Blog

Practical articles on AI, DevOps, Cloud, Linux, and infrastructure engineering.

Tag: #pythonClear filters

••February 25, 2024

Practical Guide: Model Serving Observability Stack

Model Serving Observability Stack. Practical guidance for reliable, scalable platform operations.

Kiril Urbonas

Read article

••February 21, 2024

Practical Guide: RAG Retrieval Quality Evaluation

RAG Retrieval Quality Evaluation. Practical guidance for reliable, scalable platform operations.

Kiril Urbonas

Read article

••February 17, 2024

Practical Guide: Prompt Versioning and Regression Testing

Prompt Versioning and Regression Testing. Practical guidance for reliable, scalable platform operations.

Kiril Urbonas

Read article

••February 13, 2024

Practical Guide: LLM Gateway Design for Multi-Provider Inference

LLM Gateway Design for Multi-Provider Inference. Practical guidance for reliable, scalable platform operations.

Kiril Urbonas

Read article

••February 12, 2024

Fine-tuning Large Language Models: A Practical Guide

Learn how to fine-tune LLMs like Llama 2, Mistral, and GPT models for your specific use case. Includes LoRA, QLoRA, and full fine-tuning techniques.

Kiril Urbonas

Read article

••February 3, 2024

Building Production-Ready AI Applications with LangChain and Docker

Learn how to containerize and deploy LangChain applications in production. Best practices for scaling, monitoring, and maintaining AI-powered services.

Kiril Urbonas

Read article

••January 1, 2024

Fine-tuning Llama 3 on Consumer Hardware

Optimization techniques like LoRA and 4-bit quantization to run state-of-the-art models locally.

Kiril Urbonas

Read article

Page 10 of 10 · 115 posts