Ai-Engineering on Jatin Bansal

Ai-Engineering on Jatin Bansalhttps://blog.jatinbansal.com/categories/ai-engineering/Recent content in Ai-Engineering on Jatin BansalHugoen-usTue, 12 May 2026 00:00:00 +0000Chunking Strategies for Retrievalhttps://blog.jatinbansal.com/ai-engineering/chunking-strategies/Tue, 12 May 2026 00:00:00 +0000https://blog.jatinbansal.com/ai-engineering/chunking-strategies/Why chunk size is RAG's most undertuned variable, how recursive, semantic, and structural chunking differ, and when parent-document retrieval wins.LLM Inference: Tokens, Context, and Samplinghttps://blog.jatinbansal.com/ai-engineering/llm-inference-fundamentals/Mon, 11 May 2026 00:00:00 +0000https://blog.jatinbansal.com/ai-engineering/llm-inference-fundamentals/How LLMs process text: BPE tokenization, the context window as working memory, KV caching, and sampling parameters that shape output variance.Text Embeddings: Turning Meaning into Geometryhttps://blog.jatinbansal.com/ai-engineering/text-embeddings/Mon, 11 May 2026 00:00:00 +0000https://blog.jatinbansal.com/ai-engineering/text-embeddings/How embedding models encode text as dense vectors, why cosine similarity captures meaning, and how to build semantic search in Python and TypeScript.Vector Databases & ANN Indexeshttps://blog.jatinbansal.com/ai-engineering/vector-databases-ann/Mon, 11 May 2026 00:00:00 +0000https://blog.jatinbansal.com/ai-engineering/vector-databases-ann/How HNSW, IVF, and ScaNN trade recall for speed, why exact KNN doesn't scale, and how to pick between pgvector, Qdrant, and Pinecone in production.