AI glossary

RAG (Retrieval-Augmented Generation)

डेटाबेस से पहले संबंधित दस्तावेज़ लाना, फिर मॉडल से केवल उन दस्तावेज़ों का उपयोग करके जवाब देने के लिए कहना। आधारित chatbots और ज्ञान सहायकों के लिए डिफ़ॉल्ट आर्किटेक्चर।

The longer version

प्रोडक्शन RAG सिर्फ 'chunks fetch करके prompt में डालना' नहीं है। यह hybrid search (BM25 + vector) → reranking → citation-required prompting → जब retrieval confidence कम हो तो refusal patterns होता है। पूरे pattern के साथ naive RAG की तुलना में hallucination 80%+ कम हो जाता है। पूरा pattern देखने के लिए /playbooks/rag देखें।