सामग्री पर जाएं
AIAn Alian Software company

AI glossary

RAG (Retrieval-Augmented Generation)

डेटाबेस से पहले संबंधित दस्तावेज़ लाना, फिर मॉडल से केवल उन दस्तावेज़ों का उपयोग करके जवाब देने के लिए कहना। आधारित chatbots और ज्ञान सहायकों के लिए डिफ़ॉल्ट आर्किटेक्चर।

The longer version

प्रोडक्शन RAG सिर्फ 'chunks fetch करके prompt में डालना' नहीं है। यह hybrid search (BM25 + vector) → reranking → citation-required prompting → जब retrieval confidence कम हो तो refusal patterns होता है। पूरे pattern के साथ naive RAG की तुलना में hallucination 80%+ कम हो जाता है। पूरा pattern देखने के लिए /playbooks/rag देखें।

Want to talk about how this applies to your stack?