AI glossary

स्ट्रीमिंग

मॉडल की response को token-दर-token उत्पन्न होते ही return करना, पूरे reply की प्रतीक्षा करने के बजाय। chat UX के लिए महत्वपूर्ण — पूरी response में कुछ सेकंड लगने पर भी responsive महसूस होता है।

Want to talk about how this applies to your stack?

Book a 20-min call →Browse all terms

More terms

एजेंट
एजेंटिक वर्कफ़्लो
BAA (बिजनेस एसोसिएट एग्रीमेंट)
कैश (prompt caching)
उद्धरण / आधार
कॉन्टेक्स्ट विंडो