RAG तकनीक की व्याख्या
जब आप प्लेटफ़ॉर्म पर कोई फ़ाइल अपलोड करते हैं, तो इसे एक सुसंस्कृत पाइपलाइन से प्रोसेस किया जाता है। सबसे पहले, टेक्स्ट एक्सट्रैक्शन PDF, DOCX और अन्य प्रारूपों से कच्चा टेक्स्ट निकालता है, आवश्यकता पड़ने पर स्कैन की गई इमेज पर OCR लागू करता है। फिर, चंकिंग टेक्स्ट को छोटे, प्रबंधनीय खंडों में विभाजित करता है। फिर, एंबेडिंग प्रत्येक चंक को एंबेडिंग मॉडेल का उपयोग करके एक वेक्टर (अर्थ दर्शाने वाली संख्याओं की सूची) में बदलती है। अंत में, स्टोरेज इन वेक्टर्स को वेक्टर डेटाबेस में सहेजता है। जब एजेंट खोज करता है, तो क्वेरी भी एंबेड हो जाती है, और डेटाबेस क्वेरी के सबसे करीबी गणितीय निकटता (अर्थ) वाले चंक्स ढूंढता है।कॉन्फ़िगरेशन पैनल

- वर्तमान प्रोजेक्ट नॉलेज बेस: डिफ़ॉल्ट रूप से सक्षम, वर्तमान वर्कस्पेस में फ़ाइलों तक पहुँच प्रदान करता है।
- क्रॉस-प्रोजेक्ट एक्सेस: अन्य प्रोजेक्ट्स से KB लिंक करने की अनुमति देता है (जैसे, एक केंद्रीय “कंपनी नीतियां” प्रोजेक्ट)।
- विवरण: KB सामग्री का वर्णन करने वाला मेटाडेटा एजेंट को यह तय करने में मदद करता है कि इस टूल का उपयोग कब करना है।
- उन्नत उद्धरण (+1 क्रेडिट): यदि सक्षम है, तो एजेंट स्रोत टेक्स्ट से जुड़े कठोर इनलाइन उद्धरण प्रदान करता है।
| मोड | विवरण | लागत | सर्वोत्तम किसके लिए |
|---|---|---|---|
| मानक उद्धरण | कॉसाइन समानता का उपयोग करके दस्तावेज़ नाम और चंक्स का संदर्भ। सामान्य Q&A, त्वरित खोजों के लिए शामिल। | शामिल | सामान्य Q&A, त्वरित खोजें |
| उन्नत उद्धरण | उद्धरण के साथ सटीक पेज/अनुच्छेद संदर्भ प्रदान करता है | प्रति अनुरोध +1 क्रेडिट | अनुपालन, कानूनी, ऑडिटिंग |
उपलब्ध सब-टूल्स
- सर्च टूल: सिमेंटिक पुनर्प्राप्ति के लिए प्राथमिक टूल। कीवर्ड बिल्कुल मेल नहीं खाते तो भी प्रासंगिक जानकारी ढूंढता है।
- फ़ाइलें खोजें टूल: सामग्री के बजाय नाम से विशिष्ट फ़ाइलें खोजने के लिए मेटाडेटा खोज।
- पंक्तियाँ पढ़ें टूल: विशिष्ट फ़ाइल से कच्चा टेक्स्ट निकालता है। उपयोगी जब एजेंट को कोई पूरा अध्याय या अनुभाग विस्तार से पढ़ना हो।
- फ़ाइल आँकड़े टूल: मेटाडेटा लौटाता है: फ़ाइल आकार, लेखक, निर्माण तिथि, पेज संख्या।
- फ़ाइल ट्री टूल: डायरेक्टरी संरचना सूचीबद्ध करता है। एजेंट्स के लिए नए KB का पता लगाने और फ़ाइल व्यवस्था समझने के लिए आवश्यक।
कार्यान्वयन उदाहरण
- रिज़्यूमे स्क्रीनिंग: एजेंट सभी अपलोड किए गए PDF में “Python अनुभव” खोजता है, विभिन्न रिज़्यूमे से प्रासंगिक चंक्स प्राप्त करता है, और शीर्ष उम्मीदवारों का सारांश बनाता है।
- नीति QA: उपयोगकर्ता पूछता है “क्या मैं टैक्सी का खर्चा दावा कर सकता हूँ?”। एजेंट “यात्रा नीति” खोजता है, ग्राउंड ट्रांसपोर्ट अनुभाग ढूंढता है, और उत्तर देता है “हाँ, यदि यह ग्राहक यात्रा के लिए है, तो अनुभाग 4.2 के अनुसार।”
- तकनीकी सहायता: एजेंट त्रुटि कोड और समस्या निवारण चरण खोजने के लिए तकनीकी मैनुअल खोजता है।