मुख्य सामग्री पर जाएं
नॉलेज बेस (KB) टूलकिट कस्टम AI एप्लिकेशन का आधारशिला है। यह Retrieval-Augmented Generation (RAG) को लागू करता है ताकि एजेंट आपके प्रोप्राइटरी डेटा को “पढ़” सके और उसका संदर्भ दे सके। इसके बिना, एजेंट केवल अपने पूर्व-प्रशिक्षण डेटा पर निर्भर होता है; इसके साथ, एजेंट आपके विशिष्ट दस्तावेज़ों पर विशेषज्ञ बन जाता है।

RAG तकनीक की व्याख्या

जब आप प्लेटफ़ॉर्म पर कोई फ़ाइल अपलोड करते हैं, तो इसे एक सुसंस्कृत पाइपलाइन से प्रोसेस किया जाता है। सबसे पहले, टेक्स्ट एक्सट्रैक्शन PDF, DOCX और अन्य प्रारूपों से कच्चा टेक्स्ट निकालता है, आवश्यकता पड़ने पर स्कैन की गई इमेज पर OCR लागू करता है। फिर, चंकिंग टेक्स्ट को छोटे, प्रबंधनीय खंडों में विभाजित करता है। फिर, एंबेडिंग प्रत्येक चंक को एंबेडिंग मॉडेल का उपयोग करके एक वेक्टर (अर्थ दर्शाने वाली संख्याओं की सूची) में बदलती है। अंत में, स्टोरेज इन वेक्टर्स को वेक्टर डेटाबेस में सहेजता है। जब एजेंट खोज करता है, तो क्वेरी भी एंबेड हो जाती है, और डेटाबेस क्वेरी के सबसे करीबी गणितीय निकटता (अर्थ) वाले चंक्स ढूंढता है।

कॉन्फ़िगरेशन पैनल

नॉलेज बेस कॉन्फ़िगरेशन पैनल कनेक्शन और टूल चयन दर्शाता है
  • वर्तमान प्रोजेक्ट नॉलेज बेस: डिफ़ॉल्ट रूप से सक्षम, वर्तमान वर्कस्पेस में फ़ाइलों तक पहुँच प्रदान करता है।
  • क्रॉस-प्रोजेक्ट एक्सेस: अन्य प्रोजेक्ट्स से KB लिंक करने की अनुमति देता है (जैसे, एक केंद्रीय “कंपनी नीतियां” प्रोजेक्ट)।
  • विवरण: KB सामग्री का वर्णन करने वाला मेटाडेटा एजेंट को यह तय करने में मदद करता है कि इस टूल का उपयोग कब करना है।
  • उन्नत उद्धरण (+1 क्रेडिट): यदि सक्षम है, तो एजेंट स्रोत टेक्स्ट से जुड़े कठोर इनलाइन उद्धरण प्रदान करता है।
मोडविवरणलागतसर्वोत्तम किसके लिए
मानक उद्धरणकॉसाइन समानता का उपयोग करके दस्तावेज़ नाम और चंक्स का संदर्भ। सामान्य Q&A, त्वरित खोजों के लिए शामिल।शामिलसामान्य Q&A, त्वरित खोजें
उन्नत उद्धरणउद्धरण के साथ सटीक पेज/अनुच्छेद संदर्भ प्रदान करता हैप्रति अनुरोध +1 क्रेडिटअनुपालन, कानूनी, ऑडिटिंग

उपलब्ध सब-टूल्स

  • सर्च टूल: सिमेंटिक पुनर्प्राप्ति के लिए प्राथमिक टूल। कीवर्ड बिल्कुल मेल नहीं खाते तो भी प्रासंगिक जानकारी ढूंढता है।
  • फ़ाइलें खोजें टूल: सामग्री के बजाय नाम से विशिष्ट फ़ाइलें खोजने के लिए मेटाडेटा खोज।
  • पंक्तियाँ पढ़ें टूल: विशिष्ट फ़ाइल से कच्चा टेक्स्ट निकालता है। उपयोगी जब एजेंट को कोई पूरा अध्याय या अनुभाग विस्तार से पढ़ना हो।
  • फ़ाइल आँकड़े टूल: मेटाडेटा लौटाता है: फ़ाइल आकार, लेखक, निर्माण तिथि, पेज संख्या।
  • फ़ाइल ट्री टूल: डायरेक्टरी संरचना सूचीबद्ध करता है। एजेंट्स के लिए नए KB का पता लगाने और फ़ाइल व्यवस्था समझने के लिए आवश्यक।

कार्यान्वयन उदाहरण

  • रिज़्यूमे स्क्रीनिंग: एजेंट सभी अपलोड किए गए PDF में “Python अनुभव” खोजता है, विभिन्न रिज़्यूमे से प्रासंगिक चंक्स प्राप्त करता है, और शीर्ष उम्मीदवारों का सारांश बनाता है।
  • नीति QA: उपयोगकर्ता पूछता है “क्या मैं टैक्सी का खर्चा दावा कर सकता हूँ?”। एजेंट “यात्रा नीति” खोजता है, ग्राउंड ट्रांसपोर्ट अनुभाग ढूंढता है, और उत्तर देता है “हाँ, यदि यह ग्राहक यात्रा के लिए है, तो अनुभाग 4.2 के अनुसार।”
  • तकनीकी सहायता: एजेंट त्रुटि कोड और समस्या निवारण चरण खोजने के लिए तकनीकी मैनुअल खोजता है।