एजेन्टिक एआईको युग-मानिससँगै सोच्ने, खोज्ने र काम गर्ने डिजिटल सहकर्मी

२० वैशाख २०८३ ७:२१

कुनै समय कम्प्युटर भनेको मानिसले आदेश दिएपछि मात्र चल्ने मेसिन थियो। हामीले टाइप गर्‍यौं भने उसले काम गर्थ्यो, नत्र चुप लागेर बस्थ्यो।

तर अहिलेको एआई त्यस्तो छैन। आजको एआई कुरा सुन्छ, अर्थ बुझ्छ, योजना बनाउँछ, आवश्यक सूचना खोज्छ, सही-गलत छुट्याउने प्रयास गर्छ र कतिपय अवस्थामा आफैं काम पनि अगाडि बढाउँछ।

यही परिवर्तनले संसारलाई नयाँ मोडमा पुर्‍याएको छ। अब एआई केवल “प्रश्नको उत्तर दिने साधन” होइन, मानिससँगै काम गर्ने डिजिटल सहकर्मी बन्दैछ।

यस नयाँ युगको केन्द्रमा छ LLM, अर्थात् ठूलो भाषा मोडेल। सरल भाषामा भन्दा LLM एआईको दिमाग हो। यसले भाषा बुझ्छ, प्रश्नको अर्थ निकाल्छ, लेख्छ, सारांश बनाउँछ, अनुवाद गर्छ, योजना बनाउँछ र मानिससँग संवाद गर्छ। तर दिमाग मात्र भएर पुग्दैन।

मानिससँग पनि दिमाग छ, तर उसलाई किताब, अनुभव, नियम, सम्झना, औजार र अनुशासन चाहिन्छ। एआईमा पनि त्यस्तै हो। LLM दिमाग हो, तर त्यसलाई बलियो बनाउन RAG, Agentic AI, BM25, Vector Search, Metadata Filtering, Reranking, Memory, Tool Calling, MCP, Knowledge Graph जस्ता नयाँ प्रविधि जोडिन्छन्।

LLM दिमाग हो। RAG त्यसको किताब हो। BM25 त्यसको शब्द खोज्ने क्षमता हो। Vector Search त्यसको अर्थ बुझ्ने क्षमता हो। Hybrid Search त्यसको शब्द र अर्थ दुबै मिलाएर खोज्ने बुद्धि हो। Metadata Filtering त्यसको अनुशासन हो।

Reranker त्यसको छानबिन गर्ने सम्पादक हो। Prompt त्यसलाई दिइएको निर्देशन हो। Agentic AI त्यसको काम गर्ने हात हो। MCP त्यसलाई बाहिरी औजारसँग जोड्ने ढोका हो। Memory त्यसको सम्झना हो। Observability त्यसको निगरानी गर्ने आँखा हो। Guardrails त्यसको मर्यादा र सुरक्षा नियम हो। Knowledge Graph त्यसको सम्बन्ध बुझ्ने नक्सा हो।

साधारण मानिसले यसलाई अझ सजिलोसँग यसरी बुझ्न सक्छ। तपाईंले कुनै कर्मचारीलाई “यो विषयमा राम्रो रिपोर्ट बनाऊ” भन्नुभयो। कमजोर कर्मचारीले आफूलाई जे थाहा छ, त्यही लेखिदिन्छ।

तर राम्रो कर्मचारीले पहिले फाइल खोज्छ, पुरानो रिपोर्ट पढ्छ, सम्बन्धित नियम हेर्छ, आवश्यक परे वरिष्ठसँग सोध्छ, तथ्य मिलाउँछ, अनि मात्र रिपोर्ट तयार गर्छ। आजको राम्रो एआई पनि यस्तै हुन थालेको छ। पहिलेको एआईले सम्झनामा भर पर्थ्यो, अहिलेको एआई प्रमाणमा भर पर्न थालेको छ।

यहीँबाट RAG को महत्व सुरु हुन्छ। RAG भनेको एआईलाई बाहिरी ज्ञानसँग जोड्ने तरिका हो। एआईले आफ्नै दिमागबाट मात्र उत्तर नदिई पहिले कागजात, नीति, फाइल, रिपोर्ट, वेबसाइट, डेटाबेस वा guideline बाट सूचना खोज्छ, अनि त्यसकै आधारमा उत्तर दिन्छ।

यसले एआईलाई बढी भरपर्दो बनाउँछ। बिना RAG को एआई कहिलेकाहीँ आत्मविश्वासका साथ गलत कुरा बोल्न सक्छ। RAG भएको एआईले भने “मैले यो कुरा कुन कागजातको आधारमा भनिरहेको छु?” भन्ने आधार खोज्छ।

तर अहिले कुरा RAG मा मात्र रोकिएको छैन। आजको ठूलो परिवर्तन हो Agentic RAG। साधारण RAG ले प्रश्न आयो, कागजात खोज्यो, उत्तर दियो। Agentic RAG ले भने पहिले प्रश्नलाई टुक्र्याउँछ, योजना बनाउँछ, कुन स्रोत खोज्ने निर्णय गर्छ, आवश्यक परे दोहोर्‍याएर खोज्छ, फेला परेको उत्तर पर्याप्त छ कि छैन भनेर जाँच गर्छ, अनि अन्तिम उत्तर दिन्छ।

यो पुस्तकालयमा किताब खोज्ने मानिस मात्र होइन, अनुसन्धान गर्ने पत्रकारजस्तो हो। उसले एउटा स्रोतमा भर पर्दैन। तुलना गर्छ, मिलाउँछ, छुटेको कुरा खोज्छ र निष्कर्ष निकाल्छ।

आजको एआई खोजीमा BM25 अझै पनि महत्वपूर्ण छ। यो नाम सुन्दा धेरै प्राविधिक लाग्छ, तर यसको काम सरल छ-ठ्याक्कै शब्द खोज्ने। तपाईंले “नागरिकता प्रमाणपत्र”, “heart failure guideline”, “smart meter”, “tax policy” जस्ता शब्द खोज्नुभयो भने BM25 ले ती शब्दहरू भएको कागजात छिटो भेट्टाउँछ। यो पुरानो तर शक्तिशाली तरिका हो। समस्या के छ भने, यदि शब्द फरक छ तर अर्थ उस्तै छ भने BM25 ले कहिलेकाहीँ छुटाउन सक्छ।

त्यही कमजोरी पूरा गर्न आउँछ Vector Search। यसले शब्द मात्र होइन, अर्थ पनि बुझ्छ। तपाईंले “मुटु कमजोर भएको बिरामीलाई कुन औषधि चाहिन्छ?” भनेर सोध्नुभयो भने कागजातमा “heart failure guideline-directed medical therapy” लेखिएको हुन सक्छ।

BM25 ले त्यो सीधा नसमात्न सक्छ, तर Vector Search ले अर्थ मिलाएर पत्ता लगाउन सक्छ। त्यसैले आजका राम्रो एआई प्रणालीहरूले केवल शब्द खोज्दैनन्, अर्थ पनि खोज्छन्।

यही कारणले आज Hybrid Search बढी लोकप्रिय हुँदैछ। Hybrid Search भनेको BM25 र Vector Search दुबै मिलाएर खोज्नु हो। एउटा आँखाले शब्द हेर्छ, अर्को आँखाले अर्थ हेर्छ।

दुबै आँखा खुलेपछि दृश्य स्पष्ट हुन्छ। स्वास्थ्य, कानुन, शिक्षा, बैंक, ऊर्जा, सरकारी सेवा जस्ता क्षेत्रमा यो अत्यन्त उपयोगी हुन्छ, किनभने त्यहाँ कहिले ठ्याक्कै शब्द चाहिन्छ, कहिले अर्थ बुझ्नुपर्छ।

तर राम्रो खोजीका लागि अर्को महत्वपूर्ण कुरा हो Metadata Filtering। Metadata भनेको कुनै कागजातको परिचयपत्र हो। कागजात कहिले बनेको हो, कसले लेखेको हो, कुन विभागको हो, कुन भाषामा छ, कुन प्रदेशसँग सम्बन्धित छ, कुन बिरामी वा कुन परियोजनासँग जोडिएको छ-यी सबै metadata हुन्।

यदि एआईलाई “२०२५ पछि बनेका स्वास्थ्यसम्बन्धी नीति मात्र खोज” भनियो भने metadata filtering ले पुराना, असम्बन्धित वा गलत फाइल हटाइदिन्छ। यसले एआईलाई अनुशासित बनाउँछ। बिना metadata एआई कहिलेकाहीँ सही विषयमा गलत समयको सूचना दिन सक्छ।

अर्को नयाँ प्रविधि हो Reranking। एआईले धेरै कागजात खोजेपछि कुन सबैभन्दा उपयोगी हो भनेर छान्नुपर्छ। यही काम reranker ले गर्छ। यसलाई पत्रिकाको सम्पादकसँग तुलना गर्न सकिन्छ।

रिपोर्टरले धेरै सूचना ल्याउँछ, तर सम्पादकले कुन कुरा मुख्य हो, कुन सहायक हो, कुन हटाउने हो भनेर निर्णय गर्छ। Reranker ले पनि खोजिएको सामग्रीलाई क्रम मिलाउँछ-सबैभन्दा सान्दर्भिक कुरा माथि, कमजोर कुरा तल।

आजको Agentic AI मा Query Rewriting पनि महत्वपूर्ण हुँदैछ। मानिसले सोधेको प्रश्न सधैं स्पष्ट हुँदैन। हामी भन्छौं, “यो बिरामी ठीक छ कि छैन?” तर एआईले त्यो प्रश्नलाई प्राविधिक रूपमा बदल्नुपर्छ-“बिरामीको diagnosis, lab result, medication, guideline र risk factor जाँच गर।” यही query rewriting हो। राम्रो एआईले मानिसको अस्पष्ट प्रश्नलाई स्पष्ट खोजी प्रश्नमा बदल्छ।

त्यस्तै Chunking पनि ठूलो कुरा हो। कागजात धेरै लामो हुन्छ। एआईले पूरा किताब एकैपटक पढ्न सक्दैन। त्यसैले कागजातलाई साना–साना टुक्रामा बाँडिन्छ।

यही chunking हो। तर टुक्रा धेरै सानो भयो भने अर्थ हराउँछ, धेरै ठूलो भयो भने एआई अलमलिन्छ। राम्रो chunking भनेको किताबलाई यस्तो तरिकाले काट्नु हो कि प्रत्येक टुक्रामा अर्थ बाँकी रहोस्।

Embedding भनेको शब्द वा वाक्यलाई गणितीय अर्थमा बदल्ने प्रक्रिया हो। मानिसले “आमा”, “ममता”, “घर”, “सुरक्षा” जस्ता शब्दहरूबीच भावनात्मक सम्बन्ध बुझ्छ।

एआईले त्यस्तो सम्बन्ध संख्याको रूपमा बुझ्छ। Embedding ले शब्दलाई संख्याको संसारमा राख्छ, ताकि एआईले कुन कुरा कुन कुरासँग नजिक छ भनेर थाहा पाओस्। यही कारणले Vector Search सम्भव हुन्छ।

यी सबै राख्ने ठाउँ हो Vector Database। यसलाई एआईको आधुनिक पुस्तकालय भन्न सकिन्छ। पुरानो पुस्तकालयमा किताब नाम, लेखक र विषयअनुसार राखिन्थ्यो। Vector Database मा जानकारी अर्थअनुसार राखिन्छ।

तपाईंले प्रश्न सोध्दा यसले अर्थ मिल्ने सामग्री खोजेर निकाल्छ। आज Pinecone, Weaviate, Qdrant, Milvus, ChromaDB, pgvector जस्ता प्रणालीहरू यस्तै कामका लागि प्रयोग हुन्छन्।

तर अबको एआई केवल खोज्ने र उत्तर दिने मात्र होइन। यसले बाहिरी औजार चलाउन पनि थालेको छ। यही हो Tool Calling। उदाहरणका लागि, एआईले मौसमको सूचना चाहियो भने weather tool चलाउन सक्छ, बैंक डाटाबेस हेर्नुपर्‍यो भने database query चलाउन सक्छ, अस्पतालको lab report चाहियो भने medical record system मा जान सक्छ, calendar मिलाउनुपर्‍यो भने calendar tool प्रयोग गर्न सक्छ। यसरी एआई भाषा बुझ्ने दिमागबाट काम गर्ने सहायकमा परिणत हुन्छ।

यसलाई अझ व्यवस्थित बनाउन आएको छ MCP, अर्थात् Model Context Protocol। सरल भाषामा MCP भनेको एआई र बाहिरी औजारबीचको पुल हो। जसरी मोबाइलमा charger, earphone वा USB जोड्न standard port चाहिन्छ, त्यसरी एआईलाई पनि database, file system, email, calendar, browser, hospital record, government system जस्ता औजारसँग सुरक्षित रूपमा जोड्न standard चाहिन्छ। MCP ले त्यही ढोका खोल्छ।

अबको एआईमा Memory पनि जोडिँदैछ। Memory भनेको एआईले अघिल्लो कुरा सम्झने क्षमता हो। तर यो धेरै संवेदनशील विषय हो। राम्रो memory ले प्रयोगकर्ताको रुचि, कामको शैली, भाषा र प्राथमिकता सम्झेर सहयोग गर्न सक्छ। तर गलत memory ले privacy जोखिममा पार्न सक्छ। त्यसैले memory उपयोगी पनि हो, जिम्मेवारी पनि हो।

Observability अर्को महत्वपूर्ण भाग हो। एआईले के सोच्यो, कहाँ खोज्यो, कुन tool चलायो, किन यस्तो उत्तर दियो, कति समय लाग्यो, कहाँ गल्ती भयो—यी सबै हेर्ने व्यवस्था observability हो। यसलाई एआईको निगरानी गर्ने आँखा भन्न सकिन्छ। अस्पताल, बैंक, सरकार वा ऊर्जा क्षेत्रमा एआई प्रयोग गर्दा observability बिना भरोसा गर्न सकिँदैन।

त्यस्तै Guardrails भनेको एआईको मर्यादा हो। मानिसलाई कानुन, नीति र नैतिकता चाहिन्छ। एआईलाई पनि चाहिन्छ। Guardrails ले एआईलाई संवेदनशील सूचना नखोल्न, गलत सल्लाह नदिन, खतरनाक काम नगर्न, गोपनीयता नतोड्न र सीमाभित्र बस्न सहयोग गर्छ। शक्तिशाली एआई बिना guardrails भनेको ब्रेक नभएको गाडी जस्तै हो।

अहिले Knowledge Graph पनि फेरि चर्चामा छ। यसले जानकारीबीचको सम्बन्ध देखाउँछ। उदाहरणका लागि, एउटा बिरामीलाई diabetes छ, त्यसले kidney risk बढाउँछ, kidney risk ले certain medicine मा सावधानी चाहिन्छ, त्यो medicine guideline सँग जोडिन्छ। यस्तो सम्बन्ध graph ले देखाउँछ। साधारण खोजीले वाक्य भेट्छ, knowledge graph ले सम्बन्ध देखाउँछ। यो स्वास्थ्य, अनुसन्धान, कानुन, शिक्षा र सरकारी नीतिमा अत्यन्त उपयोगी हुन सक्छ।

अबको एआईमा Multi-Agent System पनि बढ्दैछ। एउटा agent ले सबै काम गर्ने होइन, धेरै agent मिलेर काम गर्ने। एउटा agent ले data खोज्छ, अर्कोले analysis गर्छ, अर्कोले risk हेर्छ, अर्कोले report लेख्छ, अर्कोले fact-check गर्छ।

यो अस्पतालको टोलीजस्तै हो-डाक्टर, नर्स, lab technician, pharmacist र administrator सबैको फरक भूमिका हुन्छ। Agentic AI मा पनि फरक-फरक digital agent मिलेर काम गर्छन्।

नेपालका लागि यी प्रविधि केवल विदेशी शब्द होइनन्। यदि सही रूपमा प्रयोग गरियो भने हाम्रो स्वास्थ्य, शिक्षा, प्रशासन, ऊर्जा, कृषि र वातावरण क्षेत्रमा ठूलो परिवर्तन ल्याउन सक्छन्। सरकारी कार्यालयमा नागरिकले “मेरो काम कहाँ पुग्यो?” भनेर सोध्दा एआईले फाइल खोजेर स्थिति बताउन सक्छ। अस्पतालमा डाक्टरलाई बिरामीको औषधि guideline अनुसार छ कि छैन भनेर देखाउन सक्छ।

विद्युत् प्राधिकरणमा असामान्य खपत, energy loss वा चोरीको संकेत देखाउन सक्छ। कृषिमा किसानलाई मौसम, माटो र बजारको आधारमा सुझाव दिन सक्छ। शिक्षामा विद्यार्थीलाई नेपाली भाषामै व्यक्तिगत शिक्षक दिन सक्छ।

तर उत्साहसँगै सावधानी पनि चाहिन्छ। एआईले दिएको उत्तर सधैं सही हुन्छ भन्ने भ्रम खतरनाक छ। खराब डाटा भए खराब उत्तर आउँछ। पुरानो कागजात भए पुरानो सल्लाह आउँछ।

गलत metadata भए गलत फाइल भेटिन्छ। कमजोर guardrails भए privacy जोखिम हुन्छ। त्यसैले एआईलाई अन्धविश्वास होइन, जिम्मेवार प्रयोग चाहिन्छ। मानिस अन्तिम निर्णयकर्ता हुनुपर्छ। एआई सहयोगी हो, मालिक होइन।

नेपालले अब एआईलाई केवल भाषण र कार्यक्रममा सीमित राख्नु हुँदैन। विश्वविद्यालय, सरकारी निकाय, अस्पताल, ऊर्जा संस्था, बैंक, नगरपालिका र निजी क्षेत्रले आफ्नै डाटा व्यवस्थित गर्नुपर्छ। नेपाली भाषाका गुणस्तरीय कागजात बनाउनुपर्छ। metadata राम्रो राख्नुपर्छ।

सुरक्षित RAG प्रणाली बनाउनुपर्छ। local context बुझ्ने agentic workflow विकास गर्नुपर्छ। विदेशी tool प्रयोग गरे पनि नेपाली आवश्यकता अनुसार ढाल्नुपर्छ।

अबको एआईको सुन्दरता यही हो-यो केवल अंग्रेजी जान्ने मान्छेको सुविधा बन्नु हुँदैन। यो नेपाली भाषामा, नेपाली नागरिकका लागि, नेपाली समस्या समाधान गर्ने साधन बन्नुपर्छ। किसानले सोध्दा किसानको भाषामा बोलोस्। विद्यार्थीले सोध्दा शिक्षकजस्तो बुझाओस्।

डाक्टरले प्रयोग गर्दा प्रमाणसहित सहयोग गरोस्। सरकारी कर्मचारीले प्रयोग गर्दा फाइल छिटो खोजोस्। नीति निर्माताले प्रयोग गर्दा तथ्यमा आधारित निर्णय गर्न सघाओस्।
अन्ततः, आजको एआईलाई एक वाक्यमा बुझ्ने हो भने: LLM दिमाग हो, RAG किताब हो, Vector Search अर्थ बुझ्ने क्षमता हो, BM25 शब्द खोज्ने क्षमता हो, Metadata Filtering अनुशासन हो, Reranker सम्पादक हो, Memory सम्झना हो, MCP औजारसँग जोड्ने ढोका हो, Observability निगरानी गर्ने आँखा हो, Guardrails सुरक्षा हो, Knowledge Graph सम्बन्धको नक्सा हो, र Agentic AI काम गर्ने हात हो।

प्रविधिको भविष्य अब केवल “एआईले के भन्छ?” भन्ने प्रश्नमा छैन। अबको प्रश्न हो-एआईले समाजका वास्तविक समस्या कसरी समाधान गर्छ? यदि नेपालले यो प्रश्नलाई गम्भीरतापूर्वक लियो भने एआई केवल च्याट गर्ने मेसिन होइन, स्वास्थ्य सुधार्ने, शिक्षा बलियो बनाउने, सेवा छिटो बनाउने, ऊर्जा बचाउने र नागरिकलाई सशक्त बनाउने नयाँ राष्ट्रिय शक्ति बन्न सक्छ। यही हो अबको यात्रा-बोल्ने एआईबाट सोच्ने एआईतर्फ, सोच्ने एआईबाट काम गर्ने एआईतर्फ।