( Open AI )
ओपनएआई ने इस साल अपना तीसरा एआई एजेंट कोडेक्स लॉन्च किया, जिसका उद्देश्य सॉफ्टवेयर इंजीनियरों और नौसिखियों को कोडिंग कार्यों में सहायता करना है। यह फीचर लिख सकता है, बग्स को ठीक कर सकता है और निजी वातावरण में कोडिंग प्रश्नों का उत्तर दे सकता है, मानव-जैसे कोड जनरेशन के लिए सुदृढीकरण सीखने का लाभ उठा सकता है।
ओपनएआई ने शुक्रवार को अपना नवीनतम एआई एजेंट कोडेक्स जारी किया, जो इस साल कंपनी द्वारा जारी किया गया तीसरा ऐसा रिलीज़ है। डीप रिसर्च और ऑपरेटर का उद्देश्य व्यापक दर्शकों को लक्षित करना है, जबकि नया कोडेक्स टूल सॉफ़्टवेयर इंजीनियर के कई कार्य करने और कम कोडिंग अनुभव वाले उपयोगकर्ताओं को नए टूल बनाने में मदद करने के लिए तैयार है। ओपनएआई के 3 एआई एजेंट क्या पेशकश करते हैं, इस पर एक नज़र डालें।
1) कोडेक्स:
कोडेक्स चैटजीपीटी पर एक सॉफ्टवेयर इंजीनियरिंग एजेंट है जो एक समय में विभिन्न कोडिंग-संबंधित कार्यों पर काम कर सकता है। ओपनएआई के अनुसार, नया टूल अपने स्वयं के सैंडबॉक्स (निजी कोडिंग वातावरण) में प्रत्येक कार्य को चलाते समय सुविधाएँ लिखने, बग को ठीक करने और उपयोगकर्ता के कोडबेस के बारे में सवालों के जवाब देने में सक्षम है।
कोडेक्स ओपनएआई के नवीनतम रीज़निंग ओ3 के एक संस्करण द्वारा संचालित है जिसे सॉफ्टवेयर इंजीनियरिंग से संबंधित कार्यों के लिए अनुकूलित किया गया था। ओपनएआई का कहना है कि इस मॉडल को विभिन्न वातावरणों में वास्तविक दुनिया के कोडिंग कार्यों पर सुदृढीकरण सीखने का उपयोग करके प्रशिक्षित किया गया था ताकि कोड उत्पन्न किया जा सके जो “मानव शैली और पीआर वरीयताओं को बारीकी से प्रतिबिंबित करता है, निर्देशों का सटीक रूप से पालन करता है, और जब तक यह एक सफल परिणाम प्राप्त नहीं करता है तब तक पुनरावृत्त परीक्षण चला सकता है”।
2) ऑपरेटर: ऑपरेटर कंप्यूटर-यूजिंग एजेंट (CUA) मॉडल द्वारा संचालित है जो GPT-4o की दृष्टि क्षमताओं और कंपनियों के अधिक उन्नत मॉडल से तर्क क्षमताओं का एक संयोजन है। OpenAI का कहना है कि CUA कार्यों को बहु-चरणीय योजनाओं में तोड़ सकता है और चुनौतियों का सामना करने पर खुद को सही कर सकता है। ऑपरेटर की प्रमुख विशेषताओं में से एक इसकी बटन, मेनू और टेक्स्ट फ़ील्ड सहित ग्राफ़िकल यूज़र इंटरफ़ेस (GUI) के साथ सहजता से इंटरैक्ट करने की क्षमता है। यह एक समर्पित ब्राउज़र के भीतर काम करता है, जिससे यह स्वतंत्र रूप से कार्यों को निष्पादित करने की अनुमति देता है जबकि उपयोगकर्ता अन्य गतिविधियों पर ध्यान केंद्रित करता है। इसके अतिरिक्त, यह टेक्स्ट और इमेज इनपुट दोनों को स्वीकार करता है, जिससे अधिक बहुमुखी कार्य प्रबंधन सक्षम होता है। पारंपरिक AI सहायकों के विपरीत, ऑपरेटर स्क्रीन से कच्चे पिक्सेल डेटा का विश्लेषण करता है और नियंत्रित सैंडबॉक्स वातावरण में वर्चुअल कीबोर्ड और माउस का उपयोग करके इंटरैक्ट करता है।
3) डीप रिसर्च: डीप रिसर्च OpenAI के नवीनतम o3 रीजनिंग मॉडल द्वारा संचालित है, जो वेब ब्राउज़िंग और डेटा विश्लेषण के लिए अनुकूलित है। एआई एजेंट वेब पर मौजूद बहुत सारे टेक्स्ट, इमेज और पीडीएफ को खोजता है, उनकी व्याख्या करता है और उनका विश्लेषण करता है, ताकि एक व्यापक रिपोर्ट तैयार की जा सके जो एक शोध विश्लेषक के स्तर के करीब हो। चैटजीपीटी पर सामान्य खोजों के विपरीत, डीप रिसर्च क्वेरीज़ को परिणाम मिलने में 5 से 30 मिनट का समय लगेगा, और चैटबॉट उपयोगकर्ताओं को उनके शोध के पूरा होने पर एक सूचना भेजेगा। ओपनएआई का कहना है कि डीप रिसर्च सैकड़ों घंटों के ऑनलाइन स्रोतों को संश्लेषित करके एक शोध विश्लेषक के स्तर की रिपोर्ट तैयार कर सकता है।