Google ने अपने I/O डेवलपर कॉन्फ्रेंस में, प्रोजेक्ट एस्ट्रा (Project Astra) को दिखाया, जो एक रियलटाइम AI असिस्टेंट है। इसका काम यूजर्स का यूनिवर्सल हेल्पर बनना है। Google के DeepMind के हेड, डेमिस हस्साबिस (Demis Hassabis) ने दिखाया कि कैसा यह AI असिस्टेंट आपका चश्मा ढूंढने जैसा जटिल काम आसानी से कर सकता है। मल्टीमोडल एआई के रूप में Astra, दुनिया को देखने, ऑब्जेक्ट की पहचान करने, खोई हुई चीजों का पता लगाने सहित कई अन्य जटिल कामों में मदद करने का दावा करता है।
Google I/O इवेंट के दौरान हस्साबिस ने Astra का दमखम दिखाने के लिए एक डेमो वीडिया दिखाया, जिसमें यह पावरफुल AI मॉडल कैमरा के जरिए आसपास के वातावरण को भापते हुए रियलटाइम में प्रश्नों के उत्तर दे रहा था। इसके साथ चीजों को पॉइंटआउट करते हुए प्रश्न पूछे जा सकते हैं और Astra उस ऑब्जेक्ट की जानकारी दे सकता है। उदाहरण के लिए, यह कुछ इस तरह है कि मानों आपने कैमरा ओपन किया और स्क्रीन पर दिखने वाले किसी भी ऑबजेक्ट की ओर सर्किल या ऐरो बनाकर आपने पूछा 'इसे क्या कहते हैं' और तुरंत आपको स्मार्टफोन से आवाज आती है, जिसमें उस ऑब्जेक्ट के बारे में सभी जरूरी जानकारी दी जाती है। यह केवल एक उदाहरण है। Astra रियलटाइम में कई जटिल और ह्यूमरस प्रश्नों का जवाब दे सकता है।
हस्साबिस ने I/O के दौरान AI एजेंट्स के महत्व पर जोर दिया, जो न केवल संवाद करते हैं बल्कि यूजर्स की ओर से कार्यों को खुद एग्जिक्यूट भी करते हैं। हस्साबिस का मानना है कि एआई का भविष्य केवल फैंसी तकनीक में नहीं, बल्कि प्रैक्टिकल यूज में भी है। उन्होंने एआई एजेंटों के बारे में बात की, जो सिर्फ बात नहीं करते बल्कि आपके बदले कई कामों को खुद करते हैं। उनका मानना है कि भविष्य में आपकी जरूरतों और आपकी स्थिति के आधार पर सिंपल असिस्टेंट से लेकर अधिक एडवांस असिस्टेंट तक, विभिन्न प्रकार के एजेंट होंगे।
उनका कहना है कि Astra का डेवलपमेंट
Google के भाषा मॉडल, Gemini 1.5 Pro में सुधार के कारण संभव हुआ। पिछले छह महीनों में, टीम ने एस्ट्रा को तेज और अधिक प्रतिक्रियाशील बनाने पर काम किया। इसमें न केवल मॉडल को रिफाइन करना शामिल था बल्कि यह सुनिश्चित करना भी शामिल था कि बड़े पैमाने पर सब कुछ आसानी से चले।
Astra इस साल के I/O में Gemini की
कई घोषणाओं में से एक है। गूगल ने Gemini 1.5 Pro के साथ 1.5 Flash AI मॉडल पर भी रोशनी डाली, जिसे समराइजेशन और कैप्शनिंग जैसे कामों को तेजी से करने के लिए डेवलप किया गया है। इसके अलावा, Veo को भी घोषित किया गया है, जो टेक्स्ट प्रॉम्प्ट से वीडियो जनरेट कर सकता है। Gemini Nano भी है, जो आपके फोन जैसे डिवाइस पर स्थानीय रूप से उपयोग करने के लिए डिजाइन किया गया मॉडल है।