• होम
  • एआई
  • ख़बरें
  • AI रिसर्च असिस्टेंट्स के जवाबों के भरोसे हो तो ये खबर आपके लिए है, नई स्टडी ने खोली पोल!

AI रिसर्च असिस्टेंट्स के जवाबों के भरोसे हो तो ये खबर आपके लिए है, नई स्टडी ने खोली पोल!

Salesforce और Microsoft की स्टडी ने दिखाया कि AI टूल्स रिसर्च असिस्टेंट के रूप में भरोसेमंद नहीं हैं। DeepTRACE ऑडिट में Bing Copilot से लेकर GPT-5 तक के सिस्टम्स पक्षपाती और अधूरे साबित हुए।

AI रिसर्च असिस्टेंट्स के जवाबों के भरोसे हो तो ये खबर आपके लिए है, नई स्टडी ने खोली पोल!

Photo Credit: Unsplash/ Aerps.com

ख़ास बातें
  • Salesforce और Microsoft ने DeepTRACE से 9 AI टूल्स को टेस्ट किया
  • जवाब अक्सर पक्षपाती और गलत रेफरेंस पर आधारित पाए गए
  • GPT-5 deep research mode बाकी से बेहतर लेकिन अभी अधूरा
विज्ञापन

आर्टिफिशियल इंटेलिजेंस (AI) सिस्टम्स को अब तक तेज और भरोसेमंद रिसर्च असिस्टेंट के तौर पर देखा जाता रहा है। लेकिन एक ताजा स्टडी ने इस भरोसे को झटका दिया है। Salesforce AI Research और Microsoft ने मिलकर किए गए इस स्टडी में पाया है कि पॉपुलर AI टूल्स अकसर अधूरे सबूतों, गलत रेफरेंस और एकतरफा जवाबों के सहारे अपनी बात रखते हैं। यानी जमीन पर भले ही ये सिस्टम कॉन्फिडेंस से भरे दिखें, लेकिन अंदर से इनके जवाब कई बार बैलेंस और सटीकता से कोसों दूर होते हैं। चलिए आपको इस स्टडी के बारे में विस्तार से जानकारी देते हैं

DeepTRACE के जरिए AI को परखा

इस स्टडी में रिसर्चर्स ने DeepTRACE नाम का एक फ्रेमवर्क तैयार किया। यह सिस्टम्स को सिर्फ उनकी भाषा की फ्लुएंसी पर नहीं, बल्कि असली सबूतों से जोड़कर जांचता है। DeepTRACE हर जवाब को छोटे-छोटे स्टेटमेंट्स में तोड़ता है और देखता है कि कौन सा दावा किस सोर्स से सपोर्ट हो रहा है।

इस फ्रेमवर्क के आठ पैमाने बनाए गए। इनमें 'जवाब कितना बैलेंस्ड है, लिखते वक्त कितनी कॉन्फिडेंस दिखाई गई, क्या क्लेम्स प्रासंगिक हैं, कितने स्टेटमेंट्स बिना सबूत के हैं, क्या रेफरेंस सिर्फ लिस्ट किए गए हैं या सही जगह पर यूज भी हुए हैं और क्या सोर्सेज वाकई जरूरी हैं' शामिल हैं। इस तरह DeepTRACE सतही लेवल के बजाय गहराई से जांच करता है कि कोई AI टूल सचमुच भरोसेमंद है या सिर्फ स्मार्ट लग रहा है।

सर्च-फोकस्ड टूल्स में सामने आई खामियां

टीम ने 9 पॉपुलर टूल्स को 300 से ज्यादा सवालों पर टेस्ट किया। इसमें Bing Copilot, Perplexity, You.com और GPT-4.5 जैसे सर्च-बेस्ड टूल्स शामिल थे। इन टूल्स की खासियत है कि ये छोटे और आसान जवाब देते हैं।

लेकिन जैसे ही सवाल डिबेट या विवादित मुद्दों से जुड़े थे, इनकी पोल खुल गई। कई बार इनके जवाब पूरी तरह एकतरफा निकले और वो भी बहुत आत्मविश्वास के साथ। यानी AI टूल्स ने ऐसा जताया जैसे यह अंतिम सच है, जबकि दूसरे दृष्टिकोण का जिक्र ही नहीं किया। साथ ही, रेफरेंस का खेल भी गड़बड़ मिला। कुछ सिस्टम्स ने ऐसे सोर्स दिए जो टेक्स्ट से जुड़े ही नहीं थे, जबकि कुछ ने सिर्फ लिस्टिंग के लिए रेफरेंस जोड़ दिए ताकि जवाब ‘भरोसेमंद' लगे। नतीजा यह हुआ कि दिखावे में मजबूत दिखने वाले जवाब असल में कमजोर साबित हुए।

डीप रिसर्च मोड: ज्यादा डिटेल लेकिन फिर भी अधूरा

जब बात आई डीप रिसर्च मोड वाले सिस्टम्स की, जैसे GPT-5 in research mode, You.com Deep Research, Gemini और Perplexity रिसर्च मोड, तो स्टडी के मुताबिक, जवाबों का साइज काफी बड़ा मिला। इन टूल्स ने लंबी रिपोर्ट्स, ज्यादा सोर्सेस और कई सारे स्टेटमेंट्स दिए।

उदाहरण के लिए, GPT-5 deep research mode ने औसतन 140 स्टेटमेंट्स और करीब 20 सोर्सेस एक साथ पेश किए। इसके टोन में बैलेंस और सावधानी बाकी टूल्स से बेहतर थी। हालांकि, यहां भी आधे से ज्यादा डिबेट-संबंधी सवालों के जवाब किसी एक पक्ष की ओर झुके हुए थे। दूसरी ओर, Perplexity deep research mode तो सबसे कमजोर साबित हुआ, जिसमें इसके लगभग सभी क्लेम्स बिना सबूत के पाए गए। Gemini का हाल भी ठीक नहीं था, क्योंकि इसके एक-तिहाई से भी कम सोर्स वास्तव में जरूरी थे।

आम यूजर्स के लिए क्या खतरा?

स्टडी का सबसे अहम पहलू यह है कि आम यूजर्स जब इन टूल्स पर भरोसा करते हैं तो उन्हें कई खतरे झेलने पड़ सकते हैं, जैसे कि अगर जवाब एकतरफा है तो यूजर को दूसरे विचारों से परिचय ही नहीं होगा, अगर गलत रेफरेंस या बेकार सोर्स जोड़े गए हैं तो भरोसे पर असर पड़ेगा और सबसे बड़ा खतरा यह है कि AI एक तरह का एको चेंबर बना देता है, जहां बार-बार वही राय सुनाई देती है जो यूजर पहले से मानता है।

Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: Deeptrace, Salesforce, microsoft, AI test, AI, AI tools, ChatGPT, Gemini, Perplexity
नितेश पपनोई Nitesh has almost seven years of experience in news writing and reviewing tech products like smartphones, headphones, and smartwatches. At Gadgets 360, he is covering all ...और भी
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News
Turbo Read

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. Redmi K90 सीरीज में मिलेगी 100W चार्जिंग और फ्लैगशिप प्रोसेसर! लीक हुए स्पेसिफिकेशन्स
  2. World Athletics Championships Final Live: जेवलिन थ्रो फाइनल में नीरज चोपड़ा का मुकाबला पाकिस्तान के अरशद से भी, कहां देखें लाइव
  3. Windows 10 यूजर्स सावधान: Microsoft के फैसले से करोड़ों कंप्यूटर खतरे में!
  4. Amazon की Great Indian Festival सेल में iPhone 15 को 45,000 रुपये से कम में खरीदने का मौका
  5. AI रिसर्च असिस्टेंट्स के जवाबों के भरोसे हो तो ये खबर आपके लिए है, नई स्टडी ने खोली पोल!
  6. Amazon Great Indian Festival Sale 2025: iQOO स्मार्टफोन्स पर जबरदस्त डील्स, होगी हजारों में बचत
  7. भारत में 6G की जबरदस्त तैयारी, गांव से लेकर आसमान तक चलेगा तेज इंटरनेट
  8. Meta Ray-Ban Display स्मार्ट ग्लासेस 12MP कैमरा और डिस्प्ले के साथ लॉन्च, उंगलियों के इशारों पर करेगा काम
  9. Kodak Matrix QLED TV 43, 50, 55 और 65 इंच डिस्प्ले में लॉन्च, जानें कैसे हैं फीचर्स और कीमत
  10. Amazon Great Indian Festival 2025 Sale: OnePlus 13 पर आ गई साल की सबसे बड़ी डील
© Copyright Red Pixels Ventures Limited 2025. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »