AI रिसर्च असिस्टेंट्स के जवाबों के भरोसे हो तो ये खबर आपके लिए है, नई स्टडी ने खोली पोल!

Salesforce और Microsoft की स्टडी ने दिखाया कि AI टूल्स रिसर्च असिस्टेंट के रूप में भरोसेमंद नहीं हैं। DeepTRACE ऑडिट में Bing Copilot से लेकर GPT-5 तक के सिस्टम्स पक्षपाती और अधूरे साबित हुए।

विज्ञापन
Written by नितेश पपनोई, अपडेटेड: 18 सितंबर 2025 14:32 IST
ख़ास बातें
  • Salesforce और Microsoft ने DeepTRACE से 9 AI टूल्स को टेस्ट किया
  • जवाब अक्सर पक्षपाती और गलत रेफरेंस पर आधारित पाए गए
  • GPT-5 deep research mode बाकी से बेहतर लेकिन अभी अधूरा

Photo Credit: Unsplash/ Aerps.com

आर्टिफिशियल इंटेलिजेंस (AI) सिस्टम्स को अब तक तेज और भरोसेमंद रिसर्च असिस्टेंट के तौर पर देखा जाता रहा है। लेकिन एक ताजा स्टडी ने इस भरोसे को झटका दिया है। Salesforce AI Research और Microsoft ने मिलकर किए गए इस स्टडी में पाया है कि पॉपुलर AI टूल्स अकसर अधूरे सबूतों, गलत रेफरेंस और एकतरफा जवाबों के सहारे अपनी बात रखते हैं। यानी जमीन पर भले ही ये सिस्टम कॉन्फिडेंस से भरे दिखें, लेकिन अंदर से इनके जवाब कई बार बैलेंस और सटीकता से कोसों दूर होते हैं। चलिए आपको इस स्टडी के बारे में विस्तार से जानकारी देते हैं

DeepTRACE के जरिए AI को परखा

इस स्टडी में रिसर्चर्स ने DeepTRACE नाम का एक फ्रेमवर्क तैयार किया। यह सिस्टम्स को सिर्फ उनकी भाषा की फ्लुएंसी पर नहीं, बल्कि असली सबूतों से जोड़कर जांचता है। DeepTRACE हर जवाब को छोटे-छोटे स्टेटमेंट्स में तोड़ता है और देखता है कि कौन सा दावा किस सोर्स से सपोर्ट हो रहा है।

इस फ्रेमवर्क के आठ पैमाने बनाए गए। इनमें 'जवाब कितना बैलेंस्ड है, लिखते वक्त कितनी कॉन्फिडेंस दिखाई गई, क्या क्लेम्स प्रासंगिक हैं, कितने स्टेटमेंट्स बिना सबूत के हैं, क्या रेफरेंस सिर्फ लिस्ट किए गए हैं या सही जगह पर यूज भी हुए हैं और क्या सोर्सेज वाकई जरूरी हैं' शामिल हैं। इस तरह DeepTRACE सतही लेवल के बजाय गहराई से जांच करता है कि कोई AI टूल सचमुच भरोसेमंद है या सिर्फ स्मार्ट लग रहा है।

सर्च-फोकस्ड टूल्स में सामने आई खामियां

टीम ने 9 पॉपुलर टूल्स को 300 से ज्यादा सवालों पर टेस्ट किया। इसमें Bing Copilot, Perplexity, You.com और GPT-4.5 जैसे सर्च-बेस्ड टूल्स शामिल थे। इन टूल्स की खासियत है कि ये छोटे और आसान जवाब देते हैं।

लेकिन जैसे ही सवाल डिबेट या विवादित मुद्दों से जुड़े थे, इनकी पोल खुल गई। कई बार इनके जवाब पूरी तरह एकतरफा निकले और वो भी बहुत आत्मविश्वास के साथ। यानी AI टूल्स ने ऐसा जताया जैसे यह अंतिम सच है, जबकि दूसरे दृष्टिकोण का जिक्र ही नहीं किया। साथ ही, रेफरेंस का खेल भी गड़बड़ मिला। कुछ सिस्टम्स ने ऐसे सोर्स दिए जो टेक्स्ट से जुड़े ही नहीं थे, जबकि कुछ ने सिर्फ लिस्टिंग के लिए रेफरेंस जोड़ दिए ताकि जवाब ‘भरोसेमंद' लगे। नतीजा यह हुआ कि दिखावे में मजबूत दिखने वाले जवाब असल में कमजोर साबित हुए।

डीप रिसर्च मोड: ज्यादा डिटेल लेकिन फिर भी अधूरा

जब बात आई डीप रिसर्च मोड वाले सिस्टम्स की, जैसे GPT-5 in research mode, You.com Deep Research, Gemini और Perplexity रिसर्च मोड, तो स्टडी के मुताबिक, जवाबों का साइज काफी बड़ा मिला। इन टूल्स ने लंबी रिपोर्ट्स, ज्यादा सोर्सेस और कई सारे स्टेटमेंट्स दिए।

उदाहरण के लिए, GPT-5 deep research mode ने औसतन 140 स्टेटमेंट्स और करीब 20 सोर्सेस एक साथ पेश किए। इसके टोन में बैलेंस और सावधानी बाकी टूल्स से बेहतर थी। हालांकि, यहां भी आधे से ज्यादा डिबेट-संबंधी सवालों के जवाब किसी एक पक्ष की ओर झुके हुए थे। दूसरी ओर, Perplexity deep research mode तो सबसे कमजोर साबित हुआ, जिसमें इसके लगभग सभी क्लेम्स बिना सबूत के पाए गए। Gemini का हाल भी ठीक नहीं था, क्योंकि इसके एक-तिहाई से भी कम सोर्स वास्तव में जरूरी थे।

आम यूजर्स के लिए क्या खतरा?

स्टडी का सबसे अहम पहलू यह है कि आम यूजर्स जब इन टूल्स पर भरोसा करते हैं तो उन्हें कई खतरे झेलने पड़ सकते हैं, जैसे कि अगर जवाब एकतरफा है तो यूजर को दूसरे विचारों से परिचय ही नहीं होगा, अगर गलत रेफरेंस या बेकार सोर्स जोड़े गए हैं तो भरोसे पर असर पड़ेगा और सबसे बड़ा खतरा यह है कि AI एक तरह का एको चेंबर बना देता है, जहां बार-बार वही राय सुनाई देती है जो यूजर पहले से मानता है।

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: Deeptrace, Salesforce, microsoft, AI test, AI, AI tools, ChatGPT, Gemini, Perplexity
Nitesh has almost seven years of experience in news writing and reviewing tech ...और भी
Advertisement
Popular Brands
#ट्रेंडिंग टेक न्यूज़
  1. 21 हजार सस्ता खरीदें Realme का 50MP तीन कैमरा, 5500mAh बैटरी वाला फोन, Flipkart पर धमाका डील
  2. Realme Narzo 100 Lite 5G भारत में लॉन्च होगा 14 अप्रैल को, 7000mAh बैटरी के साथ धांसू फीचर्स, जानें सबकुछ
#ताज़ा ख़बरें
  1. Xiaomi ने नया Mijia Wireless Floor Scrubber 5 Pro किया लॉन्च, गंदगी और बैक्टीरिया का सफाया! जानें कीमत
  2. 10 हजार से सस्ता खरीदें Realme का 6000mAh बैटरी, 50MP तीन कैमरा वाला फोन
  3. Tesla की कॉम्पैक्ट SUV लाने की तैयारी, कम हो सकता है प्राइस
  4. स्मार्टफोन्स के इंटरनेशनल मार्केट में Apple का पहला स्थान, iPhone 17 सीरीज की मजबूत डिमांड
  5. 28 हजार किलोमीटर प्रति घंटा स्पीड से आ रहा 100 फीट का एस्टरॉयड!
  6. XChat Launch: एलन मस्क के X का नया चैट ऐप XChat होने जा रहा 17 अप्रैल को लॉन्च, जानें फीचर्स
  7. कान में फट गए ईयरबड्स! MBBS स्टूडेंट का पोस्ट सोशल मीडिया पर वायरल
  8. OnePlus Ace 6 Ultra लॉन्च को लेकर बड़ा खुलासा, 8500mAh बैटरी, 50MP कैमरा से होगा लैस!
  9. लौट आए बीते दिन! इस कंपनी ने लॉन्च किया 80-90 के दशक का कैसेट रिकॉर्डर!
  10. Realme Narzo 100 Lite 5G भारत में लॉन्च होगा 14 अप्रैल को, 7000mAh बैटरी के साथ धांसू फीचर्स, जानें सबकुछ
Download Our Apps
Available in Hindi
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.