VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था।

विज्ञापन
अपडेटेड: 23 जनवरी 2023 20:31 IST
ख़ास बातें
  • VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है
  • Meta द्वारा अक्टूबर 2022 में पेश किए गए EnCodec पर है आधारित
  • मात्र तीन सेकंड के सैंपल से सीख सकता है किसी की आवाज और बोलने का तरीका
Microsoft ने हाल ही में VALL-E की घोषणा की, जो एक नया टेक्स्ट-टू-स्पीच AI मॉडल है। यह मॉडल मात्र तीन-सेकंड का एक ऑडियो सैंपल दिए जाने पर उस व्यक्ति की आवाज की सटीक नकल कर सकता है। VALL-E के डेवलपर्स का मानना ​​है कि GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त होने पर इसका उपयोग हाई-क्वालिटी वाले टेक्स्ट-टू-स्पीच एप्लिकेशन, स्पीच एडिटिंग के लिए किया जा सकता है, जिसमें किसी व्यक्ति की रिकॉर्डिंग को एडिट किया जा सकता है और टेक्स्ट ट्रांसक्रिप्ट से बदला जा सकता है।

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था। VALL-E अन्य टेक्स्ट-टू-स्पीच द्वारा आमतौर पर वेवफॉर्म में हेरफेर करके स्पीच में बदलने के विपरीत टेक्स्ट और अकूस्टिक संकेतों से ऑडियो कोडेक कोड को अलग निकालता है। यह समझता है कि किसी व्यक्ति की आवाज कैसी और उसके बोलने का अंदाज कैसा है और EnCodec का उपयोग कर जरूरी डेटा कंपोनेंट (जिन्हें 'टोकन' नाम दिया गया है) और फिर ट्रेनिंग डेटा का इस्तेमाल करता है। 

इस तरह ये सिस्टम उस व्यक्ति की आवाज के साथ उसके बोलने के लहजे को भी समझ जाता है और फिर लिखे गए किसी भी टेक्स्ट को हूबहू उस व्यक्ति की आवाज और उसके बोलने के अंदाज की तरह बोल सकता है।

Microsoft ने Meta की LibriLight ऑडियो लाइब्रेरी का उपयोग करके VALL-E की स्पीच सिंथेसिस कार्यात्मकताओं को ट्रेनिंग दी है। इसमें 7,000 से अधिक वक्ताओं के 60,000 घंटे के अंग्रेजी भाषा के भाषण शामिल हैं, जो मुख्य रूप से लिब्रीवॉक्स पब्लिक डोमेन ऑडियोबुक से प्राप्त किए गए हैं। एक अच्छा रिजल्ट देने के लिए VALL-E के लिए तीन-सेकंड के नमूने में मौजूद आवाज उसके लर्निंग एल्गोरिदम में मौजूद आवाज के समान होनी चाहिए।

VALL-E के जरिए कोई गलत काम न हो या कोई व्यक्ति इसे किसी और के लिए गलत इरादे से इस्तेमाल न करे, इसलिए Microsoft ने VALL-E कोड को दूसरों के लिए उपलब्ध नहीं कराया है। ऐसा प्रतीत होता है कि रिसर्चर्स इस तकनीक के कारण होने वाले संभावित सामाजिक नुकसान से अवगत हैं।
 

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: , Microsoft
Advertisement
Popular Brands
#ट्रेंडिंग टेक न्यूज़
  1. Vivo Y19s 5G vs iQOO Z10 Lite 5G vs Moto G45 5G: 12 हजार में कौन है बेस्ट
  2. 22 हजार रुपये सस्ता मिल रहा 48 मेगापिक्सल कैमरा वाला iPhone
  3. मुफ्त चाहिए Amazon Prime और Netflix तो Jio के ये प्लान हैं जबरदस्त
#ताज़ा ख़बरें
  1. मुफ्त चाहिए Amazon Prime और Netflix तो Jio के ये प्लान हैं जबरदस्त
  2. Vivo Y19s 5G vs iQOO Z10 Lite 5G vs Moto G45 5G: 12 हजार में कौन है बेस्ट
  3. 22 हजार रुपये सस्ता मिल रहा 48 मेगापिक्सल कैमरा वाला iPhone
  4. UPI ट्रांजैक्शंस ने बनाया रिकॉर्ड, 27 लाख करोड़ से अधिक की वैल्यू
  5. क्रिप्टोकरेंसी की इंटरनेशनल माइनिंग में चौथा सबसे बड़ा देश बना ईरान
  6. Vivo X300 Ultra हो सकता है डुअल 200 मेगापिक्सल कैमरों वाला पहला स्मार्टफोन
  7. Royal Enfield ने पेश की Flying Flea S6 इलेक्ट्रिक मोटरसाइकिल, जबरदस्त लुक और भरपूर स्मार्ट फीचर्स!
  8. Moto G67 Power 5G में होगी 6.7 इंच LCD स्क्रीन, 7,000mAh बैटरी
  9. Beaver Moon: 5 नवंबर को आसमान में खिलेगा 'बीवर मून', क्यों खास है चांद का यह रूप, जानें
  10. बोतल में बंद हो रहा है 'सूरज', AI से होगा कंट्रोल, NVIDIA के इस प्रोजेक्ट ने उड़ा डाले होश!
Download Our Apps
Available in Hindi
© Copyright Red Pixels Ventures Limited 2025. All rights reserved.