VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था।

विज्ञापन
अपडेटेड: 23 जनवरी 2023 20:31 IST
ख़ास बातें
  • VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है
  • Meta द्वारा अक्टूबर 2022 में पेश किए गए EnCodec पर है आधारित
  • मात्र तीन सेकंड के सैंपल से सीख सकता है किसी की आवाज और बोलने का तरीका
Microsoft ने हाल ही में VALL-E की घोषणा की, जो एक नया टेक्स्ट-टू-स्पीच AI मॉडल है। यह मॉडल मात्र तीन-सेकंड का एक ऑडियो सैंपल दिए जाने पर उस व्यक्ति की आवाज की सटीक नकल कर सकता है। VALL-E के डेवलपर्स का मानना ​​है कि GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त होने पर इसका उपयोग हाई-क्वालिटी वाले टेक्स्ट-टू-स्पीच एप्लिकेशन, स्पीच एडिटिंग के लिए किया जा सकता है, जिसमें किसी व्यक्ति की रिकॉर्डिंग को एडिट किया जा सकता है और टेक्स्ट ट्रांसक्रिप्ट से बदला जा सकता है।

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था। VALL-E अन्य टेक्स्ट-टू-स्पीच द्वारा आमतौर पर वेवफॉर्म में हेरफेर करके स्पीच में बदलने के विपरीत टेक्स्ट और अकूस्टिक संकेतों से ऑडियो कोडेक कोड को अलग निकालता है। यह समझता है कि किसी व्यक्ति की आवाज कैसी और उसके बोलने का अंदाज कैसा है और EnCodec का उपयोग कर जरूरी डेटा कंपोनेंट (जिन्हें 'टोकन' नाम दिया गया है) और फिर ट्रेनिंग डेटा का इस्तेमाल करता है। 

इस तरह ये सिस्टम उस व्यक्ति की आवाज के साथ उसके बोलने के लहजे को भी समझ जाता है और फिर लिखे गए किसी भी टेक्स्ट को हूबहू उस व्यक्ति की आवाज और उसके बोलने के अंदाज की तरह बोल सकता है।

Microsoft ने Meta की LibriLight ऑडियो लाइब्रेरी का उपयोग करके VALL-E की स्पीच सिंथेसिस कार्यात्मकताओं को ट्रेनिंग दी है। इसमें 7,000 से अधिक वक्ताओं के 60,000 घंटे के अंग्रेजी भाषा के भाषण शामिल हैं, जो मुख्य रूप से लिब्रीवॉक्स पब्लिक डोमेन ऑडियोबुक से प्राप्त किए गए हैं। एक अच्छा रिजल्ट देने के लिए VALL-E के लिए तीन-सेकंड के नमूने में मौजूद आवाज उसके लर्निंग एल्गोरिदम में मौजूद आवाज के समान होनी चाहिए।

VALL-E के जरिए कोई गलत काम न हो या कोई व्यक्ति इसे किसी और के लिए गलत इरादे से इस्तेमाल न करे, इसलिए Microsoft ने VALL-E कोड को दूसरों के लिए उपलब्ध नहीं कराया है। ऐसा प्रतीत होता है कि रिसर्चर्स इस तकनीक के कारण होने वाले संभावित सामाजिक नुकसान से अवगत हैं।
 

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: , Microsoft
Advertisement
Popular Brands
#ट्रेंडिंग टेक न्यूज़
  1. Amazon Great Indian Festival 2025 Sale: OnePlus 13 पर आ गई साल की सबसे बड़ी डील
#ताज़ा ख़बरें
  1. Apple का iPhone की सेल्स को तेजी से बढ़ाने का टारगेट
  2. Amazon की सेल में Sony, Vu, Samsung और कई ब्रांड्स के स्मार्ट TV पर भारी डिस्काउंट वाली अर्ली डील्स 
  3. Amazon की सेल में Carrier, Hitachi और कई ब्रांड्स के एयर कंडीशनर्स पर मिलेगा भारी डिस्काउंट
  4. Diwali with Xiaomi Sale 2025: स्मार्टफोन, स्मार्ट टीवी से एयर प्यूरीफायर तक, मिलेगा 60% तक बंपर डिस्काउंट!
  5. Amazon की Great Indian Festival Sale में Samsung, Haier, Godrej के रेफ्रीजरेटर्स पर बड़ा डिस्काउंट
  6. Amazon Great Indian Festival Sale 2025: Rs 75 हजार का फ्लैगशिप Samsung टैबलेट आधे से कम प्राइस पर! यहां जानें पूरी डील
  7. BSNL के नए SIM कार्ड से लेकर रिचार्ज सर्विस तक, सब कुछ नजदीकी डाकघरों में!
  8. Amazon की Great Indian Festival Sale में Samsung Galaxy S24 Ultra पर मिलेगा भारी डिस्काउंट
  9. Redmi K90 सीरीज में मिलेगी 100W चार्जिंग और फ्लैगशिप प्रोसेसर! लीक हुए स्पेसिफिकेशन्स
  10. World Athletics Championships Final Live: जेवलिन थ्रो फाइनल में नीरज चोपड़ा का मुकाबला पाकिस्तान के अरशद से भी, कहां देखें लाइव
Download Our Apps
Available in Hindi
© Copyright Red Pixels Ventures Limited 2025. All rights reserved.