VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था।

VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम
ख़ास बातें
  • VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है
  • Meta द्वारा अक्टूबर 2022 में पेश किए गए EnCodec पर है आधारित
  • मात्र तीन सेकंड के सैंपल से सीख सकता है किसी की आवाज और बोलने का तरीका
विज्ञापन
Microsoft ने हाल ही में VALL-E की घोषणा की, जो एक नया टेक्स्ट-टू-स्पीच AI मॉडल है। यह मॉडल मात्र तीन-सेकंड का एक ऑडियो सैंपल दिए जाने पर उस व्यक्ति की आवाज की सटीक नकल कर सकता है। VALL-E के डेवलपर्स का मानना ​​है कि GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त होने पर इसका उपयोग हाई-क्वालिटी वाले टेक्स्ट-टू-स्पीच एप्लिकेशन, स्पीच एडिटिंग के लिए किया जा सकता है, जिसमें किसी व्यक्ति की रिकॉर्डिंग को एडिट किया जा सकता है और टेक्स्ट ट्रांसक्रिप्ट से बदला जा सकता है।

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था। VALL-E अन्य टेक्स्ट-टू-स्पीच द्वारा आमतौर पर वेवफॉर्म में हेरफेर करके स्पीच में बदलने के विपरीत टेक्स्ट और अकूस्टिक संकेतों से ऑडियो कोडेक कोड को अलग निकालता है। यह समझता है कि किसी व्यक्ति की आवाज कैसी और उसके बोलने का अंदाज कैसा है और EnCodec का उपयोग कर जरूरी डेटा कंपोनेंट (जिन्हें 'टोकन' नाम दिया गया है) और फिर ट्रेनिंग डेटा का इस्तेमाल करता है। 

इस तरह ये सिस्टम उस व्यक्ति की आवाज के साथ उसके बोलने के लहजे को भी समझ जाता है और फिर लिखे गए किसी भी टेक्स्ट को हूबहू उस व्यक्ति की आवाज और उसके बोलने के अंदाज की तरह बोल सकता है।

Microsoft ने Meta की LibriLight ऑडियो लाइब्रेरी का उपयोग करके VALL-E की स्पीच सिंथेसिस कार्यात्मकताओं को ट्रेनिंग दी है। इसमें 7,000 से अधिक वक्ताओं के 60,000 घंटे के अंग्रेजी भाषा के भाषण शामिल हैं, जो मुख्य रूप से लिब्रीवॉक्स पब्लिक डोमेन ऑडियोबुक से प्राप्त किए गए हैं। एक अच्छा रिजल्ट देने के लिए VALL-E के लिए तीन-सेकंड के नमूने में मौजूद आवाज उसके लर्निंग एल्गोरिदम में मौजूद आवाज के समान होनी चाहिए।

VALL-E के जरिए कोई गलत काम न हो या कोई व्यक्ति इसे किसी और के लिए गलत इरादे से इस्तेमाल न करे, इसलिए Microsoft ने VALL-E कोड को दूसरों के लिए उपलब्ध नहीं कराया है। ऐसा प्रतीत होता है कि रिसर्चर्स इस तकनीक के कारण होने वाले संभावित सामाजिक नुकसान से अवगत हैं।
Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: , Microsoft
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. Apple मार्च इवेंट में लॉन्च करेगा iPhone 17e, Mac और iPad जैसे 5 नए प्रोडक्ट
  2. Apple जल्द लॉन्च कर सकती है iPhone 17e और कम प्राइस वाला MacBook
  3. अब AI से पूछे किसने आपको WhatsApp पर ब्लॉक किया है या नहीं
  4. AI बनाम इंसान पर Zoho फाउंडर श्रीधर वेम्बू और OpenAI के CEO आमने-सामने, जानें पूरा मामला
  5. Motorola Edge 70 Fusion 50MP कैमरा, 7000mAh बैटरी के साथ होगा पेश, लिस्टिंग से खुलासा
  6. Realme P4 Lite 4G vs Samsung Galaxy A07 4G vs Tecno Pop 9 5G: जानें 10K में कौन सा है बेस्ट
  7. Vivo V70 FE होगा अगला 7000mAh बैटरी, 200MP कैमरा वाला फोन, लॉन्च से पहले लीक हुए फुल स्पेसिफिकेशन्स!
  8. LG ने लॉन्च की बड़ी बैटरी, Ryzen AI 400 सीरीज प्रोसेसर वाली Gram 16 (2026) लैपटॉप सीरीज
  9. WhatsApp पर रात में जागे बिना भी कर पाएंगे मैसेज, आ रहा अनोखा फीचर
  10. iPhone Fold होगा 2026 में लॉन्च! कीमत से लेकर डिजाइन और स्पेक्स तक, अब तक की पूरी डिटेल
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »