VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था।

विज्ञापन
अपडेटेड: 23 जनवरी 2023 20:31 IST
ख़ास बातें
  • VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है
  • Meta द्वारा अक्टूबर 2022 में पेश किए गए EnCodec पर है आधारित
  • मात्र तीन सेकंड के सैंपल से सीख सकता है किसी की आवाज और बोलने का तरीका
Microsoft ने हाल ही में VALL-E की घोषणा की, जो एक नया टेक्स्ट-टू-स्पीच AI मॉडल है। यह मॉडल मात्र तीन-सेकंड का एक ऑडियो सैंपल दिए जाने पर उस व्यक्ति की आवाज की सटीक नकल कर सकता है। VALL-E के डेवलपर्स का मानना ​​है कि GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त होने पर इसका उपयोग हाई-क्वालिटी वाले टेक्स्ट-टू-स्पीच एप्लिकेशन, स्पीच एडिटिंग के लिए किया जा सकता है, जिसमें किसी व्यक्ति की रिकॉर्डिंग को एडिट किया जा सकता है और टेक्स्ट ट्रांसक्रिप्ट से बदला जा सकता है।

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था। VALL-E अन्य टेक्स्ट-टू-स्पीच द्वारा आमतौर पर वेवफॉर्म में हेरफेर करके स्पीच में बदलने के विपरीत टेक्स्ट और अकूस्टिक संकेतों से ऑडियो कोडेक कोड को अलग निकालता है। यह समझता है कि किसी व्यक्ति की आवाज कैसी और उसके बोलने का अंदाज कैसा है और EnCodec का उपयोग कर जरूरी डेटा कंपोनेंट (जिन्हें 'टोकन' नाम दिया गया है) और फिर ट्रेनिंग डेटा का इस्तेमाल करता है। 

इस तरह ये सिस्टम उस व्यक्ति की आवाज के साथ उसके बोलने के लहजे को भी समझ जाता है और फिर लिखे गए किसी भी टेक्स्ट को हूबहू उस व्यक्ति की आवाज और उसके बोलने के अंदाज की तरह बोल सकता है।

Microsoft ने Meta की LibriLight ऑडियो लाइब्रेरी का उपयोग करके VALL-E की स्पीच सिंथेसिस कार्यात्मकताओं को ट्रेनिंग दी है। इसमें 7,000 से अधिक वक्ताओं के 60,000 घंटे के अंग्रेजी भाषा के भाषण शामिल हैं, जो मुख्य रूप से लिब्रीवॉक्स पब्लिक डोमेन ऑडियोबुक से प्राप्त किए गए हैं। एक अच्छा रिजल्ट देने के लिए VALL-E के लिए तीन-सेकंड के नमूने में मौजूद आवाज उसके लर्निंग एल्गोरिदम में मौजूद आवाज के समान होनी चाहिए।

VALL-E के जरिए कोई गलत काम न हो या कोई व्यक्ति इसे किसी और के लिए गलत इरादे से इस्तेमाल न करे, इसलिए Microsoft ने VALL-E कोड को दूसरों के लिए उपलब्ध नहीं कराया है। ऐसा प्रतीत होता है कि रिसर्चर्स इस तकनीक के कारण होने वाले संभावित सामाजिक नुकसान से अवगत हैं।
 

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: , Microsoft
Advertisement
Popular Brands
#ट्रेंडिंग टेक न्यूज़
  1. Motorola Edge 70 Fusion 50MP कैमरा, 7000mAh बैटरी के साथ होगा पेश, लिस्टिंग से खुलासा
  2. AI के जरिए अब चौबीसों घंटे मिलेगी वीजा हेल्प, BLS ने मशीनों में जोड़ा Voicebot
  3. Apple मार्च इवेंट में लॉन्च करेगा iPhone 17e, Mac और iPad जैसे 5 नए प्रोडक्ट
  4. iPhone 17 Pro की अचानक गिरी कीमत, अभी खरीदें अब तक सबसे ज्यादा सस्ता
#ताज़ा ख़बरें
  1. भारत के इस राज्य में 16 वर्ष से कम उम्र के बच्चों के लिए स्मार्टफोन के इस्तेमाल पर लग सकती है रोक....
  2. AI के जरिए अब चौबीसों घंटे मिलेगी वीजा हेल्प, BLS ने मशीनों में जोड़ा Voicebot
  3. Apple मार्च इवेंट में लॉन्च करेगा iPhone 17e, Mac और iPad जैसे 5 नए प्रोडक्ट
  4. Apple जल्द लॉन्च कर सकती है iPhone 17e और कम प्राइस वाला MacBook
  5. अब AI से पूछे किसने आपको WhatsApp पर ब्लॉक किया है या नहीं
  6. AI बनाम इंसान पर Zoho फाउंडर श्रीधर वेम्बू और OpenAI के CEO आमने-सामने, जानें पूरा मामला
  7. Motorola Edge 70 Fusion 50MP कैमरा, 7000mAh बैटरी के साथ होगा पेश, लिस्टिंग से खुलासा
  8. Realme P4 Lite 4G vs Samsung Galaxy A07 4G vs Tecno Pop 9 5G: जानें 10K में कौन सा है बेस्ट
  9. Vivo V70 FE होगा अगला 7000mAh बैटरी, 200MP कैमरा वाला फोन, लॉन्च से पहले लीक हुए फुल स्पेसिफिकेशन्स!
  10. LG ने लॉन्च की बड़ी बैटरी, Ryzen AI 400 सीरीज प्रोसेसर वाली Gram 16 (2026) लैपटॉप सीरीज
Download Our Apps
Available in Hindi
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.