VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था।

VALL-E: 3 सेकंड में आपकी आवाज को कॉपी कर लेगा ये AI मॉडल! जानें कैसे करता है काम
ख़ास बातें
  • VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है
  • Meta द्वारा अक्टूबर 2022 में पेश किए गए EnCodec पर है आधारित
  • मात्र तीन सेकंड के सैंपल से सीख सकता है किसी की आवाज और बोलने का तरीका
विज्ञापन
Microsoft ने हाल ही में VALL-E की घोषणा की, जो एक नया टेक्स्ट-टू-स्पीच AI मॉडल है। यह मॉडल मात्र तीन-सेकंड का एक ऑडियो सैंपल दिए जाने पर उस व्यक्ति की आवाज की सटीक नकल कर सकता है। VALL-E के डेवलपर्स का मानना ​​है कि GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त होने पर इसका उपयोग हाई-क्वालिटी वाले टेक्स्ट-टू-स्पीच एप्लिकेशन, स्पीच एडिटिंग के लिए किया जा सकता है, जिसमें किसी व्यक्ति की रिकॉर्डिंग को एडिट किया जा सकता है और टेक्स्ट ट्रांसक्रिप्ट से बदला जा सकता है।

Microsoft के अनुसार, VALL-E मुख्य रूप से एक "न्यूरल कोडेक लैंगुएज मॉडल" है और EnCodec पर आधारित है, जिसे Meta ने अक्टूबर 2022 में पेश किया था। VALL-E अन्य टेक्स्ट-टू-स्पीच द्वारा आमतौर पर वेवफॉर्म में हेरफेर करके स्पीच में बदलने के विपरीत टेक्स्ट और अकूस्टिक संकेतों से ऑडियो कोडेक कोड को अलग निकालता है। यह समझता है कि किसी व्यक्ति की आवाज कैसी और उसके बोलने का अंदाज कैसा है और EnCodec का उपयोग कर जरूरी डेटा कंपोनेंट (जिन्हें 'टोकन' नाम दिया गया है) और फिर ट्रेनिंग डेटा का इस्तेमाल करता है। 

इस तरह ये सिस्टम उस व्यक्ति की आवाज के साथ उसके बोलने के लहजे को भी समझ जाता है और फिर लिखे गए किसी भी टेक्स्ट को हूबहू उस व्यक्ति की आवाज और उसके बोलने के अंदाज की तरह बोल सकता है।

Microsoft ने Meta की LibriLight ऑडियो लाइब्रेरी का उपयोग करके VALL-E की स्पीच सिंथेसिस कार्यात्मकताओं को ट्रेनिंग दी है। इसमें 7,000 से अधिक वक्ताओं के 60,000 घंटे के अंग्रेजी भाषा के भाषण शामिल हैं, जो मुख्य रूप से लिब्रीवॉक्स पब्लिक डोमेन ऑडियोबुक से प्राप्त किए गए हैं। एक अच्छा रिजल्ट देने के लिए VALL-E के लिए तीन-सेकंड के नमूने में मौजूद आवाज उसके लर्निंग एल्गोरिदम में मौजूद आवाज के समान होनी चाहिए।

VALL-E के जरिए कोई गलत काम न हो या कोई व्यक्ति इसे किसी और के लिए गलत इरादे से इस्तेमाल न करे, इसलिए Microsoft ने VALL-E कोड को दूसरों के लिए उपलब्ध नहीं कराया है। ऐसा प्रतीत होता है कि रिसर्चर्स इस तकनीक के कारण होने वाले संभावित सामाजिक नुकसान से अवगत हैं।
Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

ये भी पढ़े: , Microsoft
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. OnePlus 15 के कैमरा स्पेसिफिकेशंस फिर लीक, 6500+mAh बैटरी, 100W चार्जिंग से होगा लैस!
  2. Xiaomi का नया स्टैंडिंग AC लॉन्च: 40 सेकंड में ठंडा करेगा रूम, सेल्फ क्लीनिंग भी शामिल! जानें कीमत
  3. Oppo Pad SE टैबलेट 11 इंच डिस्प्ले, 9340mAh बैटरी, 33W फास्ट चार्जिंग के साथ लॉन्च, जानें कीमत
  4. Infinix GT 30 Pro में गेमर्स के लिए मिलेंगे इनबिल्ट शोल्डर ट्रिगर्स और स्मार्ट लाइटिंग, जल्द होगा लॉन्च
  5. Amazfit Balance 2 स्मार्टवॉच सिंगल चार्ज में 21 दिन बैटरी, 10ATM वाटर रसिस्टेंस के साथ लॉन्च, जानें कीमत
  6. Xiaomi TV F Pro 2026: शाओमी ने 32, 43, 50, 55, 65 और 75 इंच 4K QLED TV किए लॉन्च, जानें कीमत
  7. Itel का सस्ता फोन Itel A90 भारत में 4GB रैम, 5000mAh बैटरी के साथ Rs 6,499 में लॉन्च, जानें खास फीचर्स
  8. Dubai में भी की जा सकेंगी क्रिप्टोकरेंसीज से पेमेंट, Crypto.com के साथ किया टाई-अप
  9. Oppo के Reno 14 Pro में होगी 6.83 इंच की स्क्रीन, 6,200mAh बैटरी
  10. Realme के GT 7 में होगा MediaTek Dimensity 9400e चिपसेट, 27 मई को लॉन्च
© Copyright Red Pixels Ventures Limited 2025. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »