70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Google ने Gemini 3.1 Flash TTS लॉन्च किया है, जो टेक्स्ट को नैचुरल और एक्सप्रेसिव आवाज में बदलता है।

70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Photo Credit: Google

ख़ास बातें
  • Gemini 3.1 Flash TTS बेहतर और नैचुरल AI आवाज देता है
  • 70 से ज्यादा भाषाओं और मल्टी-स्पीकर सपोर्ट मिलता है
  • डेवलपर्स के लिए API और AI Studio में उपलब्ध है
विज्ञापन

Google ने अपने AI पोर्टफोलियो को आगे बढ़ाते हुए नया Gemini 3.1 Flash TTS मॉडल पेश किया है। यह टेक्स्ट-टू-स्पीच (TTS) मॉडल खासतौर पर बेहतर आवाज की क्वालिटी, कंट्रोल और स्केलेबिलिटी के लिए डिजाइन किया गया है। कंपनी के मुताबिक, यह मॉडल डेवलपर्स, एंटरप्राइज यूजर्स और AI-बेस्ड स्पीच एप्लिकेशन बनाने वालों के लिए तैयार किया गया है।

Gemini 3.1 Flash TTS, Gemini 3 Pro पर आधारित है और टेक्स्ट को ऑडियो में बदलने के लिए इस्तेमाल किया जा सकता है। यह मॉडल 16K टोकन्स तक टेक्स्ट इनपुट और 32K टोकन्स तक ऑडियो आउटपुट को सपोर्ट करता है। इसके अलावा Gemini 3.1 Flash Live वेरिएंट भी दिया गया है, जो टेक्स्ट के साथ ऑडियो, इमेज और वीडियो इनपुट को सपोर्ट करता है और मल्टीमोडल इंटरैक्शन को सक्षम बनाता है।

Google के मुताबिक, इस नए मॉडल में स्पीच क्वालिटी को बेहतर बनाया गया है, जिससे आवाज ज्यादा नैचुरल और एक्सप्रेसिव सुनाई देती है। इसमें ऑडियो टैग्स के जरिए यूजर आवाज के टोन, स्पीड और डिलीवरी को कंट्रोल कर सकते हैं। साथ ही मल्टी-स्पीकर सपोर्ट भी दिया गया है, जिससे अलग-अलग आवाजों में बातचीत तैयार की जा सकती है।

Gemini 3.1 Flash TTS में सीन डायरेक्शन और स्पीकर-लेवल कंट्रोल जैसे फीचर्स भी शामिल हैं। इसके जरिए यूजर्स आवाज के स्टाइल, एक्सेंट और पेस को कस्टमाइज कर सकते हैं। इसके अलावा, एक ही सेंटेंस में अलग-अलग एक्सप्रेशन सेट करने का ऑप्शन भी मिलता है।

डेवलपर्स के लिए Google AI Studio में एडवांस कंट्रोल टूल्स दिए गए हैं, जिससे वे स्पीच आउटपुट को डिटेल में मैनेज कर सकते हैं। इसके साथ ही सेटिंग्स को Gemini API कोड के रूप में एक्सपोर्ट करने का ऑप्शन भी मिलता है। यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है और अलग-अलग रीजन में इस्तेमाल के लिए डिजाइन किया गया है।

सिक्योरिटी के लिए इसमें SynthID वॉटरमार्किंग टेक्नोलॉजी दी गई है, जिससे AI-जनरेटेड ऑडियो की पहचान की जा सकती है। फिलहाल यह फीचर प्रीव्यू में रोलआउट किया जा रहा है। डेवलपर्स इसे Gemini API और Google AI Studio के जरिए एक्सेस कर सकते हैं, जबकि एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है।

Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

नितेश पपनोई Nitesh has almost seven years of experience in news writing and reviewing tech products like smartphones, headphones, and smartwatches. At Gadgets 360, he is covering all ...और भी
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News
Turbo Read

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. OnePlus N6 में हो सकता है MediaTek Dimensity 6 सीरीज का चिपसेट, Geekbench पर हुई लिस्टिंग
  2. रोबोट पुलिसवाले की गई नौकरी, डिपार्टमेंट ने 1 साल से पहले ही दिखा दिया बाहर का रास्ता
  3. 8000mAh बैटरी वाले फोन Pova 8 की सेल शुरू, 8GB रैम, 50MP कैमरा से लैस, जानें सबकुछ
  4. Oppo की मिड-रेंज सेगमेंट में नई एंट्री! Reno 15A आया 7000mAh बैटरी के साथ, जानें कीमत
  5. Huawei FreeBuds 7i, FreeBuds SE 4 ईयरबड्स लॉन्च, 50 घंटे चलेगी बैटरी, जानें कीमत और फीचर्स
  6. 45W पावर आउटपुट के साथ 10000mAh का पावरबैंक Ugreen ने किया लॉन्च, जानें कीमत
  7. JBL Live 780NC और 680NC हेडफोन स्पैटियल ऑडियो के साथ लॉन्च, जानें कीमत और फीचर्स
  8. 17 हजार रुपये सस्ता मिल रहा 64MP कैमरा वाला Google Pixel स्मार्टफोन
  9. Haier HQLED P7 Pro सीरीज Google TV लॉन्च, Gemini AI के साथ धांसू फीचर्स से लैस
  10. 13,380mAh बैटरी, 16GB रैम के साथ OnePlus Pad 3 Pro टैबलेट लॉन्च, जानें सबकुछ
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »