70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Google ने Gemini 3.1 Flash TTS लॉन्च किया है, जो टेक्स्ट को नैचुरल और एक्सप्रेसिव आवाज में बदलता है।

70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Photo Credit: Google

ख़ास बातें
  • Gemini 3.1 Flash TTS बेहतर और नैचुरल AI आवाज देता है
  • 70 से ज्यादा भाषाओं और मल्टी-स्पीकर सपोर्ट मिलता है
  • डेवलपर्स के लिए API और AI Studio में उपलब्ध है
विज्ञापन

Google ने अपने AI पोर्टफोलियो को आगे बढ़ाते हुए नया Gemini 3.1 Flash TTS मॉडल पेश किया है। यह टेक्स्ट-टू-स्पीच (TTS) मॉडल खासतौर पर बेहतर आवाज की क्वालिटी, कंट्रोल और स्केलेबिलिटी के लिए डिजाइन किया गया है। कंपनी के मुताबिक, यह मॉडल डेवलपर्स, एंटरप्राइज यूजर्स और AI-बेस्ड स्पीच एप्लिकेशन बनाने वालों के लिए तैयार किया गया है।

Gemini 3.1 Flash TTS, Gemini 3 Pro पर आधारित है और टेक्स्ट को ऑडियो में बदलने के लिए इस्तेमाल किया जा सकता है। यह मॉडल 16K टोकन्स तक टेक्स्ट इनपुट और 32K टोकन्स तक ऑडियो आउटपुट को सपोर्ट करता है। इसके अलावा Gemini 3.1 Flash Live वेरिएंट भी दिया गया है, जो टेक्स्ट के साथ ऑडियो, इमेज और वीडियो इनपुट को सपोर्ट करता है और मल्टीमोडल इंटरैक्शन को सक्षम बनाता है।

Google के मुताबिक, इस नए मॉडल में स्पीच क्वालिटी को बेहतर बनाया गया है, जिससे आवाज ज्यादा नैचुरल और एक्सप्रेसिव सुनाई देती है। इसमें ऑडियो टैग्स के जरिए यूजर आवाज के टोन, स्पीड और डिलीवरी को कंट्रोल कर सकते हैं। साथ ही मल्टी-स्पीकर सपोर्ट भी दिया गया है, जिससे अलग-अलग आवाजों में बातचीत तैयार की जा सकती है।

Gemini 3.1 Flash TTS में सीन डायरेक्शन और स्पीकर-लेवल कंट्रोल जैसे फीचर्स भी शामिल हैं। इसके जरिए यूजर्स आवाज के स्टाइल, एक्सेंट और पेस को कस्टमाइज कर सकते हैं। इसके अलावा, एक ही सेंटेंस में अलग-अलग एक्सप्रेशन सेट करने का ऑप्शन भी मिलता है।

डेवलपर्स के लिए Google AI Studio में एडवांस कंट्रोल टूल्स दिए गए हैं, जिससे वे स्पीच आउटपुट को डिटेल में मैनेज कर सकते हैं। इसके साथ ही सेटिंग्स को Gemini API कोड के रूप में एक्सपोर्ट करने का ऑप्शन भी मिलता है। यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है और अलग-अलग रीजन में इस्तेमाल के लिए डिजाइन किया गया है।

सिक्योरिटी के लिए इसमें SynthID वॉटरमार्किंग टेक्नोलॉजी दी गई है, जिससे AI-जनरेटेड ऑडियो की पहचान की जा सकती है। फिलहाल यह फीचर प्रीव्यू में रोलआउट किया जा रहा है। डेवलपर्स इसे Gemini API और Google AI Studio के जरिए एक्सेस कर सकते हैं, जबकि एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है।

Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

नितेश पपनोई Nitesh has almost seven years of experience in news writing and reviewing tech products like smartphones, headphones, and smartwatches. At Gadgets 360, he is covering all ...और भी
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News
Turbo Read

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. Xiaomi ने लॉन्च किया 508L स्मार्ट रेफ्रिजरेटर, 55 मिनट में बनेगी बर्फ और मोबाइल कनेक्टिविटी भी!
  2. WhatsApp चैट लिस्ट होगी क्लीन, बिजनेस चैट्स जाएंगी अलग सेक्शन में!
  3. Honor के आगामी स्मार्टफोन में मिल सकती है 11,000mAh की जंबो बैटरी
  4. PS Plus Game Catalogue: अप्रैल में फ्री खेलने को मिलेंगे कई नए गेम्स, Horizon Zero Dawn भी शामिल
  5. Oppo का नया टैबलेट 8000mAh बैटरी, 12GB रैम के साथ होगा 21 अप्रैल को लॉन्च
  6. Nothing Warp App लॉन्च, अब कंप्यूटर और मोबाइल के बीच चुटकी में होगी फाइल शेयर, जानें तरीका
  7. OnePlus Pad 4 जल्द होगा भारत में लॉन्च, Snapdragon 8 Elite Gen 5 चिपसेट
  8. 70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च
  9. Moto Pad 60 Pro, Pad 60 Neo हुए महंगे! कंपनी ने हजारों रुपये से बढ़ाई कीमत
  10. 144Hz 4K डिस्प्ले के साथ Lumio Vision 9 (2026), Vision 7 (2026) लॉन्च, जानें कीमत और फीचर्स
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »