70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Google ने Gemini 3.1 Flash TTS लॉन्च किया है, जो टेक्स्ट को नैचुरल और एक्सप्रेसिव आवाज में बदलता है।

70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Photo Credit: Google

ख़ास बातें
  • Gemini 3.1 Flash TTS बेहतर और नैचुरल AI आवाज देता है
  • 70 से ज्यादा भाषाओं और मल्टी-स्पीकर सपोर्ट मिलता है
  • डेवलपर्स के लिए API और AI Studio में उपलब्ध है
विज्ञापन

Google ने अपने AI पोर्टफोलियो को आगे बढ़ाते हुए नया Gemini 3.1 Flash TTS मॉडल पेश किया है। यह टेक्स्ट-टू-स्पीच (TTS) मॉडल खासतौर पर बेहतर आवाज की क्वालिटी, कंट्रोल और स्केलेबिलिटी के लिए डिजाइन किया गया है। कंपनी के मुताबिक, यह मॉडल डेवलपर्स, एंटरप्राइज यूजर्स और AI-बेस्ड स्पीच एप्लिकेशन बनाने वालों के लिए तैयार किया गया है।

Gemini 3.1 Flash TTS, Gemini 3 Pro पर आधारित है और टेक्स्ट को ऑडियो में बदलने के लिए इस्तेमाल किया जा सकता है। यह मॉडल 16K टोकन्स तक टेक्स्ट इनपुट और 32K टोकन्स तक ऑडियो आउटपुट को सपोर्ट करता है। इसके अलावा Gemini 3.1 Flash Live वेरिएंट भी दिया गया है, जो टेक्स्ट के साथ ऑडियो, इमेज और वीडियो इनपुट को सपोर्ट करता है और मल्टीमोडल इंटरैक्शन को सक्षम बनाता है।

Google के मुताबिक, इस नए मॉडल में स्पीच क्वालिटी को बेहतर बनाया गया है, जिससे आवाज ज्यादा नैचुरल और एक्सप्रेसिव सुनाई देती है। इसमें ऑडियो टैग्स के जरिए यूजर आवाज के टोन, स्पीड और डिलीवरी को कंट्रोल कर सकते हैं। साथ ही मल्टी-स्पीकर सपोर्ट भी दिया गया है, जिससे अलग-अलग आवाजों में बातचीत तैयार की जा सकती है।

Gemini 3.1 Flash TTS में सीन डायरेक्शन और स्पीकर-लेवल कंट्रोल जैसे फीचर्स भी शामिल हैं। इसके जरिए यूजर्स आवाज के स्टाइल, एक्सेंट और पेस को कस्टमाइज कर सकते हैं। इसके अलावा, एक ही सेंटेंस में अलग-अलग एक्सप्रेशन सेट करने का ऑप्शन भी मिलता है।

डेवलपर्स के लिए Google AI Studio में एडवांस कंट्रोल टूल्स दिए गए हैं, जिससे वे स्पीच आउटपुट को डिटेल में मैनेज कर सकते हैं। इसके साथ ही सेटिंग्स को Gemini API कोड के रूप में एक्सपोर्ट करने का ऑप्शन भी मिलता है। यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है और अलग-अलग रीजन में इस्तेमाल के लिए डिजाइन किया गया है।

सिक्योरिटी के लिए इसमें SynthID वॉटरमार्किंग टेक्नोलॉजी दी गई है, जिससे AI-जनरेटेड ऑडियो की पहचान की जा सकती है। फिलहाल यह फीचर प्रीव्यू में रोलआउट किया जा रहा है। डेवलपर्स इसे Gemini API और Google AI Studio के जरिए एक्सेस कर सकते हैं, जबकि एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है।

Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

नितेश पपनोई Nitesh has almost seven years of experience in news writing and reviewing tech products like smartphones, headphones, and smartwatches. At Gadgets 360, he is covering all ...और भी
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News
Turbo Read

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. Xiaomi 17T जल्द होगा भारत में लॉन्च, MediaTek Dimensity 8500 Ultra चिपसेट
  2. Honor Magic 9 के जल्द लॉन्च की तैयारी, 8,000mAh हो सकती है बैटरी
  3. Apple कर रहा आईफोन एंटी स्नैचिंग फीचर पर काम, चोरी होने पर होगा अपने आप लॉक, जानें सबकुछ
  4. स्क्रू कसने और खोलने का काम होगा आसान, Xiaomi ने लॉन्च किया नया स्मार्ट इलेक्ट्रिक टूल
  5. Lava Bold N2 5G जल्द होगा भारत में लॉन्च, डुअल रियर कैमरा यूनिट
  6. Jio ने पेश किया OTT Pass, 30GB डाटा के साथ 12+ OTT ऐप, लाइव चैनल के साथ ऐसे फायदे, जानें कीमत
  7. बढ़ते AI मार्केट ने की Samsung कर्मचारियों की चांदी, बोनस में मिलेंगे ₹3.28 करोड़!
  8. Oppo Find X10 में मिल सकती है 8,000mAh की दमदार बैटरी
  9. सरकार दे रही फ्री Cyber Security Course, सिर्फ 2.5 घंटे में मिलेगा सर्टिफिकेट, ऐसे करें अप्लाई
  10. Amazon Echo Dot Max, Echo Studio 3 गुना ज्यादा Bass और Dolby Atmos के साथ भारत में लॉन्च, जानें कीमत
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »