70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Google ने Gemini 3.1 Flash TTS लॉन्च किया है, जो टेक्स्ट को नैचुरल और एक्सप्रेसिव आवाज में बदलता है।

विज्ञापन
Written by नितेश पपनोई, अपडेटेड: 16 अप्रैल 2026 14:10 IST
ख़ास बातें
  • Gemini 3.1 Flash TTS बेहतर और नैचुरल AI आवाज देता है
  • 70 से ज्यादा भाषाओं और मल्टी-स्पीकर सपोर्ट मिलता है
  • डेवलपर्स के लिए API और AI Studio में उपलब्ध है

Photo Credit: Google

Google ने अपने AI पोर्टफोलियो को आगे बढ़ाते हुए नया Gemini 3.1 Flash TTS मॉडल पेश किया है। यह टेक्स्ट-टू-स्पीच (TTS) मॉडल खासतौर पर बेहतर आवाज की क्वालिटी, कंट्रोल और स्केलेबिलिटी के लिए डिजाइन किया गया है। कंपनी के मुताबिक, यह मॉडल डेवलपर्स, एंटरप्राइज यूजर्स और AI-बेस्ड स्पीच एप्लिकेशन बनाने वालों के लिए तैयार किया गया है।

Gemini 3.1 Flash TTS, Gemini 3 Pro पर आधारित है और टेक्स्ट को ऑडियो में बदलने के लिए इस्तेमाल किया जा सकता है। यह मॉडल 16K टोकन्स तक टेक्स्ट इनपुट और 32K टोकन्स तक ऑडियो आउटपुट को सपोर्ट करता है। इसके अलावा Gemini 3.1 Flash Live वेरिएंट भी दिया गया है, जो टेक्स्ट के साथ ऑडियो, इमेज और वीडियो इनपुट को सपोर्ट करता है और मल्टीमोडल इंटरैक्शन को सक्षम बनाता है।

Google के मुताबिक, इस नए मॉडल में स्पीच क्वालिटी को बेहतर बनाया गया है, जिससे आवाज ज्यादा नैचुरल और एक्सप्रेसिव सुनाई देती है। इसमें ऑडियो टैग्स के जरिए यूजर आवाज के टोन, स्पीड और डिलीवरी को कंट्रोल कर सकते हैं। साथ ही मल्टी-स्पीकर सपोर्ट भी दिया गया है, जिससे अलग-अलग आवाजों में बातचीत तैयार की जा सकती है।

Gemini 3.1 Flash TTS में सीन डायरेक्शन और स्पीकर-लेवल कंट्रोल जैसे फीचर्स भी शामिल हैं। इसके जरिए यूजर्स आवाज के स्टाइल, एक्सेंट और पेस को कस्टमाइज कर सकते हैं। इसके अलावा, एक ही सेंटेंस में अलग-अलग एक्सप्रेशन सेट करने का ऑप्शन भी मिलता है।

डेवलपर्स के लिए Google AI Studio में एडवांस कंट्रोल टूल्स दिए गए हैं, जिससे वे स्पीच आउटपुट को डिटेल में मैनेज कर सकते हैं। इसके साथ ही सेटिंग्स को Gemini API कोड के रूप में एक्सपोर्ट करने का ऑप्शन भी मिलता है। यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है और अलग-अलग रीजन में इस्तेमाल के लिए डिजाइन किया गया है।

सिक्योरिटी के लिए इसमें SynthID वॉटरमार्किंग टेक्नोलॉजी दी गई है, जिससे AI-जनरेटेड ऑडियो की पहचान की जा सकती है। फिलहाल यह फीचर प्रीव्यू में रोलआउट किया जा रहा है। डेवलपर्स इसे Gemini API और Google AI Studio के जरिए एक्सेस कर सकते हैं, जबकि एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है।

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

Nitesh has almost seven years of experience in news writing and reviewing tech ...और भी
Advertisement
Popular Brands
#ट्रेंडिंग टेक न्यूज़
  1. 24 हजार रुपये सस्ता मिल रहा Samsung का 3 कैमरा वाला फ्लैगशिप फोन, यहां से होगा फायदा
#ताज़ा ख़बरें
  1. Xiaomi 17T जल्द होगा भारत में लॉन्च, MediaTek Dimensity 8500 Ultra चिपसेट
  2. Honor Magic 9 के जल्द लॉन्च की तैयारी, 8,000mAh हो सकती है बैटरी
  3. Apple कर रहा आईफोन एंटी स्नैचिंग फीचर पर काम, चोरी होने पर होगा अपने आप लॉक, जानें सबकुछ
  4. स्क्रू कसने और खोलने का काम होगा आसान, Xiaomi ने लॉन्च किया नया स्मार्ट इलेक्ट्रिक टूल
  5. Lava Bold N2 5G जल्द होगा भारत में लॉन्च, डुअल रियर कैमरा यूनिट
  6. Jio ने पेश किया OTT Pass, 30GB डाटा के साथ 12+ OTT ऐप, लाइव चैनल के साथ ऐसे फायदे, जानें कीमत
  7. बढ़ते AI मार्केट ने की Samsung कर्मचारियों की चांदी, बोनस में मिलेंगे ₹3.28 करोड़!
  8. Oppo Find X10 में मिल सकती है 8,000mAh की दमदार बैटरी
  9. सरकार दे रही फ्री Cyber Security Course, सिर्फ 2.5 घंटे में मिलेगा सर्टिफिकेट, ऐसे करें अप्लाई
  10. Amazon Echo Dot Max, Echo Studio 3 गुना ज्यादा Bass और Dolby Atmos के साथ भारत में लॉन्च, जानें कीमत
Download Our Apps
Available in Hindi
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.