70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Google ने Gemini 3.1 Flash TTS लॉन्च किया है, जो टेक्स्ट को नैचुरल और एक्सप्रेसिव आवाज में बदलता है।

70 भाषाओं के सपोर्ट के साथ Google का नया स्पीच AI लॉन्च

Photo Credit: Google

ख़ास बातें
  • Gemini 3.1 Flash TTS बेहतर और नैचुरल AI आवाज देता है
  • 70 से ज्यादा भाषाओं और मल्टी-स्पीकर सपोर्ट मिलता है
  • डेवलपर्स के लिए API और AI Studio में उपलब्ध है
विज्ञापन

Google ने अपने AI पोर्टफोलियो को आगे बढ़ाते हुए नया Gemini 3.1 Flash TTS मॉडल पेश किया है। यह टेक्स्ट-टू-स्पीच (TTS) मॉडल खासतौर पर बेहतर आवाज की क्वालिटी, कंट्रोल और स्केलेबिलिटी के लिए डिजाइन किया गया है। कंपनी के मुताबिक, यह मॉडल डेवलपर्स, एंटरप्राइज यूजर्स और AI-बेस्ड स्पीच एप्लिकेशन बनाने वालों के लिए तैयार किया गया है।

Gemini 3.1 Flash TTS, Gemini 3 Pro पर आधारित है और टेक्स्ट को ऑडियो में बदलने के लिए इस्तेमाल किया जा सकता है। यह मॉडल 16K टोकन्स तक टेक्स्ट इनपुट और 32K टोकन्स तक ऑडियो आउटपुट को सपोर्ट करता है। इसके अलावा Gemini 3.1 Flash Live वेरिएंट भी दिया गया है, जो टेक्स्ट के साथ ऑडियो, इमेज और वीडियो इनपुट को सपोर्ट करता है और मल्टीमोडल इंटरैक्शन को सक्षम बनाता है।

Google के मुताबिक, इस नए मॉडल में स्पीच क्वालिटी को बेहतर बनाया गया है, जिससे आवाज ज्यादा नैचुरल और एक्सप्रेसिव सुनाई देती है। इसमें ऑडियो टैग्स के जरिए यूजर आवाज के टोन, स्पीड और डिलीवरी को कंट्रोल कर सकते हैं। साथ ही मल्टी-स्पीकर सपोर्ट भी दिया गया है, जिससे अलग-अलग आवाजों में बातचीत तैयार की जा सकती है।

Gemini 3.1 Flash TTS में सीन डायरेक्शन और स्पीकर-लेवल कंट्रोल जैसे फीचर्स भी शामिल हैं। इसके जरिए यूजर्स आवाज के स्टाइल, एक्सेंट और पेस को कस्टमाइज कर सकते हैं। इसके अलावा, एक ही सेंटेंस में अलग-अलग एक्सप्रेशन सेट करने का ऑप्शन भी मिलता है।

डेवलपर्स के लिए Google AI Studio में एडवांस कंट्रोल टूल्स दिए गए हैं, जिससे वे स्पीच आउटपुट को डिटेल में मैनेज कर सकते हैं। इसके साथ ही सेटिंग्स को Gemini API कोड के रूप में एक्सपोर्ट करने का ऑप्शन भी मिलता है। यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है और अलग-अलग रीजन में इस्तेमाल के लिए डिजाइन किया गया है।

सिक्योरिटी के लिए इसमें SynthID वॉटरमार्किंग टेक्नोलॉजी दी गई है, जिससे AI-जनरेटेड ऑडियो की पहचान की जा सकती है। फिलहाल यह फीचर प्रीव्यू में रोलआउट किया जा रहा है। डेवलपर्स इसे Gemini API और Google AI Studio के जरिए एक्सेस कर सकते हैं, जबकि एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है।

Comments

लेटेस्ट टेक न्यूज़, स्मार्टफोन रिव्यू और लोकप्रिय मोबाइल पर मिलने वाले एक्सक्लूसिव ऑफर के लिए गैजेट्स 360 एंड्रॉयड ऐप डाउनलोड करें और हमें गूगल समाचार पर फॉलो करें।

नितेश पपनोई Nitesh has almost seven years of experience in news writing and reviewing tech products like smartphones, headphones, and smartwatches. At Gadgets 360, he is covering all ...और भी
Share on Facebook Gadgets360 Twitter ShareTweet Share Snapchat Reddit आपकी राय google-newsGoogle News
Turbo Read

विज्ञापन

Follow Us

विज्ञापन

#ताज़ा ख़बरें
  1. Redmi Turbo 6 Max में मिल सकती है 10,000mAh की बैटरी
  2. LinkedIn में हुई जबरदस्त छंटनी, सैकड़ों कर्मचारियों को गंवानी पड़ी नौकरी
  3. Acer का 1.2Kg वजन वाला Aspire 5 AI भारत में लॉन्च, 180-डिग्री तक खुलता है इसका डिस्प्ले
  4. Google I/O 2026: Samsung Google के इंटेलिजेंट आईवियर पेश, जबरदस्त AI फीचर्स
  5. Motorola Razr Fold Sale in India: मोटोरोला के प्रीमियम फोल्डेबल फोन की सेल भारत में शुरू, Rs 12,500 तक बचत का मौका!
  6. Google I/O 2026: गूगल का नया AI Search हुआ ज्यादा स्मार्ट, फोटो-वीडियो से भी कर सकेंगे सर्च
  7. Google I/O 2026: ऑनलाइन शॉपिंग बदलने की तैयारी में Google, एक ही कार्ट में जुड़ेंगे सामान!
  8. U&i ने नए नैकबैंड, पावरबैंक, कार चार्जर किए लॉन्च, कीमत Rs 399 से शुरू
  9. Instagram पर कैसे पोस्ट करें Instants, यहां जानें सबकुछ
  10. Lenovo Legion Y70 (2026) हुआ 50MP कैमरा, 8000mAh बैटरी के साथ लॉन्च, जानें सबकुछ
© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
ट्रेंडिंग प्रॉडक्ट्स »
लेटेस्ट टेक ख़बरें »