Google випустила технологію синхронного перекладу мови з підтримкою понад 70 мов світу

Google представила Gemini 3.5 Live Translate — систему майже синхронного перекладу мовлення з підтримкою понад 70 мов. ШІ перекладає розмови в режимі реального часу, зберігаючи голос та інтонацію.
Google представила нову модель голосового перекладу Gemini 3.5 Live Translate, яка може змінювати мову розмови практично в режимі реального часу. Система підтримує понад 70 мов і намагається зберегти не тільки зміст сказаного, але й голос, інтонацію та темп мовлення мовця. У компанії заявляють, що це має зробити спілкування між людьми з різних країн більш природним і менш «машинним».
Головна відмінність нової технології в тому, що вона не чекає, поки людина закінчить фразу. У звичайних системах переклад з'являється тільки після паузи. Тут же модель аналізує мовлення прямо під час розмови і видає переклад із затримкою всього в кілька секунд. Тому діалог можна вести майже без помітних зупинок.
Система також вміє автоматично визначати мову, без ручних налаштувань, і працює навіть у шумній обстановці. За задумом Google, її можна використовувати для міжнародних дзвінків, відеоконференцій, онлайн-навчання, стрімів та будь-яких ситуацій, де потрібен швидкий переклад мови.
Нова технологія вже починає з'являтися в екосистемі компанії (взаємопов'язана мережа сервісів, додатків і пристроїв, що працює через єдиний обліковий запис). Розробники отримали доступ до неї через Gemini Live API та платформу Google AI Studio. Корпоративні клієнти зможуть протестувати переклад у Google Meet, а користувачі Android та iOS — через оновлений Google Translate.
Одним із перших партнерів стала компанія Grab, яка тестує систему в сервісі поїздок: вона обробляє понад 10 мільйонів голосових дзвінків на місяць. За словами представників компанії, переклад став точнішим, а затримка — помітно меншою.
Google також запустила закрите тестування для клієнтів Google Workspace, а більш широкий реліз очікується до кінця року. У новій версії підтримка розширена з п'яти до понад 70 мов, що дозволяє створювати понад 2000 мовних комбінацій для перекладу.
У мобільному додатку Google Translate з'явиться окремий «режим прослуховування»: користувач зможе прикласти телефон до вуха і чути переклад як звичайний дзвінок.
Усі аудіодані, створені системою, маркуються цифровим водяним знаком SynthID, який допомагає відрізняти контент, створений штучним інтелектом, і знижує ризик поширення підробок та дезінформації.
- Конституцію України вперше повністю переклали на мову жестів
- Google запускає технологію миттєвого перекладу мови з підтримкою понад 70 мов
- Генерал НАТО розповів про сценарії війни в Європі
- Гендиректор Nvidia пояснив, чого варто вчити дітей в епоху штучного інтелекту
- Китай запровадив обмеження на закордонні поїздки для ключових експертів у сфері штучного інтелекту
Олена Расенко пише про новини у сфері науки, ЗСЖ і психології, ділиться лайфхаками та порадами щодо балансу між роботою і життям.















