DeepL, відома текстовим перекладом, тепер хоче перекладати ваш голос

Image

DeepL, компанія з перекладу, найбільш відома своїми текстовими інструментами, сьогодні випустила набір інструментів для голосового перекладу, який охоплює такі сценарії використання, як зустрічі, мобільні та веб-розмови, а також групові комунікації для працівників на передовій через спеціальні додатки. Компанія також випускає API, що дозволяє зовнішнім розробникам і компаніям створювати власні рішення на основі технологій DeepL для індивідуальних випадків, наприклад, для кол-центрів.

«Після багатьох років роботи над текстовим перекладом, голос був для нас природним кроком», — розповів TechCrunch генеральний директор DeepL Ярек Кутиловський. «Ми досягли значного прогресу в текстовому перекладі та перекладі документів. Але ми вважали, що не існує якісного продукту для синхронного голосового перекладу».

Кутиловський зазначив, що проблеми у створенні продукту для синхронного перекладу зосереджені на пошуку балансу між зменшенням затримки — часу між тим, коли людина говорить, і відтворенням перекладеного аудіо — та збереженням точності результатів.

DeepL випускає додатки для таких платформ, як Zoom і Microsoft Teams, де слухачі можуть або чути синхронний переклад, поки інші говорять рідними мовами, або стежити за синхронним перекладеним текстом на екрані. Ця програма зараз доступна в режимі раннього доступу, і компанія запрошує організації приєднатися до списку очікування. Компанія також має продукт для мобільних та веб-розмов, які можуть відбуватися особисто або віддалено.

DeepL також дозволяє користувачам брати участь у груповій розмові в таких умовах, як тренінги або семінари, приєднуючись через QR-код.

DeepL повідомила, що її технологія голосового перекладу також може вивчати та адаптуватися до спеціальної лексики, як-от галузеві терміни, назви компаній та особисті імена.

Кутиловський зазначив, що ШІ змінює уявлення про те, як виглядатиме обслуговування клієнтів у найближчі роки. Він підкреслив, що шар перекладу допомагає компаніям надавати підтримку мовами, де кваліфікованих спеціалістів мало і їхній найм коштує дорого.

Компанія заявляє, що контролює весь стек технології голосового перекладу. Однак поточна система перетворює мовлення на текст, застосовує переклад, а потім конвертує його назад у мовлення. DeepL вважає, що через багаторічну роботу над текстовим перекладом вона має перевагу в якості перекладу. У майбутньому компанія планує розробити наскрізну модель голосового перекладу, яка повністю пропускає текстовий етап.

DeepL стикається з конкуренцією з боку кількох добре фінансованих стартапів, які працюють у суміжних сферах. Sanas, який минулого року залучив 65 мільйонів доларів від Quadrille Capital і Teleperformance, використовує ШІ для зміни акценту мовця в реальному часі — інструмент, призначений насамперед для агентів кол-центрів.

Дубайський Camb.AI зосереджується на синтезі мовлення та перекладі для медійних і розважальних компаній, допомагаючи їм дублювати та локалізувати відеоконтент у великих масштабах.

Palabra, який підтримує фірма співзасновника Reddit Алексіса Оганяна Seven Seven Six, створює механізм синхронного мовленнєвого перекладу, призначений для збереження як сенсу, так і оригінального голосу мовця, що робить його більш прямим конкурентом того, що зараз будує DeepL.

Comments

Залишити відповідь