Top.Mail.Ru
Полный дуплекс: почему новая ИИ-модель Thinking Machines Lab умеет не только говорить, но и слушать.

Новая ИИ-модель Thinking умеет не только говорить, но и слушать

На данный момент модели ИИ привыкли к монологу: пользователь говорит — машина слушает. Потом машина отвечает — пользователь слушает. Этот пошаговый ритуал напоминает переписку по электронной почте, где нет места живой реакции и естественным перебиваниям.

Компания Thinking Machines Lab, основанная бывшим техническим директором OpenAI Мирой Мурати, намерена разрушить этот устоявшийся порядок. Их главная идея — внедрить в ИИ полный дуплекс, то есть способность обрабатывать запрос и генерировать ответ одновременно, как во время обычного телефонного разговора.

Что скрывается за термином «полный дуплекс»

Технически это означает, что модель больше не ждет паузы, чтобы начать отвечать, и может вас перебить — ровно так, как это сделал бы внимательный собеседник, уточняющий деталь или возражающий по ходу дела.

В понедельник Thinking Machines Lab анонсировала пробную версию модели взаимодействия TML-Interaction-Small. Заявленное время ответа — 0,4 секунды, что соответствует скорости естественной человеческой речи и заметно быстрее, чем у текущих решений от OpenAI и Google.

Сейчас на рынке доминируют алгоритмы, работающие в режиме «полудуплекса»: пока одна сторона говорит, другая молчит. Такой подход надежен и прост, но далек от повседневного общения. Полный дуплекс, который пытается реализовать Thinking Machines, меняет саму природу взаимодействия: модель учится не только информировать, но и быть вовлеченным слушателем.

Действительно ли это прорыв?

С одной стороны, технологические характеристики впечатляют. Задержка в 0,4 секунды стирает грань между человеком и нейросетью. С другой стороны, пока неясно, как новая модель поведет себя в реальных условиях — например, при одновременных запросах нескольких пользователей или в шумной обстановке.

Компания признает: это лишь исследовательская предварительная версия. До полноценного продукта еще несколько месяцев, а первая ограниченная превью выйдет только ближе к концу года.

Так что же с этим делать?

Пока никаких практических рекомендаций дать нельзя. Сама концепция того, что интерактивность должна быть неотъемлемой частью модели, а не опциональным дополнением, — безусловно, интересна. Но будет ли реальный опыт общения с ИИ таким же естественным, как обещают технические характеристики, покажут только тесты настоящих пользователей.

Стартап Thinking Machines Lab, судя по всему, нацелен не просто на увеличение скорости ответа, а на смену парадигмы: искусственный интеллект должен не только говорить, но и слушать — активно, с готовностью к реплике в любой момент.

YUZAA
Комментарии: 0