OpenAI представила полноценного голосового помощника — конкуренция с Google усиливается. Apple на гонку даже не пришла (пока)
OpenAI вчера
представила новую модель GPT-4o, которая научилась распознавать голос и по сути готова к естественному разговору с человеком.
Теперь ChatGPT гораздо лучше любой существующей модели понимает и обсуждает изображения, которыми с ними делятся. Пользователь сможет сфотографировать меню в ресторане на другом языке и попросить GPT-4o перевести его, рассказать об истории и значении блюда, получить рекомендации.
Разработчики обещают дорабатывать модель и для адаптации к более сложным сценариям взаимодействия с человеком. Например, пользователь сможет показать ИИ спортивную игру в прямом эфире и попросить объяснить правила.
Глава OpenAI Сэм Альтман
добавляет, что интерфейс модели спроектирован с учетом представлений об искусственном интеллекте из голливудских фильмов:
«Меня до сих пор немного удивляет, что это реально. Переход к быстродействию и выразительности на уровне человеческих эмоций оказался самым потрясающим изменением». Сэм, а как нас-то это удивляет! И даже мягко говоря пугает.
Вкратце, что теперь ещё умеет ChatGPT:
• Незрячий человек снимает вокруг себя видео — нейронка в реальном времени расскажет,
что видит.
• GPT-4o
работает
прямо в Zoom — это полноценный участник созвона, готовый ответить на любой вопрос.
• ИИ объясняет школьнику задачу по математике, подбадривает и
заменяет учителя.
• GPT-4o подготовит к собеседованию — оценит ваш внешний вид и притворится рекрутером.
• ChatGPT говорит
человеческим голосом — смеется, смущается и использует другие эмоции. Умеет в сарказм.
Презентация разработки состоялась накануне запланированной конференции для разработчиков от Google — компания
подтверждает, что она будет посвящена искусственному интеллекту. «Выходка» OpenAI уже не кажется чистой случайностью: ранее стало известно, что компания
готовится представить поисковик на основе ChatGPT.
Другой технологический гигант — Apple — уже признал успехи OpenAI и
собирается внедрить ChatGPT в iOS. Учитывая низкий уровень развития голосового помощника Siri от Apple, сотрудничество с OpenAI поможет существенно усилить позиции производителя iPhone на рынке и наконец с триумфом внедрить ИИ в собственные продукты.
Англоязычные СМИ преимущественно положительно встретили анонс GPT-4o. Так обозреватель PC Gamer, комментируя видео мужчины, разговаривающего по телефону с голосовым помощником,
отметил, что выглядит это «не так уж и странно». Тот факт, что на другой стороне с человеком разговаривает ChatGPT, автора «крайне отталкивает, конечно, но, безусловно, впечатляет».
Журналист Gizmodo более восторженно
воспринял разработку OpenAI, назвав возможности GPT-4o «буквально невероятными». Автор оценивает голосовые возможности ИИ «впечатляющими», а демонстрационный
ролик OpenAI «потрясающим». Акции Duolingo на фоне презентации новой модели, которая может свободно говорить на любом языке, рухнули.
В сегодняшнем обзоре этой конференции на БизнесFM редакторы включили в эфире её фрагмент. Он был переведен и озвучен с помощью встроенного в Яндекс Браузер онлайн переводчика видео. То есть, что характерно, с помощью ИИ.
Момент технологической сингулярности, меж тем, ожидается до конца этого десятилетия. А мы к нему готовы?
@lobushkinادامه مطلب ...