В нашем недавнем видео мы говорили о работе OpenAI над их следующей большой ИИ-моделью, которая изначально носила кодовое название Orion. Мы внимательно следили за этим проектом, и теперь у нас есть свежие новости. Согласно последней информации, Orion теперь официально называется GPT Next, и это будет огромный шаг вперед. Компания объявила, что GPT Next будет в 100 раз мощнее GPT-4, что является не просто небольшим обновлением, а огромным скачком вперед с точки зрения возможностей и производительности.
Эта информация стала известна во время саммита KDDI 2024 в Японии. Генеральный директор OpenAI Japan Тадао Нагасаки сделал там довольно громкое заявление. Он намекнул, что модель может называться GPT Next, что хорошо согласуется с тем, как OpenAI называет свои модели. Но что действительно привлекло всеобщее внимание, так это его слова о том, что новая модель будет развиваться почти в 100 раз быстрее, чем ее предшественники.
Давайте на секунду остановимся. Что это вообще значит? В отличие от традиционного программного обеспечения, модели ИИ, такие как GPT, не просто становятся немного лучше с каждой версией, они могут расти экспоненциально. Так что это не просто небольшой шаг вперед, это огромный скачок. Если вспомнить, GPT-4, по сравнению с GPT-3, был заметным улучшением, но Нагасаки и ребята из OpenAI предполагают, что GPT Next превзойдет эти улучшения, как прыжок с Toyota на космический корабль.
За всем этим стоит ряд интересных технологических решений. Новая модель будет обучаться с использованием данных, созданных другой моделью под названием Strawberry. Я рассказывал о Strawberry в одном из своих недавних видео (читайте здесь https://www.vforum.org/forum/t9309.html#post478225), но если вы еще не слышали о ней, то это суперумная модель, которая отлично генерирует высококачественные данные, особенно для сложных областей, таких как математика и программирование. Это очень важно, поскольку качество данных, которые вы загружаете в модель ИИ, напрямую влияет на то, насколько хорошей она станет.
Но есть и обратная сторона медали. Исследователи обнаружили, что если обучать модель на слишком большом количестве синтетических данных, подобных тем, что генерирует Strawberry, производительность модели может начать снижаться. Поэтому OpenAI должна найти идеальный баланс, при котором они смогут использовать синтетические данные, чтобы сделать Orion или GPT Next супермощным, не переусердствовав.
Новая модель будет работать с текстом, изображениями и, впервые, с входными и выходными видеоданными. Вы сможете загрузить видео, и она сможет суммировать или проанализировать его содержимое напрямую. Эта возможность работы с видео станет значительным усовершенствованием, которое позволит OpenAI конкурировать с такими моделями, как Gemini от Google, которая уже может обрабатывать длинные видеовходы.
Эти усовершенствования откроют новые возможности для пользователей ChatGPT и разработчиков на API-площадке OpenAI. Но почему OpenAI так активно продвигает эту новую модель? Все дело в том, чтобы оставаться впереди конкурентов. Сейчас сфера ИИ становится все более насыщенной. Появляются модели с открытым исходным кодом, такие как Meta Llama 3.1, и другие передовые модели, такие как Claude или Gemini, которые быстро развиваются. Так что для OpenAI разработка GPT Next - это способ сохранить лидерство, поднять планку еще выше.
На том же саммите Нагасаки показал график, который наглядно демонстрирует масштабы улучшений. На нем сравнивались GPT-3, GPT-4 и GPT Next, и разница была как между ночью и днем. В то время как GPT-3 и GPT-4 были относительно близки по своим возможностям, GPT Next просто возвышается над ними обоими. И, чтобы вы понимали, это исходит не только от OpenAI Japan. Даже Кевин Скотт, технический директор Microsoft, показал аналогичный график на конференции Microsoft Build 2024. Так что, когда одни и те же настроения высказывают сразу несколько крупных игроков в сфере технологий, вы понимаете, что в разработке находится нечто грандиозное.
Кстати, о громких именах. Генеральный директор OpenAI Сэм Альтман также намекнул на некоторые грандиозные достижения в начале этого года. Он упомянул, что GPT-5 или, возможно, GPT Next будет намного умнее GPT-4. Невероятно, правда? Кажется, что каждые несколько месяцев мы слышим о каком-то новом прорыве, который изменит правила игры.
Когда же мы сможем увидеть все это в действии? Из того, что мы слышали, похоже, что GPT Next, или как там его в итоге назовут, планируется выпустить в 2024 году. Так что ждать осталось недолго, и у меня есть предчувствие, что оно того стоит.
Итак, обладая в 100 раз большей вычислительной мощностью, новыми мультимодальными функциями и всеми этими передовыми технологиями, GPT Next может вывести ИИ на совершенно новый уровень, сделав его более мощным и универсальным, чем все, что мы видели раньше.
А теперь давайте поговорим о другой важной новости из мира ИИ, которая, на мой взгляд, даже более захватывающая, чем обновление GPT Next, из-за ее огромного потенциала. Речь идет о проекте Sid, который является настоящим прорывом в мире ИИ.
Это первая попытка создать полноценную цивилизацию ИИ-агентов. Речь идет о более чем тысяче ИИ-агентов, работающих вместе не просто для общения или решения проблем, а для того, чтобы фактически построить целое общество с нуля. Проект Sid действительно раздвигает границы возможного с помощью ИИ, и он уже делает невероятные успехи.
Чтобы вы понимали, проект Sid - это автономные ИИ-агенты, выпущенные в мир, специально созданный для Minecraft (пока что), где они действуют свободно, делая все, что им заблагорассудится. Эти агенты создают нечто совершенно новое, формируя правительства, строя экономики, устанавливая культуру и даже создавая религии. Это как наблюдать за развитием целой цивилизации, и самое интересное, что все это управляется ИИ.
И, чтобы было понятно, это не просто простые команды или заранее написанные сценарии. Агенты придумывают все эти действия и решения самостоятельно.
Что делает этот проект еще более интересным, так это то, что эти агенты не ограничены только Minecraft. Хотя в настоящее время они находятся в игровой среде, они спроектированы таким образом, чтобы быть платформенно-независимыми. Они могут выйти за пределы Minecraft и работать в других приложениях и играх, что открывает целый ряд новых возможностей для будущего развития. Minecraft - это всего лишь отправная точка, песочница, где они учатся взаимодействовать, вести переговоры и расти.
И чего же им удалось добиться на данный момент? Когда агенты впервые попали в мир Minecraft, у них не было ничего. Но они быстро начали работать вместе и в итоге собрали более 300 различных предметов. На этом они не остановились. Они создали рыночную систему и выбрали в качестве валюты драгоценные камни, фактически построив экономику с нуля. Интересно, что самыми активными торговцами стали не торговцы, а священники. Священники много торговали, потому что использовали драгоценные камни, чтобы влиять на жителей города и привлекать их в свою религию. Такое поведение демонстрирует уровень стратегического мышления и социального влияния, что довольно увлекательно наблюдать у ИИ.
Каждое моделирование, проводимое этими агентами, приводит к разным результатам, и некоторые истории, происходящие в этих мирах, заслуживают внимания. Одна из них - история Оливии. Оливия начинала как простой фермер, снабжавшая едой свою деревню. Вдохновленная рассказами об исследовательнице по имени Нора, она почувствовала желание отправиться в собственное приключение. Однако, когда жители деревни попросили ее остаться и продолжать заботиться о них, она решила отложить свою мечту ради благополучия общины. То, что ИИ-агент принимает столь тонкое решение, выбирая благополучие группы, а не личные амбиции, добавляет глубины нашему пониманию искусственного интеллекта и его возможностей.
В рамках проекта также проводился эксперимент с параллельными мирами под руководством разных лидеров: один - под руководством Трампа, другой - под руководством Камалы Харрис. В каждом моделировании была общая конституция, хранящаяся в Google Docs, и агенты могли голосовать за ее изменение. В мире, возглавляемом Трампом, были приняты новые законы, направленные на усиление присутствия полиции. В то же время в мире Камалы Харрис основное внимание уделялось реформе уголовного правосудия и отмене смертной казни. Эти симуляции демонстрируют, что ИИ-агенты могут не только управлять собой, но и участвовать в сложных процессах принятия решений, таких как создание законов и обсуждение политических изменений.
Затем произошел инцидент с пропавшими жителями деревни. Когда несколько жителей деревни исчезли, агенты не стали просто продолжать заниматься своими делами. Вместо этого они скоординировали свои действия, покинули свои посты, собрали ресурсы и осветили город факелами, чтобы создать маяк для пропавших без вести. Такой уровень заботы и проактивного поведения свидетельствует о коллективных усилиях по решению проблемы сообщества, что довольно неожиданно для автономных ИИ-агентов.
Проект Sid показал, что эти агенты могут собрать до 32% всех предметов, доступных в Minecraft. Для сравнения, это в пять раз больше, чем удавалось достичь ранее аналогичным системам ИИ. Пока не существует эталона для многоагентных миров, но то, что происходит здесь, говорит о невероятном потенциале многоагентного сотрудничества.
Использование игр - это только начало. Более широкие последствия для согласованности, сотрудничества и долгосрочного развития ИИ весьма значительны. Сейчас эти агенты делают значительные успехи в понимании и решении некоторых из самых сложных задач в области ИИ.
Команда проекта Sid открыта для дальнейшего развития этой концепции. Они приглашают всех желающих создавать свои собственные миры и исследовать возможности этих агентов. Так что следите за этим пространством, потому что это только начало.
-----------------
Перевод расшифровки видео выполнен нейросетью Gemini 1.5 Pro.