Развитие языковых моделей (LLM) не стоит на месте и обещает нам следующий 2024 год очень интересным.
Вот список LLM, которые появятся уже в этом году или в следующем:
1. Gemini (Google) - мультимодальная языковая модель, которая, как считают разработчики, превзойдет нынешнюю GPT-4 от OpenAI. Она сможет общаться с людьми не только текстовыми сообщениями, но и изображениями и аудио. Gemini будет интегрирован во многие сервисы Google, в том числе и в Google Bard. Нейросеть уже проходит тесты.
2. Компания Meta выпустит в 2024 году новую языковую модель, которая будет в несколько раз превосходить модель LLaMA 2 и сможет конкурировать с GPT-4. Как назовут новую нейросеть пока неизвестно, но она точно будет иметь открытый исходный код, т.е. эту технологию смогут взять для своих аналогичных разработок другие компании со всего мира.
3. GPT-5 (OpenAI) - будущая мультимодальная языковая модель от компании OpenAI. То, что эта модель точно будет выпущена в ближайшее время, подтверждает заявка компании на регистрацию товарного знака GPT-5. Как считают некоторые эксперты, GPT-5 достигнет AGI - это способность компьютерной системы превосходить людей при выполнении любой интеллектуальной задачи.
4. TruthGPT (xAI) - искусственный интеллект, способный к продвинутому математическому мышлению, чего нет в современных моделях. Кроме того, по заявлению Илона Маска, данная модель, в отличии от других, будет понимать природу вселенной, а не просто знать о ней. Пока неизвестно когда именно будет создан TruthGPT, но, скорее всего, в 2024 году. К тому же Илон уже закупил тысячи процессоров NVIDIA H100 для обучения нейросети.
Зачем нужны языковые модели? Они могут применяться почти во всем, что только вам приходит в голову, но в рамках текстового общения (пока в этих рамках). Подобные нейросети могут использоваться от образования до медицины, от составления планов на неделю до написания статей и даже книг, от суммаризации больших объемов информации до ее быстрого поиска, от получения простых советов до юридических и психологических консультаций, от просто поболтать на философские темы до обсуждения глобальных проблем, от решения простых математических задач до программирования, и многое другое. Языковые модели, через API, используются компаниями и даже правительственными организациями. Например, нейросеть GPT от OpenAI используется в Белом доме США для работы с документами.
Напоминаю, что в данный момент существуют следующие LLM (в скобках указаны проекты, в которых используются модели):
GPT-4 (ChatGPT, Bing Chat) - самый умный;
Claude 2 - самый дружелюбный и с самым большим контекстным окном;
PaLM 2 (Google Bard) - подопытный кролик;
LLaMA 2 (Stable Chat) - с открытым исходным кодом, но очень плохо владеет русским языком.
Есть и другие модели, но они либо низкокачественные, либо построены на базе исходного кода GPT-2 или LLaMA. Вышеперечисленные - самые мощные и известные на весь мир LLM.