Компания Anthropic представила новую версию языковой модели ИИ Claude 2.1.

Что нового:
Контекстное окно 200K
Разработчики удвоили объем информации, которую вы можете передать в Claude, установив лимит в 200 000 лексем (у GPT-4 Turbo лимит в 128 000 лексем), что соответствует примерно 150 000 слов, или более 500 страницам материала. Теперь пользователи могут загружать техническую документацию, например, целые кодовые базы, финансовые отчеты, например, S-1, или даже длинные литературные произведения, такие как "Илиада" или "Одиссея". Имея возможность работать с большими массивами данных, Claude может обобщать, выполнять вопросы и ответы, прогнозировать тенденции, сравнивать и сопоставлять несколько документов и многое другое.
2-кратное снижение числа галлюцинаций
Модель Claude 2.1 также добилась значительных успехов в точности: в 2 раза снизилось количество ложных утверждений по сравнению с предыдущей моделью Claude 2.0. Это позволяет предприятиям создавать высокопроизводительные ИИ-приложения, решающие конкретные бизнес-задачи, и внедрять ИИ в свою деятельность с большим доверием и надежностью.
Кроме того, Claude 2.1 позволил значительно улучшить понимание и обобщение, особенно при работе с длинными сложными документами, требующими высокой точности, такими как юридические документы, финансовые отчеты и технические спецификации. Claude 2.1 продемонстрировал 30%-ное снижение количества неправильных ответов и 3-4-кратное снижение частоты ошибочных выводов о том, что документ подтверждает то или иное утверждение.
API Tool Use
Добавлена новая бета-версия функции "Tool Use", которая позволяет интегрировать Claude с существующими процессами, продуктами и API пользователей. Эта расширенная функциональная совместимость призвана сделать Claude более полезным в повседневной работе пользователей.
Теперь Claude может выполнять оркестровку функций или API, определяемых разработчиком, осуществлять поиск по веб-источникам и получать информацию из частных баз знаний. Пользователи могут определить набор инструментов для Claude и указать запрос. Модель сама определит, какой инструмент необходим для решения поставленной задачи, и выполнит от их имени то или иное действие, например:
- Использование калькулятора для сложных числовых расчетов;
- Преобразование запросов на естественном языке в структурированные вызовы API;
- Ответы на вопросы путем поиска в базах данных или с помощью API веб-поиска;
- Выполнение простых действий в программном обеспечении через частные API;
- Подключение к базам данных товаров для выработки рекомендаций и помощи пользователям в совершении покупок.
Опыт разработчиков
Создатели Claude работают над тем, чтобы упростить работу с консолью разработчика для пользователей API Claude и облегчить тестирование новых подсказок для ускорения обучения. Новый продукт Workbench позволяет разработчикам итеративно работать над подсказками в стиле игровой площадки и получать доступ к новым настройкам модели для оптимизации поведения Claude. Разработчики могут создавать несколько подсказок и переходить от одной к другой для различных проектов, при этом изменения сохраняются по мере их внесения, что позволяет сохранить исторический контекст. Разработчики также могут генерировать фрагменты кода для использования своих подсказок непосредственно в одном из SDK.
Кроме того введены системные подсказки, которые позволяют пользователям давать Claude пользовательские инструкции для повышения эффективности работы. Системные подсказки задают полезный контекст, который расширяет возможности Claude по принятию определенных личностных качеств и ролей или структурированию ответов в соответствии с потребностями пользователя.
Claude 2.1 уже доступен в API, а также используется в интерфейсе чата на сайте claude.ai для бесплатного и профессионального уровней. Использование контекстного окна с 200-килобайтным токеном предназначено только для пользователей Claude Pro, которые теперь могут загружать файлы большего размера, чем раньше.
Сайт Claude - Claude.
------------------------
Напоминаю, что в данный момент существуют следующие языковые модели (не включая устаревшие):
GPT-4 Turbo (ChatGPT, Microsoft Copilot)
Claude 2.1
PaLM 2 (Google Bard)
LLaMA 2 (Meta AI)
Grok-1 (X)
Есть и другие, но они либо низкокачественные, либо построены на базе исходных кодов GPT-2 с элементами от GPT-3, или LLaMA 2. Перечисленные являются самыми продвинутыми и известными языковыми моделями.
Что нового:
Контекстное окно 200K
Разработчики удвоили объем информации, которую вы можете передать в Claude, установив лимит в 200 000 лексем (у GPT-4 Turbo лимит в 128 000 лексем), что соответствует примерно 150 000 слов, или более 500 страницам материала. Теперь пользователи могут загружать техническую документацию, например, целые кодовые базы, финансовые отчеты, например, S-1, или даже длинные литературные произведения, такие как "Илиада" или "Одиссея". Имея возможность работать с большими массивами данных, Claude может обобщать, выполнять вопросы и ответы, прогнозировать тенденции, сравнивать и сопоставлять несколько документов и многое другое.
2-кратное снижение числа галлюцинаций
Модель Claude 2.1 также добилась значительных успехов в точности: в 2 раза снизилось количество ложных утверждений по сравнению с предыдущей моделью Claude 2.0. Это позволяет предприятиям создавать высокопроизводительные ИИ-приложения, решающие конкретные бизнес-задачи, и внедрять ИИ в свою деятельность с большим доверием и надежностью.
Кроме того, Claude 2.1 позволил значительно улучшить понимание и обобщение, особенно при работе с длинными сложными документами, требующими высокой точности, такими как юридические документы, финансовые отчеты и технические спецификации. Claude 2.1 продемонстрировал 30%-ное снижение количества неправильных ответов и 3-4-кратное снижение частоты ошибочных выводов о том, что документ подтверждает то или иное утверждение.
API Tool Use
Добавлена новая бета-версия функции "Tool Use", которая позволяет интегрировать Claude с существующими процессами, продуктами и API пользователей. Эта расширенная функциональная совместимость призвана сделать Claude более полезным в повседневной работе пользователей.
Теперь Claude может выполнять оркестровку функций или API, определяемых разработчиком, осуществлять поиск по веб-источникам и получать информацию из частных баз знаний. Пользователи могут определить набор инструментов для Claude и указать запрос. Модель сама определит, какой инструмент необходим для решения поставленной задачи, и выполнит от их имени то или иное действие, например:
- Использование калькулятора для сложных числовых расчетов;
- Преобразование запросов на естественном языке в структурированные вызовы API;
- Ответы на вопросы путем поиска в базах данных или с помощью API веб-поиска;
- Выполнение простых действий в программном обеспечении через частные API;
- Подключение к базам данных товаров для выработки рекомендаций и помощи пользователям в совершении покупок.
Опыт разработчиков
Создатели Claude работают над тем, чтобы упростить работу с консолью разработчика для пользователей API Claude и облегчить тестирование новых подсказок для ускорения обучения. Новый продукт Workbench позволяет разработчикам итеративно работать над подсказками в стиле игровой площадки и получать доступ к новым настройкам модели для оптимизации поведения Claude. Разработчики могут создавать несколько подсказок и переходить от одной к другой для различных проектов, при этом изменения сохраняются по мере их внесения, что позволяет сохранить исторический контекст. Разработчики также могут генерировать фрагменты кода для использования своих подсказок непосредственно в одном из SDK.
Кроме того введены системные подсказки, которые позволяют пользователям давать Claude пользовательские инструкции для повышения эффективности работы. Системные подсказки задают полезный контекст, который расширяет возможности Claude по принятию определенных личностных качеств и ролей или структурированию ответов в соответствии с потребностями пользователя.
Claude 2.1 уже доступен в API, а также используется в интерфейсе чата на сайте claude.ai для бесплатного и профессионального уровней. Использование контекстного окна с 200-килобайтным токеном предназначено только для пользователей Claude Pro, которые теперь могут загружать файлы большего размера, чем раньше.
Сайт Claude - Claude.
------------------------
Напоминаю, что в данный момент существуют следующие языковые модели (не включая устаревшие):
GPT-4 Turbo (ChatGPT, Microsoft Copilot)
Claude 2.1
PaLM 2 (Google Bard)
LLaMA 2 (Meta AI)
Grok-1 (X)
Есть и другие, но они либо низкокачественные, либо построены на базе исходных кодов GPT-2 с элементами от GPT-3, или LLaMA 2. Перечисленные являются самыми продвинутыми и известными языковыми моделями.


Комментарий