Американские компании Meta и Microsoft объединили усилия, чтобы запустить большую языковую модель LLaMA 2. Она открыта и позволяет разработчикам и организациям создавать генеративные инструменты на ее базе.
Microsoft объявила о запуске модели на мероприятии Inspire 2023. Компания отметила, что вместе с партнером разделяет приверженность к демократизации ИИ и его преимуществ.
Генеральный директор Meta Марк Цукерберг раскрыл дополнительную информацию о LLaMA 2 и объяснил ее отличия от предшественника LLaMA 1. По его словам, новая модель была предварительно обучена с использованием на 40% большего объема данных, чем первая версия, а также получила улучшенную архитектуру. Для ее обучения разработчики собрали более 1 млн человеческих аннотаций, а также применили контролируемую доводку и обучение с подкреплением с обратной связью (RLHF) для повышения безопасности и качества модели.
LLaMA 2 можно бесплатно использовать в исследовательских и коммерческих целях. Протестировать языковую модель можно на платформах Microsoft Azure, Amazon Web Services, Hugging Face и других.
В феврале Цукерберг представил модель LLaMA. Он заявил, что новая "LLM показала многообещающие результаты в создании текста, диалоге, обобщении письменных материалов и выполнении более сложных задач, таких как доказательство теорем или предсказание структуры белка". LLaMA представляет собой не единую систему, а "квартет моделей" разного размера. Она доступна в четырех версиях: LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров 7, 13, 33 и 65 млрд.

Так же прочтите эту тему - https://www.vforum.org/forum/t7144.html. Не забывайте переходить по ссылкам в самой теме.
Microsoft объявила о запуске модели на мероприятии Inspire 2023. Компания отметила, что вместе с партнером разделяет приверженность к демократизации ИИ и его преимуществ.
Генеральный директор Meta Марк Цукерберг раскрыл дополнительную информацию о LLaMA 2 и объяснил ее отличия от предшественника LLaMA 1. По его словам, новая модель была предварительно обучена с использованием на 40% большего объема данных, чем первая версия, а также получила улучшенную архитектуру. Для ее обучения разработчики собрали более 1 млн человеческих аннотаций, а также применили контролируемую доводку и обучение с подкреплением с обратной связью (RLHF) для повышения безопасности и качества модели.
LLaMA 2 можно бесплатно использовать в исследовательских и коммерческих целях. Протестировать языковую модель можно на платформах Microsoft Azure, Amazon Web Services, Hugging Face и других.
В феврале Цукерберг представил модель LLaMA. Он заявил, что новая "LLM показала многообещающие результаты в создании текста, диалоге, обобщении письменных материалов и выполнении более сложных задач, таких как доказательство теорем или предсказание структуры белка". LLaMA представляет собой не единую систему, а "квартет моделей" разного размера. Она доступна в четырех версиях: LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров 7, 13, 33 и 65 млрд.

Так же прочтите эту тему - https://www.vforum.org/forum/t7144.html. Не забывайте переходить по ссылкам в самой теме.
Комментарий