Благодарности Благодарности:  0
Показано с 1 по 7 из 7

Тема: Будущее языковых моделей

  1. #1 (449315)

    Будущее языковых моделей

    Развитие языковых моделей (LLM) не стоит на месте и обещает нам следующий 2024 год очень интересным.

    Вот список LLM, которые появятся уже в этом году или в следующем:

    1. Gemini (Google) - мультимодальная языковая модель, которая, как считают разработчики, превзойдет нынешнюю GPT-4 от OpenAI. Она сможет общаться с людьми не только текстовыми сообщениями, но и изображениями и аудио. Gemini будет интегрирован во многие сервисы Google, в том числе и в Google Bard. Нейросеть уже проходит тесты.

    2. Компания Meta выпустит в 2024 году новую языковую модель, которая будет в несколько раз превосходить модель LLaMA 2 и сможет конкурировать с GPT-4. Как назовут новую нейросеть пока неизвестно, но она точно будет иметь открытый исходный код, т.е. эту технологию смогут взять для своих аналогичных разработок другие компании со всего мира.

    3. GPT-5 (OpenAI) - будущая мультимодальная языковая модель от компании OpenAI. То, что эта модель точно будет выпущена в ближайшее время, подтверждает заявка компании на регистрацию товарного знака GPT-5. Как считают некоторые эксперты, GPT-5 достигнет AGI - это способность компьютерной системы превосходить людей при выполнении любой интеллектуальной задачи.

    4. TruthGPT (xAI) - искусственный интеллект, способный к продвинутому математическому мышлению, чего нет в современных моделях. Кроме того, по заявлению Илона Маска, данная модель, в отличии от других, будет понимать природу вселенной, а не просто знать о ней. Пока неизвестно когда именно будет создан TruthGPT, но, скорее всего, в 2024 году. К тому же Илон уже закупил тысячи процессоров NVIDIA H100 для обучения нейросети.

    Зачем нужны языковые модели? Они могут применяться почти во всем, что только вам приходит в голову, но в рамках текстового общения (пока в этих рамках). Подобные нейросети могут использоваться от образования до медицины, от составления планов на неделю до написания статей и даже книг, от суммаризации больших объемов информации до ее быстрого поиска, от получения простых советов до юридических и психологических консультаций, от просто поболтать на философские темы до обсуждения глобальных проблем, от решения простых математических задач до программирования, и многое другое. Языковые модели, через API, используются компаниями и даже правительственными организациями. Например, нейросеть GPT от OpenAI используется в Белом доме США для работы с документами.



    Напоминаю, что в данный момент существуют следующие LLM (в скобках указаны проекты, в которых используются модели):

    GPT-4 (ChatGPT, Bing Chat) - самый умный;
    Claude 2 - самый дружелюбный и с самым большим контекстным окном;
    PaLM 2 (Google Bard) - подопытный кролик;
    LLaMA 2 (Stable Chat) - с открытым исходным кодом, но очень плохо владеет русским языком.

    Есть и другие модели, но они либо низкокачественные, либо построены на базе исходного кода GPT-2 или LLaMA. Вышеперечисленные - самые мощные и известные на весь мир LLM.
    Последний раз редактировалось Oscar Smith; 20.09.2023 в 12:35.

  2. #2 (449318) | Ответ на # 449315
    Google Bard получил обновление.

    - Bard стал интуитивнее, креативнее и отзывчивее.
    - Теперь Bard может получать информацию из приложений Maps, YouTube, Hotels и Flights и работать с ней в режиме реального времени.
    - Теперь вы можете разрешить Bard взаимодействовать с информацией из ваших Gmail, Docs и Drive, чтобы вы могли находить, обобщать и отвечать на вопросы по всему вашему личному контенту.
    - Его ответы теперь можно проверить в Google Search, нажав на логотип Google. Функция работает пока на английском языке.
    - Если кто-то поделился с вами беседой на Bard через функцию публичного обмена ссылками, вы можете продолжить эту беседу в своем аккаунте и развить начатое.
    - Вы можете загружать изображения с помощью Google Lens, получать изображения из Google Search в ответах, а также изменять ответы Bard, делая их более простыми, длинными, короткими, профессиональными или непринужденными, на всех поддерживаемых языках.

    Подробнее обо всех обновлениях читайте здесь - Bard's Latest AI Capability Updates & Improvements - Bard.
    Пообщаться с Bard здесь - https://bard.google.com.

    Многие функции Bard пока недоступны в других странах или на других языках, кроме США и английского языка.

    Если разработчики заблокировали использование Bard в вашей стране, активируйте VPN, например, с американским IP адресом.
    Последний раз редактировалось Oscar Smith; 20.09.2023 в 15:36.

  3. #3 (449379) | Ответ на # 449318
    Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может "значительно лучше понимать запросы", анализировать сложные инструкции и генерировать "чрезвычайно детальные и точные изображения" по сравнению с DALL-E 2.



    "Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперед в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу", — сообщает OpenAI в описании нового генератора изображений.

    Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны.

    OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать еще более точные изображения и предоставит еще больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.



    "При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов", — говорят в OpenAI.

    "Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение", — уточняют в OpenAI.

    DALL-E 3 станет доступен общественности в октябре этого года.

    Подробнее на сайте OpenAI - https://openai.com/dall-e-3.

    ----------------

    В данный момент существуют следующие нейросети для генерации изображений по текстовому описанию:

    DALL-E 2 - самый умный;
    MidJourney 5.2 - мастер кисти;
    Adobe Firefly - самый функциональный;
    Stable Diffusion XL 1.0 - с открытым исходным кодом.

    Есть и другие, но все они построены на базе Stable Diffusion.
    Последний раз редактировалось Oscar Smith; 21.09.2023 в 11:28.

  4. #4 (449449) | Ответ на # 449379
    Красивая тема и информативная , как многие Ваши темы.
    кода апгрейдить комп к таким фишкам?

  5. #5 (449460) | Ответ на # 449449
    Цитата Сообщение от Дов Посмотреть сообщение
    кода апгрейдить комп к таким фишкам?
    Эти фишки работают на мощностях компаний, которые их создают. Так что ничего апгрейдить не нужно.
    Последний раз редактировалось Oscar Smith; 22.09.2023 в 09:01.

  6. #6 (449463) | Ответ на # 449460
    Цитата Сообщение от VladislavMotkov Посмотреть сообщение
    Эти фишки работают на мощностях компаний, которые их создают. Так что ничего апгрейдить не нужно.
    Спасибо. Хотя по линку https://openai.com/dall-e-3 прочитал soon - вот и спросил.

  7. #7 (450309) | Ответ на # 449318
    Цитата Сообщение от VladislavMotkov Посмотреть сообщение
    Google Bard получил обновление.

    - Bard стал интуитивнее, креативнее и отзывчивее.
    - Теперь Bard может получать информацию из приложений Maps, YouTube, Hotels и Flights и работать с ней в режиме реального времени.
    - Теперь вы можете разрешить Bard взаимодействовать с информацией из ваших Gmail, Docs и Drive, чтобы вы могли находить, обобщать и отвечать на вопросы по всему вашему личному контенту.
    - Его ответы теперь можно проверить в Google Search, нажав на логотип Google. Функция работает пока на английском языке.
    - Если кто-то поделился с вами беседой на Bard через функцию публичного обмена ссылками, вы можете продолжить эту беседу в своем аккаунте и развить начатое.
    - Вы можете загружать изображения с помощью Google Lens, получать изображения из Google Search в ответах, а также изменять ответы Bard, делая их более простыми, длинными, короткими, профессиональными или непринужденными, на всех поддерживаемых языках.

    Подробнее обо всех обновлениях читайте здесь - Bard's Latest AI Capability Updates & Improvements - Bard.
    Пообщаться с Bard здесь - https://bard.google.com.

    Многие функции Bard пока недоступны в других странах или на других языках, кроме США и английского языка.

    Если разработчики заблокировали использование Bard в вашей стране, активируйте VPN, например, с американским IP адресом.
    Чтобы получить весь функционал Bard, активируйте VPN с американским IP и в настройках Google аккаунта поменяйте язык на английский. Тогда вам будут доступны плагины для работы с YouTube, Gmail, Drive и с другими сервисами Google. Только общаться с Bard придется на английском языке.

Метки этой темы

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •