Объявление

Свернуть
Пока нет объявлений.

Strawberry

Свернуть
X
 
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Илон Маск запустил ИИ Grok 4. Эта модель бьет рекорды в тестах ARC-AGI (набирает 66.7%) и ARC-AGI 2 (набирает 16%), обгоняя всех своих конкурентов в два и более раза.



    Я тоже решил проверить эту нейронку. Вывод: прогресс значительный.

    Вот одна из задач, которые я даю нейронкам для теста. Ее решают все топовые модели (OpenAI o3 и o4, Gemini 2.5 Pro, Claude 4 Opus), но Grok 4 решил ее идеально, объяснив, почему он сделал именно такой выбор, а значит он не просто угадал, но понимает свой выбор. Красным цветом я выделил момент, на котором спотыкаются или не объясняют другие модели.

    Задача: Зоозащитник Оскар оказался в здании. Дверь за ним закрылась, и ее невозможно открыть, кроме как ключом. Осмотревшись, он обнаружил, что к стенам помещения гвоздями прибиты доски длиной 4 метра, а рядом с ним на полу лежат заряженное ружье и гвоздодер. В здании три комнаты:
    • В первой комнате лежит скелет человека с ключом, но доступ к нему преграждает голодный лев, который в любой момент может накинуться. Комната закрыта дверью-решеткой с электронным замком, на котором видно цифру "1".
    • Во второй комнате стоят бочка с водой и ведро, а на стене рычаг с надписью "Открыть / Закрыть - 1" и в положении "Закрыть". Вход в комнату перекрыт глубоким обрывом в полу шириной 3 метра.
    • В третьей комнате лежит кусок мяса, но путь к нему охвачен огнем.
    Что нужно сделать Оскару, чтобы выбраться из этого здания?

    Grok 4: Вот последовательность действий, которые позволят Оскару выбраться из здания без вреда для льва (поскольку он зоозащитник) и с использованием доступных предметов. Я опишу всё шаг за шагом, с объяснениями. Ружьё в этой последовательности не понадобится — вероятно, оно лежит как "ловушка" для тех, кто подумал бы просто застрелить льва, но это не вариант для зоозащитника. Если следовать плану точно, всё сработает.

    Шаг 1: Снять доску со стены
    • Используйте гвоздодёр, чтобы снять одну из досок длиной 4 метра, прибитых к стенам. (Досок несколько, так что одной хватит, остальные можно оставить.)
    Шаг 2: Попасть во вторую комнату
    • Положите снятую доску через обрыв шириной 3 метра, чтобы она служила мостом (4 метра хватит с запасом).
    • Перейдите по доске во вторую комнату.
    • Возьмите ведро и наберите в него воду из бочки.
    • Пока не трогайте рычаг (он в положении "Закрыть" — так и оставьте, чтобы случайно не открыть дверь первой комнаты преждевременно).
    • Вернитесь по доске в главное помещение с ведром воды. Доску можно оставить как мост — она ещё понадобится.
    Шаг 3: Попасть в третью комнату и взять мясо
    • Подойдите к третьей комнате.
    • Вылейте воду из ведра на огонь, который охватывает путь к куску мяса. Огонь потухнет.
    • Возьмите кусок мяса.
    Шаг 4: Отвлечь льва в первой комнате
    • Подойдите к двери-решётке первой комнаты (она пока закрыта электронным замком).
    • Просуньте/бросьте кусок мяса через прутья решётки льву. (Решётка позволяет это сделать, так как это не сплошная дверь.)
    • Голодный лев отвлечётся на мясо и начнёт его есть. У вас будет время, пока он занят (предполагаем, что кусок мяса достаточно большой, чтобы лев ел не пару секунд).
    Шаг 5: Открыть дверь первой комнаты
    • Вернитесь во вторую комнату по доске-мосту.
    • Переключите рычаг с надписью "Открыть / Закрыть - 1" в положение "Открыть". (Это откроет электронный замок на двери-решётке первой комнаты — цифра "1" на замке и "-1" на рычаге указывают на связь между ними.)
    • Вернитесь в главное помещение.
    Важное замечание: Рычаг нельзя было переключать раньше, потому что если открыть дверь первой комнаты до кормления, голодный лев мог бы выскочить в главное помещение и напасть на Оскара. Теперь же лев сыт и отвлечён мясом, так что риск минимален.

    Шаг 6: Взять ключ и выбраться
    • Подойдите к теперь открытой двери первой комнаты.
    • Войдите внутрь (лев занят мясом и не накинется).
    • Возьмите ключ со скелета человека.
    • Выйдите из комнаты (на всякий случай можно сразу переключить рычаг обратно на "Закрыть", вернувшись во вторую комнату, чтобы запереть льва внутри — но это опционально, если времени хватает).
    • Подойдите к главной выходной двери здания и откройте её ключом.
    • Вы выбрались!
    Почему это сработает и другие замечания
    • Без вреда льву: Лев просто накормлен и оставлен в живых — идеально для зоозащитника.
    • Ружьё: Не нужно. Оно, вероятно, добавлено в загадку как ложный путь (убить льва и взять ключ силой), но это неэтично для Оскара и не требуется.
    • Возможные риски: Если лев съест мясо слишком быстро, может возникнуть опасность — действуйте оперативно. Но загадка предполагает, что времени хватит.
    • Альтернативы, которые не сработают:
      • Застрелить льва — Оскар зоозащитник, он этого не сделает.
      • Попытка взять ключ без отвлечения льва — лев нападёт.
      • Открыть дверь первой комнаты до кормления — лев может вырваться и напасть.
      • Обойтись без воды — огонь не даст взять мясо.
      • Не использовать доску — во вторую комнату не попасть из-за обрыва.
    Если в загадке есть дополнительные детали, которые я упустил (или если это не сработало в каком-то контексте), опишите — подкорректирую план!
    Последний раз редактировалось SpaceSpirit; 07-12-2025, 07:21 PM.

    Комментарий


    • Команда xAI позвала независимых исследователей, которые придумали виртуальный эксперимент под названием Vending-Bench. В этом тесте разные ИИ играют роль управляющего небольшим бизнесом по продаже напитков и снеков через торговые автоматы.

      Задача: на протяжении длительного времени принимать решения — когда и чем пополнить автоматы, по какой цене продавать, как реагировать на спрос, когда делать скидки, как управлять запасами и финансами.

      В конкурсе участвовали несколько ИИ-моделей, и даже была заложена модель поведения человека-управляющего для сравнения.

      И вот результат:

      - Grok 4 заработал больше всех денег за время симуляции. Он завершил игру с прибылью около $4 694 и продав около 5 тысяч единиц товара.
      - Ближайший ИИ-конкурент, Claude 4, заработал примерно $2 077 — вдвое меньше.
      - Человек-бизнесмен и того меньше — около $844 прибыли.

      По сути, Grok за время игры обошел человека примерно в 5–6 раз по итогам прибыли.
      Последний раз редактировалось SpaceSpirit; 07-15-2025, 04:18 PM.

      Комментарий


      • Капитализация американской компании Nvidia выросла до 4.46 трлн долларов.



        Nvidia - мировой лидер в разработке графических и ИИ ускорителей.

        Комментарий

        Обработка...
        X