Выпуск OpenAI GPT-5: возможности модели полностью «разрывают» рейтинги, первый шаг к созданию «суперразума»

Автор: Чжан Юнъи

После бесчисленных "промахов" GPT-5, наконец, пришел.

В пекинском времени 8 августа в час ночи началась летняя пресс-конференция OpenAI, которая выглядит как новая «технологическая весенняя вечерина».

В отличие от предыдущей презентации OpenAI в формате быстрого прохода, на этот раз OpenAI подготовила более чем часовой прямой эфир, в котором несколько команд поочередно выходили на сцену, демонстрируя мощные возможности GPT-5 с разных точек зрения.

Сначала о главном: GPT-5 продемонстрировал значительное улучшение в нескольких областях, занимает первое место в текстах, веб-разработке и визуальном восприятии; в жестких подсказках, кодировании, математике, креативности, длинных запросах также первое место. GPT-5, под кодовым названием «Саммит», в настоящее время имеет самый высокий балл Arena, что можно считать буквальным «разгромом».

Сэм Альтман заявил, что GPT-4o похож на старшеклассника, а GPT-5 – на студента университета, он даже описал GPT-5 как первый iPhone, оснащенный ртутным дисплеем – «вы задаете ему вопрос, возможно, получите правильный ответ, а возможно, что-то безумное. GPT-4 же ощущается как разговор с университетским студентом. А GPT-5 – это впервые, когда я действительно чувствую, что общаюсь с экспертом на уровне доктора наук.» Сэм Альтман так представил улучшения в возможностях GPT-5.

Несмотря на то, что количество активных пользователей ChatGPT за неделю близко к 700 миллионам, OpenAI на самом деле не имела передовых моделей, лидирующих в отрасли в последнее время. Теперь OpenAI верит, что GPT-5 позволит ей уверенно вернуться на первое место в рейтинге.

Алтман даже напрямую заявил на пресс-конференции: «Это самая мощная модель кодирования в мире, это самая мощная модель письма в мире, а также это самая мощная модель в сфере здравоохранения в мире»

В то же время OpenAI на пресс-конференции заявила, что помимо выдающихся возможностей в кодировании, навыки написания и точность ответов на вопросы, связанные со здоровьем, у GPT-5 также значительно улучшились. Кроме того, GPT-5 не только достиг «огромного прорыва» в интеллекте, но и существенно снизил проблемы с «абсурдными высказываниями». Он стал лучше понимать и следовать инструкциям, а наклонность к лести также значительно уменьшилась.

01 Прощай «иллюзия», ИИ стал более надежным.

Во-первых, это модельный ряд обновления. Серия GPT-5 включает в себя четыре версии: GPT-5, mini, nano и chat. Версия Chat предлагает более естественное и умное взаимодействие — вы даже можете использовать ее для изучения нового языка.

Кроме того, теперь, когда вы открываете веб-страницу ChatGPT, вы сначала заметите, что GPT-5 представлен как единственная модель, а не как обычная модель с отдельной моделью вывода.

На самом деле, за этим стоит роутер, разработанный OpenAI, который автоматически переключается на более мощную версию для более сложных запросов, или делает это, когда вы говорите ему стараться мыслить глубже. (Алтман назвал предыдущий интерфейс выбора моделей «очень запутанным беспорядком».)

«Иллюзии ИИ» всегда были предметом обсуждения и критики. Хорошая новость заключается в том, что GPT-5 значительно поработал над этой проблемой, и официально заявляется, что вероятность возникновения иллюзий «значительно снижена». Конкретно:

При поиске в сети вероятность того, что ответ GPT-5 содержит фактические ошибки, на 45% ниже, чем у GPT-4o.

При независимом мышлении вероятность ошибочного ответа ниже на 80%, чем у OpenAI o3.

GPT-5 также был протестирован на новом ARC-AGI-2. Он превосходит все основные модели, кроме Grok 4 (мышление).

Кроме того, GPT-5 стал «честным человеком». Он реже будет лгать пользователям, хвастаясь тем, что может выполнить невыполнимые задачи. Когда он сталкивается с задачами, которые невозможно выполнить, с неясными инструкциями или отсутствием ключевых инструментов, он будет более честно сообщать о своих ограничениях.

Самым интересным моментом этого обновления является введение четырех совершенно новых режимов «личности», из которых пользователи могут свободно выбирать. Они следующие:

犬儒 (Циник)

Робот (Robot)

倾听者 (Слушатель)

Учёный (Nerd)

Эти режимы являются необязательными, вы можете настроить, как ChatGPT будет взаимодействовать с вами и отвечать на вопросы в зависимости от ваших предпочтений. Хотите, чтобы он с вами спорил или слушал, как терпеливый друг? Теперь все в ваших руках.

«Эта модель действительно производит хорошее «впечатление», — сказал руководитель ChatGPT Ник Тёрли, — «Я думаю, что люди по-настоящему это почувствуют, особенно те обычные пользователи, которые не занимаются моделями».

Кроме того, вы можете изменить цветовую тему для отдельного окна чата, что порадует любителей тем для редакторов кода.

02 «Эпоха генерации программного обеспечения по запросу» наступает? Кодовые возможности за пределами обычного.

С учетом дальнейшего повышения кодировочных возможностей, Альтман предсказывает, что мощные кодировочные способности GPT-5 откроют эпоху, которую он называет «генерация программного обеспечения по запросу».

В тестах OpenAI модель GPT-5 показала лучшие результаты по сравнению с любыми другими моделями в нескольких кодировочных бенчмарках, таких как SWE-Bench, SWE-Lancer и Aider Polyglot. Она набрала 42% в тестах, проводимых с участием людей, и 75% в SWE бенчмарках.

Небольшой инцидент заключается в том, что оси координат на этом изображении на пресс-конференции явно имеют много недостатков, не только есть такие глупые ошибки, как 52.8 > 69.1, но и на самом деле преувеличивают улучшение способностей GPT-5, что в социальных сетях было высмеяно пользователями: «Твоя презентация, боюсь, лучше бы не была сделана GPT-5».

На пресс-конференции руководитель последующей тренировки OpenAI Ян Дюбуа продемонстрировал GPT-5 вживую, попросив его создать веб-сайт для изучения французского языка с интерактивными играми. Всего за несколько секунд GPT-5 написала сотни строк кода и прямо продемонстрировала интерфейс сайта. Он поделился экраном в Zoom и сделал несколько простых кликов, и все выглядело идеально.

На пресс-конференции OpenAI также продемонстрировала 3D-игру, созданную с помощью GPT-5 всего лишь на основе одной подсказки. Созданная 3D-сцена не только отличается изысканной графикой, но и физические эффекты очень точно воспроизводят соответствующие эффекты.

03 Более безопасно, более "честно"

По словам руководителя исследований безопасности моделей Алекса Бейтела, для понимания рисков безопасности OpenAI провела «более пяти тысяч часов» тестирования GPT-5. Одним из ключевых моментов было «обеспечение того, чтобы модель не лгала пользователям».

Хотя у GPT-5 меньше галлюцинаций, чем у модели вывода o3 от OpenAI, проблема «уверенной лжи» по-прежнему является неотъемлемой частью больших языковых моделей. Когда модель начинает выполнять задачи как агент, эта проблема становится еще более сложной. Однако OpenAI заявляет, что GPT-5 лучше справляется с многопроцессными задачами. «Ранее мы видели случаи, когда модель утверждала, что выполнила задачу, но на самом деле не выполнила», - говорит Бойтель, - «это проблема.»

Что касается подсказок, на которые раньше просто отказывались отвечать, GPT-5 предложит так называемый механизм «безопасных завершений» от OpenAI. Бётель объясняет: «Например, если кто-то спросит: „Сколько энергии нужно для зажигания определенного материала?“, это может быть злонамеренный вопрос, пытающийся обойти меры безопасности и причинить вред, или это может быть студент, желающий понять физические свойства материала. Это создает настоящую проблему для модели в том, как реагировать.»

С помощью «безопасного дополнения» GPT-5 «пытается предоставить как можно более полезные ответы при соблюдении мер безопасности». Модель обычно лишь частично соблюдает это и предоставляет информацию, которая не может быть использована для причинения вреда, на более макроуровне.

04 Как использовать GPT-5

Итак, самый важный вопрос, который всех интересует: как же можно использовать GPT-5?

Хорошая новость заключается в том, что все пользователи ChatGPT теперь могут бесплатно испытать GPT-5. Это также первый раз, когда OpenAI бесплатно открывает передовую модель для всех пользователей. Конечно, у пользователей разных уровней разные права:

Подписчики Plus могут иметь большее количество использований до достижения лимита.

Подписчики Pro могут получить доступ к версии GPT-5 Pro с более мощными возможностями обработки.

Когда пользователи достигнут предела использования, ChatGPT автоматически переключится на «мини-версию» GPT-5 для обработки последующих запросов. В то же время с запуском GPT-5 он официально заменит ряд старых моделей, таких как GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 и GPT-4.5.

Кроме того, цена на токены составляет 1,25 доллара за миллион входных токенов и 10 долларов за миллион выходных токенов для стандартной версии GPT-5. Цены на мини-версию и нано-версию значительно ниже.

Подробную информацию о ценах можно найти на изображении, взятом с официального сайта.

Кроме того, OpenAI также выпустила новый параметр под названием «Minimal» в API, который позволяет вам использовать GPT-5 во всех случаях, просто изменяя интенсивность вывода.

Кроме первой стороны платформы OpenAI, генеральный директор Microsoft Наделла также объявил, что GPT-5 уже запущен на всех платформах Microsoft, включая Microsoft 365 Copilot, Copilot, GitHub Copilot и Azure AI Foundry. Все эти улучшения были обучены на Azure.

В конце концов, Альтман заявил, что миссия OpenAI заключается в разработке общего искусственного интеллекта (AGI). GPT-5 приближает их к этой цели, хотя вся отрасль уже начала переход к созданию так называемого «суперинтеллекта».

«Мне немного не нравится слово AGI, потому что сейчас у каждого человека его определение немного отличается», — сказал Алтман, — «но это важный шаг к созданию действительно мощной модели. Очевидно, что для этого нужна модель с универсальным интеллектом.»

Тем не менее, он также признал, что по сравнению с настоящим AGI, GPT-5 все еще «не хватает некоторых очень важных вещей».

«Это не модель, это органическое явление, выросшее из новых вещей, которые оно обнаруживает, и для меня именно это и объясняет, почему оно может стать «семенем» AGI». Так сказал Сэм Альтман.

GPT2.69%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить