Гонка вооружений продолжается. Спустя всего несколько недель после релиза GPT-5.1, OpenAI выкатывает «тяжелую артиллерию» — модель GPT-5.2.
По словам Сэма Альтмана, этот релиз знаменует конец режима «code red» (авральной мобилизации), который был введен внутри компании в ответ на успехи конкурентов из Google и Anthropic.
Что умеет GPT-5.2?
Новая модель позиционируется как идеальный инструмент для профессионалов. Главные улучшения:
- Агенты и код: Модель лучше справляется с автономным написанием программного кода (побила бенчмарк SWE-Bench Pro).
- Офисная работа: Улучшено создание сложных таблиц и презентаций.
- Аналитика: Более глубокое понимание длинных контекстов и научных задач (бенчмарк GPQA Diamond).
Доступность:
Модель уже доступна в ChatGPT (в режимах Instant, Thinking и Pro) и через API.
Битва метрик:
OpenAI заявляет, что GPT-5.2 превосходит человека в 70.9% специфических задач. Однако конкуренты не дремлют: Anthropic утверждает, что их Opus 4.5 всё ещё лучше кодит в определенных тестах. Альтман парирует, называя тесты конкурентов «устаревшими».
Вердикт: OpenAI пытается оправдать свою оценку в $500 млрд, доказывая инвесторам, что всё ещё держит корону технологического лидера.