Китайская компания DeepSeek совершила прорыв в области математического мышления (reasoning). В препринте, опубликованном на arXiv и освещенном журналом *Nature*, сообщается, что их новая модель DeepSeekMath-V2 способна находить и исправлять собственные ошибки в ходе рассуждений.
Результаты впечатляют:
- Олимпиады: Модель набрала 118 из 120 баллов на престижном конкурсе Putnam (для студентов бакалавриата), побив лучший результат человека (90 баллов).
- IMO: На Международной математической олимпиаде 2025 года ИИ показал уровень золотого медалиста, решив 5 из 6 задач.
В чем секрет?
В отличие от Google DeepMind, который использует сложный символический язык для проверки, DeepSeek внедрила «вербальную самопроверку». Модель сама генерирует решение, затем «перечитывает» его, как строгий учитель, ищет логические дыры и исправляет их. Это создает замкнутый цикл обучения, где ИИ становится умнее с каждой итерацией.