Китайская нейросеть DeepSeek научилась исправлять свои ошибки и победила лучших студентов-математиков

Китайская компания DeepSeek совершила прорыв в области математического мышления (reasoning). В препринте, опубликованном на arXiv и освещенном журналом *Nature*, сообщается, что их новая модель DeepSeekMath-V2 способна находить и исправлять собственные ошибки в ходе рассуждений.

Результаты впечатляют:

  • Олимпиады: Модель набрала 118 из 120 баллов на престижном конкурсе Putnam (для студентов бакалавриата), побив лучший результат человека (90 баллов).
  • IMO: На Международной математической олимпиаде 2025 года ИИ показал уровень золотого медалиста, решив 5 из 6 задач.

В чем секрет?

В отличие от Google DeepMind, который использует сложный символический язык для проверки, DeepSeek внедрила «вербальную самопроверку». Модель сама генерирует решение, затем «перечитывает» его, как строгий учитель, ищет логические дыры и исправляет их. Это создает замкнутый цикл обучения, где ИИ становится умнее с каждой итерацией.

Оставьте комментарий