Умный не значит большой: MIT научил «карманные» нейросети рассуждать лучше GPT-4o

Ученые из MIT CSAIL придумали, как победить главную проблему современных ИИ — они либо умные и дорогие (как GPT-4), либо быстрые и глупые. Решение оказалось элегантным: разделение труда.

Система DisCIPL

Работает это как в офисе:

1. Босс (Большая модель): Планирует задачу и пишет инструкции на специальном языке программирования.

2. Подчиненные (Маленькие модели): Выполняют куски работы. Например, если нужно написать стихотворение по жестким правилам, одна модель следит за рифмой, другая — за смыслом.

Результаты впечатляют:

Система, использующая крошечные модели Llama (которые в 10 000 раз дешевле гигантов), смогла обойти GPT-4o в задачах на логику и планирование. Она работает на 40% быстрее и на 80% дешевле, чем навороченная модель o1 от OpenAI.

Вердикт: Это шанс для малого бизнеса и стартапов. Теперь, чтобы получить мощный ИИ, не обязательно арендовать суперкомпьютер — достаточно умной архитектуры из «малышей».

Оставьте комментарий Отменить ответ