Ученые из MIT CSAIL придумали, как победить главную проблему современных ИИ — они либо умные и дорогие (как GPT-4), либо быстрые и глупые. Решение оказалось элегантным: разделение труда.
Система DisCIPL
Работает это как в офисе:
1. Босс (Большая модель): Планирует задачу и пишет инструкции на специальном языке программирования.
2. Подчиненные (Маленькие модели): Выполняют куски работы. Например, если нужно написать стихотворение по жестким правилам, одна модель следит за рифмой, другая — за смыслом.
Результаты впечатляют:
Система, использующая крошечные модели Llama (которые в 10 000 раз дешевле гигантов), смогла обойти GPT-4o в задачах на логику и планирование. Она работает на 40% быстрее и на 80% дешевле, чем навороченная модель o1 от OpenAI.
Вердикт: Это шанс для малого бизнеса и стартапов. Теперь, чтобы получить мощный ИИ, не обязательно арендовать суперкомпьютер — достаточно умной архитектуры из «малышей».