Голос и текст в одном флаконе: Mistral выпустила мультимодальную модель Voxtral

Mistral AI выкатила семейство моделей Voxtral (Mini на 3 млрд параметров и Small на 24 млрд). Их главная фишка — они не конвертируют речь в текст, чтобы потом его прочитать. Они воспринимают аудио напрямую, понимая интонации, эмоции и контекст. Что это дает? Умные ассистенты: Можно сказать «Посчитай корень из 144», и модель не просто запишет … Читать далее

Mistral OCR 3: Европейский ответ в битве за распознавание документов

Mistral AI представила OCR 3 — прорывной инструмент для оцифровки документов. Разработчики заявляют о победе над конкурентами в 74% случаев, особенно когда речь идет о сложных задачах: рукописном тексте, сканах низкого качества и запутанных таблицах. Что умеет новая модель? Почерк: С легкостью разбирает курсив, заметки на полях и текст, написанный поверх печатных форм. Таблицы: Не … Читать далее