Компания Mistral AI утверждает, что ее модель Small 3 является локальной альтернативой GPT-4o mini с открытым исходным кодом

Французская лаборатория Mistral утверждает, что Small 3 может конкурировать с Llama 3.3 70B и Qwen 32B, среди других больших моделей и это «отличная открытая замена для непрозрачных проприетарных моделей, таких как GPT4o-mini».

Разработанный для локального использования, Small 3 обеспечивает базу для развития способностей к рассуждениям, говорит Мистраль.

«Small 3 превосходно работает в сценариях, где важны быстрые и точные ответы»
- говорится в релизе, и отмечается, что модель имеет меньше слоев, чем аналогичные модели, что способствует ее скорости

Интересно: ChatGPT Images 2.0 уже здесь

Модель достигла более 81% точности в эталонном тесте MMLU, при этом она не обучалась с помощью обучения с подкреплением (RL), что, по словам Mistral, делает ее «более ранней в конвейере производства моделей», чем DeepSeek R1.

Наша модель, настроенная на инструкции, демонстрирует конкурентоспособные результаты по сравнению с открытыми моделями в три раза большего размера и с собственной моделью GPT4o-mini в тестах «Программирования», «Математика» и «Обществознание».

Пользуясь услугами стороннего поставщика, компания Mistral провела тестирование Small 3 с помощью более чем 1 000 подсказок по кодированию и общим знаниям. Большинство тестировщиков отдали предпочтение Small 3 перед Gemma-2 27B и Qwen-2.5 32B, однако при сравнении Small 3 с Llama-3.3 70B и GPT-4o mini мнения разделились более равномерно. Компания Mistral признала, что человеческие оценки отличаются от стандартизированных публичных эталонов.

Mistral рекомендует Small 3 для создания виртуальных помощников, работающих с клиентами, особенно для быстро решаемых задач, таких как обнаружение мошенничества в сфере финансовых услуг, юридические консультации и здравоохранение, поскольку его можно точно настроить для создания «высокоточных экспертов в предметной области», говорится в релизе.

Small 3 также может использоваться в робототехнике и производстве и может стать идеальным решением для «любителей и организаций, работающих с конфиденциальной или закрытой информацией», поскольку его можно запустить на MacBook с минимальным объемом оперативной памяти 32 ГБ.

Компания Mistral сообщила, что в ближайшие недели мы можем ожидать появления новых моделей разных размеров «с расширенными возможностями рассуждений».

Сечинов Михаил Эксперт по компьютерному железу

Один из основателей проекта ITShaman.ru. Я люблю компьютерное железо. Люблю Intel, но дома и на работе использую AMD. Из-за этого много экспериментирую и тестирую.

Компания Mistral AI утверждает, что ее модель Small 3 является локальной альтернативой GPT-4o mini с открытым исходным кодом

Комментарии (0)