DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно

21 января 2025
2 Mins Read
8 Views


			DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно

Китайская лаборатория искусственного интеллекта DeepSeek выпустила модель рассуждения R1, которая продублировала, а то и превзошла результаты o1 от OpenAI в некоторых тестах.

С плюсов — DeepSeek R1 доступна бесплатно с лимитом до 50 сообщений в день. После регистрации или авторизации нужно выбрать опцию «DeepThink».

По данным DeepSeek, R1 превосходит o1 в тестах AIME, MATH-500 и SWE-bench Verified (первый сравнивает модель с другими для оценки эффективности, второй является сборкой текстовых задач, а третий сосредотачивается на задачах программирования).

Тесты R1 / DeepSeek

Модели рассуждения отличаются тем, что могут эффективно проверять факты и избегать некоторых «ловушек», на которых обычно «тормозят» стандартные модели, а также показывать надежные результаты в естественных науках, физических и математических задачах. В то же время, по сравнению со стандартными, моделям рассуждениям необходимо немного больше времени для поиска решения.

DeepSeek R1 содержит 671 млрд параметров, тем не менее доступны и версии «попроще», которые имеют от 1,5 млрд до 79 млрд параметров — при этом наименьшая может работать и на ПК, тогда как для мощных версий понадобится сильное оборудование (тем не менее и оно доступно через API DeepSeek по цене на 90% ниже, чем OpenAI o1).

Учитывая, что DeepSeek R1 — это китайская модель, здесь есть и определенные минусы. Ее работа должна быть одобрена китайским регулятором, который должен убедиться, что ответы модели «воплощают основные социалистические ценности» (то есть R1 не ответит на вопросы о площади Тяньаньмэнь или автономии Тайваня).

Интересно, что одна из предыдущих ИИ-моделей DeepSeek также превзошла многих конкурентов по популярным тестам (в частности в программировании и написании эссе), однако имела интересную особенность — считала, что она ChatGPT (вероятно, из-за того, что обучалась на данных американской конкурентки).

СпецпроектыПереваги роботи в SharksCode на думку розробниківІгровий ноутбук ROG Strix SCAR на RTX 5090: задня кришка знімається без гвинтів, рідкий метал замість термопасти і рівень шуму до 45 дБ

Новая модель ChatGPT o1 «плела интриги против людей» и мешала себя выключить во время контрольных тестов, — Apollo Research

Источник: TechCrunch

itc.ua

Exit mobile version