Китайський стартап DeepSeek випустив оновлену версію своєї моделі штучного інтелекту R1 для мислення на платформі розробників Hugging Face, оголосивши про це в повідомленні WeChat.
Оновлена версія R1, яка перебуває під ліцензією MIT, що означає можливість комерційного використання, є «незначним» оновленням, згідно з оголошенням DeepSeek у WeChat. Репозиторій Hugging Face не містить опису моделі — лише файли конфігурації та ваги, внутрішні компоненти моделі, які керують її поведінкою.
Зі значенням розміру 685 мільярдів параметрів, оновлений R1 є досить потужним. («Параметри» є синонімом «ваги»). Без модифікацій модель, ймовірно, не зможе працювати на обладнанні споживчого класу.
DeepSeek здобув популярність на початку цього року після випуску R1, який дав змогу моделям OpenAI конкурувати. Стартап викликав гнів деяких регуляторів у США, які стверджують, що технологія DeepSeek становить загрозу національній безпеці.
No Comment! Be the first one.