Заявление DeepSeek о $5,6 млн за обучение модели R1 сомнительно, китайский ИИ стоит в 500 раз больше, — SemiAnalysis

2 февраля 2025
2 Mins Read
5 Views


			Заявление DeepSeek о $5,6 млн за обучение модели R1 сомнительно, китайский ИИ стоит в 500 раз больше, — SemiAnalysis

Раздел Технологии выходит при поддержке

Якобы недорогой искусственный интеллект DeepSeek вызвал панику среди инвесторов и падение акций NVIDIA. Аналитики сомневаются в низкой стоимости моделей DeepSeek.

В своей статье на Arxive DeepSeek указывает количество аппаратных часов, потраченных на обучение чатбота. Речь идет о 2,788 млн GPU-часов с использованием вычислителей NVIDIA H800. Разработчики указывают примерную стоимость часа $2, и у них получается $5,576 млн. Эта информация вызвала сомнения в высокой стоимости обучения ИИ, на которой настаивают OpenAI и другие компании, что привело к пересмотру стоимости рынка ИИ, падению акций NVIDIA и высокой популярности DeepSeek в App Store.

Сайт Wccftech напоминает, что DeepSeek был побочным проектом китайского хедж-фонда High-Flyer. Впоследствии DeepSeek превратился в отдельную компанию, поскольку фонд решил выделить проект SemiAnalysis утверждает, что High-Flyer приобрел 10 000 единиц вычислителей NVIDIA A100 еще в 2021 году, когда экспортные ограничения в Китай не были такими агрессивными. Исследователи сомневаются в указанной низкой стоимости обучения DeepSeek.

Аппаратные мощности, использованные для обучения ИИ DeepSeek / SemiAnalysis

В отчете говорится, что DeepSeek имеет около 10 000 «китайских» графических процессоров NVIDIA H800 AI и 10 000 чипов высшего класса H100 AI. Кроме того, компании приобрели ускорители искусственного интеллекта NVIDIA H20, и у них есть «пул» ресурсов, которые совместно используются DeepSeek и High-Flyer для «торговли, выводов, обучения и исследований». Это означает примерно $1,6 млрд капитальных затрат на DeepSeek, а операционные расходы, по неофициальным данным, составляют около $944 млн. Это почти в 500 раз выше, чем те, которые всколыхнули рынок.

Сводный анализ стоимости и эффективности моделей ИИ / SemiAnalysis

Аналитики считают начальную цифру частью затрат, вероятно, связанных только с запуском окончательной модели. SemiAnalysis отмечает эффективное привлечение DeepSeek местных талантов для разработки с помощью рекрутинговых мероприятий в лучших китайских университетах с зарплатой более $1,3 млн у отдельных работников. Отчет также содержит тестирование и анализ эффективности DeepSeek-V3.

Разбираемся с DeepSeek: бесплатный аналог ChatGPT, но отвечает как китайский коммунист, и не защищает данные

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.

itc.ua

Exit mobile version