Table Of Content
Китайська фірма зі штучного інтелекту DeepSeek виявилася потенційним конкурентом американським компаніям зі штучного інтелекту , демонструючи революційні моделі , які, як стверджується, забезпечують продуктивність, порівнянну з провідними пропозиціями, за незначну вартість. Мобільний додаток компанії, випущений на початку січня, нещодавно очолив чарти App Store на основних ринках, включаючи США, Великобританію та Китай, але він не уникнув сумнівів щодо правдивості своїх заяв.
Моделі DeepSeek, засновані у 2023 році Лян Венфеном, колишнім керівником кількісного хедж-фонду High-Flyer, заснованого на штучному інтелекті, мають відкритий вихідний код і включають функцію міркування, яка чітко формулює його мислення перед наданням відповідей.
Реакція Волл-стріт була неоднозначною. У той час як брокерська фірма Jefferies попереджає, що ефективний підхід DeepSeek «пробиває частину ейфорії капіталовкладень» після нещодавніх зобов’язань щодо витрат від Meta та Microsoft — кожна з яких перевищила 60 мільярдів доларів цього року — Citi ставить під сумнів, чи вдалося досягти таких результатів без передових графічних процесорів.
Goldman Sachs бачить ширші наслідки, припускаючи, що ця розробка може змінити конкуренцію між відомими технологічними гігантами та стартапами, знизивши бар’єри для входу.
Ось як аналітики Волл-стріт реагують на DeepSeek своїми словами (наголошено на нашому):
Джеффріс
Потужні наслідки DeepSeek для навчання штучному інтелекту руйнують деяку ейфорію капіталовкладень , яка виникла після великих зобов’язань Stargate і Meta минулого тижня. Завдяки тому, що DeepSeek забезпечує продуктивність, порівнянну з GPT-4o, за незначну частину обчислювальної потужності, для розробників можливі негативні наслідки , оскільки тиск на гравців зі штучним інтелектом, щоб виправдати постійно зростаючі плани капіталовкладень, може зрештою призвести до нижчої траєкторії доходу та прибутку центру обробки даних. зростання.
Якщо менші моделі можуть добре працювати, це потенційно позитивно для смартфона . Ми негативно ставимося до смартфонів зі штучним інтелектом, оскільки ШІ не набув популярності серед споживачів. Потрібне більше оновлення апаратного забезпечення (adv pkg+fast DRAM) для запуску більших моделей на телефоні, що збільшить витрати. Модель AAPL фактично базується на Міністерстві економіки, але 3 мільярди параметрів даних все ще занадто малі, щоб зробити послуги корисними для споживачів. Отже, успіх DeepSeek дає певну надію, але це не впливає на найближчу перспективу смартфона зі штучним інтелектом.
Китай є єдиним ринком, який прагне до ефективності LLM через обмеження чіпів. Трамп/Маск, ймовірно, визнають, що ризик подальших обмежень полягає в тому, щоб змусити Китай швидше впроваджувати інновації. Тому ми вважаємо, що Трамп, швидше за все, пом’якшить політику поширення штучного інтелекту.
Сіті
Хоча досягнення DeepSeek можуть бути новаторськими, ми сумніваємося в тому , що його подвиги були зроблені без використання передових графічних процесорів для його тонкого налаштування та/або створення базових LLM, на яких базується остаточна модель, за допомогою техніки дистиляції. Незважаючи на те, що домінування американських компаній у розробці найдосконаліших моделей штучного інтелекту потенційно може бути поставлено під сумнів, ми вважаємо, що в неминуче більш обмежувальному середовищі доступ США до більш досконалих чіпів є перевагою. Таким чином, ми не очікуємо, що провідні компанії штучного інтелекту відмовляться від більш просунутих графічних процесорів, які забезпечують більш привабливі $/TFLOP у масштабі. Ми розглядаємо нещодавні оголошення про капіталовкладення у сфері штучного інтелекту, як-от Зоряна брама, як підтвердження потреби у вдосконалених мікросхемах.
Бернштейн
Коротше кажучи, ми вважаємо, що 1) DeepSeek НЕ «створював OpenAI за 5 мільйонів доларів» ; 2) моделі виглядають фантастично, але ми не вважаємо їх дивами ; і 3) паніка, що виникла в Twitterverse на вихідних, здається надмірною .
Наша власна початкова реакція не включає паніку (не так). Якщо ми визнаємо, що DeepSeek, можливо, зменшив витрати на досягнення еквівалентної продуктивності моделі, скажімо, у 10 разів, ми також зауважимо, що поточні траєкторії витрат на моделі зростають приблизно на стільки щороку (сумнозвісні «закони масштабування…»), що не може продовжувати назавжди. У цьому контексті нам ПОТРІБНІ такі інновації (MoE, дистиляція, змішана точність тощо), якщо ШІ хоче продовжувати прогресувати. А для тих, хто шукає впровадження штучного інтелекту, як напіваналітики ми твердо віримо в парадокс Джевонса (тобто, що підвищення ефективності створює чисте зростання попиту), і вважаємо, що будь-яка нова розблокована обчислювальна потужність з більшою ймовірністю буде поглинена через використання та збільшення попиту проти впливу на довгострокову перспективу витрат на даний момент, оскільки ми не віримо, що потреби в обчисленнях десь близько досягають своєї межі в ШІ. Також здається натяжкою вважати, що інновації, які впроваджує DeepSeek, абсолютно невідомі величезній кількості провідних дослідників штучного інтелекту в інших численних світових лабораторіях ШІ (чесно кажучи, ми не знаємо, що використовували великі закриті лабораторії для розробки і розгортають власні моделі, але ми просто не можемо повірити, що вони самі не розглядали або навіть, можливо, використовували подібні стратегії).
Morgan Stanley
Ми не підтвердили достовірність цих звітів, але якщо вони точні, і розширений LLM справді можна розробити за невелику частку попередніх інвестицій, ми можемо побачити, що генеративний ШІ з часом буде працювати на все менших і менших комп’ютерах (зменшення розміру від суперкомп’ютерів до робочих станцій). , офісні комп’ютери та, нарешті, персональні комп’ютери), а індустрія SPE може виграти від супутнього збільшення попиту на супутні товари (чіпи та SPE), оскільки попит на генеративний ШІ поширюється.
Goldman Sachs
З останніми подіями ми також бачимо: 1) потенційну конкуренцію між багатими на капітал інтернет-гігантами та стартапами , враховуючи зниження бар’єрів для входу, особливо з останніми новими моделями, розробленими за незначну частину вартості існуючих; 2) від навчання до більшої кількості логічних висновків , із збільшеним акцентом на постнавчанні (включаючи здібності міркування та здібності до підкріплення), що вимагає значно менших обчислювальних ресурсів порівняно з попереднім навчанням; і 3) потенціал для подальшої глобальної експансії для китайських гравців, враховуючи їх продуктивність і конкурентоспроможність ціни та вартості.
Ми й надалі очікуємо, що гонка за додатками ШІ/агентами ШІ продовжуватиметься в Китаї, особливо серед програм To-C, де китайські компанії були піонерами в мобільних додатках в епоху Інтернету, наприклад, Tencent створила Weixin (WeChat) super- додаток Серед додатків To-C ByteDance лідирує, запустивши 32 додатки AI протягом минулого року. Серед них Doubao був найпопулярнішим ШІ-чатботом у Китаї з найвищим MAU (близько 70 мільйонів), який нещодавно був оновлений за допомогою моделі Doubao 1.5 Pro. Ми вважаємо, що додаткові потоки доходу (підписка, реклама) і остаточний/стабільний шлях до монетизації/позитивної економіки одиниць серед програм/агентів будуть ключовими.
Що стосується рівня інфраструктури, увага інвесторів зосереджена на тому, чи буде короткострокова невідповідність між ринковими очікуваннями щодо капіталовкладень штучного інтелекту та попиту на обчислення у разі значного підвищення ефективності обчислень вартості/моделі. Ми продовжуємо вірити, що для китайських гравців хмарних центрів/центрів обробки даних у 2025 році основна увага буде зосереджена на доступності чіпів і здатності CSP (постачальників хмарних послуг) забезпечувати покращення прибутку завдяки зростанню доходів хмарних технологій, керованих штучним інтелектом, а також поза орендою інфраструктури/графічного процесора. , як робочі навантаження та послуги, пов’язані зі штучним інтелектом, можуть сприяти зростанню та маржі в майбутньому. Ми залишаємось позитивними щодо довгострокового зростання попиту на обчислення ШІ, оскільки подальше зниження витрат на обчислення/навчання/виводи може стимулювати ширше впровадження ШІ. Дивіться також Тему №5 нашого звіту про ключові теми для наших базових/ведмежих сценаріїв для оцінок капітальних витрат BBAT залежно від доступності чіпів, де ми очікуємо, що сукупне зростання капітальних витрат BBAT продовжиться у 2025 році в нашому базовому сценарії (GSe: +38% порівняно з попереднім роком). дещо помірнішими темпами порівняно з сильним 2024 роком (GSe: +61% р/р), завдяки постійним інвестиціям у ШІ інфраструктура.
JPMorgan
Перш за все, багато уваги приділяється дослідницьким роботам DeepSeek та ефективності їхніх моделей. Незрозуміло, якою мірою DeepSeek використовує ~50 тисяч бункерних графічних процесорів High-Flyer (подібні за розміром до кластера, на якому OpenAI, як вважають, навчає GPT-5), але здається ймовірним, що вони значно знижують витрати (витрати на висновки для їхньої моделі V2, наприклад, стверджується, що вони на 1/7 менше GPT-4 Turbo). Їхня підривна (хоча й не нова) заява, яка цього тижня почала вражати імена штучного інтелекту в США, полягає в тому, що «більше інвестицій не означає більше інновацій». Лян: «Зараз я не бачу нових підходів, але великі фірми не мають чіткої переваги. Великі фірми мають наявних клієнтів, але їхній бізнес із грошовими потоками також є їхнім тягарем, і це робить їх уразливими до зривів у будь-який момент». А коли його запитали про те, що GPT5 досі не випущено: «OpenAI — це не бог, вони не обов’язково завжди будуть на передовій».
UBS
Протягом 2024 року, першого року, коли ми спостерігали велике навантаження на навчання ШІ в Китаї, понад 80-90% попиту на IDC було зумовлено навчанням ШІ та зосереджено на 1-2 клієнтах гіперскейлера, що призвело до оптового гіпермасштабованого попиту на IDC у відносно віддаленому районі (як енерговитратне навчання AI чутливе до вартості комунальних послуг, а не до затримки користувача).
Якщо вартість навчання штучного інтелекту та висновків значно нижча, ми очікуємо, що більше кінцевих користувачів використовуватимуть штучний інтелект для покращення свого бізнесу або розробки нових варіантів використання , особливо роздрібних клієнтів. Такий попит IDC означає більшу увагу до місця розташування (оскільки затримка користувача важливіша, ніж вартість комунальних послуг), і, отже, більшу цінову владу для операторів IDC, які мають великі ресурси в містах першого рівня та супутниках. Тим часом більш диверсифіковане портфоліо клієнтів також означало б більшу цінову владу.