Financial Times

воскресенье, 2 февраля 2025

Мировая гонка ИИ: Китай догоняет США?

Выпуск новой модели ИИ DeepSeek подверг большим сомнениям предположения о том, кто играет ведущую роль в разработке технологии искусственного интеллекта.

В понедельник, 27 января 2025 года, мир наблюдал, как за один день на фондовом рынке сгорело около $1 трлн., и этот огромный костер разжег малоизвестный китайский стартап искусственного интеллекта DeepSeek.

Выпуск его новой модели ИИ, известной как R1, подверг большим сомнениям предположения о превосходстве США в ИИ и наглядно показал, как в Китае учатся побеждать Силиконовую долину в ее собственной игре.

Модель умеет «рассуждать», чтобы решать сложные научные задачи и делает это наравне с передовым программным обеспечением от американских технологических гигантов, но, по-видимому, затраты на ее разработку составили лишь небольшую часть от стоимости американских моделей.

DeepSeek быстро превзошел ChatGPT компании OpenAI как самое скачиваемое бесплатное приложение в американском аппсторе iOS.

Наряду с геополитическим вызовом, прорыв Deepseek имеет двойные последствия для технологической отрасли.

Во-первых, это, вероятно, ускорит коммерческую разработку и внедрение искусственного интеллекта, так же, как это сделал ChatGPT в 2022 году.

Акции ИИ-проектов сильно пострадали от вторжения DeepSeek. Котировки акций ИИ-компаний в январе 2025 года.

В то же время это угрожает разрушить инвестиционные предположения, которые лежали в основе всего фондового рынка США, показав, что разработка передовых моделей ИИ не требует огромной инфраструктуры и, следовательно, огромного вливания капитала.

Вопрос, с которым с внезапной срочностью стали задаваться все в США, от Калифорнии до Уолл-стрит: обгоняет ли их Китай в ИИ в тот самый момент, когда многие работают над историческим прорывом, который поставит машины на один уровень с человеческим интеллектом - порогом, известным как сильный искусственный интеллект (AGI, artificial general intelligence)?

«Алгоритмические инновации DeepSeek напоминают нам, что Китай и США идут ноздря в ноздрю, и что наше технологическое преимущество не гарантировано, что подталкивает нашу отрасль сделать ИИ более эффективным», - говорит Эрик Шмидт, бывший исполнительный директор и председатель совета директоров Google.

«Чтобы первым достичь создания AGI, нам нужно продолжать инвестировать в таланты, поддерживать нашу динамичную экосистему с открытым исходным кодом и обеспечить, чтобы мы превзошли наших конкурентов в инновациях, а не только в затратах».

DeepSeek был основан как проект в духе амбиций Силиконовой долины. Он начался в 2023 году в качестве побочного проекта хедж-фонда эксцентричного миллиардера Ляна Вэньфэна (Liang Wenfeng), в тот момент, когда обострилась гонка за то, чтобы воспроизвести ChatGPT.

С тех пор DeepSeek превратился в одну из ведущих лабораторий искусственного интеллекта Китая.

«Почему Силиконовая долина такая инновационная? Потому что они осмеливаются что-то делать», - сказал Лян в интервью в прошлом году, - «Когда появился ChatGPT, техническому сообществу в Китае не хватало уверенности заниматься передовыми инновациями».

Он добавил: «Все, от инвесторов до руководства китайских технологических гигантов, думали, что разрыв слишком большой, и вместо этого решили сосредоточиться на применении готового ИИ. Но инновации начинаются с уверенности».

Основатель DeepSeek Лян Вэньфэн (Liang Wenfeng). Как чисто исследовательская лаборатория, его компания сосредоточила свои усилия на развитии ИИ, а не на попытке заработать деньги.

Поскольку государственные фонды в Китае за последние несколько лет приняли более широкое участие в финансировании стартапов, предпринимательская экосистема почувствовала давление с целью гарантировать отдачу из-за страха потерять активы страны.

DeepSeek выделяется среди других китайских стартапов генеративного ИИ в том смысле, что он не привлекал никакого внешнего финансирования и, следовательно, был свободен от этих ограничений.

DeepSeek стал чисто исследовательской лабораторией, повторяющей становление проектов DeepMind в Великобритании и OpenAI в США. DeepSeek сосредоточил все свои усилия на развитии ИИ, а не на попытке заработать деньги.

И хотя он горд собой за то, что полностью основан на доморощенных талантах, он принял культуру, часто встречающуюся в технологическом центре США.

«Это уникально для китайских компаний искусственного интеллекта», - говорит ИИ инвестор в китайский рынок, - «Там нет политики или управленческих трений, как в других крупных технологических компаниях или более крупных стартапах. У людей нет специфических должностей или отчетности».

Происхождение DeepSeek в качестве количественного хедж-фонда означало, что он обладал инженерными талантами с глубоким пониманием микропроцессоров для машинного обучения. Его прорыв стал результатом очевидного успеха в обучении передовых моделей, без затрат в сотни миллионов долларов, которые потратили соперники в США.

DeepSeek утверждает, что окончательный этап обучения модели R1 обошелся всего в $5.6 млн. Эта цифра, однако, не включает в себя многие другие затраты, связанные с разработкой его моделей машинного обучения, включая вычислительную инфраструктуру и предыдущие стадии обучения модели, что затрудняет точное сравнение.

Около $1 трлн. сгорело на фондовом рынке США после прорыва Deepseek. Новая модель искусственного интеллекта китайского стартапа, по-видимому, была разработана за небольшую долю от аналогичных затрат Силиконовой долины.

Он также может срезать углы, чтобы сократить расходы: OpenAI утверждает, что у него есть доказательства того, что DeepSeek обучался на результатах собственных моделей OpenAI, причем не тех, что разрешены в соответствии с условиями использования, хотя подковерная практика технического шпионажа, как считается, широко используется и американскими компаниями.

По иронии судьбы, попытка Вашингтона затруднить развитие сектора ИИ в Китае, навязывая ему экспортный контроль на передовые микропроцессоры США с 2022 года, возможно, способствовала прорыву DeepSeek.

Без доступа к передовому кремнию компания была вынуждена найти инновационные способы добиться более высокой производительности от менее сложных процессоров, которые она смогла купить.

Утверждения компании о низких затратах и расширенных возможностях ее моделей вызвали горячие дебаты о том, насколько разрушительной будет компания для США.

Лидеры Силиконовой долины отдали дань уважения ее инновациям, при том, что их значимость снизилась.

Генеральный директор Openai Сэм Альтман назвал модель R1 «впечатляющей», в то время как Марк Цукерберг, глава Meta, сказал, что компания добилась «успехов, которые мы надеемся реализовать в наших системах».

Сэм Альтман из OpenAI утверждает, что у него есть доказательства того, что DeepSeek обучил свою модель ИИ на результатах обучения ее собственных моделей OpenAI.

Тем не менее, Цукерберг также описал прорыв DeepSeek только как один из многих в области, которая развивается с головокружительной скоростью, что затрудняет определение того, насколько глубоко ее недорогой подход изменит динамику отрасли.

По словам некоторых китайских технологических наблюдателей, достижения DeepSeek недостаточно значимы, чтобы изменить тот факт, что ИИ-компании в стране были быстро появившимися последователями, в значительной степени нацеленными эмулирование своих американских коллег, а не на то, чтобы определять само направление развития ИИ.

«Работа DeepSeek попадает в эту категорию. Что действительно перевернет стол в состязании США и Китая, так это если Китай создаст что-то, что фактически расширит границы технологии. Посмотрим, добьются ли они этого», - говорит Хелен Тонер, аналитик по политике искусственного интеллекта в Центре безопасности и развивающихся технологий Джорджтауна, а также бывший член правления в OpenAI.

Другие говорят, что тот факт, что китайский технологический стартап стоит за последним достижением, перевернувшим все с ног на голову, представляет собой переломный момент, меняющий динамику в гонке искусственного интеллекта между двумя странами.

«Последние модели DeepSeek не обязательно означают, что Китай опережает США в гонке искусственного интеллекта, но это доказывает, что китайские компании делают значительные шаги в инновациях в области программного обеспечения, которые преодолевают ограничения, налагаемые экспортным контролем США», - пишет Тилли Чжан, аналитик из исследовательской фирмы Destkal Dragonomics, ориентированной на Китай.

«Гонка за лидерство в ИИ теперь не просто гонка за то, кто получит доступ к лучшим микропроцессорам, а за то, кто сможет лучше их использовать».

Хотя значение технологического прорыва DeepSeek является вопросом дебатов, нет сомнений в том, что ударная волна, которая потрясла фондовый рынок, заставила инвесторов сделать выводы: необходимо резко сократить стоимость машинного обучения для самых передовых моделей ИИ.

Модели DeepSeek, по-видимому, опровергают аргумент, о котором американские ИИ-компании громко заявляли в прошлом году: достижения в области искусственного интеллекта требуют огромного объема капитала и инфраструктуры для разработки и масштабного развертывания технологий.

Вместо этого они предполагают, что гораздо более дорогие американские модели повышают опасения среди инвесторов по поводу возникновения резкого дефляционного шока.

«Раньше было чувство американской исключительности - что только у Америки была эта технология, и только у американцев были деньги, чтобы заниматься ею», - говорит Джим Тирни, инвестор из AllianceBernstein, - «Превращение этих моделей в массовый товар происходит намного быстрее, чем мы думали».

Марк Цукерберг из Meta сказал, что если модель R1 компании DeepSeek станет мировым стандартом для «открытых» моделей искусственного интеллекта, это воспрепятствует планам США: «Для нашего национального преимущества важно, чтобы это был американский стандарт».

Большая часть Силиконовой долины отказалась от аргумента о том, что другие участники отрасли быстро скопируют инновации DeepSeek и смогут снизить стоимость машинного обучения моделей искусственного интеллекта за рубежом.

Такие руководители, как Сатья Наделла из Microsoft, заявили, что сделают эту технологию более доступной для клиентов и расширят ее использование, что принесет пользу всей отрасли.

В знак уверенности компании в своем статусе, DeepSeek опубликовала свои исследования и выпустила свои модели в формате «open-weights» - более ограниченной версии программного обеспечения с открытым исходным кодом, которая позволяет любому загружать, использовать и модифицировать технологию.

Этот шаг привлечет к участию в разработке широкое международное сообщество разработчиков программного обеспечения, которые ищут «открытые» модели для создания приложений.

Большинство моделей, разработанных ведущими компаниями ИИ в Силиконовой долине, остаются закрытыми, хотя есть исключения, в частности Meta, чьи открытые модели также набирают популярность.

Но модель DeepSeek доступна по гораздо меньшей цене. Китайская компания заявляет, что взимает только 1.4 цента за каждый 1 млн. токенов, которые она генерирует, что примерно эквивалентно 700,000 словам.

В отличие от этого, Meta взимает $2.80 за тот же результат от своих крупнейших моделей.

«Многие разработчики экспериментирует с тем, что сейчас является китайским ИИ-решением с открытым исходным кодом», - говорит Киган Макбрайд, исследователь Оксфордского Института Интернета, который фокусируется на геополитике в ИИ, - «Это действительно показывает, что в сфере ИИ США - не единственный выбор на столе».

В то время как Янн ЛеКан, главный ученый ИИ в Meta, описал DeepSeek в ярких тонах как доказательство того, что «модели с открытым исходным кодом превзойдут запатентованные аналоги», этот стартап, тем не менее, представляет собой прямую угрозу для Meta.

«То, что компания создала модели с открытым кодом, которые близки к передовым разработкам, означает, что Deepseek просто победил их в собственной игре», - говорит Тонер.

Помимо влияния DeepSeek на рынок продуктов искусственного интеллекта, этот прорыв также будет иметь геополитические последствия, и это является ключевым моментом в конкуренции между США и Китаем за превосходство в ИИ.

Если модель R1 и ее преемники станут мировым стандартом для «открытых» моделей искусственного интеллекта, это воспрепятствует планам США, предупредил Марк Цукерберг из Meta.

«Для нашего национального преимущества важно, чтобы это был американский стандарт», - сказал он, - «Мы хотим построить систему ИИ, которую будут использовать люди во всем мире».

DeepSeek «ускорил усилия многих людей в каждой стране, нацеленные на то, чтобы добиться технологического баланса сил между различными странами», - говорит Крейг Манди, ветеран Microsoft и бывший советник Белого дома.

Если Китаю удастся добиться равных позиций с США в ИИ, это будет иметь значение для всего, в чем эта технология в конечном итоге может быть использована, предупреждает Дарио Амодей, генеральный директор американского стратапа Anthropic.

«Кажется вероятным, что Китай может направлять в эту сферу больше талантов, капитала и сосредоточиться на военном применении технологий», - написал Амодей о достижениях DeepSeek, - «Сочетание его крупной промышленной базы и военных стратегических преимуществ может помочь Китаю добиться командного лидерства на мировой арене не только в ИИ, но и во всем прочем».

Манди, который также возглавляет дипломатический форум в диалоге США и Китая, созданный Генри Киссинджером, отметил, что ИИ является «абсолютной технологией двойного назначения», что означает, что ИИ имеет как позитивные, так и опасные цели.

Развитие DeepSeek, вероятно, будет зависеть от дискуссий, которые дипломатическая группа проведет в течение следующих 90 дней. Там будет обсуждаться многосторонняя, но общая структура безопасности для программного обеспечения ИИ.

Между тем, начинающие молодые предприниматели в Китае рассматривают DeepSeek и его основателя как источник вдохновения для создания нового поколения мощных технологий.

Подросток, который пришел к дому Ляна в деревне Милинг, чтобы отдать ему должное, сказал:

«Он прагматичный технолог. Он собрал команду ... превзошел компании, такие как OpenAI, с которыми мы не могли конкурировать раньше. Он великий человек, который внес свой вклад в Китай».