Выпуск новой модели ИИ DeepSeek подверг большим сомнениям предположения о том, кто играет ведущую роль в разработке технологии искусственного интеллекта.
В понедельник, 27 января 2025 года, мир наблюдал, как за один день на фондовом рынке сгорело около $1 трлн., и этот огромный костер разжег малоизвестный китайский стартап искусственного интеллекта DeepSeek.
Выпуск его новой модели ИИ, известной как R1, подверг большим сомнениям предположения о превосходстве США в ИИ и наглядно показал, как в Китае учатся побеждать Силиконовую долину в ее собственной игре.
Модель умеет «рассуждать», чтобы решать сложные научные задачи и делает это наравне с передовым программным обеспечением от американских технологических гигантов, но, по-видимому, затраты на ее разработку составили лишь небольшую часть от стоимости американских моделей.
DeepSeek быстро превзошел ChatGPT компании OpenAI как самое скачиваемое бесплатное приложение в американском аппсторе iOS.
Наряду с геополитическим вызовом, прорыв Deepseek имеет двойные последствия для технологической отрасли.
Во-первых, это, вероятно, ускорит коммерческую разработку и внедрение искусственного интеллекта, так же, как это сделал ChatGPT в 2022 году.
В то же время это угрожает разрушить инвестиционные предположения, которые лежали в основе всего фондового рынка США, показав, что разработка передовых моделей ИИ не требует огромной инфраструктуры и, следовательно, огромного вливания капитала.
Вопрос, с которым с внезапной срочностью стали задаваться все в США, от Калифорнии до Уолл-стрит: обгоняет ли их Китай в ИИ в тот самый момент, когда многие работают над историческим прорывом, который поставит машины на один уровень с человеческим интеллектом - порогом, известным как сильный искусственный интеллект (AGI, artificial general intelligence)?
«Алгоритмические инновации DeepSeek напоминают нам, что Китай и США идут ноздря в ноздрю, и что наше технологическое преимущество не гарантировано, что подталкивает нашу отрасль сделать ИИ более эффективным», - говорит Эрик Шмидт, бывший исполнительный директор и председатель совета директоров Google.
«Чтобы первым достичь создания AGI, нам нужно продолжать инвестировать в таланты, поддерживать нашу динамичную экосистему с открытым исходным кодом и обеспечить, чтобы мы превзошли наших конкурентов в инновациях, а не только в затратах».
DeepSeek был основан как проект в духе амбиций Силиконовой долины. Он начался в 2023 году в качестве побочного проекта хедж-фонда эксцентричного миллиардера Ляна Вэньфэна (Liang Wenfeng), в тот момент, когда обострилась гонка за то, чтобы воспроизвести ChatGPT.
С тех пор DeepSeek превратился в одну из ведущих лабораторий искусственного интеллекта Китая.
«Почему Силиконовая долина такая инновационная? Потому что они осмеливаются что-то делать», - сказал Лян в интервью в прошлом году, - «Когда появился ChatGPT, техническому сообществу в Китае не хватало уверенности заниматься передовыми инновациями».
Он добавил: «Все, от инвесторов до руководства китайских технологических гигантов, думали, что разрыв слишком большой, и вместо этого решили сосредоточиться на применении готового ИИ. Но инновации начинаются с уверенности».
Поскольку государственные фонды в Китае за последние несколько лет приняли более широкое участие в финансировании стартапов, предпринимательская экосистема почувствовала давление с целью гарантировать отдачу из-за страха потерять активы страны.
DeepSeek выделяется среди других китайских стартапов генеративного ИИ в том смысле, что он не привлекал никакого внешнего финансирования и, следовательно, был свободен от этих ограничений.
DeepSeek стал чисто исследовательской лабораторией, повторяющей становление проектов DeepMind в Великобритании и OpenAI в США. DeepSeek сосредоточил все свои усилия на развитии ИИ, а не на попытке заработать деньги.
И хотя он горд собой за то, что полностью основан на доморощенных талантах, он принял культуру, часто встречающуюся в технологическом центре США.
«Это уникально для китайских компаний искусственного интеллекта», - говорит ИИ инвестор в китайский рынок, - «Там нет политики или управленческих трений, как в других крупных технологических компаниях или более крупных стартапах. У людей нет специфических должностей или отчетности».
Происхождение DeepSeek в качестве количественного хедж-фонда означало, что он обладал инженерными талантами с глубоким пониманием микропроцессоров для машинного обучения. Его прорыв стал результатом очевидного успеха в обучении передовых моделей, без затрат в сотни миллионов долларов, которые потратили соперники в США.
DeepSeek утверждает, что окончательный этап обучения модели R1 обошелся всего в $5.6 млн. Эта цифра, однако, не включает в себя многие другие затраты, связанные с разработкой его моделей машинного обучения, включая вычислительную инфраструктуру и предыдущие стадии обучения модели, что затрудняет точное сравнение.
Он также может срезать углы, чтобы сократить расходы: OpenAI утверждает, что у него есть доказательства того, что DeepSeek обучался на результатах собственных моделей OpenAI, причем не тех, что разрешены в соответствии с условиями использования, хотя подковерная практика технического шпионажа, как считается, широко используется и американскими компаниями.
По иронии судьбы, попытка Вашингтона затруднить развитие сектора ИИ в Китае, навязывая ему экспортный контроль на передовые микропроцессоры США с 2022 года, возможно, способствовала прорыву DeepSeek.
Без доступа к передовому кремнию компания была вынуждена найти инновационные способы добиться более высокой производительности от менее сложных процессоров, которые она смогла купить.
Утверждения компании о низких затратах и расширенных возможностях ее моделей вызвали горячие дебаты о том, насколько разрушительной будет компания для США.
Лидеры Силиконовой долины отдали дань уважения ее инновациям, при том, что их значимость снизилась.
Генеральный директор Openai Сэм Альтман назвал модель R1 «впечатляющей», в то время как Марк Цукерберг, глава Meta, сказал, что компания добилась «успехов, которые мы надеемся реализовать в наших системах».
Тем не менее, Цукерберг также описал прорыв DeepSeek только как один из многих в области, которая развивается с головокружительной скоростью, что затрудняет определение того, насколько глубоко ее недорогой подход изменит динамику отрасли.
По словам некоторых китайских технологических наблюдателей, достижения DeepSeek недостаточно значимы, чтобы изменить тот факт, что ИИ-компании в стране были быстро появившимися последователями, в значительной степени нацеленными эмулирование своих американских коллег, а не на то, чтобы определять само направление развития ИИ.
«Работа DeepSeek попадает в эту категорию. Что действительно перевернет стол в состязании США и Китая, так это если Китай создаст что-то, что фактически расширит границы технологии. Посмотрим, добьются ли они этого», - говорит Хелен Тонер, аналитик по политике искусственного интеллекта в Центре безопасности и развивающихся технологий Джорджтауна, а также бывший член правления в OpenAI.
Другие говорят, что тот факт, что китайский технологический стартап стоит за последним достижением, перевернувшим все с ног на голову, представляет собой переломный момент, меняющий динамику в гонке искусственного интеллекта между двумя странами.
«Последние модели DeepSeek не обязательно означают, что Китай опережает США в гонке искусственного интеллекта, но это доказывает, что китайские компании делают значительные шаги в инновациях в области программного обеспечения, которые преодолевают ограничения, налагаемые экспортным контролем США», - пишет Тилли Чжан, аналитик из исследовательской фирмы Destkal Dragonomics, ориентированной на Китай.
«Гонка за лидерство в ИИ теперь не просто гонка за то, кто получит доступ к лучшим микропроцессорам, а за то, кто сможет лучше их использовать».
Хотя значение технологического прорыва DeepSeek является вопросом дебатов, нет сомнений в том, что ударная волна, которая потрясла фондовый рынок, заставила инвесторов сделать выводы: необходимо резко сократить стоимость машинного обучения для самых передовых моделей ИИ.
Модели DeepSeek, по-видимому, опровергают аргумент, о котором американские ИИ-компании громко заявляли в прошлом году: достижения в области искусственного интеллекта требуют огромного объема капитала и инфраструктуры для разработки и масштабного развертывания технологий.
Вместо этого они предполагают, что гораздо более дорогие американские модели повышают опасения среди инвесторов по поводу возникновения резкого дефляционного шока.
«Раньше было чувство американской исключительности - что только у Америки была эта технология, и только у американцев были деньги, чтобы заниматься ею», - говорит Джим Тирни, инвестор из AllianceBernstein, - «Превращение этих моделей в массовый товар происходит намного быстрее, чем мы думали».
Большая часть Силиконовой долины отказалась от аргумента о том, что другие участники отрасли быстро скопируют инновации DeepSeek и смогут снизить стоимость машинного обучения моделей искусственного интеллекта за рубежом.
Такие руководители, как Сатья Наделла из Microsoft, заявили, что сделают эту технологию более доступной для клиентов и расширят ее использование, что принесет пользу всей отрасли.
В знак уверенности компании в своем статусе, DeepSeek опубликовала свои исследования и выпустила свои модели в формате «open-weights» - более ограниченной версии программного обеспечения с открытым исходным кодом, которая позволяет любому загружать, использовать и модифицировать технологию.
Этот шаг привлечет к участию в разработке широкое международное сообщество разработчиков программного обеспечения, которые ищут «открытые» модели для создания приложений.
Большинство моделей, разработанных ведущими компаниями ИИ в Силиконовой долине, остаются закрытыми, хотя есть исключения, в частности Meta, чьи открытые модели также набирают популярность.
Но модель DeepSeek доступна по гораздо меньшей цене. Китайская компания заявляет, что взимает только 1.4 цента за каждый 1 млн. токенов, которые она генерирует, что примерно эквивалентно 700,000 словам.
В отличие от этого, Meta взимает $2.80 за тот же результат от своих крупнейших моделей.
«Многие разработчики экспериментирует с тем, что сейчас является китайским ИИ-решением с открытым исходным кодом», - говорит Киган Макбрайд, исследователь Оксфордского Института Интернета, который фокусируется на геополитике в ИИ, - «Это действительно показывает, что в сфере ИИ США - не единственный выбор на столе».
В то время как Янн ЛеКан, главный ученый ИИ в Meta, описал DeepSeek в ярких тонах как доказательство того, что «модели с открытым исходным кодом превзойдут запатентованные аналоги», этот стартап, тем не менее, представляет собой прямую угрозу для Meta.
«То, что компания создала модели с открытым кодом, которые близки к передовым разработкам, означает, что Deepseek просто победил их в собственной игре», - говорит Тонер.
Помимо влияния DeepSeek на рынок продуктов искусственного интеллекта, этот прорыв также будет иметь геополитические последствия, и это является ключевым моментом в конкуренции между США и Китаем за превосходство в ИИ.
Если модель R1 и ее преемники станут мировым стандартом для «открытых» моделей искусственного интеллекта, это воспрепятствует планам США, предупредил Марк Цукерберг из Meta.
«Для нашего национального преимущества важно, чтобы это был американский стандарт», - сказал он, - «Мы хотим построить систему ИИ, которую будут использовать люди во всем мире».
DeepSeek «ускорил усилия многих людей в каждой стране, нацеленные на то, чтобы добиться технологического баланса сил между различными странами», - говорит Крейг Манди, ветеран Microsoft и бывший советник Белого дома.
Если Китаю удастся добиться равных позиций с США в ИИ, это будет иметь значение для всего, в чем эта технология в конечном итоге может быть использована, предупреждает Дарио Амодей, генеральный директор американского стратапа Anthropic.
«Кажется вероятным, что Китай может направлять в эту сферу больше талантов, капитала и сосредоточиться на военном применении технологий», - написал Амодей о достижениях DeepSeek, - «Сочетание его крупной промышленной базы и военных стратегических преимуществ может помочь Китаю добиться командного лидерства на мировой арене не только в ИИ, но и во всем прочем».
Манди, который также возглавляет дипломатический форум в диалоге США и Китая, созданный Генри Киссинджером, отметил, что ИИ является «абсолютной технологией двойного назначения», что означает, что ИИ имеет как позитивные, так и опасные цели.
Развитие DeepSeek, вероятно, будет зависеть от дискуссий, которые дипломатическая группа проведет в течение следующих 90 дней. Там будет обсуждаться многосторонняя, но общая структура безопасности для программного обеспечения ИИ.
Между тем, начинающие молодые предприниматели в Китае рассматривают DeepSeek и его основателя как источник вдохновения для создания нового поколения мощных технологий.
Подросток, который пришел к дому Ляна в деревне Милинг, чтобы отдать ему должное, сказал:
«Он прагматичный технолог. Он собрал команду ... превзошел компании, такие как OpenAI, с которыми мы не могли конкурировать раньше. Он великий человек, который внес свой вклад в Китай».