DeepSeek и его влияние на технологические компании

Примерное время чтения: 6 мин

За последние несколько дней поднялся большой ажиотаж вокруг DeepSeek – китайского аналога ChatGPT. Его приложение вышло в топ по скачиваниям в App Store, а новую модель называют одним из главных прорывов в AI с момента появления ChatGPT.

В этой статье разберемся, в чем уникальность DeepSeek и как он может повлиять на крупнейшие технологические компании, Nebius, Яндекс и российский IT-сектор в целом.

Вы также можете самостоятельно потестировать последнюю версию DeepSeek бесплатно и без VPN на их сайте.

Краткая история DeepSeek

DeepSeek – китайский стартап, который имеет необычную историю. Он появился как стартап внутри китайского алгоритмического хедж-фонда High-Flyer Quant. Сам фонд запустился в 2015 году и в первые годы своего существования показывал отличные результаты и дорос за 5-6 лет до $15 млрд активов под управлением. Но с 2022 года начались сложности – китайский рынок сильно упал, несколько фондов получили значимые убытки, а ужесточение регулирования в Китае вообще поставило под вопрос дальнейшую работу.

За время работы внутри High-Flyer Quant появилась полноценная исследовательская AI лаборатория с командой ресерчеров и 10+ тысячами GPU, которые изначально использовались для разработки и тестирования торговых алгоритмов. Они были выделены в отдельный стартап DeepSeek, который переключился на разработку LLM (больших языковых моделей), аналогичных ChatGPT. В начале 2024 года появилась модель V2, в которой были первые значимые успехи. В самом конце 2024 года выпустили V3, а неделю назад R1, которая наделала столько шуму.

Если интересно, немного подробнее история DeepSeek по ссылке.

Почему возник такой ажиотаж

Не погружаясь в технические нюансы, DeepSeek имеет несколько значительных отличий от последних моделей ChatGPT и других аналогов:

  • Качество ответов DeepSeek R1 сопоставимо с последними версиями ChatGPT и аналогов, а в чем-то даже превосходит их
  • Ее обучение стоило всего $5.6 млн, это как минимум на порядок дешевле, чем у последних версий LLM конкурентов
  • Стоимость обработки запросов у DeepSeek R1 также на 90-95% дешевле, чем у конкурентов
  • Для обучения модели DeepSeek использовал GPU Nvidia H800 – “старая” версия 2023 года выпуска, у которой меньше память и вычислительная мощность, чем у последних GPU
  • DeepSeek пошел по пути open source и опубликовал веса модели и подробную техническую документацию

Что это означает на практике:

Во-первых, ранее в индустрии доминировали американские компании – OpenAI, Anthropic, Google, Meta (запрещенная в РФ). DeepSeek представил модель, которая одновременно не хуже / лучше по характеристикам и при этом кратно дешевле в разработке и использовании. В США сразу начались разговоры, что они могут проиграть конкурентную борьбу Китаю на одном из самых важных рынков, хотя ранее считалось, что их отрыв очень большой.

Во-вторых, DeepSeek добился такого результата, используя относительно старые и дешевые GPU, в то время как все конкуренты стоят в очереди за дорогими версиями новейших GPU Nvidia и платят за них космические деньги. Это ставит под вопрос светлое будущее Nvidia и эффективность американских санкций, которые ограничивают поставки чипов последних поколений в Китай.

В-третьих, DeepSeek – самая открытая из доступных моделей последнего поколения. Любой желающий, от крупной корпорации до обычного энтузиаста может на ее основе сделать собственные решения.

В-четвертых, DeepSeek имеет намного меньше требований к памяти и вычислительной мощности устройства по сравнению с большинством аналогов. Сейчас для использования последних версий LLM нужен доступ к серверу, на котором обрабатываются запросы. DeepSeek сильно приблизил возможность обработки запросов непосредственно на устройстве пользователя – смартфоне, ноутбуке и т.д.

Я не буду погружаться в то, как DeepSeek удалось добиться одновременно такого количества улучшений. Если интересно, можете поискать объяснения, что такое DeepSeekMoE и DeepSeekMLA, а также про процесс тренировки R1 и R1-Zero (DeepSeek по факту сделал две модели, где одна тренирует другую с сильно меньшим вовлечением людей, чем обычно, используя Reinforcement Learning). Также инженеры DeepSeek очень сильно заморочились с оптимизацией на всех уровнях, включая написание собственного низкоуровневого кода на уровне GPU (все обычно используют CUDA от Nvidia). При большом желании можно даже почитать полную техническую документацию.

Успехи DeepSeek сразу породили множество слухов и теорий заговора, что на самом деле это проект китайских властей, такие цифры эффективности не достижимы, на самом деле потратили намного больше денег, а новейшие GPU ввезли контрабандой в обход санкций. Но так как модель open source, основную часть этих тезисов можно прямо или косвенно опровергнуть. Пока ситуация выглядит так, что это действительно “честный” технологический прорыв.

Если максимально просто и коротко описать последствия последней модели DeepSeek – LLM модели станут более доступными в создании и использовании, их начнут быстрее и более массово внедрять в разных сферах. Общий объем рынка AI тоже вырастет, несмотря на то, что сами вычисления станут сильно дешевле – это называется парадокс Джевонса. Скорость прогресса еще сильнее увеличится, хотя она уже очень высокая.

Как DeepSeek повлияет на бизнес технологических компаний

В понедельник акции Nvidia обвалились на 17%, многие другие технологические компании также сильно упали, хотя некоторые, наоборот, выросли. Сильнее всех пострадал Nebius, котировки которого потеряли почти 40%. Далее рассмотрим, как DeepSeek может повлиять на бизнес разных компаний, от Nvidia и других бигтехов до Nebius, Яндекса и российского IT.

DeepSeek и его влияние на технологические компании

Оценка эффекта DeepSeek на бизнес различных компаний доступна для подписчиков

+8

Просмотр и написание комментариев доступны после бесплатной регистрации на сайте.

Если вы нашли ошибку или опечатку, пожалуйста, выделите фрагмент текста и нажмите Ctrl + Enter, чтобы сообщить о ней.

Представленная информация носит исключительно информационный характер и не является индивидуальной инвестиционной рекомендацией. Long Term Investments не осуществляет деятельность по инвестиционному консультированию и не является инвестиционным советником. Отказ от ответственности.

Авторизация
*
*
Регистрация
*
*
*
Генерация пароля

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: