Пока скептики продолжают спорить о том, сможет ли ИИ обрести сознание или останется лишь инструментом для обработки данных, китайская компания DeepSeek совершила настоящий прорыв. Всего за $6 млн (что меньше зарплаты некоторых инженеров в Кремниевой долине и составляет лишь 2% от стоимости ближайшего конкурента) они создали модель, которая не уступает OpenAI o1. При этом DeepSeek предлагает свои решения по невероятно низкой цене: $0,14 за обработку миллиона токенов против $2,50 у ChatGPT.
Доступ к API DeepSeek не требует сложных настроек, и обходится в разы дешевле. Многие компании уже начали переходить на эту модель, включая нас.
Почему DeepSeek — это прорыв?
Пока американские гиганты, такие как Google, тратили миллиарды на разработку ИИ, DeepSeek добилась успеха, оптимизировав железо и позволив модели обучать себя самостоятельно. Это вызвало настоящую панику в отрасли.
Некоторые выражают опасения относительно приватности и реальной стоимости разработки, предполагая, что проект косвенно финансируется Китайской коммунистической партией. Пока доказательств этому нет, но такие подозрения добавляют интриги.
Что известно о DeepSeek?
Акт 1. История успеха
DeepSeek начинала не в гараже Кремниевой долины, а в мире финансов. Компания была основана Ляном Вэньфэном, создателем хедж-фонда High-Flyer Quant. В 2021 году, до введения санкций США, High-Flyer закупил большое количество GPU «на всякий случай». Эти мощности использовались для анализа рынка, но большую часть времени простаивали.
К 2023 году High-Flyer выделил ИИ-направление в отдельную компанию — DeepSeek. Акционеры были в недоумении, но Лян настаивал: «Представьте ChatGPT, но дешевле… созданный теми, кто не уходит из офиса даже чтобы поспать».
Акт 2. Инженерная магия
DeepSeek смогла обойти санкции США благодаря инновационным решениям:
- Прорыв в архитектуре: Multi-head Latent Attention (MLA) — метод, который сократил стоимость обучения на 90%, игнорируя 95% данных.
- Модели MoE: DeepSeek-V2 с 236 млрд параметров оказался дешевле, чем производство сезона сериала Stranger Things.
- Обучение с подкреплением: Модели серии R1 учились методом проб и ошибок, как дети с PhD. Результат? Уровень GPT-4, но на 95% дешевле.
В мае 2024 года DeepSeek шокировала рынок ценами на API: 2 юаня за миллион токенов. Это вызвало панику среди конкурентов.
Акт 3. Споры и сомнения
В интернете сразу появились скептики, которые утверждают, что DeepSeek предвзят. «Он не отвечает на вопросы о Тайване или Си Цзиньпине», — жалуются они. Однако важно не это, а то, что китайская компания смогла создать конкурентоспособную модель, несмотря на санкции.
Также вызывает сомнение красивая история о том, что небольшой фонд смог совершить такой прорыв. Не исключено, что правительство Китая косвенно поддерживало проект. Но в конечном итоге важен результат.
Эпилог: AGI или провал?
Создаст ли DeepSeek искусственный общий интеллект (AGI)? Пока неизвестно, но они уже доказали, что в гонке ИИ побеждает не тот, кто тратит больше, а тот, кто целеустремленнее и эффективнее.
То, что модель DeepSeek полностью открыта, даст значительный толчок всей отрасли. Уже сейчас заканчиваются бенчмарки, которые могли бы доказать, что ИИ не способен думать.
Отрицать реальность больше не разумно. DeepSeek — это не просто прорыв, это вызов всему миру. И гонка ИИ только начинается.