Лян Вэньфэн решил выделить финансирование для DeepSeek после того, как увидел, насколько Клод Мифос продвинулся благодаря большим вычислительным мощностям и данным. После завершения финансирования компания объявила, что набор персонала во все отделы (включая разработку ИИ-систем, инфраструктуры, продуктов и исследования в области глубокого обучения) как минимум удвоился — сейчас в DeepSeek около 300 сотрудников. Команда Harness, которая отвечает за преобразование модели в автономного ИИ-агента, начала проводить ежедневные собеседования. DeepSeek также активизировала адаптацию отечественных чипов: Лян Вэньфэн считает, что чипы Huawei могут достичь уровня Nvidia за несколько лет. При этом система обучения и развёртывания DeepSeek построена на базе ПО Nvidia CUDA — инженерам нужно переписать базовое ПО, чтобы модель эффективно работала на чипах Huawei. Из‑за этого компания 15 месяцев не выпускала модели нового поколения — в то время как другие лаборатории представляют их каждые 2–3 месяца. Лян Вэньфэн на роуд-шоу заявил инвесторам, что чат‑боты с ИИ — лишь временные продукты на пути к AGI (общему искусственному интеллекту). В рамках финансирования на 77,4 млрд долларов Лян Вэньфэн лично вложил 20 млрд юаней (около 33 млрд долларов) — это две пятых от общей суммы. После финансирования DeepSeek разработала план распределения акций для сотрудников. Лян Вэньфэн подчёркивает, что стратегия компании не изменится: открытый исходный код, низкие цены, фокус на AGI. DeepSeek — единственная крупная лаборатория ИИ, которая полностью раскрывает базовый код всех моделей. Флагманская модель V4, выпущенная в апреле, за месяц стала третьей по величине на платформе Vercel AI Gateway после Anthropic и Google: доля использования токенов выросла с менее чем 1% до 17%. Облегчённая версия V4 Flash стоит в 20–50 раз дешевле моделей Anthropic.
量子位 (QbitAI)
·
·
~2 мин
DeepSeek: финансирование, рост команды и адаптация чипов Huawei
DeepSeek получила финансирование и удвоила набор персонала. Компания активно адаптирует отечественные чипы Huawei и продолжает развивать модели ИИ. Флагманская модель V4 за месяц вошла в тройку лидеров на платформе Vercel AI Gateway.
// оригинал
量子位 (QbitAI)
↗ Читать оригинал
4 просмотров
// похожие статьи