Китайский стартап в области искусственного интеллекта DeepSeek (официальный сайт) представил новое поколение больших языковых моделей, явно оптимизированных для отечественных чипов. Это достижение отраслевые эксперты рассматривают как сдвиг в сторону снижения зависимости от продукции компании.
DeepSeek: три версии для разных задач
Компания DeepSeek представила предварительную версию серии моделей, а также высокопроизводительную версию и облегченный вариант.
Ключевые особенности новой архитектуры:
- Поддержка сверхдлинных контекстных окон до одного миллиона китайских иероглифов.
- Улучшенные возможности агентного взаимодействия.
- Расширенные знания о мире и улучшенная логика рассуждений.
- Оптимизация для работы на различных аппаратных платформах.
Примечательно, что в своем техническом отчете компания впервые поместила графические процессоры и нейронные процессоры в единую рамку аппаратной валидации.
Отмечается, что схема мелкозернистого экспертного параллелизма была верифицирована на обеих платформах. Это означает, что модель может эффективно распределять вычислительные задачи между различными типами процессоров, что ранее было сложно реализовать из-за архитектурных различий.
Компания добавила, что модель уже завершила адаптацию инференса на платформе, что указывает на переход развертывания на отечественных чипах от экспериментального тестирования к практической реализации.
Выход за пределы CUDA
Этот шаг разрывает давно устоявшуюся практику, при которой китайские разработчики полагались почти исключительно на экосистему для обучения и инференса.
Для индустрии это означает:
- Снижение рисков, связанных с экспортными ограничениями
- Возможность использования более доступного отечественного оборудования
- Стимулирование развития локальной экосистемы инструментов разработки
Сдвиг происходит на фоне ужесточения экспортного контроля со стороны Соединенных Штатов в отношении передовых полупроводников, что ускорило стремление Китая создать самодостаточный стек искусственного интеллекта, охватывающий чипы, фреймворки и модели.
Параллельно Академия искусственного интеллекта Пекина заявила, что ее система уже адаптировала модель для полного развертывания инференса на более чем восьми архитектурах ИИ-чипов, включая решения от компаний.
Для разработчиков, инвесторов и технологических компаний текущая ситуация создает определенные сигналы: успешная адаптация моделей под отечественные чипы снижает зависимость от импортных решений, поддержка длинного контекста открывает новые сценарии использования ИИ, а расширение совместимости с различными архитектурами ускоряет внедрение технологий в реальные продукты. Однако успех будет зависеть от производительности отечественных чипов в сравнении с глобальными аналогами и от качества инструментария для разработчиков.
Запуск модели, оптимизированной для отечественных чипов, – это не просто техническое достижение, а стратегический сигнал о зрелости китайской экосистемы искусственного интеллекта. Сможет ли сочетание программной адаптации и аппаратного развития создать устойчивую альтернативу доминирующим платформам? Поделитесь мнением в комментариях.
Новость Китая “DeepSeek и отечественные чипы: разрыв с зависимостью от Nvidia” подготовлена Порталом PRC.TODAY.
Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале

DeepSeek как фраза года: китайская ИИ-модель стала национальным символом



