
Alibaba Cloud, подразделение облачных вычислений китайского технологического гиганта Alibaba Group, представило свою новейшую модель большого языка с открытым исходным кодом QwQ-32B (официальный сайт), производительность которой сопоставима с ведущими моделями, такими как DeepSeek R1 (официальный сайт).
В модели всего 32 миллиарда параметров, что в 21 раз меньше, чем 671 миллиард параметров DeepSeek R1, но она достигла значительного улучшения по целому ряду показателей, включая математическое мышление и владение кодом.
Alibaba Cloud бросает вызов DeepSeek
По словам компании, это позволило значительно снизить затраты на развертывание и может быть эффективно развернуто на аппаратном обеспечении потребительского класса.
Alibaba интегрировала в QwQ-32B возможности, связанные с ИИ-агентами, что позволило ему критически мыслить, эффективно использовать инструменты и адаптировать свои рассуждения на основе обратной связи с окружающей средой.
Этот шаг был предпринят после того, как компания Alibaba заявила, что в ближайшие три года увеличит объем инвестиций в искусственный интеллект, включая инфраструктуру для ИИ и облачных вычислений, а также базовые модели ИИ и собственные приложения.
Новость Китая “Alibaba Cloud удивляет: QwQ-32B превосходит DeepSeek R1 в математике и коде” подготовлена Порталом PRC.TODAY по материалам сайта China Daily.
Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале
