ИИ QwQ-32B против DeepSeek R1: как меньший размер стал большим преимуществом

Китайская модель ИИ QwQ-32B с открытым исходным кодом, несмотря на меньший размер, может соперничать с такими высококлассными мировыми конкурентами, как DeepSeek R1 (официальный сайт), что представляет собой еще один шаг вперед в балансе между производительностью и эффективностью применения ИИ.

Модель QwQ-32B (официальный сайт), представленная в прошлый четверг командой Qwen компании Alibaba, работает всего на 24 ГБ видеопамяти с 32 миллиардами параметров, в то время как DeepSeek R1 требует 1 600 ГБ для выполнения 671 миллиарда параметров, что обеспечивает 98-процентное сокращение.

Кроме того, по сравнению с o1-mini от OpenAI и Sonnet 3.7 от Anthropic, модель ИИ Qwen имеет значительно меньшие вычислительные требования.

Кайл Корбитт (Kyle Corbitt), бывший инженер Google, опубликовал результаты тестирования на социальной медиаплатформе X, показав, что «более компактная модель с открытым весом может сравниться с современными моделями рассуждений».

По данным команды Корбитта, QwQ-32B достигла второго по величине результата в эталоне дедуктивных рассуждений с помощью метода подкрепляющего обучения (RL), превзойдя R1, o1 и o3-mini, и почти сравнялась с Sonnet 3.7 при стоимости вывода, более чем в 100 раз меньшей, чем требуется для Sonnet 3.7.

«ИИ не просто становится умнее, он учится развиваться», – прокомментировал Шашанк Ядав (Shashank Yadav), генеральный директор Fraction AI. «QwQ-32B доказывает, что обучение с подкреплением может превзойти масштабирование грубой силой».

«Мы обнаружили, что обучение с применением RL повышает производительность, особенно в задачах по математике и кодированию. Его расширение может позволить средним моделям сравняться по производительности с большими MoE-моделями», – говорится в статье в блоге Qwen на Github.

Читайте и другие НОВОСТИ КИТАЯ Alibaba Cloud обслуживает 80% китайских технологических компаний и половину фирм, разрабатывающих языковые модели ИИ

QwQ-32B: китайская модель ИИ, которая доказывает, что меньше — значит больше

Ожидается, что новая модель Qwen позволит в будущем расширить возможности локальных операций для генеративного ИИ на компьютерах и даже мобильных устройствах.

Ауни Ханнун (Awni Hannun), специалист по информатике из Apple, запустил QwQ-32B на компьютере Apple с чипом M4 Max, и, судя по всему, он «работает хорошо».

Китайская национальная суперкомпьютерная интернет-платформа в прошлую субботу объявила о запуске сервиса API-интерфейса для QwQ-32B. Кроме того, компания Biren Technology, разработчик чипов GPU из Шанхая, объявила в воскресенье о выпуске машины «все-в-одном», способной работать с этой моделью.

Модель QwQ-32B находится в свободном доступе и может быть запущена любым желающим, следуя курсу DeepSeek на содействие более широкому применению технологий ИИ во всем мире и передаче мудрости Китая всему миру.

Недавно Alibaba также выложила в открытый доступ свою модель ИИ для создания видео Wan2.1, которая доступна для загрузки в сообществе моделей ИИ Alibaba Cloud, Model Scope и на совместной платформе ИИ Hugging Face.

Гигант электронной коммерции и облачных вычислений объявил о планах инвестировать более 380 миллиардов юаней в создание облачной и аппаратной инфраструктуры ИИ в течение следующих трех лет.

Новость Китая “ИИ QwQ-32B против DeepSeek R1: как меньший размер стал большим преимуществом” подготовлена Порталом PRC.TODAY по материалам сайта China Daily.

Читайте и другие НОВОСТИ КИТАЯ Сводка новостей автотранспортного сектора Китая за 27 мая 2021

Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале

Alibaba Cloud удивляет: QwQ-32B превосходит DeepSeek R1 в математике и коде

Print 🖨 PDF 📄

Поделиться:

Теги

Китай сегодня11.03.2025

Добавить комментарий Отменить ответ

Китай сегодня - бизнес новости
Спасибо за ваши уточнения. Соберем больше свежих данных, обн...
Китай сегодня - бизнес новости
Мошенников полно в любых странах, нужно внимательно проверят...
Дмитрий Валентинович
А где данные торговли между Россией и Китаем?...
Юрий
Оба описанных автором способа не работают, пытаюсь через апе...
Фарход
От имени компании TEMU из Китая взял себе представителя этой...

QwQ-32B: китайская модель ИИ, которая доказывает, что меньше — значит больше

Подпишитесь на обновления и получайте новые статьи на почту!

Похожие статьи

Роботы-компаньоны в Китае: цена от 119 800 юаней и запрет на роль «партнеров»

Китай призвал ООН к справедливому управлению ИИ: 200 обучающих программ

ИИ синтез белков в Шанхае: платформа производит 10 000 белков в день

Claude Code уязвимость: Китай обнаружил «бэкдор» в инструменте Anthropic

Добавить комментарий Отменить ответ