Искусственный интеллект (ИИ)Новости Китая

ИИ QwQ-32B против DeepSeek R1: как меньший размер стал большим преимуществом

Китайский инструмент генеративного ИИ меньшего размера демонстрирует надежные способности при гораздо меньшей стоимости

Китайская модель ИИ QwQ-32B с открытым исходным кодом, несмотря на меньший размер, может соперничать с такими высококлассными мировыми конкурентами, как DeepSeek R1 (официальный сайт), что представляет собой еще один шаг вперед в балансе между производительностью и эффективностью применения ИИ.

Модель QwQ-32B (официальный сайт), представленная в прошлый четверг командой Qwen компании Alibaba, работает всего на 24 ГБ видеопамяти с 32 миллиардами параметров, в то время как DeepSeek R1 требует 1 600 ГБ для выполнения 671 миллиарда параметров, что обеспечивает 98-процентное сокращение.

Кроме того, по сравнению с o1-mini от OpenAI и Sonnet 3.7 от Anthropic, модель ИИ Qwen имеет значительно меньшие вычислительные требования.

Кайл Корбитт (Kyle Corbitt), бывший инженер Google, опубликовал результаты тестирования на социальной медиаплатформе X, показав, что «более компактная модель с открытым весом может сравниться с современными моделями рассуждений».

По данным команды Корбитта, QwQ-32B достигла второго по величине результата в эталоне дедуктивных рассуждений с помощью метода подкрепляющего обучения (RL), превзойдя R1, o1 и o3-mini, и почти сравнялась с Sonnet 3.7 при стоимости вывода, более чем в 100 раз меньшей, чем требуется для Sonnet 3.7.

«ИИ не просто становится умнее, он учится развиваться», – прокомментировал Шашанк Ядав (Shashank Yadav), генеральный директор Fraction AI. «QwQ-32B доказывает, что обучение с подкреплением может превзойти масштабирование грубой силой».

«Мы обнаружили, что обучение с применением RL повышает производительность, особенно в задачах по математике и кодированию. Его расширение может позволить средним моделям сравняться по производительности с большими MoE-моделями», – говорится в статье в блоге Qwen на Github.

Читайте и другие НОВОСТИ КИТАЯ  Деловые новости Китая за неделю (Дайджест N203)

QwQ-32B: китайская модель ИИ, которая доказывает, что меньше — значит больше

Ожидается, что новая модель Qwen позволит в будущем расширить возможности локальных операций для генеративного ИИ на компьютерах и даже мобильных устройствах.

Ауни Ханнун (Awni Hannun), специалист по информатике из Apple, запустил QwQ-32B на компьютере Apple с чипом M4 Max, и, судя по всему, он «работает хорошо».

Китайская национальная суперкомпьютерная интернет-платформа в прошлую субботу объявила о запуске сервиса API-интерфейса для QwQ-32B. Кроме того, компания Biren Technology, разработчик чипов GPU из Шанхая, объявила в воскресенье о выпуске машины «все-в-одном», способной работать с этой моделью.

Модель QwQ-32B находится в свободном доступе и может быть запущена любым желающим, следуя курсу DeepSeek на содействие более широкому применению технологий ИИ во всем мире и передаче мудрости Китая всему миру.

Недавно Alibaba также выложила в открытый доступ свою модель ИИ для создания видео Wan2.1, которая доступна для загрузки в сообществе моделей ИИ Alibaba Cloud, Model Scope и на совместной платформе ИИ Hugging Face.

Гигант электронной коммерции и облачных вычислений объявил о планах инвестировать более 380 миллиардов юаней в создание облачной и аппаратной инфраструктуры ИИ в течение следующих трех лет.

Новость Китая “ИИ QwQ-32B против DeepSeek R1: как меньший размер стал большим преимуществом” подготовлена Порталом PRC.TODAY по материалам сайта China Daily.

Читайте и другие НОВОСТИ КИТАЯ  Китайские регуляторы предлагают радикальные меры для живого маркетинга

Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале 

https://t.me/PRC_TODAY
Мы в Telegram

посмотрите другие новости Китая на prc.today

Alibaba Cloud удивляет: QwQ-32B превосходит DeepSeek R1 в математике и коде

Поделиться:

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Back to top button