Китайский технологический гигант Baidu Inc. сделал открытым исходный код своей мультимодальной языковой модели Ernie 4.5, выпустив серию из 10 различных вариантов. Этот шаг стал частью стратегии компании по ускорению развития технологий искусственного интеллекта.
Технические особенности моделей Ernie 4.5
В семейство моделей вошли:
- MoE-модели (Mixture of Experts) с 47 и 3 млрд параметров.
- Крупнейшая модель с 424 млрд параметров.
- Плотная модель с 0,3 млрд параметров.
Baidu отмечает, что архитектура MoE обеспечивает более глубокое мультимодальное понимание и улучшенную производительность в текстовых задачах. Все модели обучались с высокой эффективностью на фреймворке PaddlePaddle, что позволяет достигать быстрого вывода и упрощает развертывание.
Производительность и возможности
Модель Ernie, представленная в марте 2024 года, демонстрирует передовые результаты в различных тестах, включая:
- Следование инструкциям.
- Запоминание знаний.
- Визуальное понимание.
- Мультимодальные рассуждения.
Эта модель способна анализировать и генерировать текст, изображения, аудио и видео на основе пользовательских запросов, что делает ее универсальным инструментом для разработчиков.
Открытие исходного кода Ernie 4.5 — важный шаг для мирового ИИ-сообщества. Baidu не только делится передовыми наработками, но и стимулирует инновации в мультимодальных системах. Сможет ли это решение укрепить позиции Китая в гонке ИИ? Поделитесь вашим мнением в комментариях!
Новость Китая “Ernie 4.5 vs GPT-4: что предлагает Baidu разработчикам?” подготовлена Порталом PRC.TODAY.
Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале


Ernie Bot помогает Baidu удвоить усилия по развитию искусственного интеллекта



