Мультимодальные LLM: новые горизонты искусственного интеллекта

Мультимодальные большие языковые модели (LLM) достигли значительного прогресса за последний год, и практическое применение таких моделей движется в направлении искусственного общего интеллекта, с появлением различных вертикальных промышленных больших моделей и агентов ИИ, заявили эксперты на Всемирной конференции по искусственному интеллекту 2024, которая завершилась 6 июля в Шанхае.

Мультимодальные LLM интегрируют и обрабатывают различные типы данных – текст, изображения, аудио и видео – для улучшения понимания и генерирования комплексных ответов.

В мае запуск GPT-4o, новейшего LLM, разработанного OpenAI, произвел фурор во всем мире. По словам компании, новая флагманская модель генеративного ИИ обладает возможностями работы с текстом, голосом и визуальными образами, делая взаимодействие между людьми и машинами гораздо более естественным и бесшовным.

Под влиянием GPT-4o китайские ИИ-компании также продемонстрировали свои обновления LLM во время конференции, включая Baidu, Alibaba, Tencent, Huawei, SenseTime и Ant Group, а также новые компании, такие как Minimax, Baichuan Intelligence и Zhipu AI.

Китайский пионер в области искусственного интеллекта SenseTime запустил свою новейшую мультимодальную LLM 5 июля. Новая модель включает в себя интеграцию различных типов данных и потоковое мультимодальное взаимодействие с пользователями в режиме реального времени, тесно конкурируя с GPT-4o по эффекту взаимодействия и нескольким основным метрикам, заявила компания.

В тот же день китайская финансовая компания Ant Group представила свой новейший продукт LLM.

Читайте и другие НОВОСТИ КИТАЯ Tencent покупает «крупный пакет акций» шведского разработчика игр 10 Chambers Collective

«Модель Ant BaiLing Foundation Model была оснащена собственными мультимодальными возможностями. Она может напрямую понимать и обучать различные типы данных, включая аудио, видео, изображения и текст», – сказал Сюй Пэн (Xu Peng), вице-президент группы, который считает такие мультимодальные возможности „верным путем к достижению искусственного общего интеллекта“, поскольку они позволят LLM взаимодействовать как люди.

Мультимодальные LLM на выставке искусственного интеллекта

По сравнению с предыдущей выставкой, в этом году WAIC продемонстрировала значительные достижения в области LLM. Согласно официальной статистике, количество LLM в Китае превышает 330.

Практическое промышленное применение больших моделей, например, применение вертикальных больших моделей, агентов ИИ или MaaS (модель как услуга), стало еще одной актуальной темой WAIC этого года.

«Создание больших моделей – это только отправная точка. Цель – внедрить LLM в промышленные сценарии для получения прибыли», – говорит Ву Юншэн (Wu Yunsheng), вице-президент Tencent Cloud и глава Tencent YouTu Lab.

Tencent Hunyuan, общая модель компании, была одним из самых ярких экспонатов на конференции этого года.

Цзян Цзе (Jiang Jie), вице-президент Tencent, сказал: «В будущем общие модели будут существовать как инфраструктура – как вода, электричество и сети – для доступа по требованию. Появится больше моделей разных размеров и форм, и предприятия смогут координировать работу больших и малых моделей для удовлетворения индивидуальных потребностей и повышения производительности».

Читайте и другие НОВОСТИ КИТАЯ Государственная поддержка научно-технического прогресса в Китае приносит плоды

Ху Шивэй (Hu Shiwei), соучредитель и президент китайской ИИ-компании 4Paradigm, считает, что позиционирование таких больших моделей в качестве новой «инфраструктуры» в будущем – это несомненный факт.

«Наши промышленные большие модели достигли замечательных результатов в применении. Например, в секторе финансовых услуг ИИ повысил точность выявления мошеннических транзакций. В сфере розничной торговли персонализированные услуги привели к значительному росту продаж», – говорит Ху.

Помимо разработки вертикальных крупных моделей, многие компании и разработчики также используют MaaS – тип облачного сервиса, который предлагает пользователям доступ к моделям машинного обучения для разработки приложений ИИ.

Zhipu AI, пекинский стартап, прозванный одним из четырех новых «тигров ИИ» Китая, собрал более 400 000 корпоративных пользователей.

Новость Китая “Мультимодальные LLM: новые горизонты искусственного интеллекта” подготовлена Порталом PRC.TODAY по материалам сайта China Daily.

Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость в нашем Telegram-канале

Китай: Всемирная конференция по искусственному интеллекту WAIC 2021 в Шанхае

Print 🖨 PDF 📄

Поделиться:

Теги

Китай сегодня18.07.2024

247

Добавить комментарий Отменить ответ

Китай сегодня - бизнес новости
Спасибо за ваши уточнения. Соберем больше свежих данных, обн...
Китай сегодня - бизнес новости
Мошенников полно в любых странах, нужно внимательно проверят...
Дмитрий Валентинович
А где данные торговли между Россией и Китаем?...
Юрий
Оба описанных автором способа не работают, пытаюсь через апе...
Фарход
От имени компании TEMU из Китая взял себе представителя этой...

Мультимодальные LLM на выставке искусственного интеллекта

Подпишитесь на обновления и получайте новые статьи на почту!

Похожие статьи

105-летию Коммунистической Партии Китая

Россия–Китай. В Москве прошел телемост по Китайско-российскому сотрудничеству в сфере туризма

3D-сканирование Shining 3D: точность до 4 микрон и ИИ-технологии

ИИ-платформа 360 Nano Work: запуск корпоративных агентов

Добавить комментарий Отменить ответ