- Китайская ИИ-компания Baichuan заявляет, что последняя версия ее большой языковой модели имеет большее «контекстное окно», чем ее зарубежные конкуренты.
- Китайская компания в области ИИ Baichuan также заявляет, что ее модель превосходит Claude 2 от Anthropic по качеству ответов, а также по пониманию длинного текста.
Китайская ИИ-компания Baichuan запустила модель ИИ, которая, по ее словам, может переваривать и обобщать романы, что делает ее самой мощной в мире моделью для обработки длинных текстовых подсказок.
Пекинская компания, основанная основателем китайской поисковой системы Sogou Ван Сяочуанем (Wang Xiaochuan), в понедельник объявила о своей последней версии модели большого языка Baichuan2-192k (LLM), заявив, что ее «контекстное окно» может обрабатывать около 350 000 китайских символов.
Контекстное окно – это комбинация входного и выходного текста, которую модель ИИ может обрабатывать во время разговоров с пользователями.
Для сравнения, Claude 2, представленный в июле компанией Amazon.com Anthropic как самая передовая в мире модель ИИ с точки зрения количества слов, которые пользователи могут включать в свои чат-запросы, как говорят, имеет контекстное окно из около 75 000 английских слов, соответствующих сотням страниц документов или книги.
Согласно сообщению китайской компании WeChat, контекстное окно модели Baichuan в 14 раз больше, чем у OpenAI GPT-4-32k.
Китайская ИИ-компания Baichuan также заявила, что его модель превзошла Claude 2 по качеству ответов, а также по пониманию и обобщению длинного текста, ссылаясь на результаты тестов LongEval, проекта, запущенного Калифорнийским университетом в Беркли и другими учреждениями США для оценки того, насколько хорошо LLM справляются с большими подсказками.
Китайская компания в области ИИ Baichuan заявила, что более крупное контекстное окно сделает ее модель ИИ полезной для предприятий, которым необходимо ежедневно обрабатывать и генерировать длинный текст, например в юридической, медиа и финансовой отраслях. По данным китайской компании Baichuan, она начала внутренние испытания модели с промышленными партнерами.
Китайская ИИ-компания Baichuan сталкивается с конкуренцией
Тем не менее, совместное исследование ученых из Стэнфордского университета и Калифорнийского университета в Беркли показывает, что способность обрабатывать больше информации не обязательно делает модель ИИ лучше, чем ее аналоги.
«Производительность существенно снижается по мере увеличения длины входного контекста, даже для моделей с явно длинным контекстом», – пишут исследователи в своем исследовании.
Китайская ИИ-компания Baichuan сталкивается с усилением конкуренции со стороны китайских конкурентов, которые стремятся привлечь пользователей к своим моделям и приложениям искусственного интеллекта.
Облачное подразделение холдинга Alibaba Group, во вторник объявило об обновлении своей модели ИИ Tongyi Qianwen, обученной с использованием сотен миллиардов параметров.
Tongyi Qianwen 2.0 превосходит ChatGPT 3.5 от OpenAI и Llama2 от Meta Platforms и сокращает разрыв с ChatGPT 4, заявил Чжоу Цзинжэнь (Zhou Jingren), технологический руководитель Alibaba Cloud, на ежегодном партнерском мероприятии компании.
Тем временем Zhipu AI, стартап, поддерживаемый Alibaba и Tencent Holdings, на прошлой неделе представил свою модель ChatGLM3 с различными улучшениями, включая более высокую скорость вывода, снижение затрат на обучение и добавление помощника по кодированию.
Компания также выпустила уменьшенную версию модели, предназначенную для использования в персональных электронных устройствах, таких как ноутбуки и смартфоны.
Новость Китая «Китайская компания в области ИИ Baichuan утверждает, что превзошла Anthropic и OpenAI с моделью, способной обрабатывать 350 тыс китайских иероглифов» подготовлена Порталом PRC.TODAY по материалам сайта SCMP.
Если вам понравилась новость или появились вопросы, оставьте ваш комментарий или обсудите эту новость на форуме.
![]()
Новости Китая: робототехника и искусственный интеллект за 15 сентября 2021



