Китайские модели, сгенерированные искусственным интеллектом, отстают от лидеров

В Китае модели искусственного интеллекта Ernie Bot 4.0 от Baidu и GLM-4 от стартапа Zhipu AI показали наилучшие результаты среди больших языковых моделей (БЯМ), однако зарубежные аналоги продолжают превосходить их по общим возможностям.

Цинхуа-Университет провел исследование, в ходе которого сотрудники оценили 14 различных БЯМ, широко используемых в чат-ботах. Для оценки моделей использовались различные методики, включая тесты на семантическое понимание, способность к написанию кода, а также адаптацию к командам человека.

Оказалось, что между китайскими моделями и моделями первого класса из других стран существуют «очевидный разрыв», особенно в программировании и выполнении задач в реальных условиях.

Исследователи хотели предложить объективные и научно обоснованные критерии для оценки моделей, что становится все более важным в условиях растущего числа БЯМ на рынке. Ученые хотят точно оценивать способности моделей к обработке естественного языка, их умение логически рассуждать и способность к обучению без учителя.

Среди 200 моделей БЯМ, запущенных в Китае (где услуги OpenAI официально недоступны), высокие результаты в задачах на китайском языке показали Ernie Bot 4.0 и GLM-4. В этой категории также выделялись чат-боты Kimi от Moonshot AI и Tongyi Qianwen 2.1 от Alibaba, которые заняли топовые позиции, хотя и GPT-4 продолжает оставаться лидером в области рассуждений на китайском языке.

03.05.2024 | 15:09    220
Футбольная команда «Динамо Дубна» 2014 г.р. под руководством Кирилла Переверзьева приняла участие в одном из самых престижных турниров Тверской области «Компьютерия», который собрал команды из разных городов РФ.
27.04.2024 | 16:33    766
На пленуме комитета Московской областной организации Профсоюза работников здравоохранения РФ, который прошел 24 апреля в Московском областном научно-исследовательском клиническом институте имени М.Ф. Владимирского, подвели итоги работы, выбрали и отметили...
28.04.2024 | 15:55    760
С 22 по 26 апреля были организованы четыре объемные секции: естественные и инженерные науки, инженерные и физические науки, компьютерные науки, социальные и гуманитарные науки. Работали 22 подсекции, на которых заслушаны более 250 докладов. По итогам...