Учёные бьют тревогу: слишком долгое обучение ИИ может ухудшать его работу

Обновлено: 13 Апр, 18:25

Время чтения: менее минуты

Группа исследователей из Carnegie Mellon, Stanford, Harvard и Princeton выступила с неожиданным заявлением, которое может изменить фундаментальный подход к обучению искусственного интеллекта. Согласно их новому исследованию, чрезмерно длительное обучение больших языковых моделей способно не улучшать, а ухудшать их результаты.

Вопреки распространённому мнению, что «чем больше данных — тем лучше модель», учёные описали явление под названием «катастрофическая переобученность» (catastrophic overtraining). Оно заключается в том, что избыточное предварительное обучение (pre-training) может повредить способности модели после её дообучения (fine-tuning).

В рамках эксперимента сравнивались две версии языковой модели OLMo-1B. Первая была обучена на 2,3 триллиона токенов, а вторая — на 3 триллионах. Казалось бы, вторая должна была показать лучший результат. Однако всё вышло наоборот: «переобученная» модель показала до 3% худшие результаты в таких тестах, как AlpacaEval и ARC.

Этот вывод ставит под сомнение текущую стратегию наращивания объёмов обучающих данных, которую активно применяют лидеры индустрии. Если эффект «катастрофической переобученности» подтвердится для более крупных моделей, это может серьёзно изменить то, как мы будем развивать искусственный интеллект в ближайшие годы.

Оцените статью

Автор публикации

не в сети 6 месяцев

Александр Данилов

Техно-журналист с опытом ведения тех. блога более 5 лет. Люблю всё, что связано с новыми технологиями. Слежу за новинками, изучаю старые вещи. Знаю, что такое Linux и как поднять свой сервер. Ну а здесь я для того, чтобы рассказывать о новостях из мира технологий.

Комментарии: 0Публикации: 559Регистрация: 06-01-2025

Ты дочитал статью до конца, значит, нашёл в ней что-то интересное. Автор пыхтел над ней несколько дней, все пальцы стёр. Отблагодари его — оставь комментарий. Без тебя наше комьюнити будет неполным.

Присоединиться

Статья была полезной? Поделитесь с друзьями в соцсетях: