• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Сегодня сделать большую языковую модель — это гигантский труд»

«Сегодня сделать большую языковую модель — это гигантский труд»

Фото: wtcmoscow.ru

С 22 по 24 ноября проходит международная онлайн-конференция в сфере технологий искусственного интеллекта AI Journey 2023. В ее работе приняли участие эксперты НИУ ВШЭ. В фокусе обсуждения — языковые модели и методы, которые применяются сегодня для обучения искусственного интеллекта.

Научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ Елизавета Гончарова выступила с докладом «Языковые модели. Что можно выучить, генерируя текст?». Она рассказала об истории развития процесса обработки естественного языка и больших языковых моделей как виртуальных ассистентов. По ее словам, начало этому направлению было положено еще в середине прошлого столетия, но применяемые тогда подходы главным образом были основаны на правилах, связанных с формальной грамматикой и регулярными выражениями. «Однако впоследствии нейросетевые подходы по обработке естественного языка и трансформерные модели взяли верх, и все большие и наиболее успешные примеры работ моделей по обработке естественного языка теперь связаны именно с архитектурой трансформеров», — отметила исследовательница.

Елизавета Гончарова

Елизавета Гончарова считает, что большие языковые модели очень мощные, поэтому, будучи предобученными на простой задаче языкового моделирования, они способны решать гораздо более сложные прикладные задачи даже без дальнейшего обучения. «Если заглянуть внутрь модели, то мы увидим, что каждая часть модели отвечает за кодирование и своей информации, и той информации, на которую мы посягаем как люди: лингвистической структуры текста, фактологии, понятий времени и пространства и даже визуальных концептов, в целом закодированных внутри модели, которую мы рассматриваем, — объяснила она. — Добавление на дообучение модели данных других модальностей позволяет лучше улавливать понятия, связанные с этими модальностями, как в случае цветов, так и в случае форм. Это намекает нам на то, что текстов недостаточно, чтобы модель получила все знания о мире. Возможно, расширение модальности позволит нам открыть новые формы моделей и перейти к более сложным и более умным моделям, которые мы будем использовать в будущем».

Об алгоритмах, которые применяются для создания языковых моделей, используемых искусственным интеллектом, рассказал Евгений Соколов, руководитель департамента больших данных и информационного поиска, доцент факультета компьютерных наук, научный руководитель Центра непрерывного образования НИУ ВШЭ. Тема его доклада — «Tехнологии и алгоритмы внутри больших языковых моделей, или Что сегодня понимают под ИИ?». Евгений Соколов отметил, что сегодня уже много информации об успехах ИИ, генеративных моделей, больших языковых моделей. Он предложил разобраться, как они работают, что находится внутри, какие алгоритмы делают возможными все эти результаты и за счет чего происходит рост качества в методах ИИ.

Евгений Соколов

«Сегодня сделать большую языковую модель — это гигантский труд. Да, математика, которая лежит в основе, очень простая: производные, градиенты, градиентный спуск. А дальше начинается много интересного, нужно придумать методы для извлечения информации из данных, — говорит Евгений Соколов. — Сейчас есть трансформеры, но, кто знает, может, завтра придумают что-то новое? Очень важны сегодня обучающие данные. Классическая парадигма — это когда мы берем обучающие данные и подкручиваем параметры какой-то модели, какого-то алгоритма, чтобы получилось получше. Но сейчас этого мало, недостаточно. Нам нужно как-то внедрить требования качества в эту модель. Для этого мы берем асессоров, собираем большую выборку, строим отдельную оценивающую модель, что требует тоже очень много времени, и на основе этого докручиваем параметры нашей большой языковой модели. Получается сложная схема, какой мы видим ее сегодня. И это то, как сейчас обучаются большие языковые модели».

Эксперт отметил, что в этой работе главную роль играет не решение задачи, чтобы модель как-то «догадалась», что разработчики в нее заложили какие-то глубокие понимания — например, понимание того, как устроен язык. В этой работе важны два момента — собрать качественные данные и взять модель побольше. По его мнению, последние годы исследований показали, что основной рост качества языковых моделей достигается за счет определения большего количества параметров, по которым в дальнейшем будет вестись разработка большой языковой модели.

Свои доклады на конференции также представили и другие исследователи из Вышки. Так, младший научный сотрудник Института искусственного интеллекта и цифровых наук Айбек Аланов выступил с докладом «Редактирование изображений с помощью диффузионных моделей». Сотрудник Института искусственного интеллекта и цифровых наук и Научно-учебной лаборатории методов анализа больших данных НИУ ВШЭ Виталий Поздняков представил доклад на тему «Генерация стрессовых данных для проверки устойчивости моделей». Доцент факультета компьютерных наук, сотрудник Международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ Дмитрий Ильвовский сделал сообщение на тему «Интерпретируемые подходы к дискурсивным, логическим и аргументативным структурам в тексте». А профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко представил исследование «Эффективные методы распознавания выражений лиц на видео».

В форсайт-сессии «ИИ для человека будущего» выступил Александр Чулок, директор Центра научно-технологического прогнозирования ИСИЭЗ НИУ ВШЭ.

Вам также может быть интересно:

Ученые НИУ ВШЭ рассказали о будущем искусственного интеллекта в судопроизводстве

Современные технологии меняют не только нашу повседневную жизнь, но и такие консервативные сферы, как судебная система. Сотрудники кафедры конституционного и административного права НИУ ВШЭ в Нижнем Новгороде Ирина Михеева и Олег Шерстобоев проанализировали возможности и вызовы, связанные с внедрением ИИ в судебный процесс. Исследование опубликовано в журнале «Вестник Российского университета дружбы народов».

«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»

Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.

В Вышке упростили разработку интеллектуальных сервисов

Ученые НИУ ВШЭ разработали MLOps-платформу, применение которой поможет внедрять эффективные и безопасные ИИ-решения во всех кампусах и подразделениях университета. В дальнейшем рассматривается возможность масштабирования инструмента на внешний рынок.

Бизнес-разработки и студенты в науке: какие еще задачи у новой лаборатории Института ИИ и цифровых наук

Лабораторию теоретических основ моделей ИИ возглавил старший научный сотрудник факультета компьютерных наук Никита Пучкин, за прикладные разработки будет отвечать руководитель проектов Института ИИ и цифровых наук Елизавета Жемчужина. О том, чем будет заниматься лаборатория, как планируется организовать сотрудничество с индустриальными партнерами и какая роль в ее работе отводится студентам Вышки, они рассказали в интервью «Вышке.Главное».

НИУ ВШЭ – Нижний Новгород и ИТ-кампус будут готовить магистров в области ИИ и компьютерного зрения

17 сентября директор нижегородского кампуса Высшей школы экономики Анна Бляхман и директор АНО «Проектный офис ИТ-кампуса НЕЙМАРК» Валерий Черепенников заключили соглашение о присоединении ИТ-кампуса к программе магистратуры «Искусственный интеллект и компьютерное зрение». Поступить на программу в сетевом формате можно будет в 2025 году.

Вышка представила свои разработки и научные достижения в области ИИ

Сбер организовал R&D-день для исследовательских центров в области искусственного интеллекта. Команды Центра ИИ и других подразделений ВШЭ продемонстрировали свои компетенции и обсудили с бизнес-заказчиками перспективные задачи и подходы к их решению в будущих проектах.

НИУ ВШЭ и «Яндекс» проведут международную олимпиаду по ИИ для студентов

Факультет компьютерных наук НИУ ВШЭ и «Яндекс Образование» открывают набор на участие в олимпиаде Artificial Intelligence and Data Analysis Olympiad (AIDAO). Это первая совместная олимпиада по искусственному интеллекту университета и ИТ-компании для студентов разных стран. Участники попробуют силы в решении сложных задач из сферы науки и индустрии и познакомятся с экспертами из Вышки и «Яндекса», а победители получат денежные призы.

Искусственный интеллект в университете: вызовы и задачи

На форуме «Технопром-2024», прошедшем в Новосибирске, Высшая школа экономики организовала круглый стол, посвященный обсуждению роли искусственного интеллекта в образовании. Как технологии ИИ помогают выводить качество образования в НИУ ВШЭ на новый уровень, рассказали представители университета.

Красота в деталях: ученые Вышки и AIRI разработали метод высококачественного редактирования изображений

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета разработали новый метод редактирования изображений на основе глубинного обучения — StyleFeatureEditor. Он позволяет точно воссоздавать мельчайшие детали изображения и сохранять их при редактировании. С его помощью пользователи смогут изменять цвет волос или выражение лица без потери качества изображения. Результаты работы опубликованы на самой цитируемой конференции по компьютерному зрению CVPR 2024.

Победители Международной олимпиады по ИИ поступили в НИУ ВШЭ

В середине августа в Болгарии состоялся финал первой Международной олимпиады по искусственному интеллекту (IOAI) среди старшеклассников. Сборная России показала отличный результат: в научном туре команда завоевала золотые медали, в практическом — серебряные и оказалась первой по сумме баллов за оба тура. Два участника сборной в этом году стали студентами факультета компьютерных наук ВШЭ.