ИИ позволит точно моделировать производительность систем хранения данных

Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию систем хранения данных на основе генеративных моделей машинного обучения. Он позволяет с высокой точностью предсказывать ключевые характеристики работы таких систем при различных условиях. Результаты опубликованы в журнале IEEE Access.
Системы хранения данных играют важную роль в современном цифровом мире, отвечая за сохранность и оперативную доступность огромных объемов информации. Эти системы состоят из множества компонентов — контроллеров, дисков HDD и SSD, кеш-памяти, — которые совместно обеспечивают быструю и эффективную работу. Чтобы такие системы функционировали оптимально, важно точно прогнозировать их производительность при различных сценариях, например при изменении нагрузки.
Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию производительности систем хранения данных, который базируется на использовании генеративных моделей машинного обучения. Авторы предложили методику, позволяющую с высокой точностью предсказывать ключевые характеристики работы систем: количество операций ввода-вывода в секунду (IOPS) и задержку (latency).
Моделирование состоит из двух этапов. Сначала ученые собирают данные реальных измерений производительности системы при различных нагрузках и конфигурациях. Затем эти данные поступают в специальные генеративные модели: регрессионную модель CatBoost и модель нормализующих потоков (Normalizing Flow). CatBoost хорошо работает с табличными данными и точно предсказывает средние значения и отклонения производительности. Модель нормализующих потоков позволяет получить полное распределение возможных значений с учетом неопределенности и вариабельности данных.
Михаил Гущин
«Одно из важных преимуществ нашего метода — это то, что он не требует детального знания внутреннего устройства компонентов системы. Часто это невозможно из-за коммерческой тайны производителей. Вместо этого генеративные модели обучаются непосредственно на реальных измерениях. В нашем исследовании, например, мы обучили модель на примере 300 000 измерений. Такой подход позволяет сделать метод универсальным и применимым к любым типам систем хранения данных», — рассказывает автор исследования Михаил Гущин, старший научный сотрудник факультета компьютерных наук НИУ ВШЭ.
Точность предложенного подхода исследователи проверили с помощью закона Литтла — фундаментального принципа теории массового обслуживания. Результаты тестов показали высокую степень соответствия предсказаний реальным наблюдениям: ошибки прогнозирования IOPS составляют всего 4–10%, а задержки — 3–16%, при этом корреляция с наблюдаемыми значениями достигает 0,99.
Азиз Темирханов
«Предложенный нами подход открывает широкие перспективы для оптимизации и планирования работы центров обработки данных. Он позволяет заранее предсказывать поведение системы при изменении нагрузки, выявлять потенциальные проблемы производительности, оптимизировать энергопотребление. Кроме того, для точного моделирования не нужно проводить дорогостоящие физические эксперименты», — отмечает Азиз Темирханов, младший научный сотрудник Научно-учебной лаборатории методов анализа больших данных.
Код экспериментов, а также данные измерений производительности системы хранения данных выложены в открытый доступ.
Исследование выполнено в рамках проекта «Зеркальные лаборатории» НИУ ВШЭ по теме «Повышение эффективности центров обработки данных и систем хранения данных методами искусственного интеллекта».
Вам также может быть интересно:
Ученые Вышки научили нейросеть «слышать» неисправности в электродвигателях
Ученые Института искусственного интеллекта и цифровых наук (ИИиЦН) факультета компьютерных наук НИУ ВШЭ разработали метод Signature-Guided Data Augmentation (SGDA), который способен с точностью 99% определять неисправность двигателей и с точностью 86% классифицировать типы возникших поломок. Применение этой разработки может снизить расходы на ремонт промышленного оборудования, уменьшить простои и сделать производство безопаснее. Результаты исследования опубликованы в журнале Engineering Applications of Artificial Intelligence.
«Подготовка инженеров нового поколения невозможна без интеграции инструментов ИИ в отраслевые ОП»
26 февраля в Уфе на площадке Межвузовского студенческого кампуса Евразийского научно-образовательного центра прошла защита итоговых проектов пилотного курса образовательной программы «ИИ-инженерия в нефтегазовой отрасли». Эксперты НИУ ВШЭ оценили студенческие проекты в сфере искусственного интеллекта, выполненные для «Газпрома» в рамках федерального проекта «Экономика данных и цифровая трансформация государства».
Стартует набор на онлайн-программу повышения квалификации «Основы ИИ-агентов для автоматизации процессов»
В Центре непрерывного образования факультета компьютерных наук НИУ ВШЭ открыт набор на новую онлайн-программу повышения квалификации «Основы ИИ-агентов для автоматизации процессов». Программа разработана для тех, кто стремится перейти от базового использования нейросетей в формате чат-ботов к созданию прикладных интеллектуальных инструментов для автоматизации бизнес-задач. Курс ориентирован на слушателей, заинтересованных в практическом освоении современных подходов к разработке автономных ИИ-агентов на базе больших языковых моделей и их внедрении в рабочие процессы.
Эпоха перемен: как исследования ЦСКИ помогают понять Россию
Сотрудники Центра социокультурных исследований НИУ ВШЭ сочетают фундаментальную и прикладную науку. О деятельности центра новостная служба «Вышка.Главное» побеседовала с его директором, доктором психологических наук Александром Татарко, научным руководителем, доктором психологических наук, профессором Надеждой Лебедевой, и главным научным сотрудником Викторией Галяпиной.
НИУ ВШЭ запустит лаборатории по космическим исследованиям и наноэлектронике с одним из ведущих университетов Индии
Ученые Высшей школы экономики и Индийского технологического института Бомбея (IIT Bombay) займутся совместными исследованиями в области хранения, передачи и обработки данных в космических системах. Вторым важным проектом станет лаборатория по сверхпроводниковой спинтронике — перспективному направлению современной наноэлектроники.
Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве
Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.
В Вышке продолжается набор на программу «ИИ-лидеры: бизнес-лаборатория для руководителей»
26 февраля на факультете компьютерных наук стартует 6-месячное очное обучение. О программе рассказывает ее автор и руководитель Евгений Соколов, научный руководитель Центра непрерывного образования ФКН.
«Наша задача — в создании лазеров как носителей информации»
Международная лаборатория квантовой оптоэлектроники НИУ ВШЭ в Санкт-Петербурге занимается разработкой полупроводниковых микролазеров. Создаваемые лабораторией компоненты и системы также обеспечивают высокую скорость передачи и обработки данных. «Вышка.Главное» обсудила перспективы и направления исследований лаборатории с ее руководителем — доктором физико-математических наук Натальей Крыжановской.
Ученые ВШЭ разработали DeepGQ — Google Maps для G-квадруплексов
Исследователи из Центра искусственного интеллекта ФКН НИУ ВШЭ разработали ИИ-модель, которая открывает новые возможности для диагностики и лечения тяжелых заболеваний, включая рак мозга и нейродегенеративные нарушения. Ученые применили искусственный интеллект для изучения G-квадруплексов — структур, которые оказывают значительное влияние на работу наших клеток и развитие различных органов и тканей. Статья с результатами исследования опубликована в журнале Scientific Reports.
ИИ в науке: страхи и чаяния российских ученых
Искусственный интеллект стал привычным инструментом в ряде стран, однако в российской науке его внедрение пока остается фрагментарным. К такому выводу пришли авторы первого в стране комплексного исследования использования технологий ИИ в научной деятельности. Они провели интервью с ведущими российскими учеными и расспросили их о сферах применения, возможностях и барьерах технологии.


