Модели предсказания и динамика оценок характеристик прикладных задач методами машинного обучения

Решение прикладных задач методами искусственного интеллекта
Авторы:
Аннотация:

В статье рассматривается задача машинного обучения, заключающаяся в одновременной оценке условного распределения выживаемости и динамических характеристик вычислительных задач. Проблема возникает при управлении рабочей нагрузкой кластера, и крайне актуальна для оптимального планирования. Для решения задачи предложен новый метод, основанный на комбинации механизма внимания и случайном лесе выживаемости. Ключевой особенностью является использование древовидной структуры, полученной случайным лесом выживания. Алгоритм построения леса опирается только на данные задачи выживаемости. В каждом листе используется безусловная оценка Каплана-Мейера, что является серьезным ограничением леса, особенно в случае редких событий в некоторых частях пространства признаков. Более того, случайный лес выживаемости не позволяет оценить динамические параметры задачи. Предлагаемый метод решает данные проблемы, дополняя уже построенный случайный лес выживаемости механизмом внимания внутри каждого листа дерева. Для моделирования выживаемости применяется оценка Берана, а для предсказания динамических характеристик задач – регрессия Надарая-Ватсона с теми же параметрами. Для этого используются подмножества обучающих данных, соответствующие тому же листу, что и входной вектор. В результате получена совместная модель, позволяющая более точно оценить функцию выживаемости и одновременно предсказать динамические характеристики задачи. Разработанная модель сочетает в себе преимущества гладких моделей, основанных на механизме внимания, и ступенчатых деревьев решений.