Методы интерпретации моделей машинного обучения в рамках анализа выживаемости при цензурированных данных: краткий обзор

Решение прикладных задач методами искусственного интеллекта
Авторы:
Аннотация:

Методы интерпретации, или объяснения, предсказаний являются неотъемлемой частью современных моделей машинного обучения типа «черный ящик». Они получили широкое распространение, что обусловлено необходимостью понимания пользователем того, что предсказывает модель машинного обучения. Это особенно относится к моделям анализа выживаемости, так как они используются в медицине, надежности, безопасности, а также имеют особенности, которые усложняют их объяснение и интерпретацию. В работе рассматриваются основные методы интерпретации моделей выживаемости, которые оперируют с цензурированными данными и определяют характеристики времени до определенного события. Особенностью таких моделей является то, что их предсказания представляются не в виде некоторого точечного значения, а в виде вероятностной функции времени, например, функции выживаемости или функции риска. Это требует необходимости разработки специальных методов интерпретации. Рассмотрены наиболее известные методы SurvLIME, SurvLIME-KS, SurvNAM и SurvBeX, SurvSHAP(t), которые основаны на использовании методов интерпретации предсказаний LIME и SHAP, модели Кокса и ее модификации, а также оценки Берана.