Категориальный анализ выживаемости требуемых времен исполнения задач в гибридном суперкомпьютерном центре
Согласно статистике, фактическое время выполнения большинства заданий на суперкомпьютерном кластере существенно отличается от времени, запрошенного пользователем. Исследование распределений времен исполнения задач на суперкомпьютере с использованием статистических методов или методов машинного обучения позволяет оптимизировать работу суперкомпьютерного кластера. Мы изучаем результаты исполнения вычислительных задач в суперкомпьютерном центре Санкт-Петербургского Политехнического университета Петра Великого. Нами разработан непараметрический подход для обнаружения и подтверждения статистической достоверности слабых стохастических порядков. Данный подход основан на категориальном непараметрическом методе сравнений на базе оценок Каплана–Мейера, построенных по независимым группам цензурированных справа наблюдений. Для корректировки уровня достоверности обнаруженных слабых стохастических порядков мы применяем поправку Бонферрони на все рассматриваемые сравнения. Проведен сравнительный статистический анализ распределений времен, необходимых для корректного завершения задач, в различных группах наблюдений, найдены и статистически подтверждены некоторые слабые стохастические порядки.