Разработка двухконтурного метода интеллектуального светофорного регулирования на основе обучения с подкреплением и почасовой дистилляции фазовых стратегий

Системный анализ и управление
Авторы:
Аннотация:

На фоне усложняющейся урбанистической динамики, а также возрастающих требований к устойчивости городской мобильности и внедрения когнитивных технологий в транспортную инфраструктуру в работе предлагается двухконтурный метод интеллектуального регулирования светофоров на основе обучения с подкреплением и процедур дистилляции фазовых стратегий. Первый уровень реализует управление в реальном времени через RL-агента, второй — формирует резервные почасовые планы на основе статистики его поведения. Метод опирается на системно-дискретную модель с учетом стохастических параметров трафика и допустимых ограничений управления. Проведенное моделирование в SUMO для реального перекрестка демонстрирует существенное снижение средней задержки транспорта по сравнению с классическим управлением, подтверждая эффективность, устойчивость и масштабируемость подхода. Полученные результаты обосновывают возможность практического внедрения модели в рамках интеллектуальных транспортных систем крупных городов и заложения инженерной основы для гибридных архитектур управления городской мобильностью.