баннер Телеграм каналбаннер Телеграм канал

Управление светофором: стратегия, тактика, решение

Рейтинг 5
41616
Метелкин П.В.
директор Центра стратегического анализа ФГУП «ЗащитаИнфоТранс»
41617
Чепурнова А.В.
заместитель директора Центра стратегического анализа ФГУП «ЗащитаИнфоТранс»

Развитие крупных городов с учетом требований, предъявляемых к комплексному развитию территорий, неизбежно связано с проблемами управления транспортными потоками. Безусловно, стремление к оптимальному управлению ими стоит на переднем плане в современных транспортных системах. Успешное решение этой задачи посредством внедрения интеллектуальных транспортных систем (ИТС) может привести к сокращению расходов на поездки, снижению потребления топлива и, как следствие, уменьшению негативного воздействия на экологию. Специалисты ФГУП «ЗащитаИнфоТранс» в своем аналитическом обзоре рассматривают ключевую возможность ИТС – управление светофорными сигналами.

Введение

Работая в сегменте экономики, связанном с развитием и цифровизацией транспортной отрасли, нельзя не обратить внимание на то, как тесно связаны транспортная и строительная отрасли между собой. Требования, предъявляемые в одной из них, оказывают существенное влияние на смежную. За последнее время в строительной отрасли появился ряд требований и понятий, которые оказали значительное влияние на отрасль транспорта и логистики. Такими понятиями являются информационное моделирование, комплексное развитие территории, новые критерии организации градостроительной деятельности, которые послужили одной из причин появления новых требований при строительстве и развитии транспортной инфраструктуры.

Если провести анализ действующих нормативно-правовых актов и нормативно-технических документов, становится очевидным, что требования, предъявляемые к транспортной инфраструктуре, возрастают практически ежегодно. За счет плановой реализации мероприятий национальных программ и федеральных проектов во все отрасли экономики Российской Федерации все больше внедряются элементы высоких технологий. Цифровизация отраслей экономки с каждым годом повышает уровень технологичности и сложности подчас самых простых и обыденных предметов. Одним из них стала транспортная инфраструктура.

Клиентоориентированность при строительстве и развитии транспортной инфраструктуры стала одним из ключевых критериев при реализации мероприятий в транспортной отрасли. Акцентирование на социально-экономических аспектах при развитии транспортной инфраструктуры послужило причиной для все большего проникновения цифровых технологий и все большего использования цифровых технологий при развитии транспортной инфраструктуры.

Развитие крупных городов, с учетом требований, предъявляемых к комплексному развитию территории, неизбежно связано с проблемами управления транспортными потоками. Увеличивающийся с каждым годом транспортный поток, застройка новых микрорайонов, развитие дорожной сети и увеличение количества необходимых для обеспечения транспортной доступности для граждан маршрутов общественного транспорта требуют согласованной и эффективной организации перевозок.

Один из наиболее актуальных подходов к решению данной задачи – внедрение интеллектуальных транспортных систем. Интеллектуальная транспортная система (ИТС) – система, интегрирующая современные информационные, коммуникационные и телематические технологии, технологии управления и предназначенная для автоматизированного поиска и принятия к реализации максимально эффективных сценариев управления транспортно-дорожным комплексом региона, конкретным транспортным средством или группой транспортных средств с целью обеспечения заданной мобильности населения, максимизации показателей использования дорожной сети, повышения безопасности и эффективности транспортного процесса, комфортности для водителей и пользователей транспорта.

В более узком понимании интеллектуальные транспортные системы – это оборудование, которым оснащаются городские и региональные дороги (светофоры, камеры наблюдения, информационные табло, умные остановки, АПВГК, метеостанции), и программное обеспечение, которое объединяет это оборудование в единую систему, позволяя ей управлять.

Ключевая возможность ИТС

Возможность управления светофорными сигналами остаётся ключевой в интеллектуальных транспортных системах.

Прогресс в области машинного обучения способствовал активному внедрению адаптивных методов управления светофорами, использующих обучение с подкреплением.

Однако существующие исследования часто сравнивают традиционные методы управления и методы на основе обучения с подкреплением либо на основе синтетических сценариев, либо на небольшом количестве перекрёстков. Сравнение эффективности адаптивных систем управления и других систем является трудной задачей, поскольку для этого нужно по очереди опробовать каждую из них при одной и той же дорожной сети, что в условиях данного изучения вопроса является невозможной задачей в связи с отсутствием подобного рода научных практических испытаний на текущий момент. Единственным возможным для изучения вопроса вариантом являются критерии и способы сравнения и аналитики систем в условиях использования моделирования и прогноза ситуаций, например, на основе исследований по сравнению алгоритмов управления сигналами светофоров в крупномасштабном сценарии с помощью системы моделирования SUMO.

Безусловно, стремление к оптимальному управлению потоками в современных транспортных системах стоит на переднем плане. Успешное управление этим аспектом может привести к сокращению расходов на поездки, уменьшению потребления топлива и, как следствие, уменьшению экологического воздействия.

На текущий момент координированное управление дорожным движением в рамках АСУДД можно разделить на три уровня: стратегический, тактический и локальный.

На стратегическом уровне УДС разбивается на районы координации. Для каждого из них создают набор базовых ПК (пунктов коммутации), охватывающий все пересечения района координации. При этом используют накопленные статистические данные о параметрах транспортных потоков в этом или похожем районе. Таких ПК создают несколько, каждый для определённой транспортной ситуации. Обычно выделяют три вида колебаний характеристик транспортных потоков: суточный (утро, день, вечер), недельный (рабочий и выходные дни) и сезонный (время года). В районе выделяются группы пересечений, состоящие из перекрёстков, связанных между собой по транспортному потоку. Например, это может быть городской проспект как последовательная группа пересечений. Между собой эти группы тоже связаны, но слабее. Для каждой такой группы рассчитывается набор базовых ПК с учётом сезонных, недельных и суточных колебаний. Задачами стратегического уровня являются разработка базовых ПК для групп пересечений, а также согласование по времени действия ПК для всех групп, входящих в район координации.

Основной задачей, выполняемой на тактическом уровне, является корректировка базовых ПК групп пересечений под реальную транспортную ситуацию на пересечениях в районе координации. Интенсивности транспортных потоков на пересечениях могут отличаться от базовых в определённых пределах.

На локальном уровне осуществляется местная коррекция программы для каждого перекрёстка. Для этого используются алгоритмы местного гибкого регулирования (МГР). Результатом их работы является изменение длительностей сигналов светофорных объектов и поведения других периферийных устройств в соответствии с текущей транспортной ситуацией на отдельном пересечении или в районе координации в целом.

На стратегическом уровне через небольшие промежутки времени корректируются длительность светофорного цикла управления, длительность зелёных сигналов, последовательность фаз, временной сдвиг. Коррекция производится на основе данных о параметрах транспортных потоков, собираемых периферийным оборудованием в реальном времени. На тактическом уровне каждые 60-90 секунд определяется изменение последовательности фаз, например, для предоставления приоритета общественному транспорту. Локальный уровень каждую секунду регулирует длительность зелёного сигнала на каждом перекрёстке, реагируя на отдельные транспортные средства.

Набор ПК района координации может не использовать тактический и локальный уровни. Система управления реализует заранее заданный набор ПК для всех районов регулирования, периодически корректируемый с учётом статистических данных. В этом случае говорят о жёстком регулировании. Кроме программ координированного управления, в АСУДД при необходимости реализуется ряд специальных прикладных алгоритмов. К таким алгоритмам относятся включение временных участков зелёной улицы для проезда спецтранспорта, обнаружение ликвидация заторовых ситуаций, а также дистанционное диспетчерское и местное ручное управление светофорной сигнализацией.

Все методы регулирования дорожного движения могут учитывать или не учитывать текущее изменение транспортного потока, а также применяться для отдельных пересечений или их групп.

На локальном уровне

Перекрестки, удаленные на расстояние более 1 км друг от друга, считаются изолированными по транспортному потоку. Их называют локальными, они могут регулироваться независимо. Алгоритмы управления такими перекрёстками можно разделить на два класса. В  обоих классах управление сигналами светофоров производится в соответствии с критерием минимума суммарных задержек ТС на перекрестке.

Первый класс называют локальными жёсткими алгоритмами. Он основан на методах определения управляющих параметров регулирования: длительности светофорного цикла и распределения фаз в пределах цикла на основе средних характеристик транспортного потока.

Второй класс, называемый локальными адаптивными алгоритмами, основан на методах переключения сигналов светофоров с учётом поведения транспортного потока в реальном времени. Этот класс включает в себя несколько алгоритмов.

Управление на основе интервалов между прибывающими ТС или алгоритм поиска разрыва в транспортном потоке используется с 1930-х годов. Его обычно применяют при средней и низкой интенсивности движения. Длительность каждого сигнала светофора корректируется в зависимости от плотности потока с учётом ограничений минимального и максимального времени сигнала. Если по истечении времени действия зелёного сигнала детектор регистрирует ещё одно ТС, прибывшее к перекрёстку, то время работы сигнала увеличивается на некоторый интервал. При этом значение периода не может превысить максимальную величину. Если за время очередного увеличения зеленого сигнала ни одного транспортного средства зарегистрировано не будет, то зелёный сигнал сменяется на красный. Добавочный интервал определяется временем, которое требуется транспортному средству, после его регистрации детектором, на преодоление расстояния от детектора до стоп-линии и последующего безопасного проезда перекрестка.

В алгоритме управления на основе длины очереди ТС изменение длительности разрешающего сигнала происходит с учётом минимизации длины очереди, скопившейся за время предыдущего цикла регулирования. В этом алгоритме длительность цикла поддерживается относительно малой, увеличение разрешается только при увеличении интенсивности движения.

При использовании управления на основе длины очереди и потока насыщения алгоритм пропускает только транспортные средства, которые накопились за время действия красного сигнала светофора. Реализуется на основе информации о потоке насыщения на каждом подходе к перекрестку. Поток насыщения является показателем, зависящим от многих факторов: ширины проезжей части (полосы движения), продольного уклона на подходах к перекрестку, состояния дорожного покрытия, видимости перекрестка водителем, наличия в зоне перекрестка пешеходов и стоящих автомобилей.

Сетевые методы управления применяются для смежных перекрестков, которые связаны в единую сеть, расстояния между которыми менее 1 км. Для вычисления параметров регулирования необходимы данные о транспортной ситуации на всех перекрестках, входящих в сеть. Параметры вычисляются в центральном УП, обычно это длительности циклов регулирования и сдвиги начала циклов на смежных перекрестках.

Сетевое жесткое управление обеспечивает координацию работы светофоров в некотором районе управления. Одними из самых популярных в мире продуктов для расчёта ПК на сети пересечений являются программные пакеты Лаборатории Транспортных и Дорожных Исследований (TRRL, Transport and Road Research Laboratory) Великобритании. Они используются более чем в 110 странах для разработки ПК и моделирования. Наиболее известным является программный комплекс Transyt. Система Transyt определяет оптимальный план координации сигналов всех светофоров для сети пересечений в целом. Расчёт может производиться для разных видов пересечений: регулируемых, нерегулируемых, с круговым движением и пересечений на автомагистралях.

В основе жёстких алгоритмов управления лежит предположение о повторяемости транспортных ситуаций в одни и те же часы суток или дней недели. В случае высокой амплитуды значений интенсивности транспортного потока они могут не справиться с ситуацией. Это то, что приведет к лавинообразному росту очереди и возможному блокированию смежных перекрестков. В таких случаях наиболее эффективно применение адаптивных методов управления. Следует отметить, что опыт разработки отечественных сетевых адаптивных методов управления невелик по сравнению с зарубежным. Поэтому в российских АСУДД обычно реализуют или один из вариантов сетевых адаптивных алгоритмов, описанных выше, или один из зарубежных алгоритмов.

Сравнение алгоритмов

Наиболее распространённой системой (и алгоритмом) управления является SCOOT (Split, Cycle and Offset Optimization Technique), разработанный TRRL совместно с Simens и Peek Traffic. Он представляет собой централизованную адаптивную систему управления транспортным потоками. Она имеет более 250 реализаций по всему миру.

Система, использующая алгоритм SCOOT, делит зону управления на районы. Границы районов расположены вдоль длинных или слабо загруженных дорог. Внутри каждого района обеспечивается сетевая координация работы светофоров. Работа системы существенно зависит от данных по транспортному потоку, получаемых от детекторов транспорта. Система требует большого количества детекторов транспорта, расположенных обычно на выходе со смежного перекрестка, а также непосредственно перед стоп-линией.

Процесс оптимизации параметров регулирования в SCOOT включает в себя три уровня, каждый из которых соответствует оптимизации одного типа параметров: цикл (Cycle), доля фазы (Split) и смещение (Offset).

Цикл регулирования – это продолжительность полного переключения по порядку всех фаз светофора. Под долей фазы понимают соотношение времени, выделяемого на каждую фазу, долю от продолжительности цикла. Смещение определяется как время начала цикла конкретного светофора от заданного для всей системы момента времени. Этот параметр позволяет согласовать циклы разных перекрестков между собой.

На первом уровне для каждого района выполняется оптимизация цикла регулирования, для которого определяются базовые длительности фаз на каждом перекрестке.

Для принятия решения об изменении длины цикла SCOOT вычисляет так называемую степень насыщения всех фаз светофора. Этот показатель представлен как процент используемого зеленого сигнала. Алгоритм оценивает, сколько еще ТС успели бы проехать перекресток в промежутках между автомобилями, которые фиксирует детектор транспорта. Задача SCOOT в том, чтобы для самой загруженной фазы степень насыщения составляла бы не более 90 процентов.

Помимо этого, один раз в течение цикла программа рассчитывает коэффициент эффективности по сумме вынужденных остановок и времени ожидания автомобилей. В зависимости от значения коэффициента SCOOT на втором уровне производит оптимизацию долей фазы между перекрёстками района регулирования. Она выполняется один раз в цикл. В каждом цикле существует возможность изменения сдвига не более чем на 4 секунды.

На третьем уровне дорожные контроллеры на пересечениях уточняют время переключения фаз и принимается решение об увеличении или уменьшении фазы на величину, не превышающую 4 сек. Эта процедура выполняется перед каждым переключением фаз и основывается на краткосрочном прогнозе транспортной ситуации на перекрестке.

Критерием оптимальности при выборе управляющих параметров, как и в Transyt, является взвешенная сумма задержек и остановок транспортных средств.

Техническая реализация SCOOT предусматривает централизованное управление и не предъявляет высоких требований к локальным контроллерам. Применяемые в настоящее время модификации SCOOT обеспечивают приоритетный пропуск общественного транспорта.

Система координированного управления движением Сиднея (SCATS, Sydney Coordinated Adaptive Traffic System) – основной̆ конкурент SCOOT и используется в АСУДД более 150 городов. Алгоритм и система были разработаны управлением дорог и дорожного движения (Road and Traffic Authority, RTA) штата Новый Южный Уэльс в Австралии. Его работа и критерии эффективности основаны на методах определения потока насыщения и задержек ТС, аналогичных применяемых в SCOOT.

Алгоритм SCATS состоит из трёх уровней управления: центральный (стратегический), региональный (тактический) и локальный. Для каждого перекрестка компьютер центрального уровня распределяет вычисления между компьютерами региональных центров управления и дорожными контроллерами.

Система адаптирует программы переключения светофорных сигналов в реальном времени в зависимости от изменений транспортного потока и пропускной способности дорожной сети. Она принимает решение на основе информации от транспортных детекторов, расположенных на каждой полосе непосредственно перед стоп-линией у перекрестков. В отличие от SCOOT, контроллеры на пересечениях могут самостоятельно менять только длину цикла, а расписания фаз и смещений после каждого цикла выбираются из стандартного набора на региональном уровне.

Система прогнозного управления (RHODES, Real-time Hierarchical Optimizing Distributed Effective System), распределенная эффективная система для оптимизации в реальном времени, разработана в университете Аризоны (The University of Arizona, USA). Она используется в некоторых городах в США.

Система RHODES оценивает дорожную обстановку на нескольких уровнях: перекресток, дорожная сеть, распространенные маршруты и рассчитывает циклы для светофоров. Решения принимаются с учётом детекторов транспорта и накопленной истории движения на контролируемых пересечениях. На основе этих данных система составляет прогноз развития дорожной ситуации. Ключевую роль в прогнозе играет алгоритм оценки вероятности поворота автомобиля на каждом конкретном перекрестке. Это позволяет вычислять возможную загрузку соседних перекрестков. В качестве отправной точки RHODES использует историческое распределение вероятностей поворота, после чего уточняет это распределение данными, полученными за последние пять минут.

Распределенная система управления дорожным движением на перекрестке в реальном времени OPAC (Optimized Policies for Adaptive Control). Эта система была разработана в университете Массачусетса при поддержке Министерства транспорта США в начале 1980-х.

Эта система отличается от традиционного метода управлением длительностью фаз и не использует понятие цикла. Используемый алгоритм управления сигналами светофора включает в себя последовательность решений по переключению в фиксированные интервалы времени. Решение о том, продлить или прекратить текущую фазу, принимается в каждый отдельный момент. Для этого используется понятие горизонта. Это временной отрезок в 60 секунд, при этом первые десять называются головной частью, остаток – хвостовой. В головной период от детекторов транспорта в центр управления поступает информация о параметрах транспортного потока, а для хвостовой части горизонта эти параметры прогнозируются. Затем с использованием этих данных рассчитываются параметры светофорного регулирования.

Гибридная система управления дорожным движением UTOPIA (Urban Traffic Optimization by Integrated Automation) разработана в Италии. Структура включает в себя локальный и сетевой уровни. Сетевой дорожны контроллер генерирует базовый ПК, а подключённые к нему локальные контроллеры адаптируют его под свои пересечения. Данные о транспортном потоке, собираемые ДТ, передаются ДК соседних пересечений для прогнозирования трафика. Также эти данные обрабатываются сетевым ДК централизованно для обновления базового ПК.

Одной из наиболее эффективных зарубежных систем АСУДД (Urban Traffic Control systems, UTC) является MOTION (Method for the Optimization of Traffic Signals In Online Controlled Networks). Для управления в условиях заторов она использует экспертную систему. На основании данных о параметрах потоков программный комплекс определяет параметры модели текущей транспортной ситуации. Затем, используя экспертную систему, ищет похожую ситуацию и соответствующую ей модель управления. В общей сложности MOTION может использовать до двенадцати заранее рассчитанных стратегий управления.

Система управления Время в пути, % Задержки TC, % Остановки TC, %
SCOOT 5 - 29 2-28 17-37
SCATS 0 - 20 3 - 19 5-24
ОРАС 10 - 26 - 0-55
UTOPI 0 - 15 0 - 50 -

Некоторые адаптивные алгоритмы также находят применение при разработке пакетов транспортного микромоделирования. В качестве средств реализации таких алгоритмов можно назвать, например, дополнительный модуль VAP/VisVAP к программе PTV Vision Vissim для моделирования программируемых фаз и этапов средств управления сигналами, а также LISA+, в котором можно планировать, анализировать, оптимизировать сигнальные контроллеры.

Прогресс в информационно-коммуникационных технологиях и распространение интернета вещей, а также автономных транспортных средств привели к значительному росту объема данных, которые могут быть использованы для эффективного управления светофорными системами. Использование алгоритмов обучения с подкреплением становится все более распространенным для адаптивного управления светофорами на основе собранной информации о дорожном движении от различных источников, таких как датчики, видеокамеры и подключенные транспортные средства.

Ранее нами были рассмотрены классические методы управления светофорами, такие как SOTL и MaxPressure, основанные на детерминированных моделях. Посмотрим на адаптивный метод управления, использующий детерминированную прогнозную модель для определения оптимальной фазы светофорного цикла, учитывая максимальный прогнозируемый поток транспорта. В последние десятилетия все больше внимания уделяется разработке адаптивных методов управления на основе методов машинного обучения и, в частности, на основе обучения с подкреплением.

Однако эти подходы могут быть нестабильными в сложных сценариях с большим объемом зашумленных данных и слишком зависимых от гиперпараметров. Кроме того, исследования этих алгоритмов часто ограничены синтетическими модельными сценариями с перекрестками стандартной структуры или ограниченным числом перекрестков в реальных сценариях.

В рамках раскрытия этой темы и проведения ключевого анализа будем опираться на исследования А.А. Агафонова, проводившего сравнение алгоритмов управления сигналами светофоров в крупномасштабном сценарии моделирования движения транспортных средств в системе моделирования SUMO.

Используемые для сравнения детермированные методы управления, которые опираются на заранее заданные правила для определения следующей фазы светофорного цикла:

  • Метод SOTL оценивает запросы на зеленый свет от текущей фазы и других конкурирующих фаз, затем принимает решение о сохранении или изменении текущей фазы, основываясь, например, на непрерывном потоке транспортных средств.
  • MaxPressure стремится сбалансировать длину очередей между соседними перекрестками, минимизируя «давление» фаз на перекресток.
  • MaxFlow основывается на выборе фазы светофорного цикла, для которой прогнозируемый поток транспорта максимален.

Методы на основе обучения с подкреплением

Для решения задачи управления светофорами с использованием методов обучения с подкреплением вводятся следующие обозначения: S – множество состояний объекта, A – множество возможных действий. Задача состоит в построении отображения, которое определяет оптимальное действие для каждого состояния. Для этого обычно применяется подход на основе марковского процесса принятия решений , где P определяет вероятности переходов между состояниями, R – величину награды, γ - коэффициент дисконтирования. Задача обучения с подкреплением заключается в нахождении оптимальной политики, которая максимизирует награду R.

В качестве алгоритмов на основе обучения с подкреплением рассматриваются:

  • IDQN – алгоритм на основе Q-обучения, где каждый агент контролирует отдельный светофор и обучается независимо;
  • IPPO – алгоритм на основе оптимизации политики.

Экспериментальные исследования разработанных алгоритмов были проведены с использованием системы моделирования движения транспортных средств SUMO. Для этой цели был создан сценарий моделирования, основанный на известном сценарии движения SUMO под названием TAPAS Cologne. В созданном сценарии содержится 2928 перекрестков различной конфигурации, включая 316 сигнализированных перекрестков, и 5808 сегментов. Исследование движения транспортных средств проводилось в утренний час пик в период с 6 до 8 утра. Дорожная сеть сценария моделирования на рисунке.

Сравнение алгоритмов проводилось по двум ключевым метрикам: среднему времени ожидания и среднему времени движения. Среднее время ожидания (измеряемое в секундах) указывает на среднее время, в течение которого транспортные средства простаивали на перекрестках, а среднее время движения (также измеряемое в секундах) отражает среднее время, затраченное транспортными средствами на проезд по сети. Результаты сравнения алгоритмов рассмотрим в таблице о сравнении эффективности управления транспортными потоками.

Резюме

В работе было проведено сравнение адаптивных детерминированных алгоритмов и алгоритмов на основе обучения с подкреплением для решения задачи управления сигналами светофоров. Для этого был создан крупномасштабный сценарий моделирования движения транспортных средств. Результаты экспериментов показали, что алгоритм IDQN, основанный на обучении с подкреплением и обучаемый независимо для каждого агента, превзошел остальные алгоритмы. Однако было отмечено, что данный подход не является масштабируемым, что подчеркивает необходимость разработки новых подходов к управлению для решения данной проблемы.

Хотя алгоритм IDQN показал высокую эффективность в решении задачи управления сигналами светофоров, его неспособность масштабироваться ограничивает его применимость в реальных условиях с большим количеством перекрестков и плотным транспортным потоком. Это может быть связано с большим количеством параметров, требующихся для обучения каждого агента в отдельности, что приводит к высоким вычислительным затратам.

В свете этого возникает необходимость в разработке новых подходов к управлению, которые будут обладать не только высокой эффективностью, но и масштабируемостью. Возможно, стоит рассмотреть алгоритмы, способные учитывать взаимодействие между различными перекрестками и принимать глобальные решения для оптимизации потока транспорта на всей сети дорог.

Кроме того, важно учитывать разнообразие дорожных условий и особенностей транспортного потока в различных городах и регионах. Адаптивные алгоритмы управления светофорами должны быть способны адаптироваться к различным сценариям и изменяющимся условиям дорожного движения.

Таким образом, развитие эффективных и масштабируемых методов управления светофорами остается актуальной задачей, требующей дальнейших исследований и инноваций.

Тем не менее, развитие и применение моделей глубокого обучения с подкреплением в области управления светофорами представляет собой инновационный и перспективный подход, который может принести значительные выгоды для городской транспортной инфраструктуры.

Традиционные статические решения, основанные на таймерах, могут быть недостаточно эффективными в условиях динамически меняющегося транспортного потока. В таких случаях адаптивные системы, способные реагировать на текущую ситуацию в реальном времени, могут значительно улучшить эффективность управления светофорами и сократить временные задержки на перекрестках.

Модели глубокого обучения с подкреплением предоставляют мощный инструмент для обучения систем управления светофорами на основе реальных данных о дорожном движении. Эти модели способны адаптироваться к сложным и динамическим условиям дорожного движения, что делает их идеальным кандидатом для реализации адаптивных систем управления светофорами.

Использование моделей глубокого обучения с подкреплением может значительно повысить эффективность управления светофорами в городах, сократить временные задержки и улучшить общую проходимость дорожного движения. Поэтому исследование и разработка таких систем представляет собой важное направление в современной городской инженерии и транспортном планировании.

Среднее время движения Среднее время ожидания
IDQN 319,21 19,54
IPPO 371,32 67,28
SOTL 361,14 44,04
MaxPressere 334,8 28,59
MaxFlow 327,69 23,68

Фото: пресс-служба ФГУП «ЗащитаИнфоТранс»

Возврат к списку

Чтобы оставить комментарий - авторизуйтесь через