баннер Телеграм каналбаннер Телеграм канал

ИИ и большие данные: миф или реальность

Рейтинг 5
25902
Дмитрий Алексеевич Горшков
«СИЦ Минтранса России»

Тема интеграции искусственного интеллекта и больших данных в управление ключевыми процессами приобретает все большую популярность среди экспертов и масс-медиа. Однако общественный дискурс преимущественно ведется в теоретической плоскости.

О практической стороне применения больших данных и искусственного интеллекта в управлении на примере транспортной отрасли нам рассказал директор ФГБУ «СИЦ Минтранса России» Дмитрий Горшков.

— Дмитрий Алексеевич, когда читаешь некоторые статьи, новости про большие данные и искусственный интеллект, иногда складывается впечатление, что все это здорово, но не про сегодня. Есть ли в транспортной сфере сегодня конкретные технологии, которые дают конкретный практический результат?

Д.Г.: Вопрос на самом деле шире, чем просто практический результат.

Сегодня работа с большими данными транспортной отрасли это в первую очередь вопрос обеспечения национального логистического суверенитета нашего государства. Это основная технологическая задача, которая сейчас очень четко ставится перед всем транспортным комплексом на уровне руководства Российской Федерации.

Транспортная система Российской Федерации является одной из крупнейших в мире. Она включает в себя более 87 тыс. км железных дорог, более 745 тыс. км автомобильных дорог с твёрдым покрытием, свыше 600 тыс. км воздушных линий, порядка 115 тыс. км речных судоходных путей и множество морских трасс. В ней занято свыше 3,2 млн человек, что составляет 4,6 % работающего населения.

С нами могут сравниться только транспортные инфраструктуры США и Китая. Когда речь идет о таком масштабе, необходимость сбора и анализа больших данных становится насущной необходимостью. Без этого невозможно создать для пользователей транспортной системы — а это абсолютно все россияне, весь бизнес и плюс туристические потоки — условия для комфортного использования и дальнейшего развития.

Именно поэтому Министерство транспорта Российской Федерации уже достаточно давно озаботилось вопросом сбора больших данных по транспортной отрасли.

С 2007 года существует Автоматизированная система управления Транспортным комплексом, если сокращенно — АСУ ТК. На момент своего создания данная система была прогрессивной базой знаний данных. Все эти годы она активно пополнялась.

Сегодня система насчитывает более 10 тысяч активных пользователей, включая сотрудников Аналитического центра при Правительстве РФ, Минтранса России, подведомственных агентств и учреждений, сотрудников ОМСУ.

АСУ ТК содержит данные/характеристики более чем по 340 тыс. объектов транспортного комплекса, порядка 120 тыс. субъектов транспортного комплекса и порядка 185 тыс. транспортных средств. А также она содержит более 1500 различных показателей транспортного комплекса, взаимодействует с 28 системами Минтранса и подведов, РЖД, ТКП и др., собирает данные с 875 муниципальных образований по КСОДД.

Однако в текущих реалиях просто базы данных — даже самой обширной — недостаточно для качественного анализа, прогнозов и дальнейшего принятия управленческих решений. Назрел вопрос о трансформации подхода к АСУ ТК, о переводе системы из разряда базы знаний в разряд библиотеки больших данных.

— В чем принципиальная разница? В масштабе? Регулярности пополнения? Или в чем-то ещё?

Д.Г.: Снова вопрос гораздо шире. Безусловно, есть разница в масштабе. Например, база АСУ ТК в штатной эксплуатации оперировала тысячами строк. АСУ ТК как библиотека больших данных еще на уровне моделирования и тестовой отработки формул оперирует миллионами строк.

Есть разница и в оперативности. Например, транспортно-экономический баланс (ТЭБ) считался один раз в год. По каким-то параметрам отчеты формировались не чаще, чем раз в месяц. Сейчас мы выводим АСУ ТК не просто на еженедельный и ежедневный уровень. По некоторым параметрам мы говорим о ежечасовом, фактически интерактивном мониторинге.

Но принципиальная разница между базой знаний и библиотекой больших данных — в подходе формирования. То есть в том, по каким правилам мы отбираем данные и какие мы берем данные.

Изначально в АСУ ТК собирались данные под конкретные задачи, для определенных отраслевых специалистов. Например, нужны данные о том, какие номера на вагонах, — у нас существует система номерного счета вагонов и др. На момент создания системы это было абсолютно правильно. Так как существовали технологические ограничения. Ведь данные не должны лежать, они должны работать.

Сейчас появилось понимание, как большие данные реализовать для принципиально иного уровня владения информации по транспортной системе нашего государства.

Нам не нужны абсолютно все данные. Например, данные по тому, сколько шин тратит большегруз, пока едет из Москвы в Хабаровск. Но важно понимать, что он везет, сколько и с какой скоростью ехал, где он стоял в пробках, пошел ли обратно пустой или с грузом. Мы вырабатываем общий подход к сбору данных таким образом, чтобы потом их использовать под решение самых разных задач. В том числе — для экстраполяции характеристик и выводов с одного субъекта РФ или сегмента транспортной отрасли на другой. Благодаря этому- мы можем строить гипотезы и прогнозировать развитие транспортной ситуации при сопоставимых условиях.

И ещё один важный момент формирования правил отбора данных, который мы сейчас закладываем в АСУ ТК: должна быть возможность совместного использования этих данных для проведения корреляции, сравнений и «вытаскивания» из них аналитики более глубокого порядка.

Вообще разницу между просто базой данных и библиотекой больших данных можно пояснить на примере. Когда мы в школе разбираем решение задачки: из пункта А в пункт Б едет машина, разворачивается и едет обратно — мы понимаем, что делаем большое количество условных допусков. Например, допускаем, что машина делает свой разворот мгновенно. В жизни это не так. Значит ли, что нам не надо уметь решать такие задачки с допусками? Конечно, нет. Решение задачки все равно даст нам представление о затраченном времени. Но оно будет условным, не полным. Вот база данных — это решение задач с допусками. А библиотека больших данных — это когда решение задачи учитывает не просто разворот, но изменение скорости машины на каждом участке движения по параболе.

— Вернёмся к практике. Как Вы реализуете переход от базы данных к библиотеке больших данных?

Д.Г.: Сегодня основная технологическая задача по практическому формированию и применению больших данных для управления транспортной отраслью решается по 3 ключевым направлениям:
1. Люди и программное обеспечение — человек плюс искусственный интеллект.
2. Сбор данных.
3. Нормативно-правовая база.

Почему мы ставим человека и искусственный интеллект в одной связке? Да потому что возможности технологий искусственного интеллекта сейчас обширны, но не универсальны.
Во-первых, искусственный интеллект требует проверки и верификации. В целом, работа с данными всегда подразумевает двойные, а то и тройные проверки. Мы для этого всегда привлекаем отраслевых экспертов. Во-вторых, искусственный интеллект требует постановки задачи со стороны человека, поскольку существуют множество разных систем ИИ, а для решения задач транспортной отрасли необходимы четкость, правильность постановки вопроса для статистики, анализа, прогнозов и принятия решений.

СИЦ Минтранса России начал с того, что набрал целый отдел квалифицированных аналитиков по каждому виду транспорта. Они, совместно с программистами, выработали единые цели, алгоритмы задач для интеграции искусственного интеллекта и больших данных.
Наша команда программистов и команда аналитиков создают, формируют модели, которые нужны будут искусственному интеллекту для работы и анализа больших данных. Мы же понимаем, что человеческих ресурсов не хватает и хватить не может, когда говорим про масштаб работы.

Искусственный интеллект в данном случае принципиально важен, и он не может существовать без человеческого интеллекта.

Второе направление, по которому мы сейчас ведем работы в рамках модернизации АСУ ТК, это сбор больших данных. Звучит просто — собрать данные. Но это очень непростая задача, во-первых, потому что транспортный комплекс РФ входит в топ-3 крупнейших в мире. Во-вторых, потому, что мы наблюдаем крайнюю фрагментацию данных. Например, самый крупный производитель сыров владеет менее чем 5% рынка. Следовательно, для того чтобы сформировать понимание по транспортировке сыров нужно просмотреть порядка 1000 разных производителей, каждый из которых куда-то перевозит или везет свой продукт. В целом отмечу, что по большинству направлений у нас высокая степень фрагментации по сбору данных.

И, наконец, третье направление — это нормативно-правовая база. Залог эффективности больших данных и управление на их основе заключается в оперативности. Для того чтобы апеллировать еженедельными, ежедневными, ежечасными данными, необходимо иметь определенные параметры. В данном случае только нормативно-правовое регулирование является важным фактором для оперативного сбора больших данных по единому формату.
В дальнейшем мы видим систему АСУ ТК единым технологическим решением для грамотного сбора, хранения и обмена большими данными всего транспортного комплекса. Это будет одна из глобальных передовых систем в государстве.

Мир продолжает ускоряться, а вместе с ним — и требования отрасли к скорости принятия решений.

— Подключены ли к АСУ ТК новые регионы: Донецкая Народная Республика (ДНР), Луганская Народная Республика (ЛНР), Запорожская и Херсонская области?

Д.Г.: Пока не подключены, но мы с коллегами работаем над этим. Конечно, в перспективе эти регионы, как и другие субъекты Российской Федерации, будут интегрированы в АСУ ТК.

— Дмитрий Алексеевич, любая система может подвергаться кибератакам. Большие данные транспортной отрасли — очень заманчивая цель для кибертеррористов. СИЦ Минтранса России активно развивает направление информационной безопасности. Расскажите, какие изменения в данной области произошли за последние 3 года? Какое количество кибератак было зафиксировано на государственные учреждения за последние 3 года?

Д.Г.: Количество кибератак на государственные учреждения неуклонно растет. Рост количества кибератак за первый квартал в 2023 году составляет
65 % по сравнению с первым кварталом 2022 года. Растет и сложность атак: обычные DDoS-атаки дополняются направленными атаками с внедрением и закреплением хакеров в сети организаций, где они могут находиться месяцами.

— На что в основном направлены кибератаки? Какие существуют сейчас угрозы? Как СИЦ Минтранса России контролирует угрозы и борется с ними?

Д.Г.: Атаки на организации направлены в основном на кражу конфиденциальных данных (51 %) и нарушение основной деятельности (44 %).

Сфера кибербезопасности сегодня характеризуется изменением логики, целей и задач кибертеррористов. И это влечет изменение системы и подходов к системе безопасности.
Раньше киберпреступники действовали в основном разрозненно и самостоятельно. А их целью было получение прибыли с жертв. Злоумышленники расставляли сеть и находили тех, у кого есть слабина, работали с теми, у кого проблемы в информационной безопасности. Есть абсолютно понятный сценарий, который был всегда. Он очень сильно развился в период пандемии, при переходе на удаленную работу. В этот период появилось множество уязвимостей.

Сегодня у кибертеррористов появился заказчик, финансирующий их деятельность. Оставим за скобками тему «кому выгодно». Просто проконстатируем этот факт. Теперь киберпреступники получают деньги не от жертв, а от заказчика, работая над его целью — навредить работе учреждения, нанести урон и в идеале — уничтожить.

Смена логики преступления естественным образом влечет смену логики защиты. Для того, чтобы сделать нашу киберзащиту действительно эффективной, мы сначала выявили и описали так называемые «недопустимые события» — т.е. то, что не должно произойти, что необходимо защищать в первую очередь. И свою защиту концентрируем именно на противостоянии недопустимых событий. Такая тактика: теперь не все, что можем, защищаем, а в каждом учреждении определяются недопустимые события, которые нужно будет защищать.

Для контроля цифровой устойчивости СИЦ Минтранс России создал Центр мониторинга ИБ на базе комплекса отечественных решений. Центр мониторинга ИБ позволяет своевременно выявлять нарушителя в контролируемой инфраструктуре — будь то злоумышленник (или хакер) или вредоносное программное обеспечение — и автоматизировано среагировать на компьютерный инцидент, блокируя вредоносные действия и нарушителей.

— В чем отечественные ПО превосходят западные? Используется ли российское ПО ещё в других странах, кроме России?

Д.Г.: Что касается отечественных производителей программного обеспечения в области кибербез-опасности, важно подчеркнуть, что на мировом рынке, безусловно, есть российские компании, которые превосходят западные в части SIEM-систем — систем мониторинга событий информационной безопасности.

Наше отечественное ПО активно используются в Китае, в странах СНГ. Российские компании активно работают и развивают отечественную продукцию, в перспективе, думаю, что спрос на разработку продуктов, направленныч на защиту от кибеартак, будет намного больше.

— Как давно начался процесс импортозамещения программного обеспечения в кибербезопасности?

Д.Г.: Процесс импортозамещения ПО в области кибербезопасности запущен еще в 2014 году. На сегодняшний день разработчики информационных систем попали в тренд импортозамещения. Если раньше ими не достаточно интересовались, то сейчас, например, до конца 2024 года операторам объектов информатизации критической инфраструктуры нужно будет перейти на импортозамещеные продукты.

— Дмитрий Алексеевич, ведь под киберугрозой находятся не только федеральные учреждения, но и региональные. И, если, например, Казань в состоянии позаботиться о себе, то ряд регионов не имеют необходимых компетенций.

Д.Г.: Сейчас действительно очень остро стоит проблема обеспечения информационной безопасности в регионах. На данный момент СИЦ Минтранса России разрабатывает проект формирования центров компетенций по информационной безопасности, которые обеспечат разработку проектов отраслевых стандартов и методических рекомендаций по защите информации в информационных системах транспортно-логистической сферы. Центры смогут оказать методическую и практическую помощь участникам системы обеспечения информационной безопасности в транспортно-логистической сфере по вопросам защиты информации. А также центры компетенций смогут организовать и контролировать качество подготовки кадров по информационной безопасности для транспортно-логистической сферы.

— Помимо развития технологий кибербезопасности на транспорте, какие еще тренды транспортной инфраструктуры будут развиваться в ближайшем будущем?

Д.Г.: Во-первых, это развитие беспилотного транспорта. Социальный и экономический эффект внедрения беспилотного транспорта бесспорен. Ведь, к сожалению, 96 % ДТП происходит по вине человека.

Во-вторых, это, безусловно, развитие ИТС и системы цифровых двойников автотрасс. Минтранс России уже работает над созданием цифрового двойника трассы М-11. «СИЦ Минтранса России» в данном проекте осуществляет экспертное сопровождение.

Цифровой двойник трассы М-11 — уникальный проект для нашей страны, т.к. создается настоящая цифровая карта, благодаря которой беспилотник поедет не вслепую, а с полноценной интеграцией с автоматизированной системой управления дорогой. Будет обеспечена интеграция и онлайн-обмен сообщениями о состоянии проезжей части, инцидентах и аварийных ситуациях (ДТП, пешеход на проезжей части и иные).

— Возвращаясь к вопросу больших данных транспортной отрасли — абсолютно все тренды, которые вы выделили — и кибербезопасность, и беспилотный транспорт, и развитие ИТС — логично ведут к увеличению масштабов больших данных транспортной отрасли. Будут ли готовы технологии ИИ к обработке таких масштабных массивов?

Д.Г.: Как говорится в легендарном фильме «Москва слезам не верит», если трех научишься организовать — дальше число уже не имеет значения. Тот подход к сбору и анализу данных, который мы сейчас вырабатываем в СИЦ Минтранса России в рамках АСУ ТК, позволяет оперировать как миллионами, так и триллионами данных.

Развитие цифровых технологий транспорта происходит неоднородно. Но большая часть технологий достигнет высокого уровня зрелости уже в течение 5 лет.

В целом технологическая революция в транспортной сфере еще набирает обороты, и мы с вами сегодня закладываем ее основу на десятки лет вперед.

Фото: Интеллектуальные транспортные системы России / пресс-служба ФГБУ «СИЦ Минтранса России» / www.freepik.com

Возврат к списку

Чтобы оставить комментарий - авторизуйтесь через