Машинное обучение
Ключевую роль для оценки загруженности выполняет заранее обученный сложный математический алгоритм. Он умеет собирать и анализировать все ключевые факторы, а после выдает категорию загруженности каждого вагона в конкретном поезде: низкая, средняя, выше средней или высокая.
Чтобы понять как работает алгоритм машинного обучения, надо разобрать два ключевых понятия: обучение с учителем и дерево принятия решений.
Обучение с учителем
Это один из способов машинного обучения. При таком сценарии «учитель» (им выступает живой человек или группа людей) указывает машине, какие данные считать эталонными. В качестве исходных данных рассматривали выгрузку с проходов на турникетах билетной системы.
В метро первый этап обучения с учителем занял примерно 4 месяца. За это время тестировщики «МаксимаТелеком» и сотрудники метро физически спускались в подземку и выполняли нехитрую операцию — считали людей в разных поездах и вагонах, в разное время, на разных ветках и станциях. Таким образом сформировался эталонный датасет, на который ориентируется алгоритм. Собранные в ходе обучения данные могут изменяться в зависимости от внешних факторов (сезона, погоды, пандемии), поэтому процедура подсчета периодически повторяется. Полученная выборка и статистика о подключениях к Wi-Fi легли в основу работы сервиса.
Дерево принятия решений
Это один из способов анализа и обработки больших массивов данных. Грубо говоря, система работает по принципу «Если…, то…». Такой способ хорошо подходит для категоризации информации. В случае с метро категории — это уровни загруженности вагонов.