С начала 2021 г. ГК ВТБ Лизинг формирует политику управления данными как ценным активом. В ближайшее время компания планирует усилить контроль за их качеством и привлекать на работу специалистов, готовых развивать новое стратегически важное направление Data Governance. Cnews решил разобраться, с чего всё началось и что уже для этого сделано в лизинговой компании, и поговорил с Константином Есюниным, главным архитектором ВТБ Лизинг.
Откуда возникла необходимость управления данными?
За многие годы в компании несколько раз менялись подходы к развитию информационных систем, как правило, в связи с автоматизацией отдельных блоков бизнес-процессов в самостоятельном монолитном решении. С течением времени появилось то, что сейчас принято называть «зоопарком» систем. Все они внедрялись в разное время, разными командами, с различными подходами к автоматизации, соответствующими архитектурным возможностям внедряемых платформ.
Как следствие — в разных системах, которых на текущий момент в компании насчитывается более 60, к одному и тому же домену данных могут применяться разные правила и форматы.
«Все это порождает огромные сложности при формировании операционных и аналитических отчетов, когда нужно свести воедино большое количество информации из разных источников. А возможно ли сформировать ежеквартальный отчет быстрее, чем за две недели ручного труда? Да еще и без погрешностей, вызванных человеческим фактором? Ответ — да. Но для этого нужно вначале навести порядок в управлении данными», — рассказывает Константин Есюнин.
В компании планируют создать создать озеро «сырых» данных — единое место, где будут собраны сведения из всех информационных систем
Что показал аудит
В начале 2020 года банк ВТБ провел аудит качества данных во всех дочерних организациях группы. Он показал, что в ВТБ Лизинг обеспечен достаточный контроль за качеством важных данных, но культура работы с данными требует развития. Основными зонами роста оказались:
- Одни и те же данные рождались в разных системах и при переходе в нормативно-справочную систему затирали друг друга.
- В некоторых системах отсутствовали маски ввода бизнес-критичных данных и проверки их качества.
- Мониторинг интеграционных процессов был недостаточно эффективен.
- Практически полностью отсутствовал контроль заведения необязательных атрибутов данных пользователями.
В результате аудита стало понятно, какие меры необходимо принять для повышения уровня качества данных, а также культуры работы с ними.
В 2021 году в компании появился комитет по управлению данными (КУД), главной задачей которого стало развитие направления Data Governance. Для формирования культуры управления данными, основанной на понимании их стратегической ценности, в состав комитета были включены руководители всех подразделений компании.
Первое заседание КУД состоится в ближайшее время. На нем будет утверждена дорожная карта развития политики управления данными в компании и определены критически важные домены данных, работа с которыми должна начаться в первую очередь.
Как организован процесс управления данными
Построение процесса Data Governance начинается с назначения ответственных за введение данных в информационные системы и контроль их качества. Такими ответственными являются «владельцы» и «офицеры» данных. Владельцы данных, роль которых выполняют руководители самостоятельных структурных подразделений, отвечают за организацию и контроль работы офицеров данных.
По словам Константина Есюнина, главного архитектора департамента информационных технологий ВТБ Лизинг, в компании существуют два подхода к назначению владельца данных (см. скриншот).
В компании существуют два подхода к назначению владельца данных
Первый подход заключается в том, что владельцем данных становится руководитель подразделения, в котором они создаются. Например, начальник отдела страхования отвечает за все сведения, имеющие отношение к страхованию транспортных средств — это справочники, коэффициенты страховых премий каско, ОСАГО, ДСАГО. Второй подход более простой. У каждой информационной системы в компании есть свой владелец-распорядитель, и он же становится владельцем рождающихся в ней данных. Например, владельцем CRM-системы является директор департамента продаж автолизинга, значит он может быть назначен владельцем домена данных, заводимых в CRM.
У каждого владельца данных есть помощники — офицеры данных, которые контролируют корректность ввода данных в информационные системы, согласовывают описания атрибутов, требования к качеству данных для последующего занесения в бизнес-глоссарий, организуют работы по исправлению ошибок, а также ставят задачи на доработки для системного повышения качества данных.
Направление Data Governance в ВТБ Лизинг возглавляет главный архитектор департамента информационных технологий. Помогает ему архитектор данных, он отвечает за структуру единого бизнес-глоссария, формирование стандартов ведения моделей данных, централизованное ведение реестра проверок качества и организацию процессов исправления ошибок.
Опыт внедрения Data Governance в крупных организациях показывает, что охватить все и сразу не получается. Поэтому в ВТБ Лизинг решили вначале запустить профилирование данных, наиболее критичных для бизнеса. Это идентификационные данные контрагентов и физических лиц (compliance), а также сведения для отчетов регуляторам и головной организации — банку ВТБ.
«Обеспечение качества всегда было приоритетом для ВТБ Лизинг. В рамках процедуры идентификации клиента мы работаем, как правило, со многими источниками данных, и в этом процессе фундаментальным является фокус на качество. Этот фактор также важен для того, чтобы исполнить регуляторные требования в области обслуживания клиентов, подготовки различных оценок и анализов, выполнения внутренних контрольных процедур или предоставления отчетности. То есть для целей реализации комплаенс-мер исходные данные должны быть корректными, полными, актуальными и доступными. Более того, качественные данные снижают операционную нагрузку на все задействованные в этом процессе подразделения», — прокомментировала начальник отдела комплаенс и финансового мониторинга ВТБ Лизинг Ирина Пономарева.
Стратегия развития корпоративных хранилищ данных
Параллельно в ВТБ Лизинг разрабатывается стратегия развития хранилищ данных (DWH). Имеющееся хранилище предназначено в основном для формирования финансовой отчетности и построено на базе технологий Oracle. Теперь перед компанией стоит более амбициозная цель — создать единое хранилище, агрегирующее в себе вычищенные данные не только из учетных, но также из фронт- и мидл-офисных систем. Все это делается для того, чтобы специалисты могли начать создавать прогнозные и скоринговые модели.
«Мы планируем всерьез заняться этим вопросом и создать озеро «сырых» данных — единое место, где будут собраны сведения из всех информационных систем, а также ретроспектива их изменения, — рассказывает Константин Есюнин. — Сейчас у нас два хранилища. Одно выполняет старые задачи формирования портфеля и построения BI финансовой отчетности, а второе — новое, со всеми необходимыми архитектурными костяками и надстройками: обработчиками, процессами и слоями. Именно его в дальнейшем мы хотим вырастить до Data Lake».
В настоящее время ВТБ Лизинг работает над созданием слоя «сырых» данных, то есть сведений, которые приходят из первоисточников. Пока они поступают из фронт-офисных систем, например, из CRM. В следующем году к ним добавятся маркетинговые данные из CallTouch, Федресурса и других источников — их обработка позволит формировать отчетность, вовремя корректировать продуктовую линейку и маркетинговые акции, строить прогнозные модели.
Кроме развития хранилищ данных, компания планирует внедрять и перепрофилировать MDM-системы (Master Data Management), в которых будут содержаться чистые выверенные данные.
Какой будет команда специалистов?
Формирование подразделения по управлению данными в ВТБ Лизинг только начинается. «В ближайшей перспективе нам потребуются специалисты, которым известны понятия Data Warehouse, большие данные, озеро данных, Data Science, архитектура управления данными, физическая и логическая модель данных, профилирование данных. Специалисты, обладающие знаниями в области T-SQL, PL SQL, Python, Postgres», — говорит Константин Есюнин.
Для модернизации хранилищ данных потребуются архитекторы и разработчики, имеющие опыт работы с Oracle, Postgres. Также необходимы специалисты по Data Science — люди, которые умеют работать с данными и создавать на их основе различные модели: строить отчеты, прогнозировать процессы, оценивать вероятность наступления различного рода событий, а в будущем заниматься развитием искусственного интеллекта. «В перспективе мы планируем развивать направление machine learning, которое по мере роста объемов данных научится автоматически перестраивать модели принятия управленческих решений. Например, прогнозные модели плана продаж, распределения по регионам разного рода составляющих, добавления в линейку новых продуктов», — говорит Константин Есюнин.
Компания начинает работу в направлении Data Governance практически «с нуля», а значит у сотрудников будет возможность сделать по-настоящему современное решение. «Перед нами стоит задача, которая признана одной из стратегически значимых для компании. У нее нет четкого временного срока, так как политика управления данными это не проект, который когда-нибудь закончится, а постоянный процесс, который будет расширяться, охватывая все больше и больше доменов данных и подразделений, и позволит нам постоянно повышать эффективность работы, ускорять бизнес-функции за счет повышения ценности используемых данных, повышать гибкость деятельности компании, а также в перспективе получить новые возможности в бизнесе», — говорит Константин Есюнин.
Полный текст статьи читайте на CNews