Георгий Семянников: «С подавляющим большинством задач система справляется в автоматическом режиме»

В Сбербанке запущена система «Единый клиент Сбербанка» на базе IBM InfoSphere Master Data Management (MDM) Server с набором интеграционной логики и средствами первоначальной за¬грузки данных. Важную роль в реализации проекта сыграли специалисты компании «Аплана». На вопросы журнала «Банковские технологии» ответил Георгий Алексеевич Се¬мянников, начальник отдела систем управления клиентскими данными ЦК Развития CRM Техно¬логий Департамента развития аналитических решений и системных сервисов компании «Сбер¬банк-Технологии».

В Сбербанке запущена система «Единый клиент Сбербанка» на базе IBM InfoSphere Master Data Management (MDM) Server с набором интеграционной логики и средствами первоначальной загрузки данных. Важную роль в реализации проекта сыграли специалисты компании «Аплана». На вопросы журнала «Банковские технологии» ответил Георгий Алексеевич Семянников, начальник отдела систем управления клиентскими данными ЦК Развития CRM Технологий Департамента развития аналитических решений и системных сервисов компании «Сбербанк-Технологии».


«Банковские технологии»: Георгий Алексеевич, давайте нач­нем с истории. Насколько мы по­няли, проект по внедрению MDM-системы начался в 2010 г.?

Георгий Семянников: Да, в сен­тябре 2010 г. открылся проект по клиентам корпоративного блока, а розничное направление началось на год раньше. Я работаю в Сбертехе с октября 2011 г. на позиции начальни­ка отдела, до этого работал руководи­телем проекта по корпоративному направлению. И тогда, и сейчас я ку­рирую MDM-системы. Изначально мы занимались и клиентскими MDM-системами, и другими темами, напри­мер, продуктовыми справочниками, но сейчас локализовались на клиент­ских MDM-системах, клиентских ре­шениях.

Проект начинался с «пилота», в процессе которого были усовершен­ствованы алгоритмы обработки, стан­дартизации и восстановления дан­ных, разработан процесс контроля качества данных и ручной выверки данных, не подлежащих автоматичес­кой обработке. Обрабатывая эту базу, мы поняли реальные объемы и каче­ство тех данных, с которыми придет­ся работать.

На сегодняшний день система пе­редана в промышленную эксплуата­цию, мы собрали 100% информации по физлицам, а это больше 110 млн записей, почти все трудоспособное население России! По юридическим лицам собрано и обработано около 95% информации.

«Б.Т.»: Какие преимущества дает внедрение такого класса си­стем?

Г. С.: MDM — это система, которая позволяет построить единый про­филь клиента для того, чтобы мы его могли использовать во фронтовых или в бэк-офисных системах или в ка­честве основы для проведения марке­тинговых кампаний, а также для фор­мирования отчетности.

Сбербанк, крупнейший банк Рос­сии, обладает большим количеством источников данных в виде различ­ных бэк-офисных и фронт-офисных систем, в каждой из которых ведется какая-то работа с клиентами. В одной системе сотрудник банка вводит ин­формацию по клиентам Дальневос­точного банка, касающуюся их депо­зитов. В другой системе вводится и обрабатывается информация по кре­дитам. В третьей системе — по цен­ным бумагам. В четвертой системе отслеживаются какие-либо сделки на инвестиционном рынке. И вся эта информация собирается в хранили­ще данных для построения правиль­ной управленческой отчетности. Клиент, физическое или юридичес­кое лицо, может быть уникальным или многоликим в каждой из этих си­стем. И чтобы понять, с кем мы рабо­таем, чтобы понять, что один и тот же клиент обладает счетом, кредитом и такими-то продуктами, нужно эту ин­формацию о клиенте собрать и сопоставить.

Только после этого мы смо­жем понять, что это Иванов Иван Иванович, или ООО «Ромашка», или крупнейший российский энергети­ческий холдинг, включающий мно­жество юридических лиц, которые входят в этот холдинг. Или, скажем, многофилиальная транспортная компания. Чтобы понять, что все фи­лиалы к ней относятся, и, наоборот, разделить эти филиалы между собой и понять, что это не одна головная компания, нужно решить множество задач. Возможно, данные в различные системы вводились в разные перио­ды времени, в разных системах и раз­ными людьми. В некоторых системах на каждый кредит открывалась новая карточка клиента. В других случаях сливались 2 территориальных банка. и клиенты «задваивались». К примеру. Московский банк собирался из 17 филиалов, и у нас наблюдалась картина, когда в кредитной системе было 17 одних и тех же клиентов. Это для банка было — да и сейчас остает­ся — проблемой. Ее и решает MDM-система.

«Б.Т.»: Как именно она ее реша­ет и какую информацию при этом использует?

Г. С.: Мы загружаем к себе ин­формацию из различных источни­ков и обрабатываем ее, Применяем алгоритмы стандартизации, норма­лизации данных. Например, возьмем адрес. Из одной строки разбираем его на город, улицу, дом, офис. Потом сравниваем это со справочником ад­ресов России. Соответственно вы­ставляем коды качества сравнения исходного адреса со справочником. Берем идентификационные атрибу­ты компании, если мы говорим о юридических лицах. Смотрим, верен ли ИНН, нужное ли количество раз­рядов, выполняется ли контрольная сумма.

Даже название компании бывает введено в разных местах по-разному. Где-то используется просто аббревиа­тура, где-то — название полностью, а где-то — с указанием формы собст­венности. Наша задача: выделить организационно-правовую форму, короткое название и полное. Потом систе­ма смотрит единый госреестр юриди­ческих лиц и индивидуальных пред­принимателей, находит компанию там, проверяет ее атрибуты. Если они у нас неактуальны или введены с ошибками, предлагается эти данные восстановить. По результатам сравне­ния клиентских данных с реестром проставляются коды качества, на ос­новании которых можно судить об уровне качества всей клиентской базы банка.

«Б.Т.»: Требуется ли участие человека?

Г. С.: В большинстве случаев не требуется, по крайней мере, по потоку ежедневных изменений. С подавляю­щим большинством задач система справляется в автоматическом режи­ме. Человек нужен только там. где са­ма система не в состоянии решить во­прос с конфликтом данных, где дан­ных явно недостаточно или они вве­дены с серьезными ошибками и не поддаются обработке с помощью алгоритмов, Например, когда назва­ние — от одной компании, а ИНН — от другой.

Вручную с таким потоком данных не справиться. Только по физическим лицам и ИП поток — более полутора миллионов изменений ежедневно. По юридическим лицам данных прихо­дит меньше, но и цена ошибки там вы­ше, поэтому именно по юридическим лицам у нас налажен процесс выверки данных с ручной обработкой, где сис­тема сама не справится. Этим занима­ется относительно небольшая группа дата-стюардов в Центре сопровожде­ния клиентских операций.

«Б.Т.»: Давайте разберем на примере, как работает система. Вот, например, есть у компании адрес «в одну строку» — г. Москва, Проектируемый проезд № 4338, дом 8, корпус 1, офис 15. Система справится с обработкой такого адреса?

Г. С: Приведенный пример очень простой. Куда сложнее, если в адресе есть, помимо дома и корпуса, разнообразные владения, строения и т. д. Бывает и так: указано «офис с 1 по 15». В этом случае система обра­батывает эту запись и выдает ее с оп­ределенным кодом качества как требующую проверки. Возможно, юри­дический адрес будет восстановлен из иных источников, например из ЕГРЮЛ.

«Б.Т.»: MDM является единой точкой доступа к обработанным данным или она как-то взаимо­действует с другими системами-поставщиками информации в об­ратном направлении?

Г. С.: Конечно взаимодействует! Данные по новым клиентам и измене­ниям транслируются в CRM-системы. Мы также отдаем этот «золотой про­файл» для использования в централь­ном хранилище данных. Также бизнес использует эти дан­ные для поиска клиентов и выдачи кредитов.

Мы не так давно достигли такого большого охвата, и различные потре­бители внутри банка должны убедить­ся, что все корректно, что мы данные не только не портим, но действитель­но улучшаем, что с ними можно рабо­тать. В перспективе же MDM-система будет являться единственным местом, где хранятся эталонные клиентские записи, и откуда все остальные систе­мы смогут эти записи забирать.

«Б.Т.»: Можете рассказать вкратце о технических решени­ях, на базе которых вы строите MDM?

Г. С.: В основе — решение IBM InfoSphere Master Data Management Server. Эта система позволяет дедублицировать и обогащать информацию о клиентах путем сбора данных из пер­вичных источников и сравнения с «золотой записью» клиента, используя при этом передовые технологии и ме­тодики.

За обеспечение качества данных отвечает Российский модуль стандар­тизации «Фактор». «Фактор» позволяет проводить стандартизацию и норма­лизацию клиентских данных. Основ­ной особенностью системы является возможность обогащения клиентских данных информацией из справочни­ков ЕГРЮЛ и ЕГРИП, КЛАДР и других.

Кроме того, в «Факторе» реализована система кодов качества, которая поз­воляет классифицировать данные по параметрам их качества, получать ко­личественные характеристики про­блем в первичных данных.

За первичную загрузку данных от­вечает решение IBM InfoSphere DataStage, позволяющее производить пакетные загрузки данных из систем-источников.

В качестве корпоративной сервис­ной шины был выбран продукт IBM WebSphere Message Broker — система интеграции, обеспечивающая син­хронизацию данных между MDM-системой и смежными системами.

«Б.Т.»: Но ведь мало выбрать решение, нужно его внедрить, а самое главное — настроить и описать правила и методики работы с ним...

Г. С.: Да, именно поэтому для реа­лизации решения мы обратились к квалифицированным партнерам. По корпоративному направлению од­ним из основных подрядчиков с са­мого начала стала компания «Апла­на». Их специалисты описывали и разрабатывали требования к нормализации, стандартизации клиентских данных и их очистке, правилам дедубликации данных, выполняли тес­тирование и оказывали консалтинго­вые услуги.

После того как процесс контроля качества данных был построен, ко­мандой «Апланы» была разработана технологическая схема процесса кон­троля качества клиентских данных корпоративных клиентов, обучены сотрудники и выверка данных была передана на сторону банка. В настоя­щий момент коллеги из «Апланы» осу­ществляют поддержку нашей команды и разрабатывают рекомендации по усовершенствованию процесса кон­троля качества данных, ведь проект еще не завершен.

Говоря простым языком, партне­ры написали как инструкции для человека, занимающегося ручной выверкой данных, так и функциональные требования для самой АС: «если случилась такая-то ошибка, делай так». Это тяжелый труд, но без него создание MDM-системы невозможно.

«Б.Т.»: Каково ближайшее бу­дущее MDM-системы Сбербанка?

Г. С.: В ближайших наших пла­нах — проведение повторной стан­дартизации всей клиентской базы ЮЛ, что должно привести к резкому повышению качества данных. Посто­янно ведется доработка правил авто­матической дедубликации и стандар­тизации данных. Планируется подключение новых систем-источников к MDM, осуществление поисковых запросов из различных банковских систем к MDM, и в перспективе сис­тема, как я уже говорил, станет основным хранилищем клиентских данных. Несмотря на достигнутые результаты, нам еще предстоит очень много работы!


Банковские технологии, №05, 2015

Сайт IBS использует cookie. Это дает нам возможность следить за корректной работой сайта, а также анализировать данные, чтобы развивать наши продукты и сервисы. Посещая сайт, вы соглашаетесь с обработкой ваших персональных данных.