Керівник відділу управління даними IT-компанії MODUS X Валентин Винту в колонці для Енергореформи розповів, що треба враховувати в сфері енергетики та банкінгу, аби побудувати дійсно ефективну систему такого управління.
За роки роботи з даними в обох сферах побачив, що формальні підходи до Data Governance можуть виглядати схожими, але "під капотом" – це зовсім різні світи з унікальними викликами, драйверами та навіть підводнимкаміннями.
Енергетика:
- Динаміка та багатоваріантність джерел: Дані надходять з безлічі систем – SCADA, IIoT, ERP, Billing, smart meters, GIS. Більшість цих систем створювалися для операційних цілей, а не для якісної інтеграції чи аналітики.
- Реальний час: Багато рішень потребують мінімальної затримки – наприклад, диспетчеризація, аварійне реагування, балансування енергосистеми. Стандартні процеси Data Quality тут іноді "зайві" або сповільнюють роботу, тому доводиться впроваджувати гібридні моделі: базові перевірки в реальному часі та глибокий контроль у batch-режимі.
- Відсутність повноти історичних даних: В енергетиці часто бракує якісної історії даних по активах, ремонтах, навіть по обліку споживання. Через це доводиться будувати окремі data-mart’и, проводити "ручний" Data Lineage і постійно навчати бізнес про важливість коректного введення даних.
- Організаційний спротив: Виробничі підрозділи часто сприймають governance як додатковий контроль або "зайву бюрократію", тож зміна культури вимагає окремого фокусу.
Банківський сектор:
- Висока регуляторка: Практично всі великі банки вже мають формалізовану структуру управління даними: Data Steward, Owner, Council, політики та стандарти (BCBS 239, GDPR, FATCA, AML).
- Централізована архітектура: Основні дані живуть у DWH, дані проходять сувору ETL-очистку, існують чіткі правила Master Data Management, Data Quality вимірюється автоматично.
- Тотальна простежуваність: Будь-яка зміна має бути задокументована, зберігається аудиторський журнал. Без цього – штрафи, перевірки, проблеми з регулятором.
- "Shadow-IT" та неформальні джерела: Хоча в банках офіційно все дуже структуровано, на практиці існують так звані shadow-IT – неформальні Excel-реєстри, локальні БД, які потрапляють поза основні процеси governance. Їх виявлення та інтеграція – окремий квест.
- Пріоритет – захист персональних даних: Кожен проект проходить data privacy impact assessment, існують процедури маскування, шифрування, а також обмеження для доступу навіть всередині організації.
Ключові відмінності з практики:
В енергетиці:
- Governance часто йде "знизу догори": починається з підрозділів, що мають проблеми з якістю або розрахунками, а не з C-level ініціатив.
- Значно більша кількість даних із зовнішніх джерел (державні API, ринки електроенергії, погодні сервіси).
- Важливо навчити виробничий персонал основам data literacy, інакше навіть найкраща система не запрацює.
У банкінгу:
- Governance – це питання виживання. Без нього неможливо пройти аудит або отримати нову ліцензію.
- Найбільший виклик – контроль над неформальними (shadow) даними.
- Інструментарій governance максимально автоматизований, більшість процесів відбуваються "за лаштунками" для бізнесу.
Висновок: Data Governance – це не просто впровадження стандартів, а глибока трансформація культури управління даними. І тільки враховуючи галузеві нюанси, можна побудувати дійсно ефективну систему.