Читать книгу Антихаос. Управление данными - - Страница 41

Часть II. Объекты управления: данные как активы компании
6. Атрибуты и характеристики объектов управления
6.3. Жизненный цикл данных – от рождения до цифрового забвения

Оглавление

Введение: "Четыре времени года данных"

Представьте большой город. Каждый день в нем рождаются новые здания (данные), которые проходят свой жизненный цикл: проектирование, строительство, активное использование, ремонт, и наконец – снос или реконструкция. Но представьте, что в этом городе:

– Строители (бизнес) хотят строить быстрее и дешевле

– Архитекторы (управление данными) хотят соблюдать генплан и стандарты

– Коммунальщики (ИТ) хотят минимизировать затраты на обслуживание

– Историки (юристы/комплаенс) требуют сохранять всё навечно

Управление жизненным циклом данных – это искусство балансировки между этими интересами, где каждый этап от создания до удаления требует согласованных правил и компромиссов.

6.3.1. Что такое жизненный цикл данных и почему им нужно управлять?

Расширенное определение для руководителя:

Жизненный цикл данных – это сквозной процесс управления данными от момента их возникновения или получения до окончательного удаления, включающий все этапы создания, использования, хранения, архивации и уничтожения, с учетом требований бизнеса, ИТ-инфраструктуры и нормативных ограничений.


Ключевые противоречия в подходах:

6.3.2. Универсальные стадии жизненного цикла: от замысла до забвения

Расширенная модель из 7 стадий

6.3.3. Специфика жизненного цикла для разных видов данных

6.3.3.1. Жизненный цикл основных данных – "Долгоживущие активы"


6.3.3.2. Жизненный цикл корпоративных данных – "Быстротечные транзакции"


6.3.3.3. Жизненный цикл организационного капитала – "Вечные ценности"


6.3.3.4. Жизненный цикл метаданных – "Карта, которая переживает территории"


6.3.4. Критические конфликтные точки и их разрешение

6.3.4.1. Конфликт: "Миграция данных – Стабильность систем"

Сценарий: Компания переходит с устаревшей ERP на современную cloud-платформу.

• Бизнес: "Перейти за выходные, без остановки продаж"

• ИТ: "Поэтапная миграция в течение 6 месяцев с тестированием"

• УД: "Полная конвертация и очистка данных перед переносом"

• Юристы: "Сохранить все исторические данные за 10 лет"

Решение – "Миграционный мост":

1. Двусторонняя синхронизация в реальном времени на 3 месяца

2. Постепенное переключение отделов по принципу "один филиал в неделю"

3. Исторические данные остаются в старой системе с read-only доступом

4. Автоматизированная очистка данных во время передачи

6.3.4.2. Конфликт: "Стоимость хранения – Ценность данных"

Сценарий: Терабайты данных IoT с датчиков оборудования накапливаются ежемесячно.

• Бизнес: "Хранить всё – вдруг понадобится для предиктивного анализа"

• ИТ: "Хранить агрегированные данные – сырые слишком дороги"

• УД: "Хранить выборочно – только данные, прошедшие контроль качества"

• Производство: "Хранить в реальном времени – для мгновенного реагирования"

Решение – "Пирамида хранения":

УРОВЕНЬ 1: Горячие данные (последние 30 дней) → In-memory базы

УРОВЕНЬ 2: Теплые данные (1-12 месяцев) → SSD-хранилища

УРОВЕНЬ 3: Холодные данные (1-5 лет) → HDD-массивы

УРОВЕНЬ 4: Ледяные данные (5+ лет) → Cloud archive с задержкой доступа

УРОВЕНЬ 5: Агрегированные тренды (вечно) → Column-store для аналитики

6.3.4.3. Конфликт: "Нормативные требования – Технические ограничения"

Сценарий: Требование регулятора хранить финансовые транзакции 5 лет в неизменном виде.

• Регулятор: "WORM-хранилище с криптографическим хешированием"

• ИТ: "Наше облако не поддерживает WORM, миграция стоит руб.2 млн"

• Бизнес: "Нужен быстрый доступ для аудиторов – задержка не более 1 часа"

• УД: "Данные должны быть совместимы с новой системой отчетности"

Решение – "Юридически совместимая архитектура":

1. Шифрование + цифровая подпись вместо аппаратного WORM

2. Регламент изменений с согласованием юристов и ИБ

3. Ежеквартальные аудиты целостности данных

4. Резервная копия на съемных носителях в сейфе

6.3.5. Организационные механизмы управления жизненным циклом

Data Lifecycle Council – совет по управлению жизненным циклом данных


Состав:

• Председатель: CDO или его представитель

• Члены: Руководители бизнес-направлений, CIO, CISO, Юрист по compliance

• Приглашенные: Владельцы данных, Архитекторы систем


Полномочия:

• Утверждение политик жизненного цикла для всех типов данных

• Разрешение конфликтов между бизнесом, ИТ и compliance

• Утверждение бюджетов на хранение и миграцию данных

• Мониторинг соблюдения утвержденных политик


Процесс работы совета:

ЗАПРОС на изменение политики ЖЦД

→ Анализ затрат/выгод (ИТ + бизнес)

→ Оценка рисков (ИБ + юристы)

→ Решение совета с фиксацией компромиссов

→ Коммуникация заинтересованным сторонам

→ Мониторинг выполнения


Матрица принятия решений советом:

6.3.6. Техническая реализация управления жизненным циклом

6.3.6.1. Инструменты автоматизации


6.3.6.2. Архитектурные паттерны

Паттерн "Data Lake + Data Warehouse":

RAW ZONE (озеро) → все данные в оригинале, срок хранения 1 год

CURATED ZONE (очищенные) → проверенные данные, срок 3 года

SERVED ZONE (обслуживаемые) → готовые к использованию, срок 5 лет

ARCHIVE ZONE (архив) → исторические данные, срок по требованию

Паттерн "Polyglot Persistence":

• Основные данные → Реляционные БД (высокая целостность)

• Корпоративные данные → NoSQL (масштабируемость)

• Организационный капитал → Graph DB (связность)

• Метаданные Search Engine (быстрый поиск)

6.3.7. Нормативная база и compliance

Международные стандарты:

• ISO 15489: Управление записями (Records Management)

• ISO 27001: Информационная безопасность

• GDPR: Право на забвение (статья 17)

Российское законодательство:

• 152-ФЗ: Персональные данные (сроки хранения)

• 402-ФЗ: Бухгалтерский учет (5 лет для первички)

• Отраслевые стандарты: Например, для телекома – 3 года детализации звонков

6.3.8. Практические шаги по внедрению

90-дневный план "Управление жизненным циклом без боли":


Месяц 1: Инвентаризация и классификация

1. Выявление критичных данных: 3-5 самых ценных и 3-5 самых проблемных наборов

2. Создание матрицы владельцев: Кто отвечает за каждый тип данных

3. Анализ текущих затрат: Сколько реально стоит хранение данных


Месяц 2: Политики и процессы

4. Разработка политик ЖЦД: Для каждого класса данных

5. Создание Data Lifecycle Council: Первое заседание

6. Внедрение инструментов мониторинга: Дашборд стоимости хранения


Месяц 3: Автоматизация и масштабирование

7. Автоматизация 20% процессов: Наиболее рутинных операций

8. Обучение владельцев данных: Их роли в управлении ЖЦД

9. Расширение на 80% данных: Масштабирование успешных практик


KPI успешности внедрения:

• Снижение затрат на хранение: На 25-40% в первый год

• Сокращение времени доступа: На 30% к горячим данным

• Соблюдение compliance: 100% по срокам хранения

• Удовлетворенность бизнеса: Рост на 20% в опросах

Заключительная аналогия:

Управление жизненным циклом данных – это создание "умной системы городского планирования" для ваших цифровых активов.

• Бизнес – это девелоперы, которые хотят строить быстро и там, где выгодно

• Управление данными – это архитекторы, следящие за генпланом и стандартами

• ИТ-инфраструктура – это коммунальщики, обеспечивающие устойчивость систем

• Комплаенс – это историки, охраняющие культурное наследие

Успешное управление жизненным циклом – это когда в городе есть и современные небоскребы (актуальные данные), и ухоженные парки (архивные данные), и эффективная инфраструктура (ИТ-системы), и сохраненные памятники (юридически значимые данные). При этом город развивается, не превращаясь ни в трущобы (хаотичное хранение всего), ни в мертвый музей (хранение только старого).

Антихаос. Управление данными

Подняться наверх