Совместный проект
Технотренды
Цифровая триада: данные – информация – знания и ценность

Как избежать лоскутной цифровизации и не превратить «озера данных» в болота; какие данные «умны»; что на вершине цифровой пирамиды; чего нам «цифра» не простит, – рассказывает Алексей Заславский, директор департамента компании «Витте Консалтинг» (ГК «АйТеко»).

О цифровых технологиях и уровнях пирамиды

Сегодня у всех на слуху цифровая экономика, цифровая трансформация, цифровизация. Государство разрабатывает и принимает специальные стратегии и программы, корпорации планируют или уже реализуют программы по цифровой трансформации, конечным потребителям грозят тотальным датацентричным будущим...

Давайте посмотрим на само определение термина из профильных нормативно-правовых актов: «Цифровая экономика – хозяйственная деятельность, в которой ключевым фактором производства являются данные в цифровом виде». 

Данные – это кровь цифровой экономики, сердце любой большой и малой цифровой трансформации. Несколько утрируя, но не изменяя самой сути, можно сказать, что любая модная цифровая технология – это технология генерации, передачи, хранения, обработки и извлечения данных и/или получения с помощью этих данных некой ценности.

Избегая деклараций о лавинообразном росте объемов данных, генерируемых и обрабатываемых в мире в последние годы, отмечу лишь, что этот процесс связан прежде всего с ростом объемов неструктурированных или слабоструктурированных данных.

И требует использования специализированных инструментов и технологий, отличающихся от бывших ранее классическими инструментов работы со структурированными данными, сохраняя при этом актуальность эффективной работы с ними.

Давайте представим себе некую пирамиду, уровни которой от подножия к вершине можно описать как данные – информация – знания/ценность. На каждом из уровней надо решить комплекс взаимосвязанных задач, использующих различные методики, методы и технологии, которые должны быть направлены на достижение конечной цели – извлечения требуемых знаний и/или получение необходимой ценности.

Спектр таких задач широк: от определения источников данных, механизмов их генерации, сбора и актуализации, обеспечения эффективного хранения и доступа к данным – через решение задач обработки, обеспечения нужного качества данных, организации работы с мета- и мастер-данными, – до превращения данных в значимую информацию за счет их горизонтальной и вертикальной интеграции и контекстуализации, применения различных инструментов и технологий, направленных на получение требуемых знаний и/или ценности.

О технологиях работы с большими данными

Большие данные сегодня многим представляются ответом на все вопросы. Берем данные, запускаем скрипт и ожидаем, что мгновенно получим на выходе идею прорывной инновации или понимание, как изменить бизнес-модель. А когда по разным причинам этого не происходит, это вызывает недоумение или рождает недоверие.

Нужны не большие данные сами по себе, а «умные» данные, грамотно подобранные и обработанные, из которых мы можем получить требуемую ценность. Важен не объем сам по себе, а понимание конкретной цели и правильно выбранные и использованные инструменты, которые эффективно смогут работать с каждой из трех V-составляющих, где volume – объём данных, velocity – скорость прироста/обработки, variety – многообразие данных.

О возможных ошибках на пути к «умным» данным

Лет 10-12 назад говорили о лоскутной автоматизации, когда для решения конкретных задач создавалась новая информационная система, а затем разрабатывались многолетние и дорогостоящие программы устранения дублирования и перехода к целевому ИТ-ландшафту.

Сегодня, когда отдельным представителям менеджмента надо быстро и «малой кровью», ничего не меняя по сути, показать, что они в цифровом тренде, компании могут пойти по пути уже «лоскутной цифровизации», то есть решать локальные задачи за счет точечного внедрения инноваций, не научившись эффективно работать с таким новым активом цифровой экономики, как данные.

«Цифра» этого не простит: скорость изменений растет, а с ней растет и цена ошибки неэффективного использования собственных активов, исправлять которую будут уже другие...

Другой пример: построение так называемых «озер данных», под которыми подразумевают организацию хранилищ, куда сливают все данные отдельного подразделения/филиала в надежде вытянуть из них потом максимум пользы. Или, наоборот, в одно озеро сливаются практически все данные всех подразделений компании по принципу «все в дом».

В первом случае, какую бы могучую аналитику ни привлекали для обработки данных, ее выводы будут ими и ограничены. Есть большая вероятность в итоге получить много маленьких прудов и запруд, в которых ничего крупнее мелких карасей поймать будет нельзя, даже если для их вылова применят новейшие технологии искусственного интеллекта и блокчейн для учета.

Во втором случае есть риск, что в отсутствие механизмов управления метаданными, четких процедур сбора и актуализации данных большое озеро очень быстро превратится в болото, где водятся одни «пиявки да лягушки».

Надо создавать целую гидросистему с системой водохранилищ, шлюзов, каналов, систем очистки, с помощью которых можно получать нужные продукты и услуги: ловить рыбу, орошать поля, кататься на лодках, вырабатывать электроэнергию, доставлять потребителям техническую или питьевую воду.

Как избежать «лоскутной цифровизации»

Как ни банально, надо обеспечить баланс и быстро решать отраслевые задачи, имея методически грамотный подход, который не приведет в итоге к «лоскутной цифровизации».

Именно поэтому на первый план сейчас выходят платформенные решения, способные обеспечить гибкую работу с данными различных типов и возможность разработки на базе этой платформы конкретных отраслевых решений. Это позволит решать задачи быстро, не нарушая общего подхода, с возможностью в дальнейшем масштабировать решения.

Поделитесь:

Еще про Технотренды

11
Умный выбор: какие бизнес-задачи помогут решить интеллектуальные платформы

Центр когнитивных технологий компании «АйТеко» представил на рынке собственную разработку SmartSel. Интеллектуальная платформа предназначена для классификации и маршрутизации неструктурированной информации, а также для построения диалоговых систем, чат-ботов.

Читать
4
Рейтинг Топ-100 виральных медиаресурсов: новые методика расчета, технологии и тренды

Какие издания чаще других упоминают пользователи в соцсетях, чьи материалы в Сети привлекают большее внимание, чьи медиа- и инфоповоды побуждают их комментировать? Об этом знают исследователи аналитического центра Brand Analytics, представившие обновленную методику рейтинга Топ-100 виральных медиаресурсов, которая помогла выявить ряд трендов в распространении публикаций медиаресурсов.

Читать