Тема доверия к данным вызывает оживленные дискуссии в мировом экспертном сообществе. Одна из таких дискуссий состоялась в конце ноября 2020 года, под эгидой Всемирного банка совместно с партнерами из Института информационного общества и Национального центра цифровой экономики МГУ имени М.В. Ломоносова и экспертным сообществом в России.
Жить в мире данных
Сегодня никто уже не спорит, что данные являются стратегическим активом для экономического развития. Многие даже приравнивают их к новой «нефти», хотя и в отличие от нефти данные можно использовать повторно, и далеко не один раз, а их количество постоянно увеличивается.
Давайте просто посмотрим на цифры. В 2019 году пользователи интернета провели в сети примерно 1.2 миллиарда лет. Каждый день Google получает 3.5 миллиарда поисковых запросов; пользователи WhatsApp обмениваются до 65 миллиардов сообщений ежедневно; а в Twitter отправляют более полумиллиона твитов каждую минуту. Суммарно пользователи интернета генерируют около 2,5 квинтиллионов байт данных каждый день. И здесь мы не упоминаем такие категории, как промышленные данные, данные межмашинного взаимодействия и так далее.
Объем всех этих данных поистине колоссальный. Чтобы просто скачать их из интернета потребуется примерно 180 миллионов лет. IDC прогнозирует, что совокупная сумма мировых данных вырастет с 33 зеттабайт в 2019 году до 175 зеттабайт к 2025 году. Они же и приводят хороший пример для понимания этих объемов - если все эти данные записать на Blu-Ray диски, то можно получить такую стопку дисков, по которой можно добраться до Луны 23 раза.
Важный момент состоит в том, чтобы извлечь ценность из этих данных и использовать их в интересах граждан, государств, частного бизнеса, научного сообщества.
Особую роль здесь играет позиция государства в качестве ключевого агента экосистемы данных и ее основного регулятора, принимающего стратегические решения в этой области.
Данные, в которые мы верим
Неотъемлемой частью национальной стратегии развития многих экономически развитых стран является политика по обеспечению доверия населения к экосистеме данных, жизнеспособность которой зависит от доверия между поставщиками и пользователями данных.
Например, если граждане не убеждены в том, что их личные данные, доверяемые государству будут в безопасности, то делиться ими добровольно они не будут. Можно только догадываться об эффективности такой политики без доверия со стороны граждан.
Исходя из этого, большинство стран регулируют экосистему данных в первую очередь с помощью разработки или обновления законов о защите данных, конфиденциальности, открытых данных, этике их использования, обучения основам кибербезопасности и борьбы с киберпреступностью. Таким образом многие правительства имеют своей целью обеспечение доверия ко всей экосистеме данных и к соответствующим институтам, а также создают благоприятные условия для уверенного взаимодействия между гражданами, производителями и потребителями услуг в области данных.
Ситуация существенно усложнилась в 2020 году, когда пандемия новой коронавирусной инфекцией вызвала серьезные социальные и экономические проблемы во всем мире. Для борьбы с COVID-2019 многие государства начали массированно использовать практику сбора и анализа персональных данных с целью моделирования распространения заболевания, например, для контроля за личным перемещением с целью обеспечения соблюдения правил изоляции. Однако, такая практика вызывала серьезные дебаты в мировом экспертном сообществе, особенно в отношении этических аспектов управления этими данными, и отсутствия соответствующей нормативной правовой базы. Очевидно, что такое отслеживание контактов для населения большинства стран – это вмешательство в частную жизнь (пусть даже и временное), которое вызывает опасения защиты прав человека и общественного доверия в целом.
Взглянем на это с другой стороны. В кризисной ситуации такие страны, как Китай, Корея и Сингапур, с их прямым государственным контролем над управлением персональными данными граждан и не столь значительным ограничениям их использования и конфиденциальности, продемонстрировали впечатляющие результаты в борьбе с пандемией. Имеющие разные политические и правовые системы страны показали высокую результативность в использовании данных при борьбе с пандемией. Примечательным является также и то, что, подходы были разными – например, хотя Корея и использовала широкий спектр конфиденциальных персональных данных, включая данные о финансовых операциях, подход государства был прозрачен для общественности как в отношении приоритетов, так и методов, что в итоге помогло обеспечить общественную поддержку.
Сообщество говорит о данных
Тема доверия вызывает оживленные дискуссии в мировом экспертном сообществе в 2020 году. Одна из таких дискуссий состоялась в конце ноября 2020 года, под эгидой Всемирного банка совместно с партнерами из Института информационного общества и Национального центра цифровой экономики МГУ имени М.В. Ломоносова.
На виртуальной площадке собрались представители государства, бизнеса, гражданского общества и научных организацией, чтобы обсудить политику России в области регулирования персональных данных, этики и доверия использования данных, и локализации данных.
Очевидно, что в рамках подобных дискуссий, на которых обмениваются мнениями представители разных секторов, и должна рождаться истина. По крайней мере, должен создаваться фундамент для рождения истины. Ну или хотя бы пара кирпичиков для фундамента уж точно должны закладываться.
Так и произошло. В ходе дискуссии эксперты поднимали ряд важных вопросов, которые далеко не всегда рассматриваются на правительственном уровне при формировании государственной политики в области данных. Мы хотели бы отметить некоторые моменты:
- В частности, ряд экспертов сошлись во мнении по поводу необходимости активизации работы с качеством данных как значимого фактора для обеспечения доверия. Важным аспектом для создания такого доверия является оценка качества и безопасности данных, а также их достоверности. Речь идет о метрологии в области данных, включая, например, разработку требований к наборам текстовых данных, автоматизации оценки качества и безопасности данных и так далее.
- Очень важным был признан вопрос об обезличивании данных, точнее о регламентация процедур обезличивания. Без введения общих правил сбора и анонимизации данных невозможно развивать такие сегменты как, например, здравоохранение.
- Отдельная часть дискуссии была посвящена этике данных. Для обеспечения доверия многие страны сейчас разрабатывают и принимают этические принципы, стандарты и руководства для работы с данными. Однако такие принципы являются либо слишком общими, либо фрагментарными. В ходе обсуждения было предложено изучать этику данных в трех измерениях: этика сбора данных, этика анализа глубины данных и этика алгоритмов данных. И уже на этой основе детализировать подходы в регулирование.
- Поднимался также и вопрос о цифровом донорстве, который также относится к этике, но мы бы хотели заострить на нем особое внимание и задать читателям вопрос - можно ли дарить свои персональные данные для общественно-значимых проектов? Или здесь опять можно столкнуться с недобросовестным поведением со стороны пользователей данных, не говоря уже о вопросах кибербезопасности?
- Наконец, шла речь и о таком понятии как права на данные как таковые. Далеко не всегда обладатели данных, будь то компании или отдельные граждане, знают как пользоваться своими данными, что для этого нужно, зачем они вообще нужны. Это напрямую касается и вопроса о цифровой грамотности, но это уже тема для отдельного блога.
Как итог, хотим отметить, что несмотря на то, что некоторые предметные области, такие как защита данных, уже неплохо развиты, другие (например, этика данных и все, что связано с доверием к данным) еще находятся в дискуссионном поле даже в самых передовых странах. Для России (как и для всех стран) нужен системный подход к политике в области данных, и в особенности к обеспечению доверия ко всей экосистеме данных. Мы надеемся, что таким системным кирпичиком станет доклад Всемирного банка о развитии экономики данных в России “Данные как ключевой фактор развития: эволюция российской политики в области данных”, который будет опубликован в начале 2021 года.
Присоединяйся к обсуждению