«Большой брат следит за тобой»: что скрывают данные
Каждый год 26 ноября отмечается Всемирный день информации, учрежденный в 1994 году по инициативе Международной академии информатизации. Этот праздник стал своеобразными признанием: информация играет огромную роль в развитии общества. Но он также заставляет задуматься о теневой стороне данных. В рубрике «Имени языка Эйнштейна» разбираемся, как сбор и анализ информации на протяжении всей истории человечества использовался для наблюдения и контроля.
Ранние примеры слежки
Первые попытки мониторинга информации и слежки появились задолго до возникновения интернета. Еще в Древнем Египте и Месопотамии правители создавали сложные системы учета, позволяющие отслеживать ресурсы населения. В Средние века контроль осуществлялся через переписи, налоговые регистры и учет военнообязанных. Изобретение печатного станка в XV веке совершило переворот, позволив передавать информацию массово, но одновременно потребовало от государственных структур новых методов контроля и цензуры. Уже тогда власти стремились знать о подданных как можно больше: место жительства, доходы, социальные связи.
«Исчисление израильтян», гравюра Анри Феликса Эммануэля Филиппото (1894). Источник: wikipedia.org
Настоящий перелом произошел в XX веке с появлением вычислительных машин. В 1948 году Клод Шеннон публикует работу «Математическая теория связи», закладывая основы теории информации. Разработанные им принципы позже легли в основу алгоритмов анализа данных и систем мониторинга, которые сегодня кажутся нам обычным делом.
Цифровая эпоха
С приходом интернета и компьютеров объемы информации начали расти стремительными темпами. Каждое наше действие, будь то сообщение, звонок, или отметка в социальной сети, — все это оставляет цифровой след. При этом ценность представляют не только сами данные, но и метаданные — информация о данных, кто с кем общался, когда, откуда был звонок или сообщение. Даже не зная содержания разговора, можно установить многие детали общения.
Именно на анализе метаданных строятся современные системы наблюдения и аналитики поведения. Современные спецслужбы и крупные технологические компании собирают и используют эти данные для формирования моделей поведения. Так сетевой анализ позволяет выявлять так называемые «центральные узлы» — людей, играющих ключевую роль в информационных потоках.
Центр обработки данных. Источник: infiniti-it.co.uk
Еще в XVI веке, анализируя архив королевского секретаря Англии, исследователи могли выявить заговорщиков и агентов, отслеживая не содержание писем, а количество связей и «промежуточность» корреспондентов (сколько информационных путей проходит через человека в сети). Аномально высокая промежуточность при относительно небольшом количестве связей часто выдавала шпионов. Это доказывает, что для выявления подозрительной активности сам текст сообщения часто не нужен.
Центр обработки данных. Источник: exabytes.sg
Современные же технологии, такие как машинное обучение и искусственный интеллект, многократно расширили эти возможности. Алгоритмы способны находить аномалии в поведении и прогнозировать действия, основываясь исключительно на метаданных. Более того, нейросети могут компилировать различные параметры узла (степень, промежуточность, активность), позволяя находить целые группы людей со схожими ролями. Ярким примером масштабов сбора метаданных стал скандал 2013 года. Тогда Эдвард Сноуден, бывший сотрудник Центрального разведывательного управления и Агентства национальной безопасности США, раскрыл программу PRISM АНБ. Спецслужбы собирали метаданные миллионов телефонных звонков, оправдывая это тем, что не прослушивают сами разговоры. АНБ же заявило, что не нарушало Конституцию США, поскольку собирало не сами переписки и разговоры, а лишь сведения о них (метаданные). В качестве обоснования они ссылались на решение Верховного суда 1979 года, разрешавшее государству собирать имена участников коммуникации, время, дату и место ее осуществления.
Первая полоса The Guardian, 10 июня 2013 г. На фото Эдвард Сноуден. Заголовок: «Разоблачитель. “Я не могу позволить правительству США разрушить неприкосновенность частной жизни и базовые свободы”». Источник: theguardian.com
Позже Майк Помпео, бывший директор ЦРУ, предложил пойти дальше. Он призвал Конгресс разрешить сбор всех видов метаданных и объединять их с данными о финансах и образе жизни граждан в одну большую базу, которую можно будет свободно использовать для поиска нужной информации.
Любопытно, что даже простое использование фитнес-браслета или умной колонки может создавать цифровой след, из которого при желании можно узнать не только маршруты и привычки человека, но и состояние его здоровья.
Будьте осторожны с тем, чем делитесь в интернете. Все, что вы публикуете, пишете или отправляете, может однажды стать достоянием общественности. Цифровая информация имеет свойство жить своей жизнью и часто не подлежит полному удалению. Лучше лишний раз подумать, чем потом сожалеть.
