Многие из нас понимают, что использование сотового телефона означает оставление практически точных данных о местоположении в данный период времени. Но новое исследование показывает как на самом деле мало данных надо для идентификации мобильных пользователей в истории их перемещений. Проанализировав данные за 15 месяцев от 1.5 миллионов людей исследователям удалось определить, что для идентификации пользователя в этой «толпе» с точностью в 95% нужно только 4 точки в пространстве и времени (примерное место с точностью до базовой станции и примерное время с точностью до часа).
Ученый Ив-Александр де Монт из MIT и его соавтор опубликовали работу в Scientific Reports в которой описывают, как данные сотовых телефонов вступают в фундаментальное противоречие с конфиденциальностью персональных данных.
Причина того, что всего 4 точек достаточно для идентификации пользователя, состоит в том, что «мобильность» каждого человека уникальна. Так же как у каждого есть свои отпечатки пальцев, каждый имеет свой отпечаток передвижения. В 1930 году Эдмонд Локард доказал, что для идентификации отпечатка нужно только 12 точек. Точно также ученые сейчас доказали, что для определения принадлежности мобильного следа нужно всего 4 пространствено-временных точки. Проще говоря, вряд ли кто будет в этих же локациях в это же время, даже с учетом погрешности. Более того, знание только 2 точек может точно идентифицировать 50% людей.
Как заметили исследователи, эти четыре точки можно получить из публично открытых данных, таких как домашний адрес, рабочий адрес, пост в Twitter или чекин в Foursquare. Таким образом, имея социальный профиль человека и базу мобильных данных можно без труда вычислить его мобильный номер, а дальше уже проследить все перемещения – прошлые и будущие.
Можно было бы ожидать, что точность «распознавания» людей уменьшится с увеличение временного или пространственного интервалов, но в случае мобильных данных это не совсем так. Увеличение «разрешения» не делает данные более анонимными, для идентификации людей нужно лишь чуть больше точек.
Это исследование подчеркивает потенциальный риск для неприкосновенности частной жизни и анонимности со стороны мобильных данных, соединенных с открытой информацией. Ученые надеются, что их изыскание позволит помочь в разработке будущих политик и технологий.
Ссылка на источник