[#] Fbi Detected: Как я обнаружил агентов ФБР
habrabot(difrex,1) — All
2016-03-24 13:30:04


В новом выпуске [«Черной археологии датамайнинга»][1] мы немного поиграемся в шпионов. Увидим, что может узнать обычный Data Specialist на основе открытых в сети данных. Всё началось со [статьи на хабре][2], о том, что некий анинимный хакер делился слитыми в сеть данными агентов ФБР. Я получил эти данные, и стал смотреть, что с ними можно сделать? В данных есть только фамилия, имя, и служебные мейлы и телефон – немного информации. ![][3] Получив эти данные, я увидел, что они заканчиваются буквой **J**. То есть, датасет не полон. Интресено, каков его полный размер? Чтобы узнать его, надо построить статистику частоты встречаемости фамилий. Для этого я начал искать наборы американских фамилий, и тут меня ждало открытие – в Америке можно найти открытые данные по, скажем, избирателям штата – как я понял, совершенно легально. Например, я за полчаса без проблем [получаю][4] данные всех избирателей штата Юта. [Читать дальше →][5]

[1]: https://habrahabr.ru/users/caveeagle/topics/
[2]: https://geektimes.ru/post/270730/
[3]: https://habrastorage.org/files/2d7/02d/d75/2d702dd7513041bfaeb8719da0442a84.png
[4]: https://www.reddit.com/r/privacy/comments/3yinij/entire_us_voter_registration_record_leaks_191
[5]: https://habrahabr.ru/post/280065/#habracut