⚡️🔥💥Великолепное интервью по анализу БигДата в соцсетях - кто что постит, кого лайкает, и т.п.
http://paperpaper.ru/campus/big-data/Было еще одно - по таким же анализаторам фотографий и поведения в соцмедия.
Спойлер - анонимности не существует. По крайней мере на уровне обывателя и даже оппозиционного или провластного журналиста/активиста. Слишком адово нужно заморочиться, чтобы ее обеспечить всерьез.
"Сначала данные собираются специальными алгоритмами, потом попадают в огромное хранилище, а там уже анализируются с помощью скриптов, которые «обогащают» [дополнительными смыслами] эти данные. Скрипты здесь играют главную роль. Скрипт — это такая программа, которая эмулирует движения пользователя. Так, один скрипт выделяет из текстов нужные места, объекты действия или фамилии, другой — считает информацию, третий — анализирует и раскладывает лица людей. В конце концов в этой большой-большой и уже обогащенной базе данных есть и сами данные, и дополнительные поля, по которым аналитик может сделать запрос и проанализировать информацию в понятном для него виде.
Таким образом мы искали террориста, который совершил взрыв 3 апреля. Всё началось с того, что один наш клиент, СМИ, в три часа ночи прислал фотографию оторванной головы и попросил найти предполагаемого террориста. Ну мы и нашли его страницу с помощью нашего алгоритма по типу FindFace: он создан на подобном движке, но работает в одиннадцати соцсетях.
А на следующий день мы решили еще и проанализировать все его социальные связи и нашли еще больше информации. Так, мы узнали, что у Джалилова шесть аккаунтов в социальных сетях, при этом один из них он удалил за несколько дней до теракта. Поняли, что через друзей он связан с хабаровским террористом, который расстрелял приемную ФСБ. Выяснили, что Джалилов и его друзья имели ультраправые взгляды, кластер которых, кстати, принадлежит Максиму Марцинкевичу. Несколько его друзей уехали воевать в Сирию. Если не все, то многие из этих выводов мы сделали только по открытым данным.
Последний раз я наткнулся на пост, в котором «Лентач» высмеивал религиозную организацию, которая просила удалить один мем. Я не знаю, что мной двигало, но я зашел на сайт этой религиозной организации и выяснил, что там есть призывы чуть ли не сжигать нерожавших женщин, геев и так далее. Тогда я собрал по десять примеров постов людей, которые там призывали к экстремизму, и отправил куда следует.
По моим наблюдениям, никто не станет интересоваться вашими личными сообщениями, если у вас нет хотя бы 5 тысяч человек активной аудитории. На самом деле, важно лишь то, что вы говорите широкой публике и как сказанное может повлиять на это общество. Никому нет дела, если это не уголовное следствие. Мы анализируем Tor, анализируем сайты и Telegram-каналы.
Не могу сказать и то, с какими именно органами сотрудничаем. Но к нам многие организации обращаются. Для меня такое сотрудничество нормально. Путина я поддерживаю.
У нас свои алгоритмы, которых нет у других; мы единственные, кто анализирует лайки, интересы, аудиторию, грамотно распознаем лица.