Почитал про исследование, в котором с помощью машинного обучения определяли пьяные твиты. В большинстве новостей в заголовок вынесли что-то вроде "Этот алгоритм определит, пьяны ли вы, по вашим твитам". Оказывается, само исследование не совсем про это, а про то, где люди пьют - дома или в барах, в каких районах чаще и пр. То есть найти "пьяные твиты" - это вообще не сложно, достаточно только набрать достаточно материала для обучения (набирали его, кстати, руками, через Mechanical Turk). Находки из географии выпивания не особо сенсационные: в Нью-Йорке пьют больше, чем в пригороде, а также ближе к дому (или дома). Чем больше питейных заведений в районе, тем больше число алкогольных твитов (есть корреляция, но непонятно, где причина, а где следствие). Главный вывод - такой анализ твитов с геолокацией работает, и с его помощью можно неплохо оценивать городскую активность. Этим в дальшейшем и планирует заняться команда ученых - исследованиями потребления алкоголя в демографическом, географическом и урбанистическом аспектах.
https://www.technologyreview.com/s/601051/machine-learning-algorithm-identifies-tweets-sent-under-the-influence-of-alcohol/Кстати, другое недавнее исследование обнаружило, что анализ твитов позволяет оценивать последствия стихийных бедствий дешевле и эффективнее, чем сложные модели американского МЧС:
https://telegram.me/apparatmag/91На фоне подобных исследований (а их сотни, и среди них - очень важные и полезные) все печальнее читать новости про упадок Twitter. Открытая платформа для глобального общения в реальном времени - мощнейший инструмент для исследователей из всех стран и специальностей. С помощью анализа твитов можно исследовать перемещение людей, их политические симпатии, культурные привычки, паттерны поведения. Можно исследовать, как люди пьют, что они думают обо всем на свете - да просто забейте в гугл "twitter analysis reveals" и посмотрите, сколько всего мы можем узнать о самих себе с помощью этой прекрасной платформы. А теперь количество и активность пользователей Twitter падает, топ-менеджеры компании не могут найти оптимальную стратегию развития, акции падают, и если руководство Twitter не придумает какой-то очень крутой поворот в продукте, то соцсеть безнадежно отстанет от конкурентов - мессенджеров, Instagram, Facebook. А может и уже безнадежно отстала. Хотя есть мнение, что Twitter надо просто смириться - их продукт уже занял свою нишу (довольно узкую) в насыщенной экосистеме социальных сервисов. Я согласен с этим - формат вещания подходит не всем, не всем есть что сказать. И это одна из главных причин массовой миграции людей в мессенджеры. Но мессенджеры - закрытые платформы, личные чаты нельзя вот так свободно анализировать. И в этом плане упадок Twitter меня огорчает больше всего.
Чтобы не заканчивать на упадочной ноте, вот еще одно исследование про алкогольные твиты, на этот раз - про разницу в дранкстинге (сам когда-то придумал это слово, можете пользоваться) между мужчинами и женщинами. Анализ пьяных твитов (тут обошлись без машинного обучения, брали просто твиты, содержащие "алкогольные" слова) доказал гендерные стереотипы - мужчины по-пьяни пишут про пиво, друзей и секс, женщины - про красивые коктейли.
http://qz.com/486704/this-is-how-men-and-women-drink-according-to-twitter/