140 символов F * CK, Sh! T, и @ss: Как мы ругаемся на Twitter

В лучшем случае, Twitter - это место, где можно найти последние новости, вдумчивый диалог и неожиданные голоса. В худшем случае это форум для реакции коленного рефлекса, троллей и преследований. На обеих этих крайностях, как и в жизни, на этом пути обязательно найдется какой-то плохой язык.

Насколько люди ругаются в Твиттере? Кто ругается и что они говорят?

Четыре кротких исследователя пытались выяснить, и бумага, которую они произвели представленный, на этой неделе на конференции ACM по компьютерной совместимой работе и социальным вычислениям - это сборник оскорбительных выражений, которые соперничают развратный, наполненный рутиной блеск из недавнего фильма Волк с Уолл-стрит .

В лучшем случае, Twitter - это место, где можно найти последние новости, вдумчивый диалог и неожиданные голоса

Изучив случайную месячную выборку из 51 миллиона англоязычных твитов из 14 миллионов различных учетных записей пользователей, они пришли к следующему выводу: мы много ругаемся в Твиттере, где наш язык обычно общедоступен, даже больше, чем в реальной жизни. жизнь. Еще более убедительными они открыли контекст, когда и почему происходит проклятие и кто за кого проклинает.

«Это значительная часть тех слов, которые мы используем. В среднем один твит из 13 твитов будет содержать хотя бы одно ругательство », - говорит он. Венбо Ван научный сотрудник в Университете Райта, который руководил исследованием. «Из-за социальных сетей люди не видят друг друга. Они могут говорить то, чего не говорят в физическом мире ». Другие исследования показали, что от 0,5 до 0,7% слов, которые мы говорим в физическом мире, являются проклятиями - в Твиттере исследователи обнаружили, что этот показатель составляет 1,15%. Или как написано в газете, и как Ван был слишком вежлив, чтобы повторить во время нашего телефонного интервью:

Самым популярным ругательством является ебать, которое охватывает 34,73% всех случаев употребления ругательств, за которыми следуют дерьмо (15,04%), задница (14,48%), сука (10,34%), ниггер (9,68%), ад (4,46%) шлюха (1,82%), член (1,67%), моча (1,53%) и киска (1,16%).

Результаты интересны для всех, кто использует Twitter, но для команды, все связанные с Огайо Центр передового опыта в области компьютерных технологий документ будет работать с более широкими социальными последствиями, связанными с психическим здоровьем, словесными оскорблениями, онлайн-преследованиями и гендерными различиями в онлайн-коммуникациях.


«Социальный контент чрезвычайно богат», - говорит директор центра Амит П. Шет , «Проблема проклятия - это выражение чувств и эмоций… это своего рода ключевая проблема понимания языка». Центр работает над созданием автоматизированных инструментов, которые могут помечать проблемы беспокоящего преследования в социальных сетях, особенно в старшей школе и в колледже. или может выявить депрессивные расстройства или склонность к насилию. Создание фильтров для детей в социальных сетях - еще одно потенциальное приложение.

Конечно, время и контекст - это все, и не все ругательства отрицательны. Например, «Я б * $% - люблю тебя» может быть музыкой для ушей @ получателя.

Попытка «анализа настроений», которая имеет свои ограничения, показала, что, хотя отрицательные эмоции побеждают в ругательствах в твиттере, любовь и игривость (два друга говорят «ты шлюха») стали реальными сигналами в данных. Гнев и грусть составляли 22% и 17% проклятых твитов, тогда как 7%, казалось, выражали любовь. Каждый четвертый из всех выбранных твитов, которые были классифицированы как «злые», содержал ругательства.

Другие идеи в документе касались времени, места, пола и уровня влияния твитеров NSFW. Люди проклинают все больше и больше по мере того, как проходит день, достигая максимума в 12 часов утра до 1:30 ночи перед сном, а по понедельникам, вторникам и средам самые ругательные слова касаются объема твита.

И, как и в реальной жизни, люди, которые находятся в более спокойной обстановке, например, дома или в клубе, а не в офисе, с большей вероятностью будут ругаться в твиттере, но различия меньше, чем в очном мире ( исследователи смотрели только на гео-локализованные твиты для них). Студенты колледжей и старших классов не стесняются ругаться, даже когда они в школе. Мужчины проклинают больше, чем женщины, но оба пола чаще ругаются, когда напрямую общаются в Твиттере с кем-то того же пола. Что касается социального ранга, знаменитости в верхних 1% подписчиков в Твиттере рассматриваются лучше, чем «средние» пользователи Твиттера:

Коэффициент проклятия среди твитов, полученных верхней 1% -ной группой, является самым низким среди всех групп получателей: эти популярные пользователи получают много дружеских сообщений от своих поклонников, например, «@Harry Styles follow me me babe <3», «@NiallOfficial Я не могу спать :( ”

Исследователи говорят, что есть возможность улучшить их систему классификации, так как даже попытка записать проклятые слова не так проста, как кажется. После удаления спама команда должна была закодировать каждый твит как «проклятие» или «не проклятие». Это означало решить, что такое проклятие. Для этого четыре автора, ни один из которых не является носителем английского языка, составили лексикон оскорбительных слов и попросили двух магистрантов (кто еще?) Помочь в разрешении неясностей. Они поняли, что «геи» могут использоваться как нечеткость или в обычной описательной речи. Также пришлось изменить лексику, включив в нее все виды вариаций: «например, a55, @ $$, $ h1t, b! Tch, bi + ch, c0ck, f * ck, l3itch, p * ssy и dik».

«Я думаю, что наш словарный запас увеличился», - говорит другой автор Лу Чен.

Насколько люди ругаются в Твиттере?
Кто ругается и что они говорят?
Кто еще?