Новая программа определяет возраст пользователя Twitter
ff46ba301b0333e706385521626dd9d6.jpg

Голландские программисты из Университета города Твенте разработали онлайн-программу, способную довольно точно определять пол и возраст пользователя соцсети Twitter, анализируя его сообщения в сети микроблоггинга.

Разработчики говорят, что недавно завершили тестирование программы на базе из 3000 twitter-пользователей, которые регулярно отправляли в соцсеть короткие сообщения на разные темы. В программе была создана база знаний, которая при помощи синтаксического, семантического, словарного и иных типов анализа выявляла половую и возрастную принадлежность отправителя сообщений.

Программе для довольно четкого определения необходимо проанализировать около 200 твитов пользователя и после этого оператор программы может просто ввести ник пользователя, а программа выдаст информацию о том, что может скрываться за этим псевдонимом.

"Наш анализ показал, что разница между блогерами мужчинами и женщинами довольно стереотипна. Проще говоря, мужчины чаще говорят о футболе и политике, женщины - о ногтях, - говорит Донг Нгуен, один из разработчиков программы. - С позиции возраста, молодые пользователи чаще говорят о себе самих и используют много смайликов, тогда как возрастные пользователи применяют более сложные словарные обороты и чаще говорят на нетипичные темы".

Кроме того, Нгуен говорит, что по своей природе твиты молодых пользователей более эмоциональны, часто имеют крайне позитивную или крайне негативную окраску, что редко встречается у пользователей старше 30 лет.

Пока программа анализирует твиты только на голландском и имеет относительную погрешность в 4 года при выявлении возраста.

Напомним, создано новое приложение LivesOn для сети Twitter, которое публикует сообщения на странице пользователя после его смерти. Оно создает новые записи на основе собранной им информации из сделанных пользователем при жизни твитов. LivesOn также ретвитит сообщения, которые мог бы написать пользователь, с часто цитируемых им при жизни страниц.

Источник: CyberSecurity