На конференции, которая прошла в Берлине, группа из нескольких аспирантов университета Дрекселя представила новый способ, который поможет определять авторство большинства анонимных текстов, размещенных на просторах всемирной сети. Об этом сообщило информационное агентство SC Magazine Australia. Способ представляет собой аналитический подход к размещенному материалу.
Аспиранты предлагают изучение твитов, электронных писем, различных сообщений путем выявления закономерностей, например, в знаках препинания. Другими словами, с точки зрения статистических стилистик. Один из разработчиков данного метода (Садиа Афроз) выступая на конференции заявил, что один из самых главных ориентиров – служебные слова. Служебные слова пользователь обычно использует в повседневных переписках. Как правило, такие слова используются не для обозначения каких-либо предметов разговора, а для отношения и взаимоотношения между ними.
Однако есть и проблемы в новом методе. Пока ни одно из государств Европы не заинтересовалось в нем, да и не видит в нем рационального применения. А так как создатели метода в основном коренные американцы, то и способы вычисления адаптированы под английский язык. Хотя некоторые аналитики полагают, что текст, который переведен автоматическим переводчиком, также может быть вполне доступен способу разработчиков.
Главный инструмент, который разработчики использовали в методе и способе проведения анализа текста, пока получил лишь кодовое название – Jstylo. В целом разработка еще далека от совершенства даже в «английском» представлении. То есть пока представлена бета-версия. Вопрос по поводу дальнейшего развития подобных технологий достаточно расходится. Одни заявляют, что это вполне нужная программа, которая действительно необходима и нуждается в полной разработке, другие заявляют, что программа абсолютно бессмысленна, тем более для абсолютного большинства пользователей, которым не интересно авторство того или иного текста.
Стоит заметить, что Jstylo может выявить истинное авторство текста при соблюдении целого ряда условий. Во-первых, количество пользователей, которые попадают под критерий «он мог написать», должно быть максимально пятьдесят человек. Во-вторых, эти пятьдесят человек уже должны были где-то публиковать свои работы. И не просто публиковать, совокупность текста каждого автора должна быть не меньше 6,5 тысячи слов. И наконец, третье условие: длина текста, который проверяется, должна быть не меньше 500 слов.
Впрочем разработчики не унывают и обещают продолжить работу. Кроме того, они делают вполне смелые заявления. Например, что когда работа Jstylo будет полностью завершена, ее смогут применять даже спецслужбы для того, чтобы выявить хакеров, которые пренебрегают законом. Или, например, для поимки создателей вредоносных программ. Примечательно, что одновременно с программой, которая будет помогать найти интернет-преступников, эти же разработчики занялись созданием инструмента Anonymouth, который должен максимально обезопасить авторов и зашифровать их тексты.