В российские СМИ попала информация о том, что МВД заказало, цитата: «…разработку системы, способной вычислить автора текста и даже установить, в каком психологическом состоянии он находился». Назначение подобной системы, которая будет называться «Фраза» - отслеживание плагиаторов и компиляторов, «вычисление» анонимщиков. Бюджет МВД на разработку – 6 миллионов рублей, тестовые рабочие версии должны сдаваться заказчику поэтапно уже в следующем и в 2014 годах.
Однако, вычислять авторов (!) интернет-посланий по их особенностям, скорее всего, не вполне удастся, хотя программы, позволяющие это делать, давно существуют и используются при анализе больших текстовых объемов. Например, в университете Санкт-Петербурга, о чем рассказал его доцент Сергей Ширин: выявляется структура речи, определяются часто применяемые слова и обороты и так далее, после чего возможно сравнение с «опытными» образцами. Плагиат таким образом выявляется очень быстро и уверенно, так как в общем объеме вставные участки выглядят для специальной программы очень отчетливо.
Антиплагиатные программы давно и успешно применяются, их уже множество на разных языках; эксперты утверждают, что с их помощью – при незначительной доработке - можно даже определять правдивость слов того или иного человека (например, политика). При наличии базы для сравнения, естественно. «Такие системы не просто могут быть созданы, они уже есть» - заявляет господин Ширин. Определенные проблемы могут возникнуть при попытке оценить эмоциональный настрой автора, причем сложность анализа русского текста значительно возрастает, английский же текст анализировать легко ввиду особенностей самого языка, он более прост.
Техзадание от МВД на разработку системы звучит следующим образом: «Создание аппаратно-программного комплекса для производства автороведческой экспертизы»… АПК «Фраза». Куратором проекта определено НПО «СТиС» (Специальная техника и связь», научное подразделение МВД), разработчик буден выбран, как всегда, по итогам конкурса.
Подробнее Известия