Они помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.
Проблема текстов, искусственно созданных компьютерной программой, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.
«Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, — пояснил Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. – Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически».
Планируемая к созданию разработка должна будет выявлять стилистические особенности текста. Формальные критерии, определяющие создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета Томского государственного университета
«С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, — добавил Роман Мещеряков. – Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека, и при отклонении от нормы указывать на это».
Пока проект находится в стадии разработки, но работающих аналогов к настоящему времени в мире нет, хотя многие специалисты активно занимаются поисками решения актуальной проблемы, сообщает Центр информации и общественных связей ТУСУРа.