Компьютер сможет разобраться в тонкостях филологии?

Ученые разработали алгоритм, благодаря которому компьютер сможет разобраться в тонкостях филологии, а именно отличить новостной текст от художественного (рассказа), сообщается в научной статье на портале arXiv.org.

Специальная программа проанализировала количество повторений одного и того же слова в рассказах и новостных сообщениях, полученные данные сравнили.

Оказалось, что показатели для двух разных типов текстов отличаются. Для исследования были выбраны только произведения писателей XX века, чтобы минимизировать разницу языка; все тексты были взяты из электронной библиотеки проекта «Гутенберг». Им в противовес были изучены 400 новостных заметок, случайно выбранные с сайта National Public Radio.

Для новостных заметок точность угадывания составила 69,1% с погрешностью 1,22%, а для рассказов – 73,8% с погрешностью 5,15%.

Компьютеры с помощью ученых сегодня, что называется, творят чудеса, например, помогают определить «интересное положение».