Задание №4. Кластерный анализ из внешней базы данных
В период с 18 по 26 октября были проанализированы слова: панда, Япония, заповедник.
Эти графики помогают нам проанализировать, какого числа и в каком количестве употреблялись те или иные слова в материалах издания Guardian - ежедневной леволиберальной газете в Великобритании. Графики помогают понять актуальность новостей и повестку текущего дня.
Т.к. газета на английском языке, то слова мы вводили на соответствующем языке: panda, Japan, reserve.
Как выяснилось после анализа, графики практически не совпадают.
Вечером 19 октября были новости, включающие в себя слова "Япония" и "заповедники", следовательно можно предположить, что были статьи, рассказывающие про заповедники в Японии.
25 октября был большой всплеск со словом "панда", который пересекается со словом "Япония".
Однако анализ таким образом не даёт полного представления о всей картине и он имеет ряд недостатков. С его помощью можно только предположить. Так, проводя анализ на тему сельского хозяйства, использовал слова: поле, трактор, зерно; и программа не смогла отнести данные слова к одному инфоповоду, из-за чего получился весьма странный и необычный график.
Комментарии
Отправить комментарий