Задание №4. Кластерный анализ из внешней базы данных

В период с 18 по 26 октября были проанализированы слова: панда, Япония, заповедник.

Эти графики помогают нам проанализировать, какого числа и в каком количестве употреблялись те или иные слова в материалах издания Guardian - ежедневной леволиберальной газете в Великобритании. Графики помогают понять актуальность новостей и повестку текущего дня.

Т.к. газета на английском языке, то слова мы вводили на соответствующем языке: panda, Japan, reserve.


Как выяснилось после анализа, графики практически не совпадают. 

Вечером 19 октября были новости, включающие в себя слова "Япония" и "заповедники", следовательно можно предположить, что были статьи, рассказывающие про заповедники в Японии.

25 октября был большой всплеск со словом "панда", который пересекается со словом "Япония".

Однако анализ таким образом не даёт полного представления о всей картине и он имеет ряд недостатков. С его помощью можно только предположить. Так, проводя анализ на тему сельского хозяйства, использовал слова: поле, трактор, зерно; и программа не смогла отнести данные слова к одному инфоповоду, из-за чего получился весьма странный и необычный график.



Комментарии

Популярные сообщения из этого блога

Задание №2. КОММЕРЧЕСКОЕ ПЛАНИРОВАНИЕ. Полнометражный фильм "Бриллиантовая история". Шиленберг А.А.