Сообщения

Сообщения за декабрь, 2022

Задание 5. Простой sentiment анализ

Изображение
 Анализ произведён на основе статьи в Sky news, которая рассказывает о том, что Великобритания представила истребитель нового поколения, который будет построен совместно с Италией и Японией: https://news.sky.com/story/uk-unveils-next-generation-fighter-to-be-built-with-italy-and-japan-12764284 Как видно из анализа, +- в равной степени преобладают голубые и жёлтые тональности, меньше зелёные. Однако по словам сравнительно больше синей тональности, что говорит про отрицательную окраску текста, это связано с тем, что в статье говорится про военные разработки, а за частую, всё, что связано с военными действиями - на подсознательном уровне воспринимается с опаской, т.к. человек всегда нуждается в безопасности. Слово с наибольшей положительной окраской: jet Слова с большой положительной окраской: combat, jobs, defence, partnership, ... Слова с нейтральной окраской: air, today, operational, countries, ... Слова с большой отрицательной окраской: years, consciousness, fighters, ... Слова с ...

Задание №4. Кластерный анализ из внешней базы данных

Изображение
В период с 18 по 26 октября были проанализированы слова: панда, Япония, заповедник. Эти графики помогают нам проанализировать, какого числа и в каком количестве употреблялись те или иные слова в материалах издания Guardian - ежедневной леволиберальной газете в Великобритании. Графики помогают понять актуальность новостей и повестку текущего дня. Т.к. газета на английском языке, то слова мы вводили на соответствующем языке: panda, Japan, reserve. Как выяснилось после анализа, графики практически не совпадают.  Вечером 19 октября были новости, включающие в себя слова "Япония" и "заповедники", следовательно можно предположить, что были статьи, рассказывающие про заповедники в Японии. 25 октября был большой всплеск со словом "панда", который пересекается со словом "Япония". Однако анализ таким образом не даёт полного представления о всей картине и он имеет ряд недостатков. С его помощью можно только предположить. Так, проводя анализ на тему сельского...

Задание №3. Простой кластерный анализ

Изображение
 Предметом исследования стало крупное событие, послужившее инфоповодом всего мира: Отмена Евровидения из-за COVID-19. Были проанализированы 10 статей, объединённых общей темой из разных федеральных и региональных сми России. Будем использовать интеллектуальный анализ данных в Orange Data Mining. 1) https://tass.ru/obschestvo/8017131 2) https://www.gazeta.ru/culture/2020/03/18/a_13010707.shtml 3) https://www.kp.ru/daily/27106.4/4180341/ 4) https://rg.ru/2020/03/18/evrovidenie-2020-otmenili-chto-budet-dalshe.html 5) https://www.vedomosti.ru/society/news/2020/03/18/825578-evrovidenie-2020-ofitsialno-otmenili-iz-za-koronavirusa 6) https://iz.ru/988446/2020-03-18/smi-soobshchili-ob-otmene-evrovideniia-2020-iz-za-koronavirusa 7) https://ria.ru/20200318/1568795352.html 8) https://www.1obl.ru/news/kultura/organizatory-nazvali-mesto-provedeniya-evrovideniya-v-2021-godu/ 9) https://74.ru/text/entertainment/2020/03/18/69037630/ 10) https://rus...