Служба спасения студентов
Служба спасения для студентов (18+)

Оценка и анализ моделей распознавания юмора

Стоимость
3000 руб.
Содержание
Теория
Объем
97 лист.
Год написания

Описание работы

Работа пользователя Beskonechno
Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Оценка и анализ моделей распознавания юмора»
Оригинальность работы 95%
 


Оглавление

Аннотация ....................................................................................................................4
Введение.......................................................................................................................5
Обзор литературы........................................................................................................7
1.Распознавание юмора ........................................................................................7
2.Состязательные атаки......................................................................................17
Выводы....................................................................................................................24
Глава 1. Данные .........................................................................................................26
1.1One-Liners ..........................................................................................................26
1.2Humicroedit ........................................................................................................28
1.3 Unfun.me ............................................................................................................29
1.4 PUNS..................................................................................................................30
Выводы и результаты.............................................................................................31
Глава 2. Модели и метрики качества ......................................................................32
2.1Метрики качества.............................................................................................33
2.2Bag of Words & Logistic Regression ................................................................35
2.2.1Train on One-liners ......................................................................................37
2.2.2Train on Humicroedit ...................................................................................38
2.2.3Train on Unfunme ........................................................................................39
2.2.4Train on Puns ...............................................................................................40
2.3Word2Vec & Logistic Regression .....................................................................42
2.3.1Train on One-Liners .....................................................................................43
2.3.2Train on Humicroedit ...................................................................................44
2.3.3Train on Unfunme ........................................................................................45
2.3.4Train on Puns ...............................................................................................46
2.4Universal Sentence Encoder & ClassifierDL ....................................................47
2.4.1Train on One-liners ......................................................................................48
2.4.2Train on Humicroedit ...................................................................................49
2.4.3Train on Unfunme ........................................................................................50
2.4.4Train on Puns ...............................................................................................51
2.5Сравнение моделей ..........................................................................................52
2.5.1One-liners (train, test) ..................................................................................53


2

2.5.2 Humicroedit (train, test)........................................................................ 54
2.5.3 Unfunme (train, test)............................................................................. 55
2.5.4 Puns (train, test).................................................................................... 56
2.5.5 Сравнение на всех датасетах.............................................................. 57
Выводы и результаты.................................................................................... 58
Глава 3. Состязательные атаки......................................................................... 59
3.1 Метрики качества..................................................................................... 61
3.2 Slang 18+.................................................................................................. 61
3.3 Антонимы................................................................................................. 63
3.4 Рифмы....................................................................................................... 65
3.5 Сравнение................................................................................................. 67
Выводы и результаты.................................................................................... 68
Глава 4. Применение состязательных атак....................................................... 69
4.1 Slang 18+.................................................................................................. 70
4.2 Антонимы................................................................................................. 73
4.3 Рифмы....................................................................................................... 76
Выводы и результаты.................................................................................... 78
Заключение........................................................................................................ 79
Библиографический список.............................................................................. 81
Приложениe 1. Результаты классификации BOW на исходных данных......... 84
Приложениe 2. Результаты классификации Word2Vec на исходных данных. 86
Приложениe 3. Результаты классификации USE на исходных данных.......... 88
Приложениe 4. Процент изменений текстов класса «non-humorous» для каждой
атаки................................................................................................................... 90
Приложениe  5.   Процент  ошибок  для  класса   «non-humorous» в   исходных
результатах........................................................................................................ 91
Приложениe 6. Результаты классификации после применения атаки «Slang 18+»
92
Приложениe 7. Результаты классификации после применения атаки «Антонимы»
94
Приложениe 8. Результаты классификации после применения атаки «Рифмы» 96

 
Введение
Юмор – один из ключевых компонентов социального взаимодействия в современном обществе. Когда человек слышит шутку, он смеётся, выражая тем самым позитивные эмоции. Что создаёт юмористический эффект в обычном тексте? Изучение механик и структур, определяющих юмор, позволяет понимать различные способы влияния на поведение индивидуумов. Например, если в рекламе какого-либо продукта, предвыборном видео, агитационном ролике есть смешной фрагмент, который, кроме того, соответствует современным тенденциям – вероятность того, что зритель выберет именно этот продукт, увеличивается в разы. Однако как создать шутку, которая понравится большинству? Существуют ли определённые алгоритмы, позволяющие манипулировать толпой таким образом? Для того, чтобы ответить на эти вопросы, необходимо выявить паттерны и факторы, которые делают обычное предложение смешным.
В настоящее время большинство юмора содержится в текстовой форме – многочисленные порталы анекдотов, бесконечные ветки Twitter и Reddit, комментарии пользователей в сети… Для того, чтобы понять природу юмора, необходимо исследовать компоненты существующих шуток на предмет общих паттернов. Но как выявить юмористические составляющие, если мы даже не умеем автоматически различать шутку и обычный текст? В этом и содержится задача распознавания юмора – ответ на вопрос «Является ли этот текст шуткой?»
В данной работе предлагается целых три способа ответить на этот вопрос. Это модели-классификаторы, обучающиеся на уже известных текстах и предсказывающие класс для новых. Сами модели и способы решения совсем не новы – в последнее десятилетие с прогрессом технологий и распространением различных форматов социального взаимодействия проводится всё больше и больше исследований по распознаванию юмора в текстовой форме. Всё же, данная работа предлагает объемный анализ моделей, так же как исследование влияния состязательных атак на классификацию юмора. Насколько известно на
5

настоящий момент, ни одна работа ранее не рассматривала состязательные атаки как способ дополнительного оценивания и анализа моделей распознавания юмора. Это открывает возможность для принципиально новых способов и решений в классификации юмористических текстов.
Основная цель данной работы – исследование моделей распознавания юмора, иначе говоря, их оценка и анализ. В задачи же входят сравнение нескольких подходов в распознавании шуток на разных датасетах, а также анализ влияния состязательных атак на предсказания в зависимости от метода и обучающих данных.
Можно с уверенностью сказать, что в ходе данного исследования были получены весьма интересные результаты – например, среди моделей распознавания юмора самым стабильным вариантом стало глубокое обучение, а наиболее уязвимы модели оказались от состязательной атаки, добавляющей неприличные слова в тестовое множество. Кроме того, были выявлены дополнительные сопутствующие и препятствующие работе моделей факторы, также как подтверждена важность некоторых юмористических свойств.
Структура работы организована следующим образом. Раздел «Обзор литературы» содержит в себе подробное описание источников по распознаванию юмора и по состязательным атакам. Далее в главе «Данные» приведено описание используемых в работе датасетов. В главе «Модели и метрики качества» рассмотрены модели распознавания юмора, приведён как индивидуальный, так
  • сравнительный анализ результатов. Наконец, в главах «Состязательные атаки»
  • «Применение состязательных атак» описаны исследуемые состязательные атаки и подробно рассмотрено влияние атак на модели распознавания юмора.
После основной части следуют «Заключение», «Библиографический список» и «Приложения».


 
Библиографический список
  1. R, Mihalcea, and C. Strapparava. “Making Computers Laugh: Investigations
in Automatic Humor Recognition.” (2005). HLT/EMNLP.
  1. Британский Национальный корпус [сайт]. URL: https://www.english-corpora.org/bnc/
  1. F, Barbieri, and H. Saggion. “Automatic Detection of Irony and Humour in Twitter.” (2014).
  1. Yang et al. “Humor recognition and humor anchor extraction.” (2015).
EMNLP.
  1. Potash et al. “#HashtagWars: Learning a Sense of Humor.” (2016).
  1. Miller et al. “SemEval-2017 Task 7: Detection and Interpretation of English Puns.” (2017). SEMEVAL2017.
  1. WordNet (2010) [сайт]. URL: https://wordnet.princeton.edu
  1. L. Chen, and Chong Min Lee. “Predicting Audience's Laughter Using
Convolutional Neural Network.” (2017).
  1. TED-talks [сайт]. URL: https://www.ted.com/talks
  1. Ermilov et al. “Stierlitz Meets SVM: Humor Detection in Russian.” (2018).
AINL.
[11] C. Chang, and C. Lin. “LIBSVM: A library for support vector machines.”
(2011).
[12] A. Cattle, and X. Ma. “Recognizing Humour using Word Associations and Humour Anchor Extraction.” (2018).
  1. S. Attardo, and V. Raskin. “Script theory revis(it)ed: Joke similarity and joke representation model.”. (1991).
  1. Zhang et al. “Exploiting Syntactic Structures for Humor Recognition.”
(2018). COLING.
81
 
  1. Blinov et al. “Large Dataset and Language Model Fun-Tuning for Humor
Recognition.” (2019). ACL.
  1. J. Howard, and S. Ruder. “Universal Language Model Fine-tuning for Text
Classification.”(2018). ACL.
  1. O. Weller, and K. Seppi. “Humor Detection: A Transformer Gets the Last Laugh.” (2019). EMNLP.
  1. Reddit r/Jokes thread [сайт]. URL: https://www.reddit.com/r/Jokes/
  1. P. Chen, and V. Soo, “Humor recognition using deep learning” (2018).
Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 2 (Short Papers).
  1. Devlin et al. “BERT: Pre-training of Deep Bidirectional Transformers for
Language Understanding.” (2019). NAACL-HLT.
[21] Hossain et al. “President Vows to Cut Hair : Dataset and Analysis of Creative Text Editing for Humorous Headlines.” (2019).
  1. Hossain et al. “SemEval-2020 Task 7: Assessing Humor in Edited News
Headlines” (2020).
  1. Weller et al. “Can Humor Prediction Datasets be used for Humor Generation? Humorous Headline Generation via Style Transfer.” (2020).
  1. I. Annamoradnejad, and G. Zoghi “ColBERT: Using BERT Sentence Embedding for Humor Detection” (2020).
  1. Ziser et al. “Humor Detection in Product Question Answering Systems.”
(2020).
[26] Goodfellow et al. “Explaining and harnessing adversarial examples.”
(2015). In Proceedings of ICLR.
82

[27] R. Jia and P. Liang. “Adversarial Examples for Evaluating Reading Comprehension Systems.” (2017).
  1. Rajpurkar et al. “SQuAD: 100, 000+ Questions for Machine Comprehension of Text.” (2016). EMNLP.
  1. Zhou et al. “Learning to Discriminate Perturbations for Blocking Adversarial Attacks in Text Classification.” (2019). EMNLP/IJCNLP.
  1. Y. Malkov, and D. Yashunin. “Efficient and Robust Approximate Nearest Neighbor Search Using Hierarchical Navigable Small World Graphs.” (2016). IEEE Transactions on Pattern Analysis and Machine Intelligence.
  1. Xiaosen et al. “Natural Language Adversarial Attacks and Defenses in
Word Level.” (2019).
  1. Zhou et al. “Fake News Detection via NLP is Vulnerable to Adversarial Attacks.” (2019).
  1. Fakebox state-of-the-art model [сайт]. URL:
https://machinebox.io/docs/fakebox
  1. Wallace et al. “Universal Adversarial Triggers for Attacking and Analyzing
NLP.” (2019). EMNLP.
[35] Singh et al. “Model Robustness with Text Classification: Semantic-preserving adversarial attacks” (2020).
  1. R. West, and E. Horvitz, “Reverse-Engineering Satire, or «Paper on
Computational Humor Accepted despite Making Serious Advances»” (2019).
Proceedings of the AAAI Conference on Artificial Intelligence.
  1. Cer, Daniel Matthew, et al. “Universal Sentence Encoder.” (2018).


 

Сколько стоит помощь с учебной работой?