Diplomová práca

Použitie neurónových sietí v analýze textových dokumentov

Vedúci práce: doc. RNDr. Gabriela Andrejková, CSc.

Ciele práce:

1. Spracovať prehľad existujúcich metód používajúcich neurónové siete pre hľadanie anomálií v textoch.

2. Spracovať prehľad metód pre reprezentáciu textových dát s cieľom ich ďalšieho spracovania.

3. Pripraviť vhodné textové dáta na trénovanie a vyhodnotenie neurónovej siete

4. Navrhnúť a implementovať hlbokú neurónovú sieť na vyhľadávanie outlierov v texte

5. Vyhodnotiť efektivitu neurónovej siete a porovnať s výsledkami získanými inými metódami

Literatúra

- Ian Goodfellow and Yoshua Bengio and Aaron Courville: Deep Learning, MIT Press, 2016

- Ramakrishnan Kannan, Hyenkyun Woo, Charu C. Aggarwal, Haesun Park: Outlier Detection for Text Data : An Extended Version, 2017

- Honglei Zhuang, Chi Wang, Fangbo Tao, Lance Kaplan, Jiawei Han : Identifying Semantically Deviating Outlier Documents, Proceeding of 2017 Conference on Empirical Methods in Natural Language Processing (September 2017)

- Subutai Ahmad, Alexander Lavin, Scott Purdy, Zuha Agha: Unsupervised real-time anomaly detection for streaming data. Neurocomputing, 262 (2017) 134–147.

Rozšírené zadanie