Použitie neurónových sietí v analýze textových dokumentov
Vedúci práce: doc. RNDr. Gabriela Andrejková, CSc.
Ciele práce:
1. Spracovať prehľad existujúcich metód používajúcich neurónové siete pre hľadanie anomálií v textoch.
2. Spracovať prehľad metód pre reprezentáciu textových dát s cieľom ich ďalšieho spracovania.
3. Pripraviť vhodné textové dáta na trénovanie a vyhodnotenie neurónovej siete
4. Navrhnúť a implementovať hlbokú neurónovú sieť na vyhľadávanie outlierov v texte
5. Vyhodnotiť efektivitu neurónovej siete a porovnať s výsledkami získanými inými metódami
Literatúra
- Ian Goodfellow and Yoshua Bengio and Aaron Courville: Deep Learning, MIT Press, 2016
- Ramakrishnan Kannan, Hyenkyun Woo, Charu C. Aggarwal, Haesun Park: Outlier Detection for Text Data : An Extended Version, 2017
- Honglei Zhuang, Chi Wang, Fangbo Tao, Lance Kaplan, Jiawei Han : Identifying Semantically Deviating Outlier Documents, Proceeding of 2017 Conference on Empirical Methods in Natural Language Processing (September 2017)
- Subutai Ahmad, Alexander Lavin, Scott Purdy, Zuha Agha: Unsupervised real-time anomaly detection for streaming data. Neurocomputing, 262 (2017) 134–147.
Rozšírené zadanie