Преподаватель:
к.ф.-м.н., заведующий отделом ИСП РАН
Турдаков Денис Юрьевич
Лекторы:
- м.н.с. ИСП РАН Майоров Владимир Дмитриевич
- ст.-иссл. ИСП РАН Перминов Андрей Игоревич
Аннотация
Спецкурс предназначен для студентов, желающих получить знания и практические навыки в области обработки текстовой информации. Курс знакомит слушателей с основными проблемами компьютерной обработки текстов и современными подходами к их решению. Рассматриваются как фундаментальные понятия и идеи, так и современные исследования в данной области. Особое внимание уделяется применению методов машинного обучения, которые активно развиваются в настоящее время и показывают лучшие результаты.
Актуальность обработки текстовой информации на естественном языке связана с ростом количества документов, доступных для автоматической обработки, потребностью в их анализе и наличием вычислительных ресурсов. Слушатели получат базовые знания в области обработки текстов на естественном языке, понимание проблем, возникающих при разработке систем текстового анализа, и подходов к их решению.
Литература
- Daniel Jurafsky and James H. Martin. 2008. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Second Edition. Prentice Hall.
- Christopher D. Manning and Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. MIT Press.
- Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python. O'Reilly Media, 2009 (http://www.nltk.org/book)
- Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep learning. MIT Press. 2016
- ACL Anthology
План на 2023 год и материалы к лекциям
Лекция | Слайды | Лектор | |
---|---|---|---|
Лекция 1: Задачи обработки текстов | lecture1-2023 | Турдаков | |
Лекция 2: Методы машинного обучения для обработки текстов. | lecture2-2023 | Турдаков | |
Лекция 3: Искусственные нейронные сети для обработки текстов | lecture3-2023 | Перминов | |
Лекция 4: Статистические методы в обработки текстов. Поиск словосочетаний | lecture4-2023 | Турдаков | |
Лекция 5: Векторные представления слов | lecture5-2023 | Майоров | |
Лекция 6: Базовые задачи обработки текстов | lecture6-2023 | Майоров | |
Лекция 7: Синтаксический анализ | lecture7-2023 | Майоров | |
Лекция 8: Лексическая семантика | lecture8-2023 | Турдаков | |
Лекция 9: Машинный перевод | lecture9_2023 | Турдаков | |
Лекция 10: Языковые модели на основе нейронных сетей | lecture10-2023 | Майоров | |
Лекция 11: Информационный поиск | lecture11-2023 | Турдаков | |
Лекция 12:Прикладные задачи обработки текстов | lecture12_2023 | Турдаков | |
Лекция 13: Кластеризация текстов. Тематическое моделирование | lecture13-2023 | Турдаков | |
Лекция 14: Большие языковые модели | lecture14-2023 | Тихомиров |
Ссылка на чат по курсу 2023 года: Telegram