Готовы билеты к экзамену (скачать в pdf).
- Задачи обработки текста. Многозначность при обработке текста. Проблема понимания
- Регулярные выражения
- Конечные автоматы, распознавание языка с помощью КА
- Регулярные языки и конечные автоматы. Построение КА для регулярных выражений
- Модель N-грамм. Оценка вероятности высказывания
- Модель N-грамм. Сглаживание (Лапласа и Откат)
- Модель N-грамм. Оценка качества. Тренировочный и проверочный корпуса
- Задача определения частей речи. Существующие подходы
- Использование скрытой марковской модели для определения частей речи
- Скрытые марковские модели. Вероятность последовательности. Прямой алгоритм
- Скрытые марковские модели. Наиболее правдоподобное объяснение. Алгоритм Витерби
- Модели классификации. Наивный байесовский классификатор
- Модели классификации. Логистическая регрессия
- Модели классификации. Модель максимальной энтропии
- Модели классификации. Марковская модель максимальной энтропии
- Типы грамматик. Грамматика составляющих. Грамматика зависимостей. Категориальная грамматика
- Контекстно-свободные грамматики. КС грамматики и регулярные языки. Банк деревьев.
- Синтаксический разбор. Разбор сверху вниз и снизу вверх
- Синтаксический разбор. Алгоритм Кока-Янгера-Касами (CKY parsing). Эквивалентность КС грамматик
- Фрагментирование
- Стохастические контекстно-свободные грамматики. Разрешение синтаксической многозначности
- Моделирование языка. Обучение стохастических КС грамматик
- Вероятностная версия алгоритма Кока-Янгера-Касами. Оценка качества
- Проблемы стохастический КС грамматик. Алгоритм Коллинза. Оценка качества
- Лексическая семантика. WordNet. Значения слов
- Разрешение лексической многозначности. Алгоритмы классификации. Самонастройка. Методы оценки качества
- Разрешение лексической многозначности. Методы основанные на словарях и тезаурусах. Варианты алгоритма Леска. Методы оценки качества
- Семантическая близость слов. Подходы на основе тезаурусов. Методы оценки качества
- Семантическая близость слов. Подходы на основе статистик. Методы оценки качества
- Вопросно-ответные системы. Общая архитектура. Обработка запроса
- Вопросно-ответные системы. Общая архитектура. Извлечение фрагментов текста
- Вопросно-ответные системы. Общая архитектура. Обработка ответа
- Автоматическое реферирование. Общая архитектура
- Машинный перевод. Классические подходы
- Статистический машинный перевод. Модель зашумленного канала. Модель перевода на основе фраз. Выравнивание фраз (если слова выровнены). Декодирование
- Статистический машинный перевод. Выравнивание слов. Модель IBM Model 1
- Статистический машинный перевод. Выравнивание слов. Тренировка моделей выравнивания
- Статистический машинный перевод. Методы оценки качества. BLUE
为了学习这个知识,到处找相关文章,哎,真不容易,博主也不容易,在此也要感谢一下博主了。