Практикум (весна 2014)

Целью работы является создание системы, позволяющей оценивать эмоциональную окраску сообщений микроблога Twitter. Задача анализа эмоциональной окраски (или тональности) текста (англ. sentiment analysis  или opinion mining) состоит в автоматическом выявлении в текстах эмоциональной оценки автора по отношению к некоторому объекту.

Примеры:

  • "Начинается новый день" - нейтральная оценка
  • "Какой прекрасный день" - позитивная
  • "Ужасный день" - негативная

Предлагается разработать систему, которая на вход получает короткий текст (твит), а на выходе отдает одну из трех меток:

  • neutral - нейтральная
  • positive  - позитивная
  • negative - негативная
Все детали доступны в файле по ссылке.

UPD. Лучшие решения доступны для скачивания.

Таблица итоговых результатов:
.

15 thoughts on “Практикум (весна 2014)”

  1. Почему то не могу отправить программу на проверку, не загружает архив.

  2. Не получается. Выдаёт "File can not be uploaded". А ещё периодически показывает чьи-то попытки отправки.

  3. Если я правильно понял, на семинаре было сказано, что при обучении будет доступна некоторая дополнительная информация о твитах: время появления в корпусе, оценки и пр.

    Однако это противоречит описанию (стр. 4): «train(self, training_corpus), где training_corpus - это список пар (text, class)».

    Если это так, то зачем в тренировочном json такие поля, как «created», «creator», «confirm» и «denied»? Что с ними предполагается делать? Обучаться офлайн на корпусе с дополнительными полями, а потом заново на новом корпусе?

  4. Скажите, пожалуйста, что за Error на моей программе? У меня работает.

  5. File can not be uploaded при попытке отправить программу

  6. Пишите лучше сразу Алексею Лагуте по таким вопросам

  7. Есть ли какой-нибудь лимит по времени? Например, 15 минут, час, два?

Comments are closed.

Спецкурс для студентов и аспирантов ВМК МГУ и ФКН ВШЭ