15еместо

1

голос

Разметка

На планируете ли делать синтаксис? Вообще есть ли какие то характеристики связи между токенами?

Макс, 26.05.2015, 17:41
Статус идеи: ожидает рассмотрения

Комментарии

Виктор Бочаров, 04.06.2015, 08:51
Планируем. Думаем о том, как разделить его на маленькие и понятные всем задачи. Есть идеи?
Макс, 04.06.2015, 17:28
У меня такая идея. Можно запарсить ваши тексты синтаксическим анализатором, который берет на вход предложение и возвращает граф. MaltParser неплохо определяет (из того, что я знаю). Потом предъявлять пользователю предложение и пары слов (узлов в этом графе) и попросить отметить 1) есть ли между словами синт. связь 2) правильно ли определено главное и зависимое слово 3) тип связи (здесь сложнее будет, наверное).
Альтрнативный вариант, генерировать пары слов случайным образом без предварителного синт. разбора. И дальше в такой же последовательности. Но тогда придется перебирать больше вариантов.

Оставить комментарий