opencorpora

OpenCorpora — это проект по созданию размеченного корпуса текстов силами сообщества. Корпус будет доступен бесплатно и в полном объёме (под лицензией CC-BY-SA). Мы создаём хранилище текстов, специально предназначенное для текстов с лингвистической разметкой, удобный интерфейс редактирования разметки и исправления ошибок, инструменты для контроля качества и стандарт разметки для русского языка.
Официальные лица
Я хотел бы...
Последние отзывы
x  или  xСортировка:  x  x  x

0

голосов

"столичном аэропорту « Домодедово »" не получается выделить как единый спан.

wtom, 30.12.2015, 13:18
нет комментариев

0

голосов

Ранжирование задач чтобы в топе были те задачи на которых автоматические методы ошибаются хуже всего

Натренировать статистические модели (supervised learning) которые предсказывает аннотацию и её неопределённость по тексту, ранжировать по неопределённости. Может вы уже такое делаете?
нет комментариев

0

голосов

Маловато, многовато, немного и т.п. ( в свежих правках на 26.01. 18:01)

В свежих правках сейчас заметила много правок от Shadow, в которых такие слова как "многовато", "маловато", "немного", "много", "мало", "достаточно", "недостаточно" и т.п. все...
Olga, 26.01.2016, 17:05
1 комментарий

0

голосов

Слова только нет в инструкции к союз/наречие/частица

Слова только нет в инструкции к союз/наречие/частица, однако оно есть в заданиях и есть в инструкции к союз/частица.
А, 12.05.2016, 16:04
1 комментарий

0

голосов

Видео в faq http://video.yandex.ru/users/nataxane/view/2/ недоступно.

На странице http://opencorpora.org/?page=faq есть ссылка на видео http://video.yandex.ru/users/nataxane/view/2/, но на момент 19.05.16 яндекс говорит, что видео не найдено.
Дмитрий, 19.05.2016, 11:33
нет комментариев

0

голосов

Нельзя ли "NOUN, inan, ..." писать по-русски?

Нельзя ли "NOUN, inan, ..." писать по-русски? Намного быстрее пойдёт работа по ручному снятию неоднозначностей!
Александр, 15.06.2016, 22:52
2 комментария

0

голосов

"Хочу еще примеров"

После нажатия кнопки "Хочу еще примеров" нужно возвращать к верху страницы автоматически. Сейчас- приходится каждый раз скроллить. Особенно неудобно на смартфоне.
Dmitry Tumaykin, 13.09.2016, 23:29
нет комментариев

0

голосов

Ачивки за точность

Предлагаю ачивки за точность. Например, 5%, 1%, 0,5%, 0,1%, 0,05% Чем выше точность личной разметки, тем круче ачивка. Градацию посмотрите сами - рассортируйте текущую выборку участников с весомым вкладом. Выше - условная.
Dmitry Tumaykin, 13.09.2016, 23:33
1 комментарий

12

голосов

Учитывать сложность заданий в статистике.

Наверно, стоит давать больше баллов за сложные задания.
Fedor Nikolaev, 04.04.2013, 12:02
1 комментарий

2

голоса

Источник морфологического словаря?

Как составлен (составляется?) морфологический словарь, выложенный на сайте? Какие источники в него вошли?
Официальный ответ
opencorpora, 23.05.2013
Сергей, это переработанный словарь проекта АОТ (aot.ru), который в свою очередь является доработанным словарём Зализняка.
Сергей Слепов, 23.05.2013, 17:44
нет комментариев

1

голос

Более сложные - более медленные

Отчего-то при работе с красными пулами сервер куда менее охотно отдаёт задания - их загрузка работает безумно медленно. Наблюдаю это полгода уж точно, как такое может быть - не понимаю.
Анастасия Львова, 08.12.2013, 16:13
нет комментариев

0

голосов

Обновите таймзону на сайте

У вас сейчас +4, а в Москве теперь снова +3
Alex Dvoretsky, 26.10.2014, 23:34
1 комментарий

Страницы< 1 2 >