Page 1 of 1

Две карточки для одного слова при включенной морфологии

PostPosted: Wed May 06, 2009 9:01 am
by gromescu
Есть два слова, различающиеся только диакриткой (grupa и grupă). Задаю поиск grupa, выбираю слово без диакритки и получаю в окне перевода сразу 2 карточки - для grupa и grupă. Если выбрать в списке grupă - то показывается одна карточка для grupă, т.е. так как надо. Если отключить морфологию, то все отображается корректно.

В общем, вот скриншот.
Image

Re: Две карточки для одного слова при включенной морфологии

PostPosted: Wed May 06, 2009 9:12 am
by gromescu
Update: Хотя, возможно, все правильно. Морфологический словарь воспринимает grupa и как глагол и как определенную форму существительного и подсовывает сразу два варианта, чтобы какой-то подошел наверняка.

Re: Две карточки для одного слова при включенной морфологии

PostPosted: Wed May 06, 2009 9:14 am
by ikm
Это не ошибка. grupă является формой глагола grupa (el grupă - простое прошедшее время). Поэтому тут два значения - существительное и глагол.

Re: Две карточки для одного слова при включенной морфологии

PostPosted: Wed May 06, 2009 10:02 am
by gromescu
С этим я уже разобрался. Но тут возникает другой вопрос: есть ли смысл сбивать пользователей с толку двумя карточками для одного запроса? Может логичнее в списке отдельно выводить вариант из морфологического словаря. На данном примере:

grupa
grupa
grupă

первый вариант показывает только карточку для глагола, второй отображает все возможные варианты, с учетом морфологии, а третий отображает только существительное.

Это не ошибка. grupă является формой глагола grupa (el grupă - простое прошедшее время). Поэтому тут два значения - существительное и глагол.

Вариант с perfectul simplu, кстати, myspell видимо не учитывает иначе по запросу grupă он также предлагал бы две карточки

Re: Две карточки для одного слова при включенной морфологии

PostPosted: Wed May 06, 2009 10:39 am
by ikm
gromescu wrote:С этим я уже разобрался. Но тут возникает другой вопрос: есть ли смысл сбивать пользователей с толку двумя карточками для одного запроса?

Если введенное слово может быть как формой глагола, так и существительным, словарь выдает обе возможности. А пользователю уже должно быть виднее из контекста переводимого текста, что он там имеет - существительное или глагол.

По поводу всего остального. Я потерялся во всех этих интерпретациях. Давайте подойдем к вопросу более технически. Сейчас морфология может предоставлять стемы для вводимого слова. Грубо говоря, для глаголов это инфинитив, для существительных это единственное число, и тому подобное. Эти стемы подмешиваются в основной запрос. Вопрос: что в этом может быть плохо и как это хочется изменить?

gromescu wrote:Вариант с perfectul simplu, кстати, myspell видимо не учитывает иначе по запросу grupă он также предлагал бы две карточки

Да, тут вообще чепуха какая-то. Короче, что там в файле морфологии написано - то и используется. Видимо, там просто ошибка - по grupă мы должны иметь и grupa, и grupă, а по grupa мы должны иметь только grupa. Они довольно несовершенны, эти файлы, потому что все создавались для проверки орфографии. Сам формат, однако, позволяет делать анализ достаточно качественно - просто контент на данный момент не очень.