Критичность проблемы, поднятой в первом посте, можно лучше понять при выборе словаря:
- heb-rus_strong.zip
- Древнееврейско-русский лексикон Ветхого Завета
- (293.91 KiB) Downloaded 2255 times
Создание словаря выполнялось по команде:
- Code: Select all
USERDATA_PATH="$HOME/Документы/Словари"; BD="heb-rus_strong"; cd /usr/share/dictd/dictmime; cat $USERDATA_PATH/$BD.html | sudo dictfmt -e -u 'http://michael72.radiushosting.ru/UPRAVLEN/DICT.shtml?td' -s "Древнееврейско-русский лексикон Ветхого Завета" --utf8 --columns 0 $BD; sudo dictzip $BD.dict
В отличие от словаря, на который даётся ссылка в первом посте, здесь не использовался ключ
--index-keep-orig, в результате чего четвёртый столбец со списком слов с огласовкой (некудот) и дагешами отсутствует. Принцип работы GoldenDict с этим столбцом был создан при
этом обсуждении.
Этот принцип работы оказался ошибочным. В мане к ключу
--index-keep-orig поясняется, что четвёртый столбец используется для MATCH запросов. См.
- Code: Select all
--index-keep-orig
When --utf-8 is specified headwords are lowercased and non-alphanumeric characters
are removed from it before saving to .index file in order to simplify the search.
When --index-keep-orig option is used fourth column is created (if necessary) in
.index file, and contains an original headword which is returned by MATCH command.
This option may be useful to prevent converting " AT&T" to " ATT" or to keep proper
nouns with uppercased first letter.
Из
этого обсуждения следует, что результаты от MATCH запросов на DICT-сервер показываются в выпадающем списке вариантов. Таким образом, было бы логично и для локальных DICT-словарей информацию из четвёртого столбца использовать только для списка вариантов. Сама же проблема поиска слов с диакритическими символами должна решаться не путём использования четвёртого столбца, а иначе.
Сперва необходимо проверить index-файл на наличие специального слова 00-database-allchars. Если это слово отсутствует, то искомое выражение предварительно должно быть очищено от всех символов, которые не являются алфавитно-цифровым или пробелом (например, при помощи функции iswalnum). Иначе используется искомое выражение как есть, без фильтрации.
Итак, сейчас ещё раз подробно опишу нашу ситуацию.
Что я делаю и что вижу на экране - шаг за шагом.Операционная система: Windows XP Home Edition, Service Pack 3
Версия словаря GoldenDict: 1.5.0-RC-533-g5ff9838
Словарь:
- heb-rus_strong.zip
- Древнееврейско-русский лексикон Ветхого Завета
- (293.91 KiB) Downloaded 2255 times
Установка словаряДля чистоты эксперимента перед установкой убедитесь, что такой словарь у вас ещё не установлен (например, тот, который доступен по ссылке в первом посте этого обсуждения). Если установлен, то выйдите из программы GoldenDict и удалите его из каталога, который в настройках GoldenDict указан для поиска файлов словарей. Затем запустите GoldenDict. Для установки словаря необходимо скопировать содержимое архива (файлы heb-rus_strong.dict.dz и heb-rus_strong.index) в один из каталогов, в котором GoldenDict ищет файлы словарей, затем выполнить команду
Пересканировать файлы.
Действия: В строке поиска напечатайте слово
אדם и нажмите на Enter. Будут показаны все словарные статьи для этого слова. Если в тексте имеется гипертекстовая ссылка на словарную статью, она будет выделена цветом (по умолчанию – синим) и подчеркиванием. Щелкнете на такой строке, которая является ссылкой на древнееврейское слово с огласовкой (некудот) – в основном окне должны будут показаны все статьи к слову, упомянутому в данной гипертекстовой строке. Например, найдите слово
גִּבּוֹר и щелкните по нему - в основном окне не будет выведена ни одна словарная статья к слову גִּבּוֹר.
Суть проблемы не в гипертекстовой ссылке. Например, если задать поиск по слову с огласовкой через строку поиска, Поиск не найдет все статьи.