New user registration is currently disabled due to spam abuse / Регистрация новых пользователей в настоящее время приостановлена из-за злоупотреблений спаммерами

Какой формат словаря предпочтителен?

Обо всём по программе

Какой формат словаря предпочтителен?

Postby Novikov » Tue Jan 24, 2012 12:45 pm

Какой формат словаря предпочтительнее в плане быстродействия и в плане потребляемых Goldendict'ом ресурсов?
Novikov
 
Posts: 164
Joined: Mon Jan 23, 2012 8:29 pm

Re: Какой формат словаря предпочтителен?

Postby Tvangeste » Wed Jan 25, 2012 8:29 am

Novikov wrote:Какой формат словаря предпочтительнее в плане быстродействия и в плане потребляемых Goldendict'ом ресурсов?

По опыту, без особой разницы. Но в стардиктовских и BGL словарях чаще грабли с форматированием (в исходных словарях обычно ;) ).

Так что лично я предпочитаю DSL формат, плюс пожатый dictzip'ом. Вот это очень помогает с уменьшением размера файла на диске. Ну и все дополнительные ресурсы (аудио, картинки) - обязательно в ZIP архив совать, а не хранить рядом с основным словарем, тоже сильно помогает со скоростью обращения к этим ресурсам.
Tvangeste
 
Posts: 893
Joined: Thu Jun 02, 2011 11:42 am

Re: Какой формат словаря предпочтителен?

Postby Novikov » Wed Jan 25, 2012 12:05 pm

Да, я вот тоже пришел к такому выводу, особенно по вопросам форматирования. Скачал в формате Stardict несколько словарей и обратил внимание на косяки с форматированием, а также на крайне невыгодное соотношение объемов собственно словаря и тегов.

DSL, на мой взгляд, тут существенно выигрывает, поэтому я засел за написание скриптов и регулярных выражений для конвертации и "причесывания" всех этих многомегабайтных Stardict'овских страшилок.

Тут еще вопросы есть:

1. Что даст компиляция в LSD? Есть ли где-то описание процесса компиляции, сути происходящих при этом изменений?
2. Скомпилированный в LSD словарь будет ли работать со звуками и картинками, положенными в zip рядом?
Novikov
 
Posts: 164
Joined: Mon Jan 23, 2012 8:29 pm

Re: Какой формат словаря предпочтителен?

Postby Tvangeste » Wed Jan 25, 2012 5:18 pm

Novikov wrote:DSL, на мой взгляд, тут существенно выигрывает, поэтому я засел за написание скриптов и регулярных выражений для конвертации и "причесывания" всех этих многомегабайтных Stardict'овских страшилок.


Собственно, практически все новые словари (в русскоязычном рунете по крайней мере) изначально появляются в DSL виде. И потом уже из них разными способами получаются стардиктовские словари. Поэтому в большинстве случаев ничего переконвертировать обратно не нужно, нужно всего лишь найти исходные словари в DSL виде ;)

Novikov wrote:1. Что даст компиляция в LSD? Есть ли где-то описание процесса компиляции, сути происходящих при этом изменений?

Ничго особого не даст. Не говоря о том, что это совершенно закрытый проприетарный бинарный формат, который понимает только GD на Андроиде. ;)

Novikov wrote:2. Скомпилированный в LSD словарь будет ли работать со звуками и картинками, положенными в zip рядом?

Не знаю, ибо никогда в LSD словари не храню, смысла нет.
Tvangeste
 
Posts: 893
Joined: Thu Jun 02, 2011 11:42 am

Re: Какой формат словаря предпочтителен?

Postby Novikov » Wed Jan 25, 2012 6:05 pm

Ну я искал словари Longman, в DSL они были на сайте traduko.lib.ru, но сайт тот оказался закрыт.

Нашел кучу хороших английских словарей в Stardict, попробовал подключить -- и обнаружил кучу косяков. Например, там уровни вложенности были заданы тегами blockquote, а они отображаются в GD с огромными отступами и интервалами, пользоваться невозможно.

При помощи EditPad (отлично работает с гигантскими файлами) и регулярок конвертировал в DSL и почистил.

По поводу LSD у меня такое ощущение, что там как-то отделяются заголовки, отделяются карточки, прописывается привязка заголовков к карточкам, сокращается масса служебных тегов и проставляется что-то для индексации.

Вот я и подумал, вдруг этот формат будет работать в GD быстрее, чем пожатый Dictzip'ом DSL.
Novikov
 
Posts: 164
Joined: Mon Jan 23, 2012 8:29 pm

Re: Какой формат словаря предпочтителен?

Postby ikm » Thu Jan 26, 2012 1:59 am

LSD обычно занимает чуть больше места, чем DSL. А также он ни с чем не совместим. Плюс LSD в том, что он быстрее индексируется, а также в том, что можно весь словарь (вместе с ресурсами) иметь одним файлом. С zip-файлами оно в данный момент не работает (может, добавлю в след. версиях) - лучше всего сразу положить все ресурсы внутрь.
ikm
Автор GoldenDict
 
Posts: 1595
Joined: Wed Feb 04, 2009 10:40 am

Re: Какой формат словаря предпочтителен?

Postby Novikov » Thu Jan 26, 2012 1:24 pm

У меня, кстати, на маленьких файлах LSD занял больше места, а на больших -- меньше. Возможно, за счет дублей.
Novikov
 
Posts: 164
Joined: Mon Jan 23, 2012 8:29 pm

Re: Какой формат словаря предпочтителен?

Postby ikm » Thu Jan 26, 2012 4:55 pm

Под dsl имелись в виду, разумеется, dsl, сжатые dictzip.
ikm
Автор GoldenDict
 
Posts: 1595
Joined: Wed Feb 04, 2009 10:40 am

Re: Какой формат словаря предпочтителен?

Postby Novikov » Thu Jan 26, 2012 7:21 pm

Да, я про сжатый, специально сравнивал, правда, на "грязном" словаре с кучей дублированных карточек.
Novikov
 
Posts: 164
Joined: Mon Jan 23, 2012 8:29 pm


Return to Общий

Who is online

Users browsing this forum: No registered users and 2 guests

cron