New user registration is currently disabled due to spam abuse / Регистрация новых пользователей в настоящее время приостановлена из-за злоупотреблений спаммерами

Восприятие dsl-словарей, пожатых GZip

Сообщаем о найденных ошибках сюда

Восприятие dsl-словарей, пожатых GZip

Postby Oliver » Wed May 13, 2009 6:21 pm

Версия для Windows. Ошибка - не ошибка, но отсутствие защиты от дурака. Найдено случайно :-)
Работала в Windows XP. Но здесь, наверное, даже эта деталь непринципиальна.

Если предложить программе словарь .dsl, заархивированный не DictZip'ом, а просто GZip'ом, она не распознает подмены: примет словарь, проиндексирует, будет искать в нём слова. Конечно, словарь для этого нужно переименовать из *.dsl.gz в *.dsl.dz... А при попытке выдать результат запроса, составную карточку - будет вылетать, если в результатах должны фигурировать статьи из такого словаря. Вылетает по-разному, но всегда; процесс остаётся в памяти.

А ход мыслей для человека непосвящённого, не знающего, что такое DictZip, вполне логичный. Анонсирована возможность архивировать словари DSL, с программой идут сжатые словари, сжаты (как определит наугад взятый архиватор) GZip'ом... но со странным расширением. Предупреждений вроде нет, сам GoldenDict такой подставы тоже не ожидает :-)

У меня вылетала на словарях .dsl, пожатых 7z 4.65 по алгоритму GZip с компрессией Ultra.

А с нормально пожатыми DictZip'ом работает замечательно, просто загляденье! Правда, найти DictZip для Windows оказалось очень нелегко. Такое ощущение, будто в инете всего одна ссылка на standalone сборку оного. Удивительно. Не стОит ли включать этот архиватор в дистрибутив?
Oliver
 
Posts: 22
Joined: Wed May 13, 2009 6:06 pm

Re: Восприятие dsl-словарей, пожатых GZip

Postby Gloggy » Wed May 13, 2009 6:38 pm

Oliver wrote:А с нормально пожатыми DictZip'ом работает замечательно, просто загляденье! Правда, найти DictZip для Windows оказалось очень нелегко. Такое ощущение, будто в инете всего одна ссылка на standalone сборку оного. Удивительно.

Есть такое дело, да. ;)

Oliver wrote: Не стОит ли включать этот архиватор в дистрибутив?

Я так понял, что рано или поздно GD сам будет уметь жать словари, так что пользователям не придется мучиться с незнакомой командной строкой.
Gloggy
Модератор
 
Posts: 516
Joined: Wed May 06, 2009 3:01 pm

Re: Восприятие dsl-словарей, пожатых GZip

Postby Gloggy » Wed May 13, 2009 6:41 pm

Кстати, ради интереса потестировал как dictzip жмет DSL файлы. Ну и вот, на 500мб-ный DSL одного огромного словаря получается 95Mb LSD файл и 81Mb dsl.dz файл (пожатый DSL при помощи dictzip). В общем, неплохо. А если жать файл, который изначально не в UTF-16, а в UTF-8 кодировке, которая более экономная, то получается в итоге всего 75мб. Как-никак, а 20мб разницы против оригинального LSD. Оч. хорошо! :)
Gloggy
Модератор
 
Posts: 516
Joined: Wed May 06, 2009 3:01 pm

Re: Восприятие dsl-словарей, пожатых GZip

Postby gromescu » Wed May 13, 2009 7:42 pm

Gloggy wrote:Кстати, ради интереса потестировал как dictzip жмет DSL файлы. Ну и вот, на 500мб-ный DSL одного огромного словаря получается 95Mb LSD файл и 81Mb dsl.dz файл (пожатый DSL при помощи dictzip). В общем, неплохо. А если жать файл, который изначально не в UTF-16, а в UTF-8 кодировке, которая более экономная, то получается в итоге всего 75мб. Как-никак, а 20мб разницы против оригинального LSD. Оч. хорошо! :)

В lsd при сжатии как правила добавляется разметка [trn] и прочее + наверное какая-то служебная информация. Возможно отчасти из-за этого размер получается меньше.
gromescu
 
Posts: 76
Joined: Sun Apr 05, 2009 2:25 pm

Re: Восприятие dsl-словарей, пожатых GZip

Postby Oliver » Fri May 15, 2009 3:37 pm

Gloggy wrote:Я так понял, что рано или поздно GD сам будет уметь жать словари, так что пользователям не придется мучиться с незнакомой командной строкой.

Так строка-то у него обычная. Даже попроще, чем у иных архиваторов: команда на сжатие с удалением исходника даётся вообще без параметров, кроме имени исходника. Проблема не в командной строке, а в малой доступности DictZip под виндой. Не сырцов, а собранной работающей версии. Сама по себе командная строка проблем создавать не должна, если люди пользуются файловым менеджером с таковой.
Oliver
 
Posts: 22
Joined: Wed May 13, 2009 6:06 pm


Return to Ошибки

Who is online

Users browsing this forum: No registered users and 21 guests