Page 1 of 1

Три варианта оффлайн вики для GD

PostPosted: Wed Apr 17, 2013 6:57 am
by microspace
Здравствуйте
Цель: получить оффлайн вики-семейство (википедия, викисловарь и т.п.) с картинками, внутренними ссылками, интервики-ссылками, ссылками между разными вики проектами (например википедия и викисловарь) и, возможно, полнотекстовым поиском для использования вместо встроенного arrddict.
Интервики-ссылка - Ссылки между одинаковыми статьями в разных языковых разделах.
Aarddict в составе GD не имеет картинок, нет интервики-ссылок. Компиляция актуальных версий вики проходит очень долго (до 4-х дней)

Альтернатива первая:
Установить вики-семейство в виде локального веб-сервера.
Плюсы: есть картинки, языковые ссылки, полнотекстовый поиск.
Минусы: долгий и сложный процесс установки.

Альтернатива вторая:
Kiwix
Плюсы: Позволяет просматривать эскизы картинок в статье, запускается как веб-сервер. Возможно запустить несколько kiwix-серверов. Имеет встроенный полнотекстовый поиск на основе xapian.
Минусы: нет интервики-ссылок. Я не нашел способ скомпилировать вики самостоятельно. На сайте проекта есть только википедия, других скомпилированных проектов вики нет.

Альтернатива третья:
Очень свежий проект xowa. Основан на Java.
Плюсы: работает напрямую с xml-дампом вики. Позволяет добавлять любой имеющийся вики-проект. Есть интервики-ссылки. Все ссылки работают. Картины подгружаются из Интернета по мере просмотра картинок. С помощью консольной команды можно извлекать статьи в виде html-документа. В будущем автор проекта планирует встроить полнотекстовый поисковик, а пока статьи ищутся по заголовкам.
Минусы: Не запускается как веб-сервер. Вызов статьи из командной строки занимает 4-6 секунд

Re: Три варианта оффлайн вики для GD

PostPosted: Wed Apr 17, 2013 7:44 am
by Tvangeste
microspace wrote:Aarddict в составе GD не имеет картинок, нет интервики-ссылок.

А что такое интервики-ссылки, можно примерчик?

Re: Три варианта оффлайн вики для GD

PostPosted: Wed Apr 17, 2013 9:12 am
by dg333

Re: Три варианта оффлайн вики для GD

PostPosted: Wed Apr 17, 2013 10:26 am
by microspace
Tvangeste wrote:А что такое интервики-ссылки, можно примерчик?

интервики-ссылки включают в себя также ссылки на переводы просматриваемой статьи на других языках. Список всех ссылкок обычно виден в левой части Это очень удобно когда ищешь на иностранном языке, а более подробную информацию хочешь прочитать на родном языке.

Re: Три варианта оффлайн вики для GD

PostPosted: Sun Jun 02, 2013 7:35 am
by FlexS
microspace wrote:Здравствуйте
Цель: получить оффлайн вики-семейство (википедия, викисловарь и т.п.) с картинками, внутренними ссылками, интервики-ссылками, ссылками между разными вики проектами (например википедия и викисловарь) и, возможно, полнотекстовым поиском для использования вместо встроенного arrddict.
Интервики-ссылка - Ссылки между одинаковыми статьями в разных языковых разделах.
Aarddict в составе GD не имеет картинок, нет интервики-ссылок. Компиляция актуальных версий вики проходит очень долго (до 4-х дней)

Альтернатива первая:
Установить вики-семейство в виде локального веб-сервера.
Плюсы: есть картинки, языковые ссылки, полнотекстовый поиск.
Минусы: долгий и сложный процесс установки.

Альтернатива вторая:
Kiwix
Плюсы: Позволяет просматривать эскизы картинок в статье, запускается как веб-сервер. Возможно запустить несколько kiwix-серверов. Имеет встроенный полнотекстовый поиск на основе xapian.
Минусы: нет интервики-ссылок. Я не нашел способ скомпилировать вики самостоятельно. На сайте проекта есть только википедия, других скомпилированных проектов вики нет.

Альтернатива третья:
Очень свежий проект xowa. Основан на Java.
Плюсы: работает напрямую с xml-дампом вики. Позволяет добавлять любой имеющийся вики-проект. Есть интервики-ссылки. Все ссылки работают. Картины подгружаются из Интернета по мере просмотра картинок. С помощью консольной команды можно извлекать статьи в виде html-документа. В будущем автор проекта планирует встроить полнотекстовый поисковик, а пока статьи ищутся по заголовкам.
Минусы: Не запускается как веб-сервер. Вызов статьи из командной строки занимает 4-6 секунд


Всё это хорошо, но есть ли нулевая альтернатива (Goldendict)?
И как собрать оффлайн вики самому, если имеющиеся кажутся устаревшими?

Re: Три варианта оффлайн вики для GD

PostPosted: Sun Jun 02, 2013 12:14 pm
by microspace
FlexS wrote:Всё это хорошо, но есть ли нулевая альтернатива (Goldendict)?

Что значит нулевая?
FlexS wrote:И как собрать оффлайн вики самому, если имеющиеся кажутся устаревшими?

Чтобы воспользоваться xowa нужен только дамп вики. И время
Чтобы собрать aard словарь нужно воспользоваться инструкцией на их сайте. И много времени (2-5 дней в зависимости от размера) Кстати там довольно свежие версии вики.
Есть еще проект по переводу aard в формат stardict. Они выкладывают популярные вики в stardict формате.