Page 1 of 4

Добро пожаловать!

PostPosted: Sat Feb 07, 2009 10:51 pm
by Admin
Форумы созданы, можно начинать в них писать. Скоро будет первый релиз, так что будет что обсудить.

Re: Добро пожаловать!

PostPosted: Sat Feb 21, 2009 11:08 pm
by Ars
привет)
я смотрю, проект понемногу развивается? :)

Re: Добро пожаловать!

PostPosted: Sun Feb 22, 2009 12:19 am
by ikm
Привет :)

Ага. В принципе, в релизе 0.5 все, что надо, уже есть и прекрасно работает. Остается только рюшечек навешать. Надо бы заняться. Сейчас переделываю внутреннюю структуру запросов, чтоб можно было формировать долгоживущие запросы. Поверх этого будет для начала поддержка dictd-протокола, а в будущем еще чего угодно сетевого.

В идеале вообще пользователю удобней, когда все словари живут где-то на сервере, и он вообще о них не заботится. Вот только единственное, что есть на эту тему -- это dictd. А там словари оптимизированы под моноширинный текстовый терминал... Всё остальное либо насквозь закрытое, либо это просто веб-сайты без вменяемого внешнего api. И даже википедия, имея внешнее api, кошмарно сложно рендерится (одного css там килобайт на сто). Можно конечно сделать свой словарный сервер, только вот все равно большинство словарей несвободны ни разу, и сделать паблик сервер не получится. В общем, словари вещь нишевая.

Такие дела.

Re: Добро пожаловать!

PostPosted: Sun Feb 22, 2009 10:23 pm
by Ars
Насчет свободности, это вопрос спорный. Во-первых, что понимать под свободностью? Наличие в открытом формате (не требующих декомпиляции)? Так подобных словарей наберется не менее сотни, а то и больше. Например, на том же XDXF. Другое дело, что они там отформатированы задницей (в основном), поэтому придется еще провести работу по вычищению и конвертации. Во-вторых, все они, как правило, GPL, а это для нас только хорошо. В-третьих, ХОРОШИХ словарей на самом деле не так и много, а те, что есть (Апресян, Мюллер, и т.д.) были выпущены еще во времена СССР, когда никаких лицензий не существовало. Собственно, Лингво сделала просто - взяла шаровые электронные словари, отформатировали, добавили озвучку и выдали как свое. Поэтому, не вижу проблем в создании своего паблик сервера (мы сейчас как раз работаем над движком).

Re: Добро пожаловать!

PostPosted: Sun Feb 22, 2009 11:42 pm
by ikm
Под свободностью я имею в виду наличие четкой лицензии, разрешающей свободное размещение словаря и доступ к нему в публичном режиме. И вот тут -- ни разу они не под GPL... Насколько я понимаю, практически единственным таким словарем среди русскоязычных является Мюллер седьмой (и только седьмой) редакции. Все остальные не пойми под чем. Среди англоязычных толковых ситуация чуть лучше: Webster, WordNet и прочие их компиляции. Французский: литтре. Немецкий: словарь из ding, наверное... В общем, по разным группам набирается немножко словарей -- по сусекам поскребли, и просто-таки ни дать ни взять колобок какой-то получается.

Все эти словари в общем-то уже есть в dict-серверах, хотя и с фиговым форматрированиям, аля _вот так_ и {так}, и по границе 80 символов.

В принципе, многим людям простого мюллера достаточно, и таких людей, как мне кажется, форматирование не смутит.

Конечно, со многими словарями ситуация такая, что правообладателей или толком нет, или же им неинтересны проблемы циркуляции их словарей в электронном виде. Можно сделать сервер с нормальным форматированием и разместить там более-менее непроблемные словари. Однако это не даст возможности полностью отказаться от офлайн-словарей. Например, по португальскому направлению ничего толкового в свободном доступе я не видал вообще. Ну и так далее. Словари -- это ниша. Недаром словарные программы клепают в основном русские и китайцы.

Тем не менее, могу только поприветствовать создание нормального сервера.

Re: Добро пожаловать!

PostPosted: Mon Feb 23, 2009 8:41 am
by Ars
Я думаю, что наличие или отсутствие бюрократии в виде лицензий нас смущать не должно :)
Фактически, на сайте http://xdxf.sourceforge.net/ собрано очень много GPL & Public словарей, в том числе Мюллер 7 и 24, БАРС Апресяна, Ожегов, ну и еще штук 200+ других. Поэтому априори можно считать их Public Domain, так как за 4-5 лет существования проекта никто не оспорил их присутсвие там.
Это в принципе может сделать только автор словаря, а печатные издательства к ним никакого отношения не имеют (так же, как и конторы типа Лингво).
К тому же, срок давности для большинства давно прошел :)

Re: Добро пожаловать!

PostPosted: Mon Feb 23, 2009 11:23 am
by ikm
Ru<->En и En<->En направления представлены достаточно хорошо, согласен. Однако с остальными языками ситуация похуже.

Re: Добро пожаловать!

PostPosted: Mon Feb 23, 2009 11:52 am
by Ars
Согласен, сам долго искал немецкие словари (вменяемые). Нашел только 1, и то с убитым форматированием.
Ну что ж, будем конвертор делать, приводить в человеческий вид :)

Re: Добро пожаловать!

PostPosted: Mon Feb 23, 2009 12:01 pm
by ikm
Проблема в том, что большинство вменяемых электронных словарей созданы коммерчески и с коммерческими целями. Не думаю, что правообладатели вправе запрещать делать совместимые словарные программы, но вот распространять сами словари или делать сервисы на их основе не получится.

Так или иначе, сделать подборку словарей, находящихся "условно" в public domain (т.е. без активных правообладателей) и сетевой сервис на их основе -- дело неплохое. Хостинг правда еще нужен, который согласится хостить такой сервис, но это вопрос десятый.

Re: Добро пожаловать!

PostPosted: Mon Feb 23, 2009 12:50 pm
by Ars
Так никто ж не говорит о том, чтобы выкладывать коммерческие словари.
Например, в Лингво входит БАРС - но их права ограничиваются только файлом, который они сами создали на основе контента, созданного Апресяном и компанией. Мы не можем выложить лингвовский файл, но можем взять исходники БАРСа и обработать как нам хочется, представив в своем формате.