Page 5 of 6

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Mon Oct 15, 2012 4:46 pm
by trauschauwem
хорошо, попробую разделить dsl файл на две части, если получится. просто странно это, ведь англо-русская версия по размеру такая же, а она нормально проиндексировалась. спасибо за совет, тем не менее.

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Tue Oct 16, 2012 7:25 am
by quicktrick
Смартфон не тянет. У меня на Мотороле Атрикс всё индексируется нормально. Гигабайт оперативки надо для индексации таких словарей. Пробовал тут, кстати, СГС3 -- классный смартфон, лучше моего Атрикса в разы, быстрее раза в три работает. HTC One X тоже должен быть отличный.

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Tue Oct 16, 2012 7:55 am
by Tvangeste
quicktrick wrote:Смартфон не тянет.

Та версия Мультитрана, что по сети гуляет, там именно в русско-англ. направлении какие-то странности, индекс занимает в несколько раз больше места, чем в обратном направлении. Какая-то особенность словаря, может где ошибки или еще что в самом DSL, просто среди миллионов карточек оно не так заметно пользователю, но заметно Голдендикту и Лингво... ;) В общем, словарь надо на части бить, если не влезает целиком.

quicktrick wrote:У меня на Мотороле Атрикс всё индексируется нормально. Гигабайт оперативки надо для индексации таких словарей. Пробовал тут, кстати, СГС3 -- классный смартфон, лучше моего Атрикса в разы, быстрее раза в три работает. HTC One X тоже должен быть отличный.

Не могу удержаться! :) А еще лучше Samsung Galaxy Note II - и быстрый и экран очень большой, как раз удобно для чтения статей в Голдендикте, и памяти 2 гига, что полезно сказывается на индексации Мультитрана! :)

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Sun Dec 30, 2012 11:19 pm
by s0hm
Не могу удержаться! :D Мне удалось проиндексировать multitran, и даже urban dictionary, и они работают на сером zte blade с 256mb ram, из которых реально доступно только 168! Вобщем история такая: качнул multitran, ru_en и en_ru, каждый разбитый на 3 части по ~ 300 мбайт, но памяти моего девайса для полной индексации не хватило. (Процесс доходил до 2/3). Попросил друга проиндексировать на nexus s с 512mb ram, - индексация прошла успешно, заодно проиндексировал urban dictionary, 2 части по ~ 700 мбайт. Залил в zte - все работает. Если кому нужно - выложу индексы и словари. А samsung galaxy note II не для нищебродов, мой аппарат с картой на 16gb обошелся мне всего в 5 килорублей, что в 5 раз дешевле GN II :D Так что на самом деле не гигабайт оперативки нужен для индексации таких словарей, и не 2, а достаточно всего 512mb.

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Sun Feb 03, 2013 5:08 pm
by arkaim
Во-первых огромное спасибо за мега крутую утилиту!
Вопрос к уважаемому moytra, в немецком словаре утеряна важная вещь при конвертации - отсутствуют род и окончания для множественного числа для немецких слов. Это очень важный момент, поскольку без знания рода невозможно правильно склонять слово и использовать артикли в безличных предложениях.
Возможно как-то можно перенести недостающие элементы. Какие для этого ключи использовать?
Заранее благодарен!

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Thu Feb 07, 2013 8:33 am
by s0hm
Кстати в cyanogenmod и других кастомных прошивках можно добавить раздел swap 256 mb (через clockworkmod), если в вашем девайсе маловато памяти для индексации.

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Wed Feb 13, 2013 6:59 pm
by moytra
arkaim wrote:Во-первых огромное спасибо за мега крутую утилиту!
Вопрос к уважаемому moytra, в немецком словаре утеряна важная вещь при конвертации - отсутствуют род и окончания для множественного числа для немецких слов. Это очень важный момент, поскольку без знания рода невозможно правильно склонять слово и использовать артикли в безличных предложениях.
Возможно как-то можно перенести недостающие элементы. Какие для этого ключи использовать?
Заранее благодарен!


Насколько помню там была сложная некая структура для хранения словоформ и некоторых из характеристик (возможно, рода). Я решил не разбираться и не писать до конца полную поддержку всего подряд. Основная моя цель была англ/рус, а остальные языки уже по аналогии сделал. И видимо для немецкого нечто особое в структурах хранилось, чего не было для английского. А можно несколько примеров как это в оригинальном мультитране отображается и как у меня?

PS. Если есть желающие похакерить знатоки C++, то исходники утилиты доступны (думаю, раньше ссылку давал, там же где и скомпилированная версия), можно усовершенствовать.

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Wed Feb 13, 2013 7:56 pm
by arkaim
moytra wrote:Насколько помню там была сложная некая структура для хранения словоформ и некоторых из характеристик (возможно, рода). Я решил не разбираться и не писать до конца полную поддержку всего подряд. Основная моя цель была англ/рус, а остальные языки уже по аналогии сделал. И видимо для немецкого нечто особое в структурах хранилось, чего не было для английского. А можно несколько примеров как это в оригинальном мультитране отображается и как у меня?

Скриншоты во вложении. На скриншоте МТ видно что это женский род (f), множественное число имеет окончание -en
Я думаю тут дело не в алгоритмах программы. Похоже эта информация хранится в отдельных словарях типа:
- end.ger
- endnum.ger
- plurals.ger

И еще было бы хорошо, если бы переносились данные (ник) автора который добавил перевод. Похоже, что это файл:
autor.ger (для английского думаю по аналогии)

Спасибо!

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Tue Apr 02, 2013 9:43 am
by scowl
moytra, моё уважение! осталось только разобраться с компилятором)

Re: Не может проиндексировать словарь Multitran 2009

PostPosted: Mon Apr 21, 2014 7:41 pm
by socrates
Не работает ссылка на Гугл. Не могли бы кто-нибудь выложить файл readme для multitran tool? Я забыл как раньше его конвертировал. Спасибо!