Re: Не может проиндексировать словарь Multitran 2009
Posted: Wed Feb 15, 2012 3:42 pm
Кстати, по поводу 5.23 млн статей... Должно быть по идее около 2.5млн, т.к. слова объединяются с одинаковым исходным словом . Это как раз часть стадии 3 - merging articles. 5.2 - это столько исходных статей. Эту агрегацию только для лингво делал, похоже GD настолько молодец, что сам может такое делать. Так вот, у меня тулса 2.6 млн статей дала на выходе, согласно GD , расскажи, как у тебя 5 получилось? (я ещё для лингвы часть с начала вырезал вручную статей, а то он пр генерации .lsd ругается, у меня кстати .lsd уже пару часов генерит, не завершился , GD конечно рулит, пару минут это делал). Было бы вообще клёво, чтобы мультитран просто GD мог на вход брать и конвертить, т.к. они уже всей зачисткой занимались, нужный код есть и не нужна отдельная утилита. Или можно весь код конвертирования в отдельную коммандную утилиту вынести, типа makedict, чтобы там была туча форматов поддерживаемых... Хотелось бы только, чтобы в GD была кнопка типа сконвертить в другой формат (скажем хотя бы .DSL). Вот мой скриншот c 2.6 млн статей:
PS. Кстати, а как спойлер тут на форуме делать, чтобы разворачиваться могла картинка по нажатию а не сразу показывать... ?
PS. Кстати, а как спойлер тут на форуме делать, чтобы разворачиваться могла картинка по нажатию а не сразу показывать... ?