Page 1 of 1

Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 10:51 am
by regnbage
Что потеряет словарь если текст будет не в кодировке UCS-2 Little Endian, а в UTF-8?
Заметил, что в GD UTF-8 словари работают, а Lingvo их компилировать не хочет.

Подойдёт ли какая-либо кодировка для всех случаев?

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 12:10 pm
by Abs62
Заметил, что в GD UTF-8 словари работают, а Lingvo их компилировать не хочет.

Вот именно это и потеряет. Возможность скомпилировать его в Lingvo.
Подойдёт ли какая-либо кодировка для всех случаев?

UTF-16LE и подойдёт.

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 12:29 pm
by regnbage
Abs62
Спасибо.

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 1:46 pm
by regnbage
В Notepad++ 5.7 (Unicode)

- Открываю DSL файл в UTF-8.
- Ctrl+A, Ctrl+X
- Меняю кодировку на UCS-2 Little Endian.
- Ctrl+V, Ctrl+S
- Закрываю файл
- Открываю снова

На одном и том же самом обычном месте каждый раз появляются крякозябры. Причём, до закрытия их нет, а после открытия они есть. :) Пока нашёл их только в одном месте. Есть ли способ искать крякозябры автоматически?

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 2:32 pm
by Abs62
А что там за символы? Не суррогатные пары, случаем? Всё-таки UCS-2 - это не совсем UTF-16.

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 5:50 pm
by regnbage
Не знаю. Выявил ещё один крякозябр в том же файле. Причём, появляется либо один, либо другой, но не вместе.
№1 вместо
Code: Select all
кого-либо[
Code: Select all
кого-лؐѐޛ

№2 вместо
Code: Select all
дерева[
Code: Select all
деՐҐЛ

как можно заметить в обоих случаях последний исковерканный символ - это [

Пробовал перекодировать в других программах и такого эффекта не достиг. Вопрос переходит в разряд теоретических.

Re: Кодировка Юникода в словарях

PostPosted: Fri Nov 16, 2012 9:22 pm
by Tvangeste
А рефреш словарей делаете после изменения содержимого? Ctrl-F5.

Re: Кодировка Юникода в словарях

PostPosted: Sat Nov 17, 2012 6:22 am
by regnbage
Вообще делаю, а в данном случае в GD не проверял. А зачем?

Re: Кодировка Юникода в словарях

PostPosted: Sat Nov 17, 2012 5:07 pm
by Tvangeste
regnbage wrote:Вообще делаю, а в данном случае в GD не проверял. А зачем?

Я когда с DSL словарями работаю и меняю их на лету, то без рефреша в GD часто вижу похожие кракозябры и как бы битые словари. После рефреша словарей всё ОК. Ну или после рестарта GD.

Re: Кодировка Юникода в словарях

PostPosted: Tue Nov 20, 2012 7:38 am
by regnbage
Tvangeste
Понятно. Здесь они обнаруживались после закрытия dsl файла в Notepad++ и повторного открытия.