New user registration is currently disabled due to spam abuse / Регистрация новых пользователей в настоящее время приостановлена из-за злоупотреблений спаммерами

Кодировка Юникода в словарях

Всё по словарям

Кодировка Юникода в словарях

Postby regnbage » Fri Nov 16, 2012 10:51 am

Что потеряет словарь если текст будет не в кодировке UCS-2 Little Endian, а в UTF-8?
Заметил, что в GD UTF-8 словари работают, а Lingvo их компилировать не хочет.

Подойдёт ли какая-либо кодировка для всех случаев?
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am

Re: Кодировка Юникода в словарях

Postby Abs62 » Fri Nov 16, 2012 12:10 pm

Заметил, что в GD UTF-8 словари работают, а Lingvo их компилировать не хочет.

Вот именно это и потеряет. Возможность скомпилировать его в Lingvo.
Подойдёт ли какая-либо кодировка для всех случаев?

UTF-16LE и подойдёт.
Abs62
 
Posts: 624
Joined: Mon Jun 14, 2010 11:51 am

Re: Кодировка Юникода в словарях

Postby regnbage » Fri Nov 16, 2012 12:29 pm

Abs62
Спасибо.
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am

Re: Кодировка Юникода в словарях

Postby regnbage » Fri Nov 16, 2012 1:46 pm

В Notepad++ 5.7 (Unicode)

- Открываю DSL файл в UTF-8.
- Ctrl+A, Ctrl+X
- Меняю кодировку на UCS-2 Little Endian.
- Ctrl+V, Ctrl+S
- Закрываю файл
- Открываю снова

На одном и том же самом обычном месте каждый раз появляются крякозябры. Причём, до закрытия их нет, а после открытия они есть. :) Пока нашёл их только в одном месте. Есть ли способ искать крякозябры автоматически?
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am

Re: Кодировка Юникода в словарях

Postby Abs62 » Fri Nov 16, 2012 2:32 pm

А что там за символы? Не суррогатные пары, случаем? Всё-таки UCS-2 - это не совсем UTF-16.
Abs62
 
Posts: 624
Joined: Mon Jun 14, 2010 11:51 am

Re: Кодировка Юникода в словарях

Postby regnbage » Fri Nov 16, 2012 5:50 pm

Не знаю. Выявил ещё один крякозябр в том же файле. Причём, появляется либо один, либо другой, но не вместе.
№1 вместо
Code: Select all
кого-либо[
Code: Select all
кого-лؐѐޛ

№2 вместо
Code: Select all
дерева[
Code: Select all
деՐҐЛ

как можно заметить в обоих случаях последний исковерканный символ - это [

Пробовал перекодировать в других программах и такого эффекта не достиг. Вопрос переходит в разряд теоретических.
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am

Re: Кодировка Юникода в словарях

Postby Tvangeste » Fri Nov 16, 2012 9:22 pm

А рефреш словарей делаете после изменения содержимого? Ctrl-F5.
Tvangeste
 
Posts: 893
Joined: Thu Jun 02, 2011 11:42 am

Re: Кодировка Юникода в словарях

Postby regnbage » Sat Nov 17, 2012 6:22 am

Вообще делаю, а в данном случае в GD не проверял. А зачем?
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am

Re: Кодировка Юникода в словарях

Postby Tvangeste » Sat Nov 17, 2012 5:07 pm

regnbage wrote:Вообще делаю, а в данном случае в GD не проверял. А зачем?

Я когда с DSL словарями работаю и меняю их на лету, то без рефреша в GD часто вижу похожие кракозябры и как бы битые словари. После рефреша словарей всё ОК. Ну или после рестарта GD.
Tvangeste
 
Posts: 893
Joined: Thu Jun 02, 2011 11:42 am

Re: Кодировка Юникода в словарях

Postby regnbage » Tue Nov 20, 2012 7:38 am

Tvangeste
Понятно. Здесь они обнаруживались после закрытия dsl файла в Notepad++ и повторного открытия.
regnbage
 
Posts: 37
Joined: Fri Sep 10, 2010 6:03 am


Return to Словари

Who is online

Users browsing this forum: No registered users and 6 guests