GoldenDict Forum

by **Novikov** » Tue Feb 07, 2012 9:59 pm

А, я в UTF-8 перевел все, ибо жалко просто так выкидывать место

by **ikm** » Wed Feb 08, 2012 12:27 am

Давайте не будем мешать кодировки и коды символов Unicode. Символ U+00A0 кодируется одним байтом A0 в кодировке ISO-8859-1, двумя байтами - A0 00 - в кодировке UTF-16LE, и последовательностью C2 A0 - в UTF-8.

by **Novikov** » Wed Feb 08, 2012 12:45 am

Ну я там приложил файл, вы смотрите сами, где встал символ с кодом A0

Символ стоит перед словами "good food".

by **ikm** » Wed Feb 08, 2012 12:54 am

В какой кодировке ваш файл?

by **Novikov** » Wed Feb 08, 2012 1:06 am

UTF-8 с BOM же. У Вас редактор что-то другое показывает?

by **ikm** » Wed Feb 08, 2012 1:12 am

Прекрасно. Какой последовательностью байтов кодируется символ U+00A0 в UTF-8?

by **Novikov** » Wed Feb 08, 2012 2:08 am

Я неправильно выразился, видимо. Не символ с кодом A0, а байт со значением A0. Как правильно -- Вам виднее, вы программист.

by **ikm** » Wed Feb 08, 2012 6:58 am

О том и речь, что в UTF-8 байт A0 вовсе не означает символ A0. Более того, этот байт вообще не может идти лидирующим в UTF-8 последовательности. Поэтому ваш файл с примером - битый. И именно поэтому GD не может его прочитать.

by **alleo** » Wed Feb 08, 2012 7:18 am

Кстати, в японском (соответственно и в китайском) тексте есть еще один вид пробела с кодом U+3000. Так как все иероглифы одинаковой ширины, то и пробел должен быть такой же. Я думаю его тоже было бы неплохо учитывать.

by **ikm** » Wed Feb 08, 2012 7:25 am

Он учитывается. Однако он не может выступать в качестве отделителя тел статей от заголовков - как уже упоминалось, для этого можно использовать только обычный пробел или обычный таб.

GoldenDict Forum

Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Re: Особенность с альтернативными пробелами

Who is online