lampslave |
|
Темы:
32
Сообщения:
4801
Участник с: 05 июля 2011
|
При чём тут локаль вообще? Если я правильно понял, cut тупо не знает, что символ может кодироваться не восемью байтами. |
Anton8830 |
|
Темы:
23
Сообщения:
175
Участник с: 16 ноября 2013
|
lampslaveПри том, что cut выводит то, что его просят. Просят символ 10 в кодировке UTF-8 - значит вывести сивол 10, кодированный 8 битами. И это верно. А то, что кирилица кодируется 16 битами в кодировке UTF-8 - это не его проблемы... Зато в результате - вывод получается не тот, что ожидается... И это, на мой взгляд, проблема не пользователя... По-моему, если кодировка использует 8 бит, она должна использовать 8 бит для всех символов, какие бы они не были. Да, пусть их будет всего 256, но: хотите больше - используйте другую кодировку... |
vasek |
|
Темы:
47
Сообщения:
11874
Участник с: 17 февраля 2013
|
cut все выводит верно. Вот Вам для раздумья - полный вывод "test " (с пробелом и переводом строки) - $ cat -A test M-PM-"M-PM-5M-QM-^AM-QM-^B $ 1....2. ...3. ...4... .5. ...6.. ..7.. ..8.. ..9 (пробел)
Ошибки не исчезают с опытом - они просто умнеют
|
nafanja |
|
Темы:
94
Сообщения:
9252
Участник с: 02 июня 2012
заблокирован
|
Anton8830, тебе ж написали, это баг cut, который не исправляют очень долго! cut должен с ключем -с работать правильно не зависимо от кодировки и ее спецификации, а он работает не правильно, так как бы работал с ключем -b.
Псевдографический инсталлятор Arch Linux ver. 3.8.2
Благодарности принимаются на ЯД 410012815723874 |
nafanja |
|
Темы:
94
Сообщения:
9252
Участник с: 02 июня 2012
заблокирован
|
echo 'Привет' | iconv -f UTF-8 -t cp1251 | cut -c 3 | iconv -f cp1251 -t UTF-8
Псевдографический инсталлятор Arch Linux ver. 3.8.2
Благодарности принимаются на ЯД 410012815723874 |
Anton8830 |
|
Темы:
23
Сообщения:
175
Участник с: 16 ноября 2013
|
nafanjaТогда и баг wc? Он ведь тоже сообщает, что в строке не 17 символов??? |
Kycok |
|
Темы:
32
Сообщения:
1585
Участник с: 09 января 2013
|
lampslaveСам файл? А как? |
Anton8830 |
|
Темы:
23
Сообщения:
175
Участник с: 16 ноября 2013
|
KycokСаму систему вместе с файлами... Всю, со всеми...lampslaveСам файл? А как? |
nafanja |
|
Темы:
94
Сообщения:
9252
Участник с: 02 июня 2012
заблокирован
|
Anton8830да и его баг, так как они используют одну библиотеку для работы с символами!
Псевдографический инсталлятор Arch Linux ver. 3.8.2
Благодарности принимаются на ЯД 410012815723874 |
Anton8830 |
|
Темы:
23
Сообщения:
175
Участник с: 16 ноября 2013
|
nafanjaВозможно, я неправ и это баг cut, wc, length и прочего, но я не понимаю такой логики... Для меня это - повод отказаться от UTF-8...Anton8830да и его баг, так как они используют одну библиотеку для работы с символами! |