[РЕШЕНО]Смена кодировки файла из windows

имеется файл
отображается криво в utf-8
команда:
`--> file -i msu_ru_nsh.dic
msu_ru_nsh.dic: text/plain; charset=iso-8859-1
грит чо он iso-8859-1, но при преобразовании из еной кодировки получается ересь:
`--> iconv -f iso-8859-1 -t utf-8 msu_ru_nsh.dic
показывает чото (тот же самый эффект от обычного cat):
ÞÕ×ÓÔ×ÕÅÔ  ch uu s t v ur j ae t
ÞÕ×ÓÔ×ÕÅÔÅ  ch uu s t v ur j ae tt e
ÞÕ×ÓÔ×ÕÅÔÓÑ  ch uu s t v ur j ae t ss a
ÞÕ×ÓÔ×ÕÅÛØ  ch uu s t v ur j ae sh
ÞÕ×ÓÔ×ÕÊ  ch uu s t v ur j
ÞÕ×ÓÔ×ÕÊÔÅ  ch uu s t v ur j tt e
ÞÕ×ÓÔ×ÕÑ  ch uu s t v ur j a
ÞÕÛÉ  ch uu sh i
ÞÕÛËÉÎ  ch uu sh kk ae n
ÞÕÛØ  ch ur sh
ÞÕÛØÀ  ch uu sh j u
ÞÕÞÅÌ  ch uu ch ae l
ÞÕÞÅÌÁ  ch uu ch ae l a
ÞÕÞÅÌÁÍÉ  ch uu ch ae l ay mm i
ÞÕÞÅÌÅ  ch uu ch ae ll e
ÞÕÞÅÌÏ  ch uu ch ae l a
ÞÕÞÅÌÏÍ  ch uu ch ae l ay m
ÞÕÞÅÌÕ  ch uu ch ae l u
ÞÕÞËÏ×  ch u ch k oo f
Þ×ÁÎÉÌÓÑ  ch v aa nn ae l ss a
Þ×ÁÎÉÔÓÑ  ch v aa nn ae t ss a
Þ×ÁÎÎÙÈ  ch v aa n ay h
Þ×ÁÎÏ×  ch v aa n ay f
Þ×ÁÎÓÔ×Ï  ch v aa n s t v a
Þ×ÁÒÔÁÃËÉÊ  ch v a r t aa c kk ae j
ÞØÀ  ch j uu
ÞØÀ-ÌÉÂÏ  ch j uu ll ae b a
ÞØÀ-ÎÉÂÕÄØ  ch j uu nn ae b ur tt
ÞØÀ-ÔÏ  ch j uu t a
ÞØÅ  ch j ee

прбывал рекодить из cp1251, но получается русская, но ересь.
в итоге работает только метод открытия в браузере
А что должно быть?
А в каком редакторе вы открываете этот словарь? Если это Pluma из mate-desktop, то установите dconf-editor. Найдите ключ org > mate > pluma > auto-detected-encodings, и установите значение: ['CURRENT', 'UTF-8', 'Windows-1251', 'ISO-8859-15']
In Tux We Trust
Medit -
$ file msu_ru_nsh.dic
msu_ru_nsh.dic: ISO-8859 text
Но там koi8, похоже.
$ iconv -f koi8-r -t utf-8 msu_ru_nsh.dic -o msu_ru_nsh2.dic
msu_ru_nsh2.dic
-----
+издали   ii z d ay ll i
+окна   oo k n a
+острова   oo s t r ay v a
+эн   ee n
+эрц   ee r c
12   d vv i n aa c ay tt
16   sh y s n aa c ay tt
1662   a d n aa t yy ss ae ch sh y s s oo t sh ay s dd dd i ss aa t d v aa
17   ss i m n aa c ay tt
18   v ay ss i m n aa c ay tt
19   dd ae vv a t n aa c ay tt
2-х   d v aa h
23   d v aa c a tt t rr ii
326-го   t rr i d v aa sh ay s dd g a
i   aa j
ёлке   j oo l kk e
ёлкина  j oo l kk ae n a
ёлку  j oo l k u
ёжик  j oo zh ay k
ёжика  j oo zh ay k a
ёжиком  j oo zh ay k ay m
ёжил  j oo zh ay l
ёжила  j oo zh ay l a
ёжились  j oo zh ay ll ae ss
ёжился  j oo zh ay l ss a
ёжистой  j oo zh ay s t ay j
ёжистую  j oo zh ay s t ur j u
ёжистые  j oo zh ay s t ay e
ёжится  j oo zh ay t ss a
ёжиться  j oo zh ay tt ss a
ююбы  j u j uu b y
ююков  j u j uu k ay f
ююкова  j u j uu k ay v a
юбилею  j ur bb i ll ee j u
...
Почему бы нормальным редактором не открыть, типа Sublime?
https://github.com/warlock90000/awesome
Aivar
Но там koi8, похоже.
$ iconv -f koi8-r -t utf-8 msu_ru_nsh.dic
и енто правильный ответ)))
warlock9000
Почему бы нормальным редактором не открыть, типа Sublime?
открывал в gedit, в нем каракули... он не нормальный?
Судя по виду, это правписание для руссского языка, файл в koi8-r. Зачем его вообще в редакторе открывать?
Правильные вопросы такие:
  • Как это прикручивается к программе xxx?
  • Как программе xxx сказать, что он в koi8-r?
  • Если никак, то в какой кодировке он должен быть?
  • Чем перекодировать его в эту кодировку?
Без телепатии можно ответить только на последний вопрос - iconv
akorop
Судя по виду, это правписание для руссского языка, файл в koi8-r. Зачем его вообще в редакторе открывать?
Правильные вопросы такие:
  • Как это прикручивается к программе xxx?
  • Как программе xxx сказать, что он в koi8-r?
  • Если никак, то в какой кодировке он должен быть?
  • Чем перекодировать его в эту кодировку?
Без телепатии можно ответить только на последний вопрос - iconv
собсна не сагласен... ибо мне просто надо видить какая транскрипцыя для каких звуков, что бы создать собственный список ибо мне такое большое количество без надобности
отвечу для того чо я хароший -- енто словарь для создания акустической модели под программу julius, которую я хочу прикрутить как распознаватель речи с микрофона для речевого-голосового управления компом
 
Зарегистрироваться или войдите чтобы оставить сообщение.