Тревожные данные журнала после неудачного запуска

имеется арч, i3wm

сегодня утром запустился, как обычно, но почемуто не прогрузилась пульса (значек в трее был соответствующий). Попытка перезапустить пульсу "pulseaudio -k" не увенчалась успехом. При чем все тупило неимоверно, терминал подвисал. Перезапуск... все пошло норм... в журнале пичальные варнинги и баги.

в чем именно создалась траббла? почитав, понял чо с устройством альсы чото не так вышло, но почему после ребута все стало норм?
safocl
в чем именно создалась траббла

BUG: Bad page state in process mandb

BUG: Bad page state in process pulseaudio

Я бы посоветовал прогнать memtest.
Думаю, что pulseaudio тут не причем ….
Судя по трассировочным вызовам, типа
page dumped because: nonzero _refcount
page dumped because: nonzero mapcount
page dumped because: bad pte
…......................................
print_bad_pte
unmap_page_range
…........................................
page:ffffea00084d0040 count:1 mapcount:0 mapping: (null) index:0x0
скорее всего причина связана с памятью …...... и, что интересно, связано это в основном с alsa-sink-ALC88 …
Строк типа
апр 07 07:38:23 safocloComp kernel: page:ffffea00084d0040 count:0 mapcount:-1 mapping: (null) index:0x0
апр 07 07:38:40 safocloComp kernel: BUG: Bad page state in process alsa-sink-ALC88  pfn:213401
около 20 …... (а один из номеров страничного блока alsa-sink-ALC88 … pfn:213401 … упомянут и в трассировочном выводе pulseaudio)
Коренной причиной может быть — планка памяти или ядро (пора отказаться от самосборки ядра и перейти на нормальное) ….... и с меньшей долей вероятности железо, точнее чип ALC88 (в это верю не очень, так как есть несколько трассировочных вызовов связанных и с mandb)
Ошибки не исчезают с опытом - они просто умнеют
vasek
ну а в чем дело с памятью? почему нет постоянных подобных моментов?
а ядро при чем может тут быть? ведь я его собрал давольно давно и все норм роббит.
safocl
ну а в чем дело с памятью? почему нет постоянных подобных моментов?
Пропадающий дефект. Кто занимается ремонтом техники, знает, что это самое хреновое.

safocl
а ядро при чем может тут быть? ведь я его собрал давольно давно и все норм роббит.
Вам предложили начать диагностику неисправности, а вы продолжаете задавать вопросы вместо ее поиска.
safocl
ну а в чем дело с памятью? почему нет постоянных подобных моментов?
а ядро при чем может тут быть? ведь я его собрал давольно давно и все норм роббит.
На мой взгляд — то ли это связано с ошибками страничной адресацией памяти, то ли дефектами самой памяти ОЗУ…..... эти ошибки могут быть и плавающими …...... что их вызывает, гадать не буду …..
Я бы, как тебе советовал pztrn, потестил память и подольше …..... а вот ошибки страничной адесации — это вообще темный лес, тут очень многое завязано, вплоть до ядра ….
Когда то вычитал, что сами по себе сообщения типа BUG: Bad page state in process …. pfn:.... , как правило, завязаны на конкретный процесс и железо и большая вероятность, что это железо не поддерживается ядром ….. но лично я с этим не совсем согласен, точнее не совсем четко это понимаю — не понимаю наличие в этом выводе pfn … (т. е. как страничный блок связан одновременно и с ядром и с железом???) …. возможно это и так ...
pfn - Номер страничного блока, соответствующий физическому адресу, с которым должен быть связан виртуальный адрес. Номер страничного блока - это просто физический адрес, сдвинутый вправо на PAGE_SHIFT бит.
За свою долгую жизнь встретилось такое дважды - один раз помогла смена ядра, второй — замена памяти … (перкопал тогда кучу инфы, чтобы понять … что к чему … но до конца так и непонял …) ….... и, главное, ошибка была не постоянной ... , как подметил Aivar
Ошибки не исчезают с опытом - они просто умнеют
Aivar
Пропадающий дефект. Кто занимается ремонтом техники, знает, что это самое хреновое.
я занимался... но обычно такие деффекты у памяти постоянны, ибо там может только пропасть нормальный контакт между чипами памяти и платой из-за искревления платы от термовлияния...
Aivar
Вам предложили начать диагностику неисправности, а вы продолжаете задавать вопросы вместо ее поиска.
я хароший (склоняюсь перед вашей волей)
vasek
и, главное, ошибка была не постоянной ... , как подметил Aivar
а у меня она первый раз за два года на линуксе
ну а комп уже лет 5-6.

п.с. при чем енто был холодный старт (т.е. часов 8 комп не работал)
думается мне, что одноразовый глюк не стоит внимания.
повторится сразу раз 10, вот тогда и думать нужно...
Псевдографический инсталлятор Arch Linux ver. 3.8.2
Благодарности принимаются на ЯД 410012815723874
safocl, ты спросил, мы ответили …..... не нравится, займись анализом трассировочных вызовов, плюс проанализируй возникновение Oops (между прочем в регистре IP прописан основной виновник падения проблемы …, который тоже указывает на память)
Не хочешь анализировать и читать ........ следуй совету nafanja ........ жди других падений и копи статистику ...
UPD ….. нашел у себя один топик, в котором похожая проблема и, главное, рассуждения похожи на твои ….... но в итоге ..
Отнес на работу память Corsair и принес samsung такого же номинала. Сегфолты в х64 сразу пропали. На работе Corsair работает стабильно (win7 х64). Вот так решилась моя проблема. Я удивлен что memtest не выявлял проблему. Думаю моя материнка устанавливает экстремальные тайминги для Corsair и возможно в дальнейшем новые bios поправят это.
PS ... забыл отметить, что причиной может быть и увеличение частоты/быстродействия и т.п., если эти опреации делал ...
Ошибки не исчезают с опытом - они просто умнеют
vasek
PS ... забыл отметить, что причиной может быть и увеличение частоты/быстродействия и т.п., если эти опреации делал ...
не не... все на авто стоит, две планки с примерно равными параметрами.
 
Зарегистрироваться или войдите чтобы оставить сообщение.