vladis |
|
Темы:
3
Сообщения:
19
Участник с: 21 января 2020
|
Приветствую! После обновлений на 6.6.Х (несколько) и последнего 6.7arch3 (по названию пакета), в логе вижу такое сообщение: Сообщения однотипные. Ядра самосборное, в качестве исходной точки, использую https://gitlab.archlinux.org/archlinux/packaging/packages/linux и https://aufs.sourceforge.net/, плюс патчи для драйвера ath10k. Так же пробовал (на каких-то 6.6.Х) загрузить "штатное" ядро, получаю такие же сообщения, т.е. дело не самосбре ядра. Из-за этого, часть процессов (обычно те что встречаются в сообщениях выше), как бы нормально не работают, на знаю как это правильно описать. После остановки такого процесса, система сообщается что оно всё ещё работает, а сама остановка происходит по таймауту. Так же из-за этого, система не может нормально выключиться или перезагрузиться (только по watchdog'у). Но если я откатываю ядро на последнее 6.5.9, тоже самосборное, то проблемы нет, всё работает нормально, этих сообщений нет. Но эти новые (6.6 и выше) самосборные ядра нормально работают в другой системе, почти такой же по конфигурации. Не знаю, где проблема?
|
vasek |
|
Темы:
47
Сообщения:
11819
Участник с: 17 февраля 2013
|
vladisНасколько понял, проблема у тебя началась в конце 2023. В логах видим Call Trace, а значит наскоком это не решить - нужен серьёзный анализ … методов много, начни, например, с этой статьи В логах кроме этого видим vladisчто тоже не есть хорошо: - в части divide error: 0000 [#1] PREEMPT SMP PTI например, почитать это - в части Not tainted - означает, что в ядре есть модуль (не загруженный), который не имеет лицензии … в принците это это не страшно, но нужно имеет в виду ...
Ошибки не исчезают с опытом - они просто умнеют
|
vladis |
|
Темы:
3
Сообщения:
19
Участник с: 21 января 2020
|
В логах кроме этого видимvladisЕсли это намёк на какую-то аппаратную неисправность, то на ядре 6.5.9 нет этих сообщений, никаких из моего первого. При этом всё программное, остаётся тоже самое и самое главное, нормально работает. Вообще tcp_rcv_space_adjust что-то про работу сети. Для ясности опишу конфигурацию, процессор i7-5775C, 2х8ГБ памяти, 10 Гб сеть (адаптер x550t2), внешних usb сетевой адаптер, pci-e и usb wifi адаптеры. Драйверов каких-то, не устанавливал, всё штатное. Напрягают не эти сообщения, сколько последствия с самими программами, например процесс, который там отметился, не возможно убить по kill и подобными, остановить, перезапустить и т.д, он остаётся в памяти в непонятном состоянии. Похожая на мою проблема: https://www.mail-archive.com/squid-users@lists.squid-cache.org/msg25149.html Так же не убивается процесс, тот же RIP: 0010:tcp_rcv_space_adjust+0xbe/0x160. Чем закончилось, не известно. |
vasek |
|
Темы:
47
Сообщения:
11819
Участник с: 17 февраля 2013
|
Чтобы понять проблему, нужен ее анализ … а так одни гадания. Если зависает какой то определенный процесс, то найди его и убей … и выясни причину его зависания. Если проблема в ядре, то это намного сложнее … В части анализа зависших процессов - немного описал в этом блоге PS - проблема скорее всего связана с протоколом RIP ...
Ошибки не исчезают с опытом - они просто умнеют
|
vasek |
|
Темы:
47
Сообщения:
11819
Участник с: 17 февраля 2013
|
... уточнение в части RIP ...vladisВ части tcp_rcv_space_adjust … Грубо - основные файлы Linux, используемые при загрузке - vmlinuz + initrd.img (ядро + образ) - System.map (файл для управления памятью) - ... можно добавить и config (файл параметров с которыми собрано текущее ядро) Нам интесен файл System.map, внутри которого находится символьная таблица, используемая ядром Linux, в которой перечислены имена переменных и функций и их адреса в памяти … этот файл находится в /usr/src/linux/ и в /usr/lib/modules/`uname -r`/build/System.map Например, смотрим функцию cp_rcv_space_adjust grep tcp_rcv_space_adjust /usr/src/linux/System.map | head -3 Если проблема в этой фнкции, то нужно дебажить и искать причину.Что это за функция? - здесь я чайник … но как пишут
Ошибки не исчезают с опытом - они просто умнеют
|
Nebulosa |
|
Темы:
9
Сообщения:
910
Участник с: 05 марта 2009
|
vladis Вы столкнулись с таким понятием как "регрессия ядра", решал пару месяцев назад похожую проблему. Для того, чтобы понять, что именно вызывает "падение", неоходимо выполнить бисекцию ядра. Процесс трудоёмкий, но ничего сложного для вас нет, т.к. вы знакомы со сборкой кастомного ядра. Вот написал шпаргалку с ссылками на статьи wiki: После определения того самого коммита, можно будет разместить информацию на gitlab.archlinux.org, там дальше сориентируют, куда направить запрос. |
vladis |
|
Темы:
3
Сообщения:
19
Участник с: 21 января 2020
|
Нашёл я причину, такого поведения. У меня интернет от провайдера подключен через usb to ethernet адаптер "ASIX AX88179_178A USB 2.0/3.0 Ethernet Devices". Через него настроено pppoe соединение. На неделе, я переключился на встройку от realtek "RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller". Вот в таком режиме тех сообщений не было совершенно. Для повторяемости я вновь вернул всё как было, сообщения появились. Так же я попробовал другой usb to ethernet на том же чипе (ax88179), с ним те же проблемы, т.о. адаптеры не причём. Переключение в другой usb порт так же ничего не изменило. Последнее что я предпринял, это установил другой драйвер, т.е. не тот что идёт с ядром. Драйвер взял отсюда. С этим драйвером проблем нет. Пока на этом я остановился. |