[РЕШЕНО][Realtek RTL8111/8168/8411] Сетевая карта пропускает пакеты

grayich
Panda911,
98% - что кабель, плохо обжат или т.п.
1% - что свитч\роутер глючные
1% - остальное

покажи хоть статистику
ip -s -s link show
Проблема решилась но не полностью.
Если выключить ПК, подождать а потом включить, ИНТЕРНЕТ появляется и работает без пропусков.
Если вместо выключения, перезагрузить то ИНТЕРНЕТА нет. Линк не поднимается и висит в статусе NO-CARRIER.
Как полностью решить эту проблему?
Знаю что у других есть такие же проблемы в dualboot (Windows+linux).
Но у меня нет второй системы, и на этом диске всегда был только linux.
После перезагрузки, ИНТЕРНЕТ стабильно пропадает и не работает до выключения ПК.
Поднятия линка с помощью
ip link set enp2s0 up
не помогает.
Panda911
Если вместо выключения, перезагрузить то ИНТЕРНЕТА нет. Линк не поднимается и висит в статусе NO-CARRIER.
Как полностью решить эту проблему?
Знаю что у других есть такие же проблемы в dualboot (Windows+linux).
да это частая проблема, связано с драйверами, которые в linux не инициализируют карточку с нуля, и она сохраняет своё состояние с венды
помнится лечение было, но совсем не помню какое, давно было, лет 10 назад

гугл сказал что:
В настройках винды в диспетчере устройств в свойствах сетевой карты:
Wake-on-lan after shutdown установить во включено(в других случаях в выключено)
так-же не помешает bios потыркать на предмет настроек сетевой, а так-же вариантов acpi, пробуждения по сети и т.п.
grayich
Panda911
Если вместо выключения, перезагрузить то ИНТЕРНЕТА нет. Линк не поднимается и висит в статусе NO-CARRIER.
Как полностью решить эту проблему?
Знаю что у других есть такие же проблемы в dualboot (Windows+linux).
да это частая проблема, связано с драйверами, которые в linux не инициализируют карточку с нуля, и она сохраняет своё состояние с венды
помнится лечение было, но совсем не помню какое, давно было, лет 10 назад

гугл сказал что:
В настройках винды в диспетчере устройств в свойствах сетевой карты:
Wake-on-lan after shutdown установить во включено(в других случаях в выключено)
так-же не помешает bios потыркать на предмет настроек сетевой, а так-же вариантов acpi, пробуждения по сети и т.п.
У меня нет винды. Из настроек в bios только включить или выключить Ethernet
как нет, это ноут что ли?
параметры apm должны быть

раз не венда, то тем более похоже на железную проблему
Возможных причин две … хотя, скорее всего, обе переплелись между собой ...
- устаревшее железо и устаревший драйвер
- плохо работает ASPM с этим железом и драйвером.
ASPM позволяет управлять энергопотреблением шин PCI Express (PCIe) посредством их перевода в энергосберегающий режим, если устройство не используются. В то же время, активация ASPM приводит к задержке ответа от устройств, так как требуется некоторое время на переключение режимов работы шины.
... но есть еще один нюанс - активация ASPM при reboot возможно и не срабатывает ... а срабатывает только при полном выключении.
Что можно попробовать - отключить ASPM …. имеем ввиду, что параметр pcie_aspm=off не работает.
Ошибки не исчезают с опытом - они просто умнеют
vasek
Возможных причин две … хотя, скорее всего, обе переплелись между собой …
- устаревшее железо и устаревший драйвер
- плохо работает ASPM с этим железом и драйвером.
ASPM позволяет управлять энергопотреблением шин PCI Express (PCIe) посредством их перевода в энергосберегающий режим, если устройство не используются. В то же время, активация ASPM приводит к задержке ответа от устройств, так как требуется некоторое время на переключение режимов работы шины.
… но есть еще один нюанс - активация ASPM при reboot возможно и не срабатывает … а срабатывает только при полном выключении.
Что можно попробовать - отключить ASPM …. имеем ввиду, что параметр pcie_aspm=off не работает.
По вот этой надписи, вроде как у меня такого вообще нет.
r8169 0000:02:00.0: can't disable ASPM; OS doesn't have ASPM control
vasek
Возможных причин две … хотя, скорее всего, обе переплелись между собой …
- устаревшее железо и устаревший драйвер
- плохо работает ASPM с этим железом и драйвером.
ASPM позволяет управлять энергопотреблением шин PCI Express (PCIe) посредством их перевода в энергосберегающий режим, если устройство не используются. В то же время, активация ASPM приводит к задержке ответа от устройств, так как требуется некоторое время на переключение режимов работы шины.
… но есть еще один нюанс - активация ASPM при reboot возможно и не срабатывает … а срабатывает только при полном выключении.
Что можно попробовать - отключить ASPM …. имеем ввиду, что параметр pcie_aspm=off не работает.
Отключил, все также.
~ » ping -c 10 ya.ru
PING ya.ru (87.250.250.242) 56(84) bytes of data.
64 bytes from ya.ru (87.250.250.242): icmp_seq=1 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=2 ttl=247 time=12.4 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=4 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=5 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=6 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=7 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=8 ttl=247 time=12.8 ms

--- ya.ru ping statistics ---
10 packets transmitted, 7 received, 30% packet loss, time 9668ms
rtt min/avg/max/mdev = 12.418/12.574/12.806/0.112 ms
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo dmesg | grep -i aspm
[    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-linux-lts root=UUID=0208e499-159d-490d-bcc2-ae920ea5b39b rw quiet pcie_aspm=off nvidia-drm.modeset=1
[    0.039574] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-linux-lts root=UUID=0208e499-159d-490d-bcc2-ae920ea5b39b rw quiet pcie_aspm=off nvidia-drm.modeset=1
[    0.039646] PCIe ASPM is disabled
This test run on 27/10/22 at 17:15:40 on host Linux archlinux 5.15.75-1-lts #1
SMP Wed, 26 Oct 2022 11:14:25 +0000 x86_64.

Command: "fwts aspm".
Running tests: aspm.

aspm: PCIe ASPM test.
--------------------------------------------------------------------------------
Test 1 of 2: PCIe ASPM ACPI test.
PCIe ASPM is controlled by Linux kernel.

Test 2 of 2: PCIe ASPM registers test.
WARNING: Test 2, RP 0000h:00h:04h.00h L0s not enabled.
WARNING: Test 2, RP 0000h:00h:04h.00h L1 not enabled.
WARNING: Test 2, Device 0000h:02h:00h.00h L0s not enabled.
WARNING: Test 2, Device 0000h:02h:00h.00h L1 not enabled.

ADVICE: The ASPM L0s low power Link state is optimized for short entry and exit
latencies, while providing substantial power savings. Disabling L0s of a PCIe
device may increase power consumption, and will impact the battery life of a
mobile system.
ADVICE: The ASPM L1 low power Link state is optimized for maximum power savings
with longer entry and exit latencies. Disabling L1 of a PCIe device may
increases power consumption, and will impact the battery life of a mobile system
significantly.

PASSED: Test 2, PCIe ASPM setting matched was matched.
WARNING: Test 2, RP 0000h:00h:02h.00h L0s not enabled.
WARNING: Test 2, RP 0000h:00h:02h.00h L1 not enabled.
WARNING: Test 2, Device 0000h:01h:00h.00h L0s not enabled.
WARNING: Test 2, Device 0000h:01h:00h.00h L1 not enabled.

ADVICE: The ASPM L0s low power Link state is optimized for short entry and exit
latencies, while providing substantial power savings. Disabling L0s of a PCIe
device may increase power consumption, and will impact the battery life of a
mobile system.
ADVICE: The ASPM L1 low power Link state is optimized for maximum power savings
with longer entry and exit latencies. Disabling L1 of a PCIe device may
increases power consumption, and will impact the battery life of a mobile system
significantly.

PASSED: Test 2, PCIe ASPM setting matched was matched.

================================================================================
2 passed, 0 failed, 8 warnings, 0 aborted, 0 skipped, 0 info only.
================================================================================
2 passed, 0 failed, 8 warnings, 0 aborted, 0 skipped, 0 info only.

Test Failure Summary
================================================================================

Critical failures: NONE

High failures: NONE

Medium failures: NONE

Low failures: NONE

Other failures: NONE

Test           |Pass |Fail |Abort|Warn |Skip |Info |
---------------+-----+-----+-----+-----+-----+-----+
aspm           |    2|     |     |    8|     |     |
---------------+-----+-----+-----+-----+-----+-----+
Total:         |    2|    0|    0|    8|    0|    0|
---------------+-----+-----+-----+-----+-----+-----+
Panda911
r8169 0000:02:00.0: can't disable ASPM; OS doesn't have ASPM control
Выходит, что у тебя все намного серьезнее - ASPM похоже вообще не работает - если сам не отключал, то может проблема в BOIS (глючный) или в firmware или в чем другом --- вобщем проблема имеется ... и этого скорее всего и является причиной проблемы.
По хорошему требуется хороший анализ, в том числе и тест ASPM (типа запуск fwts aspm) и другое ... можно пропробовать обновить BIOS.
И если посмотреть вывод sudo lspci -vv для данного устройства, то ASPM будет скорее всего disabled

EDIT 1 - пока писал, смотрю, что тест fwts aspm выполнил. В части pcie_aspm=off - уже писал, этот параметр не работает, в твоем случае это навряд ли поможет.

EDIT 2 - что можно еще проверить, так это саму возможность активации ASPM - способов несколько, но самый лучший это через регистры. Как это делать? - описывал в одном из топиков .... https://archlinux.org.ru/forum/topic/21143/?page=2#post-254205
Ошибки не исчезают с опытом - они просто умнеют
vasek
Panda911
r8169 0000:02:00.0: can't disable ASPM; OS doesn't have ASPM control
Выходит, что у тебя все намного серьезнее - ASPM похоже вообще не работает - если сам не отключал, то может проблема в BOIS (глючный) или в firmware или в чем другом — вобщем проблема имеется … и этого скорее всего и является причиной проблемы.
По хорошему требуется хороший анализ, в том числе и тест ASPM (типа запуск fwts aspm) и другое … можно пропробовать обновить BIOS.
И если посмотреть вывод sudo lspci -vv для данного устройства, то ASPM будет скорее всего disabled

EDIT 1 - пока писал, смотрю, что тест fwts aspm выполнил. В части pcie_aspm=off - уже писал, этот параметр не работает, в твоем случае это навряд ли поможет.

EDIT 2 - что можно еще проверить, так это саму возможность активации ASPM - способов несколько, но самый лучший это через регистры. Как это делать? - описывал в одном из топиков …. https://archlinux.org.ru/forum/topic/21143/?page=2#post-254205
Если верить команде sudo lspci -vvvv -s 02:00, то ASPM отключен

02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 06)
        Subsystem: Gigabyte Technology Co., Ltd Onboard Ethernet
        Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+
        Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
        Latency: 0, Cache Line Size: 64 bytes
        Interrupt: pin A routed to IRQ 27
        Region 0: I/O ports at ee00 [size=256]
        Region 2: Memory at fddff000 (64-bit, prefetchable) [size=4K]
        Region 4: Memory at fddf8000 (64-bit, prefetchable) [size=16K]
        Capabilities: [40] Power Management version 3
                Flags: PMEClk- DSI- D1+ D2+ AuxCurrent=375mA PME(D0+,D1+,D2+,D3hot+,D3cold+)
                Status: D0 NoSoftRst+ PME-Enable- DSel=0 DScale=0 PME-
        Capabilities: [50] MSI: Enable+ Count=1/1 Maskable- 64bit+
                Address: 00000000fee01004  Data: 0022
        Capabilities: [70] Express (v2) Endpoint, MSI 01
                DevCap: MaxPayload 128 bytes, PhantFunc 0, Latency L0s <512ns, L1 <64us
                        ExtTag- AttnBtn- AttnInd- PwrInd- RBE+ FLReset- SlotPowerLimit 0W
                DevCtl: CorrErr- NonFatalErr- FatalErr- UnsupReq-
                        RlxdOrd+ ExtTag- PhantFunc- AuxPwr- NoSnoop-
                        MaxPayload 128 bytes, MaxReadReq 4096 bytes
                DevSta: CorrErr+ NonFatalErr- FatalErr- UnsupReq+ AuxPwr+ TransPend-
                LnkCap: Port #0, Speed 2.5GT/s, Width x1, ASPM L0s L1, Exit Latency L0s unlimited, L1 <64us
                        ClockPM+ Surprise- LLActRep- BwNot- ASPMOptComp-
                LnkCtl: ASPM Disabled; RCB 64 bytes, Disabled- CommClk-
То есть, проблема не в ASPM а в чем-то другом.

UPD: Удивительно, но вся статистика карты, говорит о том что карта работает нормально.
Но пакеты пропадают, и это заметно в загрузки страниц

-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_dropped
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_packets
117
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_packets
151
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_over_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_carrier_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_missed_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_heartbeat_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/rx_crc_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_window_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » sudo cat /sys/bus/pci/devices/0000:02:00.0/driver/0000:02:00.0/net/enp2s0/statistics/tx_fifo_errors
0
-------------------------------------------------------------------------------------------------------------------------------------
~ » ping -c 10 ya.ru
PING ya.ru (87.250.250.242) 56(84) bytes of data.
64 bytes from ya.ru (87.250.250.242): icmp_seq=1 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=2 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=3 ttl=247 time=12.7 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=5 ttl=247 time=12.8 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=6 ttl=247 time=12.8 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=7 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=8 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=9 ttl=247 time=12.8 ms

--- ya.ru ping statistics ---
10 packets transmitted, 8 received, 20% packet loss, time 9056ms
rtt min/avg/max/mdev = 12.475/12.633/12.774/0.110 ms
UPD 2: ip link show тоже говорит что всё в порядке
12: enp2s0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP mode DEFAULT group default qlen 1000
link/ether MAC brd ff:ff:ff:ff:ff:ff
RX: bytes packets errors dropped missed mcast
141650 621 0 0 0 295
RX errors: length crc frame fifo overrun
0 0 0 0 0
TX: bytes packets errors dropped carrier collsns
91128 405 0 0 0 0
TX errors: aborted fifo window heartbt transns
0 0 0 0 2
Пинг 8.8.8.8 и пинг до роутера.
~ » ping -c 10 8.8.8.8
PING 8.8.8.8 (8.8.8.8) 56(84) bytes of data.
64 bytes from 8.8.8.8: icmp_seq=1 ttl=109 time=43.2 ms
64 bytes from 8.8.8.8: icmp_seq=2 ttl=109 time=47.3 ms
64 bytes from 8.8.8.8: icmp_seq=3 ttl=109 time=37.9 ms
64 bytes from 8.8.8.8: icmp_seq=4 ttl=109 time=43.6 ms
64 bytes from 8.8.8.8: icmp_seq=5 ttl=109 time=32.4 ms
64 bytes from 8.8.8.8: icmp_seq=7 ttl=109 time=36.4 ms
64 bytes from 8.8.8.8: icmp_seq=8 ttl=109 time=45.9 ms
64 bytes from 8.8.8.8: icmp_seq=9 ttl=109 time=47.3 ms
64 bytes from 8.8.8.8: icmp_seq=10 ttl=109 time=42.4 ms

— 8.8.8.8 ping statistics —
10 packets transmitted, 9 received, 10% packet loss, time 9065ms
rtt min/avg/max/mdev = 32.352/41.822/47.309/4.904 ms
———————————————————————-
~ » ping -c 10 192.168.0.1
PING 192.168.0.1 (192.168.0.1) 56(84) bytes of data.
64 bytes from 192.168.0.1: icmp_seq=1 ttl=64 time=0.369 ms
64 bytes from 192.168.0.1: icmp_seq=2 ttl=64 time=0.309 ms
64 bytes from 192.168.0.1: icmp_seq=3 ttl=64 time=0.356 ms
64 bytes from 192.168.0.1: icmp_seq=4 ttl=64 time=0.326 ms
64 bytes from 192.168.0.1: icmp_seq=6 ttl=64 time=0.354 ms
64 bytes from 192.168.0.1: icmp_seq=7 ttl=64 time=0.290 ms
64 bytes from 192.168.0.1: icmp_seq=8 ttl=64 time=0.371 ms
64 bytes from 192.168.0.1: icmp_seq=9 ttl=64 time=0.326 ms
64 bytes from 192.168.0.1: icmp_seq=10 ttl=64 time=0.376 ms

— 192.168.0.1 ping statistics —
10 packets transmitted, 9 received, 10% packet loss, time 9389ms
rtt min/avg/max/mdev = 0.290/0.341/0.376/0.028 ms
——————————————————
UPD 3: Интересно, нашел статью на форуме ubuntu.
Попробовал также ограничить скорость до 100мб и о чудо, ошибки пропали.

~ » ping -c 10 ya.ru                                                                                                  alex@archlinux
PING ya.ru (87.250.250.242) 56(84) bytes of data.
64 bytes from ya.ru (87.250.250.242): icmp_seq=1 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=2 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=3 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=4 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=5 ttl=247 time=12.6 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=6 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=7 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=8 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=9 ttl=247 time=12.5 ms
64 bytes from ya.ru (87.250.250.242): icmp_seq=10 ttl=247 time=12.6 ms

--- ya.ru ping statistics ---
10 packets transmitted, 10 received, 0% packet loss, time 9013ms
rtt min/avg/max/mdev = 12.451/12.540/12.607/0.054 ms
Теперь я вообще ничего не понимаю.
Сделал так, РАБОТАЕТ!

Если выбирать полнодуплексное согласование то в dmesg ошибки по RX

[31675.156300] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac108
[31879.276431] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac185
[31879.331366] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac35a
[31879.347936] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac2b0
[31879.360719] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac127
[31879.378243] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac1b8
[31879.391388] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac0ef
[31879.391946] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac126
[31879.392169] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac10d
[31879.392416] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac116
[31879.393059] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac10b
[31890.148908] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac448
[31891.147542] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac46b
[31940.049783] r8169 0000:02:00.0 enp2s0: Rx ERROR. status = 352ac10f
Panda911
Попробовал также ограничить скорость до 100мб и о чудо, ошибки пропали.
Молодец, нашел причину. ... Лишний раз убедились - Кто ищет, тот найдет.
И все-таки коренная причина, скорее всего, связана со старым железом и драйвером.
Ошибки не исчезают с опытом - они просто умнеют
 
Зарегистрироваться или войдите чтобы оставить сообщение.