私は最近、すべてのハードウェアがかなり新しいように新しいコンピューターを組み立てました。それ以来、Debian6.0を実行しているときにIRQで問題が発生しています。ランダムな場合、通常は1時間ほど実行した後、ビープ音が鳴り、これがdmesg
に表示されます。
[ 3537.762795] irq 16: nobody cared (try booting with the "irqpoll" option)
[ 3537.762797] Pid: 0, comm: swapper Tainted: P W O 2.6.39-2-AMD64 #1
[ 3537.762798] Call Trace:
[ 3537.762799] <IRQ> [<ffffffff810924d4>] ? __report_bad_irq+0x3a/0xa2
[ 3537.762803] [<ffffffff810926a4>] ? note_interrupt+0x168/0x1da
[ 3537.762805] [<ffffffff81090dd4>] ? handle_irq_event_percpu+0x171/0x18f
[ 3537.762807] [<ffffffff8100e0e2>] ? read_tsc+0x5/0x16
[ 3537.762809] [<ffffffff8106b8a2>] ? update_ts_time_stats+0x32/0x6b
[ 3537.762810] [<ffffffff81090e26>] ? handle_irq_event+0x34/0x52
[ 3537.762812] [<ffffffff81063fb7>] ? sched_clock_idle_wakeup_event+0x12/0x1c
[ 3537.762813] [<ffffffff81092df2>] ? handle_fasteoi_irq+0x82/0xa4
[ 3537.762815] [<ffffffff8100aadb>] ? handle_irq+0x1a/0x23
[ 3537.762816] [<ffffffff8100a384>] ? do_IRQ+0x45/0xaa
[ 3537.762818] [<ffffffff81332c93>] ? common_interrupt+0x13/0x13
[ 3537.762818] <EOI> [<ffffffff81332c8e>] ? common_interrupt+0xe/0x13
[ 3537.762821] [<ffffffff81026800>] ? native_safe_halt+0x2/0x3
[ 3537.762829] [<ffffffffa016ed58>] ? acpi_idle_do_entry+0x39/0x62 [processor]
[ 3537.762831] [<ffffffffa016edde>] ? acpi_idle_enter_c1+0x5d/0xad [processor]
[ 3537.762834] [<ffffffff81261033>] ? cpuidle_idle_call+0x11f/0x1cc
[ 3537.762835] [<ffffffff81008dd2>] ? cpu_idle+0xab/0xe1
[ 3537.762837] [<ffffffff8169fc60>] ? start_kernel+0x3e0/0x3eb
[ 3537.762838] [<ffffffff8169f3c8>] ? x86_64_start_kernel+0x102/0x10f
[ 3537.762839] handlers:
[ 3537.762840] [<ffffffffa0358d5a>] (rtl8169_interrupt+0x0/0x2d7 [r8169])
[ 3537.762842] [<ffffffffa08ff2ca>] (nv_kern_isr+0x0/0x54 [nvidia])
[ 3537.762902] Disabling IRQ #16
その後、XorgはCPUを占有するか、不安定になります(システムを完全にハングさせるまで)。 Xorgを再起動すると、すべてが正常に戻り、次の再起動まで問題は発生しません。
不安定なリポジトリからカーネルをストック2.6.32
から2.6.39
にアップグレードしようとしましたが、それは役に立ちませんでした。 irqpoll
オプションを使用して起動すると、問題が発生した後の最初の期間が長くなるようです。
firmware-realtek
パッケージの最新のNVIDIAドライバーとRealtekファームウェアを使用しています。 SLIで動作するGTX560Tiが2つあります。 SLIを無効にしたり、1枚のカードを完全に取り出したりしても問題は解決しません。
uname -a
の出力は次のとおりです。
Linux whitestar 2.6.39-2-AMD64 #1 SMP Wed Jun 8 11:01:04 UTC 2011 x86_64 GNU/Linux
lspci
の出力は次のとおりです。
00:00.0 Host bridge: Intel Corporation Sandy Bridge DRAM Controller (rev 09)
00:01.0 PCI bridge: Intel Corporation Sandy Bridge PCI Express Root Port (rev 09)
00:01.1 PCI bridge: Intel Corporation Sandy Bridge PCI Express Root Port (rev 09)
00:16.0 Communication controller: Intel Corporation Cougar Point HECI Controller #1 (rev 04)
00:19.0 Ethernet controller: Intel Corporation 82579V Gigabit Network Connection (rev 05)
00:1a.0 USB Controller: Intel Corporation Cougar Point USB Enhanced Host Controller #2 (rev 05)
00:1b.0 Audio device: Intel Corporation Cougar Point High Definition Audio Controller (rev 05)
00:1c.0 PCI bridge: Intel Corporation Cougar Point PCI Express Root Port 1 (rev b5)
00:1c.1 PCI bridge: Intel Corporation Cougar Point PCI Express Root Port 2 (rev b5)
00:1c.2 PCI bridge: Intel Corporation Cougar Point PCI Express Root Port 3 (rev b5)
00:1c.4 PCI bridge: Intel Corporation Cougar Point PCI Express Root Port 5 (rev b5)
00:1c.6 PCI bridge: Intel Corporation 82801 PCI Bridge (rev b5)
00:1d.0 USB Controller: Intel Corporation Cougar Point USB Enhanced Host Controller #1 (rev 05)
00:1f.0 ISA bridge: Intel Corporation Cougar Point LPC Controller (rev 05)
00:1f.2 SATA controller: Intel Corporation Cougar Point 6 port SATA AHCI Controller (rev 05)
00:1f.3 SMBus: Intel Corporation Cougar Point SMBus Controller (rev 05)
01:00.0 VGA compatible controller: nVidia Corporation Device 1200 (rev a1)
01:00.1 Audio device: nVidia Corporation Device 0e0c (rev a1)
02:00.0 VGA compatible controller: nVidia Corporation Device 1200 (rev a1)
02:00.1 Audio device: nVidia Corporation Device 0e0c (rev a1)
04:00.0 USB Controller: NEC Corporation uPD720200 USB 3.0 Host Controller (rev 04)
06:00.0 USB Controller: NEC Corporation uPD720200 USB 3.0 Host Controller (rev 04)
07:00.0 PCI bridge: Device 1b21:1080 (rev 01)
08:02.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8110SC/8169SC Gigabit Ethernet (rev 10)
08:03.0 FireWire (IEEE 1394): VIA Technologies, Inc. VT6306/7/8 [Fire II(M)] IEEE 1394 OHCI Controller (rev c0)
/proc/interrupts
の内容:
CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7
0: 77 0 0 0 0 0 0 0 IO-APIC-Edge timer
1: 2 0 0 0 0 0 0 0 IO-APIC-Edge i8042
8: 1 0 0 0 0 0 0 0 IO-APIC-Edge rtc0
9: 0 0 0 0 0 0 0 0 IO-APIC-fasteoi acpi
12: 4 0 0 0 0 0 0 0 IO-APIC-Edge i8042
16: 699083 0 0 0 0 0 0 0 IO-APIC-fasteoi nvidia, eth0
17: 87810 0 0 0 0 0 0 0 IO-APIC-fasteoi firewire_ohci, hda_intel, nvidia
18: 242 0 0 0 0 0 0 0 IO-APIC-fasteoi hda_intel
23: 85925 0 0 0 0 0 0 0 IO-APIC-fasteoi ehci_hcd:usb5, ehci_hcd:usb6
40: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
41: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
42: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
43: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
44: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
45: 0 0 0 0 0 0 0 0 PCI-MSI-Edge PCIe PME
46: 79853 0 0 0 0 0 0 0 PCI-MSI-Edge ahci
48: 1 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
49: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
50: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
51: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
52: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
53: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
54: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
55: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
56: 1 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
57: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
58: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
59: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
60: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
61: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
62: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
63: 0 0 0 0 0 0 0 0 PCI-MSI-Edge xhci_hcd
64: 173506 0 0 0 0 0 0 0 PCI-MSI-Edge hda_intel
NMI: 482 89 25 13 277 24 11 10 Non-maskable interrupts
LOC: 783857 194752 114133 70577 372438 179065 117179 162016 Local timer interrupts
SPU: 0 0 0 0 0 0 0 0 Spurious interrupts
PMI: 482 89 25 13 277 24 11 10 Performance monitoring interrupts
IWI: 0 0 0 0 0 0 0 0 IRQ work interrupts
RES: 131917 46750 7432 3291 150003 9576 3435 3067 Rescheduling interrupts
CAL: 2759 6563 7150 6997 5387 7140 7269 6678 Function call interrupts
TLB: 4396 2038 1336 492 5434 1896 1121 606 TLB shootdowns
TRM: 0 0 0 0 0 0 0 0 Thermal event interrupts
THR: 0 0 0 0 0 0 0 0 Threshold APIC interrupts
MCE: 0 0 0 0 0 0 0 0 Machine check exceptions
MCP: 37 37 37 37 37 37 37 37 Machine check polls
ERR: 0
MIS: 0
大事なことを言い忘れましたが、起動直後、これらの行は通常dmesg
にあります。
[ 18.367094] hda-intel: IRQ timing workaround is activated for card #1. Suggest a bigger bdl_pos_adj.
[ 18.458859] hda-intel: IRQ timing workaround is activated for card #2. Suggest a bigger bdl_pos_adj.
それが関連しているのか、それともより大きな問題の症状なのかわからないので、念のために投稿します。
ここで他にどのような情報が関連しているのか、私にはよくわかりません。コメントでもっと質問することを躊躇しないでください。
私はついにこの問題の回避策を見つけたようです。
カーネルにpci=routeirq
ブートオプションを追加する必要があります。ドキュメントに記載されているように、次のことを行います。
すべてのPCIデバイスに対してIRQルーティングを実行します。これは通常、pci_enable_device()で実行されるため、このオプションは、それを呼び出さない壊れたドライバーの一時的な回避策です。
ここでは、NVIDIAXorgドライバーが原因のようです。おそらくバグレポートを提出する必要があります。
ちょっと待ってください... BIOSにアクセスして、グラフィックの「SERR」機能について何も無効にしてください。可能であれば、後のカーネルに更新してみることもできます。
私はまったく同じ問題を抱えており、Debian 6.0を実行し、多くのカーネル(2.6.32、2.6.38、2.6.39)を試し、多くのカーネルパラメーター(「irqpoll」または「noapic」は違いがありませんでしたが、「acpi =オフ」により、システムがほぼ数日間使用できるようになりました)。したがって、初心者には「acpi = off」を使用して実行してみることができます。
私のメインボードはAsusP8H67-M EVOですが、Sandy Bridgeチップセットを搭載したAsusメインボードも使用していますか?はいの場合は、BIOSも更新してみてください。問題が解決する可能性があります。
ここで同じ問題がSandyBridgeを実行しています...
Asus P-67 Sabertooth i7 2600k @ 3.4 nVidia Evga GTX 570 Debian Squeeze 2.6.39-bpo.2-AMD64
17でfirewire_ohci、hda_intelを使用してIRQ17を無効にするKernelOopsesを取得しています。