web-dev-qa-db-ja.com

カーネル4.20.xおよびamdgpuカーネルドライバーでR9-290 / 290Xカードを動作させる方法

R9-290/290Xハワイのカード範囲は、ubuntu 18のLinuxカーネル4.19.xおよび4.20.xでは機能しません。最後に完全に機能するカーネルバージョンは4.18.20です。これは、最新の安定したmesaドライバーとamdgpu drmドライバーが含まれています-カーネル。

4.19.xおよび4.20.xは、起動に失敗するか、まったく起動しません(grub後の黒い画面、ttyなし)。

Grub linuxコマンドラインパラメータに応じて、状態の証拠をさらに調査して収集するために不安定なデスクトップを起動することができました。ここにあります...

カーネルとコマンドライン

カーネル:

Linux version 4.20.0-042000-generic (kernel@tangerine) (gcc version 8.2.0 (Ubuntu 8.2.0-12ubuntu1)) #201812232030 SMP Mon Dec 24 01:32:58 UTC 2018

カーネルコマンドライン:

BOOT_IMAGE=/vmlinuz-4.20.0-042000-generic root=/dev/mapper/ubuntu--vg-root ro quiet splash radeon.si_support=0 radeon.cik_support=0 amdgpu.si_support=1 amdgpu.cik_support=1 amdgpu.dc=1

lspci -v for Linux Kernel 4.20.0

01:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Hawaii XT / Grenada XT [Radeon R9 290X/390X] (prog-if 00 [VGA controller])
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Hawaii XT / Grenada XT [Radeon R9 290X/390X]
    Flags: fast devsel, IRQ 16
    Memory at d0000000 (64-bit, prefetchable) [size=256M]
    Memory at ef800000 (64-bit, prefetchable) [size=8M]
    I/O ports at ae00 [size=256]
    Memory at fb980000 (32-bit, non-prefetchable) [size=256K]
    [virtual] Expansion ROM at 000c0000 [disabled] [size=128K]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Legacy Endpoint, MSI 00
    Capabilities: [a0] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] #19
    Capabilities: [2b0] Address Translation Service (ATS)
    Capabilities: [2c0] Page Request Interface (PRI)
    Capabilities: [2d0] Process Address Space ID (PASID)
    Kernel modules: radeon, amdgpu

01:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Hawaii HDMI Audio [Radeon R9 290/290X / 390/390X]
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Hawaii HDMI Audio [Radeon R9 290/290X / 390/390X]
    Flags: bus master, fast devsel, latency 0, IRQ 32
    Memory at fb9fc000 (64-bit, non-prefetchable) [size=16K]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Legacy Endpoint, MSI 00
    Capabilities: [a0] MSI: Enable+ Count=1/1 Maskable- 64bit+
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Kernel driver in use: snd_hda_intel
    Kernel modules: snd_hda_intel

最後のブートカーネル4.20 1つのディスプレイのみが機能します。

その他のディスプレイは強制ミラーリング。他のGPUポートが機能していない。 journalctl -b | grep drm出力:

[drm] amdgpu kernel modesetting enabled.
[drm] initializing kernel modesetting (HAWAII 0x1002:0x67B0 0x1002:0x0B00 0x00).
[drm] register mmio base: 0xFB980000
[drm] register mmio size: 262144
[drm] add ip block number 0 <cik_common>
[drm] add ip block number 1 <gmc_v7_0>
[drm] add ip block number 2 <cik_ih>
[drm] add ip block number 3 <gfx_v7_0>
[drm] add ip block number 4 <cik_sdma>
[drm] add ip block number 5 <powerplay>
[drm] add ip block number 6 <dm>
[drm] add ip block number 7 <uvd_v4_2>
[drm] add ip block number 8 <vce_v2_0>
[drm] vm size is 128 GB, 2 levels, block size is 10-bit, fragment size is 9-bit
[drm:gmc_v7_0_sw_init [amdgpu]] *ERROR* Failed to load mc firmware!
[drm:amdgpu_device_init.cold.31 [amdgpu]] *ERROR* sw_init of IP block <gmc_v7_0> failed -2
[drm] amdgpu: finishing device.

Linuxカーネル4.18.20の最後の成功したブート。

すべてのディスプレイが機能しています。すべてうまくいった。参考までに、journalctl | grep drm出力:

[drm] amdgpu kernel modesetting enabled.
fb: switching to amdgpudrmfb from VESA VGA
[drm] initializing kernel modesetting (HAWAII 0x1002:0x67B0 0x1002:0x0B00 0x00).
[drm] register mmio base: 0xFB980000
[drm] register mmio size: 262144
[drm] probing gen 2 caps for device 8086:151 = 261ac83/e
[drm] probing mlw for device 8086:151 = 261ac83
[drm] add ip block number 0 <cik_common>
[drm] add ip block number 1 <gmc_v7_0>
[drm] add ip block number 2 <cik_ih>
[drm] add ip block number 3 <ci_dpm>
[drm] add ip block number 4 <dm>
[drm] add ip block number 5 <gfx_v7_0>
[drm] add ip block number 6 <cik_sdma>
[drm] add ip block number 7 <uvd_v4_2>
[drm] add ip block number 8 <vce_v2_0>
[drm] vm size is 64 GB, 2 levels, block size is 10-bit, fragment size is 9-bit
[drm] Detected VRAM RAM=4096M, BAR=256M
[drm] RAM width 512bits GDDR5
[drm] amdgpu: 4096M of VRAM memory ready
[drm] amdgpu: 4096M of GTT memory ready.
[drm] GART: num cpu pages 262144, num gpu pages 262144
[drm] PCIE GART of 1024M enabled (table at 0x000000F4007E9000).
[drm] Internal thermal controller with fan control
[drm] Invalid PCC GPIO: 13!
[drm] amdgpu: dpm initialized
[drm] Found UVD firmware Version: 1.64 Family ID: 9
[drm] Found VCE firmware Version: 50.10 Binary ID: 2
[drm] PCIE gen 3 link speeds already enabled
[drm] dce110_link_encoder_construct: Failed to get encoder_cap_info from VBIOS with error code 4!
[drm] dce110_link_encoder_construct: Failed to get encoder_cap_info from VBIOS with error code 4!
[drm] dce110_link_encoder_construct: Failed to get encoder_cap_info from VBIOS with error code 4!
[drm] Display Core initialized with v3.1.44!
[drm] SADs count is: -524, don't need to read it
[drm] Supports vblank timestamp caching Rev 2 (21.10.2013).
[drm] Driver supports precise vblank timestamp query.
[drm] UVD initialized successfully.
[drm] VCE initialized successfully.
[drm] fb mappable at 0xD0BD0000
[drm] vram apper at 0xD0000000
[drm] size 8294400
[drm] fb depth is 24
[drm]    pitch is 7680
fbcon: amdgpudrmfb (fb0) is primary device
[drm] dce_get_required_clocks_state: clocks unsupported disp_clk 681000 pix_clk 148500
amdgpu 0000:01:00.0: fb0: amdgpudrmfb frame buffer device
[drm] Initialized amdgpu 3.26.0 20150101 for 0000:01:00.0 on minor 0
1
DanglingPointer

自分の問題のトラブルシューティングと解決を開始してくれたAlex Deucher(LinuxのAMDドライバー開発者)に感謝します。

問題と回避策の解決策は、このバグトラッカーで最初に文書化されました... https://bugs.freedesktop.org/show_bug.cgi?id=108781

下で詳しく説明する解決策は、Linuxカーネル4.19.xおよび4.20.xで修正されることはほとんどありません。私はそれが将来のカーネルで分類されることを望んでいます。簡単なものが必要な場合は、4.18.20以下を使用してください。 4.19.x/4.20.xカーネルの修正を利用したい場合は、以下の方法を試してみてください。

回避策:

  1. Linuxコマンドラインからamdgpu.dpm = xを完全に削除し、grubを更新しました。 「0」または「1」は機能せず、起動せず、ttyも
  2. / lib/firmware/radeon/*を/ lib/firmware/amdgpu /にコピーしました
  3. / lib/firmware/radeon/*のすべての内容をバックアップ
  4. / lib/firmware/radeon /を削除しました
  5. 4.20.0のinitrdが/ bootの場所にあることを確認
  6. ~$ Sudo update-initramfs -u
  7. 機能している/動作しているカーネルの内容をlsinitramfs /boot/initrd.img-<YOUR-KERNEL>-generic | grep hawaiiで確認します/ lib/firmware/radeonを削除している場合でも、それを指す必要があります。
  8. 機能していない新しいカーネルの内容を確認します。私にとってカーネルはlsinitramfs /boot/initrd.img-4.20.0-042000-generic | grep hawaiiでした。/lib/firmware/amdgpu/*のみを含める必要があります
  9. バックアップから/ lib/firmware/radeon/*を復元します。これは、必要に応じて以前のカーネルバージョンに回復できるようにするためです。
  10. 再起動/再起動
  11. [OPTIONAL-IMPORTANT]すべてが正常に機能している場合(私にとっては)、将来のカーネルで競合が発生しない場合は、/ lib/firmware/radeonを削除してから削除してください現在機能している新しいカーネルより前のすべての以前のカーネル。これを行わず、新しいカーネルをインストールしてからupdate-initramfsコマンドを実行すると、将来のカーネルのinitrdにパスが重複します。それが起こるとき何が起こるかわからない、それのための時間がないので私はそれを見つけるためにテストしていません。
1
DanglingPointer