実際には4つのVM(2 x Linux、1 x w2k3、1 x win7)を備えた仮想化環境があります。ホストシステム(Debian Jessie)では、ゲスト内のタスクマネージャーのCPU負荷がゼロであっても、topは常にwin7ゲストのqemuプロセスに対して30〜70%(またはそれ以上)のCPU負荷を示します。
top - 11:12:08 up 6 days, 1:47, 1 user, load average: 0,70, 0,62, 0,55
Tasks: 216 total, 2 running, 214 sleeping, 0 stopped, 0 zombie
%Cpu(s): 5,0 us, 3,7 sy, 0,0 ni, 91,3 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st
KiB Mem: 24776900 total, 21591188 used, 3185712 free, 122680 buffers
KiB Swap: 3905532 total, 60748 used, 3844784 free. 399364 cached Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
11138 libvirt+ 20 0 10,804g 8,243g 18536 R 70,1 34,9 2137:30 qemu-system-x86
12134 libvirt+ 20 0 7309216 6,046g 18792 S 3,7 25,6 139:13.88 qemu-system-x86
12055 libvirt+ 20 0 8900940 4,057g 18500 S 2,3 17,2 109:41.87 qemu-system-x86
12041 libvirt+ 20 0 2956240 1,388g 18292 S 2,0 5,9 61:38.55 qemu-system-x86
5569 root 20 0 1007924 23456 11012 S 1,0 0,1 1:16.86 libvirtd
ゲストの内部では、MSSQL 2008 R2Expressが実行されています。そのためにTraceflag-T8038が設定されています( proxmoxパフォーマンスの微調整 による)。また、タブレットデバイスは構成から削除され、バルーニングデバイスはゲスト内で無効になります(VM構成で無効にする方法がわからないため)。さらに、Pervasive SQL 8サーバーを実行して、古いbtrieveデータベースを起動します。
奇妙なことに、ゲストからすべてのNICを完全に削除すると、上部のCPU負荷が適切なレベル(1〜3%)に低下します。実際には、NIC私は物理NICの1つ(Intel I350)を通過しました。ただし、動作は仮想化NICでも同じです。これはすべて、クライアントを接続せずにテストしました。
実際のゲスト構成:
<domain type='kvm'>
<name>win7</name>
<uuid>4b62c825-07ce-49b9-be8c-63f1f51ec28c</uuid>
<memory unit='KiB'>8388608</memory>
<currentMemory unit='KiB'>8388608</currentMemory>
<vcpu placement='static'>2</vcpu>
<os>
<type Arch='x86_64' machine='pc-i440fx-2.1'>hvm</type>
</os>
<features>
<acpi/>
<apic/>
<hyperv>
<relaxed state='on'/>
<vapic state='on'/>
<spinlocks state='on' retries='8191'/>
</hyperv>
</features>
<cpu mode='Host-model'>
<model fallback='allow'/>
<topology sockets='1' cores='2' threads='1'/>
</cpu>
<clock offset='localtime'>
<timer name='rtc' tickpolicy='catchup'/>
<timer name='pit' tickpolicy='delay'/>
<timer name='hpet' present='no'/>
<timer name='hypervclock' present='yes'/>
</clock>
<on_poweroff>destroy</on_poweroff>
<on_reboot>restart</on_reboot>
<on_crash>restart</on_crash>
<pm>
<suspend-to-mem enabled='no'/>
<suspend-to-disk enabled='no'/>
</pm>
<devices>
<emulator>/usr/bin/kvm</emulator>
<disk type='block' device='disk'>
<driver name='qemu' type='raw' cache='none' io='native'/>
<source dev='/dev/vg_vm/lv_win7Pro'/>
<target dev='vda' bus='virtio'/>
<boot order='1'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x03' function='0x0'/>
</disk>
<disk type='file' device='cdrom'>
<driver name='qemu' type='raw'/>
<target dev='hdb' bus='ide'/>
<readonly/>
<address type='drive' controller='0' bus='0' target='0' unit='1'/>
</disk>
<controller type='usb' index='0' model='ich9-ehci1'>
<address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x7'/>
</controller>
<controller type='usb' index='0' model='ich9-uhci1'>
<master startport='0'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x0' multifunction='on'/>
</controller>
<controller type='usb' index='0' model='ich9-uhci2'>
<master startport='2'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x1'/>
</controller>
<controller type='usb' index='0' model='ich9-uhci3'>
<master startport='4'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x2'/>
</controller>
<controller type='pci' index='0' model='pci-root'/>
<controller type='ide' index='0'>
<address type='pci' domain='0x0000' bus='0x00' slot='0x01' function='0x1'/>
</controller>
<controller type='virtio-serial' index='0'>
<address type='pci' domain='0x0000' bus='0x00' slot='0x05' function='0x0'/>
</controller>
<serial type='pty'>
<target port='0'/>
</serial>
<console type='pty'>
<target type='serial' port='0'/>
</console>
<channel type='spicevmc'>
<target type='virtio' name='com.redhat.spice.0'/>
<address type='virtio-serial' controller='0' bus='0' port='1'/>
</channel>
<input type='mouse' bus='ps2'/>
<input type='keyboard' bus='ps2'/>
<graphics type='vnc' port='-1' autoport='yes'/>
<video>
<model type='qxl' ram='65536' vram='65536' heads='1'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x02' function='0x0'/>
</video>
<hostdev mode='subsystem' type='pci' managed='yes'>
<source>
<address domain='0x0000' bus='0x07' slot='0x00' function='0x1'/>
</source>
<address type='pci' domain='0x0000' bus='0x00' slot='0x07' function='0x0'/>
</hostdev>
<memballoon model='virtio'>
<address type='pci' domain='0x0000' bus='0x00' slot='0x06' function='0x0'/>
</memballoon>
</devices>
</domain>
これを引き起こす可能性のあるヒントと改善方法はありますか?
犯人を見つけました。私たちの環境にはUSB-over-IPサーバー( Longshine LCS-US204 )があります。クライアントソフトウェアは、その特定のVMにインストールされました。クライアントソフトウェアをアンインストールした後、ホストのCPU負荷は適切なレベルまで低下しました。いつも接続を探していたようです。すべてのvirtio-serialデバイスを削除すると、もう1つの小さな改善がもたらされました。現在、ウィンドウがアイドル状態のときのホスト負荷は約2〜3%です。ご協力いただきありがとうございます。
私は過去に同様の問題を抱えていました。ゲストでのIRQストーミングと、ホストでの高負荷です。ゲストでCPUをストームしているものを分離する必要があります。最有力候補は、MSSQLインスタンスとhal.dllライブラリの両方です。
デバッグするには、次の手順に従います。
EDIT:わかりました、MSSQLもHALもホスト負荷の根本的な原因ではないようです。 2番目のデバッグフェーズに進みます。
powertop
ユーティリティを使用してホストのCPUアクティビティを監視してください。ここでは、どのソフトウェアルーチン/割り込みが最もサービスされているかを確認する必要があります。 30秒で実行し、ここに報告します。