web-dev-qa-db-ja.com

Linuxサーバーはアイドル状態ですが非常に遅い

LinuxのUbuntu16.04ボックスがありますが、負荷はほとんどありませんが、数日間遅くなっています。それはそれがしなければならないことのために力不足ではありません:

  • owncloudを備えたファイルサーバー(2ユーザー)、
  • gogsを備えたgitサーバー。

ハードウェア:Intel Atomデュアルコア@ 1,7GHz、4GB DDR3&1TBHDD。

私が遅いと言うとき、それはすべてがそれが必要であるよりずっと多くの時間を要することを意味します。たとえば、apt-get upgradeは、通常は数秒の大きなアップグレードがなくても、5分ほどかかります。

Gogsを使用すると、ページの生成も非常に遅くなります。 Gogsは統計を提供します:Page: 9803ms Template: 10ms、通常、ページは生成するのに500msのようなものです…

トップ出力:

top - 10:23:59 up 34 min,  2 users,  load average: 0.58, 0.82, 1.00
Tasks: 132 total,   1 running, 131 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.2 us,  0.3 sy,  0.0 ni, 94.9 id,  4.6 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  4008036 total,  3014964 free,   366540 used,   626532 buff/cache
KiB Swap:  1000444 total,  1000444 free,        0 used.  3370956 avail Mem 

プロセス:

ps h -Led -o user | sort | uniq -c | sort -n
  1 Debian-exim
  1 messagebus
  2 ntpd
  4 syslog
 21 www-data
 24 gogs
 30 mysql
 31 sensu
133 root

dmesg:

dmesg | grep "sd\|EXT\|mount\|filesystem\|SATA"
[   20.069558] ahci 0000:00:18.0: AHCI 0001.0300 32 slots 2 ports 3 Gbps 0x3 impl SATA mode
[   20.069563] ahci 0000:00:18.0: flags: 64bit ncq led clo pio deso sadm sds apst 
[   20.084065] ata1: SATA max UDMA/133 abar m2048@0x80024000 port 0x80024100 irq 24
[   20.084068] ata2: SATA max UDMA/133 abar m2048@0x80024000 port 0x80024180 irq 24
[   20.518945] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[   20.518972] ata2: SATA link down (SStatus 0 SControl 300)
[   20.606811] sd 0:0:0:0: [sda] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
[   20.606815] sd 0:0:0:0: [sda] 4096-byte physical blocks
[   20.606972] sd 0:0:0:0: [sda] Write Protect is off
[   20.606977] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[   20.607034] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[   20.607508] sd 0:0:0:0: Attached scsi generic sg0 type 0
[   20.649884]  sda: sda1 sda2 sda3
[   20.651578] sd 0:0:0:0: [sda] Attached SCSI disk
[   22.965497] EXT4-fs (sda2): mounted filesystem with ordered data mode. Opts: (null)
[   27.112100] systemd[1]: Set up automount Arbitrary Executable File Formats File System Automount Point.
[   33.547005] EXT4-fs (sda2): re-mounted. Opts: errors=remount-ro
[   36.480793] Adding 1000444k swap on /dev/sda3.  Priority:-1 extents:1 across:1000444k FS
[   37.538548] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
[  948.341404] QNX4 filesystem 0.2.3 registered.

いくつかのものをOwncloudと同期しながらiotopで調査すると、問題がIOバインドされていることが明らかになります。これは、主にMySQLが原因です。

enter image description here

それにもかかわらず、ここではMySQLを書き込み集中型とは見なしません。 ジャーナルのないパーティションに移動する jdb2の問題のためだけに解決策とは思えません。それだけでなく、数日までは完全に機能し、同じセットアップが別のマシンの魅力のように機能します。

smartctl -t long /dev/sdaで完全なテストを実行した後:

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   153   153   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       11
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   094   094   000    Old_age   Always       -       3022
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       4
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       50
194 Temperature_Celsius     0x0002   206   206   000    Old_age   Always       -       29 (Min/Max 19/30)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

Hdparmを使用したディスクパフォ​​ーマンス(FSマウントされていない)のレキューからテスト済み):

hdparm -Tt /dev/sda

/dev/sda:
 Timing cached reads:   2836 MB in  2.00 seconds = 1418.58 MB/sec
 Timing buffered disk reads: 236 MB in  3.01 seconds =  78.51 MB/sec

SMARTはエラーを表示しませんが、ハードウェアの問題である可能性がありますが、それは私には非常に遅いようです…

さらに、FSは正気のようです:

e2fsck /dev/sda2
e2fsck 1.42.9 (4-Feb-2014)
/dev/sda2 : clean, 314622/60956672 files, 12081169/243818240 blocks

問題はハードドライブから来ていました。 hdparmの結果が示すように、ディスクのパフォーマンスが低下していたため、多くのIO待機が発生し、システムの速度が低下しました。

2
Buzut

あなたが提供したものに基づいて、ディスクに問題があるようです。 SMART smartctl -t short/dev/sdaなどのテストを実行して結果を確認することをお勧めします。結果に多くの不良セクタとエラーが含まれている場合、それは無料です。

スマートテストで短期間で回答が得られない場合は、ストレスが大きい(ストーリーからではない可能性が高い)か、欠陥があります。おそらく、絶え間ないエラー訂正は、途方もないオーバーヘッドを生み出す可能性があります。

必須ではないすべてのサービスがシャットダウンされたときに管理するディスクパフォ​​ーマンスを知りたいと思います。 hdparm -Tt/dev/sdaを実行して、結果を共有してください。

2
Robin Gould