QNAPTS-412を持っています。 RAID10には4x4TB WDRedドライブがあります。
かわいそうなことはかなり一生懸命働きます。事実上24時間年中無休で、多数のオフィスコンピュータと少数のサーバーからのバックアップデバイスとして20〜30MB /秒で実行されます。
過去2週間、どこからともなく、16時間ごとに再起動しています。この種の作業負荷は約3年間続いており、18か月ごとにドライブ容量をアップグレードするための休憩があります。
コンソール(またはSSH経由)で再起動する理由を確認できる場所はありますか?
ウェズリーの答えによると、ログには何も見つかりませんでした。その結果、現場に出向き、QNAPシャーシを予備のシャーシと交換し、古いドライブを新しいシャーシに配置しました。
同じ種類の負荷がかかっている間、2日以上安定しているようです。ハードウェアは非常に長い間適度に暖かい場所にあったため、過熱の問題が原因で故障したと思われます。
sshログインを有効にすると
ssh admin@<qnap_ip_addr_here>
password: admin
次に/ var/logを見てください
grep ERR *log
特にhal_lib.logとhal_lib.log.bakを見てください
このようなものを探してください。私のHDDは60Cだったとは思わないので、HDDの温度が正しく読み取られないことがあるかどうか疑わしいです。これらが実際の測定値ではなくしきい値を設定している可能性があります。わからない。
hal_lib.log:Get_Temp_Threshold() called, SYS_ERROR_TEMP=70
hal_lib.log:Get_Temp_Threshold() called, HDD_ERROR_TEMP=60
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85
他の人がこれを見ているかどうかも興味があります:
manaRequest.cgi:Tue Oct 21 16:45:48 2014
PD_Is_Exist: can't retrieve port_id value!
hal_daemon:Tue Oct 21 16:45:59 2014
root_get_fan_speed(978): NOT implement.
se_sys_get_SAS_HBA_info(3606):System Error.
disk_manage.cgi:Tue Oct 21 16:46:03 2014
qNAP qui(ハードウェア)の内部に入り、スマートファン速度設定を無効にして手動速度に切り替えることをお勧めします(常に中程度ですか?)
「root_get_fan_speed(979):実装しないでください」と表示されている場合。怪しいです。ファンの速度はGUIで正しいように見えるので。中程度を選択した場合は約9k、高速を選択した場合は> 10k
ターミナルでQNAPに接続し、/mnt/HDA_ROOT/.logs
を調べます。具体的には、kmsg
です。あなたはあなたの熟読、解釈、そして究極の啓発のために多くの深い情報を見るはずです。
もう1つのオプションは、Web UI >> [システム管理] >> [システムログ] >>上部のタブに移動すると、さまざまなファイルへのUIアクセスが可能になります。
何を探すべきかについては、それは通常、見た目が悪いもののクラップスシュートであり、Googleがあなたに言っていることはもっと悪いです。
NASにsshを実行して、以下を実行することにより、再構築がビジーであるかどうか、およびそれにかかる時間(分)を確認することもできます。
# cat /etc/mdstat
残り時間を含むRAIDの再構築が表示されます。
再起動の原因となる予期しない障害が発生したのではないかと思いますが、QNAPはドライブを再同期する必要があると判断していました。また、再同期中は通常の操作が可能です。しかし、再同期中のアクティビティに問題がありました。 「一定の負荷」があり、16時間ごとに再起動した場合、それは負荷と再同期の相互作用であったのではないかと思います。
同様の問題が発生し、バックアップジョブを停止して再同期を完了するまで、再起動ループから抜け出すことができませんでした(GUIの適切な場所(ストレージマネージャー内)で再同期ステータスを確認できます)。ログには、再同期がいつ開始されるかが示されます。再同期が完了するとログに記録されるかどうかはわかりません。実行中はGUIが確実に表示されます(メインページの上部にもタスク/ジョブとして表示されます)。
概要:再同期しているかどうかを確認します。その場合は、再同期が完了するまで外部アクティビティを停止します。
最高の冷却を得るために、smartfan設定を手動高速に設定することもできます。