私のシステムは常にクラッシュします。そこで、ログファイルで考えられるエラーを確認できなかったため、kdumpで問題を確認できるようにすることにしました。
私は ここからサイトからkdumpを設定する手順 に従いました。私のサーバーはCentOS 5.8と16GB RAMで動作します。以下は、kdumpを構成するために実行した手順です。
1. Install kexec-tools, `yum install kexec-tools` and follow the installation steps
2. Edit the /boot/grub/grub.conf to configure the kdump memory usage
3. Edit the /etc/kdump.cof to configure the target type to /var/crash/ and core_collector
4. Enable kdump through `chkconfig kdump on`.
5. Reboot the server
service kdump status
を実行すると、Kdump is not operational
と表示されます。 kdumpを機能させるにはどうすればよいですか。設定するものを逃しましたか? /boot/grub/grub.confと/etc/kdump.confの内容を以下に含めました
以下は/boot/grub/grub.confファイルの内容です
# grub.conf generated by anaconda
#
# Note that you do not have to rerun grub after making changes to this file
# NOTICE: You have a /boot partition. This means that
# all kernel and initrd paths are relative to /boot/, eg.
# root (hd0,0)
# kernel /vmlinuz-version ro root=/dev/sda3
# initrd /initrd-version.img
#boot=/dev/sda
default=0
timeout=5
splashimage=(hd0,0)/grub/splash.xpm.gz
hiddenmenu
title CentOS (2.6.18-308.el5)
root (hd0,0)
kernel /vmlinuz-2.6.18-308.el5 ro root=LABEL=/
crashkernel=128M
initrd /initrd-2.6.18-308.el5.img
以下は/etc/kdump.confファイルの内容です
# Configures where to put the kdump /proc/vmcore files
#
# This file contains a series of commands to perform (in order) when a
# kernel crash has happened and the kdump kernel has been loaded. Directives in
# this file are only applicable to the kdump initramfs, and have no effect if
# the root filesystem is mounted and the normal init scripts are processed
#
# Currently only one dump target and path may be configured at once
# if the configured dump target fails, the default action will be preformed
# the default action may be configured with the default directive below. If the
# configured dump target succedes
#
# For filesystem based dump, it's recommended to use UUID and LABEL
# instead of device name in dump target.
#
# See the kdump.conf(5) man page for details of configuration directives
#raw /dev/sda5
#ext3 /dev/sda3
#ext3 LABEL=/boot
#ext3 UUID=03138356-5e61-4ab3-b58e-27507ac41937
#net my.server.com:/export/tmp
#Net [email protected]
path /var/crash
core_collector makedumpfile -c --message-level 1
#core_collector cp --sparse=always
#link_delay 60
#kdump_post /var/crash/scripts/kdump-post.sh
#extra_bins /usr/bin/lftp
#disk_timeout 30
#extra_modules gfs2
#options modulename options
#default Shell
#sshkey /root/.ssh/kdump_id_rsa
また、私の/boot/grub/grub.confファイルがチュートリアルのサンプルgrub.confファイルと異なることにも気づきました。彼らは2つの行で異なります:
From tutorial
kernel /vmlinuz-2.6.32-220.el6.x86_64 ro root=/dev/sda3
initrd /initramfs-2.6.32-220.el6.x86_64.img
From own conf
kernel /vmlinuz-2.6.18-308.el5 ro root=LABEL=/
initrd /initrd-2.6.18-308.el5.img
これらの行が原因でkdumpが起動しませんか?
[編集1]/var/log/messagesの内容
Feb 25 02:18:28 61540 kernel: Command line: ro root=LABEL=/ crashkernel=128M
Feb 25 02:18:28 61540 kernel: BIOS-provided physical RAM map:
Feb 25 02:18:28 61540 kernel: BIOS-e820: 0000000000010000 - 000000000009a000 (usable)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 000000000009f800 - 00000000000a0000 (reserved)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000000f0000 - 0000000000100000 (reserved)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 0000000000100000 - 00000000cfda0000 (usable)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000cfda0000 - 00000000cfdd1000 (ACPI NVS)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000cfdd1000 - 00000000cfe00000 (ACPI data)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000cfe00000 - 00000000cff00000 (reserved)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000e0000000 - 00000000f0000000 (reserved)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 00000000fec00000 - 0000000100000000 (reserved)
Feb 25 02:18:28 61540 kernel: BIOS-e820: 0000000100000000 - 000000042f000000 (usable)
Feb 25 02:18:28 61540 kernel: DMI 2.4 present.
Feb 25 02:18:28 61540 kernel: No NUMA configuration found
Feb 25 02:18:28 61540 kernel: Faking a node at 0000000000000000-000000042f000000
Feb 25 02:18:28 61540 kernel: Bootmem setup node 0 0000000000000000-000000042f000000
Feb 25 02:18:28 61540 kernel: Memory for crash kernel (0x0 to 0x0) notwithin permissible range
Feb 25 02:18:28 61540 kernel: disabling kdump
Feb 25 02:44:39 61540 kdump: No crashkernel parameter was specified or crashkernel memory reservation failed
Feb 25 02:44:39 61540 kdump: failed to start up
[編集2]または、コードro root = LABEL =をro root =/dev/sda3に変更する必要がありますか?
title CentOS (2.6.18-308.el5)
root (hd0,0)
kernel /vmlinuz-2.6.18-308.el5 ro root=LABEL=/
crashkernel=128M
initrd /initrd-2.6.18-308.el5.img
crashkernel
パラメータを新しい行に入力したようです。これがKdump is not operational
メッセージの理由です。すべてのカーネルパラメータは、kernel
と同じ行に配置する必要があります。
title CentOS (2.6.18-308.el5)
root (hd0,0)
kernel /vmlinuz-2.6.18-308.el5 ro root=LABEL=/ crashkernel=128M
initrd /initrd-2.6.18-308.el5.img
再起動後、/var/log/messages
を確認すると、次のようなものが表示されます。
localhost kdump: kexec: loaded kdump kernel
localhost kdump: started up
そして:
# /etc/init.d/kdump start
Starting kdump: [ OK ]
# /etc/init.d/kdump status
Kdump is operational
kdump: No crashkernel parameter was specified or crashkernel memory reservation failed
kdump: failed to start up
this ドキュメントによると、これを試してください:
crashkernel=128M@16M
クラッシュカーネルが小さすぎます。 256M、384M、または512Mを試します。 「クラッシュカーネルのメモリ...は許容範囲内ではありません」というメッセージがそのことを伝えています。