プログラムの詳細の確認
topコマンドでどれご占有しているか調べたら
それを
locate コマンドで調べる
プログラムの場所がわかったら
dpkg
rpm
を使い、プログラムの詳細情報を取得
たとえば
topコマンドの結果
backupdプロセスが原因だったとして
locate backupd
で調べて
/usr/bin/backupd
にあるとわかったら
rpm -qf /usr/bin/backupd
でパッケージ名を表示し
rpm -qi backupd-tool
で
backupd-toolの詳細を表示し
バックアップツールのデーモンであることを確認
rpm -ql backupd-tool
で、backupd-toolパッケージのファイル一覧を表示し
initスクリプトが存在することを確認
という流れになる
initスクリプトは
システム起動時に自動で呼び出され
初期化、ソフトの起動をするスクリプト
ここまでで、原因の推測かできるので
ログを見て検証
まず、いつからシステムが重くなったか知るため
sarコマンドで過去のシステムの状態を確認
sar の実行結果の中から
%user という、ユーザープロセスのCPU利用率が急増しているところと
%idleという、CPUアイドル時間の割合が減少しているところを探す
この時間帯が判明したら
システムログの
/var/log/syslog
や
/var/log/messages
を確認する
これを確認すると
CROND というデーモンが処理をしているのが確認てきる
一番右側に、実行している処理で
/etc/cron.hourly
/etc/cron.daily
となっているので
ls /etc/cron.daily
で確認する
これにより、この時間帯にバックアップツールが動作しているのが
原因だったと検証できる
これらから、プロセス状況の把握をまとめてみると
free -m
てメモリ使用率の確認
topコマンドで
c
m
で、占有率の高いプロセスを把握
locateコマンドなどでファイルシステムのどこにあるか把握
パッケージコマンドのrpm dpkgで詳細情報の取得
sar コマンドで
CPU利用率
sar -m て
メモリ使用率
から
状態異常の起きている時間を把握
/var/log/syslog
/var/log/messages
から、その時間帯に行われているシステムのログをみて
推測と結果の検証をする