検索条件
日本語情報が見つからなかったのでメモ。
一部サービスにAmazonEC2を使っているのですが、先日インスタンスタイプをm1.smallからc1.mediumに乗り換えたところ、1日1回くらいのペースでサーバが落ちるという状況に。なぜかAmazonの管理画面では「running」になっているのだけど、WebもSSHもまったくアクセスできなくなる。しかも一度落ちると2回再起動しないと復活しないというよくわからない状況(なぜ2回?)。
/var/log/messageには下記のようなエラーが。
kernel BUG at arch/i386/mm/pgtable-xen.c:306!
カーネルのバグ??
検索しても日本語のページでは原因が見つからず。海外サイトをまわってやっと見つけました。
以下、参考情報(英語)
http://www.vincestross.com/2009/04/upgrade-an-ec2-instance/
結論としては、インスタンスの起動時にデフォルトのカーネルを選択しない方がいいらしい。
c1.mediumのデフォルトのカーネルバージョンが2.6.16なんですが、これが問題の元とのこと。
インスタンス起動時に、たぶんどれでもいいのですがデフォルト以外のなるべくリストの下の方のKernel ID(下の方がカーネルが新しい)を選んでおきましょう。
2.6.16でなければなんでもいい。
ちなみに利用中のカーネルのバージョンはuname -aで確認できます。
2.6.31になって今のところ安定してます。しかしデフォルト設定にそんな罠があったとは…。