• AWSメンテナンスでstoppingのまま停止しない障害の対応

    こんにちは。小宮です。

    タイトルどおり障害がありまして、今後の為に記録しておこうかと思います。

    AWSメンテ通知の来たインスタンスをStopしたところ、最終的には6時間強ほどstoppingのままでした。
    今回のインスタンスは、自分で構築したわけでなく、構築メモは残っているもののメンテナンスされていない、
    という状況把握が難しいパターンでした。
    一応上がってるプロセスとポートくらいは控えてから止めましたが、snapshotは撮ってなくAMIも作っていませんでした。

    日本語フォーラムに投稿したところ特に反応がありませんでした。
    聞いた話によると英語フォーラムを使えば15分くらいで対応してもらえることもあるようです。

    その間、stoppingのインスタンスのsnapshotを撮ってAMI作成してそこから新インスタンスを起動してみましたが、
    NICの設定の問題かなにかで接続できませんでした。
    microインスタンスを起動しapacheだけ入れて簡単なsorryページを設置しました。

    stoppingのまま6時間ほど待ったのですが一向に進捗せず、
    しかもサポートにも未加入だったので、サポートに申し込んで以下のように問い合わせをしました。
    (申し込んだら10分くらいで反映されました)。
    -——————————– 1回目:
    EC2 Management ConsoleからサーバをStopしましたが、Stoppingから進みません。
    http://aws.amazon.com/jp/instance-help/
    に従い、何度かForce Stopを試みましたが同様のため、強制停止をお願いしたいです。

    Zone: ap-northeast-1a
    Instance: i-4a42a348

    インスタンスID: i-4a42a348
    -——————————– 2回目:

    先ほどstopしました。何か対応されましたでしょうか。
    同じインスタンスをstartしたいのですが、2回ほどstartしてもstopされてしまいます。
    可能なら起動をお願いできますでしょうか。
    -——————————– 私が時短なので帰宅後、stopedになってから選べたCreateImageでAMIを作って新インスタンスを起動したら接続できたようです。

    翌朝みたらサポートから返事が来ていました。
    -——————————– サポートの方から:
    お問い合わせ誠にありがとうございます。

    i-4a42a348についてお調べしたところ、仮想サーバホストに問題が発生していたためインスタンスの停止にお時間を要しておりました。
    EC2では、長時間StoppingやShuttingdownの状態が続いているインスタンスを自動でクリーンアップする仕組みがございます。
    今回はこちらの仕組みによってインスタンスのStopが行われておりました。
    このたびはご迷惑をおかけし、申し訳ございませんでした。

    インスタンスが起動できない件については、インスタンスとEBSボリュームの関連付けに問題が発生しており、その影響でインスタンスが起動しない状態となっているようです。
    お手数をおかけしますが、インスタンスにアタッチされているボリュームをデタッチ/アタッチして再度インスタンスの起動をお試しいただけるでしょうか。
    通常のデタッチが効かない場合、Force Detachをお試しください。

    ボリュームのデタッチ/アタッチを行ってもインスタンスが起動しない場合、恐れ入りますが、再度ご連絡いただけるでしょうか。

    ご不明な点がありましたらお知らせください。
    よろしくお願いいたします。
    -——————————–

    ...