2013年7月11日 5:41 PM

一部スペースにて発生したアクセス障害についてのご報告 (2013年7月10日)

7月10日(木) 12時57分 から 13時04分頃 まで、Backlogの一部のスペースにアクセスしづらい、またはアクセスできない問題が断続的に発生しておりました。
お昼のご利用の多い時間帯に障害を発生させてしまったこと、申し訳ございませんでした。

[障害の概要]
7月10日の12時57分頃より、一部のスペースにてDBサーバの応答が悪化いたしました。
障害の検知から対応を開始し、13時04分頃に障害は収束いたしました。
上記の時間帯において、対象のスペースのユーザ様には、Backlog のスペースにつながりにくい、つながらない、という状況が発生しておりました。

[障害の影響範囲]
一部のスペースに対して Backlog へのアクセスに影響がありました。

[障害発生の経緯]

  • 12:57 DBサーバが高負荷となり、応答の悪化を検知。Twitter にて障害状況を報告後、すべてのアプリケーションサーバを停止すると同時に、DBへの問い合わせで長時間かかっているクエリを強制終了
  • 13:04 アプリケーションサーバ復旧後、全サーバにて応答が安定、障害の収束

[障害発生の原因]
DBサーバが高負荷となった原因は、ただ今調査中です。
また、障害発生時に効率が悪いクエリが発行されていたことから、DBサーバにより一層の負荷がかかる状態となっておりました。

[対策]
引き続きDBサーバが高負荷となった原因を調査すると同時に、障害時のログから時間がかかっているクエリを解析後対応を行います。

この度は、ご迷惑をお掛けして申し訳ございませんでした。
安心してBacklogをご利用いただけるよう、運用の改善を進めます。

アナウンス情報一覧に戻る