2013年8月7日 5:53 PM
一部スペースにて発生したアクセス障害についてのご報告 (2013年8月7日)
8月7日(水) 17時4分 から 17時9分頃 まで、Backlogの一部のスペースにアクセスしづらい、またはアクセスできない問題が断続的に発生しておりました。
[障害の概要]
8月7日の17時4分頃より、一部のスペースにてDBサーバの応答が悪化いたしました。
障害の検知から対応を開始し、17時9分頃に障害は収束いたしました。
上記の時間帯において、対象のスペースのユーザ様には、Backlog のスペースにつながりにくい、つながらない、という状況が発生しておりました。
[障害の影響範囲]
一部のスペースに対して Backlog へのアクセスに影響がありました。
[障害発生の経緯]
- 17:04 DBサーバが高負荷となり、応答の悪化を検知。Twitter にて障害状況を報告後、すべてのアプリケーションサーバを停止すると同時に、長時間終了していないDBへの問い合せを強制終了
- 17:09 アプリケーションサーバ復旧後、全サーバにて応答が安定、障害の収束
[障害発生の原因]
ある条件でのDBへの問い合せによる高負荷と考えておりますが、引き続き詳細に調査をおこないます。
[対策]
高負荷を引き起したDBへの問い合せの条件の特定と改善をおこないます。
この度は、ご迷惑をお掛けして申し訳ございませんでした。
安心してBacklogをご利用いただけるよう、運用の改善を進めます。