2013年9月13日 6:18 PM
一部スペースにてアクセスできない状態が発生しておりました (2013年9月13日)
9月13日(金) 13時52分 から 14時08分頃 まで、Backlogの一部のスペースにアクセスしづらい、またはアクセスできない問題が発生しておりました。
該当スペースをご利用のみなさまには、大変ご迷惑をおかして申し訳ございませんでした。
[障害の概要]
13時48分頃に、一部のスペースにてDBサーバの応答が悪化いたしました。
障害の検知から対応を開始し、14時08分頃に障害は収束いたしました。
上記の時間帯において、対象のスペースのユーザ様には、Backlog のスペースにつながりにくい、つながらない、という状況が発生しておりました。
[障害の影響範囲]
一部のスペースに対して Backlog へのアクセスに影響がありました。
[障害発生の経緯]
- 13:48 アプリケーションからの応答が悪化している、または応答できなくなっていることを検知し、DBサーバが高負荷状態であることを確認
- 13:51 Twitter にて障害状況を報告後、アプリケーションサーバを一時的にすべて停止し、DBサーバ内の状況確認
- 14:00 DBサーバを再起動
- 14:05 負荷状況を確認しながら、アプリケーションサーバを順次起動し、障害の収束
[障害発生の原因]
DBサーバが高負荷となった原因は、ただ今調査中です。
[対策]
引き続きDBサーバが高負荷となった原因を調査すると同時に、障害時のログから時間がかかっているクエリを解析後対応を行います。
この度は、ご迷惑をお掛けして申し訳ございませんでした。
安心してBacklogをご利用いただけるよう、運用の改善を進めます。