2013年7月16日 3:05 PM

一部スペースにて発生したアクセス障害についてのご報告 (2013年7月16日)

7月16日(木) 11時26分 から 11時43分頃 まで、Backlogの一部のスペースにアクセスしづらい、またはアクセスできない問題が断続的に発生しておりました。

お昼のご利用の多い時間帯に障害を発生させてしまったこと、申し訳ございませんでした。

7月16日(木) 20時37分 追記
20時04分頃にも同様の障害が発生し、20時14分に収束いたしました。皆様には度々ご迷惑をおかけして申し訳ございません。

[障害の概要]

7月16日の11時26分頃より、一部のスペースにてDBサーバの応答が悪化いたしました。
障害の検知から対応を開始し、11時43分頃に障害は収束いたしました。
上記の時間帯において、対象のスペースのユーザ様には、Backlog のスペースにつながりにくい、つながらない、という状況が発生しておりました。

[障害の影響範囲]
一部のスペースに対して Backlog へのアクセスに影響がありました。

[障害発生の経緯]

  • 11:26 DBサーバが高負荷となり、応答の悪化を検知。Twitter にて障害状況を報告後、すべてのアプリケーションサーバを停止すると同時に、DBへの問い合わせで長時間かかっているクエリを強制終了
  • 11:43 アプリケーションサーバ復旧後、全サーバにて応答が安定、障害の収束

[障害発生の原因]
DBサーバが高負荷となった原因は、ただ今調査中です。

[対策]
引き続きDBサーバが高負荷となった原因を調査すると同時に、障害時のログから時間がかかっているクエリを解析後対応を行います。

この度は、ご迷惑をお掛けして申し訳ございませんでした。
安心してBacklogをご利用いただけるよう、運用の改善を進めます。

一覧に戻る