2016年4月4日 5:11 PM
一部のユーザ様において、Backlogにアクセスしづらい状態となっておりました (2016年04月04日)
4月4日(月)11時39分頃から13時45分頃まで、一部のユーザ様において、アプリサーバ障害によってBacklogに断続的にアクセスしづらい状態となっておりました。障害が発生していた皆様には、ご迷惑をおかけして大変申し訳ございませんでした。
[障害の概要]
本日4月4日(月)11時39分ごろより、アプリサーバの負荷が上昇し、Webアクセスに伴う内部処理のエラーが増加しておりました。このため、全アプリサーバの再起動を行い、復旧しました。
引き続き原因調査を進めると、原因はある特定スペースの特定Webアクセスに問題があることを確認しました。該当のアクセスを一時的に遮断する暫定対応の後、恒久対応を行いました。
[障害の影響範囲]
一部のユーザ様にて、WebアクセスにおけるBacklogのご利用がしづらい状態となっておりました。
[障害発生の経緯]
- 11:39 一部のアプリサーバからのエラーを検知したため、調査と復旧作業に着手
- 11:48 一部のアプリサーバが応答を返せなくなったため、Twitterでの障害報告
- 12:30 アプリサーバをすべて再起動
- 12:36 サーバ負荷が元に戻ったことを確認、Twitterで復旧報告
- 13:37 引き続き調査を実施。特定スペースの特定Webアクセスに問題があったことを確認し、一時的にアクセスを遮断。
- 15:00 恒久対応を行い本番環境にリリース開始
- 16:40 全環境にリリース完了
[障害発生の原因]
不正なリクエストを拒否する過程での内部処理に不適切な箇所があり、メモリを大量消費する結果となって、アプリサーバが応答不能になりました。
[対策]
不正なリクエストに対する異常系処理中のコードを適切に修正しました。