2021年6月1日 7:40 PM
Backlog にアクセスしづらい状況となっていました (2021/06/01)
2021年6月1日(火) 9時18分頃から11時10分頃まで、サービスにアクセスしづらくなる問題が発生しておりました。
ご利用の皆様にはご迷惑をおかけし申し訳ございませんでした。
概要
2021年6月1日(火) 9時17分頃のヌーラボアカウントの認証基盤のメンテナンスにおいて、オペレーションミスを起因としたシステム障害が発生しました。
これにより、ヌーラボアカウントを利用するユーザーは Backlog にログインできず、スペースにアクセスできない状況となりました。
その後、高負荷により一部の環境でサービスがご利用しづらい状態となりましたが、11時10分頃にすべての環境の問題を解消し、サービスが復旧しました。
経緯
6/1 09:17 ヌーラボアカウントのメンテナンス作業におけるオペレーションミスが発生
6/1 09:17 担当者が障害の状況を把握
6/1 09:20 Backlog への影響を確認
6/1 09:23 ヌーラボアカウントのシステムが復旧
6/1 09:36 Backlog での障害の影響が解消しないため、Twitter でユーザーに報告
6/1 09:45 サービス負荷が高い状況が継続
6/1 09:45 アプリケーションのキャッシュ削除を実施
6/1 10:03 状況が改善しないため、続報を Twitter で報告
6/1 10:49 アプリケーションの再起動を実施
6/1 10:55 アプリケーションの再起動の結果、一部の環境でエラー率の減少を確認
6/1 10:59 続報を Twitter で報告
6/1 11:05 負荷が高まった要因と推測されるアプリケーションを特定し、再起動を実施
6/1 11:10 サービス負荷が改善傾向に推移
6/1 11:19 負荷およびエラー率の数値が平常時に戻っていることを確認
6/1 11:37 すべての環境での復旧を確認できたため、Twitter で復旧報告
6/29 14:50 再発防止策を追記
影響範囲
- 新プランを契約中のスペースのユーザー
- 個人でヌーラボアカウントを接続して利用しているユーザー
再発防止策 (2021/6/29 追記)
- 複数人でオペレーションにあたる体制を整える
- 誤認識・誤操作が生じにくいファイル構成に変更する
- リソースの保護を強化し、更新には段階的な操作を要するフローに変更する
今後も安心して Backlog をご利用いただけるよう、
組織的な再発防止策の徹底と改善を進めてまいります。