NEWEST / < NEXT   BACK >

「無影響確認」が出来ないとこうなる

・大規模障害の概要と原因について(中間報告)/ファーストサーバ

先週末から大騒ぎになっている、商用向けレンタルサーバの
データ消失騒動の原因報告です。

いろいろ書いてあるけど、一言で言えば他サーバへの「無影響確認漏れ」
ああいう事態を引き起こしたということです。

これ、今回はITインフラ(サーバ)領域で起きたことだけど、
アプリケーション領域でもよくあることなんですよね。

例えば、特定のデータを更新するアプリを開発するとします。
データがA/B/C/D/Eの5件あって、その中の「C」だけ更新する
設計としましょう。

開発したら当然テスト仕様書を作ってテストするわけですが、
この場合、テスト仕様書はどう書くべきでしょうか。

「Cが更新されること」という仕様書はアウトです。
「Cだけが更新されること」(A/B/D/Eは更新されないこと)と
書かないといけません。

一見当たり前のように見えるんだけど、実際エンジニアやプログラマに
こういうテスト仕様書を書かせてみると、10人中9人は
「Cが更新されること」という仕様書を書いてきます。

当然そういうのはダメなのでレビューの度に突き返してるんだけど、
自分の知ってる範囲では一向に改善されません。

で、このようにちゃんとレビューで指摘する人がいればいいんだけど
そうでなければ、「Cが更新されているからOK。他は知らん」という
アプリケーションが出来上がって、本番環境まで行ってデータあぼーん、
という事態が起こります。

まあこれは極端な例だけど、今回のファーストサーバ騒動は
それがリスクとして発動してしまった事例です。

どうにか、ならんもんですかね。
作ることに関して優秀な人はいっぱい居るけど、
検証することに関してはこの業界はめちゃくちゃ人材難です。

はあ。
 
| society | comments (0) |  

コメント

NEWEST / PAGE TOP / < NEXT   BACK >


Twitter Updates▼


ARCHIVES▼

<前月 2018年12月 次月>
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31      

OTHER▼

POWERED BY

BLOGNPLUS(ぶろぐん+)