楽天モバイルの仮想サーバーでの運用について懸念しています

昨日、JR系のクレジットカードシステムに障害が出て、何十万件の取引ができなかったとニュースになっていました。

便利のために作られたシステムにより、不便になっているという本末転倒が、このシステム障害になる。そもそも、作り手は不具合なんかは、想定していない。極端かもしれませんが、便利になることしか、考えていません。トラブルになり、不便になることもあるということを想定して、設計をしていることはほとんどありません。

なぜなら、どのシステムも障害を出し、大きな信頼を失っています。たとえば、不具合が出たときに、数秒で、バックアップサーバーとミラーリングサーバーでの連携により、この不具合がカバーできたというニュースは見たことがない。つまり、不具合がでましたというニュースは、障害や不具合を設計し、フォローできていないという報告になります。

以前からシステム障害のリスクはインターフェースにあると申し上げてきました。
たとえば、トラック競技のリレーで例えます。リレーで問題になる箇所は、バトンタッチです。バトンタッチは、インターフェースの最たるものです。逆にいえば、1人ですべて走ってもよい、バトンタッチがなければトラブルはほぼ極端に少なくなります。それは、バトンタッチのリスクだけではなく、4人で走る(つくる)となれば、4人の能力差 これがリスクとなります。いくらディレクターがディレクションをしても、この能力差のリスクは吸収しきれません。国家の威信をかけた あのマイナンバーでも不具合だらけです。
たしか、ニュースでは、富士通が作った部分に出ているとなっていましたが、あの大手の富士通が作ってもそんなレベルです。

不具合について、出さない と いうより、必ず出るのでリカバリーやフォローができるようにしたいが正解のような気がします。しかし、お客様は、そのお金は出しません。なぜなら何もなければ何もないのでしょ、何もないようにおたくが作ればよいのでは、となるからです。つまり、自腹でも最低限は、稼働監視ツール、不具合報告ツールくらいは作っておくべきです。リカバリーができるという環境は同環境が、平行して稼働しているとなるため一見難しそうに思えますが、結局のところ、バックアップという考え方もできるため、同環境が平行して稼働し、バックアップにもなっているという設計がされていれば、すぐにバックアップを使って動かせるという論理になります。

また、その同環境が、混雑時のフォローやストレージ不測のフォローをするなんかは、とても賢いシステムになります。しかしながら、同環境=本番のコピーです。不具合やウィルスも同環境です。リカバリーするたびにそれを世襲して、いつまでも治らないという経験をしたこと結構あるはずです。その場合は、原因をまずは取り除かないといけません。

不具合を出さない は神様の領域です。人は、不完全なものです。だから人なのですが、これをミスを起さないものを作るということは、システムが大きくなればなるほど難しいということになりますが、それをあきらめては、成長や後学もありません。エンジニアはそれでもミスは許さないという気持ちで能力を高めてもらいたいです。

回りくどかったですが、楽天モバイルの仮想サーバでの運用について、本題にはいります。

仮想サーバーアプリケーションとそのエンジニアがリスクのインターフェースになります。

私は、ユーザーが1000万人超える当りから、不具合が連発し、ニッチもサッチもいかなくなるのではと懸念しています。

楽天をつぶしたい人、いたずらな人、そもそもの不具合、サーバーアプリケーションの不具合、が重なり相乗効果を生んで不具合の大爆発を起こすのではないかという懸念です。

仮想サーバーは、まだまだ歴史が浅く安定していない、セキュリティに関しても同じことがいえると考えています。それを運用するエンジニアも同じく歴史が浅く、新参者というイメージが強く、結局サーバーセキュリティに関して、未熟な人間が運用し、気づけるものも気づかない、直せるものも直せないという状態が続くような気がします。

仮想マシーンは、ある日ログインさえできなくなる という報告も上がってきています。
また、不安定な状態になり、リブートを繰り返しているイメージも非常に強いです。

現時点では、開発環境やテスト環境を作るために用意されているくらいのものにしか私は仮想サーバーでの運用がよいとは思いません。ユーザーは安物買いの銭失いになりかねません。

仮想化で、サーバーの台数を減らして、無駄な領域を余すことなく使うということが、仮想化、つまり、効率化、合理化の考えであるなら、その無駄と言われる部分が、本来、安定・安全のために必要な 無駄 ではないかは、今後の楽天モバイルの運用で証明されるであろうことだが、私はなんでもかんでもハイテクなもの、合理的なもの、いわゆる便利というものは一方から見たら怠慢であり、その怠慢は本来組織として苦労すべく必要苦であるならば、その組織に必ずや怠慢で肥満化・弱体化し、しっぺ返しのような形で自分達に帰ってくるようで私はそう思ってなりません。