Stellar - ネットワークが少し停止したらしいので理由を探る

公式の報告があるのかどうかは知らないが、今のところないので、適当に推測してみる。
ネタはこの辺

ステラのコンセンサス(SCP: Stellar Consensus Protocol)は、「あの人が良いって言ったら良いよ」みたいな感じで各ノードがそれぞれ合意を取りたい(信頼する)ノードを指定する。この信頼ノードは集中している必要は全くないのだが、実態として多くのノードがStellar Developer Foundation(SDF)が運営するノード(SDF validator)を指定しており、あんまり分散していなかった。このことは中の人たちも認識していたし、SDF validatorが停止するとネットワークが止まるとも指摘されていた。で、分散化を進めていた(SDFはバリデータをやめる予定っぽい)のだけれども、分散化を果たす前にSDF validatorが落ちてステラネットワークが停止した。
ということだろうか。ガバナンス的な問題かな?

まあ、好きなノードを指定せよと言われても難しいのだろうね。ステラネットワークが成長するにつれ、どんどん複雑化するだろうし。
XRPLedgerでいうところのRipple推奨UNL(Unique Node List)みたく、ガイドライン的なものが用意され将来にわたって よく分散されていくでしょう

追記

2019-05-17

公式からの報告より
SDF_validatorに集中化していたからではなく、むしろ逆で、急に分散しすぎたからだそう。
上に書いた話は全然違った。

分散化のために追加された新しいバリデータ達のちょくちょく停止したり、設定ミスだったりで、ネットワークが不安定になっていた。
そこにkeybaseが予定していたメンテナンスのためにバリデータを停止、これが重なってネットワークが落ちたということらしい。
新しいバリデータうんぬんは、例えばstellarbeat.ioでを日本国内ノードを確認すると、これまでに観測されており現在は稼働していないノードは数多いが、そういうことかな?それで、そういうノードの挙動が攻撃っぽくなっていて、ストレステストっぽい状況が形成されていたと。

あと、コンセンサスが取れなくなったら停止するのは設計された意図した動作で、実際に今回ネットワークは停止したがフォークは発生しておらず分散台帳の一貫性は保たれ不整合な状態にはならなかった(金融システム的には正?)ことは知ってくと良いかもしれない。
(この辺の挙動は、たぶんXRPLedgerは同じでBitcoinなど多くの暗号通貨は違う)
もちろん止まるのも問題大ありなので、以前より進めていたこと含め対策をしていくとのこと。
まあ、監視能力の強化、設定や操作の簡素化、報連相だったりで、この辺は従来システムや組織とあんまり変わらないよね。

2019-05-18

今度はクオーラムセット(信頼するノードのリスト)の重複率が基準を下回ってしまいフォークしたそうだ。 一貫した分散台帳のための重複率については、60%以上だっけ? Rippleの論文があったような。
原因は設定ミスということになるけど、分散システム 難しいね。


See also