引き続きnoteに書いてたけど、noteって書き途中のでも下書き保存されてしまって、整理中に間違って消してしまう可能性があるので、こっちにもコピー取っておきます

https://note.com/roshiroshi15/n/ne8c465b06097


黒猫が走っている。
それはもう、見事な走りっぷりだった。

はい、はじめましての方ははじめまして、ろしと申します。
自由に文章を書くのは楽しいですが、すこしはしゃぎすぎたかもしれませんね(笑)。
ただ、もうちょっと走ってみたいと思います。

と今日の話はメタゲームについてです。
タイトルの通りゲーム理論と絡めながらお話ができればなって思っています。
いつもより少し実用性に乏しい内容となっています。メタゲームに関しては二部構成で次にもうちょっと実用的なことを書こうと思ってます。




週末なにつかいますか?調整に忙しいですか?勝たせてもらっていいですか?

目次
ゲーム理論とは?
共有知識とナッシュ均衡
メタゲームとレベルk思考
追伸
ゲーム理論とは?
wikiからそのまま引用すると

ゲーム理論(ゲームりろん、英: game theory)とは、社会や自然界における複数主体が関わる意思決定の問題や行動の相互依存的状況を数学的なモデルを用いて研究する学問である。
はて・・・って感じですが、一つの物事に対して複数の人が同じようにお互いに考えあった結果どうなるのか?とかそんな中でどのような行動が関係者全員に最もよい選択になるのか?
ってことを数学的に導こうっていうものです。
「囚人のジレンマ」っていう言葉を聞いたことがある人もいると思いますが、それです。

ある犯罪に関する容疑で捕まった2人の容疑者が、意思疎通の出来ない別々の部屋で尋問を受けています。
この2人が取る選択肢は「自白する」「自白しない」のいずれかですが、自白の状況によって受ける刑罰の重さが異なります。
・1人が自白し、もう一方が自白しない場合、自白した方は無罪・自白しない方は懲役10年
・2人共自白しない場合は懲役2年
・2人共自白した場合は懲役5年
この場合、それぞれの容疑者がどの選択肢を取るでしょうか。
この場合、お互いの利益を最大にするならば二人とも「自白をしない」という選択をするのが合理的ですが、もし自分の利益を最大にしようと「自白をする」を選んでしまったら協力した時よりもお互いの利益っていう面では協力した時よりも悪い。相手が「自白をする」リスクを考えると自分は「自白をする」という選択をしなければならなくなるそうです。

共有知識とナッシュ均衡
概要はこんな感じで本題に移ろうと思います。

TED Conferenceでルーカル・ハステッドという方がスピーチをした内容を踏まえての内容となります。
このスピーチで例として出されているのが、2/3ゲームと言われるゲームです。

0~100までの数字を参加者に聞き、その平均値の2/3である値を当ててもらうというゲームです。
このゲームの理屈を考えると、全員が100を選択した場合その2/3は66となります。そのため、66より高い数字を選ぶことは合理的ではありません。
この問題の要点となるところが理屈だけを考えると上記のようになりますが、参加者が同じ情報を持っているだけでなく、同じ情報を持っているという情報を参加者が持っているというところにあります。これを共有知識という状況となります。
みんなが66が平均値であることを予測して66周辺で数を当てようとすると平均値は44となり、それを予測すると28となりどんどん小さくなっていき最終的には0に収束するというのが論理的です。この状態を「ナッシュ均衡」といいます。(上の囚人のジレンマの話でいうとお互いに自白をする状態です)。これは他の人の戦略に対して各自が最適な戦略を取っていて違う選択をすることが誰にとっても利益にならないこと。
このゲームを行ったところ、大体平均値は20~35に落ち着くそうです。
このケースを「レベルk思考」という名前でモデリングされています。

kは思考サイクルが繰り返される回数を表しています。
k0=他のプレイヤーのことを考えずにランダムに数字を予測します。
K1=他の人がK0と予測をして平均値が50と予測し33と答えます。
K2=他の人がK1と予測して平均値を33と予測し22と答えます。
で最終的にK12まで達する人は0と予測します。
大体の人はK0~K2で留まるらしいです(なので平均値は↑になるそうです)。
で深読みをしていくと最終的に0に達します。

メタゲームとレベルk思考
ここまで一切ポケカの話が出てませんが、そろそろ話していきましょうかね。
このレベルk思考の内容どこかで同じようなことを考えた人いるんじゃないでしょうか?
そう、大会におけるメタ読みに近い考え方だと思うんですよね。
以前私が大会の記録として記事を書いたCL京都2019を例として考えていきましょう。


カードパワー・デッキパワーだけを見た場合最強のレシラム&リザードンデッキが環境トップ(K0)

画像1

レシラム&リザードンGXに対して強いズガドーン・デスカーンギラティナが流行る。(K1)

画像2

デスカーンギラティナやズガドーンに対して弱いピカチュウ&ゼクロムGX、ジラーチサンダーデッキが環境から消える(K2)

画像3

ピカチュウ&ゼクロムGXとレシラム&リザードンGXに弱いが、デスカーンギラティナとズガドーンに対して強いゾロアークが増える(K3)。

画像4

そのゾロアークに対して強いレシラム&リザードンGX、ピカチュウ&ゼクロムGXが再び環境に帰ってくる(K4)

大雑把にCL京都2019前週までの結果を見ての環境をおさらいするとこんな感じだったんじゃないかなと思います。
ここがスタート地点であり、ここから考察を進めることとなります。
そのため、K0として、レシラム&リザードンGXデッキがあり、ここからスタートとなります。


実際のCL京都はどうなったのかというと
ベスト16(13件しか掘り返せなかったので13件だけ)
5:レシリザ
2:ジラサン
1:HAND
1:グランブル
1:ズガアゴ
1:フーパブラッキー
1:ルガゾロ
1:サナニンフ
となっていたようです。
デッキ作成者の意図までは掘り返せないのであまり深くは話さないようにしておきます。

と実際のメタゲームをみていったわけですが、上記の2/3ゲームとの大きな違いは、2/3ゲームの場合

無題

こんな感じで直線状で考えればいいだけの話でしたが、ポケカのメタゲームはそういうわけでなくもっと多くのベクトルに矢印が伸び3次元的、4次元方向も考えないといけないところです(K0、K4が同じになってしまうのもそのため)。
でかつ、K0の地点がカードパワーというベクトルだけを考えていますが、デッキ構築が自由でキャラゲーであるため、そんなメタとは全く関係なく好きなデッキを使う人もいるためK0がわんさかいるようなイメージです。
上記のK1・K2で留まることが多いというデータだけを見ると、デスカーンギラティナ・ズガドーンの使用率が多くなると考えられます(実際は情報がK0のプレイヤーが多いこと、情報が速くこの流れなしに結果だけを見てK3・K4に直接たどり着く人もいること)。
カードプールだけを渡された場合というか、新弾発売直後の環境などはK0がなんなのかという予測を立てることができ、思考の出発地点が間違っていなかった場合、概ねこんな感じでメタを読むことができるんじゃないかと思います。
ただし、現在SNSなどで大会結果など情報だけが先走りしてしまうため、K0をどこに置くかが非常に難しい環境ではあり、実用性に乏しいかもしれませんが、何か考える際の足しになればうれしいです。

追伸
こんな感じでいつもとスタンスを変えて書き物をしましたが、あんまり実用性はないものだと思うので、次回の記事はメタゲームからのデッキ作成のような内容で書き物をしたいと思います。

もし面白かった、続きがみたい、他にもなんか書いてなどありましたら、♡押してくれたりコメント書いてくれたりRTしてくれたら喜びます。
それではまた別の機会に。






川越敏司  制度研究と限定合理性 VCASI 2009
小川 一仁 「実験」を通じた複眼的思考の育て方 The Journal of Economic Education No36,september 2017
3)ゲーム理論に挑戦、君は人の行動を予測できるか? 
囚人のジレンマとは?ゲーム理論の代表的なモデルを解説

コメント

お気に入り日記の更新

最新のコメント

この日記について

日記内を検索