ROEコモン・ソート解析の闇
2010年5月3日 ゲーム コメント (2)ソートの中に、同じカードが同じ順序で連続している部分が複数含まれているかもしれない、というハナシを前回しました。
実際どうなんだろう、と思い、データに当たってみました。
以下、カードはすべてコレクターズ・ナンバーで示します。
統計データから、「5,148」という並びが多く出てくることは分かっていました。
具体的には、全部で15パックに現れます。
ところが、そのうちの4パックは、
「・・・133,5,148,207,43,79,108・・・」という並び(の一部)であり、
他の11件のうちの10パックは、
「・・・175,223,65,5,148,43,79,111・・・」という並び(の一部)です。
(残りの1パックは、10パックの方に非常に良く似た並びですが、1枚違っています。)
これをどう解釈したらいいでしょうか?
・10パックの方が正しく、4パックは、「全く偶然同じ並びになったエラー・パックである」
こりゃ不自然な想定です。
やっぱり、
・「5,148」を含む並びが、ソート中に2箇所(以上)ある。
ですよね。
てことは、「5,148」だけでは、次の出力が決まりません。
これでは、昨日示したアルゴリズムではソートが求まらないのは当たり前です。
こんなのがあとどれくらいあるんでしょうか?
「5,148」だけ?
いえいえ。とんでもない。
例えば、「145,213」。17パックありますが、
228,26,114,145,213,78,182 ... 4パック
68,228,26,145,213,182,5,86 ... 6パック
68,228,26,97,145,213,41,182,5,142 ... 7パック
です。
ところでこの3種類、良く見ると、ちょっと似てますよね。
6パックと7パックのソートの違いは、97と41が挿入されていて、86が142に変わってるだけ。
でも、エラーでこうなったとは思えない量のパックがそうなっています。
6枚ソートでは、こういう例が他にもいっぱい出てきます。
これは何を示唆しているでしょうか?
それはたぶん、「エルドラージ覚醒は、全パックが共通のソートに基づいて生産されているわけではない」でしょう。
製造時期によって、または、製造工場によって、あるいはもしかしたら、生産ロットによって、少しずつ異なるソートが使われている、のではないかしら。
さーて、それを解析するにはどうしたらいいんですかなー。
とりあえず、三階のマルコフ過程だと思って推定してみますか。
しかし、尤度をどう定義したらいいんだこれは。
推定はしたけど検証はできません、では(わたしにとっては)意味が無いですし。
実際どうなんだろう、と思い、データに当たってみました。
以下、カードはすべてコレクターズ・ナンバーで示します。
統計データから、「5,148」という並びが多く出てくることは分かっていました。
具体的には、全部で15パックに現れます。
ところが、そのうちの4パックは、
「・・・133,5,148,207,43,79,108・・・」という並び(の一部)であり、
他の11件のうちの10パックは、
「・・・175,223,65,5,148,43,79,111・・・」という並び(の一部)です。
(残りの1パックは、10パックの方に非常に良く似た並びですが、1枚違っています。)
これをどう解釈したらいいでしょうか?
・10パックの方が正しく、4パックは、「全く偶然同じ並びになったエラー・パックである」
こりゃ不自然な想定です。
やっぱり、
・「5,148」を含む並びが、ソート中に2箇所(以上)ある。
ですよね。
てことは、「5,148」だけでは、次の出力が決まりません。
これでは、昨日示したアルゴリズムではソートが求まらないのは当たり前です。
こんなのがあとどれくらいあるんでしょうか?
「5,148」だけ?
いえいえ。とんでもない。
例えば、「145,213」。17パックありますが、
228,26,114,145,213,78,182 ... 4パック
68,228,26,145,213,182,5,86 ... 6パック
68,228,26,97,145,213,41,182,5,142 ... 7パック
です。
ところでこの3種類、良く見ると、ちょっと似てますよね。
6パックと7パックのソートの違いは、97と41が挿入されていて、86が142に変わってるだけ。
でも、エラーでこうなったとは思えない量のパックがそうなっています。
6枚ソートでは、こういう例が他にもいっぱい出てきます。
これは何を示唆しているでしょうか?
それはたぶん、「エルドラージ覚醒は、全パックが共通のソートに基づいて生産されているわけではない」でしょう。
製造時期によって、または、製造工場によって、あるいはもしかしたら、生産ロットによって、少しずつ異なるソートが使われている、のではないかしら。
さーて、それを解析するにはどうしたらいいんですかなー。
とりあえず、三階のマルコフ過程だと思って推定してみますか。
しかし、尤度をどう定義したらいいんだこれは。
推定はしたけど検証はできません、では(わたしにとっては)意味が無いですし。
コメント
>エルドラージ覚醒は、全パックが共通のソートに基づいて生産されているわけではない」
うわぁ。
そうすると今までの様にいただいたデータを全部集計して解析すると言う手法を使うには、それぞれの工場のソートのデータが必要になるので、データの量が足りないと言う事になるでしょうか。
それとも頂いたデータをそれぞれ別に集計したほうが良いのでしょうか。
今まで僕は、例えば4枚のソートであれば40×40×40のパターンを全部検出して、それぞれのパターンについて、実際のデータと付き合せて、上下の並びを見ていけば、ソートがつながるだろうと考えていましたが、それだけでは解析できないのかな?と思います。
例えば、一つの完全につながったパターンを見つけても(僕は見つけられていませんが)それだけでは、全てのデータについて説明がつかないと言う事でしょうか。
いやはや。まさしく「闇」ですね。
>そうすると今までの様にいただいたデータを全部集計して解析すると言う手法を使うには、それぞれの工場のソートのデータが必要になるので、データの量が足りないと言う事になるでしょうか。
仰る意味を完全に理解してないかもしれませんが・・・。
ともあれ、560件というデータ数は、4枚ソートを解析するにはちょっと少な過ぎるような気はします。
4枚ソートの方も6枚ソートと同じような状況と仮定した上のハナシであり、なおかつ、直観だけで根拠はないのですが。
>例えば、一つの完全につながったパターンを見つけても(僕は見つけられていませんが)それだけでは、全てのデータについて説明がつかないと言う事でしょうか。
それは、どんな方法でそのソートを見つけたか、および、それにどんな説明を付けたか、ということに依存すると思います。
わたしは、ソート情報を得ることでなく、ソート情報を得る方法をあれこれ工夫して楽しむことが目的ですので、何かに「説明がつく」かどうかについては、bunさんとは少しズレてるかもしれません。