変態にRを与えた結果がこれだよ…5 THE IDOLM@STER CINDERELLA GIRLSを弄り倒す
YF@Med_KU
THE IDOLM@STER CINDERELLA GIRLS
データセットからの体重推定LASSO (Least Absolute Shrinkage and Selection Operator)
外れ値アイドルの推定LOF (Local Outlier Factor)FRaC (Feature Regression and Classification)
本日の紹介
某大学異学部
あるソーシャルゲームにはまっていた…
ポチポチ…
さて課金してレアカードでも当てるかな…
ポチポチ…
さて課金してレアカードでも当てるかな…
キタァァァァァァァアアアアアアアアブヒィィィィィィイイイイイイしぶりんキタァァァァ
けどこれ人が多すぎてコンプ無理だお…
@AntiBayesian
さすがしぶりんかわいいおっおっおwww
15y 165cm 44kg 80/56/81
働いたら負けな杏こいつだけ3サイズ非公開…??
17y 139cm 30kg ??/??/??
これだけアイドルがいてみんな3サイズを公表しているのに杏だけ非公開だぞ…これは何かある…
杏の3サイズがどうしても知りたいんだお…
他のメンバーの3サイズはわかるのに…どうすればいいんだお…?
そうだ!!機械学習を使って推定するお!!
プロフィールはそれぞれ関係が強そうだお…
まあ普通にLASSOっていう機械学習を使ってみればいいんじゃないか。常識的に考えて。
(1)の部分が普通の線形回帰にペナルティ項が入っているみたいだな。常識的に考えて。
なぜLASSOかって?そんなんこれをやったやつがLASSOしかできないからに決まっているじゃないか。常識的に考えて。他のやり方を知りたければ「きかいがくしゅう!」@Tsukuba.rでggrks.
結果
17y 139cm 30kg 68/52/72
交差検証による推定誤差Weight 2.07kgB/W/H 3.52/1.85/2.89 cm
16y 158cm 42kg 80/56/81
45kg 47kg 42kg 48kg 43kg
43kg 43kg 41kg44kg
ミクさんおっぱいデカすぎwww
16y 158cm 42kg 80/56/81
で
このBBAとかloliの集団ってアイドルとして必要なの…??
普通アイドルって10代半ば~後半の娘じゃないの…?
>30 や <12のアイドルってどう考えてもニッチな業界だろ…?
そうだ!!統計手法を使ってこいつらの外れ値っぷりを推定するお!!
他のアイドルたちと明らかにかけ離れた分布のアイドルを探すお…
まあ普通にLOFっていう機械学習を使ってみればいいんじゃないか。常識的に考えて。
N次元空間内での各点の近傍MinPts個からどれだけ近い(離れている)かでわかる。なぜLOFかって?そんなんこれをやったやつがLOFしかできないということもないけど、精度が一番よさそうだからだ。常識的に考えて。他のやり方を知りたければ外れ値検出(知識)でggrks.
LOFとか有名すぎんだろ!!もっと有益なことつぶやけよ!!
じゃあFRaCという別の手法を使ってみよう。常識的に考えて。だがしかしこれはRで実装されていなかっ
た。こういう場合は別の言語でググってみるぞ。常識的に考えて。
FRaC (Feature Regression and Classification)は、複数の機械学習・外れ
値検出法の特徴量を組み合わせて、外れ具合を算出する方法っぽい。デフォルトではSVM、決定木、決定株(?)の中から組み合わせて使うようになっていたので、とりあえずやってみた。
全ての手法を組み合わせて使った場合が、普通の集団と外れ値データとの分離具合が最も良い感じに見えないこともない。常識的に考えて。
結果
Normal15/165/44/80/56/81
Too large17/182/60/91/64/86
Too small10/137/30/63/47/65
Too small9/127/31/60/55/65
Too small9/128/29/61/57/67
Too large16/170/56/105/64/92
age/height/weight/B/W/H
やっぱりオレのしぶりんはかわいいwww
まとめ
アイマス集団をいろいろ弄った。
非実在青(性)少女たちはあまりにもボンキュッボンすぎ
て身長・オパーイの過大評価と体重・ウエストの過小評価になりがち。
外れ値アイドルは年齢よりむしろプロポーションの影響が大きい(3サイズに相関がありすぎ)。
初音ミクの3サイズは叩かれた。
〜完〜