さんすうのーと

#exp(x)
function(x) sum(sapply(0:20, function(i) x^i/factorial(i)))

正規分布の確率密度関数が覚えられない

-∞exp(-x2)dx = sqrt(π)

がうす積分というらしい.これなら俺でも覚えられる.

この左辺を加工する.左辺で積分している関数のxを x - μ に置き換えると、ぐらふが右にμだけしふとする.横にしふとしても積分したら一緒だろう. (x - μ)/σ で置き換えると、横にしふとした上でσ倍だけ横に伸びる.横にσ倍になっても、縦に1/σ倍してから積分すれば多分一緒だろう.更にsqrt(2)で割っても同様だろう.

σまでは分かるけど、何でsqrt(2)が出てくるのかと不審に思っていると…

1/sqrt(2π)σ * ∫-∞exp(-((x - μ)/sqrt(2)σ)2)dx = 1

見たことがある関数が出てきた.これなら俺も正規分布の確率密度関数が覚えられる.ありがたい.

教科書ではeの右上にるーととか出てくるとおどろおどろしくなるということか、大体 (x - μ)2/2σ2 という形になってると思うけど、おどろおどろしい形で書いたほうが分かりやすいよね.xを標準化した形 (x - μ)/σ を保ってるし、左下の sqrt(2)σ との対応も良いし.

対数正規分布

みんなの大好きな対数正規分布の確率密度関数は正規分布の確率密度関数を積分したもののxをlog(x)に置き換えて微分したものだから、頭に 1/x が出て来る.

期待値は exp(μ + σ2/2) で、元の期待値μをeの右上に乗せたやつより右にずれた感じになる.右にずれるのはまあ良いとして、何で exp(σ2/2) 倍ずれるのか.今度調べよう.

最頻値は反対にずれて exp(μ - σ2) になる.最頻値がずれるのは多分1/xが頭に来るからだろう.何か腹立たしいな.

期待値が分かれば分散は俺でも分かる. log(X2) ~ N(2μ, (2σ)2) だから、 Var(X) = E(X2) - E2(X) = exp(2μ + 2σ2) - exp(2μ + σ2) .

陸上部の足の指は強いか、言い換えれば、ためしてがってんは仮説検定をしているか

この前ためしてがってんが日体大生の足の指で物をつかむ力を調べていた.20代前半の男性の平均は5.8 kgだと説明した後で、野球部、陸上部、柔道部、相撲部からそれぞれ5人ずつ捕まえて、足の指で物を挟ませる.計ってみるとびろーのようなことになった.

ぶ, 1, 2, 3, 4, 5, 平均
野球部, 8.5, 4.2, 5.8, 4.5, 7.6, 6.1
陸上部, 6.9, 6.4, 8.2, 6.1, 5.5, 6.6
柔道部, 5.7, 6.8, 7.2, 8.5, 8.2, 7.3
相撲部, 8.5, 8.3, 8.3, 8.4, 8.5, 8.4

単位多分kgじゅうだよね.よくわかんないけど.kgfって書いてあったと思うけど.よくわかんないけど.

この結果を見て、20代前半の男性の平均に勝ったと言えるのは何部か.野球部が勝ったと主張する人は少ないだろうし、相撲部は勝っていないと言う人は居ないだろう (でーたが不自然だから八百長だと言う人は居るかもしれない).統計学を使うならt検定をすることになる.Rなら関数一発でできる.

この結果からはためしてがってんは有意水準5%で仮説検定をしていないとは言えない.

> t.test(yakyu, mu=5.8, alternative='greater')

        One Sample t-test

data:  yakyu
t = 0.37886, df = 4, p-value = 0.362
alternative hypothesis: true mean is greater than 5.8
95 percent confidence interval:
 4.319378      Inf
sample estimates:
mean of x 
     6.12 

> t.test(ricujo, mu=5.8, alternative='greater')

        One Sample t-test

data:  ricujo
t = 1.8006, df = 4, p-value = 0.07307
alternative hypothesis: true mean is greater than 5.8
95 percent confidence interval:
 5.649132      Inf
sample estimates:
mean of x 
     6.62 

> t.test(judo, mu=5.8, alternative='greater')

        One Sample t-test

data:  judo
t = 2.9401, df = 4, p-value = 0.02119
alternative hypothesis: true mean is greater than 5.8
95 percent confidence interval:
 6.206853      Inf
sample estimates:
mean of x 
     7.28 

> t.test(sumo, mu=5.8, alternative='greater')

        One Sample t-test

data:  sumo
t = 58.138, df = 4, p-value = 2.621e-07
alternative hypothesis: true mean is greater than 5.8
95 percent confidence interval:
 8.304661      Inf
sample estimates:
mean of x 
      8.4 

俺はえらーばーの意味をよく理解しているか

「研究者の多くはエラーバーの意味をろくに理解していない」を読んで.

あんまり使ったことがないよねえらーばー.ていうか、えらーばーっていうのかこの株価のろうそくみたいなやつ.いきなり聞かれたら答えられない.

二つのぐるーぷの標本の平均と標準偏差 (>_< もしくは信頼区間) をえらーばーで図示したときに互いのひげがどのくらい離れていたら (>_< あるいはどのくらいしか重なっていなかったら) 二つのぐるーぷの平均に有意差があると言えるかという話.

よく分からないから普通に仮説検定してから考えよう.帰無仮説は μX = μY . X̅ - Y̅ は平均が μX - μY 、分散が σ̃2 = σX2/nX + σY2/nY の正規分布に従うから、 z = (X̅ - Y̅)/σ̃ が±1.96より遠くだったら有意水準5%で棄却される (>_< 両側検定). (>_< 母分散が未知でも、えぬが大きくなるにつれてzの分布は正規分布に収束するというやつのはずだ.)

この関係を図から読み取るという問題になった. X̅ - Y̅ は図にわかりやすく現れているから、これがσ̃ 1.96こぶん離れているかどうかを目分量で判定しろというわけ.片方のひげの長さはそれぞれ σX/sqrt(nX), σY/sqrt(nY).もし二つのぐるーぷの分散も標本のさいずも同じならσ̃はひげのsqrt(2)倍だから、平均と平均の間隔がひげの 1.96 * sqrt(2) = 2.77 倍、ひげとひげの間はひげの0.77倍だ.

ということだと思うけど、どうかな.

Elo Ratingをはっくする

いろれーてぃんぐしすてむでは期待勝率は対局者のれーてぃんぐの差の関数だということになっている.ろじすてぃっく分布の分布関数を援用して F(x) = 1/(1 + 10-x/400) = 1/(1 + exp(-x/s)) .ただし s = 1/ln(101/400) ≒ 173.7178 .お好みでxを x - μ に置換えれば、μは自分がどれだけ過大評価されているかを表すことになる.

将棋倶楽部24では ΔR = -0.04x ± 16 となっているけど、これは隙がありそうだ.今 μ = 0 なら、次の対局の結果に従うれーてぃんぐの変動の期待値は当然0でないといけないから、整数に丸めるのを無視して E(ΔR) = G(x)(-0.04x + 16) + (1 - G(x))(-0.04x - 16) = 0 と置く.そうすると、このΔRの定義を正当化する期待勝率は G(x) = 1/2 + x/800 だということが分かる.現実に狙える勝率がF(x)なら、これが制度上要求される勝率G(x)を超過している幅 F(x) - G(x) が最大になるxを求めて、点差がxの相手を狙って対局すれば、自分のれーてぃんぐを効果的に釣り上げることができるじゃん.

超過期待勝率が最大になる点はF(x)を微分すれば簡単に求められる.式が見辛くなるから t = exp(-x/s) とすると、 F'(x) = f(x) = t/s(1 + t)2 = 1/800 となって、これはただのtについての2次方程式 t2 + (2 - 800/s)t + 1 = 0 で、 t = 0.4678828, x ≒ 132 .つまり、自分より132点下の相手と指せば有利だということになる.いろれーてぃんぐを地で行けば勝率は約68%.

このはっくが限界に達するのはどこか.だんだん自分のれーてぃんぐが過大評価されて、μが貯まってくると、期待勝率のぐらふが右に逃げていって、超過期待勝率の隙間が潰れる.隙間がつぶれるのは F(132 | μ = 0) = 1/2 + x/800 で x = 145 . μ = 145 - 132 = 13 .たった13てんしかみゅーがたまらない.それは当然で、もともと x = ±238 付近で F(x) = G(x) になるから、この方法ではどうやってもその幅より遠くには行けないんだ.念のためRで24万局実験してみたけど、その間μは平均11.91634点で推移した.

めも. 10120/400 = 1.005773120 = 1.995262

しーおるそー

20160211/20160410
横谷紀卑呼 <yokota12612542@gmail.com>
人間だいすきくらぶ