データサイエンス

統計学

匂いの嗜好と配偶者選択の研究の再現性

『「科学的に正しい」の罠』で知ったのだがヒトは体臭を通して自分と異なるMHC遺伝子型をもつ相手に魅力を感じ、配偶者として選びやすい、というヒト行動進化の有名な実験結果も、追試でほとんど再現できていないらしい。体臭による配偶者選択は、有名なT...
統計学

スズメガ効果

スズメガ効果(ホークモス効果、Hawkmoth Effect)」とは、数値モデルやシミュレーションにおいてモデル構造にわずかな誤り・変更があるだけで、将来予測が大きくずれてしまう可能性を指す概念です。この効果は、バタフライ効果とは異なり、初...
統計学

統計検定1級 統計応用 理工学 2024年 問2

2024年の統計検定1級 理工学 問2を ChatGPT に解いてもらった。時間があったら清書したい。問題としては、与えられたハザード関数から尤度関数を求めて、いろいろ計算させる感じ。
機械学習

PythonでMAPとMRRを計算する方法

Mean Average Precision (@k) や Mean Reciprocal Rank (@k) という、レコメンドのオフライン評価で使われる指標があるのですが、scikit-learn では計算できなさげだったので、Chat...
統計学

ブライアスコア

フィリップ・テトロック (Philip Tetlock) の『超予測力』や『専門家の政治予測』で出てくるブライアスコア (Brier score) について。最良が0、最悪が2、チンパンジーが0.5ってどういう計算かと思ったけど、どうやら以...
統計学

ビジネス数学検定1級受験記

ビジネス数学検定の1級を受けてみた。調べてもあまり情報が出てこないので、記録を残しておく。結果:AAAで合格個別成績票スコアチャートやったこと:以下の本を1時間半くらいで読んだ。以上。1級のテキストはないようだけど、2級と何が違うのか分から...
統計学

Precisionのパラドックス

何か正式な名前がついているのかは知らないけれど、昔読んだ行動経済学系の何かの本に書いてあったような気がするのと類似の例を考えてみる。問題:ある病気にかかる確率は1%とします。病気にかかっているときに、正しく病気だと診断される確率 (reca...
機械学習

FFMをxLearnで試す

Field-aware Factorization Machines (FFM) を Python で試すために、xLearn を使ってみた。環境によってインストールできたりできなかったりして、よく分からない。メンテナンスもされていなさそう...
情報幾何

情報幾何に入門した (5): 双対平坦空間とか

『入門 情報幾何―統計的モデルをひもとく微分幾何学―』の復習メモ。\(M\) を多様体、\(\nabla\) を \(M\) の affine 接続とし、\((U,\varphi)\) を \(M\) の座標近傍とする。\(\varphi\...
情報幾何

情報幾何に入門した (4): 統計多様体とか

『入門 情報幾何―統計的モデルをひもとく微分幾何学―』の復習メモ。\((M,g)\) を Riemann 多様体、\(\nabla\) を \(M\) の affine 接続とする。各 \(X,Z \in \mathfrak{X}(M)\)...