先行KPIで統計をどう使い、どう捨てるか(実務手順)
前回(⑭-1)では、KPIツリー各階層における統計の使い分けルールを整理した。
今回はその中でも、「先行KPIで統計をどう使うか」に絞って整理する。
前提:先行KPIで統計を使う目的
先行KPIで統計を使う目的は、説明できる因果の仮説を1〜2本に絞ること。
- 精度の高いモデルを作る
- 正解を証明する
これらは不要。ここで欲しいのは「残すべき芯」と「捨てるべき枝」の切り分けだけ。
ステップ1:相関分析(まず全体像)
使うタイミング
- 必ず最初にやる
目的
- 主要KPIでは「方向決め」
- 先行KPIでは「枝落とし」
やること
- 同一期間・同一母集団でそろえる
- 月次 or 週次(粒度を混ぜない)
- 散布図+相関係数を見る
判断
- まず符号を見る(業務ロジックと逆なら要注意)
- 明らかに弱いものを切る or 格下げする
※格下げ=KPIツリーには残さず、説明用指標に回す(「見ておく」だけの指標)。
ステップ2:重回帰分析(候補が残りすぎたら)
使うタイミング
- 候補が残りすぎたとき
やること
- 説明変数は最大3つ(入れすぎると解釈が崩れる)
- 標準化係数を見る
- p値は参考程度(主役にしない)
重視するのはここ
- 符号が業務ロジックと合っているか
- 係数の大小が安定しているか
- 期間をずらしても傾向が崩れないか
→ 独立した説明力を持たないKPIを落とす。
(「相関はあるのに、入れると効かない」ものは、だいたい他の指標の影に隠れている)
ステップ3:部分相関(代理変数の切り分け)
使うタイミング
- 先行KPI同士が強く相関しているとき
考え方
- Aの影響を除いたBと主要KPIの関係を見る
判断
- 部分相関がほぼ0 → 代理変数(本質ではない)
- 残った方が「因果の芯」
→ KPIツリーには片方だけ残す。
(両方残すと、先行KPIが増殖して意思決定が曖昧になる)
まとめ
先行KPIで統計を使うとは、因果を証明することではない。
- 疑う価値があるか
- 薄いか
- 残すか、捨てるか
を決めるための作業である。
統計は「採用するため」より、絞るために使うと強い。

コメント