KPIツリー作成のスキルアップ⑭-2|先行KPIは「統計で絞る」—相関→重回帰→部分相関のやり方

DX・IT

先行KPIで統計をどう使い、どう捨てるか(実務手順)

前回(⑭-1)では、KPIツリー各階層における統計の使い分けルールを整理した。

今回はその中でも、「先行KPIで統計をどう使うか」に絞って整理する。


前提:先行KPIで統計を使う目的

先行KPIで統計を使う目的は、説明できる因果の仮説を1〜2本に絞ること

  • 精度の高いモデルを作る
  • 正解を証明する

これらは不要。ここで欲しいのは「残すべき芯」と「捨てるべき枝」の切り分けだけ。


ステップ1:相関分析(まず全体像)

使うタイミング

  • 必ず最初にやる

目的

  • 主要KPIでは「方向決め」
  • 先行KPIでは「枝落とし」

やること

  • 同一期間・同一母集団でそろえる
  • 月次 or 週次(粒度を混ぜない)
  • 散布図+相関係数を見る

判断

  • まず符号を見る(業務ロジックと逆なら要注意)
  • 明らかに弱いものを切る or 格下げする

※格下げ=KPIツリーには残さず、説明用指標に回す(「見ておく」だけの指標)。


ステップ2:重回帰分析(候補が残りすぎたら)

使うタイミング

  • 候補が残りすぎたとき

やること

  • 説明変数は最大3つ(入れすぎると解釈が崩れる)
  • 標準化係数を見る
  • p値は参考程度(主役にしない)

重視するのはここ

  • 符号が業務ロジックと合っているか
  • 係数の大小が安定しているか
  • 期間をずらしても傾向が崩れないか

→ 独立した説明力を持たないKPIを落とす。
(「相関はあるのに、入れると効かない」ものは、だいたい他の指標の影に隠れている)


ステップ3:部分相関(代理変数の切り分け)

使うタイミング

  • 先行KPI同士が強く相関しているとき

考え方

  • Aの影響を除いたBと主要KPIの関係を見る

判断

  • 部分相関がほぼ0 → 代理変数(本質ではない)
  • 残った方が「因果の芯」

→ KPIツリーには片方だけ残す。
(両方残すと、先行KPIが増殖して意思決定が曖昧になる)


まとめ

先行KPIで統計を使うとは、因果を証明することではない。

  • 疑う価値があるか
  • 薄いか
  • 残すか、捨てるか

を決めるための作業である。
統計は「採用するため」より、絞るために使うと強い。

コメント