市場規模の推定に「平均値」と「中央値」のどちらを使うべきか?
Q. 顧客が現在の代替手段に支払っている金額をもとに市場規模を推定する際、「平均値」と「中央値」のどちらを使うのが妥当かを判断したいです。アンケート調査で金額データを取得しており、統計処理の選定で悩んでいます。
- ︎ 「平均値」は極端値の影響を受けやすく、過大推定のリスクがある
- ︎ 「中央値」は代表値として安定しやすく、現実的な市場像を描きやすい
- ︎ ケースバイケースだが、まずは「中央値」+セグメント別の分布確認が定石
極端値(アウトライヤー)の影響を考慮せよ
**市場調査で金額を尋ねると、一定数の回答者が極端に高い/低い金額を回答することがある。**たとえば、月1万円のユーザーと月1,000円のユーザーが混在すれば、「平均値」はすぐに1,000円〜5,000円レンジに引っ張られる。
**特にアンケート形式では、熱狂的ファンや非典型的ユーザーが過大な金額を申告するケースも多いため、「平均値」にはバイアスが入りやすい。**これにより市場規模が現実よりも大きく見積もられてしまう危険がある。
その点で「中央値」は、全体の傾向を過度に左右されず、堅実な市場ボリュームの把握に有効だ。 とくに市場創出初期の仮説検証フェーズでは、過大な取らぬ狸の皮算用よりも、着実な「足元」の数字が重要になる。
分布の歪み(スキュー)を把握する
**ただし、すべてのケースで「中央値」が正義とは限らない。**分布が正規分布に近ければ、「平均値」も代表値として有効に機能する。一方、分布が大きく右に偏る(リッチ顧客が一部存在)場合は、「中央値」だけでは上位顧客のインパクトを過小評価してしまう。
**そのため「分布の可視化」を行うことが肝要である。**たとえばヒストグラムや箱ひげ図で、分布の広がりや偏りを視覚的に捉えること。そこから「平均値」「中央値」「モード値」の比較を通じて、代表値の選定を行う。
市場の全体像を捉えるには、「中央値」+「上位10%」の平均など、複数の代表値の併用が効果的だ。
セグメントごとの「金銭感覚」を見極める
**もう一つ重要なのは「誰の視点で市場を見るか?」**という問いだ。たとえば、学生と社会人では同じプロダクトでも支払い可能金額が異なる。主婦層とエグゼクティブ層でも、可処分所得や価値認識は大きく異なる。
**こうした違いを踏まえ、「セグメント別」に中央値や平均値を計算するアプローチが有効である。**BtoCであれば年齢・収入・ライフスタイル、BtoBであれば業種・企業規模・担当者役職などが典型的な切り口となる。
顧客セグメントごとの「支払い意欲・支払い能力」を可視化し、それぞれの市場サイズを積み上げていく。 この「セグメント積み上げ型市場推定」は、事業戦略にも直結するインサイトを提供してくれる。
SAM/SOMの推定は「構成要素の掛け算」
「顧客が代替手段に使っている金額」は市場規模の構成要素の一つでしかない。
TAM/SAM/SOMのSAMの計算式は、以下のような構造をとる。
SAM = 該当セグメント人数 × 顧客単価 × 購入頻度
また、その上で、アーリーアダプターに限定して計算すれば、SOMとなる。
このうち「顧客単価」に相当するのが今回のアンケートで得られる金額データである。 「人数」や「頻度」も調査や外部データから仮定を置く必要がある。
つまり、金額の中央値か平均値かだけで全体が決まるわけではなく、全体設計の中での位置づけが重要になる。 だからこそ、金額単体の議論に閉じず、市場規模の構成要素としてどのように機能するかを捉えておきたい。
最終判断は「戦略目的」から逆算する
**平均値と中央値のどちらを使うかは、「何を目的に数字を分析するか?」**によって変わってくる。
もし投資家への説得材料として「成長ポテンシャル」を語りたいなら、多少夢のある平均値ベースも検討に値する。
一方で、初期のプロダクト開発やUX設計では、典型的ユーザーのリアルな金銭感覚を反映する「中央値」のほうが有用である。 チーム内の意思決定やペルソナ設計においては、「地に足のついた市場像」が力を持つ。
つまり、単一の指標にこだわらず、「誰に、何を、どの場面で伝えるか?」 という戦略意図に応じて、統計指標を選択すべきである。
まとめると、市場規模の推定において「中央値」をベースとしつつ、分布の把握とセグメントごとの分解を行い、「現実性」と「説得力」のバランスを取ることが最適解である。 統計は手段。問いに応じて、使い分けよう。
THE SEEDS 81
イノベーションの種を撒き散らかす手紙。
ピンキーが毎週お届けする、新規事業のヒントと思考実験。
Powered by Substack
