IT用語集

散布図とは? 10分でわかりやすく解説

水色の背景に六角形が2つあるイラスト 水色の背景に六角形が2つあるイラスト
アイキャッチ
目次
UnsplashPlanet Volumesが撮影した写真

散布図とは?見方・作り方・注意点を分かりやすく解説

散布図は、2つの変数の関係を点の並びで見るグラフです。相関の有無だけでなく、外れた点、集団の混在、直線ではない形まで一度に確認できます。業務データにはノイズや例外が多いため、散布図を正しく読めるかどうかで、施策づくりやKPI設計の精度が変わります。

  • 分かること:右上がり・右下がりの傾向、ばらつき、外れた点、集団の違い、直線ではない形
  • 分からないこと:原因と結果の関係の断定
  • 使いどころ:仮説を作る、気になる点を洗い出す、次の検証につなげる

この記事では、散布図で何が読み取れるのか、何は読み取りすぎてはいけないのかを押さえたうえで、実務で使いやすい作り方と読み方を整理します。

散布図とは

散布図は、2つの変数間の関係性を点の分布として可視化するグラフです。横軸と縦軸にそれぞれの変数を置き、各データを「1点」としてプロットします。

ここで重要なのは、散布図の1点は1つの観測(1レコード)を表すという点です。たとえば「広告費」と「売上高」を使う場合、ある期間(例:1週間、1か月)における広告費と売上の組み合わせ(x, y)が1点になります。期間や粒度が揃っていないと、散布図はそれらしく見えても解釈が崩れます。

散布図で分かることと分からないこと

  • 分かること:傾向(右上がり・右下がり)、ばらつきの大きさ、外れた点、グループの混在、直線ではない形(U字・飽和など)
  • 分からないこと:原因と結果の関係(「Aが増えたからBが増えた」とは断定できない)、第三の要因(交絡)がないことの保証

散布図は「仮説を作る」ために非常に強力ですが、相関が見えても因果とは限らない点を最初に押さえておく必要があります。

棒グラフや折れ線グラフとの違い

散布図は、2つの数値の関係を見るためのグラフです。棒グラフや折れ線グラフとは、見たいものが異なります。

  • 散布図:2つの数値がどう並ぶかを見る
  • 棒グラフ:項目ごとの大きさを比べる
  • 折れ線グラフ:時間の流れに沿った変化を見る

たとえば、月ごとの売上の増減を見たいなら折れ線グラフ、商品別の売上を比べたいなら棒グラフ、広告費と売上の関係を見たいなら散布図が向いています。

散布図の例

例として、広告費(万円)と売上高(万円)の関係を見てみます。現実のデータは一直線になりにくいため、ばらつきがある例を示します。

広告費(万円)売上高(万円)
1095
20140
30210
40230
40260

このデータを散布図にすると、点はおおむね右上がりに並び、広告費が増えるほど売上も増える傾向が読み取れます。一方で、同じ広告費(40万円)でも売上が230万円と260万円に分かれており、広告とは別の要因(季節性、商品力、在庫、営業の施策など)も影響している可能性が示唆されます。

散布図を用いるメリット

  1. 変数間の関係性を直感的に理解できる
  2. データの分布やばらつきを把握できる
  3. 外れた点(異常値)や入力ミスの疑いを見つけやすい
  4. 回帰を使った分析など、次の分析につなげやすい

特にビジネスの現場では、散布図を起点にして「効いていそうな要因」を当たりづけし、次の検証へ進める使い方が有効です。

散布図の基本的な見方

  • 分布:点がどこに集中しているか、ばらつきが大きいか
  • :直線的か、曲線的か(U字・飽和・段差など)
  • グループ:複数の集団(店舗別、顧客層ごと、地域別)が混在していないか
  • 外れた点:明らかに離れた点がないか(ただし即除外しない)

散布図は「正の相関」「負の相関」「相関なし」だけで終えるのではなく、形の違いから仮説を作ると実務での価値が上がります。

散布図の具体的な使用例

  • マーケティング:広告費と売上の関係を見て、予算の配分の仮説を作る
  • 品質を管理する場面:工程の条件(温度・圧力など)と不良率の関係を見て、ばらつき要因を疑う
  • 人事・組織:研修を受けた回数と成果を見る指標の関係を見て、効果の出方(ラグ)を検討する
  • 財務・経営:在庫が回る速さと粗利率の関係を見て、商品の方針の方向性を探る

散布図は、データに基づく議論の出発点として有用です。結論を断定する道具ではなく、「次に何を確かめるべきか」を見つける道具として使うと安定します。

散布図の作り方

散布図を作成する手順

  1. 何を見たいかを決める(何を判断したいか)
  2. 変数を選ぶ(結果を見る指標と要因の候補、または比較したい2指標)
  3. データの粒度と期間を揃える(週次なのか日次なのか、店舗別なのか全体なのか)
  4. 前処理を行う(欠損値、異常値、単位、スケール)
  5. プロットし、必要に応じて回帰線や補う情報を加える
  6. 読み取りと仮説化を行い、追加の切り口(層別・期間を分けること)で再プロットする

この流れで進めると、散布図が「描いて終わり」にならず、判断に接続しやすくなります。

散布図の軸と点の意味

横軸と縦軸は「比較したい2つの変数」です。例えば、横軸に広告費、縦軸に売上高を置く場合、各点は「ある単位で切ったデータ」の組み合わせを表します。

広告費(横軸)売上高(縦軸)データポイントの意味
10万円100万円ある期間に広告費10万円で売上100万円だった
20万円150万円ある期間に広告費20万円で売上150万円だった

実務では「ある期間」が曖昧だと解釈が破綻します。週次なのか月次なのか全社の合計なのか担当者ごとなのかなど、点の定義を先に固定しましょう。

相関の強さを示す値とR²の見方

散布図の印象を数値で補いたいときは、相関の強さを示す値とR²を使います。

  • 相関の強さを示す値(r):2変数の直線的な関係の強さを表す(-1〜1)
  • :当てはめた式が、結果側の変数のばらつきをどれだけ説明しているかを表す(0〜1)

切片を含む単回帰では、R²は相関の強さを示す値rの二乗(r²)に一致します。ただし、説明に使う変数が複数ある場合や、モデルの置き方が異なる場合は、この対応をそのまま使えません。

また、相関の強さを示す値や当てはまりの度合いを示す値は原因と結果の関係を証明しません。外れた点が1点あるだけで数値が大きく動くこともあるため、散布図の形(分布・外れた点・直線ではない形)を先に確認することが重要です。

散布図を作るときの注意点

  • 単位とスケール:万円、件、%などを明記し、桁が違う場合は対数軸も検討する
  • 点の重なり:件数が多いと真っ黒になるため、透明度・サンプリング・ジッターなどで見やすさを確保する
  • 期間の混在:施策を変える前後が混ざると別のグループが同居するため、期間を分けて描く
  • ラグ:広告や教育などは効果が遅れて出ることがあるため、当月ではなく翌月の売上なども試す
  • 外れた点:即除外せず、入力ミスか見逃せない出来事かを切り分ける

散布図の分析と解釈

散布図から相関の向きを読み取る

散布図の点の並び方から、相関の方向を把握できます。

  • 正の相関:右上がりの傾向(xが増えるほどyも増えやすい)
  • 負の相関:右下がりの傾向(xが増えるほどyが減りやすい)
  • 相関が弱い/見えない:点が散らばる(直線的な関係がはっきりしない)

ただし、ここで結論を急がないことが重要です。相関が弱い場合でも、直線ではない形(U字・飽和)層の混在(顧客層ごとでは関係がある)が原因で、全体では見えなくなっていることがあります。

直線ではない形と集団の混在を疑う

実務の散布図では、次のような「形」がよく現れます。

  • 飽和:ある点から先は増やしても効果が伸びない(広告費を増やしても売上が頭打ち)
  • 閾値:一定ラインを超えたところで一気に傾向が変わる(在庫が足りると売上が伸びる等)
  • 二つの雲:施策の前後、地域差、顧客層の違いなどで別集団が混ざる

これらは「相関の強さを示す値」だけでは見落とされやすい情報です。散布図はまず形で読み、必要なら層別して描き直すことで解釈が安定します。

外れた点の確認と対処

外れた点は「邪魔な点」ではなく、重要なサインである可能性があります。外れた点の主な原因は大きく3つに分かれます。

  • 入力ミス・集計ミス:桁違い、単位違い、欠けた値の補い方の誤りなど
  • 条件の違い:キャンペーン、障害、在庫切れ、価格の改定など、通常と異なる状況
  • 見逃せない出来事:不正、事故、重大な運用の質の劣化など、対策すべき本質的な異常

対処の基本は、除外の前に原因を特定することです。除外する場合も「なぜ除外したか」を記録し、再現性のある判断の基準にします。

散布図で回帰を使うとき

散布図の傾向を数式で表したい場合、回帰を使った分析を行います。回帰を使った分析では、説明に使う変数から結果側の変数を見積もる式を作ります。

  1. 散布図で形を確認する(線形で近似できそうか)
  2. 当てはめた直線(または曲線)を置く
  3. 係数を算出し、解釈する
  4. 適合度と残差を確認する(偏りがないか、外れた点に引っ張られていないか)

回帰は便利ですが、「直線を引けた」ことと「因果が証明できた」ことは別です。さらに実務では、第三の要因(交絡)が混ざりやすいため、必要に応じて期間を分けること層別、あるいは多変量での検証を検討します。

散布図から導き出せる知見

  • どの要因が効いていそうかの当たりづけ(仮説の生成)
  • ばらつきの大きさから「再現性の低さ」を疑う(運用の不安定さの発見)
  • 外れた点から入力の質や異常な出来事を疑う
  • 層別の必要性(顧客層・店舗・期間)を発見する

散布図を業務で活用するコツ

社内データに適用するときの前提を揃える

散布図は、社内データに適用して初めて真価が出ます。一方で社内データは、粒度・期間・定義が混ざりやすい点に注意が必要です。

  • 集計の単位(人別、店舗別、週次、月次など)を固定する
  • 期間を揃える(繁忙期・閑散期を混ぜない、施策の前後を分ける)
  • 欠損や異常な値が「意味を持つのか」を確認する

この前提を揃えるだけで、散布図の解釈は大きく安定します。

散布図を用いたKPI設計

散布図はKPI候補を探すのに役立ちますが、判断は「相関があるか」だけでは不十分です。実務では次の観点が重要です。

  • 現場が動かせるかどうか:現場がコントロールできる指標か
  • 副作用:KPIを上げる行動が別の品質を下げないか
  • ラグ:効果が遅れて出るなら、評価タイミングをどう設計するか

散布図で「関係がありそう」だと分かったら、KPI化する前に、期間をずらして描いたり、層別で描いたりして、関係の安定性を確かめるのが現実的です。

問題を見つけ、改善につなげる

散布図は、問題を見つけて終わりではありません。実務では次のループで使うと効果が出ます。

  1. 散布図で傾向・外れた点・グループを観察する
  2. 原因の仮説を立て、施策を決める
  3. 施策後に同じ定義で再プロットし、変化を確認する

「同じ定義で描き直せる」ことが、散布図を判断の道具に変えるポイントです。

散布図を使った説明を強くする

プレゼンや報告で散布図を使う場合は、誤解を防ぐために次をセットで示しましょう。

  • データの期間・母集団・単位
  • 相関と因果の違い(因果を主張しない/検証が必要である)
  • 外れた点を除外した場合は理由
  • 層別している場合は切り口(店舗別、顧客層ごとなど)

これにより、「それっぽい図」ではなく、判断に使いやすい図になります。

散布図が向かない場面

  • 項目名どうしを比べたいとき:数値どうしの関係ではないため、棒グラフの方が向きます。
  • 時間の流れを主に見たいとき:推移の把握が主目的なら、折れ線グラフの方が読みやすくなります。
  • 点が極端に少ないとき:数点だけでは傾向を読み違えやすく、別の資料と合わせて見る必要があります。

まとめ

散布図は、2つの変数の関係を直感的に捉え、外れた点や集団の混在、直線ではない形の兆候まで読み取れる強力なグラフです。一方で、相関は因果を意味せず、期間・粒度・層別の設計を誤ると解釈が崩れます。まずは1点が何を表すかを固定し、形と分布を読んだうえで、必要なら層別や期間を分けて描き直すことで、散布図は実務の判断に直結する道具になります。

Q.散布図は何のために使いますか

2つの変数の関係を点の分布として可視化し、傾向・ばらつき・外れた点を把握するために使います。

Q.散布図で原因と結果の関係は分かりますか

分かりません。散布図は相関や形の示唆を与えますが、因果の断定には追加の検証が必要です。

Q.相関の強さを示す値が高ければ施策が有効だと言えますか

言えません。外れた点や交絡で高く見えることがあるため、前提を確認し別の切り口でも検証します。

Q.点が重なって真っ黒になるときはどうしますか

透明度の調整、サンプリング、ジッター、集計した表示などで重なりを減らして読み取りやすくします。

Q.外れた点は削除してから分析すべきですか

原則として原因の確認が先です。入力ミスか見逃せない出来事かを切り分け、除外するなら理由を記録します。

Q.相関がないように見えるのに関係がありそうな場合はどうしますか

直線ではない形や層の混在を疑い、期間を分けることや層別で描き直して形を確認します。

Q.当てはめた直線は必ず引くべきですか

必須ではありません。まずは分布と形を読み、線形で近似できる場合に補助として使います。

Q.散布図の軸は0から始めるべきですか

必ずしも必要ありません。散布図は関係の形を読むため、データの見やすさを優先して範囲を設定します。

Q.対数軸はどんなときに使いますか

値の桁が大きく異なる場合や、指数的な増減を扱う場合に、分布を見やすくするために使います。

Q.散布図をKPI設計に使うときの注意点は何ですか

相関だけで決めず、現場が動かせるかどうか・副作用・ラグを確認し、関係が安定するかを層別や期間を分けることで確かめます。

記事を書いた人

ソリトンシステムズ・マーケティングチーム