メインコンテンツへスキップ
一般社団法人社会構想デザイン機構

「グラフの嘘」を見抜く5つのチェックポイント

ヨコタナオヤ
約8分で読めます

Y軸切断、比率の歪み、チェリーピッキング、相関と因果の混同、サンプルサイズ問題——グラフの典型的な誤用パターン5つを解説し、データビジュアライゼーションを批判的に読むための実践的チェックポイントを提示する。

XFBThreads

ざっくり言うと

  1. グラフは客観性の象徴とみなされがちだが、Y軸の切断や縦横比の操作など、視覚的トリックで読者の判断を誘導する手法が広く使われている
  2. フィンランドは2013年から国家カリキュラムにメディアリテラシーを組み込み、6歳児から「情報の読み方」を教育している一方、日本では体系的な統計グラフ教育が不足している
  3. 5つのチェックポイント(Y軸・比率・期間・因果・サンプル)を習慣化することで、日常的に接するグラフの「嘘」を構造的に見抜く力が身につく

何が起きているのか

グラフの視覚的トリックが日常に溢れている実態と、データリテラシーの重要性を提示

「このグラフを見てください——数字が証明しています」

SNSのタイムラインやニュース記事で、こうした文句とともにグラフが共有される光景は日常的である。グラフは「客観性の証」として機能し、テキストだけでは生まれない説得力を与える。しかし、その「客観性」は本当に担保されているのだろうか。

複数の調査が示唆するところでは、誤解を招くビジュアルをそれと気づかずにオンラインで共有した経験を持つ人は少なくない。問題は意図的な「嘘」だけではない。作成者自身が無自覚なまま、グラフの構造が読者の判断を歪めているケースのほうがむしろ多い。

1954年、統計学者のダレル・ハフ『統計でウソをつく法』(原著 How to Lie with Statistics)を出版した。グラフのトリック、偏ったサンプル、平均値の罠——70年以上前に指摘された手法は、デジタル時代の今もなお、形を変えて反復されている。

本稿では、グラフを含むデータビジュアライゼーションを批判的に読み解く力——ここでは「グラフリテラシー」と呼ぶ——の基礎として、日常的に遭遇頻度が高い典型的な誤用パターンを5つに絞って整理する。グラフの誤用パターンはほかにも存在するが、まずはこの5つを習慣的にチェックすることが出発点となる。

背景と文脈

フィンランドのメディアリテラシー教育モデルと日本の現状を比較し、5つの誤用パターンを体系的に解説

メディアリテラシー教育の国際格差

グラフの誤用に対する「免疫力」は、教育によって大きく異なる。

Open Society Institute Sofiaが公表するメディアリテラシー指数で、フィンランドは2017年の初回調査から毎年1位(100点満点中74点)を維持している。デンマーク(73点)、ノルウェー(72点)と北欧諸国が上位を独占する構図は一貫している。

フィンランドの強みは制度設計にある。2013年に国家メディアリテラシー方針(Good Media Literacy: National Policy Guidelines 2013–2016)を制定し、早期幼児教育(3歳頃から)を含む全教育段階にメディアリテラシーを組み込んだ。就学前教育(6歳頃)の段階では子どもたちがより積極的な役割でメディアの真偽判断を学ぶ。6歳児が「フェイクニュースの見分け方」を学ぶというのは誇張ではなく、実際のカリキュラムに基づく事実である。学校だけではない。図書館、新聞社、NGO、企業が協働してメディアリテラシーの生態系を構築している。

一方、日本はどうか。PISA 2022で日本の数学的リテラシーはOECD加盟国中1位(536点)であり、計算能力そのものは世界トップクラスにある。しかし、「統計グラフを批判的に読む」教育は体系化されていない。文部科学省は2026年2月、「メディアリテラシーに関する現状と検討課題」を教育課程部会で議論し、生成AI時代の情報リテラシーの重要性を指摘しているが、具体的なカリキュラム化はこれからである。

計算はできるが「グラフの嘘」は見抜けない——これが日本の現在地である。

5つの誤用パターン

01
Y軸切断
Truncated Y-Axis
Y軸のゼロを省略し、わずかな差を大きく見せる
: 支持率48%→52%の変化が、画面上では「倍増」に見える
02
比率の歪み
Aspect Ratio Distortion
グラフの縦横比やピクトグラムの面積を操作する
: 2倍の数値を4倍の面積の円で表現し、差を誇張する
03
チェリーピッキング
Cherry Picking
都合のよい期間・データだけを選んで提示する
: 上昇トレンドの一部だけを切り取り「急成長」と報じる
04
相関と因果の混同
Correlation ≠ Causation
2つの変数の相関を因果関係であるかのように提示する
: アイスクリーム売上と溺死事故の相関→「アイスが原因」?
05
サンプルサイズ問題
Sample Size Fallacy
少数のサンプルから全体を語り、信頼性を偽装する
: 「利用者の90%が満足」——実は調査対象はわずか10人
図: グラフの5つの典型的な誤用パターン

以下、5つのパターンを順に解説する。

チェックポイント1: Y軸はゼロから始まっているか

最も頻度が高く、最も見落とされやすい手法がY軸の切断(truncated axis)である。Y軸をゼロではなく途中の値から始めることで、わずかな差を視覚的に増幅する。

たとえば、ある商品の顧客満足度が48%から52%に変化したとする。Y軸を0%〜100%で描けば、変化はグラフ全体の4%分にすぎない。しかしY軸を45%〜55%に絞れば、同じ変化がグラフの約40%を占める。視覚的には「急上昇」に見え、読者は実際以上の変化が起きたと錯覚する。この手法は企業の広告やIR資料でも、政党の支持率報道でも、あらゆる場面で使われている。

アルベルト・カイロは著書 How Charts Lie(2019年)で、Y軸の切断を「最も普遍的なグラフの嘘」と呼んでいる。重要なのは、これが必ずしも悪意から生じるわけではない点にある。Excelのデフォルト設定がデータ範囲に合わせてY軸を自動調整するため、作成者が意識せずとも切断が発生する。

チェック: グラフを見たら、まずY軸の開始値を確認する。ゼロから始まっていない場合、実際の変化量と視覚的な変化量の乖離を頭の中で補正する。

チェックポイント2: 面積・比率は正しいか

棒グラフ以上に注意が必要なのが、ピクトグラムや面積グラフである。

数値が2倍であることを表現するために、図形の高さを2倍にするのは正しい。しかし、縦横ともに2倍にすると面積は4倍になる。3次元の立体図形で表現すれば体積は8倍になる。読者は面積や体積で「量」を直感的に判断するため、実際の差の2倍〜4倍の印象を受ける。

新聞やテレビの報道で使われるピクトグラム(人型・コインなど)は、この罠に陥りやすい。2倍の予算を示すために2倍の大きさのコインを描くと、面積は4倍——読者は無意識に「4倍の差がある」と認識する。

チェック: ピクトグラムや円・バブルチャートでは、「数値の比」と「見た目の面積の比」が一致しているかを確認する。

チェックポイント3: 期間・範囲は恣意的でないか

とは、全体のデータから都合のよい部分だけを選んで提示する手法である。

株価が10年間で見れば横ばいでも、直近3カ月の上昇局面だけを切り取れば「急成長」に見える。逆に下落局面だけを切り取れば「暴落」になる。同じデータから正反対の結論を導き出せるのがチェリーピッキングの本質である。

企業のIR資料や政府の統計発表でも、比較の基準年(ベースライン)の選び方で印象が大きく変わる。「前年同月比で改善」と発表する場合、前年がコロナ禍の底であれば、改善は当然であり、「回復」とは言えないかもしれない。投資信託の広告が「直近3年で○○%のリターン」と謳う場合も、開始時点の選び方次第で数字はいかようにも変わる。

チェック: グラフの時間軸の範囲を確認する。「なぜこの期間なのか?」と問い、可能であれば長期データを自分で確認する。

チェックポイント4: 相関を因果と読み違えていないか

タイラー・ヴィゲンの "Spurious Correlations" プロジェクトは、「米国の科学技術支出」と「首吊り自殺数」が高い相関を示すグラフを並べることで、相関と因果の混同がいかに荒唐無稽な結論を導くかを示した。

二軸グラフ(デュアルアクシス・チャート)は、この混同を誘発しやすい。左右の軸に異なるスケールの変数を配置し、2本の線を重ねて描くと、読者は無意識に因果関係を読み取る。しかし、2つの変数が同じ方向に動いていても、共通の第三の要因()が両方を動かしているだけかもしれない。

アイスクリームの売上と溺死事故の相関は、「夏」という共通要因で説明できる。アイスクリームが溺死を引き起こしているわけではない。

チェック: 2つの変数の関連が示されたとき、「第三の要因はないか?」「時間的な前後関係はあるか?」「介入実験で確認されているか?」と問う。

チェックポイント5: サンプルサイズは十分か

「利用者の90%が満足」——この数字は、調査対象が1万人なら信頼できるが、10人なら何の意味もない。サンプルサイズの小ささは、統計の信頼性を根本から揺るがす。

問題は、グラフ上では大きなサンプルと小さなサンプルの区別がつかない点にある。棒グラフで「90%」と表示されれば、それが10人の結果でも1万人の結果でも、視覚的には同じに見える。

広告やプレスリリースで「○○%が効果を実感」と主張する場合、サンプルサイズ、調査方法(自社調査か第三者調査か)、母集団の定義を確認する必要がある。

チェック: グラフに付記された注釈や出典を確認する。サンプルサイズ(n=)が明示されていない統計は、信頼性を大幅に割り引いて受け取る。

構造を読む

グラフリテラシーを市民の基礎教養として位置づけ、実践的なチェックリストを提示

グラフリテラシーは「見る力」ではなく「疑う力」

5つのチェックポイントに共通する本質は、「グラフを見る力」ではなく「グラフを疑う力」にある。

グラフは本来、複雑なデータを理解しやすくするための道具である。しかし、その「わかりやすさ」が判断を歪める方向に作用するとき、道具は武器になる。重要なのは、グラフそのものを否定することではなく、グラフが「何を見せていないか」を問う習慣を持つことである。

心理学研究のレビューは、「人間はデータの視覚的表現に対して体系的なバイアスを持つ」ことを示している。Y軸が切断されていると知っていても、視覚的な印象に引きずられて差を過大評価する傾向がある。つまり、「知っている」だけでは不十分であり、チェックを「習慣化」することが必要になる。

市民のデータリテラシーとして

フィンランドが示しているのは、メディアリテラシーは「特別な教育」ではなく「市民の基礎教養」であるという考え方である。グラフの読み方も同様に、専門家だけでなくすべての市民が身につけるべきスキルである。

以下の5項目を、グラフを見るたびに確認するチェックリストとして提案する。

  1. Y軸: ゼロから始まっているか? 切断されている場合、実際の変化量はどの程度か?
  2. 面積・比率: 図形の面積と数値の比率は一致しているか?
  3. 期間・範囲: なぜこの期間が選ばれているのか? 長期データではどう見えるか?
  4. 因果: 相関を因果と読み違えていないか? 第三の要因はないか?
  5. サンプル: サンプルサイズは明示されているか? 調査方法は適切か?

このチェックリストは、グラフに限らず、統計データ全般に応用できる。「数字があるから正しい」ではなく「数字があるからこそ、その数字の出自を問う」——それがデータリテラシーの出発点である。


参考文献

読んだ後に考えてみよう

  1. 最近SNSやニュースで見たグラフに、Y軸切断やチェリーピッキングが使われていなかったか振り返ってみよう
  2. 「相関」と「因果」の違いを、身近な例で説明できるだろうか
  3. グラフを見たとき、最初に何を確認する習慣をつけるべきだろうか

この記事の用語

チェリーピッキング
全体のデータから都合のよい部分だけを選んで提示する手法。期間・対象・変数の恣意的な選択により、同じデータセットから正反対の結論を導き出せる。
交絡変数
研究対象の2変数の両方に影響を与える第三の変数。交絡変数を見落とすと、見せかけの相関を因果関係と誤認する原因となる。

関連コンテンツ

XFBThreads

新着コラムをメールで受け取る

週1-2本の社会構造分析コラムを配信します。登録は無料です。

ISVDの活動に参加しませんか?

会員登録で最新の研究・活動レポートをお届けします。協業やプロジェクト参加のご相談もお気軽にどうぞ。