一般社団法人社会構想デザイン機構
実践ガイド — 評価・測定

職業訓練の効果は測れるのか — EBPMが問う人材育成政策の評価設計

ISVD編集部
約6分で読めます

年間数千億円の公費を投じる日本の公的職業訓練制度。その効果を厳密に測定する仕組みはほぼ存在しない。EBPMの視点から、公的訓練プログラムの評価設計手法と主要国との国際比較を行い、NPOが取り組める実践的な評価フレームワークを体系的に整理する。

XFBThreads

ざっくり言うと

  1. 日本の職業訓練の投資規模と効果検証のギャップをOECD比較データで示す
  2. カークパトリックモデル+SROIによる評価フレームワークを体系的に解説
  3. NPO実務者向けの3ステップ評価設計(ロジックモデル・指標・比較群)を提供

はじめに

年間数千億円規模の職業訓練投資の効果検証が不十分な現状を指摘

日本政府は「5年間で1兆円」のリスキリング投資を掲げ、教育訓練給付金の拡充や人材開発支援助成金を通じて職業訓練への公的投資を拡大している。令和5年度の求職者支援訓練受講者は約44,700人、離職者訓練の就職率は約70〜80%と報告されている。

しかし、この就職率は「訓練を受けなかった場合にどうなっていたか」という反事実との比較を欠いている。セレクションバイアスを含んだ数字を「効果」と呼べるのか。投資規模と効果検証の間に横たわる構造的なギャップ。それが(Evidence-Based Policy Making)の視点から見た日本の職業訓練の現在地である。


投資規模と効果検証のギャップ

日本のALMP支出の国際比較と評価体制の構造的問題を分析

ALMP支出の国際比較

積極的労働市場政策(ALMP)への支出をGDP比で見ると、日本の位置づけが浮かび上がる。

デンマーク
1.3%
スウェーデン
0.9%
ドイツ
0.6%
OECD平均
0.41%
日本
0.15%
出典: OECD (2023)
図: 積極的労働市場政策(ALMP)支出の国際比較(GDP比%、2023年)

日本のALMP支出はGDP比約0.1〜0.2%OECD平均の0.41%に対して半分以下であり、デンマークの1.3%とは一桁の差がある。支出規模が小さいだけではない。その限られた投資の効果を測定する仕組みも未整備という「二重の遅れ」が、日本の構造的課題である。

厳密なエビデンスはどこにあるか

日本で反事実的分析に基づく公的職業訓練の効果検証を行った研究は、数えるほどしか存在しない。RIETIの原(2021)による傾向スコアマッチング研究が代表的であり、就業構造基本調査のマイクロデータを用いて離職者訓練の効果を検証した。

指標効果出典
男性就業率向上+15.4ppRIETI (2021)
女性就業率向上+17.4ppRIETI (2021)
離職者訓練就職率70〜80%厚労省
行田市SROI3.78SIB実証
デンマークALMP義務参加高い移行率OECD
ドイツ訓練先定着率74%OECD

※ pp = パーセントポイント。RIETI研究は傾向スコアマッチングによる反事実比較

図: 職業訓練の効果に関する主要エビデンス

離職者訓練の受講により、男性で+15.4ポイント、女性で+17.4ポイントの就業率向上が確認されたことは重要な知見である。ただし、この研究が測定しているのは訓練完了後1年以内の短期効果に限られ、賃金効果や長期的なキャリアへの影響は未検証のまま残されている。


なぜ厳密な評価が進まないのか

政治的制約・予算制約・技術的制約が評価実施を阻む要因を解説

が政策評価のゴールドスタンダードとされる中、日本で実施が進まない背景には構造的な障壁がある。

  1. 公平性の原則との緊張 — 政策対象者をランダムに介入群・対照群に分けることへの行政的・倫理的抵抗が根強い
  2. 担当者の異動サイクル — 分析が完了する前に担当者が異動してしまい、知見の組織的蓄積が途切れる
  3. データインフラの分断 — ハローワークの訓練受講データ、雇用保険データ、税データが省庁を横断して連結できない構造的問題
  4. 追跡調査の不在 — 訓練修了後の中長期的な就業・賃金を追うパネルデータそのものが存在しない

これらの障壁は、個別の技術的問題ではなく、政策評価を制度に組み込む文化そのものの不在を示している。


評価フレームワーク — カークパトリック+SROI

実務で使える評価手法として2つのフレームワークを統合提案

職業訓練の評価にはカークパトリックの4段階モデルが広く参照されるが、日本の公的訓練で体系的に実施されているのはLevel 1(受講者満足度)とLevel 3の一部(就職率の追跡)にとどまる。

段階評価内容日本の現状
Level 1反応受講者満足度実施済み
Level 2学習知識・スキル習得一部実施
Level 3行動就職率・行動変容就職率のみ
Level 4成果賃金変化・生産性・税収ほぼ未測定
SROI社会的投資収益率社会的価値の貨幣換算事例限定
図: カークパトリック4段階 + SROI拡張 — 日本の公的職業訓練における評価の現在地

Level 4(社会的成果)の測定には、の適用が有効である。行田市の就労支援プログラムでは、SIB(ソーシャル・インパクト・ボンド)を活用した効果測定によりSROI 3.78を達成した。1円の投資に対し3.78円の社会的価値が生まれたことを意味する。受講者の進路決定率が全国平均を5.9%上回った実績と合わせ、成果連動型の評価モデルが公的訓練にも応用できる可能性を示した事例といえる。


国際比較から学ぶ評価設計

ドイツ・北欧諸国の評価制度から日本への示唆を抽出

デンマーク: 評価文化が制度に埋め込まれたフレキシキュリティ

デンマークのフレキシキュリティモデルは、柔軟な労働市場・手厚い社会保障・積極的労働市場政策の三位一体で構成される。失業給付受給者はALMPプログラムへの参加が義務化されており、プログラムの効果検証が政策サイクルに組み込まれている。評価を「おまけ」ではなく制度の構成要素として位置づける思想が、日本との決定的な違いである。

シンガポール: SkillsFutureの品質管理

シンガポールのSkillsFuture Career Transition Programmeでは、修了者の55%が6ヶ月以内に就職という実績データを公開している。2024年には監査対象の訓練プロバイダーの約15%が品質基準未達で退出させられた。訓練の供給側にも厳格な評価を適用する姿勢は、日本が学ぶべき仕組みである。

ドイツ: デュアルシステムの追跡評価

ドイツの職業訓練(デュアルシステム)では、訓練先企業への定着率が約74%に達する。企業内訓練と職業学校を組み合わせた構造が、訓練と就業の接続を制度的に保証している点が特徴的である。


NPO実務者のための評価設計 — 3つのステップ

準備・実施・活用の3段階で構成される実践的評価プロセスを提示

NPOや社会セクターが就労支援・職業訓練事業の効果を測定するために、まず取り組むべきステップを整理する。

ステップ1: ロジックモデルで因果仮説を明示する

「訓練を提供する → 参加者のスキルが向上する → 就職率が上がる」という因果の連鎖を、ロジックモデルとして構造化する。曖昧な「支援」を測定可能な介入に変換する作業である。社会的インパクト評価入門も合わせて参照されたい。

ステップ2: アウトカム指標を厳選する

カークパトリックのLevel 3〜4に対応する指標を1〜2個選定する。「訓練終了6ヶ月後の就業継続率」「訓練前後の時給変化率」など、時期と測定方法を具体化すること。指標設計の詳細はアウトカム指標の設計を参照してほしい。

ステップ3: ベースラインと比較群を確保する

事後アンケートだけでは因果の推定ができない。プログラム開始前のベースライン測定を必ず実施し、可能であれば待機群や類似属性の非参加者との比較を試みる。完全なRCTでなくとも、前後比較データの蓄積がEBPM実践の出発点となる。


まとめ

小規模組織でも実行可能な評価アプローチの重要性を総括

日本の職業訓練は、投資規模においても効果検証においてもOECD諸国に大きく遅れている。1兆円規模の公的投資に対し、厳密なエビデンスはRIETIの数本の研究論文に限られる現状は、政策立案の基盤として脆弱と言わざるを得ない。

カークパトリックモデルのLevel 4やSROIまで踏み込んだ評価設計を、公的訓練・NPO事業の双方に定着させる必要がある。行政データの省庁横断連携と中長期追跡システムの整備も急務である。デンマークやシンガポールの事例が示すのは、評価を「おまけ」ではなく制度の構成要素として組み込む発想の転換である。その出発点に、日本はようやく立とうとしている。

参考文献

Effects of Public Job Training in JapanHara, H.. RIETI Discussion Paper 21-E-027

Active Labour Market Policies in OECD Countries: Why Renewed Investment MattersOECD. OECD Blog

社会的インパクト評価ツールキット内閣府. NPOホームページ

公共職業訓練の効果分析について厚生労働省. 雇用保険制度研究会(第3回)資料

関連するご相談・サポート

学生キャリア相談

プロボノ

就職・大学院・起業・NPO・留学。選択肢をフラットに並べ、意思決定を支援します。

読んだ後に考えてみよう

  1. あなたの組織では、事業の「効果」をどのような指標で測定しているだろうか?
  2. 身近な人材育成プログラムにおいて、参加者の長期的な変化を追跡する仕組みは整っているだろうか?
  3. もし自分たちの活動が存在しなかった場合との比較を意識した評価について、どの程度実践できているかを振り返ってみたい。

この記事の用語

EBPM
客観的なエビデンス(統計データ、研究結果等)に基づいて政策を立案・評価する手法。
ランダム化比較試験
参加者を無作為に介入群と対照群に分けて効果を検証する実験デザイン。エビデンスの質が最も高い研究手法の一つ。
社会的投資収益率
社会的・環境的・経済的な成果を貨幣価値に換算し、投入コストとの比率で表す社会的インパクト評価手法。
XFBThreads

関連コンテンツ

ISVDの活動に参加しませんか?

会員登録で最新の研究・活動レポートをお届けします。協業やプロジェクト参加のご相談もお気軽にどうぞ。