Evidence data platform constructed
by Council for Science, Technology and Innovation
政府の各府省庁は、主管する全ての事業(約 5,000 事業)に対して統一した様式のレビューシート(以下「行政事業レビューシート」と呼ぶ)を作成し、事業の執行状況や資金の流れを全面的に公表している。ここでは、第 5 期科学技術基本計画が始まった 2016 年度からの 4 年間の全府省庁の行政事業レビューシートをデータベース化し、第 5 期科学技術基本計画での政策課題や統合イノベーション戦略 2019 での強化すべき分野との関連性を類似度として指数化し上位から並べて表示することにより検索可能としている。なお、この見える化では、科技予算に限定せず行政事業レビューシートが作成されている全ての行政事業が検索対象となっていることに留意のこと。
この「見える化」により、特定の政策課題や分野に類似性の高い行政事業のリストが表示され、例えば、課題ごとの毎年の予算額の推移を調べる、あるいは異なる省庁間で同じような行政事業が実施されていないか確認する、などを効率的に行うことが可能となる。
行政事業レビューシートの検索可視化機能は、第 5 期科学技術基本計画の取り組みとの対応、統合イノベーション戦略 2019 での重点分野との対応、の 2 種類を用意した。
行政事業レビューシートは、毎年秋ごろに内閣官房行政改革推進本部が公開しているデータをダウンロードして使用した。第 5 期科学技術基本計画の対象期間である 2016 年度から 2019 年度の行政事業レビューシートをデータベース化し、検索対象としている。また、第 5 期科学技術基本計画の政策課題については、第 2 章から第 7 章の各節あるいは目次においてその中が中節、あるいは小節に細分化されている場合はその中節、小節を政策課題(合計 64 項目)と定義し、同様に、統合イノベーション戦略 2019 においても、第 5 章「特に取組を強化すべき主要分野」において (1) 節から (6) 節となっている 6 項目と、(7) 「統合的なイノベーションを実現するためのその他の主要分野」において ①~⑤ の中節で示される 5 項目の計 11 項目を検索対象の分野とした。レビューシートと政策課題・分野間の類似度の判定には、第 5 期科学技術基本計画の政策課題 64 項目をそれぞれ説明する文章、あるいは統合イノベーション戦略 2019 の 11 分野をそれぞれ説明する文章と、各行政事業レビューシートの事業概要の説明文について、それぞれ名詞を切り出して tf (Term Frequency) -idf (Inverse Document Frequency) 法による特徴ベクトルを計算し、その特徴ベクトル間のコサイン類似度を類似度として用いる。この際、数値や年号、一般指示名詞などの一般的な名詞はストップワードとして計算から除いた。類似度計算の結果は、可視化下部の行政事業のリストの左から 2 番目の「類似度」の列に表示されている。この類似度の計算においては、意味を考慮した類似度判定は行われていない点に留意されたい。
第5期基本計画の政策事項との類似度の可視化例を下記に示す。行政課題文章間の類似性を計算し、選択した行政課題と類似性の高い事業概要を持つ行政事業がリストアップされる。帯グラフは主管する府省庁別に事業件数の割合を表している。可視化ツールでは、リストアップおよび追加条件による絞り込みが可能である。
統合イノベーション戦略 2019 との類似度の可視化例を下記に示す。第 5 期基本計画の場合と同様に、行政課題文章間の類似性を計算し類似性の高い行政事業がリストアップされている。帯グラフは主管する府省庁別に事業件数の割合を表している。可視化ツールでは、リストアップおよび追加条件による絞り込みが可能である。