Evidence data platform constructed
by Council for Science, Technology and Innovation
政府の各府省庁は、主管する全ての事業(約 5,000 事業)に対して統一した様式のレビューシート(以下「行政事業レビューシート」と呼ぶ)を作成し、事業の執行状況や資金の流れを全面的に公表している。ここでは、2016 年度からの 4 年間の全府省庁の行政事業レビューシートをデータベース化し、統合イノベーション戦略 2019 との関連性を類似度として指数化し上位から並べて表示することにより検索可能としている。なお、この見える化では、科技予算に限定せず行政事業レビューシートが作成されている全ての行政事業が検索対象となっていることに留意のこと。
この「見える化」により、統合イノベーション戦略 2019 上の分野に類似性の高い行政事業のリストが表示され、例えば、分野ごとの毎年の予算額の推移を調べる、あるいは異なる省庁間で同じような行政事業が実施されていないか確認する、などを効率的に行うことが可能となる。
行政事業レビューシートは、毎年秋ごろに内閣官房行政改革推進本部が公開しているデータをダウンロードして使用した。2016 年度から 2019 年度の行政事業レビューシートをデータベース化し、検索対象としている。 統合イノベーション戦略 2019 については、 第 5 章「特に取組を強化すべき主要分野」において (1) 節から (6) 節となっている 6 項目と、(7) 「統合的なイノベーションを実現するためのその他の主要分野」において示される 5 項目の計 11 項目を検索対象の分野とした。 レビューシートと検索対象分野間の類似度の判定には「統合イノベーション戦略 2019 の 11 分野をそれぞれ説明する文章」と「各行政事業レビューシートの事業概要の説明文」について、それぞれ名詞を切り出して tf (Term Frequency) -idf (Inverse Document Frequency) 法による特徴ベクトルを計算し、その特徴ベクトル間のコサイン類似度を類似度として用いる。この際、数値や年号、一般指示名詞などの一般的な名詞はストップワードとして計算から除いた。類似度計算の結果は、可視化下部の行政事業のリストの左から 2 番目の「類似度」の列に表示されている。この類似度の計算においては、意味を考慮した類似度判定は行われていない点に留意されたい。
統合イノベーション戦略 2019 との類似度の可視化例を下記に示す。
行政課題文章間の類似性を計算し、選択した統合イノベーション戦略と類似性の高い事業概要を持つ行政事業がリストアップされる。帯グラフは主管する府省庁別に事業件数の割合を表している。可視化ツールでは、リストアップおよび追加条件による絞り込みが可能である。