国立教育研究所の教育情報・資料センターは,全国の教育関係機関の協力を得て各種の教育情報データベースを作成し,所外の機関にオンライン等で利用に供している。以下,「高校入試問題データベース」と「高校入試問題の分析・評価システム」について紹介する。
高校入試問題の質的向上または改善のためには,高校入試問題に関する科学的な分析・評価資料が必要である。以下に紹介する「高校入試問題データベース」は,平成3年度以降の,我が国の都道府県立の高等学校入学者選抜学力検査問題(国語,社会,数学,理科,英語)を収録したものである。高校入試問題データベースは,収録する情報の種類に応じて,以下の4つのサブデータベースに分かれる。
問題情報データベースは,高校入試問題の小問単位に,年度,都道府県名,教科名,問題番号,正答率,配点率,正答例等の情報をデータベース化したもので,いわゆる「二次情報データベース」である。正答率と配点は「公開可」な場合に限って収録し,正答例は「公開可」な場合は各都道府県で公表されているものを,「公開不可」の場合は当方で作成した正答例を収録した。難易度は正答率のデータをもとに5段階(LV=5:正答率0~20% ,LV=4:正答率20~40% ,LV=3:正答率40~60% ,LV=2:正答率60~80% ,LV=1:正答率80~100%)で示した。1年分の情報量は約7,500問で,これまで(平成3年度~平成9年度)合計53,096問の情報を収録した。
問題テキストデータベースは,高校入試問題の問題文をできるだけ忠実に収録した文字情報データベースである。問題情報データベースとこのデータベースが連携することで,例えば,ある特定語を含む問題文がどの教科に多いかを検索したり,また,その平均正答率を算出することができる。テキスト化(コード化)が困難な問題文は可能な限り代替文字等を使用して表現した。
問題画像データベースは,高校入試問題の問題と正答例を,画像として光ディスクに収録したイメージ情報データベースである。収録方法は,問題用紙1枚を1つの画像として収録する方法(全画面データ方式)と,大問単位に問題文をトリミングしてそれを1つの画像として収録する方法(問題別方式)の2通りである。1年分の画像量は,全画面データ方式で約1,000枚,問題別方式で約1,300枚である。問題情報データベース等の他のデータベースと連携することで,例えば,テキスト表現困難な図を含む問題を,プリンタ出力またはFAX出力によって入手することができる。
問題音声データベースは,高校入試問題の聞き取り(ヒアリング)問題を収録した音声情報データベースである。音声情報の処理方法は,提供を受けた録音テープをもとに,音声データをCD並(44.1Khz,16bit) の品質で量子化し,パソコンで取り扱えるファイル形式に変換した。そして,音声データのテキスト,スピーチの速度,ポーズ時間等の情報を付加し,データベース化した。このデータベースは平成5年度以降の高校入試問題を収録対象にしている。
本システムは,高校入試問題に関する諸データの分析・評価を支援するシステムであり,選抜方法,各教科教育,教育情報,情報工学等の各専門家の協力の下で開発が行われた。
本システムから得られる研究成果は,各分野の専門家に還元することを考慮している。特に,教育的側面では,他地域・他校の入試問題との比較分析,過去との比較分析・傾向分析,教科内容領域別の分析・評価が,実証的かつ豊富なデータと,各専門家の知見による分析・評価手法によって実現される。また,選抜方法・制度に関する研究や,義務教育終了時の学力到達状況把握等,本システムの多面的な利用が期待できる。
一方,工学的側面では,問題の説明図,グラフ,表,地図,写真等の処理,さらに,ヒアリング音声の分析・評価が本システムの開発のねらいである。具体的には,図形・画像・音声情報の蓄積方法,検索方法,出力方法,更新管理方法等,教育研究への応用利用を十分考慮している。
高校入試問題データベースの作成は文部省科研費(平成4年度~10年度,研究成果公開促進費・データベース:作成委員長 坂谷内勝)によって,高校入試問題の分析・評価システムの開発研究は,文部省科学研究費(平成5年度~6年度,試験研究B:研究代表者 坂谷内勝)の助成を得ている。したがって,研究の成果は,データの提供を頂いた各都道府県教育委員会をはじめ,地方教育センター,大学学部・センター・図書館等にも公開している。データベースに関しては,当研究所のパソコン通信ネットワークを通じて,教育関連機関からオンライン検索が可能である。