日本語教育支援システムの開発


1.研究経緯

国立教育研究所が中心となって開発研究を進めてきた,「日本語教育支援システム(Computer Assisted System for TEaching & Learning/Japanese,以下,CASTEL/Jと称する。)」について紹介する。1987年度~1989年度は,日本語教材データベースの構築と,その管理・利用プログラムの開発を行い,CASTEL/Jの第1バージョンを開発した。1990年度~1993年度は,第1バージョンで開発したデータベースの量的拡大と質的拡充,および,マルチメディアを取り入れたCASTEL/Jの第2バージョンを開発した。1994年度以降は,マルチメディア(文字,画像,音声)を積極的に利用した日本語教材データベースの開発と公開に取り組み,これまで整備してきた各種データベースをCD-ROM化(CASTEL/Jの第3バージョン)した。現在,CASTEL/J CD-ROM は,言語資源協会(GSK)を通じて,実費で配布している。


2.CASTEL/Jの特徴

CASTEL/Jを開発するに当たって最も留意した点は,「コンピュータのハードウェア,ソフトウェアの機能拡充に柔軟に対応できる」,「利用者に対応した利用が可能である」,そして,「マルチメディアの特徴を活かす」ということである。この結果,CASTEL/Jには他の類似なシステムとは異なる幾つかの特色を持っている。以下にCASTEL/Jの主な特徴を紹介する。


2.1 データベース中心のシステム

CASTEL/Jは,ソフトウェア中心ではなく,データベース中心のシステムである。これまで開発されてきた語学教育支援システムは,コースウェアの内容を充実することに力点が置かれ,ソフトウェア中心のシステムが多い。また,データベースを保有するシステムであっても,ソフトウェアに依存してデータベースが構築されており,コンピュータのハードウェア,ソフトウェアの機能拡充に柔軟に対応できず,データベースの移植または共有も極めて難しい状況にある。

CASTEL/Jの開発では,日本語教育・学習にとって必要な情報を精選し,汎用的に利用できるように,データベースを中心としたシステム開発を行っている。これにより,CASTEL/Jは,日本語教育・学習用データベースとデータベース利用ソフトウェアの独立性を保っており,コンピュータのハードウェア,ソフトウェアの機能拡充に柔軟に対応することを可能にしている。CASTEL/Jの第3バージョンは,開発したデータベースをCD-ROMに格納し,特定のハードウェア,ソフトウェアに依存しないよう留意している。

今回作成したCD-ROMの中には,開発したデータベースの他に,データベース入力データも収録されている。これらのデータは,文字コード変換のためのテキスト処理や簡単なプログラミングをすれば,他のパソコンやワークステーションでも利用できる。


2.2 利用者のニーズに応じたデータベース構築

教師が必要な教材は,その教師自身の教授法や普段利用している教科書,カリキュラム等に基づいたもので,100人の教師がいれば,100の異なる教材が必要になる。また,学習者にとっても,学習レベルや学習環境によって,必要とする教材は異なってくる。したがって,すべての教師や学習者が満足するような教材を作成することは,ほとんど不可能である。CASTEL/Jは,教師・学習者が必要と思われる教材を教材源(マルチメディア利用の日本語教育辞書や教材テキスト等)としてデータベース化している。これを利用して教師・学習者はデータベースに関する専門的な知識や技術なしで,自分のニーズに合った教材を作成・利用することができる。

現在,CASTEL/J上で電子化されている日本語教育辞書データベースは,筆順情報を含む漢字辞書データベース(筆順辞書は2,966字,漢字辞書は6,349字),音声・画像情報を含む単語辞書データベース(文字・音声・画像によるフル情報の単語辞書は2,958語,文字情報のみの和英辞書は33,566語,学術辞書は130,296語),そして用例辞書データベース(6,427文)がある。また,教材テキストデータベースは,本(新書,科学読み物,白書,教科書),新聞記事,試験問題,映画台本等で,約90冊で68.7MBである。すべての教材テキストには,原文の他に,かな表記,ローマ字表記,分かち書きのデータを持ち,さらに,文全体の構成情報(章節・シーン情報等)や文単位の数値情報(分かち書きの数等)のデータもある。

なお,CASTEL/Jで使用している著作物すべてについて,原著作者から“著作物を日本語教育教材として使用する”条件で使用許諾を得ている。


2.3 マルチメディアの有効利用

文字情報のみでは表現し難い概念を理解しようとするとき,マルチメディアによる表現は極めて有効である。例えば,単語や文章の発音・アクセントについては音声で聞くことによって問題解決を支援するし,色に関する概念はその色を見ることで一目瞭然である。CASTEL/Jでは,文字情報データベースと同じ開発思想に基づき,特定の領域に偏ることなく広範囲に渡る音声情報と画像情報をデータベース化している。即ち,音声・画像データは,当面,基本単語2,966語については,3,329枚のイラスト画像データと 4,799語の発音データをデータベース化している。また,映画「男はつらいよ」シリーズ41作分については,映像と同期した台詞をディスプレィ上で見ることができるようにデータベース化している。なお,CD-ROMの中にある音や絵のデータは,データ形式を変換するアプリケーションを使えば,他のパソコン等で利用することができる。


3.今後の課題

本プロジェクトは開始以来すでに10年を越えている。ようやくデータベースのCD-ROM化までたどり着くことができたが,今後の課題も数多く残っている。

これまでCASTEL/Jの開発における最大の課題は,「日本語教育学における知見を,いかに科学的手法で記述し,かつ,その知見を搭載したシステムをいかに実用的レベルで構築するか」という問題である。たとえば,分かち書き手法やローマ字表記等の日本語教育における様々な規則が統一されていない。日本語自体が生きていることも原因の一つかと思われるが,日本語教育における基礎的かつ実証的な研究成果が少ないという実態も加担していると思われる。

CASTEL/Jの開発には,国内外の日本語教育研究者・実践者からの要望を踏まえ,教育情報・教育工学の専門家によって,国際的かつ学際的に研究を進めている。本研究は,文部省科学研究費補助金による助成を得て,多くの機関および研究者の協力の下でシステム開発が進められている。また,CASTEL/Jの研究発表会を国内で4回,海外で1回(15カ国約70名の参加者)開催し,研究成果を広く公開している。さらに,日本語教育支援システム研究会では,CD-ROMの有効利用と流通促進を図るため,ニューズレターを発行し,利用方法に対するQ/Aや,教育・研究利用結果の報告,そしてシステムのバージョン・アップ等の情報交換を行っている。

最後に,我々はCD-ROM完成後においても,CASTEL/Jが全世界の日本語教育界に普及し利用されることを願い,システムの改良を継続して行うことを考えている。