日本テスト学会誌 Vol.9 No.1 要旨

トップ>学会誌>既刊号一覧>既刊号(9-1)>要旨

日本テスト学会誌 Vol.9 No.1

▶ 招待論文  
テストの過去,現在,そして未来の形を考える-その方向性と必要性-
池田 央
立教大学名誉教授
テスト技術は前世紀始めごろより,手書きから客観式テスト形式を経て発展し,自動読み取り装置(OMR)とコンピュータの発達により,個々の受検者からの情報を集める(集個技術)大規模テストの実施が可能となった。同時にテスト理論と多変量解析の手法によって,集められた多数の解答を採点し集約して(集約技術) ,細かい統計的分析も行われるようになった。最近では革新的な情報通信技術(ICT)の普及により,受検者一人一人がPCを持ち,個別にまた時間と場所を問わず情報交換ができる時代を迎えている。それは将来のテストの姿を変え,今までの選抜中心から個人主体の生涯にわたる教育や技能開発に役立つテストへと役割を変えていくに違いない。しかし,そのために生ずる新たな課題も多く,テスト関係者がこれから解決しなければならない問題も多い。ここで今までのテスト技術の発展を振り返りながらそうした問題を整理してみる。
キーワード:集個.・集約技術, 客観式テスト,マークリーダー,e-テスティング,習得地図
▶ 一般研究論文  
項目に関する事前情報が十分に得られない状況における適応型テストシステム開発の試み
熊谷龍一1、五島譲司2、中畝菜穂子3、柴山 直1、佐藤喜一2、野口裕之4
1東北大学、2新潟大学、3国立教育政策研究所、4名古屋大学
本論文は,予備調査が十分に実施できず,問題項目に関する情報が満足に得られない状況下におけるコンピュータ適応型テスト(CAT)の開発過程について述べたものである.本論文で開発されたCATは,数学の下位4領域について,延べ464項目の項目プールを持ち,簡易適応型の項目提示システムが採用された.また得点化については,項目難易度を基準にした独自の計算システムを開発し,テストシステムに実装された.テスト開発においては,19名のスタッフにより,2年6ヶ月の期間で開発が行われた. また,1)大学生に対して本システムと紙筆式テストを同時に受検させる,2)高校生に対して本システムを受検させる,という2つの調査を行い,テストシステムの妥当性が検証された.
キーワード:適応型テスト,CAT,CBT,テスト開発,ニューラルテスト理論
▶ 一般研究論文  
大学入学者選抜における小論文試験と教科・科目試験との関連について
荒井清佳、石岡恒憲、宮埜壽夫
大学入試センター研究開発部
大学入学者選抜では,教科・科目試験だけでなく,多くの大学で小論文試験が行われる。しかし,小論文試験と教科・科目試験との関連を調べた研究はあまり見られない。そこで,本研究では,2課題の小論文試験と大学入試センター試験の主要8科目を同一被験者に実施し,それらの得点の関連性を分析した。その結果,小論文の課題間の相関は中程度しかなく,同じ科目間の相関と比べると大きいとは言えないことが分かった。また,小論文の得点とセンター試験の得点との相関はいずれも低く,国語や英語との相関係数が0.3程度であった。小論文の得点とセンター試験の得点を用いて因子分析を行った結果,小論文,文系科目,理系科目という3因子が得られ,小論文は,文系科目と近いものの,教科・科目試験とは異なる能力を測定していることが示された。大学入学者選抜においては,このような小論文試験の性質を把握した上で,小論文試験を用いる必要があることが示唆された。
キーワード:小論文,大学入試センター試験,教科試験,大学入学者選抜,因子分析
▶ 一般研究論文  
局所独立性を満たさないテストデータに対する段階反応モデルの適用―2PLMによる分析との比較検討―
泉 毅1、山野井真児2、山田剛史3、白川隆朋4、対馬英樹4
1東北大学大学院、2株式会社教育測定研究所、3岡山大学、4株式会社ベネッセコーポレーション
本研究では,局所独立性が満たされない実際のテストデータに対し,2パラメータ・ロジスティック・モデル(2PLM)と段階反応モデル(GRM)のそれぞれから得られる項目パラメタ・能力パラメタ・テスト情報曲線について比較検討を行なった。データの局所独立性については,Yen(1984)が提案したQ3を用いて検討した。2PLMの分析結果から,局所独立性を満たさない項目の識別力パラメタの推定が極端に高いものが得られ,そのことが能力パラメタの推定値やテスト情報量の値に影響を及ぼす可能性があることが示唆された。能力パラメタの推定値について,2PLM分析において同一の能力パラメタの推定値である受験者は,GRMにおいて±1程度の範囲で異なる能力パラメタの推定値を得る場合があることが示された。
キーワード:項目反応理論,局所独立性,局所依存性,段階反応モデル,Q3
▶ 事例研究論文  
異常時パフォーマンスが予測可能な多重選択反応検査の作成
楠神 健
東日本旅客鉄道株式会社
様々な安全対策の進展により,鉄道における要注意エラーは異常時にシフトしてきている.そこで,鉄道の運転関係従事員の異常時パフォーマンスの予測が可能な心理適性検査の作成を行った.3種の選択反応の系列(色,形,音)ごとにそれぞれ3種の刺激を用意し,被検者にはこの9種の刺激をランダムに提示し,対応するキーをできるだけはやく正確に押してもらう検査で,異常時を模擬するため,反応の遅延に対するフィードバックも提示するようにした(多重選択反応検査).まず基準関連妥当性を評価するため,184名の運転士を対象に,シミュレータ訓練の講師,職場の上司,および本人の評価による「当該運転士の素質面からみた異常時の強さ」と作成した検査の成績との相関を求め,異常時パフォーマンスの予測力を確認した.次に,鉄道の運転関係従事員704名に検査を実施し,検査の主要指標の基本統計,検査指標間の相関等をもとめ,上記の異常時パフォーマンスの予測力も踏まえて,検査としての有力指標を選定した.
キーワード:心理適性検査,異常時パフォーマンス,妥当性,鉄道事故,ヒューマンエラー
▶ 事例研究論文  
汎用的コンピュータ適応型テストシステムの開発
菊地賢一
東邦大学
コンピュータ適応型テストを実施するためには、テスト問題があったとしても、システム自体を開発する必要がある。そのため、教育や心理臨床の現場での導入が困難である。そこで、本研究では、このような現場で、小規模なコンピュータ適応型テストを容易に実施するための汎用的なシステムの開発を行った。 開発したシステムは、Microsoft Windowsのアプリケーションとして、ハードディスクやUSBメモリーにコピーするだけで、スタンドアローンで動作する。利用者は、問題文をMicrosoft Word文書ファイルや画像ファイルとして、項目情報をMicrosoft Excel文書ファイルとして用意することで、自ら設定し、汎用的に利用可能である。 従来、テストのコンテンツを持っている教育者や研究者が、コンピュータ適応型テストを実施することは困難であった。本システムにより、企業による大規模なものではなく、小規模なコンピュータ適応型テストを容易に実施することが可能となった。
キーワード:コンピュータ適応型テスト,コンピュータテスト,項目反応理論,項目反応モデル,段階反応モデル
▶ 事例研究論文  
大学入試センター試験への英語リスニングテストの導入に至る歴史的経緯とその評価
内田照久、大津起夫
独立行政法人 大学入試センター 研究開発部
大学入試センター試験に代表される大学入学共通テストは,受験者の処遇を左右するハイ・ステイクスな試験である。このセンター試験への英語リスニングテストの導入については,センター試験の前身である共通第一次学力試験の時代から,幾度となく検討が繰り返されてきた。本報告では,その四半世紀余りに及ぶ議論の経緯を整理すると共に,長きに亘ってリスニングテストの導入が見送られてきた背景,その一方,2003年に急転直下,リスニングテストの実施が発表された経緯を概括する。そして,現在行われているリスニングテストの課題を考えると共に,導入後の評価に関しても検討する。そして,大規模試験における望ましい変革のあり方を探る。
キーワード:大学入学共通テスト,共通第一次学力試験,大学入試センター試験,リスニングテスト
▶ 事例研究論文  
ミャンマーの中学生のための空間能力テストのDIF分析―民族及びジェンダーにおける比較検討―
ヌヌ カイ1、安永和央2,3、石井秀宗4
1サガイン教育大学、2日本学術振興会、3東京大学、4名古屋大学
本研究の目的は,ミャンマーの中学生のための空間能力テストについて特異項目機能(DIF)を検出することである.分析には,Lordカイ2乗法,ロジスティック回帰法,マンテル-ヘンツェル法を併用して,ジェンダー及び民族に関するDIFを検討した.その結果,民族,ジェンダーの双方において,40項目中11項目においてDIFが検出された.特に,民族ではBlock rotationで,ジェンダーではPaper Folding で多くのDIFが見られた.
キーワード:項目応答理論,特異項目機能,空間能力,民族,ジェンダー
▶ 展望論文  
英語学習者のリスニングテスト結果に影響を与える要因:包括的枠組み
柳川浩三
法政大学
本研究の目的は、英語リスニングテストに関わる文脈的要因 (contextual parameter, Weir, 2005) を包括的に提示することにあった。文脈的とは、言語的、社会的、状況的をも包含したという意味である。 先行研究から文脈的要因を抽出し、抽出された全ての要因をBachman & Palmer (1996, 2010)の4つのタスク特性-ルーブリック(rubric), インプット( input), 期待される応答(expected response), インプットと期待される応答との関係(relationship between input and expected response)-に仕分けした。 本研究で構築、提示された包括的枠組みは、英語学習者を対象としたリスニングテストの開発と妥当性検証に有効であろう。
キーワード:英語を外国語として学ぶ学習者、聴解、文脈的要因、テストの妥当性
▶ 展望論文  
大学入試センター試験における対応付けの必要性
倉元直樹
東北大学
わが国の大学入試におけるセンター試験の存在価値は言をまたない。しかし,その利用実態には問題がある。ア・ラ・カルト方式の下で技術的には保証されていない素点が利用されているからである。共通第1次学力試験が大学入試センター試験へと移行した時点で,試験の制度設計に根本的な転換があったと考えるべきであった。それにもかかわらず,その事実が見過ごされたために現在の問題状況が招来されたと考えられる。さらに事態は年々深刻化しているように見える。本研究ではパーセンタイル順位を用いて科目別得点分布の年度間のゆらぎを検証し,素点の持つ意味の曖昧さを示した。また,満点を取る受験者数から,科目別テストとしての性能の限界を示した。センター試験を用いて公平な入試を実現するには,大学入試センターと個別大学が協力し,科目別得点の共通尺度化を行う必要があるのではないだろうか。
キーワード:大学入試センター試験,共通第1次学力試験,対応付け,ア・ラ・カルト方式,公平性
▶ 展望論文  
論述式テストの運用における測定論的問題とその対処
宇佐美 慧
日本学術振興会・南カリフォルニア大学
思考力,文章力,表現力,独創性といったキーワードに代表される,受験者のもつ「高次の能力」を如何に適切に測定・評価するかについては,国内外で以前から高い注目を集めている問題である.日本でも,特に小論文試験に代表されるような,ある程度まとまった文章で回答させるテスト形式である論述式テストの普及が,入学試験や人事試験をはじめとして近年特に顕著である.その一方で,論述式テストは,測定の信頼性・妥当性・バイアスといった多くの測定論的問題を抱えるのが常であるが,この問題の概要について整理し,また論述式テストの運用の改善のための具体的な指針を得る試みは十分になされてこなかったと言える. そこで本論文では,特に近年の国内外の論述式評価研究を俯瞰しながら,論述式テストにおける測定論的問題の内容について整理していく.そして,項目作成・採点・フィードバック等のテストの各運用段階と,関連する各々の測定論的問題を対比して整理することを通して,実践上重要である検討事項や工夫すべき点を整理・展望し,テスト開発の実務家やそれを支援する立場にある教育測定・評価の専門家にとって参考となる知見を提供していく.
キーワード:論述式テスト,小論文試験,教育測定,教育評価,パフォーマンス評価
▶ 展望論文  
わが国の国家試験における試験問題公開の現状と傾向
若林昌子、杉光一成
知的財産教育協会
わが国の公的な大規模試験では,実施した試験問題を公開する実務は,「日本的テスト文化」の特徴の1つとして挙げられている.背景の1つには,総務省が勧告によって,国家試験の試験問題について一律に公開を要請していることあると考えられる.しかし試験問題公開の状況については,これまで,総務省等が国家試験について部分的に調査した報告があるのみで,網羅的には調査されていなかった. そこで本研究では,国家試験について,試験問題公開の状況を網羅的に調査し,基本設計に関わると考えられる試験の仕様との関係を比較した.その結果,必ずしもすべての試験が実施した試験問題を公開しているわけではなく,非公開にしている試験が複数あることがわかった.そして,試験問題を公開している試験群と非公開にしている試験群を比較すると,1) 年間実施回数,2) 合否基準公表の時期,3) 受験手数料について,反対の傾向があることが示唆された.
キーワード:国家試験, 試験問題, 公開, 日本的テスト文化, テスト・スタンダード