日本テスト学会誌 Vol.6 No.1 要旨

トップ>学会誌>既刊号一覧>既刊号(6-1)>要旨

日本テスト学会誌 Vol.6 No.1

▶ 一般研究論文  
異なる変数変換の性能比較-信頼性係数の固定効果メタ分析モデルにおいて-
宮崎康夫1、杉澤武俊2、エドワード ウルフ3
1ヴァージニア工科大学、2新潟大学、3ピアソン
信頼性係数のメタ分析である信頼性一般化研究(Reliability generalization study)は、多くの研究で報告された同じテストの信頼性係数をまとめるのに有用な方法である。信頼性一般化研究により、信頼性係数の平均値とばらつきの度合い等を割り出し、またばらつきが顕著な場合には、そのばらつきを説明する研究の特徴等を吟味することが可能になるため、この手法は近年頻繁に利用されるようになってきた。メタ分析においてはそのモデルに適した標準効果量を定めることが必要とされるが、信頼性一般化研究においてはその手法が比較的新しいものであるため、今日のところ、どういった変換が信頼性係数をメタ分析するのに最も適しているかについての研究はほとんどない。そこで、本研究では、メタ分析の基本的モデルのひとつである固定効果メタ分析モデルにおいて、無変換を含めた各種の変換の性能を、母数値の回復の程度と正規性の仮定の妥当性の程度を観点として、モンテカルロ法により比較した。結果は、いずれの条件においても、理論的な標本分布に基づく対数変換が最もよい成績を示し、また、無変換の信頼性係数は、常に最も悪い成績を示した。この結果は、信頼性係数を固定効果のメタ分析にかける際に、有用な知見をあたえるものである。
キーワード:信頼性一般化研究,メタ分析,標準効果量,変数変換,モンテカルロ法
▶ 一般研究論文  
局所独立性の仮定が満たされない場合の潜在特性推定への影響
登藤直弥
東京大学大学院教育学研究科
本研究では、局所独立性の仮定が満たされない場合の潜在特性推定への影響について調べるため、項目間の依存関係を許容する2 つのモデル、Two-Parameter Logistic Interaction Model(2PLIM)とTwo-Parameter Logistic Copula Model(2PLCM)を取り上げてシミュレーションを行った。その結果、局所独立性が満たされない項目を含むテストに対して局所独立性を仮定して分析を行った場合には、潜在特性推定量のバイアスの平均値や標準誤差の平均値が増加する、推定値と潜在特性の真値との相関係数の平均が減少する、あるいは、推定値と真値との関係が異なるなどの影響が見られた。さらに、局所独立性が満たされない場合の潜在特性推定に対して、受験者数や項目数といった要因が影響を与えていた。
キーワード:項目反応理論,局所依存,潜在特性
▶ 一般研究論文  
日本における「テストの専門家」を巡る人材養成状況の量的把握
木村拓也
長崎大学
日本における「テストの専門家」養成問題は,日本人の読み書き能力調査や進学適性検査でOJT の形で養成されて以降,テスト政策が舵を切られるたびに,幾度もその重要性が叫ばれ,教育の質保証という文脈の中で,テストの品質を担保できる「テストの専門家」が今後ますます必要とされてくるという意味において,古くて新しい問題と言える.「テストの専門家」は,就職後や修士課程からテスト分野に参入し,学部時代には文系を学問基盤とする者が多く,独学や就職後研修で専門知識を獲得する者も多い.彼らにテスト関係の専門知識を教授しているのは,主に,「教育」分野を専攻とし,「大学等の研究機関」に籍を置く人々である.だが,この層は戦後一貫して減少傾向にあった.その理由の1 つとして,戦後直後の教員養成カリキュラムに「教育測定・統計」科目が位置づけられいたにも関わらず,その後,中教審や臨教審の各答申の中で,「教育心理学」が,カウンセリングや生徒指導といった児童理解ツールに定義が矮小化されていく中で,教員養成カリキュラムの中から「教育測定・統計」科目が自然消滅したことが挙げられる.
キーワード:テストの専門家,専門職養成,量的把握,教育職員免許法
▶ 一般研究論文  
単一グループデザインでのリンキングにおけるシミュレーションモデルの構築と誤差評価の具体例
佐藤喜一1、柴山 直2
1新潟大学、2東北大学
本論文では,リンキングの際の誤差評価に資するため,単一グループデザインのもとでのリンキングをシミュレート可能なモデルを構築する.構築したモデルを用いると,等化・対応づけ・関連づけの状況をシミュレートすることができる.さらに,構築したシミュレーションモデルに基づき,ブートストラップ法を援用してリンキングにおける誤差評価の具体例を示す.具体例として,2008 年実施の法科大学院統一適性試験を2007 年実施の同試験にリンキングする状況を想定する.シミュレーションの結果,双峰分布のような形状のリンキング誤差曲線が得られた.また,配点状況や得点の四捨五入の状況によっては誤差曲線が波打つことも明らかになった.合理的なシミュレーション結果から,構築したモデルはリンキングにおける誤差評価に有用であると結論した.
キーワード:リンキングの標準誤差,シミュレーションモデル,等パーセンタイル等化法,ブートストラップ法,項目反応理論
▶ 一般研究論文  
小標本における選抜効果を補正する相関係数の推定について―最尤推定法とベイズ推定法のシミュレーションによる比較―
岡田謙介1、繁桝算男2
1専修大学、 2帝京大学
入試得点と入学後の成績との間で相関を計算すると,予想したよりも小さい値が算出されることが多い.これは入学しなかった標本において後者が欠測となるために生じる現象であり,選抜効果と呼ばれる.選抜効果の影響を除いて真の相関係数を推定する方法には最尤推定法とベイズ推定法が提案されているが,その小標本における挙動はこれまで十分検討されていない.そこで本研究では,小標本下において真の標本数・真の相関係数・欠測標本の割合を操作し,両手法を比較する数値実験を行った.結果の概要は以下の3 点である. (1) 標本数が十分大きければ,どちらの手法を用いても適切な推定ができた (2) 推定値の期待値が真値に近いかどうかという観点からは,ベイズ推定がより推奨される傾向にあった (3) 推定値と真値の二乗誤差の観点からは,最尤推定がより推奨される傾向にあった.本研究で用いた推定のためのR コードはAppendix に掲載されている.
キーワード:選抜効果,相関係数,最尤推定,ベイズ推定,小標本
▶ 事例研究論文  
学校での多様な取組と年間授業時数を考慮した小学校の英語活動におけるテストデータの一分析
萩原康仁
国立教育政策研究所
本研究では,全国的に実施された小学生を対象とした英語の聞き取りに関するテストのデータを分析した.実施時期は平成19 年であり,外国語活動が小学校の新学習指導要領の中で新たに別立ての章で扱われる以前であった.このため,本テストは小学校において外国語活動が必修化される前に実施されたものであった.分析の際には,各学校での英語活動の取組に違いがあることを踏まえて,項目困難度に関する母数について学校レベルでの散らばりを仮定した項目反応モデルを当てはめた.さらに,各学校の年間授業時数をダミー変数化して予測変数としてモデルに組み込んだ.他のモデルと比較した結果,児童の特性値について学校レベルと学校内の児童レベルに分解し,項目の閾値について学校レベルでの残差分散を仮定したマルチレベルの項目反応モデルが相対的にデータとの当てはまりがよかった.年間授業時数との関連については,年間30~35 単位時間を本研究では基準としたが,それよりも少ない時数の学校はモデルで表された児童の学校レベルでの特性値は95%信用区間で低いことが示された.一方で,それよりも多い時数の学校は基準とされた時数の学校に比べて特性値の事後平均は高いものの,95%信用区間で違いがあるとは示されなかった.
キーワード:項目反応理論,マルチレベルモデル,学習指導要領,聞き取り,小学生
▶ 事例研究論文  
図の提示法が能力評価に及ぼす影響に関する一考察-中学国語読解テストを用いて-
安永和央、石井秀宗
名古屋大学大学院教育発達科学研究科
受験者の回答に影響を与えるものとして,設問などテストの構造的性質のもつ影響力は非常に大きい.十分な信頼性や妥当性を備えた設問でなければ,そこから得られたデータに歪みが入ってしまい,適正に能力を評価することができないからである.研究1 では,日本と韓国の中学生に実施された群馬県児童生徒学力診断テストの国語読解テストに関して,項目分析の結果から正答率及び識別力の低い設問の検討を行った.研究2 では,設問設定を変えた4 種類のテスト冊子を用いて,図の提示法が能力評価にどのような影響を与えるかを検討した.その結果,図の空所に相対する2つの単語を記述する設問では,本文に書かれている単語の順序どおりに空所を配置することが,正答率及び識別力に最も影響を与えることが示唆された.
キーワード:国語読解テスト,項目分析,難易度,識別力,図の提示法
▶ 事例研究論文  
大学入試センター試験のリスニングテストが測定する学力の布置
内田照久1、杉澤武俊2、伊藤 圭1
1大学入試センター 研究開発部、2新潟大学 教育学部
本研究では,新しく大学入試センター試験に導入された英語のリスニングテストの独自性や妥当性,社会的な波及効果を検討した。まず,センター試験の他の教科とリスニングの関係を調べた。各教科を総合的な受験学力に相当する軸と,文・理系の性質を示す軸からなる平面上に射影した。リスニングは,英語筆記試験とは布置が異なり,より文系的で国語の位置に近いことが見出された。また,妥当性の検討も紹介された。筆記試験とリスニングの相互相関は高いが,主観評価に基づく聴解行動の熟達度に対しては相関に差が見られた。リスニングは聴解行動との間に高い相関があり,構成概念としての妥当性が評価された。リスニングテストの導入は,中学・高校の英語の聞き取りへの積極的な取り組みを喚起し,文法,語彙,論理の必要性の認識を促すなど,正の波及効果が指摘された。
キーワード:大学入試センター試験,リスニングテスト,学力構造,妥当性,テストの波及効果
▶ 事例研究論文  
学科試験および科目得意度との比較による総合試験の妥当性の検証
伊藤 圭1、林 篤裕2、椎名久美子1、田栗正章1、小牧研一郎1、柳井晴夫3
1大学入試センター、2九州大学、3聖路加看護大学
近年,大学入試の多様化に伴い,問題解決力や課題遂行力,または志望学部・学科への適性などを総合的に評価する総合試験の有用性について検討が進められている.教科科目に依存した学科試験が主に学習到達度を測定することを意図しているのに対して,総合試験は論理的な思考力や読解力,表現力などを測定することを意図している.本研究では,大学生を対象に行ったモニター調査データに基づき,教科科目フリー型総合試験と学科試験の成績および高校時の履修科目の得意度との関係を調べることにより,教科科目フリー型総合試験の妥当性を検証した.その結果,総合型学力と教科科目型学力を分ける因子の存在,およびその因子と問題解決力や課題遂行力の基礎となる情報理解力,論理的思考力,表現力との関連性が確認された.これらの結果には高い再現性が見られ,教科科目フリー型総合試験の妥当性を示すものと考えられる.
キーワード:総合試験,適性試験,論理的思考力,読解力,表現力,妥当性,因子分析