要旨|既刊号（7-1）|既刊号一覧|学会誌|日本テスト学会

日本テスト学会誌　Vol.7 No.1　要旨

日本テスト学会誌　Vol.7 No.1

▶ 一般研究論文
非線形因子分析によるセンター試験英語問題の難易度比較
大津起夫、橋本貴充
独立行政法人大学入試センター、JST CREST
欠測に対応した非線形因子分析を，一部共通受験者のある大学入試センター試験モニター調査（大学1年生を被験者とする）のテスト得点に適用することにより，共通受験者についての情報が事実上利用できない異なる年度の試験問題の難易度の比較を試みた．ある年度の英語追試験問題をアンカーテストとして利用し，当該年度の本試験と翌年度の本試験との難易度を比較した．モニター調査被験者は，センター実受験者集団と比較すると，かなり高い成績の者から構成されるため，得点分布は実受験者とは大きく異なる．しかし，アンカーテストを用いることにより，実受験者における難易度の違いを良く予測することができた．ただし，非線形因子分析による推定の精度は，各項目の正誤情報を用いるIRTの2パラメータロジスティックモデルによる予測には及ばない．特に，分布の上限と下限部分において，推定の偏りが大きい傾向がみられる．
キーワード：非線形因子分析，リンキング，センター試験，リスニングテスト
▶ 一般研究論文
共通受験者デザインにおけるMean & Sigma法による等化係数推定値の補正
野口裕之¹、熊谷龍一²
¹名古屋大学、²東北大学
共通受験者デザインを適用してテストの等化を実施する場合に，等化係数の推定には，Mean & Sigma 法がよく用いられている．しかしながら，等化すべき2つのIRT尺度に含まれる項目数が異なっている場合などには，推定尺度値に含まれる誤差成分の大きさが尺度間で異なり，この影響でMean & Sigma 法では適切な等化係数の推定値が得られないことがある．本研究では，推定尺度値の分散に含まれる誤差成分の大きさを推定し取り除くという補正方法を提案した．この補正方法についてシミュレーション・データを用いて検討した結果，等化する尺度間で推定尺度値の誤差分散の大きさに違いがあるほど，また，尺度に含まれる項目の識別力パラメタが全体的に小さい値を示す場合ほど，顕著な効果のあることが示された．
キーワード：共通受験者デザイン，等化係数，Mean & Sigma法，補正
▶ 一般研究論文
全項目が開示されるテスト文化のもとでの得点分布の経年比較－全国テストと自治体テストのリンキング－
石井秀宗¹、安永和央^1,2
¹名古屋大学、²日本学術振興会特別研究員
本研究の目的は，1) 全項目が開示されるテスト文化のもとで得点分布の経年比較を行う方法を提案すること，2) その実現可能性を検討すること，そして，3) 実際のデータを用いて適用例を示すことである．第一については，全国テストと自治体テストを組み合わせたデータ収集デザインを組み，テスト理論におけるリンキングの手法を用いることにより，得点分布の経年比較を行う方法を示した．第二については，テストデータの利用可能性，地域の協同のあり方，受検者特定の不必要性などについて検討を行った．第三については，平成18年度と平成21年度の中学校3年生国語テストの得点分布の経年比較を行った．その結果，平成18年度と平成21年度とで，どちらのテストにおいても得点分布にあまり変化はないが，もし変化があるとすれば「知識」よりも「活用」においてであることが見出された．さらに，データ収集デザインを拡張し，テスト数，版数，地域数を増やした場合などについても言及した．
キーワード：リンキング，経年比較，テスト文化，全国テスト，自治体テスト
▶ 一般研究論文
クロンバックのαに代わる信頼性の推定法について－構造方程式モデリングに基づく方法・McDonaldのωの比較－
岡田謙介
専修大学人間科学部
テストの信頼性を推定するためにもっともよく知られた指標はクロンバックのαであるが，αは多くの現実的な場面において信頼性を過小推定することが先行研究により繰り返し指摘されている．信頼性の研究は近年再び盛り上がりを見せており，信頼性の推定法としてMcDonaldのω_h・ω_tを推奨する報告，および構造方程式モデリングに基づく方法を推奨する報告がそれぞれ複数ある．しかし，この両者の方法論を直接比較したシミュレーション研究は行われていない．そこで，本研究では真のモデル構造・係数の値・標本数・項目数を操作したシミュレーション実験を実施し，上述の有望と考えられている指標間の挙動の比較を行った．その結果，群因子数を3とした場合のω_h・ω_tは大きなバイアスを示した．タウ等価モデル・同属モデルによるSEMの推定と群因子数を1としたω_tはバイアスが小さく，これらの方法が推奨されると考えられる．また真のモデル構造が明らかな場合には，SEMを用いた推定がバイアスが小さく，推奨される．
キーワード：クロンバックのα，信頼性，McDonaldのω，構造方程式モデリング，シミュレーション
▶ 一般研究論文
テスト観とテスト接近-回避傾向が学習方略に及ぼす影響－有能感を調整変数として－
鈴木雅之
東京大学大学院教育学研究科・日本学術振興会
本研究では，一般的な定期テスト場面を想定した際の，「テストの実施目的・役割に対する学習者の認識」であるテスト観と学習方略との関連について検討を行った．また，これらの関係を評価する上で，テストへの動機づけの一側面として考えられる，テストを受けることに対して接近するか回避するかという2つの動機を媒介要因としたモデル構成を試みた．そして，質問紙調査によって大学生391名からデータを収集し解析を行った．その結果，「テストは学習の改善に活用するためのものであり，また学習のペースメーカーとなる」というテスト観を有する学習者ほど，テスト接近傾向の高さを媒介して，適応的な学習方略を用いることが示唆された．一方，「テストは学習を強制させるものだ」と認識している学習者は，テスト接近-回避傾向を介さず，学習方略に対して直接的に影響を与えていることが示唆された．さらに，上記の因子間の関係が，テストに対する有能感の高低によって影響を受ける可能性を検討するために，有能感を調整変数とした，平均構造のある多母集団同時解析を行った．その結果，変数間の関連については群間で大きな違いはみられなかったが，有能感の高い群は低い群と比較して，より肯定的なテスト観を示しており，またテストに対してより接近的な傾向を示していた．
キーワード：テスト観，テスト接近-回避傾向，学習方略，有能感，多母集団同時解析
▶ 一般研究論文
個別大学の追試験における得点調整方法に関する一提案－タッカーの線形等化法を用いて－
倉元直樹
東北大学
本研究では，大学の個別試験で追試験を実施する際の得点調整法を提案する．大学入試の得点調整はリンキングの一種だが，状況によって条件が異なる．追試験の場合，科目選択間の得点調整と比較して等化の条件に近い状況は満たされる半面，受験者は少数しか見込めない．また，成績処理に複雑なプロセスを加えると入試ミス発生の危険性が高くなり，望ましくない．本研究では係留テストを用いたタッカーの線形等化法を応用した得点調整の方法を提案した．本試験と追試験と係留テストの関係に二つの仮定を加えることで，安定しない追試験のパラメタを用いずに済み，追試験受験者に一定の調整得点を付加する単純な式となる利点がある．国立A大学の入試データを用いてブートストラップシミュレーションを行った．その結果．全体として調整誤差の平均値はほぼゼロに抑えられる半面，追試験受験者が少ないときは誤差の幅が大きくなった．合否入替りを用いた評価では，母集団の性質によって調整の成否が異なった．それでも，ある程度は公平性の確保に寄与することが期待される．
キーワード：得点調整，リンキング，追試験，公平性，大学入試
▶ 一般研究論文
下位テストから構成されるテスト間の等化におけるブートストラップ法を援用した等化の標準誤差の評価
佐藤喜一¹、柴山直²
¹新潟大学、²東北大学
単一グループデザインのもとで下位テストから構成されるテスト間を等化するとき，(a) 合計得点を利用して等化する方法と(b) 下位テスト間を等化してから等化得点を合計する方法が考えられる．本論文では，前者を「合計得点による等化」，後者を「下位テスト得点による等化」と呼ぶ．本研究の目的は，とくに等化の標準誤差の観点から両者の等化方法を比較することである．そのため，法科大学院統一適性試験の下位テストのうち多枝選択式の三つの下位テストに関する試験結果を利用してシミュレーション研究を実施した．その結果，両者の等化方法による等化得点に大きなちがいはないものの，等化の標準誤差については「下位テスト得点による等化」のほうが全般的に誤差が小さく，一定の誤差以下で等化が可能な得点の範囲が広いことがわかった．シミュレーションの範囲内では，「下位テスト得点による等化」のほうが等化の標準誤差の点で有利であると結論できる．
キーワード：下位テスト，等化の標準誤差，等パーセンタイル法，単一グループデザイン，ブートストラップ法，項目反応理論
▶ 事例研究論文
日本人英語学習者のための文法診断テストの妥当性の主張に向けて
小泉利恵¹、酒井英樹²、井戸聖宏³、太田洋⁴、羽山恵⁵、佐藤正俊⁶、根本章子⁷
¹常磐大学、²信州大学、³早稲田中学・高等学校、⁴駒沢女子大学、⁵獨協大学、⁶山梨県立市川高等学校、⁷茨城県龍ヶ崎市立愛宕中学校
本研究の目的は、妥当性と妥当性検証、特に「主張に基づいた妥当性アプローチ」(argument-based approach to validity) についての最近の動向をまとめ、そのアプローチを用いて英語文法診断テスト (EDiT Grammar) の解釈と使用についての妥当性の主張 (validity argument) を行うことである。EDiT Grammarは、英語の基本的な名詞句、特に名詞句の内部構造についての知識に焦点を当てたテストである。Chapelle, Enright, and Jamieson (2008a) の妥当性の枠組みにより解釈的主張 (interpretive argument) を明示した後、発話プロトコル分析とラッシュ分析を用いた2つの調査を行った。その結果、受験者のテスト受験中のプロセスがテスト細目からの予測と一致し、全てのテスト項目と受験者がラッシュモデルに適合した。2種類の肯定的な結果は「評価の推論」(evaluation inference) と「説明の推論」(explanation inference) を支持する証拠となり、妥当性の主張がなされた。
キーワード：妥当性，診断テスト，英語名詞句，発話プロトコル分析，ラッシュ分析
▶ 事例研究論文
共通項目デザインによる神奈川県高等学校「県下一斉英語学力テスト」の開発－項目応答理論を用いた等化によるテストの再評価と展望－
斉田智里¹、柳川浩三²
¹横浜国立大学、²神奈川県立小田原高等学校
神奈川県では高校生対象の英語学力テストが「県下一斉英語学力テスト」として実施されている。神奈川県高等学校教科教育研究会英語部会が，難易度の異なる4種類のテストを作成し，春と秋の年2回，年間8種類のテストを受検希望校に全県規模で一斉に実施している。2009年度春テストは73校43,546名が受検をした。近年の受検者減少傾向を受けて，英語部会では学力の伸びが共通尺度上で示せるようにと，抜本的なテスト改革を行うことにした。本研究では，2009年度春実施の4種類のテストを共通項目デザインで開発し，テスト実施後に項目応答理論を用いて共通尺度化を行った。異なるテスト間で比較可能となった項目パラメタ値とスコアを分析し，テストの再評価を行った。2008年度秋実施のテスト項目の一部を2009年度春テストに含めることで，2008年度秋と2009年度春の両方を受けた高校生の半年間の英語力の伸びも共通尺度上で示すことができた。大規模学力テストにおける共通尺度化の重要性と，教員作成の学力テスト改善の方向性について論じた。
キーワード：神奈川県県下一斉学力テスト，項目応答理論，共通項目デザイン，テスト開発，尺度の等化

日本テスト学会誌 Vol.7 No.1 要旨

日本テスト学会誌 Vol.7 No.1

日本テスト学会誌　Vol.7 No.1　要旨

日本テスト学会誌　Vol.7 No.1