日本テスト学会誌 Vol.3 No.1 要旨
日本テスト学会誌 Vol.3 No.1
▶ 一般研究論文 | |
---|---|
多肢選択式リスニングテストの問題文と選択肢の提示時期が項目困難度と項目識別力に与える影響 | |
柳川 浩三 | |
本研究の目的は、多肢選択式英語リスニングテストの問題文と選択肢の提示時期が項目困難度と項目識別力に与える影響を検証することである。目的を達成ずるため、印刷された問題文と選択肢の提示時期のみが異なる3種類のリスニングテストを作成した。3種類とは、本文を放送する前に受験者に(1)問題文と選択肢の両方を提示する形式,(2)選択肢のみを提示する形式、(3)問題文のみを提示する形式である。 実験の結果、印刷された問題文と選択肢の提示時期は項目困難度に影響を与えることが示された。具体的には、形式(2)の平均点が形式(1)および(3)よりも有意に低くなった。これは、形式(2)の9項目の困難度が形式(1)および(3)のそれよりも有意に高くなったからだと考えられる。また、用意した3形式によって項目識別力に有意な差はなかった。 |
|
キーワード:リスニング理解、多肢選択式問題、項目困難度、項目識別力、問題文と選択肢の事前提示 | |
▶ 一般研究論文 | |
非線形ロジットIRTモデルによる尺度選択の試み-EI尺度における適用- | |
川端 一光1、豊田 秀樹1、櫻井 満優美2、佐々木 研一2、横井 真人2、渡辺 徹2、目高 美英子2 | |
1早稲田大学、2(株)EIリサーチ | |
項目プールを用意しないで,利用目的に合わせた尺度選択を可能にする方法を提案する.ロジットに能力母数の二乗の項を加算したモデル,能力母数に対して対数変換を施したモデルを,事前に構成したビジネスマナーに関するEI(Emotional Intelligent)尺度(全14項目)に適用した.結果として識別力において異なるが,外的基準と高い相関をもつ2つの尺度を構成することができた.特に能力母数の二乗の項を加算したモデルでは,通常の名義反応モデルよりも高特性者を良く識別することができることが明らかになった.高特性者を選抜するというEI尺度の実践的な利用に際して,前者の尺度を選択することが好ましい. | |
キーワード:名義反応モデル,多項ロジットモデル,非線形ロジット,MCMC | |
▶ 一般研究論文 | |
エントロピー最小化基準による適応型テスト-テスト情報関数の問題点- | |
岡本 安晴 | |
日本女子大学 | |
まず、適応型テストにおけるテスト情報関数の問題点をシミュレーションによって示した。適応型テストにおいては、データが独立に同じ確率分布に従う(iid)という仮定が成り立たない。また、データ量もテストの開始時では情報関数でパラメタ推定値の分布が推測できるだけ十分に多いというわけでもない。これらのため、テスト情報関数によるパラメタ推定値の標準偏差の推測が、真の標準偏差とかなり異なるものとなりうることがシミュレーションによって示された。情報関数を用いない適応型テストとして、エントロピー最小化基準による方法が提案された。エントロピー最小化基準は、精神物理学的測定においてKontsevich and Tyler(1999)によって用いられており、その方法はΨ法と呼ばれている。このΨ法を適応型テストに適用した場合を、シミュレーションによって調へた。事前分布として正規分布を用いた場合は推定値に保守的バイアスがかかるが、一様分布を事前分布とした場合は情報関数を用いるものと同じ性能であることが確認された。エントロピー最小化基準による方法の検討をさらに進めることの意義が述べられるとともに、多次元因子モデルにも適用可能であることが指摘された。 | |
キーワード:適応型テスト、情報関数、iid、エントロピー、事後確率分布 | |
▶ 一般研究論文 | |
人間の動作データを用いたスキルの自動評価 | |
小方博之1、河合岳2、山本紗恵子3 | |
1成蹊大学理工学部、2元成蹊大学大学院工学研究科(現本田技研)、3成蹊大学大学院工学研究科 | |
本論文では、もの作りやスポーツのように連続的な動作を伴う実技課題において、受験者のスキルを自動評価する方法について検討する。具体的には、モーションキャプチャ装置で取得した受験者の動作データを用いて評価を行う。一般に、受験者の動作はスキルレベルが同一でも同じにはならず、体の大きさや筋力、肉付きなどによって差が出る。同一受験者が複数回実技を行った場合の動作にも差が生じる。また、受験者が同じ姿勢をとる時点もデータによって異なる。このような特徴を有する動作データを扱うために、本研究では時点を一意に特定できるいくつかの姿勢をデータから抽出して多変量データとしたものを利用し、そこから分類問題に帰着させることでスキルレベルを推定した。ゴルフのパタースイングを例題として本手法の有効性を確認した。あらかじめスキルレベルの判っている30名の受験者から556データを取得し、leave-one-out法でスキルの評価を行ったところ、実際のスキルに近い値が得られ、本手法の有効性を確認できた。 | |
キーワード:実技試験、スキル評価、動作データ、モーションキャプチャ装置、パタースイング | |
▶ 一般研究論文 | |
記述式問題における無回答に関連する要因の検討-群馬県児童生徒学力診断テスト小学校6年生国語テストデータ分析の結果から- | |
石井 秀宗 | |
東京大学大学院教育学研究科 | |
OECD(経済協力開発機構)が実施している学習到達度調査(PISA調査)などの結果から,日本の児童生徒は記述式問題で無回答となる割合が高いことが指摘されている.本研究では,群馬県児童生徒学力診断テストで収集されたデータを用いて,小学校6年生の国語のテストにおける記述式問題に関して,無回答と関連する要因の検討を行った.その結果,課題文に即して回答を記述する設問よりも,課題文から離れて白分の答えを記述する設問において無回答率が高いことや,意見発表や説明文の読み取り,作文,文法学習を楽しいと思う児童のほうが,そうでない児童よりも,記述式問題に対する無回答数が少ない傾向にあることが観察された.さらに,学校の授業が分かる程度が半々以下という児童において,記述式問題に対する無回答数が多いことなどが見出された. | |
キーワード:記述式問題,無回答,学力テスト,児童生徒 | |
▶ 一般研究論文 | |
児童・生徒用ソーシャルスキル尺度の開発 | |
杉村 仁和子、石井 秀宗、張 一平、渡部 洋 | |
東京大学大学院教育学研究科 | |
現在、わが国ではいくつかのソーシャルスキル尺度が開発されているが、小学生、中学生を対象とした尺度では、臨床的介入の必要性を判断する目的の尺度が多く、一般的なソーシャルスキルの測定に使われる尺度は少ない。本研究では、一般的な児童、生徒のソーシャルスキルを包括的に測定し、文化的、発達段階的な観点から考えて日本の小学生高学年から中学生に適切な尺度となるよう、児童・生徒用ソーシャルスキル尺度(SSI-M)を開発することを目的とした。中学生約五百五十名を対象に調査を実施したところ、グループ主軸法により、1)教師に対する意思表示、2)関係開始、3)会話、4)感情の統制、5)集団活動、6)友人に対する意思表示、7)関係維持、8)基本的なマナー、の8っの下位尺度が確認された。また内的一貫性、安定性、および妥当性も確認された。 | |
キーワード:ソーシャルスキル、尺度、児童・生徒、信頼性、妥当性 | |
▶ 一般研究論文 | |
大規模英語学力テストにおける年度間・年度内比較-大学受験生の英語学力の推移- | |
熊谷龍一1、山ロ大輔2、小林万里子2、別府正彦2、脇田貴文3、野口裕之3 | |
1新潟大学、2学校法入河合塾、3名古屋大学 | |
本研究では,年間複数回実施されている大規模英語学力テスト(学校法人河合塾主催)について,垂直および水平等化を行った.対象となったのは1995年から2005年の5月,8月,12月に実施された33のテストセットである.等化方法として,アンカーテストを利用した共通受験者デザインを適用した. 等化の結果,テスト受験者集団の特性尺度値について5月から12月の7ヶ月間における上昇傾向が確認された.同様に各テスト実施時期における経年比較も可能となった.また先行研究との比較から,特性尺度値の変動傾向の一致および,変動量の不一致が確認された. | |
キーワード:等化,英語学力テスト,項目反応理論 | |
▶ 一般研究論文 | |
新潟大学における「共通英語」の成績とTOEICおよび大学入試センター試験との関係 | |
熊谷 龍一、五島 譲司、中畝 菜穂子、柴山 直 | |
新潟大学 | |
新潟大学では2005年度より新しい英語教育カリキュラムを導入し,1年生を対象に全学的にTOEIC IPテストを実施した.本稿では,TOEIC IPの結果,センター試験ならびに「共通英語」の成績との関連を検討した.7OEICの成績とセンター試験,共通英語の成績の関連については,TOEICの合計点とセンター試験の得点間に62の相関,共通英語とTOEICの合計点間に.32の相関があったが,共通英語とTOEICの各技能(或いは合計点)との相関は,教員や習熟度別クラスによりばらつきがみられた.またセンター試験を独立変数,TOEIC合計得点を従属変数とした回帰分析では,教員別で.85,クラス別で.81の決定係数が得られた.教員の特性や学生の習熟度などに関して,特徴的なクラスをピックアップするための資料としてこれらの結果を利用できることが示された. | |
キーワード:共通英語,TOEIC,大学入試センター試験,英語教育 | |
▶ 一般研究論文 | |
法科大学院統一適性試験:4年間の実施経過と今後の課題 | |
前田 忠彦1、野ロ 裕之2、柴山 直3、藤本 亮4、藤田 政博5、佐藤 喜一6 | |
1統計数理研究所、2名古屋大学、3新潟大学、4静岡大学、5政策研究大学院大学、6宮城高等工業専門学校 | |
2003年に開始された「法科大学院統一適性試験」は毎年1回,2006年までに計4回が実施された。この試験は論理的判断九分析的判断力,長文読解力を測定する3つの客観式セクション(第1部~第3部)と,表現力を測定するエッセイ形式の第4部から構成されている。本論文では4年分の実施データに基づき客観式の3セクションについて,主に古典的テスト理論の立場から,内的一貫性の評価や,他の試験との相関関係の分析を通した構成概念妥当性を検討し,信頼性のより詳細な評価のための項目分析の結果を要約したその検討によると,アルファ係数で評価した試験の信頼性は0.7の後半程度で安定しており,また外部の2種類の試験との相関係数も,セクションごとの相関のパターンも含めて安定的であった。また外部試験の相関からは本試験の構成概念妥当性を支持する結果が得られた。 このような検討を通じて,本試験の計量心理的な特性が安定的であることが示されたが,今後,試験の予測的妥当性や内容的妥当性の検討が重要であることを論じた。 |
|
キーワード:法科大学院統一適性試験,古典的テスト理論,構成概念妥当性,内的一貫性 | |
▶ 一般研究論文 | |
大学入試センター法科大学院適性試験の設計及び安定性に関する実証的検討 | |
椎名 久美子、杉澤 武俊、櫻井 捷海 | |
独立行政法人大学入試センター | |
法科大学院の選抜資料として広く用いられている大学入試センター法科大学院適性試験について設計の概要を述べると共に,尺度としての安定性や妥当性に関する実証的検討を行った.適性試験総合得点の平均や分布形状,設問難易度の構成は年度間で同様の傾向を示している.各年度の試験では高い信頼性係数と下位テスト間のゆるやかな正の相関が得られており,高い信頼性と多様な分野からの出題の両立をめざして設間数や問題の類型を制御することに成功している.適性試験と個別法科大学院課される法律科目の得点がある程度の正の相関を示すことから,外部基準からみた敵性試験の妥当性が示唆された.また,各法科大学院入学者の適性試験総合得点の平均値から新司法試験の最終合格率を予測するモデルをたてたところ,モデル式から予測される最終合格率は実測値とある程度類似したふるまいを示したことから,適性試験の予測妥当性についても確保されていると考えられる. | |
キーワード:法科大学院適性試験,安定性,信頼性,妥当性 | |
▶ 一般研究論文 | |
階層線形モデル(HLM)の教育研究への応用と分析結果の教育政策への利用の観点 | |
宮崎 康夫 | |
ヴァージニア工科大学 | |
階層線形モデル(HLM)は、入れ子構造をもっている教育・発達研究データに対して、最も頻繁に使われる統計分析手法のひとつであり、それを大規模教育調査データの分析に対して用いることにより、これまでの方法では得られない有益な情報を与えることが知られている。しかしながら、残念なことに、わが国においてはこの手法はまだあまり知られておらず、応用研究もあまりないのが現状である。そこで、本論文には、2つの目的がある。一つは、階層線形モデルをその研究に利用しようと考える研究者に対して、米国全国教育縦断研究(NELS)のデータを使って組織研究と成長モデルでの分析例を示すことにより、その手法を紹介し、その考え方に精通し、実際に自分の研究に役立ててもらうこと、もう一つは、分析結果をどう教育政策の立案に利用するかについて研究デザインの統計学的見地からみたいくつかの観点を提供することにある。 | |
キーワード:階層線形モデル,入れ子構造を持つデータ,組織研究,成長モデル,大規模教育研究データ | |
▶ 一般研究論文 | |
日本の大学入試をめぐる社会心理学的公正研究の試み-「AO入試」に関する分析- | |
西郡 大1、倉元 直樹2 | |
1東北大学大学院教育情報学教育部、2東北大学高等教育開発推進センター | |
我が国の大学入試は「ハイステークス」な選抜であると考えられてきたため,その公平性への関心は高い。しかし,一言に公平性と言っても,実はその概念は一様ではない。本研究では,個人や立場の違いによって公平性の捉え方が異なることを前提に,受験当事者の主観的な公正知覚について社会心理学的視点より探索的に分析した。その結果,大学入試の文脈における公平性概念の構造について,分配的公正における分配原理や手続き的公正における基準などから整理できる可能性を見出した。中でも,現実的な大学入試の文脈において,誰もが納得する公平性を担保することが不可能だという事実は重要である。この視点からは,如何に個人の公正感を高めていくかという議論の必要性が示唆される。また,その手段として,個人の公正感に関する社会心理学的研究から得られる知見の有用性が示された。 | |
キーワード:大学入試,公平性,社会心理学,分配的公正,手続き的公正 | |
▶ 一般研究論文 | |
自己組織化マップによる平成18年度大学入試センター試験の教科学力構造 | |
荘島 宏二郎 | |
独立行政法人大学入試センター | |
本研究では,平成18(2006)年度の大学入試センター試験データを分析した.分析対象は,389,235人の健常な現役生であった.まず,34科目の基礎統計量と科目選択パタンを示した.続いて,完全情報最尤法を用いて主要19科目の平均・共分散・相関構造を同定した.また,教科学力構造を自己組織化マップ(SOM)を用いて探索的に分析した.SOMによって8つのクラスタ(層)が抽出された.また,性差について検討した. | |
キーワード:教科学九大学入試センター試験,自己組織化マップ,完全情報最尤法 |