日本テスト学会誌 Vol.2 No.1 要旨

トップ>学会誌>既刊号一覧>既刊号(2-1)>要旨

日本テスト学会誌 Vol.2 No.1

▶ 一般研究論文  
International Comparisons of Mathematical Thinking Skills in the Timss-r
Kikumi Tatsuoka, Anabelle Guerrero, James E. Corter, Curtis Tatsuoka, Tomoko Yamada, Tao Xin, Enis Dogan, Michael Dean, Seongah Im
Department of Human Development Teachers College, Columbia University
The TIMSS studies have generated a large amount of research aimed at understanding differences among countries in mathematics and science teaching and curriculum. However, few studies have attempted to investigate differences among countries at the micro-level of student performance using a cognitive diagnostic approach. The present study applies the Rule Space Model to diagnose eighth graders' latent micro-level skills (termed "attributes") and knowledge states for twenty countries. Comparisons of the countries show that students in the six top-ranking countries produced good perfbrmance on the TIMSS mathematics test via distinct patterns on these latent achievement variables and knowledge states. Singapore, Korea, Belgium (Flemish), Czech Republic and The Netherlands had almost the same profiles in their learning progress. Japanese and Finnish students tended to learn mathematical thinking skills earlier than mastering content knowledge.On the other hand, Hong Kong students acquired solid content knowledge first and then stronger mathematical thinking skills.U.S. students achieved fairly well, and produced attribute profiles similar to students in Australia, Canada, England, and Russia. In general, countries located in the same geographic vicinity tended to have very similar profiles of learning paths. For example, Israel, Italy and Jordan are similar, as are Indonesia and the Philippines, and Finland, Russia and Netherlands performed similarly although students from The Netherlands had somewhat higher mean scores.
Keywords: mathematical thinking skills, mathematics problem-solving, TIMSS, international comparisons, cognitive diagnosis
▶ 一般研究論文  
個別音源方式による英語リスニングテストの予行実施調査
内田 照久、大津 起夫、椎名 久美子、林 篤裕、伊藤 圭、荘島 宏二郎、杉澤 武俊
大学入試センター研究開発部
平成18年度の大学入試センター試験から,新たに個別音源を用いた英語リスニングテストが導入される.その実施に向けて,これまで平成15-17年の間に,高校生を対象とした「プレ試行テスト」,「試行テスト」,大学1年生を対象とした「ポスト試行テスト」の計3回の予行実施調査が行われてきた.本報告では,平成17年1月21目に行われた「ポスト試行テスト」の実施結果にっいて整理した.ここでは筆記試験とICプレーヤーを使用したリスニングテストの成績の分析結果,及び航空機騒音に関わる簡易実験の結果についてまとめた.また,新しい方式の試験の導入に際し,基礎的研究と実用的研究の連携,社会的な認知を視野に入れたテスト研究の必要性を議論した.
キーワード:大学入試センター試験,リスニングテスト,ICプレーヤー,航空機騒音
▶ 一般研究論文  
Log-linear mode1を用いたDIFの分類
佐藤 洋之
東北大学大学院教育情報学教育部
本研究は,「日本語基礎能カテスト」(平他,1992;1993;1995;1998)のうち,高校生程度を測定対象とした漢字読み取りに関する項目の100項目を題材として,特異項目機能(DIF)の検出とその分類方法を検討した結果を報告する.比較を行なった検定方法は,Mante1-Haenszel法と,対数線形モデルによる方法の二っである.分析対象となる被験者デしタは,1991-1992年度調査,2003年度調査から抽出したデータを用いた. 比較を行なった結果,100項目中96項目で同等の検定結果を示し,対数線形モデルでの検定方法が,既存の方法とほぼ同じ結果を導くことが分かった.加えて,対数線形モデルによる方法は,交互作用項パラメタを参照することで,一つ一つの項日に関わる要因を詳細に見ることが出来ることから,項目ごとのDIFの有無について意味的解釈をする際に,より詳細な材料として用いることができるだろう.
キーワード:特異項目機能(DIF), Mante1・Haenszel統計量,対数線形モデル,漢字読み取りテスト
▶ 一般研究論文  
不完全データに基づく1PLモデルにおける困難度パラメータの推定
吉田 清隆1、渡辺 琢也2、岩崎 学1
1成蹊大学理工学部、2成蹊大学大学院工学研究科
テスト被験者にテスト結果を報告させることにより,1パラメータロジスティックモデルにおける困難度パラメータを推定することを考える.このような場合,被験者全員が結果を報告するとは限らず,一部の被験者の結果は得られないと考えるのが白然である.報告者の結果のみで解析を行うことは,推定値にバイアスが生じ,誤った結論を導く可能性がある.そこで,本論文ではまず,完全データと不完全データから困難度パラメータを推定し,それらを比較することによりバイアスが生じていること示す.そして,改善策として,多重代入法を適用した不完全データに基づく困難度パラメータの推定法を提案する.さらに,シミュレーションによって,提案された推定法がバイアス修正に有効であることを示す.
キーワード:困難度パラメータ,不完全データ,項目反応理論,多重代入法,1パラメータロジスティックモデル
▶ 一般研究論文  
自己組織化マップと完全情報最尤法から見た平成17年度センター試験の教科学力構造
荘島 宏二郎、大津 起夫、田栗 正章
独立行政法人大学入試センター
大学入試センター本研究では,2005年の大学入試センター試験データにおける教科学力構造を白己組織化マップ(SOM)を用いて探索的に分析した.その後,完全情報最尤法(FIML)を用いて,主要16科目の教科学力の平均・共分散・相関構造を計算した.分析の対象は,現役生・健常者・本試験受験者であった.SOMによって9つの学力層を取り出し,各層ごとに科目選択行動および得意科目が異なることが明らかになった.また,FIMLによる分析からは,教科学力構造の2因子性が示唆された.
キーワード:教科学九センター試験,自己組織化マップ,完全情報最尤法
▶ 一般研究論文  
Raschモデルによる漢字プレースメントテストの改良
坂野 永理1、坂井 美恵子2
1岡山大学、2大分大学
本稿では、項目応答理論の一つのモデルであるRaschモデルを使い、漢字のプレースメントテストの改良を行なった。被験者は日本の大学で学んでいる留学生で、改訂前のテストの被験者187名、改訂後のテストの被験者176名が多肢選択式の漢字プレースメントテストを受験した。Raschモデルによる分析の結果、改訂すべき点が見つかったため、これを基に1)適切でない項目の改訂又は削除、2)選択肢数の削減、3)同じ困難度パラメータを持つ項目の削除を行なった。2度に渡る改訂の結果、改訂後のテストは改訂前のテストに比べ、信頼性を落とすことなく、項目数及び選択肢数が減り、より効率的なテストとなった。また、受験者能力をより適切に測る項目が増え、質的な面でも改良が加えられた。
キーワード:Raschモデル,プレースメントテスト,漢字,項目応答理論,古典的テスト理論
▶ 一般研究論文  
状態認識の不確実性を考慮した実技評価システム
小方 博之1、山本 紗恵子2
1成蹊大学理工学部、2成蹊大学大学院二学研究科
筆者らは、実世界における作業動作をカメラなどのセンサで観察し、認識することによって、受験者のスキルを定量化する実技評価システムの開発に取り組んでいる。小方・五十嵐(2005)では、実際にシステムを構築することによって実技評価の白動化の可能性が示されたが、同時に作業の認識の不確実性への対処が重要な課題であることも明らかになった。本論文では、主に認識の不確実性を考慮したスキル定量化法の検討を行い、この間題への対処を行う。また、小方・五十嵐(2005)での課題であった作業の認識におけるロバスト性の向上についても合わせて論じる。
キーワード:実技試験、技能、作業認識、最近傍法、ベイズ推定
▶ 一般研究論文  
視覚的イメージ能力テスト作成の試み
深町 珠由1、中川 正宣2
1独立行政法人 労働政策研究・研修機構 労働大学校、2東京工業大学大学院 社会理工学研究所
近年増加しているインターネット上での購買行動など,事前に商品の全容を確認できない選択状況では,選択肢のイメージを正確に把握する能力が良い選択につながると予測される.本研究では,視覚的イメージ能力を客観的に測定するテストを開発し,信頼性と,実際の選択場面での妥当性を検討した.研究1では,様々な立体図形や平面図形から成る視覚的イメージ能力テスト(Ⅷ⑪を同一被験者に2回実施し,信頼性と因子構造の安定性を検討した上で,標準化を行った.研究2では,別の被験者群のデータを研究1の標準化得点で換算し,信頼性と3因子構造を検討した.研究3では,視覚的イメージ能力を要する一現実例として,仮想空間上の部屋立体図を想像しながら間取図を選択する課題を行い,3次元組合せ因子との高い相関を得て,構成概念妥当性の一証拠を得た.今後は,他因子の妥当性の検証や,現実課題と能力因子との詳細な関連を検討する必要がある.
キーワード:視覚的イメージ能九因子分析,テスト作成,信頼性,妥当性
▶ 一般研究論文  
ルールスペース法-テストの診断的利用に対する測定論的アプローチ-
龍岡 菊美1、倉元 直樹2
1コロンビア大学教育学部、2東北大学高等教育開発推進センター
認知科学と心理測定論の結合は非常に難しい課題の一つである。本稿ではテスト受験者の認知的過誤を診断するルールスペース法(RSM)を紹介する。 RSM開発のアイデアの基本は,統計的パターン認識,分類問題に由来する。生徒の反応パターンは内容領域の専門家によって仮説的に決定された知識ステートの一つに分類される。その仮説は項目×認知的スキルの照応行列Qによって表現される。ルールスペースはIRTのθと個人の適合度統計量ζなどのデカルト積であり,類似のパターンを近くに対応付けるように設計されている。ベイズ決定規則によって,個々の生徒の反応はより近いと考えられる知識ステートに分類される。被験者の分類が済むと,どのアトリビュートに補習が必要かといった診断が可能となる。RSMによる診断結果は様々な研究からその有用性が示されている。
キーワード:認知診断,照応行列,知識,知識ステート,ルールスペース法