一般研究発表要旨一覧

発表題目(1): 確認的因子分析による360度サーベイの特徴の把握ーー自己評定と上司・同僚・部下による他者評定の測定等価性の検証 (受付日:2006-06-08)

○前田純子・入江崇介 / リクルートマネジメントソリューションズ

発表要旨:育成を目的とした360度サーベイでは,フィードバックの場面で自己評定と上司・同僚・部下などからの他者評定の結果を比較するプロセスが重視されている.しかしながら,一般に自己評定と他者評定の測定の等価性についての検証が不十分な中で行われていることが多い.そこで本研究では,この自己評定と他者評定の等価性についてVandenberg & Lance(2000)に提案されている確認的因子分析の方法をもとにした検証を行い,その結果に基づいて360度サーベイを有効に活用するための留意点の考察を試みる.

キーワード:360度サーベイ,自己評定,他者評定,測定等価性,確認的因子分析

発表題目(2): 汎用的コンピュータ適応型テスティングシステムの開発と労働者のストレス測定への応用 (受付日:2006-06-09)

○菊地賢一・岩田昇・藤原裕弥 / 東邦大学・広島国際大学・東亜大学

発表要旨:コンピュータによるテストの利点には、受験者の回答過程から逐次的に出題する問題を選択していく適応型テストが容易に行えることや、結果を即時に提示することができる点がある。また、実用化に向けた大きな問題点としては、繰り返しの実施による試験問題の漏洩がある。 しかし、いわゆるテストとしてではなく、測定された特性値を診断目的などに利用する場合には、この点は問題にはならない。そこで、従来より開発を行っている汎用的コンピュータ適応型テスティングシステムを労働者のストレスの測定に応用し、その結果を紹介する。

キーワード:コンピュータ適応型テスティング,ストレス測定,段階反応モデル

発表題目(3): Minimum Entropy基準によるCATーーテスト情報関数の問題点 (受付日:2006-06-12)

○岡本安晴 / 日本女子大学 人間社会学部 心理学科

発表要旨:Computerized Adaptive Testing (CAT)において,能力パラメタの推定値の分散をテスト情報関数(フィッシャー情報量)によって行うと,実際の分散の変化とは逆の傾向を示すことがあることを報告する.この原因は,最尤法における漸近定理がiidとサンプルが十分に多いことを前提としているが,テストの実施においてはこれらの条件が満たされないことによると思われる.テスト情報関数に代わる方法が必要であるが,ベイズ的方法に基づくminimum entropy 基準による方法をCATに適用し,そのシミュレーション例を報告する.

キーワード:

発表題目(4): 英作文評価表における信頼性の測定--多変量一般化可能性理論を用いて (受付日:2006-06-14)

○大久保奈緒 / 津田塾大学大学院

発表要旨:本発表では英作文評価表の作成とその信頼性について検討する.この評価表は,内容,構成,語彙,言語使用 から成立し, 各観点に,3から4の下位項目が設置されている.3人の英語母語話者 が,41人の大学生が書いた英作文を,この評価表を用いて評定した.多変量一般化可能性理論を用いた分析では,多変量一般化可能性係数が,.81 と信頼度の高い結果となった.しかし,語彙と言語使用の多変量一般化可能性係数が.31,.39と,内容(.69) 構成(.71)に比べ信頼度の低い結果となり,前者2観点については改善が示唆された.

キーワード:英作文評価表,信頼性の測定,多変量一般化可能性理論

発表題目(5): Flashを用いた大規模一斉オンラインテストの開発と英語プレースメントテスト「PLATON」への適用 (受付日:2006-06-16)

○秋山 實・井川悦朗・白戸治久 / 合資会社eラーニングサービス・NPO英語運用能力評価協会・NPO英語運用能力評価協会

発表要旨:プレースメントテスト等では,1)受験者数は千人規模になる,2)一斉に実施する必要がある,3)確実に実施する必要がある,4)全員同じ状態で表示・再生できなければならない,5)音声,映像,アニメーションの制御が可能である等の条件を満たす必要がある.筆者らは,上記の2)から5)の条件を完全にクリアする新しい方式を考案・実装した.試用した結果,a)テスト中の機器のトラブルに対しても,再開が容易である,b)受験者の誤操作に対してロバストであること,c)今まで実現できなかった語順整列問題などが使用できる,など満足な結果が得られた.また,条件の1)については,テストセンターでの利用を考慮し10,000人同時受験可能な設計としたバージョンを設計した.

キーワード:

発表題目(6): 算数科テストの項目困難度 (受付日:2006-06-17)

○松宮 功 / 京都府 乙訓教育局

発表要旨:卒業前の小学校6年児童を対象として行った算数科テスト形式の調査データから,項目反応理論に基づいて項目困難度を推定した.その推定値を指標として,小学校算数の指導内容による難易を検討した結果を報告する.小学校学習指導要領に示された4領域のうち,「数と計算」の指導内容に含まれる項目が主な検討対象である.

キーワード:

発表題目(7): 全情報擬最尤法による平成17年度大学入試センター試験の因子構造 (受付日:2006-06-19)

○荘島宏二郎・大津起夫・田栗正章・柳井晴夫 / 大学入試センター

発表要旨:2005年のセンター試験主要科目について探索的因子分析・確認的因子分析・階層的因子分析について,また,性別による多母集団解析を行った.

キーワード:

発表題目(8): FSにおけるEQ(EI)テストの性質について (受付日:2006-06-19)

○櫻井満優美・佐々木研一・横井真人・渡辺徹・豊田秀樹 / EIリサーチ株式会社

発表要旨:飲食業界ではアルバイトの雇用が不可欠である.そこで効率良く人材を確保する為の技能検査を作成し,項目反応理論を用いた項目分析により信頼性を検討した.当社が着目する概念”EI”は,直接お客様に接する仕事の人にとってより重要な能力と推測されている(Mayer他,2004)ことから,EI概念に基づく接客技能検査の作成を目指した.新規雇用266人(16-57,SD=7.37)を対象に36(EQコア12+接客マナー技能24)項目の検査を行ったところ,12〜16項目を選択した場合の技能検査の内的一貫性はα=0.78を示し,本検査の信頼性が示唆された.

キーワード:

発表題目(9): 中高年齢者向けキャリアガイダンスシステム開発の試み−行動特性尺度の策定へ向けて− (受付日:2006-06-19)

○深町珠由 / 労働大学校

発表要旨:本研究は,中高年齢者向けのコンピュータ版キャリアガイダンスシステムに搭載するための,尺度策定の試みを述べたものである.中高年齢者を対象としたアンケート調査を行って尺度の特性値を得て,因子分析による尺度構成を行った.その結果,試用版システムにおいて,「基礎的性格・思考特徴」「職場イメージ特徴」「得意とする対人関係業務」という3種類の尺度を策定するに至った.今後の実用版システム開発へ向けて,さらに尺度の信頼性・妥当性を確保する必要がある.

キーワード:

発表題目(10): 公的試験を利用した新潟大学英語教育プログラムの評価(1)ー入試,授業成績,公的試験の関係ー (受付日:2006-06-19)

○中畝菜穂子・五島譲司 / 新潟大学

発表要旨:新潟大学では2005年度より新しい英語教育カリキュラムを導入した.本カリキュラムは,TOEICなどの公的試験を活用し,習熟度別クラス編成を導入するなどで,学生の学習意欲を喚起することとしている.本発表では,新潟大学英語教育プログラムの経緯を踏まえつつ,以下の分析結果を報告する.(1)学部別,選抜区分別,性別によるTOEIC得点(リスニング,リーディング)の比較(2)TOEIC,センター試験(英語),授業成績との相関関係

キーワード:TOEIC・センター試験・英語教育・カリキュラム

発表題目(11): 手順解答型試験におけるミスの軽重の推定とそれを考慮したスコアリング法 (受付日:2006-06-19)

○小方博之・永嶋 晃一・山下 実 / 成蹊大学・元 成蹊大学・成蹊大学

発表要旨:最近,コンピュータを用いてテストを実施したり採点したりするシステムの研究開発が盛んに行われている.我々は,手順の形で解答可能な実技試験に関して,コンピュータを用いて自動採点する方法を研究している.本報告ではミスの軽重を考慮した場合に,その程度を推定する方法と,それを勘案して採点を行う方法について述べる.

キーワード:

発表題目(12): 心理統計テストデータベースの作成とその活用(2) (受付日:2006-06-19)

○山田剛史・杉澤武俊・村井潤一郎・栗田佳代子 / 岡山大学教育学部・大学入試センター研究開発部・文京学院大学人間学部・大学評価・学位授与機構評価研究部

発表要旨:心理統計テストデータベース試作品(杉澤ら,2006)に登録するテスト項目について検討を行った.データベースに各項目の特性値に関する情報を持たせる際の問題点として,実際に学生に問題を解かせることによって算出されたこれらの指標は,集団依存性が非常に強いということが挙げられる.すなわち,誰がどの学生を相手にどのような授業を行ったかということによって,同じテストであっても反応は全く異なることが考えられる.この点を考える1つの材料として,実際に複数の大学で共通の項目を含むテストを実施した結果を報告する.

キーワード:

発表題目(13): 心理統計テストデータベースの作成とその活用(1) (受付日:2006-06-19)

○杉澤武俊・山田剛史・村井潤一郎・栗田佳代子 / 大学入試センター研究開発部・岡山大学教育学部・文京学院大学人間学部・大学評価・学位授与機構評価研究部

発表要旨:本発表では,心理統計の授業を担当している教員間で共有することを念頭に置いた心理統計テストの項目データベースの試作版を紹介する.本データベースの特徴として,(1)客観式の項目を中心とする,(2)内容・領域等のキーワードで検索ができる,(3)難易度や識別力の指標などの統計的な特性値の情報を持たせ,それによる検索も可能,(4)インターネット上でアクセスができることなどが挙げられる.当面,大学等での統計学の講義担当教員のみを対象として試験的運用をする予定であるが,学生の自習用の教材としての発展性をも有している.

キーワード:心理統計,テスト項目データベース

発表題目(14): 公的試験を利用した新潟大学英語教育プログラムの評価(2)ー教員・習熟度クラス別の分析ー (受付日:2006-06-19)

○熊谷龍一・柴山 直 / 新潟大学・新潟大学

発表要旨:新潟大学では2005年度より新しい英語教育カリキュラムを導入した.本カリキュラムは,TOEIC等の公的試験を活用し,習熟度別クラス編成を導入するなどで,学生の学習意欲を喚起することとしている.本発表では,教員や習熟度クラスの要因に着目,以下の分析を行った結果について報告する.(1)教員別,習熟度クラス別のTOEIC,センター試験(英語),授業成績との相関関係(2)一般化可能性理論を応用した,教員,習熟度クラスによる影響度合いの推定

キーワード:TOEIC・センター試験・英語教育・一般化可能性理論

発表題目(15): LSAを用いた要約文評価の試み (受付日:2006-06-19)

○牛 娜・村木英治 / 東北大学・東北大学

発表要旨:要約とは原文の内容の趣旨を変えないで,より少ない言語分量で表現する言語行為の一種である.要約文を書かせることは読解指導や聴解指導における学習者の理解の是非を確認する手段である.しかし,その評価には,採点者の主観が大きく影響し,客観的な評価基準が明確にされていないのが現状である.本研究では, Dumains (1998)による“Latent Semantic Analysis手法 (潜在意味分析)”に着目し,要約文の評価への適用可能性について検討する.

キーワード:要約文,評価基準,自然言語処理,LSA(潜在意味分析),特異値分解

発表題目(16): 評定者間の差に関する得点調整の試み−小論文データを素材として− (受付日:2006-06-19)

○柴山直・前田忠彦 / 新潟大学・統計数理研究所

発表要旨:得点調整複数の採点者によって採点された小論文スコア行列は,採点者の疲労などを考慮した採点配置デザインの結果,不完全なデータ行列となることが多い.採点者間の際をなるべく小さくしながらかつ受検者の個人差を最大とするように変換したデータともとのデータとを分散成分の分解の観点から分析する.対象となるデータは平成17年度に実施された日弁連法科大学院統一適性検査のうち「表現力を測る問題」の採点スコアである.

キーワード:小論文,パフォーマンスアセスメント,一般化可能性理論,得点調整

発表題目(17): カテゴリカルデータにおける一般化可能性の検討 (受付日:2006-06-19)

○佐々木典彰・村木英治 / 東北大学・東北大学

発表要旨:本発表では,名義尺度,及び順序尺度における一般化可能性の検討方法を示す.名義尺度の場合は,CATANOVAの分散の定義に基づき,マルチファセットデザインにおける検討を行い,順序尺度の場合は,系列カテゴリー法を用いて順序尺度データを間隔尺度データに変換した後,通常の一般化可能性理論を用いた.そして,仮想的なデータを適用した結果,順序尺度の場合は,一般化可能性係数が間隔尺度とみなした場合よりもやや小さくなることなどが示された.

キーワード:

発表題目(18): 階層潜在クラスモデルによるSieglerのBalance Scale課題の分析 (受付日:2006-06-20)

○加藤健太郎 / ミネソタ大学

発表要旨:Sieglerのbalance scale課題は物理における「トルク」の概念の認知発達を測定するものである.本研究では,階層潜在クラスモデルを用いてbalance scale課題の項目反応データを分析する.課題遂行に用いられる認知方略を潜在クラスとし,課題中の各項目の正答確率は認知方略に依存するとする.さらに,各項目はいくつかのタイプに分けられることから,同タイプの項目の認知方略毎の正答確率が共通の事前分布を持つと仮定する.ギブスサンプリングによって事後分布を推定し,モデルの適合度を検討する.

キーワード:潜在クラスモデル,階層モデル,認知診断アセスメント,ベイズ統計学,ギブスサンプリング

発表題目(19): ロジットに非線形関数を認める名義反応モデルの提案 (受付日:2006-06-20)

○川端一光・日高美英子・豊田秀樹 / 早稲田大学・EIリサーチ株式会社・早稲田大学

発表要旨:本研究は桜井・佐々木・横井・渡辺・豊田に続く第2研究である.2母数正規累積モデルやロジスティックモデルの解釈可能な識別力母数と,困難度母数を算出する上でロジットに対して線形関数を仮定するのは必須の制約である.一方,多項ロジットモデルと本質的に変わらない名義反応モデルにおいては,この制約は必ずしも必要ない.本発表ではロジットに対して,多項回帰式,Box-Cox変換,対数変換等の非線形関数を選択し,能力母数とロジットの非線形関係を反映したより妥当な能力母数の推定を試みる.

キーワード:

発表題目(20): ディジタル映像制作シミュレーションテストの試行 (受付日:2006-06-20)

○宮井あゆみ / (財)画像情報教育振興協会

発表要旨:3次元コンピュータグラフィックス(3DCG)ソフトウェアを用いた映像制作の能力評価をするために,シミュレーション手法を用いたテストを試行した.この実験では,75人の被験者に絵コンテ形式の課題を提示し,テスト用3DCGソフトウェアを使用して,3次元空間上に,登場物の配置やライティング,カメラワークなどを行ってシーン作成をしてもらった.本発表では,実験概要と分析結果について報告する.特に被験者のテスト用ソフトウェアの習熟度の違いによる成績の差,学習履歴と成績の相関,そしてシミュレーションテストとペーパー&ペンシルテストの成績の相関について報告する.

キーワード:

発表題目(21): 共用試験医学系CBTトライアルの総括まとめ (受付日:2006-06-22)

○仁田善雄・前川眞一・柳本武美・前田忠彦・奈良信雄・石田達樹・齋藤宣彦・福島統・福田康一郎・高久史麿 / 東京医科・歯科大学

発表要旨:共用試験医学系CBTの第1回〜最終トライアルまでの4年分のデータについて項目反応理論を用いた解析を行い,古典的テスト理論による指標との関連性と能力値の経年変化を検討し,共用試験CBTの有用性について評価を行った.

キーワード:

発表題目(22): 内申書成績と模試の偏差値との関係をどう見るか? (受付日:2006-06-26)

○池田央 / 教育測定研究所

発表要旨:AERA06・05・15号に「内申で合否決めおかしい」という記事が出ていた.ある大手進学塾での約12000名の中学3年模試受験者のうち英語で5を取った約4000人の偏差値を調べると31から73までの広範囲に分布していたという.分布形のスムースさとどうしてそういうことが起こるのかという疑問から,サイコメトリックな視点から,いくつかの仮定の下,そうしたデータの発生メカニズムを理論とシミュレーションの両面から考えてみた.その結果,そうしたデータの発生は珍しいことでもなく,データの解釈は如何に難しく,かつ慎重でなければいけないかと言うことを教えてくれた.

キーワード:

発表題目(23): 過去問を利用した大学入試センター試験・英語の適応型コンピュータ・テストの試作 (受付日:2006-06-26)

○藤芳明生・藤芳 衛 / 茨城大学

発表要旨:大学入試センター試験の英語の過去問を再利用し,クライアントPC上のWebブラウザで実行できる適応型コンピュータ・テストの試作を行った.出題される問題は,それぞれの年度についてIRTに従ってパラーメータが推定され,大学1年生を被験者に等化が行われている.等化のためのデータ収集には,タブレットPCを用いたコンピュータ・テストを開発し,利用した.XML技術を利用した問題の管理や,Javaサーブレットを利用したクライアント・サーバ型のシステムの構築の詳細も説明する.

キーワード:

発表題目(24): 韓国におけるメディカルスクール入学試験MEET・DEETにみる適性試験の考え方 (受付日:2006-06-26)

○大澤公一・伊藤 圭・椎名久美子・林 篤裕・田栗正章・柳井晴夫・齋藤宣彦 / 東京大学

発表要旨:MEET・DEETは言語推論・自然科学推論・空間推論の試験領域からなる,韓国メディカルスクール入学者選抜試験として開発された客観形式の共通試験である.言語推論では言語的思考能力やコミュニケーション能力を,自然科学推論では自然科学の知識を土台とした推論能力を,空間推論では歯科医としての臨床適性を診断するための空間推論能力を測定する.科目試験偏重の入学試験に対する反省から,入試での測定の必要性が強調されている倫理観や協調性,コミュニケーションスキル等の対人関係能力をいかに測定するかが,今後の課題となると思われる.

キーワード:

発表題目(25): GPA算定の問題克服--最適解を同定する (受付日:2006-06-27)

○半田智久 / 静岡大学

発表要旨:大学の成績評価制度であるGPA(Grade Point Average)は単位認定と成績を関連づけた総合指標として従前の評価制度にはない種々の効能をもち,そのこともあって導入が相次いでいる.だが,一般的なGPA算定方法には,尺度に関する範疇錯誤があるため原成績の順位が乱れ,高い割合で不公正が発生している.この問題は算定方法を適切な仕方に換えれば完全に解決する.当報告は複数の解決方途のうち,従前のGPA値との互換性が最も高く,算定方法の変更に最適なオプションを模擬データを参照しつつ明らかにする.

キーワード:

発表題目(26): 「IRTにおける解析的項目パラメータの推定アルゴリズムを持つソフトウェアの開発」 (受付日:2006-06-28)

○高橋征典・植野真臣 / 長岡技術科学大学

発表要旨:IRTでは各項目に正答する確率を,測定しようとしている特性値の関数として表すことによって,それらの項目の特徴を表現する.しかし,数値解法を利用して,推定を行う場合,解が発散するケースが生じる.筆者らは,数値解法を用いずに項目パラメータの推定を行うアルゴリズムを提案し,問題の解決を試みた.本論では,項目パラメータである識別力,困難度そして被験者集団を設定し,提案手法とIRT項目パラメータ推定ソフトウェアであるBILOGによる推定値の比較を行い,提案手法の有効性を示した.

キーワード:

発表題目(27): CBTの経過分析と解答方式の違いによる正答率の差について (受付日:2006-06-28)

○三笠建次 / 明海大学

発表要旨:124名の学生の定期試験を自作のCBTシステムで実施し、次の2項目について調べた。(1)解答時間と点数の相関関係;解答時間と点数の間には、有意な相関関係は得られなかった。(2)解答方式の違いによる正答率の差;最初に正答を入力する問を出題し、直後に同じ趣旨の問で正答を選択させる多肢選択方式の問を出題して、解答方式の違いによる正答率の差と多肢選択方式問題での解答の選択方法を調べた。更に、CBTで解答入力問題を行う際の注意点についても報告する。

キーワード:

発表題目(28): 協調型eテスティング構成システムの開発 (受付日:2006-06-28)

○ソンムァン ポクポン・植野真臣 / 電気通信大学

発表要旨:Songmuang and Ueno 2005では協調したテスト構成を行う場合、作業者の数が増えるなどテストの妥当性が向上するが、信頼性はテストエキスパートの参加の有無に依存することを示した。本研究では、現在構成させているテストの信頼性をモニタリングできる機能によりテスト構成を支援する協調型eテスト構成支援システムを開発した。実データによる実験により、本システムを用いたノービスグループがエキスパートグループ同等の信頼性を持つテスト構成を行うことができることを示した。

キーワード:

発表題目(29): 何故,日本の学力調査には科学的測定論が根付かなかったのか?――戦後日本で実施された全国学力調査の変遷と『テストの専門家』養成能力の実態 (受付日:2006-06-29)

○木村拓也 / 東北大学

発表要旨:本発表の目的は,「何故,日本の学力調査に科学的測定論が根付かなかったのか?」を技術社会史の観点から説き起こすことである.『分数ができない大学生』(1999)以降の学力低下論争で問題になったのが経年的な学力データの不在であったことは記憶に新しい.そもそも,木村(2006)が指摘したように,戦後日本において「テストの専門家」が誰を指すのかというコンセンサスが社会的に取られてこなかったことが,こうした問題を析出させた背景の一つであると考えられる.(参考)木村拓也2006:「戦後日本において『テストの専門家』とは一体誰であったのか?--戦後日本における学力調査一覧と「大規模学力テスト」の関係者一覧」『教育情報学研究』第4号.

キーワード:

発表題目(30): 日本の大学入試をめぐる公正研究−社会心理学的アプローチの試み− (受付日:2006-06-29)

○西郡大・倉元直樹 / 東北大学・東北大学

発表要旨:受験生にとって将来の進路を左右しかねない大学入試において公平性は確保されなければならない.これまで,「主観テストよりも客観テストの方が公平」といった手続きに関する議論や統計的技術を用いた公平性へのアプローチは存在してきた.しかし,受験当事者が抱く公正感について焦点が当たることは少ないように思われる.そこで,本研究では,受験の当事者個人が,制度や選抜方法との関わりにおいて公正判断をどのように行っているかを社会心理学的なアプローチを用いて検討する.

キーワード:

発表題目(31): コンピュータ適応型テストCASECの項目漏洩に関わる諸問題 (受付日:2006-06-29)

○野上康子 / (株)教育測定研究所

発表要旨:コンピュータ適応型テスト(CAT)を運用するにあたって,長期的な実施による試験問題の漏洩が大きな問題となる。本報告は,(株)教育測定研究所によって運用されているCATであるCASECの受験者の応答データを分析し,シミュレーションによって得られる結果と比較することによって項目の提示頻度および繰り返し受験が項目の正答しやすさおよび受験者の能力推定に及ぼす影響について検討する。

キーワード:

発表題目(32): 試験の因子得点と受験者による問題評定との関係 (受付日:2006-06-29)

○椎名久美子・杉澤武俊 / 独立行政法人大学入試センター研究開発部

発表要旨:多肢選択式の試験では,各受験者にとって解答時間が十分だったかどうかを,空白数などの見かけ上の値から判断するのが難しい.設問の正誤データを用いた因子分析により,試験時間に影響を及ぼす潜在因子について検討を行うと共に,各受験者の因子得点と試験の解答時間や難易度に関する評定の関係を分析した.その結果,受験者による解答時間に関する評定と相関を持つ因子が抽出された.

キーワード:

発表題目(33): 適応型テストにおいての項目パラメーター値についての検討 (受付日:2006-06-29)

○韓 太哲・村木英治 / (株)教育測定研究所

発表要旨:適応型テスト(CAT)の実施において、項目の使用頻度、時間の経過等の原因で項目の性質が変わると言われている。本研究ではCASEC(英語コミュニケーション能力判定テスト)の実施で得たデータをもとに項目のパラメーター値を推定して、初期の項目パラメーター値と比較し、その値の安定性について検討を行う。

キーワード:

発表題目(34): 法科大学院統一適性試験:3年間のまとめ (受付日:2006-06-29)

○前田忠彦・野口裕之・柴山 直・藤本 亮・藤田政博 / 統計数理研究所

発表要旨:適性試験委員会による「法科大学院統一適性試験」は2003年から開始され2005年には第3回目が実施された。適性試験委員会では,この試験の実施結果について可能な限り情報を開示することに努めてきている。本報告では,3つの客観式セクションに限って法科大学院統一適性試験の過去3回分の分析結果を概観する。検討するのはテストの信頼性,項目統計量,セクション得点間の相関,他のテストとの相関関係,などであり,この検討を通じて試験としての「安定性」に関する現時点での中間評価を行う。

キーワード:

発表題目(35): TESTFACTを用いたIT系資格試験の妥当性検証の試み (受付日:2006-06-29)

○佐野 真 / アール・プロメトリック株式会社

発表要旨:2006年6月に改訂されたIT系資格試験(二科目)の、ベータ試験結果に対して、TESTFACTを用いた因子分析を行い、問われるべきスキル項目の妥当性検証を行った。この結果について報告する。

キーワード:

発表題目(36): 学力および適性に関する意識調査を利用した総合試験問題の妥当性の検証 (受付日:2006-06-29)

○伊藤 圭・柳井晴夫・林篤裕・椎名久美子・大澤公一・石井秀宗・田栗正章 / 独立行政法人大学入試センター研究開発部

発表要旨:近年,大学入試の多様化に伴い,多くの大学において,従来の方法では必ずしも十分に評価することができなかった受験生の多様な能力や適性を測定する総合試験が利用されている。本研究では,総合試験の妥当性の向上を目的として行った教科科目フリー型の総合試験問題の試作と評価のためのモニター調査の結果について報告する。特に,試験成績と受験者の学力および適性に関する意識調査結果との関連から,総合試験問題の測定している能力の妥当性を検証すると共に,従来の教科科目別学力と総合試験の類似点および相違点を相対的に明らかにする。

キーワード:

発表題目(37): 選択肢付穴埋め問題の諸性質 (受付日:2006-06-29)

○椎名乾平 / 早稲田大学

発表要旨:わが国の各種試験では,「選択肢つき穴埋め問題」がしばしば用いられるが,その基本的性質や真の得点推定法はあまり研究されていない.本発表では得点の持つ統計的性質および真の得点を欠損値とみなすEMアルゴリズムの適用例を紹介する.

キーワード:

発表題目(38): 詳細な個人差を描き出せる教育評価の実現−形成的評価のための新しいテスト法の確立− (受付日:2006-06-29)

○寺澤孝文・勝部厚志・三宅貴久子・灰原久美子・和気竜也 / 岡山大学 教育学部・岡山大学 教育学部・岡山市立津島小学校・岡山市立津島小学校・Benesse 教育研究開発センター

発表要旨:現在のテストでは、詳細な個人差を客観的なデータとして描き出すことは難しい。それに対して、膨大な学習コンテンツの一つ一つについて、何度も行われる学習イベントが、いつどのように生起するのか、また、学習とテストのインターバルも年単位で制御した上で、テスト反応を全て収集解析する方法(マイクロステップ計測技術)により、これまで検出できなかった個人差を描き出せるレベルのデータを、ほぼ毎日、個別にフィードバックすることが可能になった。小学校で実施した実際の実験データを紹介する。

キーワード:

発表題目(39): 大規模項目バンクの構築に際する項目パラメタの等化法に関する研究 その2 (受付日:2006-06-29)

○荒井清佳・前川眞一 / 東京工業大学

発表要旨:IRTを実際に応用する際に、項目プールの構築は最も大切なことの一つである。本研究では、小規模の項目プールがすでに存在しているとし、その既存の項目プールに新規項目を追加していく場合に着目した。項目プールと新規項目との連結デザインを数種類用意し、新規項目の項目パラメタを項目プール上の尺度へ等化する際の等化法を、シミュレーションにより比較した。昨年度のテスト学会では、同時等化法、分離等化法(特性曲線法)での結果を示したが、今回は、連結デザインを一部変更し、また等化法としてモーメント法、FCIP法を加えた結果を示す。

キーワード:

発表題目(40): FACETSを用いたアジア人英語学習者のスピーキング能力の評定に関する一考察 (受付日:2006-06-29)

○中野美知子・筒井英一郎・近藤悠介・上田倫史・大和田和治 / 早稲田大学

発表要旨:本研究は、アジア人英語学習者のスピーキング能力の評定方法を考察する。英語教育で修士号を有する10人が、ヨーロッパ共通参照枠の評価基準を参考に訓練を受けた後、アジア5カ国の大学生73人の英語の自己紹介スピーチを、29項目で評価した。FACETSを用いて学習者の能力値を推定し、客観的測定値との関連を調べた。いくつかの客観的測定値は、レベルと共に上昇傾向がみられ、能力値と客観的測定値に関する重回帰分析の決定係数は0.78であることから、自動音声評価の可能性を示唆するものであるといえる。

キーワード:

△HOMEへ