発表要旨


企画セッション
「心理テストの過去・現在・未来」

1. 「心理テストの過去・現在・未来」のねらい

柳井 晴夫 (大学入試センター)

 20世紀の初めにビネー等によって開発され100年近くの歴史を持つ知能テストが現在でも広く利用されているが,1990年代になって,米国において,その利用法に変化が生じている.さらに1930年代以降,発展のある性格特性の因子分析的研究が,1990年代になって,性格の5因子モデルを生み出した.一方,性格テスト,興味テスト等を含む適性テストは,試筆検査から脱皮して,パーソナル・コンピュータを用いた職業診断システムとして発展している.一方,最近では,性格テストに食習慣,運動習慣等の項目を含めた生活習慣テストが作成され,生活習慣予防の一環として利用されている.上記の「知能テスト」「性格テスト」「適性テスト」および「生活習慣テスト」といった4種の心理テストのそれぞれに携われてきた4人の研究者から,「心理テスト」の過去・現在・未来,についてご講演頂く本企画セッションのねらいについて,心理テストの過去1世紀の歴史を概観しながら,まとめてみた.

2. 知能テストについて

前川 久男 (筑波大学)

 現在利用されている知能テストにおける近年の変化の方向性について述べるとともに、利用の仕方における変化を述べる。このことは本学会の役割が何であるかを明らかにすることにもなると考える。さらに新たな知能検査の方向性を認知プロセスの評価という視点から述べていく。この新たな知能検査がテストの新たな可能性を開くものであること強調する。来年8月北京で開催される国際心理学会においてInvited Speakerとして話されるCanadaのDr. J.P. DasのThe rules and tools of Intelligence: How IQ became obsoleteというテーマに沿うものである。

3. 性格テストについて −Big Five的観点から−

柏木 繁男 (城西国際大学)

 過去の主だった研究事例の概略的説明の後、性格を5特性EACNO、すなわち、Big Five的観点から、筆者の行った性格テストに関する3種類の研究例を紹介した。第一に、105語の5特性15ファセットの形容詞リスト(AL)の作成について述べ、ファセット単位によるVarimax解がBig Five単純構造となることを紹介した。第二に、TEGの50項目とALのBig Five形容詞部分リスト50項目とのジョイント因子分析により、TEG概念AdultとAL特性Oとが同等な内容となること等を紹介した。そして第三、すなわち、最後に、クレペリンにおける曲線変動測度pfが、3特性ENOで複合的に記述表現可能となることを紹介した。

4. 適性テストの開発と発展 −職業適性診断システム「In★Sites2000」を中心に−

室山 晴美 (労働政策研究・研修機構)

 本報告では、これまでに開発された職業適性検査の概観、最近開発された適性検査の一例、適性検査のもつ限界、今後の発展について論じる。従来の適性検査としては紙とペンを用いる紙筆検査が主流であったが、最近ではコンピュータを使ってキャリア・ガイダンスを行うシステム(CACGs)が開発され、若年求職者に向けた職業相談に有効に活用できる可能性が示唆されている。本報告ではその例として、日本で最初に開発されたCACGsの概要と利用状況、評価を紹介する。コンピュータを利用した適性検査の開発は、今後、ますます発展する可能性がある。

5. 生活習慣テストについて −LPC式生活習慣検査の開発−

佐伯 圭一郎 (大分県立看護科学大学), 西山 悦子, 高木 廣文 (新潟大学), 柳井 晴夫 (大学入試センタ−), 道場 信孝 (労働福祉事業団), 日野原 重明 ((財)ライフプランニングセンター)

 健康にかかわる保健医療の分野においても,人間のさまざまな特性に関する測定法としてテストが幅広く利用されている。特に,健康との関わりで近年注目されている生活習慣については,多面的な観点を持つ標準的な調査票が必要とされている。
 われわれは,生活習慣の標準的な調査票を目指して,20数年前から研究を続けている。本発表では,われわれが開発したLPC式生活習慣検査の概要と研究内容について,開発および改訂の経過,生活習慣の因子構造を中心に紹介し,研究・応用の両面から今後の展望を整理したい。


一般セッション

A1. 日本の公的機関が実施する大規模試験の比較

荒井 清佳, 前川 眞一 (東京工業大学)

 テストによる選抜や資格の授与が、受験者だけでなく社会に与える影響は大きい.そこで、日本で行われているテストのうち、公的機関が実施し、社会的にも重要度の高いとされるテスト(試験)について、どのように試験が行われているかを調査し、比較する。

A2. 学習指導要領に準拠した項目プール

柳本 武美 (統計数理研究所)

 学習書としての教科書は学習指導要領に準拠していなければならない。それでは、学習指導要領に準拠したテストはどうか。そのテストを構築するときに項目プールは不可欠か。項目プールの役割と位置づけを、学習指導要領を通じて考察したので報告する。

A3. フレーミング効果の再評価

澁谷 泰秀, 渡部 諭 (青森大学)

 フレーミング効果について、一般成人を母集団として調査を行なった結果、先行研究で報告されているフレーミング効果と同様の効果が確認された。ところが、被調査者を若年者と高齢者とに分けてフレーミング効果について分析してみると、両群におけるフレーミング効果に異なった特徴が確認された。分析には、古典的テスト理論と共に項目反応理論(rating scale model)を用いた。

A4. 第2回医学系CBT共用試験トライアルの統計的解析

仁田 善雄(1,2), 奈良 信雄(1,2), 吉田 素文(1,2), 寺尾 俊哉(1,2), 石田 達樹(2), 福島 統(1,2), 斎藤 宣彦(1), 福田 康一郎(1), 高久 史麿(1), 麻生 武志(1,2) ((1): 共用試験実施機構) ((2): 東京医科歯科大学)

 臨床実習前の学生(4/5年生)の到達度評価の一つとして、全国80大学が参加している医学系共用試験CBTの第2回トライアルが平成15年1月〜5月末まで実施された。実施者のうち7149名を解析対象とし、正答率の分布、難易度の分布、モデル・コア・カリキュラム別正答率の比較、連問形式の問題の評価を行い、本格実施に向けた課題などについて検討を加えた。

A5. 作業手順の視覚による認識と評価を行うシステム

小方 博之, ○五十嵐 俊介 (成蹊大学)

 CBTの実技試験への適用可能性を検討する。ここでは実技試験として、被験者の作業手順を評価対象とするものを考え、被験者の動作をカメラを用いて認識し、得られた動作手順からその評価を行うシステムについて報告する。

A6. ハイパーグラフによる数式問題答案の評価

小方 博之 (成蹊大学)

 CBTによるテストの出題の大部分は多肢選択形式であり、測定可能な能力に限界がある。ここでは数学・物理問題などに見られる、数式操作によって解答を導く数式問題に対して、自動評価手法の検討・提案を行う。

A7. MS WordとExcelを利用した汎用的CATシステムの開発

菊地 賢一 (東邦大学)

 近年、日本においてもコンピュータを利用したテストが普及してきた。しかし、テストを行うためには、専用のアプリケーションを開発し、運用する必要がある。そこで、本研究では、アプリケーション開発の必要がなく、CATやCBTを行うことができるシステムを開発した。このシステムでは、問題文をMS Wordで、アイテムの情報をMS Excelで、作成することでテストを行うことができる。これにより、実際の教育現場などで、より簡単にCATやCBTの利用ができるものと考える。

B1. 多値型項目反応モデルによる評定者特性の推定 −多相モデルと階層モデルの比較を中心に−

大澤 公一 (東京大学)

 Constructed Response 項目の評定における評定者特性を項目反応理論の視点から解析する方法として、多相項目反応モデルが長く援用されてきた。しかし近年このモデルを評定者特性の解析目的に用いることに対する理論的反省がなされ、階層評定者モデル (HRM ; Patz et al, 2002) が考案された。本稿では HRM の応用を考えるに際し、日本では一般的であろう比較的小規模なテスト場面を想定する。両モデルによる評定者特性のシミュレーション解析の結果から、HRM の特徴と機能的有効性について、多相評定者モデルとの比較を通して考察と今後の展望を与える。

B2. Using Item Response Theory to Create a Common Scale for Comparing Results from Large-Scale Prefectural English Tests.

斉田 智里 (茨城県立並木高等学校), 服部 環 (筑波大学心理学系)

 This paper describes the use of Item Response Theory to derive ability parameter estimates on a common scale for approximately 120,000 first-year high school students. The research utilized results from prefecture-wide English tests administered in Ibaraki prefecture over an 8-year period. As the tests did not include any common items, 7 additional tests were specially produced to enable the equating of ability parameter estimates through a common test-taker design. Changes in the patterns of ability scores from year to year were identified and the results suggest that the English ability of students entering high school gradually decreased over the 8-year period covered in the study.

B3. BUGSによるIRTの現実的適用

繁桝 算男, 大森 拓哉 (東京大学)

 MCMC法による統計解析ソフトBUGSを用いてIRTの各種モデルの分析を行う。また、実際の多肢選択テストのデータを適用し、各種モデルの分析と比較を行う。

B4. 大学入試センター試験統計情報データベース作成の試み

吉村 宰, 中畝 菜穂子, 荘島 宏二郎, 石岡 恒憲 (大学入試センター)

 大学入試センター研究開発部では、設問回答率分析図(得点五分位ごとの正答率を図示したもの)を始めとする種々の試験統計情報を作題のための参考情報として提供してきたが、それらは散在しており統一的な整備状況は必ずしも十分ではなかった。より積極的な作問支援のために、さらには過去に出題された問題の再利用の視点からも、過去に出題された問題の中から特定の統計的特徴をもつ問題を容易に検索・抽出できる環境の整備が必要である。本報告では、試作された大学入試センター試験の統計情報データベースの構成及び機能を紹介するとともに、想定される利用法について考察する。

B5. 大学入試センター試験『英語』における記述統計量に見られる特徴と作問への示唆

中畝 菜穂子, 吉村 宰, 荘島 宏二郎 (大学入試センター)

 大学入試センター試験の外国語教科の1つ『英語』は,毎年60万人規模の受験者を要する大規模テスト教科である.したがって,『英語』テストがもつ社会的影響力の大きさを鑑みたとき,そのテストの性質の経年的な特徴の推移を概観することは急務である.本研究では,『英語』に焦点をあて,テストの記述統計量の経年的な変化を考察することを目的とする.また,得られた知見を,作題場面でどのように活用できるかを考察する.

B6. 項目反応理論から見た大学入試センター試験『英語』の特徴

荘島 宏二郎, 吉村 宰, 中畝 菜穂子 (大学入試センター)

 本研究では,大学入試センター試験『英語』テストを項目反応理論の観点から検討することを目的とする.具体的には,項目母数の推定値,項目特性曲線,情報関数などに着目し,それらを項目ごと,大問ごと,テストごとに,かつ,経年的な変化を視野にいれて検討する.それにより,各年のテストの統計学的な性質を概観するとともに,作題場面で知見をどのように活用できるかを検討する.

B7. 英語読解テスト項目の評価:センター試験(英語)・第6問の分析を通して

杉野 直樹 (岐阜大学), 齋藤 栄二 (関西大学), 根岸 雅史 (東京外国語大学), サイモン・フレイザー (呉大学), 野澤 健 (関西国際大学), 岡部 純子 (愛知県立大学)

 大学入試センター試験『英語』で出題される6つの大問の内,第6問は最も高い得点が配分されてきた大問であるとともに,その題材文の長さから,しばしば問題とされるテスト全体のボリュームに最も影響を及ぼす大問でもある。本報告では,この第6問の統計的特徴の経年的な推移を元に,今後の作題に対する示唆を得ることを目的として,題材文のリーダビリティや各項目の内容といった作題者の観点から過去の問題を検討・評価する。


公開シンポジウム
「これからの社会に役立つテスト技術」

2. 医学教育における共用試験−その意義と試験問題の共有化

佐藤 達夫 (東京医科歯科大学)

いま全国規模で共同開発が進められているものに、医学教育のためのモデル・コア・カリキュラムの作成と臨床実習開始前の学生評価のための共用試験がある。前者はどの医科大学であれ、医師になる者には欠かせない共通学習科目を精選し標準化してガイドラインを作ることである。後者はその達成度を評価するためのもので、これも大学間合意の上で質の高い総合試験問題の作成実施が行われる。それは、医師に必要な態度や技能をみる客観的臨床能力試験(通称OSCE)とコンピュータを利用した客観テスト(CBT)とから成る。これらのいわゆる共用試験についての発展の経緯や目的について報告する。

3. IT技術を応用した語学試験(speaking)の新しい試み

原田 康也 (早稲田大学)

 外国語(英語)の試験を実施するに当たって情報通信技術(言語処理・音声処理を含む)をどのように活用することが可能か、可能性と事例を紹介する。特に、Ordinate Corporationが開発・運用するPhonePassは、電話を通じて受験する・webを用いて結果を通知する・母語話者と非母語話者のデータにより作成された音声認識エンジンに基づいて正解か誤答かの判定を行うなど、その実施面において興味深いところが多いだけでなく、電話から聞こえる音声の指示に従って、電話を通じて音声で回答するという課題設定も現実的である。

4. 「適応型テスト方式」によるインターネット受検の開発過程

林 則生 (株式会社教育測定研究所)

 テストの実施形態として,コンピュータを利用したテスト(CBT)を見かけるようになりました。CBTは,従来の方式では出来なかったテスト技術の応用なども可能になるかも知れません。しかしながらCBT構築には,十分な検討と準備も必要と思われます。当研究所では古くからCBTに興味を持ち,これの研究開発を進めてきました。今回は実際にCBTのシステムを構築した経験をもとに,構築に際しどのような事柄を検討したか,構築に際し問題となった点,或いは実際に運用してみて生じた種々の問題点などについて報告いたします。

5. 面接選考の構造化に関する研究−信頼性と妥当性向上への取り組み

二村 英幸 (HRR株式会社)

 面接選考は、一般に面接者による総合的な人物評価という認識があり、個人差尺度と位置づけてその是非が検証されることはあまりない。面接評定の尺度に焦点をあてるアプローチは、米国では盛んで1980年代ころより構造化面接として一定の成果が得られている。面接評定の内容を明確にすること、質問内容や方法を標準化すること、評定基準を標準化すること、面接者を訓練することなどによるアプローチで、本発表では、その効果を現実の採用面接を用いて実証的に研究した結果を紹介し、面接選考のありかたを討論する。


トップページ 大会発表プログラム 大会スケジュール


(c) 2003 by test@bayes.c.u-tokyo.ac.jp