日本テスト学会誌 Vol.20 No.1 要旨

トップ>学会誌>既刊号一覧>既刊号(20-1)>要旨

日本テスト学会誌 Vol.20 No.1

▶ 一般研究論文  
回帰と分類のマルチタスク学習を用いた深層学習自動採点モデルに基づく確信度推定手法
髙橋祐斗1、宇都雅輝1
1電気通信大学
近年,様々なテストにおいて記述・論述式問題の活用が注目されているが,特に大規模試験では採点コストの高さや採点者バイアスに由来する評価の信頼性低下などが課題となる。これらの課題を解決するアプローチの一つとして記述・論述式回答の自動採点技術が注目されている。近年では,深層学習を用いた自動採点モデルが多数提案され,高精度を達成しているが,そのような高精度な自動採点モデルであっても得点予測を誤る可能性は残る。この問題を解決する方法の一つとして,得点予測に加えて,予測した得点に対する確信度も出力できる自動採点モデルを用いて,予測誤りの検出を試みる研究がなされている。本研究では,確信度を推定可能な従来の深層学習自動採点モデルを拡張することで,確信度推定と得点予測の両面における性能向上を目指す。また,実データを用いた実験を通して,提案モデルが確信度推定と得点予測の両面で優れた性能を達成することを示す。
キーワード:記述・論述式試験、自動採点、深層学習、マルチタスク学習、自然言語処理
▶ 事例研究論文  
観点別学習状況の評価と大学入学者選抜における活用可能性の展望高校の進路・教務担当教諭への調査より
永野拓矢1、寺嶌裕登1、橘春菜1、石井秀宗1
1名古屋大学
2018年3月告示の新学習指導要領より,高等学校・中等教育学校では2022年度入学者から調査書の原簿となる生徒指導要録に各教科・科目等の「観点別学習状況の評価」欄が設けられた。生徒の学習を観点別に評価し,その実現状況を分析的に捉えることを目指す本評価の方法は,多面的・総合的評価が期待される今日の大学入学者選抜に活用できる可能性がある。本稿では導入初年度となった2022年度末に高等学校・中等教育学校へ同評価に係るアンケート調査を実施し,大学入学者選抜への活用可能性,及び学校内における成果と課題について検討したところ,以前からの導入校も含めて評価は総じて低く,実際に大学入学者選抜に活用するには時間と改善を要することが示唆された。
キーワード:学習指導要領、観点別学習状況の評価、高校教育、分掌(進路指導・教務)
▶ 事例研究論文  
大学入試における近年の危機対応事例の総括――感染症・自然災害・刺傷事件・不正行為と未知の危機に備える――
寺尾尚大1、内田照久1、石井秀宗2、林篤裕3、中村裕 行4、立脇洋介5、西郡大6、宮本友弘7、久保沙織7、倉元直樹7
1大学入試センター、2名古屋大学、3名古屋工業大学、4愛媛大学・四国地区国立大学連合アドミッションセンター、5九州大学、6佐賀大学、7東北大学
本研究の目的は,2020年以降に大学入試を直撃したさまざまな危機に対して,関係機関がどのように対応したのかを総括しながら,大学入試の危機対応に関する基本的考え方や今後の検討課題を提示することである。新型コロナウイルス感染症拡大,自然災害,試験当日の刺傷事件,不正行為など,令和3年度入試以降のさまざまな危機は,平時では暗黙に了解されてきた大学入試の前提を激しく揺さぶり,大学入試のあり方を改めて問い直す機会を提供した。本研究では,国や大学入試センターの方針,国立大学での対応事例をもとに課題を浮き彫りにし,それぞれの危機が再び起こった場合だけでなく,未知の危機が起こった場合にも参照できる,危機対応の枠組みについて示唆を得る。
キーワード:大学入試、危機対応、新型コロナウイルス感染症、自然災害、刺傷事件、不正行為
▶ 事例研究論文  
全国学力・学習状況調査(保護者に対する調査・経年変化分析調査)における多次元項目反応モデルと推算値法の有効性の検証
川口俊明1
1福岡教育大学
文部科学省が実施する全国学力・学習状況調査の「保護者に対する調査」「経年変化分析調査」には,経年変化分析調査が教科ごとに独立に実施されているため,保護者に対する調査のデータを活かしきることができないという課題がある。本稿は,その改善策として提案されている全国学力・学習状況調査の悉皆調査のデータを組み合わせ,多次元項目反応モデルと推算値法を利用して受検者の学力を再推定するという方法の有効性を,シミュレーションを用いて検討した。 結論として,この手法は下位集団の平均や標準偏差,SESと学力の相関係数,回帰分析の係数について,ほぼ適切に母集団のパラメータを復元できることが明らかになった。教科間の相関係数を過大推定する傾向は見られたものの,その誤差はMLEやEAP,あるいは素点を利用した場合に比べれば小さい。
キーワード:全国学力・学習状況調査、保護者に対する調査、経年変化分析調査、多次元項目反応モデル、推算値法、シミュレーション
▶ 事例研究論文  
問題解決の間違いからの学習を促す「教訓帰納」の利用における思考のつまずきの解明と支援
柴里実1、植阪友理1
1東京大学大学院教育学研究科
本研究では,自分の間違いからの学習を促す学習方略「教訓帰納」の利用に着目し,問題解決に有効な教訓の引き出しを妨げる学習者の思考のつまずきとその支援の可能性について探索的に検討した。中学2年生10名を対象に個別調査を実施し,参加者が数学の問題を解き終えてから教訓を引き出すまでに従事した思考に関する発話を収集した。分析の結果,問題解決に有効でない教訓を引き出しに関わる思考のつまずきとして,自分の解法と正解を十分に比較できていない等の3つのタイプが示唆された。さらに,参加者に対して対話的な働きかけを実施した結果,自分の誤った考え方と正しい考え方を比べた上で,自分の間違いの原因を的確に把握することが,問題解決に有効な教訓の引き出しにつながる可能性が示唆された。最後に,本研究の結果を踏まえて,問題解決後から教訓を引き出すまでの思考過程を考察した。
キーワード:間違いからの学習、教訓帰納、問題解決、思考過程、発話分析
▶ 事例研究論文  
ChatGPTにより生成された心理尺度項目の信頼性・妥当性の評価
佐々木研一1、豊田秀樹2
1早稲田大学文学研究科、2早稲田大学文学学術院
心理学における項目作成は、その品質が研究の成果を大きく左右する要因となる。適切で信頼性のある尺度項目を作成する作業は、時間と労力を多く要し、多くの研究者にとっての課題である。近年、AIの発展に伴い、その適用範囲は多岐にわたって拡大しているが、心理尺度の項目生成への活用はまだ十分に探求されていない。本研究は、この新しい可能性を追求するため、ChatGPTを利用して心理尺度項目の生成を試みた。実際の回答データを基に、生成された項目による尺度の信頼性と妥当性を評価した結果、ChatGPTによる項目生成は有望であることが示された。さらに、高品質な項目を生成するためのプロンプト設計方法についての考察も行った。この研究は、心理学的測定法の新たな可能性を示すものであり、尺度開発の効率と品質の両方を向上させる方向性を提供する。
キーワード:心理尺度、項目生成、自動項目生成、大規模言語モデル、ChatGPT、信頼性、妥当性
▶ 展望論文  
測定モデルユーザーのための次元性評価法総論
堀一輝1、牧野直道1
1ベネッセ教育総合研究所
因子分析や項目反応理論などの測定モデルを使う際は,次元数を事前に指定しなければならないが,次元数を誤指定,特に過小指定するとパラメタの推定値にバイアスが生じるため,次元数を正しく指定することが求められる.これまでに様々な次元性評価法が提案されてきたが,決定的な手法は未だ確立されていない.また,心理・教育測定以外の分野の技術を用いた新しい手法が近年提案されており,測定モデルのユーザーが次元性評価法の知識を更新することが難しくなりつつある.そこで本研究は,次元性評価法の中でも比較的近年提案されたネットワークモデルや機械学習にもとづく手法を中心に解説するとともに,最も有力な手法の一つである平行分析と関連手法の詳細を整理することで,測定モデルユーザーの知識の更新に資することを目指す.また,既存研究の整理を通して見えてくる次元性評価法研究の展望を述べる.
キーワード:次元性、因子分析、項目反応理論、平行分析、ネットワーク・サイコメトリクス、機械学習