論文の概要: Combining physics education and machine learning research to measure evidence of students' mechanistic sensemaking
- arxiv url: http://arxiv.org/abs/2503.15638v3
- Date: Wed, 17 Sep 2025 18:05:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 15:20:14.234855
- Title: Combining physics education and machine learning research to measure evidence of students' mechanistic sensemaking
- Title(参考訳): 物理教育と機械学習研究を組み合わせて学生の機械的センスメイキングの証拠を測定する
- Authors: Kaitlin Gili, Kyle Heuton, Astha Shah, David Hammer, Michael C. Hughes,
- Abstract要約: 学習者の機械的感覚を解析するMLツールの設計の進歩について報告する。
本ツールのパイロットテストについて,異なる言語エンコーダを用いた3つのバージョンで記述し,簡単な概念的質問に対する大学生の回答から明らかな意味を解析した。
- 参考スコア(独自算出の注目度): 3.82216862698789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in machine learning (ML) offer new possibilities for science education research. We report on early progress in the design of an ML-based tool to analyze students' mechanistic sensemaking, working from a coding scheme that is aligned with previous work in physics education research (PER) and amenable to recently developed ML classification strategies using language encoders. We describe pilot tests of the tool, in three versions with different language encoders, to analyze sensemaking evident in college students' written responses to brief conceptual questions. The results show, first, that the tool's measurements of sensemaking can achieve useful agreement with a human coder, and, second, that encoder design choices entail a tradeoff between accuracy and computational expense. We discuss the promise and limitations of this approach, providing examples as to how this measurement scheme may serve PER in the future. We conclude with reflections on the use of ML to support PER research, with cautious optimism for strategies of co-design between PER and ML.
- Abstract(参考訳): 機械学習(ML)の進歩は、科学教育研究の新しい可能性を提供する。
本稿では,従来の物理教育研究(PER)に適合し,最近開発された言語エンコーダを用いたML分類戦略に適合するコーディングスキームを用いて,学生の機械的感覚を解析するためのMLベースのツールの設計の初期段階について報告する。
本ツールのパイロットテストについて,異なる言語エンコーダを用いた3つのバージョンで記述し,簡単な概念的質問に対する大学生の回答から明らかな意味を解析した。
その結果、まず、ツールが人間のコーダと有効に一致し、次に、エンコーダの設計選択が精度と計算コストのトレードオフを伴っていることを示す。
このアプローチの約束と限界について議論し、この測定方法が今後のPERにどのように役立つのかを例示する。
我々は、PER研究を支援するためのMLの使用について、PERとMLの協調設計戦略に対する慎重な楽観性を考察した。
関連論文リスト
- PhysUniBench: An Undergraduate-Level Physics Reasoning Benchmark for Multimodal Models [69.73115077227969]
大規模言語モデル(MLLM)の推論能力の評価と改善を目的とした大規模ベンチマークであるPhysUniBenchを提案する。
PhysUniBenchは、3,304の物理問題から成っている。
ベンチマークの構成には、複数のロールアウト、専門家レベルの評価、解決が容易な問題の自動フィルタリング、そして5段階の難易度グレーディングシステムを含む、厳格な多段階プロセスが含まれていた。
論文 参考訳(メタデータ) (2025-06-21T09:55:42Z) - Can Theoretical Physics Research Benefit from Language Agents? [50.57057488167844]
大規模言語モデル(LLM)は、様々な領域にわたって急速に進歩しているが、理論物理学研究への応用はまだ成熟していない。
このポジションペーパーは、LLMエージェントが、ドメイン知識やツールボックスと適切に統合された場合、理論的、計算的、応用物理学を加速するのに役立つと主張している。
マルチモーダルデータを処理し、検証可能な仮説を提案し、設計実験を行う物理特殊化LSMを構想する。
論文 参考訳(メタデータ) (2025-06-06T16:20:06Z) - Dissecting Physics Reasoning in Small Language Models: A Multi-Dimensional Analysis from an Educational Perspective [0.0]
小型言語モデル (SLM) は計算効率とアクセシビリティを提供する。
本研究では,最先端SLMの物理推論能力について検討した。
論文 参考訳(メタデータ) (2025-05-27T04:33:13Z) - MathEDU: Towards Adaptive Feedback for Student Mathematical Problem-Solving [3.2962799070467432]
本稿では,大規模言語モデル(LLM)の学習者の数学的問題解決プロセスの評価と適応的なフィードバックを提供する能力について考察する。
モデルが学生の事前回答履歴にアクセス可能なシナリオと、コールドスタートコンテキストをシミュレートするシナリオの2つについて、パーソナライズされた学習を支援するモデルの能力を評価する。
論文 参考訳(メタデータ) (2025-05-23T15:59:39Z) - LLM-based Cognitive Models of Students with Misconceptions [55.29525439159345]
本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文 参考訳(メタデータ) (2024-10-16T06:51:09Z) - A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression [0.6666419797034796]
インターリーブド・プラクティスは、学部生の記憶と問題解決能力を高める。
本稿では,Large Language Model(LLM)上に構築されたパーソナライズされた学習ツールについて紹介する。
論文 参考訳(メタデータ) (2024-06-17T13:43:30Z) - SimLM: Can Language Models Infer Parameters of Physical Systems? [56.38608628187024]
物理系におけるパラメータ推論におけるLarge Language Models (LLM) の性能について検討する。
実験の結果,単純なシステムであっても,本課題には適していないことが示唆された。
物理シミュレータを用いてLLMのコンテキストを拡大する探索の有望な方向を提案する。
論文 参考訳(メタデータ) (2023-12-21T12:05:19Z) - X-VoE: Measuring eXplanatory Violation of Expectation in Physical Events [75.94926117990435]
本研究では,AIエージェントによる直感的な物理の把握を評価するベンチマークデータセットであるX-VoEを紹介する。
X-VoEは直感的な物理モデルの説明能力を高めるためのより高いバーを確立する。
本稿では、物理力学を捉え、隠蔽対象状態を推定する説明に基づく学習システムを提案する。
論文 参考訳(メタデータ) (2023-08-21T03:28:23Z) - Physics-Based Task Generation through Causal Sequence of Physical
Interactions [3.2244944291325996]
物理的な環境でタスクを実行することは、現実世界で動作するAIシステムにとって決定的に難しい問題である。
本稿では,物体間の物理的相互作用の因果シーケンスを用いて物理シナリオを定義するための体系的なアプローチを提案する。
次に,定義したシナリオを入力として,物理シミュレーション環境でタスクを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-08-05T10:15:18Z) - Towards a Holistic Understanding of Mathematical Questions with
Contrastive Pre-training [65.10741459705739]
本稿では,数学的問題表現,すなわち QuesCo に対する対照的な事前学習手法を提案する。
まず、コンテンツレベルと構造レベルを含む2段階の質問強化を設計し、類似した目的で文字通り多様な質問ペアを生成する。
そこで我々は,知識概念の階層的情報を完全に活用するために,知識階層を意識したランク戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T14:23:29Z) - Lila: A Unified Benchmark for Mathematical Reasoning [59.97570380432861]
LILAは、23の多様なタスクと4次元からなる統一的な数学的推論ベンチマークである。
我々は,Pythonプログラムの形式でタスク命令とソリューションを収集することにより,20のデータセットベンチマークを拡張してベンチマークを構築した。
LILAで訓練された汎用数学的推論モデルであるBHASKARAを紹介する。
論文 参考訳(メタデータ) (2022-10-31T17:41:26Z) - Symmetry Group Equivariant Architectures for Physics [52.784926970374556]
機械学習の分野では、対称性に対する認識が目覚ましいパフォーマンスのブレークスルーを引き起こしている。
物理学のコミュニティと、より広い機械学習のコミュニティの両方に、理解すべきことがたくさんある、と私たちは主張する。
論文 参考訳(メタデータ) (2022-03-11T18:27:04Z) - Physics-informed Reinforcement Learning for Perception and Reasoning
about Fluids [0.0]
本研究では,流体知覚と観測からの推論のための物理インフォームド強化学習戦略を提案する。
本研究では,コモディティカメラで自由表面を観察した未確認液体の追跡(知覚)と解析(推論)を行う手法を開発した。
論文 参考訳(メタデータ) (2022-03-11T07:01:23Z) - Privacy-preserving machine learning with tensor networks [37.01494003138908]
テンソルネットワークアーキテクチャは、特にプライバシー保護機械学習に期待できる特性を持つことを示す。
まず、フィードフォワードニューラルネットワークに存在する新たなプライバシ脆弱性を説明し、それを合成および実世界のデータセットで説明する。
このような条件がテンソルネットワークアーキテクチャによって満たされていることを厳密に証明する。
論文 参考訳(メタデータ) (2022-02-24T19:04:35Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z) - Jointly Modeling Heterogeneous Student Behaviors and Interactions Among
Multiple Prediction Tasks [35.15654921278549]
学生の予測課題は学生と大学生の両方にとって実用的な意味を持つ。
本稿では,不均一な振る舞いをモデル化し,複数の予測を行う。
大学から収集した実世界のデータセットに基づいて,モチベーション行動予測タスクを3つ設計する。
論文 参考訳(メタデータ) (2021-03-25T02:01:58Z) - Explainable Empirical Risk Minimization [0.6299766708197883]
機械学習(ML)の手法が成功すると、解釈可能性や説明可能性にますます依存するようになる。
本稿では、情報理論の概念を適用し、ML法による予測の主観的説明可能性のための新しい尺度を開発する。
我々の主な貢献は、主観的説明可能性とリスクを最適にバランスする仮説を学ぶための説明可能な経験的リスク最小化(EERM)原理である。
論文 参考訳(メタデータ) (2020-09-03T07:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。