論文の概要: The AI Tutor in Engineering Education: Design, Results, and Redesign of an Experience in Hydrology at an Argentine University
- arxiv url: http://arxiv.org/abs/2510.22279v1
- Date: Sat, 25 Oct 2025 12:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.017329
- Title: The AI Tutor in Engineering Education: Design, Results, and Redesign of an Experience in Hydrology at an Argentine University
- Title(参考訳): 工学教育におけるAIチューター--アルゼンチン大学における水文学の経験のデザイン・成果・再設計
- Authors: Hugo Roger Paz,
- Abstract要約: 本稿では,AIチュータ(ChatGPT)を用いた介入の完全なサイクル(設計,初期失敗,再設計,再評価)に関する実証的ケーススタディ(土木工学,UTN-FRT,アルゼンチン)について述べる。
1回目は、表面的な使用と深刻な学術的整合性の問題(65%の類似性、コピー > 80%)により、広範囲に失敗(合格率0%)した。
第二の介入は、再設計されたプロンプト(Prompt V2)に基づいており、厳格なエビデンスコントロール(チャットをエクスポートした強制アレンディクスA、最低時間$geq$120分、検証可能)がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The emergence of Generative Artificial Intelligence (GenAI) has reshaped higher education, presenting both opportunities and ethical-pedagogical challenges. This article presents an empirical case study on the complete cycle (design, initial failure, redesign, and re-evaluation) of an intervention using an AI Tutor (ChatGPT) in the "Hydrology and Hydraulic Works" course (Civil Engineering, UTN-FRT, Argentina). The study documents two interventions in the same cohort (n=23). The first resulted in widespread failure (0% pass rate) due to superficial use and serious academic integrity issues (65% similarity, copies > 80%). This failure forced a comprehensive methodological redesign. The second intervention, based on a redesigned prompt (Prompt V2) with strict evidence controls (mandatory Appendix A with exported chat, minimum time $\geq$ 120 minutes, verifiable numerical exercise) and a refined rubric (Rubric V2), showed significantly better results: a median score of 88/100 and verifiable compliance with genuine interaction processes. Using a mixed-methods approach (reproducible document analysis and rubric analysis), the impact of the redesign on integrity and technical performance is evaluated. The results demonstrate that, without explicit process controls, students prioritize efficiency over deep learning, submitting documents without real traceability. A transferable assessment protocol for STEM courses is proposed, centered on "auditable personal zones," to foster higher-order thinking. The study provides key empirical evidence from the context of a public Latin American university.
- Abstract(参考訳): ジェネレーティブ・人工知能(GenAI)の出現は高等教育を変革し、機会と倫理教育の課題の両方を提示した。
本稿では,AIテュータ(ChatGPT)を用いた介入の完全なサイクル(設計,初期失敗,再設計,再評価)に関する実証的ケーススタディを,「水理・油圧加工」コース(土木工学,UTN-FRT,アルゼンチン)で提示する。
この研究は、同じコホートにおいて2つの介入(n=23)を文書化している。
1回目は、表面的な使用と深刻な学術的整合性の問題(65%の類似性、コピー > 80%)により、広範囲に失敗(パスレート0%)した。
この失敗により、包括的な方法論の再設計を余儀なくされた。
第2の介入は、厳密なエビデンスコントロールを備えた再設計されたプロンプト(Prompt V2)に基づくもので、最小時間$\geq$120分、検証可能な数値エクササイズ)と改善されたルーリック(Rubric V2)は、88/100の中央値と、真のインタラクションプロセスへの適合性を示す。
混合手法(再現可能な文書解析とルーブリック解析)を用いて、再設計が整合性と技術的性能に与える影響を評価する。
その結果、明示的なプロセス制御がなければ、学生は深層学習よりも効率を優先し、実際のトレーサビリティのない文書を提出することを示した。
より高次思考を促進するため,STEM コースの伝達可能な評価プロトコルが提案されている。
この研究は、公立ラテンアメリカの大学の文脈から重要な実証的な証拠を提供する。
関連論文リスト
- Hybrid Instructor Ai Assessment In Academic Projects: Efficiency, Equity, And Methodological Lessons [0.0]
本研究では, インストラクターが指導する生成型人工知能(AI)による評価システムの実装について, 33 段階の油圧レポートに適用した。
その結果,88%の低下,733%の生産性向上がみられた。
システムは等しく、報告の長さに偏りがなく、信頼性の高い校正後であることがわかった。
論文 参考訳(メタデータ) (2025-10-25T13:11:15Z) - Machine Text Detectors are Membership Inference Attacks [55.07733196689313]
我々は,あるタスクに対してもともと開発された手法が,他方でどのように機能するかを理論的,実証的に検討する。
7つの最先端MIA法と5つの最先端マシンテキスト検出器を含む大規模実験は、クロスタスク性能において非常に強いランク相関(rho >)を示す。
この結果から,両研究コミュニティ間のクロスタスク意識とコラボレーションの必要性が示唆された。
論文 参考訳(メタデータ) (2025-10-22T11:39:01Z) - Assessment Twins: A Protocol for AI-Vulnerable Summative Assessment [0.0]
評価タスクを再設計し,妥当性を高めるためのアプローチとして,アセスメント双子を導入する。
我々は、GenAIがコンテンツ、構造、連続性、一般化可能性、外部の妥当性を脅かす方法を体系的にマッピングするために、Messickの統一妥当性フレームワークを使用します。
双子のアプローチは、補完的な形式にまたがって証拠を三角測量することで、妥当性の脅威を軽減するのに役立ちます。
論文 参考訳(メタデータ) (2025-10-03T12:05:34Z) - RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark [71.3555284685426]
本稿では,双方向機能相乗効果を評価するためのベンチマークであるRealUnifyを紹介する。
RealUnifyは、10のカテゴリと32のサブタスクにまたがる、細心の注意を払ってアノテートされた1000のインスタンスで構成されている。
現在の統一モデルは、効果的な相乗効果を達成するのに依然として苦労しており、アーキテクチャの統一だけでは不十分であることを示している。
論文 参考訳(メタデータ) (2025-09-29T15:07:28Z) - The Endless Tuning. An Artificial Intelligence Design To Avoid Human Replacement and Trace Back Responsibilities [0.0]
Endless Tuningは、二重ミラーリングプロセスに基づく人工知能の信頼性の高い展開のための設計方法である。
その後プロトコルで実現され、意思決定プロセスに関する3つのアプリケーションで実装された。
論文 参考訳(メタデータ) (2025-07-20T10:48:07Z) - Unveiling the Sentinels: Assessing AI Performance in Cybersecurity Peer
Review [4.081120388114928]
サイバーセキュリティの分野では、ダブルブラインドピアレビューの実践がデファクトスタンダードである。
本稿では、ピアレビューの聖杯に触れ、学術的セキュリティカンファレンスのレビューにおけるAIのパフォーマンスについて光を当てることを目的としている。
本研究では,人間レビュアーと機械学習モデルから得られた結果を比較し,評価結果の予測可能性について検討する。
論文 参考訳(メタデータ) (2023-09-11T13:51:40Z) - Understanding and Mitigating Overfitting in Prompt Tuning for
Vision-Language Models [108.13378788663196]
本稿では, トレーニング過程全体において, 低ランク部分空間にバックプロパゲーションの勾配を投影するSubspace Prompt Tuning(SubPT)を提案する。
我々はCoOpにノベル・ラーナー・フィーチャー(NFL)を装備し、学習したプロンプトをトレーニングセット以外の新しいカテゴリに一般化する能力を高める。
論文 参考訳(メタデータ) (2022-11-04T02:06:22Z) - Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。
本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。
実験結果から,EIは性能と試料効率の両立を図った。
論文 参考訳(メタデータ) (2022-10-18T05:19:26Z) - Counterfactual Intervention Feature Transfer for Visible-Infrared Person
Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。
十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。
本稿では,これらの問題に対処するためのCIFT法を提案する。
論文 参考訳(メタデータ) (2022-08-01T16:15:31Z) - Robustness Gym: Unifying the NLP Evaluation Landscape [91.80175115162218]
ディープニューラルネットワークは、現実のシステムにデプロイすると脆くなることが多い。
最近の研究は、そのようなモデルの堅牢性をテストすることに重点を置いている。
単純かつ評価可能なツールキットであるRobustness Gymの形で解を提案する。
論文 参考訳(メタデータ) (2021-01-13T02:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。