論文の概要: ARIA: Adaptive Retrieval Intelligence Assistant -- A Multimodal RAG Framework for Domain-Specific Engineering Education
- arxiv url: http://arxiv.org/abs/2604.06179v1
- Date: Wed, 04 Feb 2026 01:08:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.374455
- Title: ARIA: Adaptive Retrieval Intelligence Assistant -- A Multimodal RAG Framework for Domain-Specific Engineering Education
- Title(参考訳): ARIA: Adaptive Retrieval Intelligence Assistant -- ドメイン特化工学教育のためのマルチモーダルRAGフレームワーク
- Authors: Yue Luo, Dibakar Roy Sarkar, Rachel Herring Sangree, Somdatta Goswami,
- Abstract要約: ARIAは、大学レベルのコースにまたがってインテリジェントな教育アシスタントを作成するためのフレームワークである。
ARIAは、60の非関連クエリのうち58を拒否しながら、関連する20のコースの質問に正しく答えた。
- 参考スコア(独自算出の注目度): 1.084959821967413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing effective, domain-specific educational support systems is central to advancing AI in education. Although large language models (LLMs) demonstrate remarkable capabilities, they face significant limitations in specialized educational applications, including hallucinations, limited knowledge updates, and lack of domain expertise. Fine-tuning requires complete model retraining, creating substantial computational overhead, while general-purpose LLMs often provide inaccurate responses in specialized contexts due to reliance on generalized training data. To address this, we propose ARIA (Adaptive Retrieval Intelligence Assistant), a Retrieval-Augmented Generation (RAG) framework for creating intelligent teaching assistants across university-level courses. ARIA leverages a multimodal content extraction pipeline combining Docling for structured document analysis, Nougat for mathematical formula recognition, and GPT-4 Vision API for diagram interpretation, with the e5-large-v2 embedding model for high semantic performance and low latency. This enables accurate processing of complex educational materials while maintaining pedagogical consistency through engineered prompts and response controls. We evaluate ARIA using lecture material from Statics and Mechanics of Materials, a sophomore-level civil engineering course at Johns Hopkins University, benchmarking against ChatGPT-5. Results demonstrate 97.5% accuracy in domain-specific question filtering and superior pedagogical performance. ARIA correctly answered all 20 relevant course questions while rejecting 58 of 60 non-relevant queries, achieving 90.9% precision, 100% recall, and 4.89/5.0 average response quality. These findings demonstrate that ARIA's course-agnostic architecture represents a scalable framework for domain-specific educational AI deployment.
- Abstract(参考訳): 効果的なドメイン固有の教育支援システムを開発することは、教育におけるAIの進歩の中心である。
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚、知識の更新の制限、ドメインの専門知識の欠如など、専門的な教育応用において重大な制限に直面している。
ファインチューニングには完全なモデル再トレーニングが必要であり、計算上のオーバーヘッドをかなり発生させる一方、汎用LSMは一般的なトレーニングデータに依存するため、特定の文脈で不正確な応答を提供することが多い。
そこで本稿では,大学レベルの知的教育支援を行うためのARIA(Adaptive Retrieval Intelligence Assistant)フレームワークを提案する。
ARIAは、構造化文書解析のためのDocling、数式認識のためのNougat、ダイアグラム解釈のためのGPT-4 Vision APIと、セマンティックパフォーマンスと低レイテンシのためのe5-large-v2埋め込みモデルを組み合わせたマルチモーダルコンテンツ抽出パイプラインを活用している。
これにより、工学的なプロンプトと応答制御による教育的一貫性を維持しながら、複雑な教育資料の正確な処理が可能になる。
本稿では,ジョンズ・ホプキンス大学における2年生の土木工学コースであるStatics and Mechanics of Materialsの講義材料を用いたARIAの評価を行い,ChatGPT-5に対するベンチマークを行った。
その結果、ドメイン固有の質問フィルタリングにおける97.5%の精度と教育性能が向上した。
ARIAは、60の非関連クエリのうち58を拒絶し、90.9%の精度、100%のリコール、4.89/5.0の平均応答品質を達成した。
これらの結果は、ARIAのコース非依存アーキテクチャが、ドメイン固有の教育AIデプロイメントのためのスケーラブルなフレームワークであることを示している。
関連論文リスト
- ProfBench: Multi-Domain Rubrics requiring Professional Knowledge to Answer and Judge [94.40918390309186]
大規模言語モデル(LLM)の進捗を評価することは、応答を検証するという課題によって制約されることが多い。
7000以上の応答基準ペアの集合であるProfBenchを紹介する。
以上の結果から, ProfBench は最先端の LLM においても大きな課題となることが明らかとなった。
論文 参考訳(メタデータ) (2025-10-21T17:59:44Z) - AI-University: An LLM-based platform for instructional alignment to scientific classrooms [12.733784667573211]
AI主導のコースコンテンツ配信のための柔軟なフレームワークであるAI University(AI-U)を紹介する。
コアとなるAI-Uは、検索強化世代(RAG)を備えた大規模言語モデル(LLM)を微調整し、講義ビデオ、ノート、教科書からインストラクター対応の応答を生成する。
本稿では、学習データを体系的に構築し、ローランド適応(LoRA)を用いたオープンソースのLLMを微調整し、RAGベースの合成による応答を最適化するスケーラブルなパイプラインを提案する。
論文 参考訳(メタデータ) (2025-04-11T01:26:34Z) - Enabling Collaborative Parametric Knowledge Calibration for Retrieval-Augmented Vision Question Answering [16.14877145354785]
KB-VQA (Vision Question Answering) システムは、外部知識ベースから取得した知識を用いて複雑な視覚的な質問に対処する。
協調的なパラメトリック知識キャリブレーションを用いた検索強化VQAフレームワークを提案する。
提案手法は,最先端モデルと競合する性能を実現し,精度が4.7%向上した。
論文 参考訳(メタデータ) (2025-04-05T05:42:12Z) - Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains [92.36624674516553]
検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の数学的推論と符号化性能の向上に成功している。
本稿では,医学,化学,心理学,経済学,教育など,さまざまな現実世界領域におけるRLVRの有効性と拡張性について検討する。
我々は,2値検証による制限を克服するために,ソフトなモデルに基づく報酬信号を生成する生成的スコアリング手法を利用する。
論文 参考訳(メタデータ) (2025-03-31T08:22:49Z) - Towards Efficient Educational Chatbots: Benchmarking RAG Frameworks [2.362412515574206]
大規模言語モデル(LLM)は、大量の文献に基づく情報を収集することで、教育において非常に有益であることが証明されている。
本稿では,LLMを活用してGATEソリューションを説明し,学生の試験準備を支援するAIを活用した質問応答フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-02T08:11:07Z) - Could ChatGPT get an Engineering Degree? Evaluating Higher Education Vulnerability to AI Assistants [176.39275404745098]
我々は,2つのAIアシスタントであるGPT-3.5とGPT-4が適切な回答を得られるかどうかを評価する。
GPT-4は65.8%の質問を正解し、85.1%の質問に対して少なくとも1つの手順で正しい答えを出すことができる。
この結果から,AIの進歩を踏まえて,高等教育におけるプログラムレベルの評価設計の見直しが求められた。
論文 参考訳(メタデータ) (2024-08-07T12:11:49Z) - MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains [54.117238759317004]
大規模マルチタスクエージェント理解(MMAU)ベンチマークは、複雑な環境設定を必要としない包括的なオフラインタスクを特徴としている。
ツールユース、DAG(Directed Acyclic Graph)QA、データサイエンスと機械学習コーディング、コンテストレベルのプログラミング、数学の5分野にわたるモデルを評価する。
3K以上の異なるプロンプトを含む20の精巧に設計されたタスクにより、MMAUはLLMエージェントの強度と限界を評価するための包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2024-07-18T00:58:41Z) - How to Build an Adaptive AI Tutor for Any Course Using Knowledge Graph-Enhanced Retrieval-Augmented Generation (KG-RAG) [5.305156933641317]
知的学習システム(ITS)におけるLarge Language Models (LLMs)は、パーソナライズされた教育に変革をもたらす機会を提供する。
現在の実装では、2つの重要な課題に直面している。
本稿では,構造化知識表現と文脈認識検索を統合した新しいフレームワークである知識グラフ強化検索(RAG)を提案する。
論文 参考訳(メタデータ) (2023-11-29T15:02:46Z) - Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-09T07:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。