論文の概要: Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs
- arxiv url: http://arxiv.org/abs/2603.03302v1
- Date: Sat, 07 Feb 2026 20:00:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.128054
- Title: Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs
- Title(参考訳): 国家DOTにおける知識管理と労働力訓練のためのAIアシスタントの開発
- Authors: Divija Amaram, Lu Gao, Gowtham Reddy Gudla, Tejaswini Sanjay Katale,
- Abstract要約: 本稿では,知識管理と意思決定を支援するマルチエージェントアーキテクチャを備えたRAG(Retrieval-Augmented Generation)フレームワークを提案する。
従来のシングルパスRAGシステムとは異なり、提案フレームワークは検索、回答生成、評価、クエリ改善のために複数の特殊エージェントを使用する。
- 参考スコア(独自算出の注目度): 0.6445594641258019
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective knowledge management is critical for preserving institutional expertise and improving the efficiency of workforce training in state transportation agencies. Traditional approaches, such as static documentation, classroom-based instruction, and informal mentorship, often lead to fragmented knowledge transfer, inefficiencies, and the gradual loss of expertise as senior engineers retire. Moreover, given the enormous volume of technical manuals, guidelines, and research reports maintained by these agencies, it is increasingly challenging for engineers to locate relevant information quickly and accurately when solving field problems or preparing for training tasks. These limitations hinder timely decision-making and create steep learning curves for new personnel in maintenance and construction operations. To address these challenges, this paper proposes a Retrieval-Augmented Generation (RAG) framework with a multi-agent architecture to support knowledge management and decision making. The system integrates structured document retrieval with real-time, context-aware response generation powered by a large language model (LLM). Unlike conventional single-pass RAG systems, the proposed framework employs multiple specialized agents for retrieval, answer generation, evaluation, and query refinement, which enables iterative improvement and quality control. In addition, the system incorporates an open-weight vision-language model to convert technical figures into semantic textual representations, which allows figure-based knowledge to be indexed and retrieved alongside text. Retrieved text and figure-based context are then provided to an open-weight large language model, which generates the final responses grounded in the retrieved evidence.
- Abstract(参考訳): 効果的な知識管理は、機関の専門知識を維持し、州交通機関の労働訓練の効率化に不可欠である。
静的ドキュメンテーション、教室ベースの指導、非公式なメンターシップのような伝統的なアプローチは、しばしば断片化された知識の伝達、非効率性、そして上級エンジニアが引退するにつれて徐々に専門知識が失われていく。
さらに、これらの機関が管理している膨大な技術マニュアル、ガイドライン、研究報告を踏まえると、現場の問題解決や訓練作業の準備において、技術者が関連情報を迅速かつ正確に見つけることはますます困難になっている。
これらの制限は、タイムリーな意思決定を妨げ、保守および建設作業における新しい人員のための急激な学習曲線を生み出します。
これらの課題に対処するため,本稿では,知識管理と意思決定を支援するマルチエージェントアーキテクチャを備えたRAG(Retrieval-Augmented Generation)フレームワークを提案する。
このシステムは構造化文書検索と,大規模言語モデル(LLM)を利用したリアルタイム・コンテキスト対応応答生成を統合する。
従来のシングルパスRAGシステムとは異なり、提案フレームワークは検索、回答生成、評価、クエリ改善のために複数の特殊エージェントを使用し、反復的な改善と品質管理を可能にしている。
さらに、このシステムは、オープンウェイトな視覚言語モデルを導入し、技術図形を意味的なテキスト表現に変換することで、図形に基づく知識をテキストとともにインデックス化し、検索することを可能にする。
そして、検索されたテキストと図形に基づくコンテキストをオープンウェイトな大言語モデルに提供し、検索された証拠に基づいた最終応答を生成する。
関連論文リスト
- A Survey on Retrieval And Structuring Augmented Generation with Large Language Models [29.707181003761004]
大規模言語モデル(LLM)は、テキスト生成と推論において顕著な能力を持つ自然言語処理に革命をもたらした。
しかし、これらのモデルは、時代遅れの知識や限られたドメインの専門知識を含む、現実世界のアプリケーションにデプロイする際の重要な課題に直面します。
Retrieval And Structuring (RAS) Augmented Generationは、動的情報検索と構造化知識表現を統合することで、これらの制限に対処する。
論文 参考訳(メタデータ) (2025-09-12T21:25:25Z) - STRUCTSENSE: A Task-Agnostic Agentic Framework for Structured Information Extraction with Human-In-The-Loop Evaluation and Benchmarking [2.355572228890207]
StructSenseは、大規模言語モデル上に構築された構造化情報抽出のためのモジュラーでタスクに依存しないオープンソースのフレームワークである。
複雑なドメインコンテンツを効果的にエンコードできるドメイン固有のシンボリック知識によって導かれる。
我々は、StructSenseがドメイン感度の限界とクロスタスクの一般化性の欠如を克服できることを実証した。
論文 参考訳(メタデータ) (2025-07-04T15:51:07Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - Dynamic Knowledge Integration for Enhanced Vision-Language Reasoning [0.0]
大規模視覚言語モデル(AKGP-LVLM)のための適応的知識誘導型事前学習法を提案する。
事前訓練と微調整の間、構造化された、構造化されていない知識をLVLMに組み込む。
提案手法を4つのベンチマークデータセットで評価し,最先端モデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-15T05:45:04Z) - StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文 参考訳(メタデータ) (2024-10-11T13:52:44Z) - Enhancing Question Answering for Enterprise Knowledge Bases using Large Language Models [46.51659135636255]
EKRGは大規模言語モデル(LLM)に基づく新しい検索生成フレームワークである
知識検索者の学習に十分な文書検索ペアを生成するために,LLMを用いた命令チューニング手法を提案する。
我々は、学習過程の効率化を図るために、関連性に敏感な教師学生学習戦略を開発する。
論文 参考訳(メタデータ) (2024-04-10T10:38:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。