論文の概要: PortAgent: LLM-driven Vehicle Dispatching Agent for Port Terminals
- arxiv url: http://arxiv.org/abs/2512.14417v1
- Date: Tue, 16 Dec 2025 14:04:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.736038
- Title: PortAgent: LLM-driven Vehicle Dispatching Agent for Port Terminals
- Title(参考訳): PortAgent:LLM駆動型携帯端末用自動車ディスパッチ剤
- Authors: Jia Hu, Junqi Li, Weimeng Lin, Peng Jia, Yuxiong Ji, Jintao Lai,
- Abstract要約: PortAgentはVDS転送ワークフローを完全に自動化する車両派遣エージェントである。
1)ポートオペレーションスペシャリストの不要、(2)データの必要性の低い、(3)迅速なデプロイメントの3つの特徴がある。
VETは、Knowledge Retriever、Modeler、Coder、Debuggerを含む4人の仮想エキスパートと協力して、人間のエキスパートチームをエミュレートする。
- 参考スコア(独自算出の注目度): 8.798101130867863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vehicle Dispatching Systems (VDSs) are critical to the operational efficiency of Automated Container Terminals (ACTs). However, their widespread commercialization is hindered due to their low transferability across diverse terminals. This transferability challenge stems from three limitations: high reliance on port operational specialists, a high demand for terminal-specific data, and time-consuming manual deployment processes. Leveraging the emergence of Large Language Models (LLMs), this paper proposes PortAgent, an LLM-driven vehicle dispatching agent that fully automates the VDS transferring workflow. It bears three features: (1) no need for port operations specialists; (2) low need of data; and (3) fast deployment. Specifically, specialist dependency is eliminated by the Virtual Expert Team (VET). The VET collaborates with four virtual experts, including a Knowledge Retriever, Modeler, Coder, and Debugger, to emulate a human expert team for the VDS transferring workflow. These experts specialize in the domain of terminal VDS via a few-shot example learning approach. Through this approach, the experts are able to learn VDS-domain knowledge from a few VDS examples. These examples are retrieved via a Retrieval-Augmented Generation (RAG) mechanism, mitigating the high demand for terminal-specific data. Furthermore, an automatic VDS design workflow is established among these experts to avoid extra manual interventions. In this workflow, a self-correction loop inspired by the LLM Reflexion framework is created
- Abstract(参考訳): 車両分散システム(VDS)は、自動コンテナターミナル(ACT)の運転効率に重要な役割を担っている。
しかし、多種多様な端末間での転送性が低いため、幅広い商業化が妨げられている。
このトランスファービリティの課題は、ポートオペレーションスペシャリストへの依存度の高いこと、端末固有のデータに対する需要の高いこと、手動のデプロイメントプロセスの時間を要すること、の3つの制限に起因している。
本稿では,Large Language Models (LLMs) の出現を生かして,VDS転送ワークフローを完全に自動化したLLM駆動の車両派遣エージェントであるPortAgentを提案する。
1)ポートオペレーションスペシャリストの不要、(2)データの必要性の低い、(3)迅速なデプロイメントの3つの特徴がある。
特に、専門的依存関係はVirtual Expert Team (VET)によって排除される。
VETは、Knowledge Retriever、Modeler、Coder、Debuggerを含む4人の仮想エキスパートと協力して、VDS転送ワークフローの人間専門家チームをエミュレートしている。
これらの専門家は、数ショットのサンプル学習アプローチを通じて、端末VDSのドメインを専門としている。
このアプローチを通じて、専門家はいくつかのVDS例からVDSドメインの知識を学ぶことができる。
これらの例は、Retrieval-Augmented Generation (RAG)メカニズムを介して検索され、端末固有のデータに対する高い要求を緩和する。
さらに、これらの専門家の間では、追加の手作業による介入を避けるために、自動VDS設計ワークフローが確立されている。
このワークフローでは、LLM反射フレームワークにインスパイアされた自己補正ループが作成される
関連論文リスト
- AgentFrontier: Expanding the Capability Frontier of LLM Agents with ZPD-Guided Data Synthesis [69.06292316741126]
大きな言語モデルエージェントをその能力の最前線でタスクで訓練することは、高度な推論をアンロックする鍵となる。
近縁開発ゾーン(ZPD)の教育理論に着想を得たデータ合成アプローチを導入する。
本稿では,ZPD内に位置する高品質な多分野データを合成する自動パイプラインであるAgentFrontier Engineを提案する。
論文 参考訳(メタデータ) (2025-10-28T17:50:47Z) - Retrieval-augmented GUI Agents with Generative Guidelines [45.75975553907856]
本稿では,推論時にWebチュートリアルを利用する軽量なVLMであるRAG-GUIを提案する。
RAG-GUIは、まず教師付き微調整(SFT)によりウォームスタートし、さらに自己誘導型リジェクションサンプリング微調整(RSF)により改良される。
一貫してベースラインエージェントを上回り、2つのモデルサイズで他の推論ベースラインを2.6%から13.3%上回る。
論文 参考訳(メタデータ) (2025-09-29T02:04:20Z) - VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making [45.02997774119763]
視覚言語モデル(VLM)は、大規模言語モデル(LLM)をマルチモーダルデータに拡張する。
我々の研究は、オフラインからオンラインへの強化学習(RL)の観点から、これらの課題にアプローチする。
論文 参考訳(メタデータ) (2025-05-06T04:51:57Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration [52.25473993987409]
モバイルデバイス操作支援のためのマルチエージェントアーキテクチャであるMobile-Agent-v2を提案する。
アーキテクチャは、計画エージェント、決定エージェント、反射エージェントの3つのエージェントから構成される。
単一エージェントアーキテクチャと比較して,Mobile-Agent-v2ではタスク完了率が30%以上向上していることを示す。
論文 参考訳(メタデータ) (2024-06-03T05:50:00Z) - Do We Really Need a Complex Agent System? Distill Embodied Agent into a Single Model [15.558269067931374]
オープンなエンボディタスクのための階層的知識蒸留フレームワークであるSTEVE-2を提案する。
蒸留後、実施エージェントは専門的なガイダンスなしで複雑なオープンエンドタスクを完了することができる。
論文 参考訳(メタデータ) (2024-04-06T12:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。