Fugu-MT 論文翻訳(概要): Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving

論文の概要: Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving

arxiv url: http://arxiv.org/abs/2410.08854v1
Date: Fri, 11 Oct 2024 14:30:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-30 21:35:51.515188
Title: Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving
Title（参考訳）: ハイブリッドLDM-DDQNを用いたV2I通信と自律運転の協調最適化
Authors: Zijiang Yan, Hao Zhou, Hina Tabassum, Xue Liu,
Abstract要約: 大規模言語モデル(LLM)は、その卓越した推論と理解能力により、最近かなりの関心を集めている。本研究は、車両間通信(V2I)と自律運転(AD)ポリシーを共同で最適化することを目的として、車載ネットワークにLLMを適用することを検討する。
参考スコア（独自算出の注目度）: 23.676853060080614
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Large language models (LLMs) have received considerable interest recently due to their outstanding reasoning and comprehension capabilities. This work explores applying LLMs to vehicular networks, aiming to jointly optimize vehicle-to-infrastructure (V2I) communications and autonomous driving (AD) policies. We deploy LLMs for AD decision-making to maximize traffic flow and avoid collisions for road safety, and a double deep Q-learning algorithm (DDQN) is used for V2I optimization to maximize the received data rate and reduce frequent handovers. In particular, for LLM-enabled AD, we employ the Euclidean distance to identify previously explored AD experiences, and then LLMs can learn from past good and bad decisions for further improvement. Then, LLM-based AD decisions will become part of states in V2I problems, and DDQN will optimize the V2I decisions accordingly. After that, the AD and V2I decisions are iteratively optimized until convergence. Such an iterative optimization approach can better explore the interactions between LLMs and conventional reinforcement learning techniques, revealing the potential of using LLMs for network optimization and management. Finally, the simulations demonstrate that our proposed hybrid LLM-DDQN approach outperforms the conventional DDQN algorithm, showing faster convergence and higher average rewards.
Abstract（参考訳）: 大規模言語モデル(LLM)は、その卓越した推論と理解能力により、最近かなりの関心を集めている。本研究は、車両間通信(V2I)と自律運転(AD)ポリシーを共同で最適化することを目的として、車載ネットワークにLLMを適用することを検討する。我々は,交通流の最大化と道路安全の衝突を避けるためにAD意思決定のためのLCMをデプロイし,V2I最適化のためのダブルディープQ-ラーニングアルゴリズム(DDQN)を用いて,受信したデータレートを最大化し,頻繁なハンドオーバを低減する。特に LLM 対応 AD では, 従来検討されていた AD 体験をユークリッド距離を用いて識別し, 過去の善と悪の判断から LLM を学習し, さらなる改善を図る。次に、LLMベースのAD決定はV2I問題の状態の一部となり、DDQNはV2Iの決定を最適化する。その後、ADとV2Iの決定は収束するまで反復的に最適化される。このような反復的最適化アプローチは、LLMと従来の強化学習技術との相互作用をよりよく探求し、ネットワーク最適化と管理にLLMを使うことの可能性を明らかにする。最後に,提案手法が従来のDDQNアルゴリズムよりも優れており,より高速な収束と平均報酬が期待できることを示す。

関連論文リスト

A Large Language Model-Enhanced Q-learning for Capacitated Vehicle Routing Problem with Time Windows [3.0518581575184225]
本稿では、CVRPTW(Capacitated Vehicle Routing Problem with Time Windows)に対処する新しいQラーニングフレームワークを提案する。我々のフレームワークは従来のQ-ラーニングに比べて平均7.3%のコスト削減を実現しており、収束に必要なトレーニングステップは少ない。
論文参考訳（メタデータ） (2025-05-09T16:45:43Z)
Automating the loop in traffic incident management on highway [11.001455003481903]
本稿では,大規模言語モデル(LLM)を交通事故管理のための意思決定支援システムに統合することにより,意思決定を支援する革新的なソリューションを提案する。本稿では,(1)自然言語相互作用の柔軟性と最適化手法の堅牢性を両立するLLM+最適化ハイブリッド,(2)LLM機能のみを用いた意思決定を自律的に生成するフルLLMアプローチを提案する。実験結果から,両手法が有望性を示す一方で,LLM+最適化ソリューションは信頼性が優れ,重要なアプリケーションに特に適していることが示唆された。
論文参考訳（メタデータ） (2025-03-15T11:22:13Z)
Confident or Seek Stronger: Exploring Uncertainty-Based On-device LLM Routing From Benchmarking to Generalization [61.02719787737867]
大規模言語モデル(LLM)はますますエッジデバイスにデプロイされ、民主化されている。 1つの有望な解決策は不確実性に基づくSLMルーティングであり、SLM上での低信頼応答が発生すると、高い要求を強いLCMにオフロードする。我々は1500以上の設定でSLMからLLMへの不確実性駆動型ルーティング戦略のベンチマークと一般化を包括的に調査する。
論文参考訳（メタデータ） (2025-02-06T18:59:11Z)
Can Large Language Models Be Trusted as Evolutionary Optimizers for Network-Structured Combinatorial Problems? [8.082897040940447]
大規模言語モデル(LLM)は、言語理解とさまざまなドメイン間の推論において強力な能力を示している。本研究では,問題構造に係わるLLMの能力を評価するための体系的枠組みを提案する。我々は、よく使われる進化的手法(EVO)を採用し、LLM演算子の出力忠実度を厳格に評価する包括的評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-25T05:19:19Z)
Large Language Models (LLMs) as Traffic Control Systems at Urban Intersections: A New Paradigm [5.233512464561313]
本研究では,Large Language Models (LLM) をトラヒックコントローラとして利用することで,トラヒック制御システムに新たなアプローチを提案する。この研究は、論理的推論、シーン理解、意思決定能力を利用してスループットを最適化し、リアルタイムで交通状況に基づいたフィードバックを提供する。
論文参考訳（メタデータ） (2024-11-16T19:23:52Z)
LLM-based Optimization of Compound AI Systems: A Survey [64.39860384538338]
複合AIシステムでは、LLMコール、レトリバー、コードインタプリタ、ツールなどのコンポーネントが相互接続される。近年の進歩により, LLM を用いたパラメータのエンドツーエンド最適化が可能となった。本稿では,複合AIシステムのLCMに基づく最適化の原理と動向について述べる。
論文参考訳（メタデータ） (2024-10-21T18:06:25Z)
Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文参考訳（メタデータ） (2024-10-10T17:00:06Z)
Making Large Language Models Better Planners with Reasoning-Decision Alignment [70.5381163219608]
マルチモーダリティ強化LLMに基づくエンドツーエンド意思決定モデルを提案する。ペア化されたCoTと計画結果との推論・決定アライメントの制約を提案する。提案する大規模言語プランナをRDA-Driverとして推論・決定アライメントする。
論文参考訳（メタデータ） (2024-08-25T16:43:47Z)
FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models [50.331708897857574]
本稿では,高度に訓練された高密度FFNを余分なサブネットワークに分解する新しいアプローチであるFacterLLMを紹介する。 FactorLLMは、最大85%のモデル性能を確保しながら、推論速度を30%以上増加させながら、ソースモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-08-15T16:45:16Z)
Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.16747639440893]
大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文参考訳（メタデータ） (2024-08-07T08:43:32Z)
DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-06-11T06:31:03Z)
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning [30.25610464801255]
大規模言語モデル(LLM)は、データ規則や倫理的AIプラクティスに従うための効果的な非学習メカニズムの必要性を強調している。 LLMアンラーニングの研究への関心は高まりつつあるが、LLMアンラーニングの選択の影響は未解明のままである。我々はLLMアンラーニングにおける選択の重要性を初めて明らかにし、二階最適化と影響アンラーニングの明確な関連性を確立した。
論文参考訳（メタデータ） (2024-04-28T16:31:32Z)
Toward Rapid, Optimal, and Feasible Power Dispatch through Generalized Neural Mapping [0.0]
パワーディスパッチ問題を解決するための学習ベースアプローチとして LOOP-LC 2.0 を提案する。 LOOP-LC 2.0フレームワークの顕著な利点は、ソリューションのほぼ最適性と厳密な実現性を保証する能力である。本稿では, LOOP-LC 2.0法の有効性を, 学習速度, 計算時間, 最適性, ソリューション実現可能性の観点から示す。
論文参考訳（メタデータ） (2023-11-08T17:02:53Z)
Federated Reinforcement Learning for Resource Allocation in V2X Networks [46.6256432514037]
資源配分はV2Xネットワークの性能に大きな影響を及ぼす。リソース割り当てのための既存のアルゴリズムのほとんどは、最適化や機械学習に基づいている。本稿では,連合型強化学習の枠組みの下で,V2Xネットワークにおける資源配分について検討する。
論文参考訳（メタデータ） (2023-10-15T15:26:54Z)
LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [87.1164964709168]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文参考訳（メタデータ） (2023-10-04T17:59:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。