論文の概要: GAMA: A Neural Neighborhood Search Method with Graph-aware Multi-modal Attention for Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2511.07850v1
- Date: Wed, 12 Nov 2025 01:23:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.506492
- Title: GAMA: A Neural Neighborhood Search Method with Graph-aware Multi-modal Attention for Vehicle Routing Problem
- Title(参考訳): GAMA: グラフ認識型マルチモーダルアテンションを用いた車両走行問題に対するニューラル近傍探索法
- Authors: Xiangling Chen, Yi Mei, Mengjie Zhang,
- Abstract要約: 本稿では,VRPにおけるグラフ対応マルチモーダルアテンションモデルを用いたニューラル近所探索手法であるGAMAを提案する。
GAMAは、問題インスタンスとその進化するソリューションをグラフニューラルネットワークを使用して、異なるモダリティとしてエンコードする。
ゲート融合機構は、マルチモーダル表現をさらに構造化状態に統合し、ポリシーが情報および一般化可能な演算子選択決定を可能にする。
- 参考スコア(独自算出の注目度): 3.6747239734253703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in neural neighborhood search methods have shown potential in tackling Vehicle Routing Problems (VRPs). However, most existing approaches rely on simplistic state representations and fuse heterogeneous information via naive concatenation, limiting their ability to capture rich structural and semantic context. To address these limitations, we propose GAMA, a neural neighborhood search method with Graph-aware Multi-modal Attention model in VRP. GAMA encodes the problem instance and its evolving solution as distinct modalities using graph neural networks, and models their intra- and inter-modal interactions through stacked self- and cross-attention layers. A gated fusion mechanism further integrates the multi-modal representations into a structured state, enabling the policy to make informed and generalizable operator selection decisions. Extensive experiments conducted across various synthetic and benchmark instances demonstrate that the proposed algorithm GAMA significantly outperforms the recent neural baselines. Further ablation studies confirm that both the multi-modal attention mechanism and the gated fusion design play a key role in achieving the observed performance gains.
- Abstract(参考訳): ニューラル近所探索法の最近の進歩は、車両ルーティング問題(VRP)に対処する可能性を示している。
しかし、既存のほとんどのアプローチは、単純化された状態表現に頼り、単純な結合を通して異種情報を融合し、リッチな構造的・意味的なコンテキストを捉える能力を制限する。
これらの制約に対処するため,VRPにおけるグラフ対応マルチモーダルアテンションモデルを用いたニューラル近所探索手法であるGAMAを提案する。
GAMAは、グラフニューラルネットワークを使用して、問題インスタンスとその進化するソリューションを個別のモダリティとしてエンコードし、積み重ねられた自己および横断的なレイヤを通じて、その内部と相互の相互作用をモデル化する。
ゲート融合機構は、マルチモーダル表現をさらに構造化状態に統合し、ポリシーが情報および一般化可能な演算子選択決定を可能にする。
様々な合成およびベンチマークインスタンスで実施された大規模な実験は、提案アルゴリズムGAMAが最近の神経ベースラインを大きく上回っていることを示している。
さらに、マルチモーダルアテンション機構とゲート融合設計の両方が、観測された性能向上を達成する上で重要な役割を担っていることを、アブレーション研究により確認した。
関連論文リスト
- NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.10695425442164]
NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文 参考訳(メタデータ) (2025-10-15T16:25:18Z) - Cooperative Autonomous Driving in Diverse Behavioral Traffic: A Heterogeneous Graph Reinforcement Learning Approach [11.908271732607295]
多様な運転スタイルで異種交通環境をナビゲートすることは、自動運転車にとって大きな課題となる。
本稿では、自動運転車の意思決定性能を向上させるためのエキスパートシステムにより強化された異種グラフ強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-30T04:12:57Z) - Visual Dominance and Emerging Multimodal Approaches in Distracted Driving Detection: A Review of Machine Learning Techniques [3.378738346115004]
引き離された運転は、世界中の道路交通事故と死者の大きな原因であり続けている。
機械学習(ML)とディープラーニング(DL)の最近の進歩は、主に注意散逸を検出する視覚データに焦点を当てている。
本稿では,ML/DL技術を用いた視覚的,センサベース,マルチモーダル,新興モダリティを横断する運転検出のための74つの研究を体系的に評価する。
論文 参考訳(メタデータ) (2025-05-04T02:51:00Z) - Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - GASE: Graph Attention Sampling with Edges Fusion for Solving Vehicle Routing Problems [6.084414764415137]
車両のルーティング問題を解決するためにEdges Fusionフレームワークを用いた適応型グラフ注意サンプリングを提案する。
提案手法は,既存の手法を2.08%-6.23%上回り,より強力な一般化能力を示す。
論文 参考訳(メタデータ) (2024-05-21T03:33:07Z) - Multi-Agent Reinforcement Learning for Power Control in Wireless
Networks via Adaptive Graphs [1.1861167902268832]
多エージェント深部強化学習(MADRL)は、電力制御のような幅広い複雑な最適化問題に対処するための有望な手法として登場した。
本稿では,これらの課題を緩和する有効な手段として,分散エージェント間の通信誘導構造としてグラフを用いることを提案する。
論文 参考訳(メタデータ) (2023-11-27T14:25:40Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - Group Gated Fusion on Attention-based Bidirectional Alignment for
Multimodal Emotion Recognition [63.07844685982738]
本稿では、LSTM隠蔽状態上の注目に基づく双方向アライメントネットワークで構成されるGBAN(Gated Bidirectional Alignment Network)と呼ばれる新しいモデルを提案する。
LSTMの最後の隠れ状態よりもアテンション整列表現の方が有意に優れていたことを実証的に示す。
提案したGBANモデルは、IEMOCAPデータセットにおける既存の最先端マルチモーダルアプローチよりも優れている。
論文 参考訳(メタデータ) (2022-01-17T09:46:59Z) - Joint Demand Prediction for Multimodal Systems: A Multi-task
Multi-relational Spatiotemporal Graph Neural Network Approach [7.481812882780837]
本研究では,マルチモーダル需要予測のためのマルチリレーショナルグラフニューラルネットワーク(MRGNN)を提案する。
マルチリレーショナルグラフニューラルネットワーク(MRGNN)を導入し,異種空間依存性を捉える。
実験はニューヨーク市の実際のデータセットを用いて行われる。
論文 参考訳(メタデータ) (2021-12-15T12:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。