論文の概要: Heterogeneous Multi-Agent Reinforcement Learning with Attention for Cooperative and Scalable Feature Transformation
- arxiv url: http://arxiv.org/abs/2511.21934v1
- Date: Wed, 26 Nov 2025 21:45:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.307828
- Title: Heterogeneous Multi-Agent Reinforcement Learning with Attention for Cooperative and Scalable Feature Transformation
- Title(参考訳): 協調的・スケーラブルな特徴変換を考慮した不均一なマルチエージェント強化学習
- Authors: Tao Zhe, Huazhen Fang, Kunpeng Liu, Qian Lou, Tamzidul Hoque, Dongjie Wang,
- Abstract要約: 特徴変換は、数学的特徴交差を通じて情報的特徴を生成することにより、下流タスク性能を向上させる。
近年の研究では、より効果的な試行錯誤方法を通じて、従来のアプローチを強化するために強化学習を採用している。
協調的かつスケーラブルな特徴変換を実現するために,新しい異種マルチエージェントRLフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.732611237889326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature transformation enhances downstream task performance by generating informative features through mathematical feature crossing. Despite the advancements in deep learning, feature transformation remains essential for structured data, where deep models often struggle to capture complex feature interactions. Prior literature on automated feature transformation has achieved success but often relies on heuristics or exhaustive searches, leading to inefficient and time-consuming processes. Recent works employ reinforcement learning (RL) to enhance traditional approaches through a more effective trial-and-error way. However, two limitations remain: 1) Dynamic feature expansion during the transformation process, which causes instability and increases the learning complexity for RL agents; 2) Insufficient cooperation and communication between agents, which results in suboptimal feature crossing operations and degraded model performance. To address them, we propose a novel heterogeneous multi-agent RL framework to enable cooperative and scalable feature transformation. The framework comprises three heterogeneous agents, grouped into two types, each designed to select essential features and operations for feature crossing. To enhance communication among these agents, we implement a shared critic mechanism that facilitates information exchange during feature transformation. To handle the dynamically expanding feature space, we tailor multi-head attention-based feature agents to select suitable features for feature crossing. Additionally, we introduce a state encoding technique during the optimization process to stabilize and enhance the learning dynamics of the RL agents, resulting in more robust and reliable transformation policies. Finally, we conduct extensive experiments to validate the effectiveness, efficiency, robustness, and interpretability of our model.
- Abstract(参考訳): 特徴変換は、数学的特徴交差を通じて情報的特徴を生成することにより、下流タスク性能を向上させる。
ディープラーニングの進歩にもかかわらず、機能変換は構造化データに必須であり、深層モデルは複雑な機能相互作用を捉えるのにしばしば苦労する。
自動特徴変換に関する以前の文献は成功しているが、しばしばヒューリスティックや網羅的な探索に依存しており、非効率で時間を要するプロセスに繋がる。
近年の研究では、より効果的な試行錯誤手法によって従来のアプローチを強化するために強化学習(RL)を採用している。
しかし、以下の2つの制限がある。
1) 変換過程における動的特徴拡張は、不安定を引き起こし、RLエージェントの学習複雑性を増大させる。
2) エージェント間の協調やコミュニケーションが不十分なため, 最適機能横断操作や劣化モデルの性能が低下する。
そこで我々は,協調的かつスケーラブルな特徴変換を実現するために,新しい異種マルチエージェントRLフレームワークを提案する。
このフレームワークは3つの異種エージェントから構成されており、それぞれが機能横断に不可欠な特徴と操作を選択するように設計されている。
これらのエージェント間のコミュニケーションを強化するために,特徴変換時の情報交換を容易にする共有批評家機構を実装した。
動的に拡大する特徴空間に対処するために,多視点注目型特徴エージェントを調整し,特徴交差に適した特徴を選択する。
さらに、RLエージェントの学習ダイナミクスを安定化・強化する最適化プロセス中に状態符号化技術を導入し、より堅牢で信頼性の高い変換ポリシーを実現する。
最後に、モデルの有効性、効率性、堅牢性、解釈可能性を検証するための広範な実験を行う。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - MEJO: MLLM-Engaged Surgical Triplet Recognition via Inter- and Intra-Task Joint Optimization [52.149337961205624]
手術用三重項認識のためのタスク間最適化とタスク内最適化を両立する枠組みを提案する。
タスク間最適化のために、タスク共有およびタスク固有コンポーネントに表現を分解する共有特徴分散学習スキーム(S$2$D)を導入する。
タスク内最適化競合に対して,正負の曖昧さを識別・再バランスするコーディネート・グラディエント・ラーニング(CGL)戦略を開発する。
論文 参考訳(メタデータ) (2025-09-16T09:48:52Z) - Collaborative Multi-Agent Reinforcement Learning for Automated Feature Transformation with Graph-Driven Path Optimization [17.588657338437812]
グラフ駆動経路最適化により特徴工学を自動化する多エージェント強化学習フレームワークであるTCTOを提案する。
フレームワークの中核的なイノベーションは、ノードとしての特徴をモデル化し、エッジとして変換する、進化する相互作用グラフにある。
包括的実験とケーススタディを行い、さまざまなデータセットで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-04-24T08:16:13Z) - Automation and Feature Selection Enhancement with Reinforcement Learning (RL) [0.0]
決定木と統合された強化学習は、特徴知識、状態表現、選択効率を向上させる。
モンテカルロをベースとした単エージェント特徴選択法である強化特徴選択(MCRFS)は計算負担を軽減する。
機能とインスタンスをまとめて選択し、それら間のインタラクションをキャプチャする、デュアルエージェントのRLフレームワークも導入された。
論文 参考訳(メタデータ) (2025-03-15T04:30:55Z) - Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.35348425288859]
RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文 参考訳(メタデータ) (2025-03-03T12:54:54Z) - Skip-Layer Attention: Bridging Abstract and Detailed Dependencies in Transformers [56.264673865476986]
本稿では、Transformerモデルを強化するためのSLA(Skip-Layer Attention)を提案する。
SLAは、高レベルの抽象機能と低レベルの詳細の間の依存関係をキャプチャするモデルの能力を改善します。
我々の実装は、与えられたレイヤ内のクエリが、現在のレイヤと前のレイヤの両方のキーと値とやり取りできるようにすることで、Transformerの機能を拡張します。
論文 参考訳(メタデータ) (2024-06-17T07:24:38Z) - Feature Interaction Aware Automated Data Representation Transformation [27.26916497306978]
我々は,マルコフ決定過程をカスケードした階層的強化学習構造を開発し,特徴選択と操作選択を自動化する。
我々は、選択された特徴間の相互作用強度に基づいてエージェントに報酬を与える。その結果、人間の意思決定をエミュレートする特徴空間をインテリジェントかつ効率的に探索する。
論文 参考訳(メタデータ) (2023-09-29T06:48:16Z) - Feature Decoupling-Recycling Network for Fast Interactive Segmentation [79.22497777645806]
近年のインタラクティブセグメンテーション手法では,入力としてソースイメージ,ユーザガイダンス,従来予測されていたマスクを反復的に取り込んでいる。
本稿では,本質的な相違点に基づいてモデリングコンポーネントを分離するFDRN(Feature Decoupling-Recycling Network)を提案する。
論文 参考訳(メタデータ) (2023-08-07T12:26:34Z) - Traceable Group-Wise Self-Optimizing Feature Transformation Learning: A
Dual Optimization Perspective [33.45878576396101]
特徴変換は、既存の特徴を数学的に洗練することにより、効果的な表現空間を再構築することを目的としている。
既存の研究は主にドメイン知識に基づく特徴工学や学習潜在表現に重点を置いている。
最初の作業は、新しい自己最適化フレームワークを導入することで、この課題への先駆的な一歩を踏み出したのです。
論文 参考訳(メタデータ) (2023-06-29T12:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。