Fugu-MT 論文翻訳(概要): Heterogeneous Knowledge for Augmented Modular Reinforcement Learning

論文の概要: Heterogeneous Knowledge for Augmented Modular Reinforcement Learning

arxiv url: http://arxiv.org/abs/2306.01158v2
Date: Sun, 14 Apr 2024 10:27:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-17 00:17:02.238756
Title: Heterogeneous Knowledge for Augmented Modular Reinforcement Learning
Title（参考訳）: モジュール強化学習のための不均質な知識
Authors: Lorenz Wolf, Mirco Musolesi,
Abstract要約: これらの制約に対処するため、AMRL(Augmented Modular Reinforcement Learning)を提案する。我々のフレームワークは、セレクタを使用して異種モジュールを結合し、異なる種類の知識表現と処理機構をシームレスに組み込む。
参考スコア（独自算出の注目度）: 2.8008279194923245
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Existing modular Reinforcement Learning (RL) architectures are generally based on reusable components, also allowing for ``plug-and-play'' integration. However, these modules are homogeneous in nature - in fact, they essentially provide policies obtained via RL through the maximization of individual reward functions. Consequently, such solutions still lack the ability to integrate and process multiple types of information (i.e., heterogeneous knowledge representations), such as rules, sub-goals, and skills from various sources. In this paper, we discuss several practical examples of heterogeneous knowledge and propose Augmented Modular Reinforcement Learning (AMRL) to address these limitations. Our framework uses a selector to combine heterogeneous modules and seamlessly incorporate different types of knowledge representations and processing mechanisms. Our results demonstrate the performance and efficiency improvements, also in terms of generalization, that can be achieved by augmenting traditional modular RL with heterogeneous knowledge sources and processing mechanisms.
Abstract（参考訳）: 既存のモジュラー強化学習(RL)アーキテクチャは一般に再利用可能なコンポーネントに基づいており、 ``plug-and-play' 統合も可能である。しかし、これらの加群は本質的に同質であり、実際には、個々の報酬関数の最大化を通じて RL を通じて得られるポリシーを本質的に提供する。その結果、これらのソリューションには、ルール、サブゴール、様々なソースからのスキルなど、複数の種類の情報(異種知識表現)の統合と処理能力がない。本稿では、異種知識の実践例をいくつか紹介し、これらの制約に対処するための拡張モジュール強化学習(AMRL)を提案する。我々のフレームワークは、セレクタを使用して異種モジュールを結合し、異なる種類の知識表現と処理機構をシームレスに組み込む。本研究は, 従来のモジュールRLを多種多様な知識源と処理機構で拡張することにより, 性能と効率性の向上を, 一般化の観点から示すものである。

関連論文リスト

UNIFORM: Unifying Knowledge from Large-scale and Diverse Pre-trained Models [62.76435672183968]
UNIFORMと呼ばれる新しいフレームワークを導入し、多様なオフザシェルフモデルから1つの学生モデルへ知識を伝達する。本稿では,ロジットレベルでも機能レベルでも知識のコンセンサスを捉えるための,専用の投票機構を提案する。 UNIFORMは、強い知識伝達ベースラインに比べて、教師なしオブジェクト認識性能を効果的に向上することを示した。
論文参考訳（メタデータ） (2025-08-27T00:56:11Z)
Selection and Exploitation of High-Quality Knowledge from Large Language Models for Recommendation [10.585520748427033]
このフレームワークは、知識フィルタリングモジュールと埋め込み空間アライメントモジュールの2つの重要なコンポーネントで構成されている。実験結果は知識フィルタリングとアライメントモジュールの両方の必要性と有効性を検証する。抽出者のみのトレーニング戦略は、知識強化された推奨に対する新たな視点を提供する。
論文参考訳（メタデータ） (2025-08-10T08:03:01Z)
Efficiently Enhancing General Agents With Hierarchical-categorical Memory [0.5919433278490629]
パラメータ更新なしで学習できる汎用エージェントであるEHCを紹介する。 EHCは階層型メモリ検索(HMR)モジュールとタスクカテゴリ指向体験学習(TOEL)モジュールで構成される。
論文参考訳（メタデータ） (2025-05-28T06:12:51Z)
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models [75.25348392263676]
オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-26T08:18:33Z)
Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation [77.10390725623125]
検索強化世代(RAG)は知識範囲の拡大に広く利用されている。 RAGは、オープンドメインの質問応答のような知識集約的なタスクを約束しているので、複雑なタスクやインテリジェントアシスタントへの幅広い応用は、その実用性をさらに進歩させてきた。本稿では、RAGが内部(パラメトリック)知識と外部(検索)知識を統合する本質的なメカニズムを体系的に検討する。
論文参考訳（メタデータ） (2025-05-17T13:13:13Z)
UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。複数のモダリティにまたがる8つのベンチマークでUniversalRAGを検証する。
論文参考訳（メタデータ） (2025-04-29T13:18:58Z)
Synergistic Fusion of Multi-Source Knowledge via Evidence Theory for High-Entropy Alloy Discovery [0.24669069937937935]
本稿では,計算資料データセットから抽出した知識と,大規模言語モデル(LLM)を用いた科学文献から抽出したドメイン知識を組み合わせたフレームワークを提案する。このアプローチの中心的な特徴は元素置換性を明確に考慮することであり、化学的に類似した元素を同定し、望ましいHEAを安定にするために交換することができる。本フレームワークは, 候補HEA組成の相安定性を予測し, いずれの合金系においても系統的に評価する。
論文参考訳（メタデータ） (2025-02-20T15:10:00Z)
GIVE: Structured Reasoning with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを統合する新しい推論フレームワークである。本手法は,ゴールド回答検索ではなく,専門家の問題解決に類似した論理的・段階的推論手法を提案する。
論文参考訳（メタデータ） (2024-10-11T03:05:06Z)
Identifiable Causal Representation Learning: Unsupervised, Multi-View, and Multi-Environment [10.814585613336778]
因果表現学習は、機械学習のコアとなる強みと因果性を組み合わせることを目的としている。この論文は、CRLが直接の監督なしに何が可能であるかを調査し、理論的基礎に寄与する。
論文参考訳（メタデータ） (2024-06-19T09:14:40Z)
MATTER: Memory-Augmented Transformer Using Heterogeneous Knowledge Sources [12.783393023641505]
我々は、MATTERと呼ばれる効率的なメモリ拡張変換器を導入する。 MATTERは、固定長のニューラルメモリの形で、非構造化ソース(パラグラフ)と半構造化ソース(QAペア)の両方から読み取る。提案モデルでは,従来のQAベンチマークにおいて,精度と速度の両面で,既存の効率的な検索強化モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-06-07T06:35:37Z)
Cross-Training with Multi-View Knowledge Fusion for Heterogenous Federated Learning [13.796783869133531]
本稿では,多視点情報を活用したクロストレーニング手法により,フェデレーション学習を促進する新しい手法を提案する。具体的には、FedCTと呼ばれる提案手法には、3つの主要なモジュールが含まれており、整合性を考慮した知識放送モジュールはモデルの割り当て戦略を最適化することを目的としている。多視点知識誘導表現学習モジュールは、グローバルな視点とローカルな視点の両方から融合した知識を活用し、モデル交換前後の局所的な知識の保存を強化する。ミックスアップベースの機能拡張モジュールは、豊富な情報を集約して、機能空間の多様性をさらに高める。
論文参考訳（メタデータ） (2024-05-30T13:27:30Z)
MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities [72.68829963458408]
異種モデルのパラメータ空間のギャップを埋めることを学ぶMergeNetを提案する。 MergeNetの中核となるメカニズムはパラメータアダプタにあり、ソースモデルの低ランクパラメータをクエリすることで動作する。 MergeNetは両方のモデルと共に学習され、我々のフレームワークは、現在のステージに関する知識を動的に転送し、適応することができます。
論文参考訳（メタデータ） (2024-04-20T08:34:39Z)
Self-Supervised Representation Learning with Meta Comprehensive Regularization [11.387994024747842]
既存の自己管理フレームワークに組み込まれたCompMod with Meta Comprehensive Regularization (MCR)というモジュールを導入する。提案したモデルを双方向最適化機構により更新し,包括的特徴を捉える。本稿では,情報理論と因果対実的視点から提案手法の理論的支援を行う。
論文参考訳（メタデータ） (2024-03-03T15:53:48Z)
Promoting Generalization for Exact Solvers via Adversarial Instance Augmentation [62.738582127114704]
Adarは、模倣学習ベース(ILベース)と強化学習ベース(RLベース)の両方の一般化を理解し、改善するためのフレームワークである。
論文参考訳（メタデータ） (2023-10-22T03:15:36Z)
Modular Deep Learning [120.36599591042908]
トランスファーラーニングは近年、機械学習の主要なパラダイムとなっている。負の干渉を伴わずに複数のタスクを専門とするモデルを開発する方法はまだ不明である。これらの課題に対する有望な解決策として、モジュール型ディープラーニングが登場した。
論文参考訳（メタデータ） (2023-02-22T18:11:25Z)
Meta-Causal Feature Learning for Out-of-Distribution Generalization [71.38239243414091]
本稿では,協調タスク生成モジュール (BTG) とメタ因果特徴学習モジュール (MCFL) を含む,バランス付きメタ因果学習器 (BMCL) を提案する。 BMCLは、分類のためのクラス不変の視覚領域を効果的に識別し、最先端の手法の性能を向上させるための一般的なフレームワークとして機能する。
論文参考訳（メタデータ） (2022-08-22T09:07:02Z)
Is a Modular Architecture Enough? [80.32451720642209]
我々は、シンプルで既知のモジュラーデータ分散のレンズを通して、共通のモジュラーアーキテクチャを徹底的に評価する。モジュール化と疎結合のメリットを強調し、モジュール化システムの最適化において直面する課題に関する洞察を明らかにします。
論文参考訳（メタデータ） (2022-06-06T16:12:06Z)
Leveraging class abstraction for commonsense reinforcement learning via residual policy gradient methods [23.199881381599617]
本稿では,オープンソース知識グラフに存在するサブクラス関係を利用して,特定のオブジェクトを抽象化する手法を提案する。そこで我々は,クラス階層内の抽象レベルをまたいだ知識を統合可能な残留ポリシー勾配法を開発した。
論文参考訳（メタデータ） (2022-01-28T14:03:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。