論文の概要: Option Discovery in the Absence of Rewards with Manifold Analysis
- arxiv url: http://arxiv.org/abs/2003.05878v2
- Date: Wed, 19 Aug 2020 13:53:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 14:04:21.234106
- Title: Option Discovery in the Absence of Rewards with Manifold Analysis
- Title(参考訳): 多様体解析による報酬の欠如によるオプション発見
- Authors: Amitay Bar, Ronen Talmon and Ron Meir
- Abstract要約: 我々は、特定の報酬やタスクの割り当てにアクセスできることなく、体系的にオプションを発見できるアルゴリズムを導出する。
従来の手法とは対照的に,本アルゴリズムはグラフラプラシアンのスペクトルをフル活用する。
- 参考スコア(独自算出の注目度): 16.260113196512865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Options have been shown to be an effective tool in reinforcement learning,
facilitating improved exploration and learning. In this paper, we present an
approach based on spectral graph theory and derive an algorithm that
systematically discovers options without access to a specific reward or task
assignment. As opposed to the common practice used in previous methods, our
algorithm makes full use of the spectrum of the graph Laplacian. Incorporating
modes associated with higher graph frequencies unravels domain subtleties,
which are shown to be useful for option discovery. Using geometric and
manifold-based analysis, we present a theoretical justification for the
algorithm. In addition, we showcase its performance in several domains,
demonstrating clear improvements compared to competing methods.
- Abstract(参考訳): 選択肢は強化学習に有効なツールであり、探索と学習の改善を促進することが示されている。
本稿では,スペクトルグラフ理論に基づくアプローチを提案し,特定の報酬やタスク割り当てを使わずに選択肢を体系的に発見するアルゴリズムを導出する。
従来の手法とは対照的に,本アルゴリズムはグラフラプラシアンのスペクトルをフル活用する。
高いグラフ周波数に関連するモードを組み込むことで、オプション発見に有用であることが示されている。
幾何学的および多様体的解析を用いて,アルゴリズムの理論的正当性を示す。
さらに,いくつかの領域でその性能を実演し,競合する手法と比較して明らかに改善した。
関連論文リスト
- Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning [83.41487567765871]
Skipperはモデルベースの強化学習フレームワークである。
これは、与えられたタスクをより小さく、より管理しやすいサブタスクに自動的に一般化する。
環境の関連部分には、スパースな意思決定と集中した抽象化を可能にする。
論文 参考訳(メタデータ) (2023-09-30T02:25:18Z) - Stochastic Graph Bandit Learning with Side-Observations [4.910658441596583]
基礎となるグラフ構造と報酬ギャップの両方に適応するアルゴリズムを提案する。
我々の知る限りでは、この設定においてギャップ依存の上界を初めて提供するアルゴリズムである。
論文 参考訳(メタデータ) (2023-08-29T08:14:19Z) - Gotta match 'em all: Solution diversification in graph matching matched filters [13.841897638543033]
非常に大きな背景グラフに複数のノイズを埋め込んだテンプレートグラフを見つけるための新しい手法を提案する。
提案手法は,Sussmanらによって提案されたグラフマッチング・マッチング・フィルタ技術に基づいている。
論文 参考訳(メタデータ) (2023-08-25T15:53:30Z) - The Galerkin method beats Graph-Based Approaches for Spectral Algorithms [3.5897534810405403]
我々は機械学習コミュニティを破り、Galerkin手法の統計的および計算的優位性を証明した。
構造化カーネルを用いて大次元の微分演算子を扱うための実装手法を導入する。
私たちは、ディープニューラルネットワークによってパラメータ化された関数など、関数の非線形空間に適用するために、私たちのアプローチ以外のコア原則を拡張します。
論文 参考訳(メタデータ) (2023-06-01T14:38:54Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Graph-Embedded Subspace Support Vector Data Description [98.78559179013295]
一クラス分類のための新しいサブスペース学習フレームワークを提案する。
提案されたフレームワークはグラフ埋め込みという形で問題を提示する。
ベースラインに対する改善されたパフォーマンスと、最近提案された1クラス分類のためのサブスペース学習方法を示す。
論文 参考訳(メタデータ) (2021-04-29T14:30:48Z) - Enhancing Balanced Graph Edge Partition with Effective Local Search [41.4257628524592]
グラフパーティションは、ワークロードバランスを達成し、並列グラフ処理システムにおけるジョブ完了時間を短縮するための重要なコンポーネントです。
本稿では,本問題の局所探索アルゴリズムについて検討し,既存の手法による分割結果をさらに改善する。
論文 参考訳(メタデータ) (2020-12-17T08:58:06Z) - Training Sensitivity in Graph Isomorphism Network [2.487445341407889]
グラフニューラルネットワーク(GNN)は、グラフの低次元表現を学習するための一般的なツールである。
本稿では,多様なベンチマークデータセットを用いて,各モジュールの様々な代替機能について検討する。
論文 参考訳(メタデータ) (2020-08-19T03:50:28Z) - Online Dense Subgraph Discovery via Blurred-Graph Feedback [87.9850024070244]
我々は高密度サブグラフ発見のための新しい学習問題を導入する。
まず,確率の高いほぼ最適解を求めるエッジ時間アルゴリズムを提案する。
そして、理論的保証のあるよりスケーラブルなアルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-06-24T11:37:33Z) - Stochastic Flows and Geometric Optimization on the Orthogonal Group [52.50121190744979]
直交群 $O(d)$ 上の幾何駆動最適化アルゴリズムの新しいクラスを示す。
提案手法は,深層,畳み込み,反復的なニューラルネットワーク,強化学習,フロー,メトリック学習など,機械学習のさまざまな分野に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-03-30T15:37:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。