論文の概要: A survey of Monte Carlo methods for noisy and costly densities with
application to reinforcement learning
- arxiv url: http://arxiv.org/abs/2108.00490v1
- Date: Sun, 1 Aug 2021 16:47:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:28:42.804528
- Title: A survey of Monte Carlo methods for noisy and costly densities with
application to reinforcement learning
- Title(参考訳): モンテカルロ法による高密度・高密度化と強化学習への応用に関する研究
- Authors: F. Llorente, L. Martino, J. Read, D. Delgado
- Abstract要約: この種の問題は、最適化や強化学習など、多くの現実世界のシナリオで見ることができる。
異なる手法を3つの主要なクラスに分類し、統一された表記法でアルゴリズムの特定のインスタンスを記述する。
可能性のない設定と強化学習に特に注意を払って、様々な応用シナリオについて論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This survey gives an overview of Monte Carlo methodologies using surrogate
models, for dealing with densities which are intractable, costly, and/or noisy.
This type of problem can be found in numerous real-world scenarios, including
stochastic optimization and reinforcement learning, where each evaluation of a
density function may incur some computationally-expensive or even physical
(real-world activity) cost, likely to give different results each time. The
surrogate model does not incur this cost, but there are important trade-offs
and considerations involved in the choice and design of such methodologies. We
classify the different methodologies into three main classes and describe
specific instances of algorithms under a unified notation. A modular scheme
which encompasses the considered methods is also presented. A range of
application scenarios is discussed, with special attention to the
likelihood-free setting and reinforcement learning. Several numerical
comparisons are also provided.
- Abstract(参考訳): 本調査は,モンテカルロ法について,耐え難い,費用がかかる,あるいはうるさい密度を扱うためのサロゲートモデルを用いて概説する。
このような問題は、確率的最適化や強化学習など、多くの実世界のシナリオで見出され、密度関数のそれぞれの評価は、計算的または物理的(実世界の活動)なコストを発生させ、毎回異なる結果を与える可能性がある。
代理モデルは、このコストを伴わないが、そのような方法論の選択と設計に関わる重要なトレードオフと考慮がある。
異なる方法論を3つの主要なクラスに分類し、統一表記法の下で特定のアルゴリズムのインスタンスを記述する。
考慮されたメソッドを包含するモジュラースキームも提示する。
可能性のない設定と強化学習に特に注意を払って、様々な応用シナリオについて論じる。
数値的な比較もいくつかある。
関連論文リスト
- Scalable Structure Learning for Sparse Context-Specific Systems [0.0]
数百の変数にスケールする文脈特化モデルを学習するためのアルゴリズムを提案する。
本手法は, 合成データと実世界の実例でよく動作することを示す。
論文 参考訳(メタデータ) (2024-02-12T16:28:52Z) - Better Understanding Differences in Attribution Methods via Systematic Evaluations [57.35035463793008]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文 参考訳(メタデータ) (2023-03-21T14:24:58Z) - Impossibility Theorems for Feature Attribution [21.88229793890961]
そこで本研究では,適度にリッチなモデルクラスでは,任意の特徴属性法がモデル振る舞いを推測するランダムな推測において,確実に改善できないことを示す。
本研究は, 局所モデル行動の特徴付け, 突発的特徴の同定, アルゴリズム的リコースなど, 一般的なエンドタスクに適用する。
論文 参考訳(メタデータ) (2022-12-22T17:03:57Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文 参考訳(メタデータ) (2022-05-20T20:50:17Z) - Network Estimation by Mixing: Adaptivity and More [2.3478438171452014]
我々は、利用可能な任意のモデルを利用して、個々のパフォーマンスを改善する混合戦略を提案する。
提案手法は計算効率が高く,チューニングがほとんどない。
提案手法は,真のモデルが個々の候補に含まれる場合のオラクル推定と同等に動作することを示す。
論文 参考訳(メタデータ) (2021-06-05T05:17:04Z) - A generalized framework for active learning reliability: survey and
benchmark [0.0]
本研究では,効果的な能動学習戦略を構築するためのモジュラーフレームワークを提案する。
信頼性ベンチマーク問題20の解決策として39の戦略を考案した。
論文 参考訳(メタデータ) (2021-06-03T09:33:59Z) - Misclassification cost-sensitive ensemble learning: A unifying framework [7.90398448280017]
私たちのコントリビューションは、コストに敏感なアンサンブルメソッドに関する包括的で洞察に富んだ概要を提供する統一フレームワークです。
私たちのフレームワークには、AdaBoost、Bagging、Random Forestなど、メソッド間の自然な拡張とアイデアの一般化が含まれています。
論文 参考訳(メタデータ) (2020-07-14T21:18:33Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z) - Marginal likelihood computation for model selection and hypothesis
testing: an extensive review [66.37504201165159]
この記事では、このトピックの最先端に関する総合的な研究について紹介する。
さまざまなテクニックの制限、メリット、コネクション、差異を強調します。
また、不適切な事前利用の問題や解決法についても述べる。
論文 参考訳(メタデータ) (2020-05-17T18:31:58Z) - There and Back Again: Revisiting Backpropagation Saliency Methods [87.40330595283969]
正当性法は,各入力サンプルの重要度マップを作成することによって,モデルの予測を説明する。
このような手法の一般的なクラスは、信号のバックプロパゲートと結果の勾配の分析に基づいている。
本稿では,そのような手法を統一可能な単一のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:58:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。