論文の概要: SupRB: A Supervised Rule-based Learning System for Continuous Problems
- arxiv url: http://arxiv.org/abs/2002.10295v1
- Date: Mon, 24 Feb 2020 14:54:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 02:37:00.912984
- Title: SupRB: A Supervised Rule-based Learning System for Continuous Problems
- Title(参考訳): SupRB:継続的問題解決のためのルールベース学習システム
- Authors: Michael Heider and David P\"atzel and J\"org H\"ahner
- Abstract要約: SupRBは、例から品質関数の近似を学習する。
そして、最適な選択をすることができるだけでなく、与えられた状況における選択の質を予測することもできる。
SupRBの応用分野の1つは工業機械のパラメトリゼーションである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose the SupRB learning system, a new Pittsburgh-style learning
classifier system (LCS) for supervised learning on multi-dimensional continuous
decision problems. SupRB learns an approximation of a quality function from
examples (consisting of situations, choices and associated qualities) and is
then able to make an optimal choice as well as predict the quality of a choice
in a given situation. One area of application for SupRB is parametrization of
industrial machinery. In this field, acceptance of the recommendations of
machine learning systems is highly reliant on operators' trust. While an
essential and much-researched ingredient for that trust is prediction quality,
it seems that this alone is not enough. At least as important is a
human-understandable explanation of the reasoning behind a recommendation.
While many state-of-the-art methods such as artificial neural networks fall
short of this, LCSs such as SupRB provide human-readable rules that can be
understood very easily. The prevalent LCSs are not directly applicable to this
problem as they lack support for continuous choices. This paper lays the
foundations for SupRB and shows its general applicability on a simplified model
of an additive manufacturing problem.
- Abstract(参考訳): 多次元連続決定問題における教師あり学習のための新しいピッツバーグスタイル学習分類システム(LCS)であるSupRB学習システムを提案する。
suprbは、例(状況、選択、関連する品質)から品質関数の近似を学び、最適な選択を行い、与えられた状況において選択の質を予測することができる。
SupRBの応用分野の1つは工業機械のパラメトリゼーションである。
この分野では、機械学習システムの推奨を受け入れることは、オペレーターの信頼に大きく依存している。
その信頼に欠かせない、広く研究されている要素は予測品質であるが、それだけでは不十分である。
少なくとも重要なことは、リコメンデーションの背後にある理由を人間には理解できない説明である。
人工ニューラルネットワークのような最先端の手法はこれには不足しているが、suprbのようなlcssは、非常に容易に理解可能な、可読性のあるルールを提供する。
一般的なLCSは、連続的な選択のサポートがないため、この問題に直接適用されない。
本稿では,SupRBの基礎を概説し,加法製造問題の単純化モデルに適用可能性を示す。
関連論文リスト
- LaRS: Latent Reasoning Skills for Chain-of-Thought Reasoning [61.7853049843921]
Chain-of-Thoughting(CoT)プロンプトは、大規模言語モデル(LLM)のための一般的なコンテキスト内学習手法である。
本稿では、教師なし学習を用いて有理数の潜在空間表現を生成するLaRS(Lalatnt Reasoning Skills)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-07T20:36:10Z) - Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.63807209414789]
我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文 参考訳(メタデータ) (2023-03-28T13:47:16Z) - Towards Unbounded Machine Unlearning [13.31957848633701]
我々は,異なるアプリケーション (RB, RC, UP) に対するアンラーニングを,それぞれ独自のデシラタ,忘れるための定義,および品質を忘れるための関連する指標をもって研究する。
UPでは,非学習者に対する強力なメンバーシップ推論攻撃の新たな適応を提案する。
また、RB, RC, UPの異なるアプリケーション依存メトリクス間で品質を忘れる上で、一貫してトップパフォーマーである新しいアンラーニングアルゴリズムであるSCRUBを提案する。
論文 参考訳(メタデータ) (2023-02-20T10:15:36Z) - Explainability in reinforcement learning: perspective and position [1.299941371793082]
本稿では, 説明可能なRL領域における既存手法の体系的概要について述べる。
新しく統合された分類法を提案し、既存の分類を構築・拡張する。
論文 参考訳(メタデータ) (2022-03-22T09:00:13Z) - Separating Rule Discovery and Global Solution Composition in a Learning
Classifier System [0.0]
本稿では,特に産業シナリオに特化して設計された,容易に解釈可能なルールベース学習システムを提案する。
システムの主な利点の1つは、ルールの条件とどのルールが問題に対する解決策を構成するかを別々に進化させることである。
SupRB2の評価結果はXCSFに匹敵するが,モデル構造を容易に制御できる。
論文 参考訳(メタデータ) (2022-02-03T16:45:05Z) - RvS: What is Essential for Offline RL via Supervised Learning? [77.91045677562802]
近年の研究では、時間差(TD)のない教師あり学習だけでオフラインRLに極めて効果的であることが示されている。
あらゆる環境スイートにおいて、2層フィードフォワードによる可能性の最大化は競争力がある。
彼らはまた、ランダムデータに対して比較的弱い既存のRvS法の限界を探索する。
論文 参考訳(メタデータ) (2021-12-20T18:55:16Z) - Exploring Bayesian Deep Learning for Urgent Instructor Intervention Need
in MOOC Forums [58.221459787471254]
大規模なオープンオンラインコース(MOOC)は、その柔軟性のおかげで、eラーニングの一般的な選択肢となっている。
多くの学習者とその多様な背景から、リアルタイムサポートの提供は課税されている。
MOOCインストラクターの大量の投稿と高い作業負荷により、インストラクターが介入を必要とするすべての学習者を識別できる可能性は低いです。
本稿では,モンテカルロドロップアウトと変分推論という2つの手法を用いて,学習者によるテキスト投稿のベイジアン深層学習を初めて検討する。
論文 参考訳(メタデータ) (2021-04-26T15:12:13Z) - Efficient time stepping for numerical integration using reinforcement
learning [0.15393457051344295]
機械学習とメタラーニングに基づくデータ駆動型タイムステッピング方式を提案する。
まず、1つまたは複数の基礎学習者(非滑らかまたはハイブリッドシステムの場合)はRLを使用して訓練されます。
次に、メタ学習者は(システムの状態に応じて)現在の状況に最適と思われる基礎学習者を選択する訓練を受ける。
論文 参考訳(メタデータ) (2021-04-08T07:24:54Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - An Information-Theoretic Approach to Personalized Explainable Machine
Learning [92.53970625312665]
本稿では,予測とユーザ知識のための簡易確率モデルを提案する。
説明と予測の間の条件付き相互情報による説明の効果を定量化する。
論文 参考訳(メタデータ) (2020-03-01T13:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。