論文の概要: Learning to Defer to a Population: A Meta-Learning Approach
- arxiv url: http://arxiv.org/abs/2403.02683v1
- Date: Tue, 5 Mar 2024 06:10:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 15:59:07.760046
- Title: Learning to Defer to a Population: A Meta-Learning Approach
- Title(参考訳): 人口に対応するための学習:メタラーニングアプローチ
- Authors: Dharmesh Tailor, Aditya Patra, Rajeev Verma, Putra Manggala, Eric
Nalisnick
- Abstract要約: テスト時に目に見えない専門家に対処できるL2Dシステムを定式化します。
テストポイントに類似したコンテキストセット内のポイントを検索できるアテンションメカニズムを採用しています。
実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検討した。
- 参考スコア(独自算出の注目度): 4.980250354893495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The learning to defer (L2D) framework allows autonomous systems to be safe
and robust by allocating difficult decisions to a human expert. All existing
work on L2D assumes that each expert is well-identified, and if any expert were
to change, the system should be re-trained. In this work, we alleviate this
constraint, formulating an L2D system that can cope with never-before-seen
experts at test-time. We accomplish this by using meta-learning, considering
both optimization- and model-based variants. Given a small context set to
characterize the currently available expert, our framework can quickly adapt
its deferral policy. For the model-based approach, we employ an attention
mechanism that is able to look for points in the context set that are similar
to a given test point, leading to an even more precise assessment of the
expert's abilities. In the experiments, we validate our methods on image
recognition, traffic sign detection, and skin lesion diagnosis benchmarks.
- Abstract(参考訳): 遅延学習(L2D)フレームワークは、人間の専門家に難しい決定を割り当てることによって、自律システムの安全性と堅牢性を実現する。
L2Dに関する既存の作業はすべて、各専門家が十分に識別されていると仮定し、もし専門家が変更するならば、システムは再トレーニングされるべきである。
本研究では,この制約を緩和し,テスト時に決して経験のない専門家に対処できるl2dシステムを定式化する。
メタラーニングを用いて最適化とモデルベースの両方を考慮し、これを実現する。
現在利用可能なエキスパートを特徴づける小さなコンテキストセットがあれば、フレームワークはその遅延ポリシーを迅速に適用できます。
モデルに基づくアプローチでは、与えられたテストポイントに類似したコンテキストセット内のポイントを検索できる注意機構を採用し、専門家の能力をより正確に評価する。
実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検証を行った。
関連論文リスト
- RLIF: Interactive Imitation Learning as Reinforcement Learning [61.14928315004026]
オフ・ポリティクス強化学習は、インタラクティブな模倣学習よりも近いが、潜在的にさらに実践的な仮定の下で、パフォーマンスを向上させることができる。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Interpretable Anomaly Detection via Discrete Optimization [1.7150329136228712]
本稿では,シーケンシャルデータから本質的に解釈可能な異常検出を学習するためのフレームワークを提案する。
この問題は計算的に困難であることを示し,制約最適化に基づく2つの学習アルゴリズムを開発した。
プロトタイプ実装を用いて,提案手法は精度とF1スコアの点で有望な結果を示す。
論文 参考訳(メタデータ) (2023-03-24T16:19:15Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Leveraging Systematic Knowledge of 2D Transformations [6.527658701826699]
人間は、たとえ画像のシーンが珍しいとしても、画像を解釈する素晴らしい能力を持っている。
本研究は,1)2次元変換の体系的知識の獲得,2)画像分類タスクにおける学習知識を活用可能なアーキテクチャコンポーネントに焦点を当てる。
論文 参考訳(メタデータ) (2022-06-02T06:46:12Z) - Fully Automated Binary Pattern Extraction For Finger Vein Identification
using Double Optimization Stages-Based Unsupervised Learning Approach [0.0]
機械学習に基づく教師なし、教師なし、ディープラーニングのアルゴリズムは、指静脈の検出と認識に大きな影響を与えている。
ディープラーニングは、手作業による生成とラベル付けが必要な、多数のトレーニングデータセットを必要とする。
本研究では,データセット作成をトレーニングするための完全に自動化された教師なし学習戦略を提案する。
論文 参考訳(メタデータ) (2022-05-08T11:01:25Z) - Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。
具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。
大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文 参考訳(メタデータ) (2021-03-07T03:10:32Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [89.01584399789951]
歴史的専門家の意思決定を豊富な情報源として利用することを検討します。
観察されたラベルだけで学習する制限を緩和するために活用できることを示しています。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - Robust Asymmetric Learning in POMDPs [24.45409442047289]
模造学習の既存のアプローチには重大な欠陥があります:専門家は研修生が見ることができないものを知りません。
模倣エージェントポリシーの期待される報酬を最大化するために専門家を訓練し、効率的なアルゴリズム、適応非対称ダガー(A2D)を構築するためにそれを使用する目的を導き出します。
a2dは、エージェントが安全に模倣できる専門家ポリシーを生成し、その結果、固定された専門家を模倣して学習したポリシーを上回ることを示します。
論文 参考訳(メタデータ) (2020-12-31T11:46:51Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z) - A System for Real-Time Interactive Analysis of Deep Learning Training [66.06880335222529]
現在利用可能なシステムは、トレーニングプロセスが始まる前に指定しなければならないログデータのみを監視することに限定されている。
本稿では,リアルタイム情報を生成するライブプロセス上で対話型クエリを実行可能にするシステムを提案する。
論文 参考訳(メタデータ) (2020-01-05T11:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。