Fugu-MT 論文翻訳(概要): Learning to Defer to a Population: A Meta-Learning Approach

論文の概要: Learning to Defer to a Population: A Meta-Learning Approach

arxiv url: http://arxiv.org/abs/2403.02683v1
Date: Tue, 5 Mar 2024 06:10:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 15:59:07.760046
Title: Learning to Defer to a Population: A Meta-Learning Approach
Title（参考訳）: 人口に対応するための学習:メタラーニングアプローチ
Authors: Dharmesh Tailor, Aditya Patra, Rajeev Verma, Putra Manggala, Eric Nalisnick
Abstract要約: テスト時に目に見えない専門家に対処できるL2Dシステムを定式化します。テストポイントに類似したコンテキストセット内のポイントを検索できるアテンションメカニズムを採用しています。実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検討した。
参考スコア（独自算出の注目度）: 4.980250354893495
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The learning to defer (L2D) framework allows autonomous systems to be safe and robust by allocating difficult decisions to a human expert. All existing work on L2D assumes that each expert is well-identified, and if any expert were to change, the system should be re-trained. In this work, we alleviate this constraint, formulating an L2D system that can cope with never-before-seen experts at test-time. We accomplish this by using meta-learning, considering both optimization- and model-based variants. Given a small context set to characterize the currently available expert, our framework can quickly adapt its deferral policy. For the model-based approach, we employ an attention mechanism that is able to look for points in the context set that are similar to a given test point, leading to an even more precise assessment of the expert's abilities. In the experiments, we validate our methods on image recognition, traffic sign detection, and skin lesion diagnosis benchmarks.
Abstract（参考訳）: 遅延学習(L2D)フレームワークは、人間の専門家に難しい決定を割り当てることによって、自律システムの安全性と堅牢性を実現する。 L2Dに関する既存の作業はすべて、各専門家が十分に識別されていると仮定し、もし専門家が変更するならば、システムは再トレーニングされるべきである。本研究では,この制約を緩和し,テスト時に決して経験のない専門家に対処できるl2dシステムを定式化する。メタラーニングを用いて最適化とモデルベースの両方を考慮し、これを実現する。現在利用可能なエキスパートを特徴づける小さなコンテキストセットがあれば、フレームワークはその遅延ポリシーを迅速に適用できます。モデルに基づくアプローチでは、与えられたテストポイントに類似したコンテキストセット内のポイントを検索できる注意機構を採用し、専門家の能力をより正確に評価する。実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検証を行った。

関連論文リスト

Expert-Agnostic Learning to Defer [4.171294900540735]
本稿では,ベイズ的手法を応用した新しいL2DフレームワークであるEA-L2Dについて紹介する。 EA-L2Dは、未確認の専門家に対する事前の手法を著しく上回り、28%の相対的な改善を達成している。
論文参考訳（メタデータ） (2025-02-14T19:59:25Z)
Generate to Discriminate: Expert Routing for Continual Learning [59.71853576559306]
Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文参考訳（メタデータ） (2024-12-22T13:16:28Z)
Two-stage Learning-to-Defer for Multi-Task Learning [3.4289478404209826]
分類タスクと回帰タスクの両方を包含するマルチタスク学習のためのLearning-to-Deferアプローチを提案する。我々の2段階のアプローチでは、事前訓練された共同回帰モデルと1つ以上の外部の専門家のうち、最も正確なエージェントに決定を下すリジェクターを使用します。
論文参考訳（メタデータ） (2024-10-21T07:44:57Z)
Informed Decision-Making through Advancements in Open Set Recognition and Unknown Sample Detection [0.0]
オープンセット認識(OSR)は、より現実に近い状況に分類タスクを導入することを目的としている。本研究は,OSRタスクの分類を改善するために,特徴空間の新たな表現を探索するアルゴリズムを提供する。
論文参考訳（メタデータ） (2024-05-09T15:15:34Z)
RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文参考訳（メタデータ） (2023-11-21T21:05:21Z)
Interpretable Anomaly Detection via Discrete Optimization [1.7150329136228712]
本稿では,シーケンシャルデータから本質的に解釈可能な異常検出を学習するためのフレームワークを提案する。この問題は計算的に困難であることを示し,制約最適化に基づく2つの学習アルゴリズムを開発した。プロトタイプ実装を用いて,提案手法は精度とF1スコアの点で有望な結果を示す。
論文参考訳（メタデータ） (2023-03-24T16:19:15Z)
A Domain-Agnostic Approach for Characterization of Lifelong Learning Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文参考訳（メタデータ） (2023-01-18T21:58:54Z)
Fully Automated Binary Pattern Extraction For Finger Vein Identification using Double Optimization Stages-Based Unsupervised Learning Approach [0.0]
機械学習に基づく教師なし、教師なし、ディープラーニングのアルゴリズムは、指静脈の検出と認識に大きな影響を与えている。ディープラーニングは、手作業による生成とラベル付けが必要な、多数のトレーニングデータセットを必要とする。本研究では,データセット作成をトレーニングするための完全に自動化された教師なし学習戦略を提案する。
論文参考訳（メタデータ） (2022-05-08T11:01:25Z)
Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文参考訳（メタデータ） (2021-03-07T03:10:32Z)
Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文参考訳（メタデータ） (2021-01-24T05:40:29Z)
Robust Asymmetric Learning in POMDPs [24.45409442047289]
模造学習の既存のアプローチには重大な欠陥があります:専門家は研修生が見ることができないものを知りません。模倣エージェントポリシーの期待される報酬を最大化するために専門家を訓練し、効率的なアルゴリズム、適応非対称ダガー(A2D)を構築するためにそれを使用する目的を導き出します。 a2dは、エージェントが安全に模倣できる専門家ポリシーを生成し、その結果、固定された専門家を模倣して学習したポリシーを上回ることを示します。
論文参考訳（メタデータ） (2020-12-31T11:46:51Z)
Learning From Multiple Experts: Self-paced Knowledge Distillation for Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文参考訳（メタデータ） (2020-01-06T12:57:36Z)
A System for Real-Time Interactive Analysis of Deep Learning Training [66.06880335222529]
現在利用可能なシステムは、トレーニングプロセスが始まる前に指定しなければならないログデータのみを監視することに限定されている。本稿では,リアルタイム情報を生成するライブプロセス上で対話型クエリを実行可能にするシステムを提案する。
論文参考訳（メタデータ） (2020-01-05T11:33:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。