論文の概要: Expert-Agnostic Learning to Defer
- arxiv url: http://arxiv.org/abs/2502.10533v1
- Date: Fri, 14 Feb 2025 19:59:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:08:46.548874
- Title: Expert-Agnostic Learning to Defer
- Title(参考訳): 専門家に依存しないディフェンダーの学習
- Authors: Joshua Strong, Pramit Saha, Yasin Ibrahim, Cheng Ouyang, Alison Noble,
- Abstract要約: EA-L2D:Expert-Agnostic Learning to Deferを紹介します。
専門家が1~16%、未確認の専門家が4~28%、そして、専門家の多様性が高い環境では、パフォーマンスが向上するのを観察する。
- 参考スコア(独自算出の注目度): 4.171294900540735
- License:
- Abstract: Learning to Defer (L2D) learns autonomous systems to independently manage straightforward cases, while deferring uncertain cases to human experts. Recent advancements in this field have introduced features enabling flexibility to unseen experts at test-time, but we find these approaches have significant limitations. To address these, we introduce EA-L2D: Expert-Agnostic Learning to Defer, a novel L2D framework that leverages a Bayesian approach to model expert behaviour in an expert-agnostic manner, facilitating optimal deferral decisions. EA-L2D offers several critical improvements over prior methods, including the ability to incorporate prior knowledge about experts, a reduced reliance on expert-annotated data, and robust performance when deferring to experts with expertise not seen during training. Evaluating on CIFAR-10, HAM10000, German Traffic Lights, Breast Ultrasound, Axial Organ Slices, and Blood Cell MNIST, we observe performance gains over the next state-of-the-art of 1-16\% for seen experts and 4-28\% for unseen experts in settings with high expert diversity.
- Abstract(参考訳): Learning to Defer (L2D)は、自律的なシステムを学習し、単純なケースを独立して管理し、不確実なケースを人間の専門家に委ねる。
この分野での最近の進歩は、テスト時に専門家を見ないような柔軟性を実現する機能を導入していますが、これらのアプローチには大きな制限があります。
EA-L2D(Expert-Agnostic Learning to Defer)は、ベイズ的アプローチを利用して専門家非依存の方法で専門家の振る舞いをモデル化し、最適な推論決定を容易にする新しいL2Dフレームワークである。
EA-L2Dは、専門家に関する事前の知識を組み込む機能、専門家による注釈付きデータへの依存の低減、トレーニング中に見えない専門知識を持つ専門家に委ねる際の堅牢なパフォーマンスなど、以前の方法よりもいくつかの重要な改善を提供する。
CIFAR-10, HAM10000, German Traffic Lights, Breast Ultrasound, Axial Organ Slices, Blood Cell MNISTでの評価を行い, 専門家の次の1~16倍, 専門家の多様性の高い環境では4~28倍の結果を得た。
関連論文リスト
- Unveiling and Consulting Core Experts in Retrieval-Augmented MoE-based LLMs [64.9693406713216]
RAGシステムの有効性に寄与する内部メカニズムは未解明のままである。
実験の結果,複数のコアグループの専門家がRAG関連行動に主に関与していることが判明した。
本稿では,専門家の活性化を通じてRAGの効率性と有効性を高めるためのいくつかの戦略を提案する。
論文 参考訳(メタデータ) (2024-10-20T16:08:54Z) - Learning to Defer to a Population: A Meta-Learning Approach [4.64209268422757]
テスト時に目に見えない専門家に対処できるL2Dシステムを定式化します。
テストポイントに類似したコンテキストセット内のポイントを検索できるアテンションメカニズムを採用しています。
実験では,画像認識,交通標識検出,皮膚病変診断ベンチマークについて検討した。
論文 参考訳(メタデータ) (2024-03-05T06:10:28Z) - Defining Expertise: Applications to Treatment Effect Estimation [58.7977683502207]
専門知識(特にドメインの意思決定者が持つであろう専門知識の種類)は、治療効果の推定方法の設計と選択において有益である、と我々は主張する。
予測的および予測的2種類の専門知識を定義し,(i)ドメインにおける顕著な専門知識のタイプが治療効果推定における異なる手法の性能に大きく影響し,(ii)データセットに存在する専門知識のタイプを予測することが可能であることを実証的に示す。
論文 参考訳(メタデータ) (2024-03-01T17:30:49Z) - Inverse Reinforcement Learning with Sub-optimal Experts [56.553106680769474]
与えられた専門家の集合と互換性のある報酬関数のクラスの理論的性質について検討する。
以上の結果から,複数の準最適専門家の存在が,相反する報酬の集合を著しく減少させる可能性が示唆された。
我々は,最適なエージェントの1つに十分近い準最適専門家のパフォーマンスレベルが最適である場合に,最小限の最適化を行う一様サンプリングアルゴリズムを解析する。
論文 参考訳(メタデータ) (2024-01-08T12:39:25Z) - Learning to Defer with Limited Expert Predictions [0.0]
本稿では,アルゴリズムを遅延させる学習訓練に必要な専門家予測数を3段階に短縮する手法を提案する。
実験の結果,この手法により,人間専門家の予測が最小限に抑えられたアルゴリズムを,様々な学習の訓練で遅延させることができることがわかった。
論文 参考訳(メタデータ) (2023-04-14T09:22:34Z) - (Re)Defining Expertise in Machine Learning Development [3.096615629099617]
我々は,1)専門知識が定義され,認識される基盤,2)専門家がML開発で果たす役割を理解するために,機械学習研究の体系的な文献レビューを行う。
私たちのゴールは、専門家の識別とML研究への関与の限界と機会を強調するために、高いレベルの分類を作ることです。
論文 参考訳(メタデータ) (2023-02-08T21:10:20Z) - Experts in the Loop: Conditional Variable Selection for Accelerating
Post-Silicon Analysis Based on Deep Learning [6.6357750579293935]
シリコン後検証は半導体製造において最も重要なプロセスの1つである。
この研究は、専門家をループに留めつつ、新しい条件変数選択アプローチを設計することを目的としている。
論文 参考訳(メタデータ) (2022-09-30T06:12:12Z) - Bayesian Optimization Augmented with Actively Elicited Expert Knowledge [13.551210295284733]
我々は、最適化をさらに加速することを目的として、専門家の知識をBOに組み込むという課題に取り組む。
本研究では,この課題に対するマルチタスク学習アーキテクチャを設計し,専門家の知識を共同で抽出し,目的関数を最小化することを目的とする。
シミュレーションと実際の人間の専門家による様々なベンチマーク関数の実験では、専門家の知識が偏っている場合でも、提案手法はBOを著しく高速化することが示された。
論文 参考訳(メタデータ) (2022-08-18T09:49:21Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。