論文の概要: Differentiable Learning Under Triage
- arxiv url: http://arxiv.org/abs/2103.08902v1
- Date: Tue, 16 Mar 2021 08:07:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 13:36:25.103031
- Title: Differentiable Learning Under Triage
- Title(参考訳): トライアージによる差別的学習
- Authors: Nastaran Okati, Abir De, Manuel Gomez-Rodriguez
- Abstract要約: アルゴリズム的トリアージでは、予測モデルはすべてのインスタンスを予測しないが、それらのいくつかを人間の専門家に否定する。
完全自動化のためにトレーニングされたモデルは、トリアージ下では最適でない場合がある。
実用的勾配に基づくアルゴリズムを導入して,性能向上の一連のトリアージポリシと予測モデルを見つけることが保証されている。
- 参考スコア(独自算出の注目度): 25.41072393963499
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple lines of evidence suggest that predictive models may benefit from
algorithmic triage. Under algorithmic triage, a predictive model does not
predict all instances but instead defers some of them to human experts.
However, the interplay between the prediction accuracy of the model and the
human experts under algorithmic triage is not well understood. In this work, we
start by formally characterizing under which circumstances a predictive model
may benefit from algorithmic triage. In doing so, we also demonstrate that
models trained for full automation may be suboptimal under triage. Then, given
any model and desired level of triage, we show that the optimal triage policy
is a deterministic threshold rule in which triage decisions are derived
deterministically by thresholding the difference between the model and human
errors on a per-instance level. Building upon these results, we introduce a
practical gradient-based algorithm that is guaranteed to find a sequence of
triage policies and predictive models of increasing performance. Experiments on
a wide variety of supervised learning tasks using synthetic and real data from
two important applications -- content moderation and scientific discovery --
illustrate our theoretical results and show that the models and triage policies
provided by our gradient-based algorithm outperform those provided by several
competitive baselines.
- Abstract(参考訳): 複数の証拠が、予測モデルがアルゴリズム的トリアージの恩恵を受ける可能性を示唆している。
アルゴリズム的トリアージでは、予測モデルはすべてのインスタンスを予測せず、その一部を人間の専門家に否定する。
しかし,アルゴリズムトリアージによる予測精度と人間専門家との相互作用はよく理解されていない。
本研究では,予測モデルがアルゴリズム的トリアージの恩恵を受ける状況下での形式的特徴付けから始める。
そうすることで、完全自動化のためにトレーニングされたモデルが、トリアージ下では最適でないことも示します。
そして、任意のモデルと所望のトリアージレベルが与えられた場合、最適なトリアージポリシーは、モデルと人間のエラーとの差をインスタンス単位のレベルで閾値にすることで、トリアージ決定を決定論的に導出する決定論的しきい値ルールであることを示す。
これらの結果をもとに,トリアージポリシのシーケンスと性能向上の予測モデルを見出すことを保証した,実用的な勾配に基づくアルゴリズムを提案する。
コンテントモデレーションと科学的発見という2つの重要な応用から得られた合成および実データを用いて、様々な教師付き学習タスクを実験した結果、我々の理論的結果が示され、勾配に基づくアルゴリズムによって提供されるモデルとトリアージポリシーが、いくつかの競合ベースラインによって提供されるものよりも優れていることが示されている。
関連論文リスト
- Supervised Score-Based Modeling by Gradient Boosting [49.556736252628745]
本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文 参考訳(メタデータ) (2024-11-02T07:06:53Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Deep Grey-Box Modeling With Adaptive Data-Driven Models Toward
Trustworthy Estimation of Theory-Driven Models [88.63781315038824]
本稿では,ニューラルネットワークのアーキテクチャとトレーニング目標にわずかな変化を伴って,レギュレータの動作を経験的に分析することのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T10:42:26Z) - Reinforcement Learning Under Algorithmic Triage [33.80293624975863]
トリアージ下で強化学習モデルを学ぶための2段階アクター批判手法を開発した。
最初の段階は、人間が単独で操作した環境で収集された人間のデータを使って、オフラインで非政治的な訓練を行う。
第2段階は、人間の政策に切り替えが与える影響を考慮し、政治上の訓練を行う。
論文 参考訳(メタデータ) (2021-09-23T12:21:26Z) - A bandit-learning approach to multifidelity approximation [7.960229223744695]
マルチファイデリティ近似は、科学計算とシミュレーションにおいて重要な技術である。
異なる忠実度のデータを利用して正確な推定を行うためのバンディットラーニング手法を紹介します。
論文 参考訳(メタデータ) (2021-03-29T05:29:35Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - Discriminative, Generative and Self-Supervised Approaches for
Target-Agnostic Learning [8.666667951130892]
生成的および自己教師型学習モデルは、そのタスクでうまく機能することが示されている。
擬似相似理論の導出した定理は、結合分布モデルの推定に関係があることも示している。
論文 参考訳(メタデータ) (2020-11-12T15:03:40Z) - Efficient Model-Based Reinforcement Learning through Optimistic Policy
Search and Planning [93.1435980666675]
最先端の強化学習アルゴリズムと楽観的な探索を容易に組み合わせることができることを示す。
我々の実験は、楽観的な探索が行動に罰則がある場合、学習を著しくスピードアップすることを示した。
論文 参考訳(メタデータ) (2020-06-15T18:37:38Z) - Efficient Ensemble Model Generation for Uncertainty Estimation with
Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。
提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。
また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文 参考訳(メタデータ) (2020-05-21T16:08:38Z) - A Comparison of Methods for Treatment Assignment with an Application to
Playlist Generation [13.804332504576301]
文献で提案される様々な手法をアルゴリズムの3つの一般的なクラス(またはメタナー)に分類する。
結果や因果効果の予測を最適化することは、治療課題の最適化と同じではないことを分析的および実証的に示す。
これは、大規模な実世界のアプリケーションにおける3つの異なるメタラーナーの最初の比較である。
論文 参考訳(メタデータ) (2020-04-24T04:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。