論文の概要: Efficient, Uncertainty-based Moderation of Neural Networks Text
Classifiers
- arxiv url: http://arxiv.org/abs/2204.01334v1
- Date: Mon, 4 Apr 2022 09:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 23:27:09.323378
- Title: Efficient, Uncertainty-based Moderation of Neural Networks Text
Classifiers
- Title(参考訳): ニューラルネットワークテキスト分類器の効率的不確実性に基づくモデレーション
- Authors: Jakob Smedegaard Andersen, Walid Maalej
- Abstract要約: 本稿では,分類器の出力を効率よく操作できるフレームワークを提案する。
予測の不確実性を利用して、不確実で、おそらく不正確な分類を人間のモデレーターに渡す半自動化アプローチを提案する。
一連のベンチマーク実験により、我々のフレームワークは分類F1スコアを5.1から11.2%改善できることが示された。
- 参考スコア(独自算出の注目度): 8.883733362171034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To maximize the accuracy and increase the overall acceptance of text
classifiers, we propose a framework for the efficient, in-operation moderation
of classifiers' output. Our framework focuses on use cases in which F1-scores
of modern Neural Networks classifiers (ca.~90%) are still inapplicable in
practice. We suggest a semi-automated approach that uses prediction
uncertainties to pass unconfident, probably incorrect classifications to human
moderators. To minimize the workload, we limit the human moderated data to the
point where the accuracy gains saturate and further human effort does not lead
to substantial improvements. A series of benchmarking experiments based on
three different datasets and three state-of-the-art classifiers show that our
framework can improve the classification F1-scores by 5.1 to 11.2% (up to
approx.~98 to 99%), while reducing the moderation load up to 73.3% compared to
a random moderation.
- Abstract(参考訳): 精度を最大化し,テキスト分類器の全体的な受入を増加させるため,分類器の出力の効率的かつ操作内モデレーションのためのフレームワークを提案する。
我々のフレームワークは、現代のニューラルネットワーク分類器(ca.~90%)のF1スコアが実際には適用できないユースケースに焦点を当てている。
予測の不確実性を人間のモデレータに不正確な分類を渡すための半自動的なアプローチを提案する。
作業負荷を最小限に抑えるため、人間の適度なデータは、精度が飽和し、さらなる人的努力が大幅な改善には至らない点に制限する。
3つの異なるデータセットと3つの最先端分類器に基づく一連のベンチマーク実験により、我々のフレームワークは、ランダムなモデレーションに比べてモデレーション負荷を最大73.3%削減しつつ、F1スコアを5.1から11.2%改善できることがわかった。
関連論文リスト
- Predicting Overtakes in Trucks Using CAN Data [51.28632782308621]
CANデータからトラックの積載量の検出について検討する。
私たちの分析では、オーバーテイクイベントの最大10秒前をカバーしています。
我々は、オーバーテイク・トリガーに近づくと、オーバーテイク・クラスの予測スコアが増加する傾向にあることを観察する。
論文 参考訳(メタデータ) (2024-04-08T17:58:22Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - How to Fix a Broken Confidence Estimator: Evaluating Post-hoc Methods for Selective Classification with Deep Neural Networks [1.4502611532302039]
我々は,ロジットの単純な$p$-norm正規化を行い,次に最大ロジットを信頼度推定器とすることで,選択的分類性能が著しく向上することを示した。
我々の結果は、分布シフトの下で一貫していることが示されている。
論文 参考訳(メタデータ) (2023-05-24T18:56:55Z) - Robustifying Sentiment Classification by Maximally Exploiting Few
Counterfactuals [16.731183915325584]
そこで本研究では,トレーニングデータの少数のアノテーションのみを必要とする新しい手法を提案する。
また,手作業による正解率を1%に抑えることで,顕著な精度向上を実現した。
論文 参考訳(メタデータ) (2022-10-21T08:30:09Z) - (Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。
これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文 参考訳(メタデータ) (2022-06-21T17:27:27Z) - Selective Classification Via Neural Network Training Dynamics [26.58209894993386]
本研究では,モデルのトレーニング力学を学習することで,最先端の選択的分類性能を達成できることを実証する。
提案手法は,典型的な選択分類ベンチマークにおいて,最先端の精度/カバレッジトレードオフを実現する。
論文 参考訳(メタデータ) (2022-05-26T17:51:29Z) - Interpolation-based Contrastive Learning for Few-Label Semi-Supervised
Learning [43.51182049644767]
半教師付き学習(SSL)は,ラベルが限定された強力なモデルを構築する上で,有効な手法であることが長年証明されてきた。
摂動サンプルを元のものと類似した予測を強制する正規化に基づく手法が注目されている。
本稿では,学習ネットワークの埋め込みを誘導し,サンプル間の線形変化を誘導する新たな対照的な損失を提案する。
論文 参考訳(メタデータ) (2022-02-24T06:00:05Z) - Semantic Perturbations with Normalizing Flows for Improved
Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。
トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文 参考訳(メタデータ) (2021-08-18T03:20:00Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。