論文の概要: Data Shapley Value for Handling Noisy Labels: An application in
Screening COVID-19 Pneumonia from Chest CT Scans
- arxiv url: http://arxiv.org/abs/2110.08726v1
- Date: Sun, 17 Oct 2021 05:06:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 07:41:27.724188
- Title: Data Shapley Value for Handling Noisy Labels: An application in
Screening COVID-19 Pneumonia from Chest CT Scans
- Title(参考訳): ノイズラベル対応のためのデータシャプレー値 : 胸部ctスキャンからのcovid-19肺炎スクリーニングへの応用
- Authors: Nastaran Enshaei, Moezedin Javad Rafiee, Arash Mohammadi, Farnoosh
Naderkhani
- Abstract要約: 協調ゲーム理論アプローチであるデータ共有値(SV)の導入は、ノイズラベルの問題に対処するためのインテリジェントな評価ソリューションである。
データSVは、学習モデルと評価指標と一緒に使用でき、各トレーニングポイントがモデルの性能に寄与していることを検証する。
SVの計算,ノイズラベルの検出,データポイントの重要度測定に異なる評価指標を用いることの効果は,まだ十分に検討されていない。
- 参考スコア(独自算出の注目度): 9.049885961865368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A long-standing challenge of deep learning models involves how to handle
noisy labels, especially in applications where human lives are at stake.
Adoption of the data Shapley Value (SV), a cooperative game theoretical
approach, is an intelligent valuation solution to tackle the issue of noisy
labels. Data SV can be used together with a learning model and an evaluation
metric to validate each training point's contribution to the model's
performance. The SV of a data point, however, is not unique and depends on the
learning model, the evaluation metric, and other data points collaborating in
the training game. However, effects of utilizing different evaluation metrics
for computation of the SV, detecting the noisy labels, and measuring the data
points' importance has not yet been thoroughly investigated. In this context,
we performed a series of comparative analyses to assess SV's capabilities to
detect noisy input labels when measured by different evaluation metrics. Our
experiments on COVID-19-infected of CT images illustrate that although the data
SV can effectively identify noisy labels, adoption of different evaluation
metric can significantly influence its ability to identify noisy labels from
different data classes. Specifically, we demonstrate that the SV greatly
depends on the associated evaluation metric.
- Abstract(参考訳): ディープラーニングモデルの長年にわたる課題は、特に人間の命がかかっているアプリケーションにおいて、ノイズの多いラベルを扱う方法だ。
協調ゲーム理論的なアプローチであるdata shapley value(sv)の採用は、ノイズラベルの問題に取り組むためのインテリジェントな評価ソリューションである。
データsvは、学習モデルと評価メトリクスと一緒に使用して、各トレーニングポイントのモデルのパフォーマンスへの貢献を検証することができる。
しかし、データポイントのSVはユニークではなく、学習モデル、評価指標、およびトレーニングゲームで協調する他のデータポイントに依存している。
しかし,SVの計算,ノイズラベルの検出,データポイントの重要度測定に異なる評価指標を用いることの効果は,まだ十分に研究されていない。
この文脈では,異なる評価指標を用いて,ノイズの多い入力ラベルを検出するSVの能力を評価するために,一連の比較分析を行った。
データSVはノイズラベルを効果的に識別できるが、異なる評価基準を採用することは、異なるデータクラスからノイズラベルを識別する能力に大きな影響を及ぼす可能性がある。
具体的には,SVが関連する評価基準に依存することを示す。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Estimating label quality and errors in semantic segmentation data via
any model [19.84626033109009]
ラベル品質を評価する手法について検討し、最も低いスコアのイメージを正しくラベル付けする可能性が低いことを示す。
これにより、高品質なトレーニング/評価データセットを保証するために、レビューするデータを優先順位付けすることが可能になる。
論文 参考訳(メタデータ) (2023-07-11T07:29:09Z) - A Matter of Annotation: An Empirical Study on In Situ and Self-Recall Activity Annotations from Wearable Sensors [56.554277096170246]
In-the-wildデータ収集に焦点をあてたユーザスタディにおいて,一般的な4つのアノテーション手法の評価と対比を行う実験的検討を行った。
実際の記録プロセス中に参加者がアノテートするユーザ主導のin situアノテーションと、各日の終わりに参加者が振り返ってアノテートするリコールメソッドの両方に対して、参加者は自身のアクティビティクラスと対応するラベルを選択できる柔軟性を持っていた。
論文 参考訳(メタデータ) (2023-05-15T16:02:56Z) - VALERIAN: Invariant Feature Learning for IMU Sensor-based Human Activity
Recognition in the Wild [7.50015216403068]
VALERIANは、Wild ウェアラブルセンサーベースのHARのための不変な特徴学習手法である。
VALERIANは、個別のタスク固有のレイヤを持つマルチタスクモデルをトレーニングすることにより、被験者間で共有された特徴表現の恩恵を受けながら、ノイズの多いラベルを個別に扱うことができる。
論文 参考訳(メタデータ) (2023-03-03T18:22:14Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - Learning to Aggregate and Refine Noisy Labels for Visual Sentiment
Analysis [69.48582264712854]
本研究では,頑健な視覚的感情分析を行うための頑健な学習手法を提案する。
本手法は,トレーニング中にノイズラベルを集約・フィルタリングするために外部メモリに依存している。
公開データセットを用いたラベルノイズを用いた視覚的感情分析のベンチマークを構築した。
論文 参考訳(メタデータ) (2021-09-15T18:18:28Z) - Assessing the Quality of the Datasets by Identifying Mislabeled Samples [14.881597737762316]
本稿では,各データ点の品質を測る指標として,新しい統計値(ノイズスコア)を提案する。
本研究では,データ品質管理型変分オートエンコーダ(AQUAVS)の推論ネットワークから導出される表現を用いる。
我々は、MNIST、FashionMNIST、CIFAR10/100データセットを破損させることにより、提案した統計データを検証した。
論文 参考訳(メタデータ) (2021-09-10T17:14:09Z) - Similarity Embedding Networks for Robust Human Activity Recognition [19.162857787656247]
我々は、入力センサ信号を、慎重に設計された畳み込み層とLSTM層を通して実ベクトルにマッピングする類似性埋め込みニューラルネットワークを設計する。
埋め込みネットワークは、ペアワイズな類似性損失でトレーニングされ、埋め込み実空間内の同じクラスからのサンプルのクラスタリングを奨励する。
2つの公開データセットに基づく広範囲な評価により、提案された類似性埋め込みネットワークは、HAR分類タスクにおける最先端のディープモデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2021-05-31T11:52:32Z) - Learning Image Labels On-the-fly for Training Robust Classification
Models [13.669654965671604]
ノイズの多いアノテーション(例えば、異なるアルゴリズムベースのラベル付け子から)を一緒に利用し、相互に分類タスクの学習に役立てることができるかを示す。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに出席するように設計されている。
論文 参考訳(メタデータ) (2020-09-22T05:38:44Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。