論文の概要: Handling Missing Annotations in Supervised Learning Data
- arxiv url: http://arxiv.org/abs/2002.07113v1
- Date: Mon, 17 Feb 2020 18:23:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 11:40:58.800017
- Title: Handling Missing Annotations in Supervised Learning Data
- Title(参考訳): 教師付き学習データにおけるミスアノテーションの扱い
- Authors: Alaa E. Abdel-Hakim and Wael Deabes
- Abstract要約: ADL (Activity of Daily Living) は、非常に大きなセンサーデータ読み取りを利用するシステムの例である。
生成されたデータセットのサイズは非常に大きいので、人間のアノテーションがデータセットのすべてのインスタンスに特定のラベルを付けることはほとんど不可能です。
本研究では,これらのギャップに対処する3つのパラダイムを提案し,検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data annotation is an essential stage in supervised learning. However, the
annotation process is exhaustive and time consuming, specially for large
datasets. Activities of Daily Living (ADL) recognition is an example of systems
that exploit very large raw sensor data readings. In such systems, sensor
readings are collected from activity-monitoring sensors in a 24/7 manner. The
size of the generated dataset is so huge that it is almost impossible for a
human annotator to give a certain label to every single instance in the
dataset. This results in annotation gaps in the input data to the adopting
supervised learning system. The performance of the recognition system is
negatively affected by these gaps. In this work, we propose and investigate
three different paradigms to handle these gaps. In the first paradigm, the gaps
are taken out by dropping all unlabeled readings. A single "Unknown" or
"Do-Nothing" label is given to the unlabeled readings within the operation of
the second paradigm. The last paradigm handles these gaps by giving every one
of them a unique label identifying the encapsulating deterministic labels.
Also, we propose a semantic preprocessing method of annotation gaps by
constructing a hybrid combination of some of these paradigms for further
performance improvement. The performance of the proposed three paradigms and
their hybrid combination is evaluated using an ADL benchmark dataset containing
more than $2.5\times 10^6$ sensor readings that had been collected over more
than nine months. The evaluation results emphasize the performance contrast
under the operation of each paradigm and support a specific gap handling
approach for better performance.
- Abstract(参考訳): データアノテーションは教師あり学習の重要な段階である。
しかし、アノテーションプロセスは徹底的で、特に大規模なデータセットには時間がかかります。
デイリーリビング(ADL)認識のアクティビティは、非常に大規模な生センサデータ読み取りを利用するシステムの例である。
このようなシステムでは、24/7で活動監視センサからセンサ読み取りを収集する。
生成されたデータセットのサイズは非常に大きいので、人間のアノテーションがデータセットのすべてのインスタンスに特定のラベルを与えることはほとんど不可能です。
これにより、教師付き学習システムへの入力データのアノテーションギャップが生じる。
認識システムの性能は、これらのギャップによって悪影響を受ける。
本研究では,これらのギャップに対処する3つのパラダイムを提案し,検討する。
最初のパラダイムでは、ラベルなしのすべての読みを落としてギャップを取り出す。
未知」または「無知」のラベルは、第2パラダイムの操作におけるラベルなしの読みに与えられる。
最後のパラダイムは、それぞれにカプセル化された決定論的ラベルを識別するユニークなラベルを与えることで、これらのギャップを処理する。
また,これらのパラダイムをハイブリッドに組み合わせ,さらなる性能向上を実現することにより,アノテーションギャップのセマンティックプリプロセッシング手法を提案する。
提案した3つのパラダイムとそれらのハイブリッド組み合わせの性能は,9ヶ月以上にわたって収集された2.5ドル以上のセンサ読み取りを含むADLベンチマークデータセットを用いて評価した。
評価結果は,各パラダイムの動作における性能コントラストを強調し,特定のギャップハンドリング手法による性能向上を支援する。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Enhancing Hyperspectral Image Prediction with Contrastive Learning in Low-Label Regime [0.810304644344495]
自己教師付きコントラスト学習は、限られたラベル付きデータの課題に対処するための効果的なアプローチである。
単一ラベルと複数ラベルの分類タスクに対して,本手法の性能を評価する。
論文 参考訳(メタデータ) (2024-10-10T10:20:16Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Semi-Supervised End-To-End Contrastive Learning For Time Series
Classification [10.635321868623883]
時系列分類は、金融、医療、センサーデータ分析など、さまざまな分野において重要な課題である。
SLOTS(Semi-supervised Learning fOr Time clasSification)と呼ばれるエンドツーエンドモデルを提案する。
論文 参考訳(メタデータ) (2023-10-13T04:22:21Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。