論文の概要: Handling Missing Annotations in Supervised Learning Data
- arxiv url: http://arxiv.org/abs/2002.07113v1
- Date: Mon, 17 Feb 2020 18:23:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 11:40:58.800017
- Title: Handling Missing Annotations in Supervised Learning Data
- Title(参考訳): 教師付き学習データにおけるミスアノテーションの扱い
- Authors: Alaa E. Abdel-Hakim and Wael Deabes
- Abstract要約: ADL (Activity of Daily Living) は、非常に大きなセンサーデータ読み取りを利用するシステムの例である。
生成されたデータセットのサイズは非常に大きいので、人間のアノテーションがデータセットのすべてのインスタンスに特定のラベルを付けることはほとんど不可能です。
本研究では,これらのギャップに対処する3つのパラダイムを提案し,検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data annotation is an essential stage in supervised learning. However, the
annotation process is exhaustive and time consuming, specially for large
datasets. Activities of Daily Living (ADL) recognition is an example of systems
that exploit very large raw sensor data readings. In such systems, sensor
readings are collected from activity-monitoring sensors in a 24/7 manner. The
size of the generated dataset is so huge that it is almost impossible for a
human annotator to give a certain label to every single instance in the
dataset. This results in annotation gaps in the input data to the adopting
supervised learning system. The performance of the recognition system is
negatively affected by these gaps. In this work, we propose and investigate
three different paradigms to handle these gaps. In the first paradigm, the gaps
are taken out by dropping all unlabeled readings. A single "Unknown" or
"Do-Nothing" label is given to the unlabeled readings within the operation of
the second paradigm. The last paradigm handles these gaps by giving every one
of them a unique label identifying the encapsulating deterministic labels.
Also, we propose a semantic preprocessing method of annotation gaps by
constructing a hybrid combination of some of these paradigms for further
performance improvement. The performance of the proposed three paradigms and
their hybrid combination is evaluated using an ADL benchmark dataset containing
more than $2.5\times 10^6$ sensor readings that had been collected over more
than nine months. The evaluation results emphasize the performance contrast
under the operation of each paradigm and support a specific gap handling
approach for better performance.
- Abstract(参考訳): データアノテーションは教師あり学習の重要な段階である。
しかし、アノテーションプロセスは徹底的で、特に大規模なデータセットには時間がかかります。
デイリーリビング(ADL)認識のアクティビティは、非常に大規模な生センサデータ読み取りを利用するシステムの例である。
このようなシステムでは、24/7で活動監視センサからセンサ読み取りを収集する。
生成されたデータセットのサイズは非常に大きいので、人間のアノテーションがデータセットのすべてのインスタンスに特定のラベルを与えることはほとんど不可能です。
これにより、教師付き学習システムへの入力データのアノテーションギャップが生じる。
認識システムの性能は、これらのギャップによって悪影響を受ける。
本研究では,これらのギャップに対処する3つのパラダイムを提案し,検討する。
最初のパラダイムでは、ラベルなしのすべての読みを落としてギャップを取り出す。
未知」または「無知」のラベルは、第2パラダイムの操作におけるラベルなしの読みに与えられる。
最後のパラダイムは、それぞれにカプセル化された決定論的ラベルを識別するユニークなラベルを与えることで、これらのギャップを処理する。
また,これらのパラダイムをハイブリッドに組み合わせ,さらなる性能向上を実現することにより,アノテーションギャップのセマンティックプリプロセッシング手法を提案する。
提案した3つのパラダイムとそれらのハイブリッド組み合わせの性能は,9ヶ月以上にわたって収集された2.5ドル以上のセンサ読み取りを含むADLベンチマークデータセットを用いて評価した。
評価結果は,各パラダイムの動作における性能コントラストを強調し,特定のギャップハンドリング手法による性能向上を支援する。
関連論文リスト
- Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Semi-Supervised End-To-End Contrastive Learning For Time Series
Classification [10.635321868623883]
時系列分類は、金融、医療、センサーデータ分析など、さまざまな分野において重要な課題である。
SLOTS(Semi-supervised Learning fOr Time clasSification)と呼ばれるエンドツーエンドモデルを提案する。
論文 参考訳(メタデータ) (2023-10-13T04:22:21Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - Self-Supervised Bernoulli Autoencoders for Semi-Supervised Hashing [1.8899300124593648]
本稿では,変分オートエンコーダに基づくハッシュ手法のロバスト性と,監督の欠如について検討する。
本稿では,モデルがラベル分布予測を用いて一対の目的を実現する新しい監視手法を提案する。
実験の結果,いずれの手法もハッシュコードの品質を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-07-17T07:47:10Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。