論文の概要: SELECT: Detecting Label Errors in Real-world Scene Text Data
- arxiv url: http://arxiv.org/abs/2512.14050v1
- Date: Tue, 16 Dec 2025 03:32:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.570633
- Title: SELECT: Detecting Label Errors in Real-world Scene Text Data
- Title(参考訳): SELECT:実世界のシーンテキストデータにおけるラベルエラーの検出
- Authors: Wenjun Liu, Qian Wu, Yifeng Hu, Yuke Li,
- Abstract要約: 実世界のシーンテキストデータセットにおけるラベルエラーを検出するために,マルチモーダルトレーニングを活用する新しいアプローチであるSELECTを導入する。
また、実世界のエラーシナリオを模倣するために、意図的にトレーニングラベルにエラーを導入するプロセスであるSimisity-based Sequence Label Corruption (SSLC)を導入する。
本手法は,可変長ラベルを考慮した実世界のシーンテキストデータセットにおけるラベル誤りを初めて検出する手法である。
- 参考スコア(独自算出の注目度): 19.30263030638965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce SELECT (Scene tExt Label Errors deteCTion), a novel approach that leverages multi-modal training to detect label errors in real-world scene text datasets. Utilizing an image-text encoder and a character-level tokenizer, SELECT addresses the issues of variable-length sequence labels, label sequence misalignment, and character-level errors, outperforming existing methods in accuracy and practical utility. In addition, we introduce Similarity-based Sequence Label Corruption (SSLC), a process that intentionally introduces errors into the training labels to mimic real-world error scenarios during training. SSLC not only can cause a change in the sequence length but also takes into account the visual similarity between characters during corruption. Our method is the first to detect label errors in real-world scene text datasets successfully accounting for variable-length labels. Experimental results demonstrate the effectiveness of SELECT in detecting label errors and improving STR accuracy on real-world text datasets, showcasing its practical utility.
- Abstract(参考訳): SELECT(Scene tExt Label Errors deteCTion)は,実世界のシーンテキストデータセットにおけるラベルエラーの検出にマルチモーダルトレーニングを活用する新しい手法である。
SELECTは、画像テキストエンコーダと文字レベルのトークンライザを使用して、可変長シーケンスラベル、ラベルシーケンスミスアライメント、文字レベルのエラーの問題に対処し、既存の手法よりも精度と実用性が高い。
また、Simisity-based Sequence Label Corruption (SSLC)を導入し、トレーニング中に実世界のエラーシナリオを模倣するために、意図的にエラーをトレーニングラベルに導入するプロセスを紹介した。
SSLCはシーケンスの長さを変えるだけでなく、汚職時に文字間の視覚的類似性を考慮に入れている。
本手法は,可変長ラベルを考慮した実世界のシーンテキストデータセットにおけるラベル誤りを初めて検出する手法である。
実世界のテキストデータセットにおけるラベル誤りの検出とSTR精度の向上にSELECTが有効であることを示す実験結果が得られた。
関連論文リスト
- Learning to Detect Label Errors by Making Them: A Method for Segmentation and Object Detection Datasets [4.553529552666485]
本稿では,オブジェクト検出,セマンティックセグメンテーション,インスタンスセグメンテーションデータセットにおけるラベルエラーを統一的に検出する手法を提案する。
実験では,提案手法のラベル誤り検出性能を,各タスク領域の様々なベースラインと最先端アプローチと比較した。
我々は、Cityscapesデータセットで特定された459個の実ラベルエラーをリリースし、Cityscapesにおける実ラベルエラー検出のベンチマークを提供する。
論文 参考訳(メタデータ) (2025-08-25T11:59:56Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - Alternative Pseudo-Labeling for Semi-Supervised Automatic Speech
Recognition [49.42732949233184]
ラベル付きデータが不十分な場合、擬似ラベル技術による半教師付き学習は自動音声認識の性能を大幅に向上させることができる。
損失関数のグラウンドトルースとしてノイズラベルを取ると、最適以下の性能が得られる。
そこで我々は,ノイズの多い擬似ラベル問題に対処するために,代替擬似ラベル方式という新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-12T12:13:52Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Detecting Label Errors in Token Classification Data [22.539748563923123]
トークン分類データセットにラベルエラーを含む文を見つけるタスクについて検討する。
予測されたクラス確率に基づいてトークン/文をスコアする,11種類の簡単な手法について検討する。
異なるトークン分類モデルに適用した場合にラベルエラーを含む文を一貫して検出する,単純かつ効果的な手法を同定する。
論文 参考訳(メタデータ) (2022-10-08T05:14:22Z) - Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification [5.279257531335345]
ピクセルワイドラベルを用いたセマンティックセグメンテーションデータセットにおけるラベル誤り検出手法を初めて提案する。
提案手法では,誤検出回数を制御しながら,ラベルエラーの大部分を検出することができる。
論文 参考訳(メタデータ) (2022-07-13T10:25:23Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Validating Label Consistency in NER Data Annotation [34.24378200299595]
本研究では,ラベル(in-)一貫性とNERモデル性能の関係を検討する経験的手法を提案する。
実験では,SCIERCおよびCoNLL03データセットにおけるテストデータのラベルの不整合を同定した。
論文 参考訳(メタデータ) (2021-01-21T16:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。