論文の概要: Finding the Reflection Point: Unpadding Images to Remove Data Augmentation Artifacts in Large Open Source Image Datasets for Machine Learning
- arxiv url: http://arxiv.org/abs/2504.03168v1
- Date: Fri, 04 Apr 2025 04:54:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:48:19.098486
- Title: Finding the Reflection Point: Unpadding Images to Remove Data Augmentation Artifacts in Large Open Source Image Datasets for Machine Learning
- Title(参考訳): 反射点の発見: 機械学習のための大規模オープンソース画像データセットにおけるデータ拡張アーティファクトの除去のための画像の展開
- Authors: Lucas Choi, Ross Greer,
- Abstract要約: 本稿では,最小平均二乗誤差手法を用いて反射境界を記述するための体系的アルゴリズムを提案する。
提案手法は,圧縮やノイズの存在下においても,真の内容とミラー付き内容との遷移を効果的に同定する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this paper, we address a novel image restoration problem relevant to machine learning dataset curation: the detection and removal of noisy mirrored padding artifacts. While data augmentation techniques like padding are necessary for standardizing image dimensions, they can introduce artifacts that degrade model evaluation when datasets are repurposed across domains. We propose a systematic algorithm to precisely delineate the reflection boundary through a minimum mean squared error approach with thresholding and remove reflective padding. Our method effectively identifies the transition between authentic content and its mirrored counterpart, even in the presence of compression or interpolation noise. We demonstrate our algorithm's efficacy on the SHEL5k dataset, showing significant performance improvements in zero-shot object detection tasks using OWLv2, with average precision increasing from 0.47 to 0.61 for hard hat detection and from 0.68 to 0.73 for person detection. By addressing annotation inconsistencies and distorted objects in padded regions, our approach enhances dataset integrity, enabling more reliable model evaluation across computer vision tasks.
- Abstract(参考訳): 本稿では,機械学習データセットのキュレーションに関連する新しい画像復元問題,すなわち,ノイズの多いミラードパディングアーティファクトの検出と削除に対処する。
パディングのようなデータ拡張技術は画像次元の標準化に必要だが、データセットがドメイン間で再利用されたときにモデル評価を劣化させるアーティファクトを導入することができる。
本稿では,最小平均二乗誤差アプローチにより反射境界を正確に記述し,反射パディングを除去する手法を提案する。
本手法は,圧縮や補間ノイズの存在下においても,実際の内容とミラー付き内容との遷移を効果的に同定する。
SHEL5kデータセットにおけるアルゴリズムの有効性を実証し,OWLv2を用いたゼロショットオブジェクト検出タスクにおいて,ハードハット検出では平均精度0.47から0.61,人検出では0.68から0.73に向上したことを示す。
アノテーションの不整合やパッド領域の歪んだオブジェクトに対処することにより,データセットの整合性を向上し,コンピュータビジョンタスク全体にわたってより信頼性の高いモデル評価を可能にする。
関連論文リスト
- Utilizing Multi-step Loss for Single Image Reflection Removal [0.9208007322096532]
歪んだイメージは、オブジェクト検出やイメージセグメンテーションといったタスクに悪影響を及ぼす可能性がある。
単一画像を用いた画像反射除去のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-11T17:57:25Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Overcoming Scene Context Constraints for Object Detection in wild using Defilters [3.038642416291856]
物体検出、認識、セグメンテーションなどの高レベルのコンピュータビジョンタスクは、特に画像歪みに敏感である。
物体検出に先立って画像歪みを補正する画像デファイラを提案する。
この方法では、非歪画像のトレーニング時にモデルが最適に実行されるため、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2024-04-12T07:30:52Z) - A Semi-supervised Object Detection Algorithm for Underwater Imagery [10.017195276758455]
本稿では, 変分オートエンコーダ(VAE)に基づく半教師付きフレームワークを用いて, 人工物体を異常として扱い, 検出することを提案する。
本研究では,学習した低次元潜在空間における画像データをクラスタリングし,異常な特徴を含む可能性のある画像を抽出する手法を提案する。
大規模な画像データセットに両方の手法を適用することで、人間のオペレーターが興味のある対象を特定するために、偽陽性率の低い候補異常なサンプルを提示できることを実証する。
論文 参考訳(メタデータ) (2023-06-07T23:40:04Z) - Exploiting the Distortion-Semantic Interaction in Fisheye Data [12.633032175875865]
魚眼のデータは他のタイプのカメラよりも広い視野の利点があるが、これは高い歪みを犠牲にしている。
中心からさらに離れたオブジェクトは、モデルがセマンティックコンテキストを特定するのが難しくなる変形を示す。
画像の中心から物体の距離に基づいて歪みクラスラベルを抽出し,この関係を利用する手法を提案する。
次に、同じ意味クラスのオブジェクトと互いに近い歪みクラスのオブジェクトを制約する重み付けされた対照的な損失で、バックボーンの表現空間を形成する。
論文 参考訳(メタデータ) (2023-04-28T20:23:38Z) - Benchmarking performance of object detection under image distortions in
an uncontrolled environment [0.483420384410068]
オブジェクト検出アルゴリズムの堅牢性は、現実世界のアプリケーションにおいて顕著な役割を果たす。
物体検出法の性能は, 被写体内歪みに悩まされていることが証明されている。
本稿では,最先端のオブジェクト検出手法の性能評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-28T09:06:52Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。