論文の概要: IDA: Improved Data Augmentation Applied to Salient Object Detection
- arxiv url: http://arxiv.org/abs/2009.08845v1
- Date: Fri, 18 Sep 2020 14:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 02:51:26.295654
- Title: IDA: Improved Data Augmentation Applied to Salient Object Detection
- Title(参考訳): IDA:有能な物体検出に応用したデータ拡張
- Authors: Daniel V. Ruiz and Bruno A. Krinski and Eduardo Todt
- Abstract要約: 本稿では,SOD(Salient Object Detection)に着目した改良型データ拡張(IDA)技術を提案する。
提案手法は,画像のインペイント,アフィン変換,およびラベル付きデータから抽出したサリアントオブジェクトと,異なる生成背景画像の線形結合を組み合わせたものである。
本手法は,SOD分野のいくつかの有名なデータセット上で,最先端ニューラルネットワークをトレーニングする際のセグメンテーション品質を向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present an Improved Data Augmentation (IDA) technique
focused on Salient Object Detection (SOD). Standard data augmentation
techniques proposed in the literature, such as image cropping, rotation,
flipping, and resizing, only generate variations of the existing examples,
providing a limited generalization. Our method combines image inpainting,
affine transformations, and the linear combination of different generated
background images with salient objects extracted from labeled data. Our
proposed technique enables more precise control of the object's position and
size while preserving background information. The background choice is based on
an inter-image optimization, while object size follows a uniform random
distribution within a specified interval, and the object position is
intra-image optimal. We show that our method improves the segmentation quality
when used for training state-of-the-art neural networks on several famous
datasets of the SOD field. Combining our method with others surpasses
traditional techniques such as horizontal-flip in 0.52% for F-measure and 1.19%
for Precision. We also provide an evaluation in 7 different SOD datasets, with
9 distinct evaluation metrics and an average ranking of the evaluated methods.
- Abstract(参考訳): 本稿では,Salient Object Detection(SOD)に着目した改良型データ拡張(IDA)技術を提案する。
画像クロッピング、回転、フリップ、リサイズなどの文献で提案された標準的なデータ拡張技術は、既存の例のバリエーションのみを生成し、限定的な一般化を提供する。
本手法では,画像インペインティング,アフィン変換,および異なる背景画像の線形結合とラベル付きデータから抽出したサルエントオブジェクトを組み合わせる。
提案手法により,背景情報を保存しながら物体の位置や大きさをより正確に制御できる。
背景選択は画像間最適化に基づいており、オブジェクトサイズは所定の間隔内で均一なランダム分布に従い、オブジェクト位置は画像内最適である。
本手法は,sodフィールドの有名なデータセット上での最先端ニューラルネットワークの訓練において,セグメンテーション品質が向上することを示す。
F測定では0.52%,精度では1.19%で水平フリップなど従来の手法を超えている。
また、7つの異なるSODデータセットで評価を行い、9つの異なる評価指標と評価手法の平均ランク付けを行った。
関連論文リスト
- RDPN6D: Residual-based Dense Point-wise Network for 6Dof Object Pose Estimation Based on RGB-D Images [13.051302134031808]
単一のRGB-D画像を用いてオブジェクトの6DoFポーズを計算する新しい手法を提案する。
オブジェクトのポーズを直接予測する既存の手法や、ポーズ回復のためのスパースキーポイントに依存する既存の手法とは異なり、我々のアプローチは密度の高い対応を使ってこの課題に対処する。
論文 参考訳(メタデータ) (2024-05-14T10:10:45Z) - Diff-DOPE: Differentiable Deep Object Pose Estimation [29.703385848843414]
Diff-DOPE, 画像入力を行う6-DoFポーズ精細機, オブジェクトの3次元テクスチャモデル, オブジェクトの初期ポーズを紹介する。
この方法は、画像とモデルの投影の間の視覚的エラーを最小限に抑えるために、オブジェクトのポーズを更新するために微分可能なレンダリングを使用する。
このシンプルで効果的なアイデアは、ポーズ推定データセットで最先端の結果を得ることができることを示す。
論文 参考訳(メタデータ) (2023-09-30T18:52:57Z) - Randomize to Generalize: Domain Randomization for Runway FOD Detection [1.4249472316161877]
細い物体検出は、小型化、低解像度化、オクルージョン化、背景クラッタ、照明条件、被写体対画像比の小さいため困難である。
本稿では,SRIA(Synthetic Image Augmentation)の新たな2段階手法を提案する。
検出精度は初期41%からOODテストセットの92%に改善した。
論文 参考訳(メタデータ) (2023-09-23T05:02:31Z) - Unsupervised Domain Adaptive Fundus Image Segmentation with Few Labeled
Source Data [17.106866501665916]
unsupervised domain adapt(UDA)メソッドは、未ラベルのターゲットファンドデータセット上のモデルの一般化能力を高める。
UDAメソッドは常にソースドメインからの十分なラベル付きデータを必要とし、補助的なデータ取得とアノテーションコストをもたらす。
本稿では,ソースデータスタイルを多様化し,データ量を増加させる検索型マルチスタイル不変機構を提案する。
提案手法は,UDAファウンダス・セグメンテーションに基づく最先端のUDAセグメンテーション法と,ラベル付き情報源データとを比較検討した。
論文 参考訳(メタデータ) (2022-10-10T00:30:48Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - DFM: A Performance Baseline for Deep Feature Matching [10.014010310188821]
提案手法では,事前学習したVGGアーキテクチャを特徴抽出器として使用し,マッチングを改善するために追加の訓練を必要としない。
提案アルゴリズムは,Hpatchesデータセット上で,平均マッチング精度(MMA)で0.57と0.80のスコアをそれぞれ1ピクセル,2ピクセルの閾値で達成する。
論文 参考訳(メタデータ) (2021-06-14T22:55:06Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。