Fugu-MT 論文翻訳(概要): Diverse Generation while Maintaining Semantic Coordination: A Diffusion-Based Data Augmentation Method for Object Detection

論文の概要: Diverse Generation while Maintaining Semantic Coordination: A Diffusion-Based Data Augmentation Method for Object Detection

arxiv url: http://arxiv.org/abs/2408.02891v1
Date: Tue, 6 Aug 2024 01:41:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-07 15:19:13.601088
Title: Diverse Generation while Maintaining Semantic Coordination: A Diffusion-Based Data Augmentation Method for Object Detection
Title（参考訳）: セマンティックコーディネーションを維持した多変量生成:オブジェクト検出のための拡散に基づくデータ拡張法
Authors: Sen Nie, Zhuo Wang, Xinxin Wang, Kun He,
Abstract要約: 本稿では,このバランスを仲介するために,事前学習条件付き拡散モデルを利用した革新的拡張手法を提案する。本手法は,データセットの多様性向上を目的としたカテゴリ親和性マトリックスの開発を念頭に置いている。本手法は,3つの異なる物体検出モデルにおいて,既存の代替品に対して,+1.4AP,+0.9AP,+3.4APの実質的な平均的改善をもたらす。
参考スコア（独自算出の注目度）: 13.891827551739008
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent studies emphasize the crucial role of data augmentation in enhancing the performance of object detection models. However,existing methodologies often struggle to effectively harmonize dataset diversity with semantic coordination.To bridge this gap, we introduce an innovative augmentation technique leveraging pre-trained conditional diffusion models to mediate this balance. Our approach encompasses the development of a Category Affinity Matrix, meticulously designed to enhance dataset diversity, and a Surrounding Region Alignment strategy, which ensures the preservation of semantic coordination in the augmented images. Extensive experimental evaluations confirm the efficacy of our method in enriching dataset diversity while seamlessly maintaining semantic coordination. Our method yields substantial average improvements of +1.4AP, +0.9AP, and +3.4AP over existing alternatives on three distinct object detection models, respectively.
Abstract（参考訳）: 近年の研究では、オブジェクト検出モデルの性能向上におけるデータ拡張の重要な役割を強調している。しかし,既存の手法は,データセットの多様性とセマンティック・コーディネートを効果的に調和させることに苦慮することが多く,このギャップを埋めるために,事前学習した条件付き拡散モデルを利用してこのバランスを仲介する革新的な拡張手法を導入する。提案手法は,データセットの多様性向上を念頭に設計したカテゴリ親和性マトリックスと,拡張画像におけるセマンティックコーディネーションの保存を確実にする周辺領域アライメント戦略の開発を包含する。大規模な実験により,セマンティック・コーディネーションをシームレスに維持しつつ,データセットの多様性を充実させる手法の有効性が確認された。本手法は,既存の3種類の物体検出モデルに対して,+1.4AP,+0.9AP,+3.4APの精度向上を実現している。

関連論文リスト

Domain Adaptation via Feature Refinement [0.3867363075280543]
本稿では,分散シフト下での非教師付きドメイン適応のための簡易かつ効果的なフレームワークであるDAFR(Domain Adaptation via Feature Refinement)を提案する。提案手法は, ラベルなし対象データを用いたバッチ正規化統計の適応, ソース学習モデルからの特徴蒸留, 仮説伝達の3つの重要な要素を組み合わせた。
論文参考訳（メタデータ） (2025-08-22T06:32:19Z)
ADAptation: Reconstruction-based Unsupervised Active Learning for Breast Ultrasound Diagnosis [11.49367029555765]
ディープラーニングベースの診断モデルは、トレーニング(ソース)とテスト(ターゲット)ドメイン間の分散シフトによって、パフォーマンス低下を被ることが多い。本稿では、適応ドメインのための教師なしアクティブ学習フレームワークADAptationを提案する。本手法は,アノテーション予算に制限されたマルチドメインデータプールから情報サンプルを効率よく選択する。
論文参考訳（メタデータ） (2025-07-01T06:45:02Z)
SGD-Mix: Enhancing Domain-Specific Image Classification with Label-Preserving Data Augmentation [0.6554326244334868]
本稿では,多様性,忠実さ,ラベルの明確さを明確に拡張プロセスに統合する新しい枠組みを提案する。提案手法では,前景のセマンティクスを保存し,背景の多様性を充実させ,ラベルの一貫性を確保するために,塩分濃度誘導混合と微調整拡散モデルを用いている。
論文参考訳（メタデータ） (2025-05-17T03:51:18Z)
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data [1.0901840476380924]
本稿では,大規模ラベル付きデータセットへの依存を減らすために,新しい二重領域拡張手法を提案する。提案手法は,前景オブジェクトにランダムノイズ摂動を適用することで,対象データ変換を行う。 SFDAのためのPACSデータセットの評価は、当社の増補戦略が既存の手法を一貫して上回っていることを示している。 Market-1501とDukeMTMC-reIDデータセットの実験は、我々のアプローチの有効性を検証する。
論文参考訳（メタデータ） (2025-04-17T16:42:33Z)
Distribution Discrepancy and Feature Heterogeneity for Active 3D Object Detection [18.285299184361598]
LiDARベースの3Dオブジェクト検出は、自律走行とロボット工学の発展にとって重要な技術である。 DDFH(Dis Distribution Discrepancy and Feature Heterogeneity)と呼ばれる新しい効果的なアクティブラーニング手法を提案する。幾何学的特徴とモデル埋め込みを同時に考慮し、インスタンスレベルとフレームレベルの両方の観点から情報を評価する。
論文参考訳（メタデータ） (2024-09-09T08:26:11Z)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳（メタデータ） (2024-08-01T07:40:00Z)
MDDD: Manifold-based Domain Adaptation with Dynamic Distribution for Non-Deep Transfer Learning in Cross-subject and Cross-session EEG-based Emotion Recognition [11.252832459891566]
動的分布を用いたマニフォールド型ドメイン適応法(MDDD)を提案する。実験の結果,MDDDは従来の非深層学習法よりも優れ,平均3.54%の改善が達成された。これは、MDDDが現実のシナリオにおけるABCIの有用性と適用性を高めるための有望な方法である可能性を示唆している。
論文参考訳（メタデータ） (2024-04-24T03:08:25Z)
Out-of-Distribution Detection via Deep Multi-Comprehension Ensemble [11.542472900306745]
マルチComprehension (MC) Ensemble は,OOD (Out-of-Distribution) 特徴表現を拡大するための戦略として提案されている。 OOD検出におけるMC Ensemble戦略の優れた性能を示す実験結果を得た。これにより,提案手法がトレーニング分布外のインスタンスを検出できるモデルの性能向上に有効であることを示す。
論文参考訳（メタデータ） (2024-03-24T18:43:04Z)
Consistency Regularization for Generalizable Source-free Domain Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-03T07:45:53Z)
Towards Efficient Deep Hashing Retrieval: Condensing Your Data via Feature-Embedding Matching [7.908244841289913]
最先端の深層ハッシュ検索モデルのトレーニングに要する費用は増加している。最先端のデータセット蒸留法は、すべての深層ハッシュ検索法に拡張できない。合成集合と実集合との特徴埋め込みをマッチングすることにより,これらの制約に対処する効率的な凝縮フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-29T13:23:55Z)
Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。 Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文参考訳（メタデータ） (2022-09-27T14:19:00Z)
Better Modelling Out-of-Distribution Regression on Distributed Acoustic Sensor Data Using Anchored Hidden State Mixup [0.7455546102930911]
トレーニングデータとテストデータの統計的分布が異なる状況への機械学習モデルの応用を一般化することは、複雑な問題であった。本稿では,正規化の新たなペナルティを形成するために,多様体隠蔽状態の混合と観測類似性を利用したアンカー型回帰混合アルゴリズムを提案する。提案手法の既存手法に対する一般化性能を広範囲に評価し,提案手法が最先端性能を実現することを示す。
論文参考訳（メタデータ） (2022-02-23T03:12:21Z)
Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文参考訳（メタデータ） (2022-02-10T06:23:56Z)
Deep Variational Models for Collaborative Filtering-based Recommender Systems [63.995130144110156]
ディープラーニングは、リコメンダシステムの結果を改善するために、正確な協調フィルタリングモデルを提供する。提案するモデルは, 深層建築の潜伏空間において, 変分概念を注入性に適用する。提案手法は, 入射雑音効果を超える変動エンリッチメントのシナリオにおいて, 提案手法の優位性を示す。
論文参考訳（メタデータ） (2021-07-27T08:59:39Z)
CoDA: Contrast-enhanced and Diversity-promoting Data Augmentation for Natural Language Understanding [67.61357003974153]
我々はCoDAと呼ばれる新しいデータ拡張フレームワークを提案する。 CoDAは、複数の変換を有機的に統合することで、多種多様な情報付加例を合成する。すべてのデータサンプルのグローバルな関係を捉えるために、対照的な正則化の目的を導入する。
論文参考訳（メタデータ） (2020-10-16T23:57:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。