論文の概要: Enhancing Small-Scale Dataset Expansion with Triplet-Connection-based Sample Re-Weighting
- arxiv url: http://arxiv.org/abs/2508.07723v1
- Date: Mon, 11 Aug 2025 07:50:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.001961
- Title: Enhancing Small-Scale Dataset Expansion with Triplet-Connection-based Sample Re-Weighting
- Title(参考訳): Triplet-Connection-based Sample Re-Weighting による小規模データセット拡張の強化
- Authors: Ting Xiang, Changjian Chen, Zhuo Tang, Qifeng Zhang, Fei Lyu, Li Yang, Jiapeng Zhang, Kenli Li,
- Abstract要約: 制御不能な生成プロセスと自然言語のあいまいさのため、ノイズの多い画像を生成することができる。
再重み付けは、このようなノイズの多い画像に低重みを割り当てることによってこの問題に対処する効果的な方法である。
本稿では,3重結合型サンプル再重み付け手法であるTriReWeightを開発した。
- 参考スコア(独自算出の注目度): 33.69942307190522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of computer vision models in certain real-world applications, such as medical diagnosis, is often limited by the scarcity of available images. Expanding datasets using pre-trained generative models is an effective solution. However, due to the uncontrollable generation process and the ambiguity of natural language, noisy images may be generated. Re-weighting is an effective way to address this issue by assigning low weights to such noisy images. We first theoretically analyze three types of supervision for the generated images. Based on the theoretical analysis, we develop TriReWeight, a triplet-connection-based sample re-weighting method to enhance generative data augmentation. Theoretically, TriReWeight can be integrated with any generative data augmentation methods and never downgrade their performance. Moreover, its generalization approaches the optimal in the order $O(\sqrt{d\ln (n)/n})$. Our experiments validate the correctness of the theoretical analysis and demonstrate that our method outperforms the existing SOTA methods by $7.9\%$ on average over six natural image datasets and by $3.4\%$ on average over three medical datasets. We also experimentally validate that our method can enhance the performance of different generative data augmentation methods.
- Abstract(参考訳): 医療診断などの特定の現実世界の応用におけるコンピュータビジョンモデルの性能は、利用可能な画像の不足によって制限されることが多い。
事前訓練された生成モデルを使用してデータセットを拡張することは、効果的なソリューションである。
しかし、制御不能な生成プロセスと自然言語のあいまいさのため、ノイズの多い画像を生成することができる。
再重み付けは、このようなノイズの多い画像に低重みを割り当てることによってこの問題に対処する効果的な方法である。
まず、生成した画像の3種類の監督を理論的に分析する。
理論解析に基づいて,3重結合を用いたサンプル再重み付け法であるTriReWeightを開発した。
理論的には、TriReWeightは任意の生成データ拡張メソッドに統合でき、パフォーマンスを低下させることはない。
さらに、その一般化は位数$O(\sqrt{d\ln (n)/n})$の最適値に近づく。
本実験は, 理論解析の正しさを検証し, 提案手法が既存のSOTA法を平均で7.9 %, 3つの医学的データセットで平均で3.4 %, 平均で7.9 %, 性能で上回っていることを示す。
また,本手法が異なる生成データ拡張手法の性能を向上させることを実験的に検証した。
関連論文リスト
- Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step [86.69947123512836]
CoT(Chain-of-Thought)推論は、複雑な理解タスクに取り組むために大規模なモデルで広く研究されている。
自己回帰画像生成を促進するために,CoT推論の可能性について,初めて包括的調査を行った。
本稿では,自動回帰画像生成に特化したPARMとPARM++を提案する。
論文 参考訳(メタデータ) (2025-01-23T18:59:43Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Local Lesion Generation is Effective for Capsule Endoscopy Image Data Augmentation in a Limited Data Setting [0.0]
そこで我々は, 局所病変生成手法を2つ提案し, 小型医用画像データセットの増大に対処する。
最初のアプローチでは、古典的な画像処理技術であるPoisson Image Editingアルゴリズムを使用して、リアルな画像合成を生成する。
第2のアプローチでは、微調整されたイメージインペインティングGANを利用して、現実的な病変を合成する新しい生成手法を導入している。
論文 参考訳(メタデータ) (2024-11-05T13:44:25Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Data-iterative Optimization Score Model for Stable Ultra-Sparse-View CT
Reconstruction [2.2336243882030025]
スパースビューCT再構成のための反復最適化データスコアリングモデル(DOSM)を提案する。
DOSMはデータの一貫性をデータ一貫性要素に統合し、測定データと生成モデルの制約を効果的にバランスさせる。
我々はDOSM更新の最適化に従来の手法を活用している。
論文 参考訳(メタデータ) (2023-08-28T09:23:18Z) - Reference-Free Isotropic 3D EM Reconstruction using Diffusion Models [8.590026259176806]
本稿では、参照データや劣化過程に関する事前知識の制限を克服する拡散モデルに基づくフレームワークを提案する。
提案手法では, 2次元拡散モデルを用いて連続的に3次元ボリュームを再構成し, 高精度なサンプルデータに適している。
論文 参考訳(メタデータ) (2023-08-03T07:57:02Z) - Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文 参考訳(メタデータ) (2023-05-24T16:33:02Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。