論文の概要: Generating Risky Samples with Conformity Constraints via Diffusion Models
- arxiv url: http://arxiv.org/abs/2512.18722v1
- Date: Sun, 21 Dec 2025 12:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.472674
- Title: Generating Risky Samples with Conformity Constraints via Diffusion Models
- Title(参考訳): 拡散モデルによる等方性制約付きリスクサンプルの生成
- Authors: Han Yu, Hao Zou, Xingxuan Zhang, Zhengyi Wang, Yue He, Kehan Li, Peng Cui,
- Abstract要約: RiskyDiffは、リスク、生成品質、条件付きカテゴリとの適合度の観点から、既存の手法よりも優れていることを示す。
また, モデルの一般化能力は, 高整合性サンプルを用いたトレーニングデータの拡大によって向上できることを実証的に示す。
- 参考スコア(独自算出の注目度): 36.826069011797294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although neural networks achieve promising performance in many tasks, they may still fail when encountering some examples and bring about risks to applications. To discover risky samples, previous literature attempts to search for patterns of risky samples within existing datasets or inject perturbation into them. Yet in this way the diversity of risky samples is limited by the coverage of existing datasets. To overcome this limitation, recent works adopt diffusion models to produce new risky samples beyond the coverage of existing datasets. However, these methods struggle in the conformity between generated samples and expected categories, which could introduce label noise and severely limit their effectiveness in applications. To address this issue, we propose RiskyDiff that incorporates the embeddings of both texts and images as implicit constraints of category conformity. We also design a conformity score to further explicitly strengthen the category conformity, as well as introduce the mechanisms of embedding screening and risky gradient guidance to boost the risk of generated samples. Extensive experiments reveal that RiskyDiff greatly outperforms existing methods in terms of the degree of risk, generation quality, and conformity with conditioned categories. We also empirically show the generalization ability of the models can be enhanced by augmenting training data with generated samples of high conformity.
- Abstract(参考訳): ニューラルネットワークは多くのタスクで有望なパフォーマンスを達成するが、いくつかの例に遭遇しても失敗し、アプリケーションにリスクをもたらす可能性がある。
リスクのあるサンプルを発見するために、以前の文献では、既存のデータセット内のリスクのあるサンプルのパターンを探索したり、摂動を注入しようとする。
しかし、このような方法では、リスクのあるサンプルの多様性は、既存のデータセットのカバレッジによって制限される。
この制限を克服するために、最近の研究は拡散モデルを採用し、既存のデータセットの範囲を超えて、新しいリスクのあるサンプルを生成する。
しかし、これらの手法は、生成したサンプルと期待するカテゴリとの整合性に苦慮し、ラベルノイズを導入し、アプリケーションにおけるそれらの効果を著しく制限する可能性がある。
そこで本研究では,カテゴリ適合性の暗黙的制約として,テキストと画像の埋め込みを組み込んだリスクディフを提案する。
また, カテゴリの適合性をさらに高めるために適合度スコアを設計し, 生成サンプルのリスクを高めるために, 組込みスクリーニングとリスクの高い勾配誘導のメカニズムを導入する。
大規模な実験により、リスクディフは、リスク、生成品質、条件付きカテゴリとの適合性の程度において、既存の手法を大幅に上回っていることが明らかとなった。
また, モデルの一般化能力は, 高整合性サンプルを用いたトレーニングデータの拡大によって向上できることを実証的に示す。
関連論文リスト
- Data-Adaptive Tradeoffs among Multiple Risks in Distribution-Free Prediction [55.77015419028725]
しきい値とトレードオフパラメータが適応的に選択された場合、リスクの有効な制御を可能にする手法を開発する。
提案手法は単調なリスクとほぼ単調なリスクをサポートするが,それ以外は分布的な仮定はしない。
論文 参考訳(メタデータ) (2024-03-28T17:28:06Z) - Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.68233326265417]
非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文 参考訳(メタデータ) (2024-02-03T08:41:51Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Semi-supervised Batch Learning From Logged Data [24.826544828460158]
我々は,リスク最小化フレームワークを構築し,妥当性スコアへのアクセスも想定している。
本稿では,一部のサンプルにフィードバックが欠落している問題に対する学習手法を提案する。
論文 参考訳(メタデータ) (2022-09-15T08:58:28Z) - Learning from a Biased Sample [2.7728441305894447]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文 参考訳(メタデータ) (2022-09-05T04:19:16Z) - Mitigating multiple descents: A model-agnostic framework for risk
monotonization [84.6382406922369]
クロスバリデーションに基づくリスクモノトナイズのための一般的なフレームワークを開発する。
本稿では,データ駆動方式であるゼロステップとワンステップの2つの手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:41:40Z) - Open Set Recognition with Conditional Probabilistic Generative Models [51.40872765917125]
オープンセット認識のための条件付き確率生成モデル(CPGM)を提案する。
CPGMは未知のサンプルを検出できるが、異なる潜在特徴を条件付きガウス分布に近似させることで、既知のクラスを分類できる。
複数のベンチマークデータセットの実験結果から,提案手法がベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-08-12T06:23:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。