論文の概要: Domain Bridge: Generative model-based domain forensic for black-box
models
- arxiv url: http://arxiv.org/abs/2402.04640v1
- Date: Wed, 7 Feb 2024 07:57:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 16:14:43.534586
- Title: Domain Bridge: Generative model-based domain forensic for black-box
models
- Title(参考訳): ドメインブリッジ:ブラックボックスモデルのための生成モデルに基づくドメイン鑑識
- Authors: Jiyi Zhang, Han Fang, Ee-Chien Chang
- Abstract要約: 我々は、一般的なデータドメインだけでなく、その特定の属性も決定する拡張されたアプローチを導入する。
本手法では,エンコーダに画像埋め込みモデル,デコーダに生成モデルを用いる。
我々のアプローチの重要な強みは、生成モデルである安定拡散をトレーニングする拡張データセットであるLAION-5Bを活用することである。
- 参考スコア(独自算出の注目度): 20.84645356097581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In forensic investigations of machine learning models, techniques that
determine a model's data domain play an essential role, with prior work relying
on large-scale corpora like ImageNet to approximate the target model's domain.
Although such methods are effective in finding broad domains, they often
struggle in identifying finer-grained classes within those domains. In this
paper, we introduce an enhanced approach to determine not just the general data
domain (e.g., human face) but also its specific attributes (e.g., wearing
glasses). Our approach uses an image embedding model as the encoder and a
generative model as the decoder. Beginning with a coarse-grained description,
the decoder generates a set of images, which are then presented to the unknown
target model. Successful classifications by the model guide the encoder to
refine the description, which in turn, are used to produce a more specific set
of images in the subsequent iteration. This iterative refinement narrows down
the exact class of interest. A key strength of our approach lies in leveraging
the expansive dataset, LAION-5B, on which the generative model Stable Diffusion
is trained. This enlarges our search space beyond traditional corpora, such as
ImageNet. Empirical results showcase our method's performance in identifying
specific attributes of a model's input domain, paving the way for more detailed
forensic analyses of deep learning models.
- Abstract(参考訳): 機械学習モデルの法医学的な調査では、モデルのデータドメインを決定する技術が重要な役割を果たす。
このような手法は広い領域を見つけるのに有効であるが、ドメイン内のよりきめ細かいクラスを特定するのに苦労することが多い。
本稿では、一般的なデータ領域(例えば、人間の顔)だけでなく、特定の属性(例えば、眼鏡)も決定する拡張アプローチを提案する。
本手法では,エンコーダとして画像埋め込みモデル,デコーダとして生成モデルを用いる。
粗い粒度の記述から始めて、デコーダは一連の画像を生成し、それが未知のターゲットモデルに提示される。
モデルで成功した分類は、エンコーダをガイドして記述を洗練させ、その後の反復でより具体的な画像を生成するために使用される。
この反復的な洗練は、正確な関心のクラスを狭める。
我々のアプローチの重要な強みは、生成モデルの安定拡散を訓練する拡張データセットlaion-5bを活用することである。
これはimagenetのような従来のコーポラを超えて、検索スペースを拡大します。
実験結果は,モデルの入力領域の特定の属性を識別する手法の性能を示し,深層学習モデルのより詳細な法医学的解析への道筋を示した。
関連論文リスト
- Active Generation for Image Classification [50.18107721267218]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - DG-TTA: Out-of-domain medical image segmentation through Domain
Generalization and Test-Time Adaptation [47.03645745525752]
本稿では、ドメインの一般化とテスト時間適応を組み合わせることで、未確認対象領域で事前学習したモデルを再利用するための非常に効果的なアプローチを提案する。
本手法は,事前訓練した全身CTモデルと組み合わせることで,MR画像を高精度に分割できることを実証する。
論文 参考訳(メタデータ) (2023-12-11T10:26:21Z) - Generating Reliable Pixel-Level Labels for Source Free Domain Adaptation [13.913151437401472]
ReGENは、画像間翻訳ネットワークとセグメンテーションネットワークとを備える。
我々のワークフローは、元のターゲット領域画像からノイズ予測を用いてターゲットライクな画像を生成する。
論文 参考訳(メタデータ) (2023-07-03T09:44:13Z) - Beyond ImageNet Attack: Towards Crafting Adversarial Examples for
Black-box Domains [80.11169390071869]
敵対的な例は、転送可能な性質のため、ディープニューラルネットワークに深刻な脅威をもたらしている。
ブラックボックス領域への転送可能性を調べるために,Beyond ImageNet Attack (BIA)を提案する。
提案手法は, 最先端手法を最大7.71%(粗粒領域)と25.91%(細粒領域)で平均的に上回っている。
論文 参考訳(メタデータ) (2022-01-27T14:04:27Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - An application of a pseudo-parabolic modeling to texture image
recognition [0.0]
偏微分方程式モデルを用いたテクスチャ画像認識のための新しい手法を提案する。
擬似パラボリックなBuckley-Leverett方程式を用いて、デジタル画像表現のダイナミクスを提供し、時間とともに進化するそれらの画像から局所的な記述子を収集する。
論文 参考訳(メタデータ) (2021-02-09T18:08:42Z) - Six-channel Image Representation for Cross-domain Object Detection [17.854940064699985]
ディープラーニングモデルはデータ駆動であり、優れたパフォーマンスは豊富で多様なデータセットに依存する。
いくつかの画像から画像への翻訳技術は、モデルを訓練するために特定のシーンの偽データを生成するために用いられる。
3チャンネル画像とそのgan生成した偽画像に刺激を与え,データセットの6チャンネル表現を作成することを提案する。
論文 参考訳(メタデータ) (2021-01-03T04:50:03Z) - Model Watermarking for Image Processing Networks [120.918532981871]
深層モデルの知的財産権を保護する方法は、非常に重要であるが、真に研究されていない問題である。
画像処理モデルを保護するための最初のモデル透かしフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-25T18:36:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。