論文の概要: SAFIRE: Segment Any Forged Image Region
- arxiv url: http://arxiv.org/abs/2412.08197v1
- Date: Wed, 11 Dec 2024 08:40:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:03:23.131654
- Title: SAFIRE: Segment Any Forged Image Region
- Title(参考訳): SAFIRE: 任意のイメージ領域をセグメント化
- Authors: Myung-Joon Kwon, Wonjun Lee, Seung-Hun Nam, Minji Son, Changick Kim,
- Abstract要約: 本稿では,任意の画像領域(SAFIRE, Segment Any Forged Image Region)を提案する。
特定の偽の痕跡を記憶する代わりに、SAFIREは自然に各ソース領域内の均一な特性に焦点を当てている。
このアプローチはより安定的で効果的な学習をもたらし、新しいタスクと従来のバイナリフォージェリーローカライゼーションの両方で優れたパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 16.97096271263231
- License:
- Abstract: Most techniques approach the problem of image forgery localization as a binary segmentation task, training neural networks to label original areas as 0 and forged areas as 1. In contrast, we tackle this issue from a more fundamental perspective by partitioning images according to their originating sources. To this end, we propose Segment Any Forged Image Region (SAFIRE), which solves forgery localization using point prompting. Each point on an image is used to segment the source region containing itself. This allows us to partition images into multiple source regions, a capability achieved for the first time. Additionally, rather than memorizing certain forgery traces, SAFIRE naturally focuses on uniform characteristics within each source region. This approach leads to more stable and effective learning, achieving superior performance in both the new task and the traditional binary forgery localization.
- Abstract(参考訳): ほとんどのテクニックは、バイナリセグメンテーションタスクとしてのイメージフォージェリーローカライゼーションの問題にアプローチし、元の領域を0、偽領域を1とラベル付けするようにニューラルネットワークをトレーニングする。
対照的に、本研究では、画像の原点に応じて分割することで、より基本的な視点からこの問題に取り組む。
そこで本研究では,ポイントプロンプトを用いた偽の局所化を解消するSegment Any Forged Image Region (SAFIRE)を提案する。
画像上の各点は、自身を含むソース領域を分割するために使用される。
これにより、画像を複数のソースリージョンに分割することができます。
さらに、特定の偽の痕跡を記憶する代わりに、SAFIREは自然に各ソース領域内の均一な特性に焦点を当てている。
このアプローチはより安定的で効果的な学習をもたらし、新しいタスクと従来のバイナリフォージェリーローカライゼーションの両方で優れたパフォーマンスを達成する。
関連論文リスト
- Image Copy-Move Forgery Detection via Deep PatchMatch and Pairwise Ranking Learning [39.85737063875394]
本研究では,従来の学習手法と深層学習手法の強みを統合した,エンドツーエンドのCMFDフレームワークを開発した。
既存のディープモデルとは異なり,提案手法では,高分解能スケールから抽出した特徴を利用して,明示的で信頼性の高いポイント・ツー・ポイントマッチングを求める。
このフレームワークは、ポイント・ツー・ポイントマッチングの強い先行性を活用することで、微妙な違いを識別し、ソースとターゲットの領域を効果的に識別することができる。
論文 参考訳(メタデータ) (2024-04-26T10:38:17Z) - CFL-Net: Image Forgery Localization Using Contrastive Learning [16.668334854459143]
コントラッシブ・ロスを用いて特徴空間へのマッピングを学習し、各画像に対して未修正領域と操作領域の特徴を適切に分離する。
本手法は, 偽造型に関する事前の知識や仮定を必要とせず, 操作領域のローカライズに長けている。
論文 参考訳(メタデータ) (2022-10-04T15:31:30Z) - Location-Free Camouflage Generation Network [82.74353843283407]
カモフラージュ(Camouflage)は一般的な視覚現象で、前景の物体を背景のイメージに隠すことで、人間の目からは一時的に見えなくなる。
本稿では,前景と背景像の高次特徴を融合させ,一つの推論によって結果を生成する,ロケーションフリーなカモフラージュ生成ネットワーク(LCG-Net)を提案する。
実験により,本手法は単一外観領域における最先端技術と同程度に良好であり,完全に見えない可能性が低いが,多外観領域における最先端技術の品質をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2022-03-18T10:33:40Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - RegionCLIP: Region-based Language-Image Pretraining [94.29924084715316]
画像テキストペアを用いたコントラスト言語画像事前学習(CLIP)は,画像分類において顕著な結果を得た。
そこで我々は,CLIPを拡張して領域レベルの視覚表現を学習するRegionalCLIPという手法を提案する。
提案手法は,COCOデータセットとLVISデータセットの新たなカテゴリに対して,3.8 AP50と2.2 APの精度を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-16T18:39:36Z) - GLocal: Global Graph Reasoning and Local Structure Transfer for Person
Image Generation [2.580765958706854]
我々は、人像生成、すなわち、腐敗したテクスチャや異なるポーズなど、様々な条件下で人像を生成することに焦点を当てる。
本稿では,異なる意味領域間のスタイル相互相関を世界規模で推論することで,咬合認識のテクスチャ推定を改善するためのGLocalフレームワークを提案する。
局所構造情報保存のために,さらにソース画像の局所構造を抽出し,局所構造転送により生成画像に復元する。
論文 参考訳(メタデータ) (2021-12-01T03:54:30Z) - From Contexts to Locality: Ultra-high Resolution Image Segmentation via
Locality-aware Contextual Correlation [43.70432772819461]
広範に使われている高解像度画像分割パイプラインを革新する。
超高解像度画像を局所分割のための正規パッチに分割し、局所的な結果を高解像度セマンティックマスクにマージする。
論文 参考訳(メタデータ) (2021-09-06T16:26:05Z) - BaMBNet: A Blur-aware Multi-branch Network for Defocus Deblurring [74.34263243089688]
畳み込みニューラルネットワーク(CNN)は、デフォーカス劣化問題に導入され、大きな進歩を遂げた。
本研究では,異なる領域(ブラー量が異なる)を区別して扱う新しいマルチブランチネットワーク(BaMBNet)を設計する。
定量的および定性的な実験は、BaMBNetが最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2021-05-31T07:55:30Z) - Rethinking of the Image Salient Object Detection: Object-level Semantic
Saliency Re-ranking First, Pixel-wise Saliency Refinement Latter [62.26677215668959]
本稿では,意味的に有意な領域を粗い位置で特定する,軽量で教師付きの深層ネットワークを提案する。
次に,これらセマンティック・サリエント領域の深層モデルを画素ワイド・サリエンシ改善として融合する。
提案手法は単純だが有効であり,本手法は主眼をオブジェクトレベルのセマンティック・リグレード問題とみなすための最初の試みである。
論文 参考訳(メタデータ) (2020-08-10T07:12:43Z) - TriGAN: Image-to-Image Translation for Multi-Source Domain Adaptation [82.52514546441247]
本稿では,ジェネレーティブ・アドバイサル・ネットワークに基づくマルチソース・ドメイン適応(MSDA)の最初のアプローチを提案する。
本手法は,画像の出現がドメイン,スタイル,内容の3つの要因に依存するという観察に着想を得たものである。
提案手法はMSDAベンチマークを用いて試行し,最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:07:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。