論文の概要: DBDH: A Dual-Branch Dual-Head Neural Network for Invisible Embedded Regions Localization
- arxiv url: http://arxiv.org/abs/2405.03436v1
- Date: Mon, 6 May 2024 12:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 13:46:36.235942
- Title: DBDH: A Dual-Branch Dual-Head Neural Network for Invisible Embedded Regions Localization
- Title(参考訳): DBDH: 可視な埋め込み領域の局所化のためのデュアルブランチデュアルヘッドニューラルネットワーク
- Authors: Chengxin Zhao, Hefei Ling, Sijing Xie, Nan Sun, Zongyi Li, Yuxuan Shi, Jiazhong Chen,
- Abstract要約: 本稿では, 目に見えない組込み領域の正確な位置決めに適したデュアルブランチデュアルヘッド(DBDH)ニューラルネットワークを提案する。
最先端の2つのオフライン・オフライン・メッセージング手法に基づいて、ローカライゼーションモデルのトレーニングとテストのための2つのデータセットと拡張戦略を構築した。
- 参考スコア(独自算出の注目度): 13.180569903159645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embedding invisible hyperlinks or hidden codes in images to replace QR codes has become a hot topic recently. This technology requires first localizing the embedded region in the captured photos before decoding. Existing methods that train models to find the invisible embedded region struggle to obtain accurate localization results, leading to degraded decoding accuracy. This limitation is primarily because the CNN network is sensitive to low-frequency signals, while the embedded signal is typically in the high-frequency form. Based on this, this paper proposes a Dual-Branch Dual-Head (DBDH) neural network tailored for the precise localization of invisible embedded regions. Specifically, DBDH uses a low-level texture branch containing 62 high-pass filters to capture the high-frequency signals induced by embedding. A high-level context branch is used to extract discriminative features between the embedded and normal regions. DBDH employs a detection head to directly detect the four vertices of the embedding region. In addition, we introduce an extra segmentation head to segment the mask of the embedding region during training. The segmentation head provides pixel-level supervision for model learning, facilitating better learning of the embedded signals. Based on two state-of-the-art invisible offline-to-online messaging methods, we construct two datasets and augmentation strategies for training and testing localization models. Extensive experiments demonstrate the superior performance of the proposed DBDH over existing methods.
- Abstract(参考訳): QRコードを置き換えるために、見えないハイパーリンクや隠れたコードをイメージに埋め込むことが、最近ホットな話題になっている。
この技術は、デコードする前にキャプチャされた写真の埋め込み領域を最初にローカライズする必要がある。
目に見えない埋め込み領域を見つけるためにモデルを訓練する既存の方法は、正確なローカライゼーション結果を得るのに苦労し、デコード精度が低下する。
この制限は主に、CNNネットワークが低周波信号に敏感であるのに対して、組込み信号は通常高周波信号であるからである。
そこで本研究では, 目に見えない埋め込み領域の正確な位置推定に適したデュアルブランチデュアルヘッド(DBDH)ニューラルネットワークを提案する。
特に、DBDHは62個のハイパスフィルタを含む低レベルのテクスチャブランチを使用して、埋め込みによって誘導される高周波信号をキャプチャする。
高レベルのコンテキストブランチを使用して、埋め込み領域と正規領域の間の識別的特徴を抽出する。
DBDHは検出ヘッドを使用して、埋め込み領域の4つの頂点を直接検出する。
さらに,トレーニング中に埋め込み領域のマスクをセグメンテーションするためのセグメンテーションヘッドを導入する。
セグメンテーションヘッドは、モデル学習のためのピクセルレベルの監視を提供し、組込み信号のより良い学習を容易にする。
最先端の2つのオフライン・オフライン・メッセージング手法に基づいて、ローカライゼーションモデルのトレーニングとテストのための2つのデータセットと拡張戦略を構築した。
実験により,既存の手法よりもDBDHの方が優れた性能を示した。
関連論文リスト
- DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and
Localization [30.317619885984005]
本稿では,視覚的セグメンテーション基盤モデル,すなわちセグメンテーションモデル(SAM)をフォージェリ検出とローカライゼーションの対面に導入する。
SAMに基づいて,Multiscale Adapterを用いたDADFフレームワークを提案する。
提案するフレームワークは、エンドツーエンドのフォージェリーローカライゼーションと検出最適化をシームレスに統合する。
論文 参考訳(メタデータ) (2023-06-29T16:25:04Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。