論文の概要: A Two-Stage Dual-Path Framework for Text Tampering Detection and
Recognition
- arxiv url: http://arxiv.org/abs/2402.13545v1
- Date: Wed, 21 Feb 2024 05:54:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 16:58:22.647785
- Title: A Two-Stage Dual-Path Framework for Text Tampering Detection and
Recognition
- Title(参考訳): テキスト改ざん検出と認識のための2段階デュアルパスフレームワーク
- Authors: Guandong Li, Xian Yang, Wenpin Ma
- Abstract要約: 深層学習の出現前は,文書改ざん検出は困難であった。
深層学習に基づくテキスト改ざん検出の分野でいくつかの探究を行った。
我々のPsタンパー検出法は,機能アシスト,監査点位置決め,タンパー認識の3段階を含む。
- 参考スコア(独自算出の注目度): 12.639006068141528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document tamper detection has always been an important aspect of tamper
detection. Before the advent of deep learning, document tamper detection was
difficult. We have made some explorations in the field of text tamper detection
based on deep learning. Our Ps tamper detection method includes three steps:
feature assistance, audit point positioning, and tamper recognition. It
involves hierarchical filtering and graded output (tampered/suspected
tampered/untampered). By combining artificial tamper data features, we simulate
and augment data samples in various scenarios (cropping with noise
addition/replacement, single character/space replacement, smearing/splicing,
brightness/contrast adjustment, etc.). The auxiliary features include
exif/binary stream keyword retrieval/noise, which are used for branch detection
based on the results. Audit point positioning uses detection frameworks and
controls thresholds for high and low density detection. Tamper recognition
employs a dual-path dual-stream recognition network, with RGB and ELA stream
feature extraction. After dimensionality reduction through self-correlation
percentile pooling, the fused output is processed through vlad, yielding an
accuracy of 0.804, recall of 0.659, and precision of 0.913.
- Abstract(参考訳): 文書改ざん検出は、常に改ざん検出の重要な側面である。
深層学習の出現前は,文書改ざん検出は困難であった。
深層学習に基づくテキスト改ざん検出の分野でいくつかの探究を行った。
我々のPsタンパー検出法は,機能アシスト,監査点位置決め,タンパー認識の3段階を含む。
階層的なフィルタリングとグレード付き出力(改ざん/改ざん/改ざん/未改ざん)を含む。
人工タンパーデータの特徴を組み合わせることで、様々なシナリオ(ノイズの追加/置換、単一文字/空間置換、スメアリング/スプライシング、輝度/コントラスト調整など)におけるデータサンプルのシミュレーションと拡張を行う。
補助機能はexif/binary streamキーワード検索/ノイズで、結果に基づいて分岐検出に使用される。
監査ポイントポジショニングは、高濃度および低密度検出のためのしきい値検出フレームワークと制御を使用する。
タンパー認識は、rgbとelaストリーム特徴抽出を備えたデュアルパスデュアルストリーム認識ネットワークを採用している。
自己相関パーセンタイルプーリングによる次元減少後、融合出力はvladを介して処理され、精度0.804、リコール0.659、精度0.913となる。
関連論文リスト
- C2P-CLIP: Injecting Category Common Prompt in CLIP to Enhance Generalization in Deepfake Detection [98.34703790782254]
本稿では、カテゴリ共通プロンプトCLIPを紹介し、カテゴリ共通プロンプトをテキストエンコーダに統合し、カテゴリ関連概念をイメージエンコーダに注入する。
提案手法は,テスト中に追加パラメータを導入することなく,元のCLIPと比較して検出精度が12.41%向上した。
論文 参考訳(メタデータ) (2024-08-19T02:14:25Z) - Simplifying Two-Stage Detectors for On-Device Inference in Remote Sensing [0.7305342793164903]
本研究では,2段階物体検出器のモデル簡易化手法を提案する。
本手法は,DOTAv1.5データセットの2.1%以内の精度で計算コストを61.2%まで削減する。
論文 参考訳(メタデータ) (2024-04-11T00:45:10Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - TAMPAR: Visual Tampering Detection for Parcel Logistics in Postal Supply
Chains [45.62331048595689]
本研究では,1枚のRGB画像のみを撮影・比較する,ユースケースのラストマイルデリバリに注目した。
そこで本研究では,キーポイント検出を用いてパーセルの8つの角点を同定する改ざん検出パイプラインを提案する。
複数の古典的および深層学習に基づく変化検出手法による実験を行う。
論文 参考訳(メタデータ) (2023-11-06T14:19:05Z) - A Low-cost Strategic Monitoring Approach for Scalable and Interpretable
Error Detection in Deep Neural Networks [6.537257913467249]
深層コンピュータビジョンネットワークのための高能率ランタイムモニタリング手法を提案する。
ハードウェアメモリと入力障害の両方から発生するサイレントデータの破損を効率よく検出することができる。
論文 参考訳(メタデータ) (2023-10-31T10:45:55Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Deep Spectro-temporal Artifacts for Detecting Synthesized Speech [57.42110898920759]
本稿では,トラック1(低品質フェイク音声検出)とトラック2(部分フェイク音声検出)の総合評価を行う。
本稿では, 原時間信号, スペクトル特性, 深層埋没特性を用いて, 分光時相アーティファクトを検出した。
我々はそれぞれ1番線と2番線で4位と5位にランクインした。
論文 参考訳(メタデータ) (2022-10-11T08:31:30Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Single-stage intake gesture detection using CTC loss and extended prefix
beam search [8.22379888383833]
個々の摂取行動の正確な検出は、自動食事監視への重要なステップである。
本稿では,センサデータから得られた確率を直接,スパース摂取検出にデコードする単一ステージアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-07T06:04:25Z) - Sequential Drift Detection in Deep Learning Classifiers [4.022057598291766]
ニューラルネットワーク埋め込みを用いて、適切な逐次決定フレームワーク内でドリフト検出を定式化することにより、データのドリフトを検出する。
本稿では,この2つの関心事のバランスをとるアルゴリズムの能力を評価する損失関数を提案する。
論文 参考訳(メタデータ) (2020-07-31T14:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。