Fugu-MT 論文翻訳(概要): A Principled Design of Image Representation: Towards Forensic Tasks

論文の概要: A Principled Design of Image Representation: Towards Forensic Tasks

arxiv url: http://arxiv.org/abs/2203.00913v1
Date: Wed, 2 Mar 2022 07:46:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-03 15:29:09.864109
Title: A Principled Design of Image Representation: Towards Forensic Tasks
Title（参考訳）: 画像表現の原理設計--法医学的課題に向けて
Authors: Shuren Qi, Yushu Zhang, Chao Wang, Jiantao Zhou, Xiaochun Cao
Abstract要約: 本稿では, 理論, 実装, 応用の観点から, 法科学指向の画像表現を別の問題として検討する。理論レベルでは、Dense Invariant Representation (DIR)と呼ばれる、数学的保証を伴う安定した記述を特徴とする、新しい法医学の表現フレームワークを提案する。本稿では, ドメインパターンの検出とマッチング実験について, 最先端の記述子との比較結果を提供する。
参考スコア（独自算出の注目度）: 75.40968680537544
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image forensics is a rising topic as the trustworthy multimedia content is critical for modern society. Like other vision-related applications, forensic analysis relies heavily on the proper image representation. Despite the importance, current theoretical understanding for such representation remains limited, with varying degrees of neglect for its key role. For this gap, we attempt to investigate the forensic-oriented image representation as a distinct problem, from the perspectives of theory, implementation, and application. Our work starts from the abstraction of basic principles that the representation for forensics should satisfy, especially revealing the criticality of robustness, interpretability, and coverage. At the theoretical level, we propose a new representation framework for forensics, called Dense Invariant Representation (DIR), which is characterized by stable description with mathematical guarantees. At the implementation level, the discrete calculation problems of DIR are discussed, and the corresponding accurate and fast solutions are designed with generic nature and constant complexity. We demonstrate the above arguments on the dense-domain pattern detection and matching experiments, providing comparison results with state-of-the-art descriptors. Also, at the application level, the proposed DIR is initially explored in passive and active forensics, namely copy-move forgery detection and perceptual hashing, exhibiting the benefits in fulfilling the requirements of such forensic tasks.
Abstract（参考訳）: image forensicsは、信頼性の高いマルチメディアコンテンツが現代社会にとって重要なため、急速に話題になっている。他の視覚関連アプリケーションと同様に、法医学解析は適切な画像表現に大きく依存する。その重要性にもかかわらず、そのような表現に対する現在の理論的理解は限定的であり、その重要な役割を無視する程度は様々である。このギャップを解消するために,理論,実装,応用の観点から,法科学指向の画像表現を別の問題として検討する。私たちの研究は、法医学の表現が満足すべき基本原則の抽象化から始まり、特に堅牢性、解釈可能性、カバレッジの臨界性を明らかにします。理論レベルでは、Dense Invariant Representation (DIR)と呼ばれる、数学的保証を伴う安定した記述を特徴とする、新しい法医学の表現フレームワークを提案する。実装レベルでは、DIRの離散計算問題を議論し、対応する正確かつ高速な解は一般的な性質と一定の複雑さで設計する。本稿では, ドメインパターンの検出とマッチング実験について, 最先端の記述子との比較結果を提供する。また、アプリケーションレベルでは、提案するdirは、まず受動的かつアクティブな鑑識、すなわちコピー・モーブの偽造検出と知覚的ハッシュ化で探求され、そのような鑑識タスクの要件を満たすための利点を示す。

関連論文リスト

Task-Driven Discrete Representation Learning [1.604511025616605]
本稿では,下流タスクに関連する個別機能の有用性を探求する統合フレームワークを提案する。我々は、表現能力とサンプルの複雑さの間のトレードオフを理論的に分析する。
論文参考訳（メタデータ） (2025-06-13T07:12:49Z)
FakeScope: Large Multimodal Expert Model for Transparent AI-Generated Image Forensics [66.14786900470158]
本稿では,AIによる画像鑑定に適した専門家マルチモーダルモデル(LMM)であるFakeScopeを提案する。 FakeScopeはAI合成画像を高精度に識別し、リッチで解釈可能なクエリ駆動の法医学的な洞察を提供する。 FakeScopeは、クローズドエンドとオープンエンドの両方の法医学的シナリオで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-03-31T16:12:48Z)
SUMI-IFL: An Information-Theoretic Framework for Image Forgery Localization with Sufficiency and Minimality Constraints [66.85363924364628]
イメージフォージェリーローカライゼーション (IFL) は, 改ざん画像誤用を防止し, 社会安全を守るための重要な技術である。本稿では,情報理論IFL フレームワーク SUMI-IFL について紹介する。
論文参考訳（メタデータ） (2024-12-13T09:08:02Z)
Hierarchical Invariance for Robust and Interpretable Vision Tasks at Larger Scales [54.78115855552886]
本稿では、畳み込みニューラルネットワーク(CNN)のような階層型アーキテクチャを用いて、オーバーコンプリート不変量を構築する方法を示す。オーバーコンプリート性により、そのタスクはニューラルアーキテクチャサーチ(NAS)のような方法で適応的に形成される。大規模で頑健で解釈可能な視覚タスクの場合、階層的不変表現は伝統的なCNNや不変量に対する効果的な代替物とみなすことができる。
論文参考訳（メタデータ） (2024-02-23T16:50:07Z)
Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文参考訳（メタデータ） (2023-05-12T00:13:17Z)
Synergies between Disentanglement and Sparsity: Generalization and Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文参考訳（メタデータ） (2022-11-26T21:02:09Z)
Shrinking the Semantic Gap: Spatial Pooling of Local Moment Invariants for Copy-Move Forgery Detection [7.460203098159187]
Copy-move forgeryは、特定のパッチをコピー&ペーストして画像に貼り付ける操作で、潜在的に違法または非倫理的使用がある。コピー・ムーブ・フォージェリーの法医学的手法の進歩は,検出精度とロバスト性の向上に寄与している。自己相似性が高い画像や強い信号の破損のある画像の場合、既存のアルゴリズムはしばしば非効率なプロセスと信頼性の低い結果を示す。
論文参考訳（メタデータ） (2022-07-19T09:11:43Z)
An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文参考訳（メタデータ） (2022-05-16T11:23:42Z)
A Survey of Orthogonal Moments for Image Representation: Theory, Implementation, and Evaluation [70.0671278823937]
モーメントに基づく画像表現は、セマンティック記述のコア条件を満たすのに有効であると報告されている。本稿では,画像表現における直交モーメントの包括的調査を行い,高速/精度計算,ロバスト性/不変性最適化,定義拡張の最近の進歩について述べる。提案した理論分析,ソフトウェア実装,評価結果は,特に新しい技術開発や実世界の応用の促進において,コミュニティを支援することができる。
論文参考訳（メタデータ） (2021-03-27T03:41:08Z)
Discriminative Residual Analysis for Image Set Classification with Posture and Age Variations [27.751472312581228]
識別残差分析(DRA)は分類性能を向上させるために提案される。 DRAは、残差表現を識別部分空間にキャストする強力な射影を得ようとする。 2つの正則化アプローチは、可能な小さなサンプルサイズ問題に対処するために使用される。
論文参考訳（メタデータ） (2020-08-23T08:53:06Z)
Anatomy of Catastrophic Forgetting: Hidden Representations and Task Semantics [24.57617154267565]
ニューラルネットワークモデルにおいて,忘れることが表現に与える影響について検討する。深い層が忘れる原因であることに気付きました。また,CIFAR-100をベースとした,現実的な入力分布シフトを近似するタスクも導入する。
論文参考訳（メタデータ） (2020-07-14T23:31:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。