論文の概要: Byte-level generative predictions for forensics multimedia carving
- arxiv url: http://arxiv.org/abs/2604.11010v1
- Date: Mon, 13 Apr 2026 05:23:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.342042
- Title: Byte-level generative predictions for forensics multimedia carving
- Title(参考訳): マルチメディア彫刻におけるバイトレベルの生成予測
- Authors: Jaewon Lee, Md Eimran Hossain Eimon, Avinash Srinivasan, Hari Kalva,
- Abstract要約: 次バイト予測用に設計されたバイトレベルの変換器であるbGPTを用いたマルチメディア彫刻における生成的手法を提案する。
部分的なBMP画像データをモデルに入力することにより、フラグメント継続の発生をシミュレートする。
本研究は, 生成モデルを用いて, 非配置ディスク空間におけるフラグメントマッチングをサポートするために, バイトレベルのパターンを効果的に予測できることを示す。
- 参考スコア(独自算出の注目度): 8.352963401868262
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Digital forensic investigations often face significant challenges when recovering fragmented multimedia files that lack file system metadata. While traditional file carving relies on signatures and discriminative deep learning models for fragment classification, these methods cannot reconstruct or predict missing data. We propose a generative approach to multimedia carving using bGPT, a byte-level transformer designed for next-byte prediction. By feeding partial BMP image data into the model, we simulate the generation of likely fragment continuations. We evaluate the fidelity of these predictions using different metrics, namely, cosine similarity, structural similarity index (SSIM), chi-square distance, and Jensen-Shannon divergence (JSD). Our findings demonstrate that generative models can effectively predict byte-level patterns to support fragment matching in unallocated disk space.
- Abstract(参考訳): デジタル法医学的な調査は、ファイルシステムのメタデータが欠けている断片化されたマルチメディアファイルを復元する際、しばしば重大な課題に直面する。
従来のファイル彫刻は、断片分類のためのシグネチャと識別的なディープラーニングモデルに依存しているが、これらの手法は欠落したデータを再構成したり、予測することはできない。
次バイト予測用に設計されたバイトレベルの変換器であるbGPTを用いたマルチメディア彫刻における生成的手法を提案する。
部分的なBMP画像データをモデルに入力することにより、フラグメント継続の発生をシミュレートする。
我々は,コサイン類似度,構造類似度指数(SSIM),チ二乗距離,Jensen-Shannon divergence(JSD)といった異なる指標を用いて,これらの予測の忠実度を評価する。
本研究は, 生成モデルを用いて, 非配置ディスク空間におけるフラグメントマッチングをサポートするために, バイトレベルのパターンを効果的に予測できることを示す。
関連論文リスト
- Commonality in Few: Few-Shot Multimodal Anomaly Detection via Hypergraph-Enhanced Memory [30.213350768611893]
CIF(Commonality In Few)に基づく新規な非教師付きマルチモーダル産業異常検出手法を提案する。
我々は、高階相関をモデル化可能なハイパーグラフを用いて、トレーニングサンプル内の構造的共通点をキャプチャし、メモリバンクを使用して、クラス内構造を前もって格納する。
MVTec 3D-ADデータセットとEyecandiesデータセットによる実験結果から,本手法は数ショット設定でSOTA(State-of-the-art)手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-11-08T10:55:46Z) - A Large-scale Interpretable Multi-modality Benchmark for Facial Image Forgery Localization [22.725542948364357]
我々は、モデル予測を説明するのに基本的なバイナリフォージェリーマスクが不十分であると主張している。
本研究では,偽画像に対する有能な領域中心の解釈を生成する。
ForgeryTalkerは,フォージェリーローカライゼーションと解釈を同時に行うように設計されたアーキテクチャである。
論文 参考訳(メタデータ) (2024-12-27T15:23:39Z) - Multi-grained Temporal Prototype Learning for Few-shot Video Object
Segmentation [156.4142424784322]
FSVOS(Few-Shot Video Object)は、いくつかのアノテーション付きサポートイメージで定義されるのと同じカテゴリで、クエリビデオ内のオブジェクトをセグメントすることを目的としている。
本稿では,ビデオデータの時間的相関性を扱うために,多粒度時間的ガイダンス情報を活用することを提案する。
提案するビデオIPMTモデルは,2つのベンチマークデータセットにおいて,従来のモデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2023-09-20T09:16:34Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - SegDiff: Image Segmentation with Diffusion Probabilistic Models [81.16986859755038]
拡散確率法は最先端の画像生成に使用される。
画像分割を行うためにそのようなモデルを拡張する方法を提案する。
この方法は、トレーニング済みのバックボーンに頼ることなく、エンドツーエンドで学習する。
論文 参考訳(メタデータ) (2021-12-01T10:17:25Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - MEG: Multi-Evidence GNN for Multimodal Semantic Forensics [28.12652559292884]
フェイクニュースは、画像、テキスト、位置などのモダリティを横断するセマンティックな操作を伴うことが多い。
近年の研究では、画像の再利用という問題に焦点が当てられている。
マルチモーダル・セマンティック・フォサイシクスのための新しいグラフニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-11-23T09:01:28Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。