論文の概要: Explainable Disentangled Representation Learning for Generalizable Authorship Attribution in the Era of Generative AI
- arxiv url: http://arxiv.org/abs/2604.21300v1
- Date: Thu, 23 Apr 2026 05:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.319611
- Title: Explainable Disentangled Representation Learning for Generalizable Authorship Attribution in the Era of Generative AI
- Title(参考訳): ジェネレーティブAI時代における一般化可能な著者帰属のための説明可能なディスタングル表現学習
- Authors: Hieu Man, Van-Cuong Pham, Nghia Trung Ngo, Franck Dernoncourt, Thien Huu Nguyen,
- Abstract要約: EAVAE(Explainable Authorship Variational Autoencoder)は、コンテンツからスタイルを明示的に切り離す新しいフレームワークである。
ディスタングルメントは、新規な差別者を通じて実施される。
EAVAEは、AI生成テキスト検出のためのM4データセットよりも、数ショットの学習に優れています。
- 参考スコア(独自算出の注目度): 70.05655131235999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning robust representations of authorial style is crucial for authorship attribution and AI-generated text detection. However, existing methods often struggle with content-style entanglement, where models learn spurious correlations between authors' writing styles and topics, leading to poor generalization across domains. To address this challenge, we propose Explainable Authorship Variational Autoencoder (EAVAE), a novel framework that explicitly disentangles style from content through architectural separation-by-design. EAVAE first pretrains style encoders using supervised contrastive learning on diverse authorship data, then finetunes with a Variational Autoencoder (VEA) architecture using separate encoders for style and content representations. Disentanglement is enforced through a novel discriminator that not only distinguishes whether pairs of style/content representations belong to the same or different authors/content sources, but also generates natural language explanation for their decision, simultaneously mitigating confounding information and enhancing interpretability. Extensive experiments demonstrate the effectiveness of EAVAE. On authorship attribution, we achieve state-of-the-art performance on various datasets, including Amazon Reviews, PAN21, and HRS. For AI-generated text detection, EAVAE excels in few-shot learning over the M4 dataset. Code and data repositories are available online\footnote{https://github.com/hieum98/avae} \footnote{https://huggingface.co/collections/Hieuman/document-level-authorship-datasets}.
- Abstract(参考訳): 権威スタイルの堅牢な表現を学習することは、著者の帰属とAIによるテキスト検出に不可欠である。
しかし、既存の手法は、しばしばコンテンツスタイルの絡み合いに苦慮し、モデルが著者の書き方とトピックの間に急激な相関関係を学習し、ドメイン間の一般化が不十分になる。
この課題に対処するために、アーキテクチャ・バイ・デザインを通じてコンテンツからスタイルを明示的に切り離す新しいフレームワークであるEAVAE(Explainable Authorship Variational Autoencoder)を提案する。
EAVAEは、様々な著者データに対する教師付きコントラスト学習を用いて、まずスタイルエンコーダを事前訓練し、次にスタイルとコンテンツ表現のために別々のエンコーダを使用する変分オートエンコーダ(VEA)アーキテクチャを用いて微調整を行う。
スタイル/コンテンツ表現のペアが同一または異なる著者/コンテンツソースに属しているかどうかを識別するだけでなく、それらの決定に対する自然言語説明を生成し、相反する情報を同時に緩和し、解釈可能性を高める、斬新な識別器を通じて、ディスタングルを強制する。
大規模な実験は、AEAEの有効性を実証している。
著者の属性に基づいて、Amazon Reviews、PAN21、HRSなど、さまざまなデータセットで最先端のパフォーマンスを実現しています。
AI生成したテキスト検出では、EAVAEはM4データセットよりも数ショットの学習が優れている。
コードとデータリポジトリはオンラインで利用可能である。
関連論文リスト
- StyleDecipher: Robust and Explainable Detection of LLM-Generated Texts with Stylistic Analysis [18.44456241158174]
StyleDecipherは堅牢で説明可能な検出フレームワークである。
組み合わせた特徴抽出器を用いてテキスト検出を再検討し、構造的差異を定量化する。
常に最先端のドメイン内精度を達成する。
論文 参考訳(メタデータ) (2025-10-14T15:07:27Z) - Fine-Grained Detection of AI-Generated Text Using Sentence-Level Segmentation [3.088244520495001]
人間とAI生成テキスト間の遷移を検出するための文レベルのシーケンスラベリングモデルの提案
我々のモデルは、ニューラルネットワーク(NN)と条件ランダムフィールド(CRF)を組み込んだ最先端の事前学習トランスフォーマーモデルを組み合わせる。
評価は、協力的な人間とAI生成されたテキストを含む2つの公開ベンチマークデータセットで実行される。
論文 参考訳(メタデータ) (2025-09-22T14:22:55Z) - Discourse Features Enhance Detection of Document-Level Machine-Generated Content [53.41994768824785]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
既存のMGC検出器は、しばしば表面レベルの情報のみに焦点を当て、暗黙的かつ構造的な特徴を見渡す。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
論文 参考訳(メタデータ) (2024-12-17T08:47:41Z) - Isolating authorship from content with semantic embeddings and contrastive learning [49.15148871877941]
作者は内部にスタイルとコンテンツが絡み合っている。
本稿では,意味的類似性モデルを用いて合成的に生成した強みを付加したコントラスト学習手法を提案する。
この切り離し技術は、コンテンツ埋め込み空間をスタイル埋め込み空間から遠ざけることを目的としており、スタイル埋め込みをより情報伝達する。
論文 参考訳(メタデータ) (2024-11-27T16:08:46Z) - Capturing Style in Author and Document Representation [4.323709559692927]
著者と文書の埋め込みをスタイリスティックな制約で学習する新しいアーキテクチャを提案する。
本稿では,Gutenbergプロジェクトから抽出した文芸コーパス,Blog Authorship,IMDb62の3つのデータセットについて評価を行った。
論文 参考訳(メタデータ) (2024-07-18T10:01:09Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。