論文の概要: Decoding AI Authorship: Can LLMs Truly Mimic Human Style Across Literature and Politics?
- arxiv url: http://arxiv.org/abs/2603.23219v1
- Date: Tue, 24 Mar 2026 13:58:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.51226
- Title: Decoding AI Authorship: Can LLMs Truly Mimic Human Style Across Literature and Politics?
- Title(参考訳): AIオーサリングをデコードする - LLMは文学と政治にまたがって、真にミミックな人間スタイルを実現できるか?
- Authors: Nasser A Alsadhan,
- Abstract要約: 本研究では,現在最先端の大規模言語モデル(LLM)が,著名な文学的・政治的人物の著作的署名をエミュレートする能力について検討する。
我々は、変換器に基づく分類(BERT)と解釈可能な機械学習(XGBoost)を組み合わせた補完的枠組みを用いて評価した合成コーパスを作成した。
提案手法は,AI生成テキストと人間認証テキストの相違を評価するために,言語問合せ,単語数マーカー,難易度,可読性指標を統合した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Amidst the rising capabilities of generative AI to mimic specific human styles, this study investigates the ability of state-of-the-art large language models (LLMs), including GPT-4o, Gemini 1.5 Pro, and Claude Sonnet 3.5, to emulate the authorial signatures of prominent literary and political figures: Walt Whitman, William Wordsworth, Donald Trump, and Barack Obama. Utilizing a zero-shot prompting framework with strict thematic alignment, we generated synthetic corpora evaluated through a complementary framework combining transformer-based classification (BERT) and interpretable machine learning (XGBoost). Our methodology integrates Linguistic Inquiry and Word Count (LIWC) markers, perplexity, and readability indices to assess the divergence between AI-generated and human-authored text. Results demonstrate that AI-generated mimicry remains highly detectable, with XGBoost models trained on a restricted set of eight stylometric features achieving accuracy comparable to high-dimensional neural classifiers. Feature importance analyses identify perplexity as the primary discriminative metric, revealing a significant divergence in the stochastic regularity of AI outputs compared to the higher variability of human writing. While LLMs exhibit distributional convergence with human authors on low-dimensional heuristic features, such as syntactic complexity and readability, they do not yet fully replicate the nuanced affective density and stylistic variance inherent in the human-authored corpus. By isolating the specific statistical gaps in current generative mimicry, this study provides a comprehensive benchmark for LLM stylistic behavior and offers critical insights for authorship attribution in the digital humanities and social media.
- Abstract(参考訳): GPT-4o、Gemini 1.5 Pro、Claude Sonnet 3.5といった最先端の大規模言語モデル(LLM)が、文学や政治の著名な人物の権威的な署名を模倣する能力について調査する。
厳密なセマンティックアライメントを備えたゼロショットプロンプトフレームワークを用いて,変換器ベース分類(BERT)と解釈可能な機械学習(XGBoost)を組み合わせた補完的フレームワークを用いて評価した合成コーパスを作成した。
提案手法では,言語問合せと単語数(LIWC)マーカー,パープレキシティ,可読性指標を統合し,AI生成テキストと人間によるテキストの相違を評価する。
その結果、XGBoostモデルは、高次元のニューラル分類器に匹敵する精度を達成し、8つのスタイル的特徴の限定セットに基づいて訓練されている。
特徴的重要度分析は,AI出力の確率的正則性において,人間の文章の多様性よりも有意なばらつきを示す主要な識別指標としてパープレキシティを同定する。
LLMは、構文的複雑性や可読性などの低次元ヒューリスティックな特徴について、ヒトの著者と分布的収束を示すが、ヒトが認可したコーパスに固有のニュアンスな感情密度とスタイル的差異を完全には再現していない。
本研究は,現生模倣における特定の統計的ギャップを分離することにより,LLMのスタイリスティックな行動に関する総合的なベンチマークを提供し,デジタル人文科学やソーシャルメディアにおける著者帰属に関する重要な知見を提供する。
関連論文リスト
- Is AI Catching Up to Human Expression? Exploring Emotion, Personality, Authorship, and Linguistic Style in English and Arabic with Six Large Language Models [0.0]
私たちはJais、Mistral、LLaMA、GPT-4o、Gemini、DeepSeekの6つのモデルで2つのタスクを実行します。
機械分類器が、人間が書いたテキストとAI生成したテキストとを確実に区別できるかどうかを評価する。
これらの結果から,AI生成したテキストは,パラフレーズ標本の分類性能は低下するものの,人間によるテキストと区別可能であることが示された(F1>0.95)。
AI生成データによるトレーニングの強化は、アラビア人格分類タスクのパフォーマンスを高め、アンダーリソース言語における課題に対処する合成データの可能性を強調している。
論文 参考訳(メタデータ) (2026-03-24T14:17:02Z) - Large Language Models and Forensic Linguistics: Navigating Opportunities and Threats in the Age of Generative AI [0.0]
大規模言語モデル(LLM)は、スケーラブルなコーパス分析と埋め込みベースのオーサシップ属性を実現する強力な分析ツールとして機能する。
近年のスタイリスティックな研究は、LLMが表面のスタイリスティックな特徴を近似できるが、ヒトのライターとの違いが検出可能であることを示唆している。
この論文は、法医学的言語学は科学的に信頼性があり法的に許容されるように、方法論的な再構成を必要とすると結論付けている。
論文 参考訳(メタデータ) (2025-12-07T17:05:31Z) - Computational Turing Test Reveals Systematic Differences Between Human and AI Language [0.0]
大規模言語モデル(LLM)は、人間の振る舞いをシミュレートするために社会科学でますます使われている。
既存の検証努力は人的判断に基づく評価に大きく依存している。
本稿では,LLMが人間の言語にどの程度近いかを評価するために,計算チューリングテストを提案する。
論文 参考訳(メタデータ) (2025-11-06T08:56:37Z) - StyleDecipher: Robust and Explainable Detection of LLM-Generated Texts with Stylistic Analysis [18.44456241158174]
StyleDecipherは堅牢で説明可能な検出フレームワークである。
組み合わせた特徴抽出器を用いてテキスト検出を再検討し、構造的差異を定量化する。
常に最先端のドメイン内精度を達成する。
論文 参考訳(メタデータ) (2025-10-14T15:07:27Z) - Human-like Content Analysis for Generative AI with Language-Grounded Sparse Encoders [46.13876748421428]
Language-Grounded Sparses (LanSE)は、画像を自然言語記述で解釈可能な視覚パターンに分解する。
93%の人的合意で5000以上の視覚パターンが検出された。
言語基底パターンを抽出する手法は自然に多くの分野に適用できる。
論文 参考訳(メタデータ) (2025-08-20T06:50:15Z) - Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.63497537202751]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文 参考訳(メタデータ) (2024-07-11T14:00:53Z) - Neural Authorship Attribution: Stylometric Analysis on Large Language
Models [16.63955074133222]
GPT-4、PaLM、Llamaのような大規模言語モデル(LLM)は、AIによるテキスト生成を著しく推進している。
誤用の可能性に対する懸念が高まっているため、AI生成テキストの鑑識の必要性が高まっている。
論文 参考訳(メタデータ) (2023-08-14T17:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。