論文の概要: Temporal Flattening in LLM-Generated Text: Comparing Human and LLM Writing Trajectories
- arxiv url: http://arxiv.org/abs/2604.12097v1
- Date: Mon, 13 Apr 2026 22:13:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.140121
- Title: Temporal Flattening in LLM-Generated Text: Comparing Human and LLM Writing Trajectories
- Title(参考訳): LLMテキストにおける時間的フラッテニング:人間とLLMの筆跡の比較
- Authors: Zhanwei Cao, YeoJin Go, Yifan Hu, Shanu Sushmita,
- Abstract要約: 2012年から2024年にかけての412人の著者と6,086件の文書からなる時系列データセットの構築と公開を行った。
意味的・語彙的・認知的感情的表現に対するドリフトと分散に基づく指標を用いて,LLM生成テキストに時間的平坦化が認められる。
このギャップは、合成トレーニングデータや長手テキストモデリングのような、真正の時間構造を必要とするアプリケーションに直接的な意味を持つ。
- 参考スコア(独自算出の注目度): 7.8363070295415165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly used in daily applications, from content generation to code writing, where each interaction treats the model as stateless, generating responses independently without memory. Yet human writing is inherently longitudinal: authors' styles and cognitive states evolve across months and years. This raises a central question: can LLMs reproduce such temporal structure across extended time periods? We construct and publicly release a longitudinal dataset of 412 human authors and 6,086 documents spanning 2012--2024 across three domains (academic abstracts, blogs, news) and compare them to trajectories generated by three representative LLMs under standard and history-conditioned generation settings. Using drift and variance-based metrics over semantic, lexical, and cognitive-emotional representations, we find temporal flattening in LLM-generated text. LLMs produce greater lexical diversity but exhibit substantially reduced semantic and cognitive-emotional drift relative to humans. These differences are highly predictive: temporal variability patterns alone achieve 94% accuracy and 98% ROC-AUC in distinguishing human from LLM trajectories. Our results demonstrate that temporal flattening persists regardless of whether LLMs generate independently or with access to incremental history, revealing a fundamental property of current deployment paradigms. This gap has direct implications for applications requiring authentic temporal structure, such as synthetic training data and longitudinal text modeling.
- Abstract(参考訳): 大規模言語モデル(LLM)は、コンテンツ生成からコード記述まで、日々のアプリケーションでますます使われており、各インタラクションはモデルをステートレスとして扱い、メモリなしで独立して応答を生成する。
著者のスタイルや認知状態は、何ヶ月、何年にもわたって進化している。
LLMは長期にわたってこのような時間構造を再現できるのか?
2012年から2024年までの412人の著者と6,086件の文書を3つのドメイン(学術的要約,ブログ,ニュース)に分散した時系列データセットを構築し,それらを標準および履歴条件の世代設定の下で3つの代表LSMによって生成された軌跡と比較した。
意味的・語彙的・認知的感情的表現に対するドリフトと分散に基づく指標を用いて,LLM生成テキストに時間的平坦化が認められる。
LLMはより長い語彙の多様性をもたらすが、人間に対する意味的および認知的感情的ドリフトは著しく減少する。
これらの違いは、時間的変動パターンだけで94%の精度と98%のROC-AUCが人間とLLMの軌跡を区別する。
以上の結果から,LCMが独立に生成するか,あるいは漸進的履歴にアクセス可能であるかに関わらず,時間的平坦化が持続していることが示唆された。
このギャップは、合成トレーニングデータや長手テキストモデリングのような、真正の時間構造を必要とするアプリケーションに直接的な意味を持つ。
関連論文リスト
- Temporal Referential Consistency: Do LLMs Favor Sequences Over Absolute Time References? [21.90468150326666]
LLM(Large Language Model)は、知識ソースの代替品である。
LLMは現実的に正確でなければならないし、時間次元にわたって一貫性を示す必要がある。
この重要な要件にもかかわらず、LLMの時間的整合性を確保する努力は依然として不十分である。
論文 参考訳(メタデータ) (2025-10-17T10:33:48Z) - How Do LLM-Generated Texts Impact Term-Based Retrieval Models? [76.92519309816008]
本稿では,大規模言語モデル(LLM)が項ベース検索モデルに与える影響について検討する。
言語学的解析により,LLM生成テキストはよりスムーズで低周波なZipf勾配を示すことが明らかとなった。
本研究は,項分布がクエリと密接に一致した文書を優先して,項ベース検索モデルがソースバイアスを示すかどうかを考察する。
論文 参考訳(メタデータ) (2025-08-25T06:43:27Z) - Domain Regeneration: How well do LLMs match syntactic properties of text domains? [19.04920427362747]
我々は、広く使われているオープンソースのLCMに、寛容にライセンスされた英語のテキストであるウィキペディアとニューステキストの2つのドメインからテキストを再生するよう促す。
この再生パラダイムは、LLMが意味的に制御された設定で、元の人間のテキストドメインと忠実に一致できるかどうかを調査することを可能にする。
その結果, 再生分布の大部分は, 平均値, 標準偏差が低く, 長い尾部が減少していることがわかった。
論文 参考訳(メタデータ) (2025-05-12T17:37:17Z) - TransientTables: Evaluating LLMs' Reasoning on Temporally Evolving Semi-structured Tables [47.85408648193376]
大規模言語モデル(LLM)は通常、静的データセットでトレーニングされ、効果的な時間的推論を行う能力を制限する。
本稿では,14,000以上のテーブルから3,971の質問を抽出し,複数の期間にわたって1,238のエンティティを対象とするTransIENTTABLESデータセットを提案する。
論文 参考訳(メタデータ) (2025-04-02T16:34:43Z) - If an LLM Were a Character, Would It Know Its Own Story? Evaluating Lifelong Learning in LLMs [55.8331366739144]
大規模言語モデル(LLM)における生涯学習評価のためのベンチマークであるLIFESTATE-BENCHを紹介する。
我々の事実チェック評価は、パラメトリックと非パラメトリックの両方のアプローチで、モデルの自己認識、エピソードメモリ検索、関係追跡を探索する。
論文 参考訳(メタデータ) (2025-03-30T16:50:57Z) - LLM-PS: Empowering Large Language Models for Time Series Forecasting with Temporal Patterns and Semantics [56.99021951927683]
Time Series Forecasting (TSF) は、金融計画や健康モニタリングなど、多くの現実世界のドメインにおいて重要である。
既存のLarge Language Models (LLM) は通常、時系列データ固有の特性を無視するため、非最適に実行する。
時系列データから基本的なtextitPatterns と有意義な textitSemantics を学習し,TLF のための LLM-PS を提案する。
論文 参考訳(メタデータ) (2025-03-12T11:45:11Z) - Temporal Alignment of LLMs through Cycle Encoding for Long-Range Time Representations [57.01193643163492]
大規模言語モデル(LLM)は、特に長期にわたって時間的ミスアライメントの問題に悩まされる。
本稿では,LLMの長期的不整合に対処する手法として,Ticktack(ティックタック)を提案する。
論文 参考訳(メタデータ) (2025-03-06T06:59:09Z) - AutoTimes: Autoregressive Time Series Forecasters via Large Language Models [67.83502953961505]
AutoTimesは時系列を言語トークンの埋め込み空間に投影し、任意の長さで将来予測を生成する。
時系列をプロンプトとして定式化し、ルックバックウィンドウを越えて予測のコンテキストを拡張する。
AutoTimesは、トレーニング可能なパラメータが0.1%、トレーニング/推論のスピードアップが5ドル以上で最先端を実現している。
論文 参考訳(メタデータ) (2024-02-04T06:59:21Z) - Under the Surface: Tracking the Artifactuality of LLM-Generated Data [21.002983022237604]
この研究は、人工データの生成において、大きな言語モデル(LLM)の役割を拡大するものである。
我々の知る限りでは、多種多様な LLM 生成テキストデータを収集する最初の研究である。
人工データの人間のパフォーマンスにマッチする能力にもかかわらず、本論文は重大な隠蔽格差を明らかにした。
論文 参考訳(メタデータ) (2024-01-26T07:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。