論文の概要: Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories
- arxiv url: http://arxiv.org/abs/2605.26492v1
- Date: Tue, 26 May 2026 03:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.597338
- Title: Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories
- Title(参考訳): 灯台のエリア? LLMストーリーにおける低多様性の診断
- Authors: Sil Hamilton, David Mimno,
- Abstract要約: 生成した物語の88.3%に11の単語が現れる。
これらの言葉には、名前(イーリアス、マラ、エララ)、設定(灯台)、職業(時計師、司書)が含まれる。
- 参考スコア(独自算出の注目度): 4.961381439031832
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-generated stories are a popular use case, but they show very low variability. We sample 20,000 total stories from four current models using five prompts. We find that 11 words occur in 88.3% of generated stories, with little difference between models. These words include names (Elias, Mara, Elara), settings (lighthouses), and professions (clockmaker, librarian). These tokens do not often occur in published literature nor pre-training data, but they are found in preference data that is likely to have been used by all current models. Surprisingly, these "lighthouse" stories are infrequent when compared with the average post-training story, much of which contains references to copyrighted characters or adult content. This result demonstrates the potentially disproportionate impact of small datasets combined with powerful alignment algorithms.
- Abstract(参考訳): LLM生成ストーリは一般的なユースケースだが,その多様性は非常に低い。
5つのプロンプトを使って、現在の4つのモデルから合計2万のストーリーをサンプリングします。
生成したストーリーの88.3%で11の単語が発生するが、モデルの違いはほとんどない。
これらの言葉には、名前(イーリアス、マラ、エララ)、設定(灯台)、職業(時計師、図書館員)が含まれる。
これらのトークンは、出版されている文献や事前学習データでは頻繁に発生しないが、現在のすべてのモデルで使用されていた可能性が高い選好データの中に見出される。
驚くべきことに、これらの「灯台」の物語は、平均的なポストトレーニングストーリーと比較すると、しばしば著作権のあるキャラクターやアダルトコンテンツへの言及を含んでいる。
この結果は、強力なアライメントアルゴリズムと組み合わせた小さなデータセットが潜在的に不均等な影響を示す。
関連論文リスト
- Lost in Stories: Consistency Bugs in Long Story Generation by LLMs [21.241285394393632]
ConStory-Benchは、長めのストーリー生成における物語の一貫性を評価するために設計されたベンチマークである。
4つのタスクシナリオに2,000のプロンプトが含まれ、19のきめ細かいサブタイプを持つ5つのエラーカテゴリの分類を定義する。
また,矛盾を検出する自動パイプラインであるConStory-Checkerを開発した。
論文 参考訳(メタデータ) (2026-03-06T04:16:46Z) - Generating Visual Stories with Grounded and Coreferent Characters [63.07511918366848]
本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-09-20T14:56:33Z) - Assessing Language Models' Worldview for Fiction Generation [0.0]
本研究では,大言語モデルがフィクションの創出に不可欠な世界を維持する能力について考察する。
2つのモデルだけが一貫した世界観を示しており、残りは自己複製である。
このモデル間の統一性は、フィクションに必要な国家の欠如をさらに示唆している。
論文 参考訳(メタデータ) (2024-08-15T03:19:41Z) - Delving into LLM-assisted writing in biomedical publications through excess vocabulary [4.58733012283457]
ChatGPTのような大きな言語モデル(LLM)は、人間レベルのパフォーマンスでテキストを生成し、修正することができる。
PubMedによる2010年から2024年にかけての1500万以上のバイオメディカル・抽象化の語彙変化について検討した。
バイオメディカル研究におけるLCMは,コビッドパンデミックなどの世界大イベントの影響を超越し,科学的な執筆に前例のない影響を与えていることを示す。
論文 参考訳(メタデータ) (2024-06-11T07:16:34Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - The Next Chapter: A Study of Large Language Models in Storytelling [51.338324023617034]
大規模言語モデル(LLM)を用いたプロンプトベース学習の適用は,自然言語処理(NLP)タスクにおいて顕著な性能を示した。
本稿では,LLMのストーリー生成能力と最近のモデルを比較するために,自動評価と人的評価の両方を利用した総合的な調査を行う。
その結果、LLMは他のストーリー生成モデルと比較して、非常に高い品質のストーリーを生成することがわかった。
論文 参考訳(メタデータ) (2023-01-24T02:44:02Z) - Computational Lens on Cognition: Study Of Autobiographical Versus
Imagined Stories With Large-Scale Language Models [95.88620740809004]
GPT-3を用いた自伝的物語と想像的物語における出来事の物語の流れの相違について検討した。
想像された物語は自伝的物語よりも逐次性が高いことがわかった。
想像された物語と比較すると、自伝的な物語は、最初の人物に関連するより具体的な言葉と単語を含んでいる。
論文 参考訳(メタデータ) (2022-01-07T20:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。