論文の概要: Constrained Semantic Decompression in LLMs through Persian Proverb-Conditioned Story Generation
- arxiv url: http://arxiv.org/abs/2606.12599v1
- Date: Wed, 10 Jun 2026 18:54:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.414176
- Title: Constrained Semantic Decompression in LLMs through Persian Proverb-Conditioned Story Generation
- Title(参考訳): ペルシャ・プロバーブ・コンディション・ストーリージェネレーションによるLLMの拘束的セマンティック・デコンプレッション
- Authors: Zahra Habibzadeh, Paria Khoshtab, Amir Mesbah, Yadollah Yaghoobzadeh,
- Abstract要約: Proverb Aligned Narrative dataset (PAND)を導入する。
現状の言語モデルでは, 根底にある道徳的・因果的構造を忠実にインスタンス化できない。
提案課題は自然に他の圧縮文化知識にも及んでいる。
- 参考スコア(独自算出の注目度): 5.105644262054024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transforming a dense, abstract proverb into an engaging and morally faithful narrative requires deep cultural understanding and robust semantic grounding. We frame this problem as a \emph{constrained semantic decompression} task and study proverb-conditioned story generation as a testbed for abstraction-to-realization in large language models (LLMs). Focusing on Persian, we introduce the Proverb Aligned Narrative Dataset (PAND), pairing proverbs with human-written stories and explicit meanings. By a hybrid evaluation framework that combines human-calibrated LLM-as-a-Judge with structural metrics, we analyze model behavior across multiple prompting regimes. Our findings reveal a persistent \emph{decompression gap}: current LLMs often achieve strong surface-level fluency while failing to faithfully instantiate the underlying moral and causal structure encoded in proverbs. We further show that explicit reasoning and iterative refinement can partially mitigate these failures, suggesting that many decompression errors arise from difficulties in translating abstract meaning into narrative form rather than a complete lack of relevant knowledge. Our proposed task naturally extends to other forms of compressed cultural knowledge.
- Abstract(参考訳): 密集した抽象的な証明を熱心で道徳的に忠実な物語に変換するには、深い文化的理解と堅固な意味的根拠が必要である。
本稿では,この問題を,大言語モデル(LLM)における抽象現実化のためのテストベッドとして,emph{constrained semantic decompression}タスクとして検討する。
ペルシャ語に焦点をあてたPAND(Proverb Aligned Narrative Dataset)を導入する。
ヒューマンキャリブレーションされたLLM-as-a-Judgeと構造指標を組み合わせたハイブリッド評価フレームワークにより、複数のプロンプトレジームにわたるモデル挙動を解析する。
現状のLSMは, 根本的道徳的・因果的構造を忠実に解明するのに失敗しながら, 強表面フラレンシをしばしば達成している。
さらに、明示的な推論と反復的洗練がこれらの失敗を部分的に軽減できることを示し、多くの圧縮誤りは、関連する知識の完全な欠如よりも、抽象的な意味を物語形式に翻訳することの難しさから生じることを示唆している。
提案課題は自然に他の圧縮文化知識にも及んでいる。
関連論文リスト
- The Pragmatic Persona: Discovering LLM Persona through Bridging Inference [6.671933768892354]
大型言語モデル (LLM) は対話を通して固有で独特なペルソナを明らかにする。
本稿では,ブリッジング推論による対話を解釈する新しいフレームワークを提案する。
我々のアプローチは、LLMがターン間で意味を整理する方法を規定する潜在意味リンクをキャプチャする。
論文 参考訳(メタデータ) (2026-04-27T06:01:47Z) - Robust Grounding with MLLMs Against Occlusion and Small Objects via Language-Guided Semantic Cues [58.21371989991432]
群衆化されたシーンには視覚的な課題が伴い、オブジェクトの意味論が損なわれ、グラウンドのパフォーマンスが低下する。
言語誘導セマンティックキュー(LGSC)を利用して,そのような制約を克服する新しい手法を提案する。
論文 参考訳(メタデータ) (2026-04-27T04:42:03Z) - Diagnosing CFG Interpretation in LLMs [17.612748633265202]
新しい文脈自由文法が与えられたら、LLMは構文的に妥当で、行動的に機能し、意味的に忠実な出力を生成することができるのか?
このフレームワークは、再帰深さ、表現の複雑さ、表面スタイルの制御されたストレステストを通じて、構文、振る舞い、セマンティクスを歪曲する。
論文 参考訳(メタデータ) (2026-04-22T17:43:05Z) - MORABLES: A Benchmark for Assessing Abstract Moral Reasoning in LLMs with Fables [50.29407048003165]
MORABLESは,歴史文献から引用されたファブレットと短編から構築された人間検証ベンチマークである。
主なタスクは、道徳的推論をターゲットとした複数選択の質問として構成されており、モデルが浅く抽出された質問応答を超えるよう挑戦する注意深い注意を払っている。
以上の結果から,より大きなモデルはより小さなモデルよりも優れているが,敵の操作に敏感であり,真の道徳的推論よりも表面的パターンに頼っていることが示唆された。
論文 参考訳(メタデータ) (2025-09-15T19:06:10Z) - Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth [21.092167028989632]
ドライブロロジーは「深みのあるナンセンス」によって特徴づけられる言語現象である
我々は、英語、マンダリン、スペイン語、フランス語、日本語、韓国語で、1200以上の精巧にキュレートされ、多様なサンプルのベンチマークデータセットを構築した。
現在の大規模言語モデル (LLM) は,ドライブロジカルテキストの階層的意味論の理解に一貫して失敗している。
論文 参考訳(メタデータ) (2025-09-04T03:58:55Z) - Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical Semantics [50.982315553104975]
本稿では,Llama2という人気言語モデルに対する語彙意味論のボトムアップ進化について検討する。
実験の結果,下位層の表現は語彙的意味論を符号化しているが,上位層はより弱い意味帰納的帰納的帰納的帰納的帰納的帰納的帰納的帰属的帰属的帰属的帰属的存在であることがわかった。
これは、高層層がより良い語彙意味論を得るマスク言語モデリングのような差別的な目的を持つモデルとは対照的である。
論文 参考訳(メタデータ) (2024-03-03T13:14:47Z) - Improving Factual Consistency of News Summarization by Contrastive Preference Optimization [65.11227166319546]
大規模言語モデル(LLM)は、本来の記事と現実的に矛盾する要約を生成する。
これらの幻覚は、従来の方法による検出が困難である。
本稿では,LLMの適合性を解消し,忠実で偽のコンテンツを生成するコントラスト優先最適化(CPO)を提案する。
論文 参考訳(メタデータ) (2023-10-30T08:40:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。