論文の概要: More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts
- arxiv url: http://arxiv.org/abs/2605.22641v2
- Date: Fri, 22 May 2026 07:17:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 14:44:53.785845
- Title: More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts
- Title(参考訳): 文脈, モデル, 道徳的知識について : 政治テキストにおけるシュワルツ値検出の体系的研究
- Authors: Víctor Yeste, Paolo Rosso,
- Abstract要約: 文脈と明示的な道徳的知識が文レベルの価値の検出に役立っているかを検討する。
フルドキュメントのコンテキストは、文のみの入力で3.8-4.8マクロF1ポイントで教師付きDeBERTaエンコーダを改善する。
回収された道徳的知識は、マッチングされた比較においてより一貫して有用である。
- 参考スコア(独自算出の注目度): 3.0339361014383397
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting Schwartz values in political text is difficult because implicit cues often depend on surrounding arguments and fine-grained distinctions between neighboring values. We study when context and explicit moral knowledge help sentence-level value detection. Using the ValuesML/Touché ValueEval format, we compare sentence, window, and full-document inputs; no-RAG and retrieval-augmented settings with a curated moral knowledge base; supervised DeBERTa-v3-base/large encoders; and zero-shot LLMs from 12B to 123B parameters. The results show that more context is not uniformly better: full-document context improves supervised DeBERTa encoders by 3.8-4.8 macro-F1 points over sentence-only input, but does not consistently help zero-shot LLMs. Retrieved moral knowledge is more consistently useful in matched comparisons, improving each tested model family and context condition under early fusion. However, scaling from DeBERTa-v3-base to large and from 12B to larger LLMs does not guarantee gains, and simple early fusion outperforms the tested late-fusion and cross-attention RAG variants for encoders. Per-value analyses show that context and retrieval help most for socially situated or conceptually confusable values. These findings suggest that value-sensitive NLP should evaluate context, knowledge, and model family jointly rather than treating longer inputs or larger models as universal improvements.
- Abstract(参考訳): 政治的テキストでシュワルツの値を検出するのは難しいのは、暗黙の手がかりは周囲の議論や近隣の値の微妙な区別に依存することが多いからである。
文脈と明示的な道徳的知識が文レベルの価値の検出に役立っているかを検討する。
ValuesML/Touché ValueEvalフォーマットを使用して、文、ウィンドウ、フルドキュメント入力、No-RAGおよび検索拡張された設定を道徳知識ベースで比較し、DeBERTa-v3-base/largeエンコーダを教師する。
フルドキュメントコンテキストは、文のみの入力よりも3.8-4.8マクロF1ポイントで教師付きDeBERTaエンコーダを改良するが、ゼロショットLLMを一貫して支援しない。
検索された道徳的知識は、マッチングされた比較においてより一貫して有用であり、テストされた各モデルファミリーと初期の融合条件下での文脈条件を改善している。
しかし、DeBERTa-v3-base から12B から大きな LLM へのスケーリングはゲインを保証せず、単純な初期融合はエンコーダの遅延融合およびクロスアテンション RAG 変異よりも優れている。
個人値分析は、コンテキストと検索が社会的に位置し、あるいは概念的に不利な値に最も役立っていることを示している。
これらの結果から,NLPはより長い入力やより大きなモデルを普遍的な改善として扱うのではなく,コンテキスト,知識,モデルファミリーを共同で評価すべきであることが示唆された。
関連論文リスト
- Human Values in a Single Sentence: Moral Presence, Hierarchies, and Transformer Ensembles on the Schwartz Continuum [3.0339361014383397]
約74kの英語文において,精巧なシュワルツ連続体における19の人文値の文レベル検出について検討した。
各文には価値の存在が注釈付けされ、二項の道徳的存在ラベルが付与される。
道徳的存在は単文から学習可能であることを示す。
論文 参考訳(メタデータ) (2026-01-20T17:25:33Z) - VAL-Bench: Measuring Value Alignment in Language Models [10.745372809345412]
大きな言語モデル(LLM)は、出力が人間の決定を形作るタスクにますます使われています。
既存のベンチマークは、主に拒否や事前定義された安全違反を追跡するが、モデルが一貫性のある価値システムを保持するかどうかを明らかにしない。
VAL-Bench(Value ALignment Benchmark)を導入し、モデルが公開討論の両面において安定的な価値スタンスを維持しているかどうかを評価する。
論文 参考訳(メタデータ) (2025-10-06T23:55:48Z) - Leveraging Large Language Models for Predictive Analysis of Human Misery [1.2458057399345226]
本研究では,Large Language Models (LLMs) を用いて,人間に知覚された悲惨なスコアを予測する。
我々は、ゼロショット、固定コンテキスト、検索に基づくプロンプトを含む複数のプロンプト戦略を評価する。
静的評価を超えて,テレビフォーマットに触発された新たなゲーム化フレームワークである"Misery Game Show"を導入する。
論文 参考訳(メタデータ) (2025-08-18T07:02:59Z) - Revisiting LLM Value Probing Strategies: Are They Robust and Expressive? [81.49470136653665]
広範に利用されている3つの探索戦略における値表現の頑健さと表現性を評価する。
人口統計学的文脈は自由テキスト生成にはほとんど影響を与えず、モデルの値は値に基づく行動の好みと弱い相関しか示さない。
論文 参考訳(メタデータ) (2025-07-17T18:56:41Z) - Small Encoders Can Rival Large Decoders in Detecting Groundedness [45.13986921082049]
大規模言語モデル(LLM)を外部コンテキストで拡張することで、自然言語処理(NLP)タスクのパフォーマンスが大幅に向上する。
本研究は,LLMによるコストのかかる回答生成の前に,与えられたクエリがコンテキストで提供されるドキュメントにグラウンドドされているかを検出することに焦点を当てる。
我々は,RoBERTa や NomicBERT などの軽量なタスク固有エンコーダモデルにおいて,キュレートされたデータセットを微調整することで,最先端の LLM に匹敵する精度が得られることを示す。
論文 参考訳(メタデータ) (2025-06-26T14:09:41Z) - Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding [58.364933651703524]
注目クエリの特定の領域において、集中した巨大な値が一貫して現れることを示す。
これらの膨大な価値は文脈知識の解釈において重要な役割を担っている。
大量の値の出現を辿り、そのような濃度は回転位置によって引き起こされる。
論文 参考訳(メタデータ) (2025-02-03T17:47:03Z) - ELCoRec: Enhance Language Understanding with Co-Propagation of Numerical and Categorical Features for Recommendation [38.64175351885443]
大規模言語モデルは自然言語処理(NLP)領域で栄えている。
レコメンデーション指向の微調整モデルによって示された知性にもかかわらず、LLMはユーザーの行動パターンを完全に理解するのに苦労している。
既存の作業は、その重要な情報を導入することなく、与えられたテキストデータに対してのみLLMを微調整するだけである。
論文 参考訳(メタデータ) (2024-06-27T01:37:57Z) - Robust and Scalable Model Editing for Large Language Models [75.95623066605259]
LLM編集のスケーラビリティと堅牢性を向上させるため,EREN(Reading Notesによる編集モデル)を提案する。
既存の技術とは異なり、複数の編集から知識を統合することができ、構文的に類似しているが意味的に無関係な入力に正しく反応する。
論文 参考訳(メタデータ) (2024-03-26T06:57:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。