Fugu-MT 論文翻訳(概要): Psychologically-informed chain-of-thought prompts for metaphor understanding in large language models

論文の概要: Psychologically-informed chain-of-thought prompts for metaphor understanding in large language models

arxiv url: http://arxiv.org/abs/2209.08141v1
Date: Fri, 16 Sep 2022 19:23:13 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-20 15:38:50.674261
Title: Psychologically-informed chain-of-thought prompts for metaphor understanding in large language models
Title（参考訳）: 大規模言語モデルにおけるメタファ理解のための心理的に非定型な思考連鎖プロンプト
Authors: Ben Prystawski, Paul Thibodeau, Noah Goodman
Abstract要約: 大規模言語モデル(LLM)は、文脈内学習によって多くのタスクを実行できるが、確率モデルの明確な構造は欠いている。確率モデルからLLMへの構造導入にはチェーン・オブ・シント・プロンプトを用いる。 GPT-3の2つの大きなバージョンにこれらのプロンプトを適用し、パラフレーズ選択を改善することができることを示す。
参考スコア（独自算出の注目度）: 1.6204795984450167
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Probabilistic models of language understanding are interpretable and structured, for instance models of metaphor understanding describe inference about latent topics and features. However, these models are manually designed for a specific task. Large language models (LLMs) can perform many tasks through in-context learning, but they lack the clear structure of probabilistic models. In this paper, we use chain-of-thought prompts to introduce structures from probabilistic models into LLMs. These prompts lead the model to infer latent variables and reason about their relationships to choose appropriate paraphrases for metaphors. The latent variables and relationships chosen are informed by theories of metaphor understanding from cognitive psychology. We apply these prompts to the two largest versions of GPT-3 and show that they can improve paraphrase selection.
Abstract（参考訳）: 言語理解の確率的モデルは解釈可能で構造化されており、例えばメタファ理解のモデルは潜在トピックや特徴の推論を記述する。しかし、これらのモデルは特定のタスクのために手動で設計されている。大規模言語モデル(LLM)は、文脈内学習によって多くのタスクを実行できるが、確率モデルの明確な構造は欠いている。本稿では,確率モデルからLLMへの構造導入にチェーン・オブ・シント・プロンプトを用いる。これらのプロンプトはモデルに潜伏変数を推論し、それらの関係を推論し、メタファーの適切なパラフレーズを選択する。選択された潜在変数と関係は、認知心理学からのメタファー理解の理論から学べる。 GPT-3の2つの大きなバージョンにこれらのプロンプトを適用し、パラフレーズ選択を改善することができることを示す。

関連論文リスト

Metaphor identification using large language models: A comparison of RAG, prompt engineering, and fine-tuning [0.6524460254566904]
本研究では,大言語モデル(LLM)が全文でメタファ識別を自動化する可能性について検討する。 i) 検索拡張生成(RAG) モデルにコードブックを付与し,その規則や例に基づいて注釈を付けるように指示する手法, (ii) タスク固有の言語命令を設計する手法, (iii) ハンドコードされたテキストでモデルを訓練してパフォーマンスを最適化するファインチューニング,の3つの手法を比較した。
論文参考訳（メタデータ） (2025-09-29T14:50:18Z)
On the Same Wavelength? Evaluating Pragmatic Reasoning in Language Models across Broad Concepts [69.69818198773244]
本研究では,言語理解と言語生産の両面で,多種多様なLMについて検討する。最先端のLMは小さくはないが,言語理解において高い性能を発揮する。
論文参考訳（メタデータ） (2025-09-08T17:59:32Z)
Language Models Fail to Introspect About Their Knowledge of Language [13.743212705122751]
我々は,21のオープンソース言語モデルを対象とした創発的イントロスペクションを体系的に検討する。モデルがメタ言語的刺激に対する応答を、内部知識を忠実に反映しているかどうかを評価する。本稿では,モデルが入力した応答が自身の文字列の確率を予測する度合いという,新しいイントロスペクション尺度を提案する。
論文参考訳（メタデータ） (2025-03-10T16:33:14Z)
Conceptual Metaphor Theory as a Prompting Paradigm for Large Language Models [0.0]
大規模言語モデル(LLM)の拡張のためのフレームワークとしてメタファー概念理論(CMT)を紹介する。 CMTは比喩的マッピングを活用して抽象的推論を構造化し、複雑な概念を処理し説明するモデルの能力を向上させる。我々は4つのネイティブモデル(Llama3.2、Phi3、Gemma2、Mistral)を、ドメイン固有の推論、創造的洞察、メタファ解釈にまたがるベンチマークタスクで、CMTが強化したモデルと比較する。
論文参考訳（メタデータ） (2025-02-04T00:26:39Z)
What Kinds of Tokens Benefit from Distant Text? An Analysis on Long Context Language Modeling [27.75379365518913]
言語モデルにおいて,どの単語が長い文脈からより恩恵を受けるかを検討する。内容語(名詞、形容詞など)と最初の単語のトークンが最も役立ちます。また、より長い文脈で言語モデルがより自信を持ち、よりシャープな確率分布が生まれることを観察する。
論文参考訳（メタデータ） (2024-06-17T06:07:29Z)
Explaining Text Similarity in Transformer Models [52.571158418102584]
説明可能なAIの最近の進歩により、トランスフォーマーの説明の改善を活用することで、制限を緩和できるようになった。両線形類似性モデルにおける2次説明の計算のために開発された拡張であるBiLRPを用いて、NLPモデルにおいてどの特徴相互作用が類似性を促進するかを調べる。我々の発見は、異なる意味的類似性タスクやモデルに対するより深い理解に寄与し、新しい説明可能なAIメソッドが、どのようにして深い分析とコーパスレベルの洞察を可能にするかを強調した。
論文参考訳（メタデータ） (2024-05-10T17:11:31Z)
Towards a Fully Interpretable and More Scalable RSA Model for Metaphor Understanding [0.8437187555622164]
Rational Speech Act (RSA) モデルは、計算用語で実用的推論をモデル化するための柔軟なフレームワークを提供する。本稿では、明示的な公式を提供することで制限に対処するメタファー理解のための新しいRSAフレームワークを提案する。このモデルは、従来の$textitJohn-is-a-shark$型に限らず、24のメタファでテストされた。
論文参考訳（メタデータ） (2024-04-03T18:09:33Z)
From Word Models to World Models: Translating from Natural Language to the Probabilistic Language of Thought [124.40905824051079]
言語インフォームド・シンキングのための計算フレームワークである「構成」を合理的に提案する。我々は、自然言語から確率論的思考言語への文脈感応的なマッピングとして、言語の意味を定式化する。 LLMは、現実的に適切な言語的意味をキャプチャする文脈依存翻訳を生成することができることを示す。認知的なモチベーションを持つシンボリックモジュールを統合するために、我々のフレームワークを拡張します。
論文参考訳（メタデータ） (2023-06-22T05:14:00Z)
Large Language Models are In-Context Semantic Reasoners rather than Symbolic Reasoners [75.85554779782048]
大規模言語モデル(LLM)は、近年、自然言語と機械学習コミュニティを興奮させています。多くの成功を収めたアプリケーションにもかかわらず、そのようなコンテキスト内機能の基盤となるメカニズムはまだ不明である。本研究では,学習した言語トークンのテクストセマンティクスが推論過程において最も重い処理を行うと仮定する。
論文参考訳（メタデータ） (2023-05-24T07:33:34Z)
Black-box language model explanation by context length probing [7.526153863886609]
本稿では、因果言語モデルのための新しい説明手法である文脈長探索について述べる。この技術はモデルに依存しず、トークンレベルの確率の計算以上のモデル内部へのアクセスに依存しない。事前学習された大規模言語モデルに文脈長探索を適用し、初期分析と洞察を提供する。
論文参考訳（メタデータ） (2022-12-30T16:24:10Z)
The Goldilocks of Pragmatic Understanding: Fine-Tuning Strategy Matters for Implicature Resolution by LLMs [26.118193748582197]
我々は、広く使われている最先端モデルの4つのカテゴリを評価する。 2進推論を必要とする発話のみを評価するにもかかわらず、3つのカテゴリのモデルはランダムに近い性能を示す。これらの結果は、特定の微調整戦略がモデルにおける実用的理解を誘導する上ではるかに優れていることを示唆している。
論文参考訳（メタデータ） (2022-10-26T19:04:23Z)
Structured, flexible, and robust: benchmarking and improving large language models towards more human-like behavior in out-of-distribution reasoning tasks [39.39138995087475]
言語単独で統計的パターンを学習することで、どの程度の人間的な思考を捉えることができるのかを問う。本ベンチマークは2つの問題解決領域(計画と説明生成)を含み,一般化を必要とするように設計されている。このベンチマークでは、人間はLSMよりもはるかに堅牢であることが分かりました。
論文参考訳（メタデータ） (2022-05-11T18:14:33Z)
Testing the Ability of Language Models to Interpret Figurative Language [69.59943454934799]
比喩的・比喩的な言語は言論において一般的である。現代の言語モデルが非リテラルなフレーズをどの程度解釈できるかについては、未解決の疑問が残る。ウィノグラードスタイルの非文字言語理解タスクであるFig-QAを紹介する。
論文参考訳（メタデータ） (2022-04-26T23:42:22Z)
Chain of Thought Prompting Elicits Reasoning in Large Language Models [56.811278668446825]
本稿では,コヒーレントな思考連鎖を生成する言語モデルについて考察する。実験により、プロンプトによって思考の連鎖を誘導することで、十分な大きな言語モデルが推論タスクをよりよく実行できるようになることが示されている。
論文参考訳（メタデータ） (2022-01-28T02:33:07Z)
A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文参考訳（メタデータ） (2022-01-20T15:01:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。