Fugu-MT 論文翻訳(概要): FaithLM: Towards Faithful Explanations for Large Language Models

論文の概要: FaithLM: Towards Faithful Explanations for Large Language Models

arxiv url: http://arxiv.org/abs/2402.04678v3
Date: Wed, 26 Jun 2024 07:43:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-27 19:04:48.447065
Title: FaithLM: Towards Faithful Explanations for Large Language Models
Title（参考訳）: FaithLM: 大規模言語モデルの忠実な説明を目指して
Authors: Yu-Neng Chuang, Guanchu Wang, Chia-Yuan Chang, Ruixiang Tang, Shaochen Zhong, Fan Yang, Mengnan Du, Xuanting Cai, Xia Hu,
Abstract要約: 大きな言語モデル(LLM)は、内部知識と推論能力を活用することで複雑なタスクに対処するのに熟練している。これらのモデルのブラックボックスの性質は、意思決定プロセスを説明するタスクを複雑にしている。自然言語 (NL) による LLM の決定を説明するために FaithLM を紹介した。
参考スコア（独自算出の注目度）: 67.29893340289779
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large Language Models (LLMs) have become proficient in addressing complex tasks by leveraging their extensive internal knowledge and reasoning capabilities. However, the black-box nature of these models complicates the task of explaining their decision-making processes. While recent advancements demonstrate the potential of leveraging LLMs to self-explain their predictions through natural language (NL) explanations, their explanations may not accurately reflect the LLMs' decision-making process due to a lack of fidelity optimization on the derived explanations. Measuring the fidelity of NL explanations is a challenging issue, as it is difficult to manipulate the input context to mask the semantics of these explanations. To this end, we introduce FaithLM to explain the decision of LLMs with NL explanations. Specifically, FaithLM designs a method for evaluating the fidelity of NL explanations by incorporating the contrary explanations to the query process. Moreover, FaithLM conducts an iterative process to improve the fidelity of derived explanations. Experiment results on three datasets from multiple domains demonstrate that FaithLM can significantly improve the fidelity of derived explanations, which also provides a better alignment with the ground-truth explanations.
Abstract（参考訳）: 大きな言語モデル(LLM)は、その内部知識と推論能力を活用することで、複雑なタスクに対処するのに熟練している。しかしながら、これらのモデルのブラックボックスの性質は、意思決定プロセスを説明するタスクを複雑にしている。近年の進歩は、自然言語(NL)による予測を自己説明するためにLLMを利用する可能性を示しているが、それらの説明は、導出された説明に対する忠実度最適化の欠如により、LLMの意思決定過程を正確に反映していない可能性がある。これらの説明の意味を隠蔽するために入力コンテキストを操作するのは難しいため、NL説明の忠実度を測定することは難しい問題である。そこで本研究では, LLM の決定を NL の説明で説明するために FaithLM を紹介した。特に、FithLMは、逆の説明をクエリプロセスに組み込むことで、NL説明の忠実さを評価する手法を設計する。さらに、FaithLMは、導出された説明の忠実性を改善するために反復的なプロセスを実行する。複数の領域から得られた3つのデータセットの実験結果から、FithLMは導出された説明の忠実性を大幅に向上させることができることが示され、また、地上の真実的説明との整合性も向上する。

関連論文リスト

Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution [79.98699884805636]
Reasoning Execution by Multiple Listeners (REMUL) は多人数の強化学習手法である。 REMULは、推論が他の当事者に従えるかがより忠実になるという仮説に基づいている。スピーカーは、リスナーにとって明らかな推論を生み出すことで報われます。
論文参考訳（メタデータ） (2026-02-18T02:55:55Z)
Can LLMs Faithfully Explain Themselves in Low-Resource Languages? A Case Study on Emotion Detection in Persian [0.0]
大規模言語モデル(LLM)は、予測と並行して自己説明を生成するためにますます使用される。本研究では,ペルシャ語における感情分類の文脈におけるLLM生成の説明の忠実性を評価する。
論文参考訳（メタデータ） (2025-11-24T21:29:15Z)
FaithAct: Faithfulness Planning and Acting in MLLMs [12.08093899815684]
不信心は依然として、大きな言語モデルにとって永続的な課題である。本稿では,各主張対象が視覚的に支持されているか否かを評価することによって,ステップレベルとチェーンレベルの忠実度を定量化するFithEvalを提案する。我々は、すべての推論ステップにおいて明らかな根拠を強制する忠実第一の計画と行動の枠組みであるFaithActを提案する。
論文参考訳（メタデータ） (2025-11-11T16:22:49Z)
Understanding the Uncertainty of LLM Explanations: A Perspective Based on Reasoning Topology [17.119158367942088]
大規模言語モデル(LLM)の説明の不確かさは、その忠実さと推論整合性を評価する上で重要である。本稿では,LLM説明の不確かさを推論トポロジーの観点から定量化する枠組みを提案する。
論文参考訳（メタデータ） (2025-02-24T10:28:21Z)
SEER: Self-Explainability Enhancement of Large Language Models' Representations [18.840860385644316]
大規模言語モデル(LLM)を説明する自己説明法SEERを提案する。本稿では、同じ概念を集約し、表現空間における異なる概念を分離することにより、LLMの説明可能性を高める自己説明法SEERを提案する。自己説明型LLMが説明可能性と性能を一貫した改善を達成するための信頼性関連タスクへのSEERの適用について紹介する。
論文参考訳（メタデータ） (2025-02-07T13:25:33Z)
Aligning Large Language Models for Faithful Integrity Against Opposing Argument [71.33552795870544]
大規模言語モデル(LLM)は複雑な推論タスクにおいて印象的な機能を示している。原文が正しい場合でも、会話中に不誠実な議論によって容易に誤解される。本稿では,信頼度と信頼度を両立させる新しい枠組みを提案する。
論文参考訳（メタデータ） (2025-01-02T16:38:21Z)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.332004960574004]
大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳（メタデータ） (2024-07-20T11:19:58Z)
Verification and Refinement of Natural Language Explanations through LLM-Symbolic Theorem Proving [13.485604499678262]
本稿では,Large Language Models(LLMs)とTheorem Provers(TPs)の統合による自然言語説明の検証と改善について検討する。本稿では, TPとLPMを統合して説明文の生成と定式化を行う, Explanation-Refiner というニューロシンボリック・フレームワークを提案する。代わりに、TPは説明の論理的妥当性を公式に保証し、その後の改善のためのフィードバックを生成するために使用される。
論文参考訳（メタデータ） (2024-05-02T15:20:01Z)
Can LLMs Produce Faithful Explanations For Fact-checking? Towards Faithful Explainable Fact-Checking via Multi-Agent Debate [75.10515686215177]
大規模言語モデル(LLM)はテキスト生成に優れるが、事実チェックにおいて忠実な説明を生成する能力は依然として過小評価されている。多様な役割を持つエージェントとして複数のLSMを利用するマルチエージェント・デベート・リファインメント(MADR)フレームワークを提案する。 MADRは、最終的な説明が厳密な検証を行い、不誠実な要素の可能性を著しく低減し、提示された証拠と密接に一致させることを保証する。
論文参考訳（メタデータ） (2024-02-12T04:32:33Z)
Faithfulness vs. Plausibility: On the (Un)Reliability of Explanations from Large Language Models [26.11408084129897]
大規模言語モデル(LLM)は、いくつかの自然言語処理(NLP)アプリケーションのための強力なツールとしてデプロイされる。最近の研究は、現代のLSMが自己説明(Ses)を生成できることを示している。 LLMが生成するSEの忠実度と妥当性の両立を論じる。
論文参考訳（メタデータ） (2024-02-07T06:32:50Z)
Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models [54.21695754082441]
説明可能なストック予測を生成するために,LLM(Large Language Models)を教えるフレームワークを提案する。反射剤は自己推論によって過去の株価の動きを説明する方法を学ぶ一方、PPOトレーナーは最も可能性の高い説明を生成するためにモデルを訓練する。我々のフレームワークは従来のディープラーニング法とLLM法の両方を予測精度とマシューズ相関係数で上回ることができる。
論文参考訳（メタデータ） (2024-02-06T03:18:58Z)
Are self-explanations from Large Language Models faithful? [35.40666730867487]
大規模言語モデル(LLM)は多くのタスクを抽出し、その推論、いわゆる自己説明を説明する。自己説明がモデルの振舞いを本当に反映しているかを測定することが重要です。信頼度を測定するために自己整合性チェックを採用することを提案する。
論文参考訳（メタデータ） (2024-01-15T19:39:15Z)
XplainLLM: A QA Explanation Dataset for Understanding LLM Decision-Making [13.928951741632815]
大規模言語モデル(LLM)は、最近、自然言語理解タスクにおいて顕著な進歩を遂げた。本稿では、新しい説明データセットを導入することにより、このプロセスに透明性をもたらすことを検討する。我々のデータセットには12,102のQAEトリプルが含まれている。
論文参考訳（メタデータ） (2023-11-15T00:34:28Z)
Explanation-aware Soft Ensemble Empowers Large Language Model In-context Learning [50.00090601424348]
大規模言語モデル(LLM)は、様々な自然言語理解タスクにおいて顕著な能力を示している。我々は,LLMを用いたテキスト内学習を支援するための説明型ソフトアンサンブルフレームワークであるEASEを提案する。
論文参考訳（メタデータ） (2023-11-13T06:13:38Z)
Language Models with Rationality [57.37201135072838]
大規模言語モデル(LLM)は質問応答(QA)に熟練している答えが潜んでいる「信条」からどのように従うか(あるいはたとえも)は必ずしも明確ではない。
論文参考訳（メタデータ） (2023-05-23T17:04:25Z)
LMExplainer: Grounding Knowledge and Explaining Language Models [37.578973458651944]
GPT-4のような言語モデル(LM)は、AIアプリケーションにおいて重要であるが、不透明な意思決定プロセスは、特に安全クリティカルな領域において、ユーザの信頼を低下させる。 LMExplainerは,人間の直感的,理解可能な説明を通じて,LMの推論過程を明らかにする新しい知識基盤説明器である。
論文参考訳（メタデータ） (2023-03-29T08:59:44Z)
Explanations from Large Language Models Make Small Reasoners Better [61.991772773700006]
提案手法は, 異なる設定において, 微調整ベースラインを連続的に, 著しく向上させることができることを示す。副次的な利点として、人間の評価は、その予測を正当化するために高品質な説明を生成することができることを示す。
論文参考訳（メタデータ） (2022-10-13T04:50:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。