Fugu-MT 論文翻訳(概要): On Championing Foundation Models: From Explainability to Interpretability

論文の概要: On Championing Foundation Models: From Explainability to Interpretability

arxiv url: http://arxiv.org/abs/2410.11444v1
Date: Tue, 15 Oct 2024 09:48:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:35.717217
Title: On Championing Foundation Models: From Explainability to Interpretability
Title（参考訳）: ファンデーションモデルのチャンピオンについて:説明可能性から解釈可能性へ
Authors: Shi Fu, Yuzhu Chen, Yingjie Wang, Dacheng Tao,
Abstract要約: 本調査は、上記の原則に準拠し、ブラックボックス基礎モデルに適用された解釈可能な手法をレビューすることを目的としている。これらの手法は機械学習理論に根ざし、一般化性能、表現能力、動的挙動の分析を網羅している。これらは、推論能力やトレーニングダイナミクスから倫理的意味まで、FMのワークフロー全体の完全な解釈を提供する。
参考スコア（独自算出の注目度）: 48.2313835471321
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Understanding the inner mechanisms of black-box foundation models (FMs) is essential yet challenging in artificial intelligence and its applications. Over the last decade, the long-running focus has been on their explainability, leading to the development of post-hoc explainable methods to rationalize the specific decisions already made by black-box FMs. However, these explainable methods have certain limitations in terms of faithfulness, detail capture and resource requirement. Consequently, in response to these issues, a new class of interpretable methods should be considered to unveil the underlying mechanisms in an accurate, comprehensive, heuristic and resource-light way. This survey aims to review interpretable methods that comply with the aforementioned principles and have been successfully applied to FMs. These methods are deeply rooted in machine learning theory, covering the analysis of generalization performance, expressive capability, and dynamic behavior. They provide a thorough interpretation of the entire workflow of FMs, ranging from the inference capability and training dynamics to their ethical implications. Ultimately, drawing upon these interpretations, this review identifies the next frontier research directions for FMs.
Abstract（参考訳）: ブラックボックス基礎モデル(FM)の内部メカニズムを理解することは、人工知能とその応用において不可欠だが困難である。過去10年にわたって、長期にわたるその説明可能性に焦点が当てられ、ブラックボックスFMによる特定の決定を合理化するためのポストホックな説明可能な方法の開発につながった。しかし、これらの説明可能な手法は、忠実さ、詳細なキャプチャ、リソース要件の点で一定の制限がある。したがって、これらの問題に対して、新しい解釈可能な手法のクラスは、その基盤となるメカニズムを、正確で包括的で、ヒューリスティックで、リソースライトな方法で明らかにすべきである。本調査は、上記の原則に従って、FMに適用された解釈可能な手法をレビューすることを目的としている。これらの手法は機械学習理論に深く根ざしており、一般化性能、表現能力、動的挙動の分析を網羅している。これらは、推論能力やトレーニングダイナミクスから倫理的意味まで、FMのワークフロー全体の完全な解釈を提供する。最終的に、これらの解釈に基づいて、このレビューはFMの次のフロンティア研究の方向性を特定する。

関連論文リスト

Brewing Knowledge in Context: Distillation Perspectives on In-Context Learning [2.6129523822281415]
In-context Learning (ICL) は、大きな言語モデルでウェイトアップなしで新しいタスクを解くことができる。実証的な成功にもかかわらず、ICLのメカニズムはいまだに理解されていない。本稿では,ICLを知識蒸留の暗黙の形式として解釈する新たな理論的視点を提案する。
論文参考訳（メタデータ） (2025-06-13T07:17:41Z)
Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1) [66.51642638034822]
推論は人間の知性の中心であり、多様なタスクにまたがる構造化された問題解決を可能にする。大規模言語モデル(LLM)の最近の進歩は、算術、常識、記号領域における推論能力を大幅に向上させてきた。本稿では,テキストおよびマルチモーダルLLMにおける推論手法の簡潔かつ洞察に富んだ概要について述べる。
論文参考訳（メタデータ） (2025-04-04T04:04:56Z)
Causal Abstraction in Model Interpretability: A Compact Survey [5.963324728136442]
因果的抽象化は、モデル行動の基礎となる因果的メカニズムを理解し説明するための原則化されたアプローチを提供する。本研究は, 因果的抽象の領域を掘り下げ, その理論的基礎, 実践的応用, モデル解釈可能性の分野への含意について考察する。
論文参考訳（メタデータ） (2024-10-26T12:24:28Z)
A Mechanistic Interpretation of Syllogistic Reasoning in Auto-Regressive Language Models [13.59675117792588]
自己回帰言語モデル(LM)における論理的推論に関する最近の研究は、そのようなモデルが事前学習中に体系的推論原理を学習できるかという議論を引き起こしている。本稿では, 内部力学の理解を深めるため, LMにおけるシロメトリクス推論の機械論的解釈を提案する。
論文参考訳（メタデータ） (2024-08-16T07:47:39Z)
Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。最近の傾向は、これらの2つの分野の潜在的均一性を示している。本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文参考訳（メタデータ） (2024-07-01T07:05:44Z)
A Guide to Feature Importance Methods for Scientific Inference [10.31256905045161]
特徴重要度(FI)法はデータ生成過程(DGP)に有用な洞察を与える本稿では,グローバルFI手法の解釈の理解を支援するための包括的ガイドとして機能する。
論文参考訳（メタデータ） (2024-04-19T13:01:59Z)
Foundation Models for Time Series Analysis: A Tutorial and Survey [70.43311272903334]
ファンデーションモデル(FM)は、時系列分析のためのモデル設計のパラダイムを根本的に変えてきた。本調査は,時系列解析のためのFMの概要を包括的かつ最新のものにすることを目的としている。
論文参考訳（メタデータ） (2024-03-21T10:08:37Z)
Foundation Model Sherpas: Guiding Foundation Models through Knowledge and Reasoning [23.763256908202496]
ファンデーションモデル(FM)は、さまざまなタスクにおいて顕著なパフォーマンスを示すことによって、AIの分野に革命をもたらした。 FMは、多くの現実世界システムで広く採用されるのを防ぐために、多くの制限を課している。エージェントがFMと対話できる様々なモードをカプセル化する概念的枠組みを提案する。
論文参考訳（メタデータ） (2024-02-02T18:00:35Z)
Learn From Model Beyond Fine-Tuning: A Survey [78.80920533793595]
Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。 LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文参考訳（メタデータ） (2023-10-12T10:20:36Z)
Explainability for Large Language Models: A Survey [59.67574757137078]
大規模言語モデル(LLM)は、自然言語処理における印象的な能力を示している。本稿では,トランスフォーマーに基づく言語モデルを記述する手法について,説明可能性の分類法を紹介した。
論文参考訳（メタデータ） (2023-09-02T22:14:26Z)
Explainable Deep Reinforcement Learning: State of the Art and Challenges [1.005130974691351]
解釈可能性、説明可能性、透明性は、多くの重要な領域で人工知能メソッドを導入する上で重要な問題である。本稿では, 深層強化学習法について解説する技術の現状について概説する。
論文参考訳（メタデータ） (2023-01-24T11:41:25Z)
Multilingual Multi-Aspect Explainability Analyses on Machine Reading Comprehension Models [76.48370548802464]
本稿では,マルチヘッド自己注意と最終MRCシステム性能の関係を検討するために,一連の解析実験を実施することに焦点を当てる。問合せ及び問合せ理解の注意が問合せプロセスにおいて最も重要なものであることが判明した。包括的可視化とケーススタディを通じて、注意マップに関するいくつかの一般的な知見も観察し、これらのモデルがどのように問題を解くかを理解するのに役立ちます。
論文参考訳（メタデータ） (2021-08-26T04:23:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。