Fugu-MT 論文翻訳(概要): Toward a Theory of Causation for Interpreting Neural Code Models

論文の概要: Toward a Theory of Causation for Interpreting Neural Code Models

arxiv url: http://arxiv.org/abs/2302.03788v1
Date: Tue, 7 Feb 2023 22:56:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-09 18:01:22.800348
Title: Toward a Theory of Causation for Interpreting Neural Code Models
Title（参考訳）: ニューラルコードモデル解釈のための因果理論に向けて
Authors: David N. Palacio and Nathan Cooper and Alvaro Rodriguez and Kevin Moran and Denys Poshyvanyk
Abstract要約: 本稿では,Nuural Language Models of Code(NCM)に特化したポストホック解釈可能性方法論である$do_code$を紹介する。本稿では,プログラミング言語におけるモデル動作の説明を基礎として,素早い相関の影響を軽減することを目的とした,具体的なインスタンス化を提案する。このケーススタディの結果から,NCMはコード構文の変化に敏感であり,他のプログラミング言語と比べ,バイアスの少ないコードのブロックに関連するトークンを統計的に予測できることが示唆された。
参考スコア（独自算出の注目度）: 20.496240986973334
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Neural Language Models of Code, or Neural Code Models (NCMs), are rapidly progressing from research prototypes to commercial developer tools. As such, understanding the capabilities and limitations of such models is becoming critical. However, the abilities of these models are typically measured using automated metrics that often only reveal a portion of their real-world performance. While, in general, the performance of NCMs appears promising, currently much is unknown about how such models arrive at decisions. To this end, this paper introduces $do_{code}$, a post-hoc interpretability methodology specific to NCMs that is capable of explaining model predictions. $do_{code}$ is based upon causal inference to enable programming language-oriented explanations. While the theoretical underpinnings of $do_{code}$ are extensible to exploring different model properties, we provide a concrete instantiation that aims to mitigate the impact of spurious correlations by grounding explanations of model behavior in properties of programming languages. To demonstrate the practical benefit of $do_{code}$, we illustrate the insights that our framework can provide by performing a case study on two popular deep learning architectures and nine NCMs. The results of this case study illustrate that our studied NCMs are sensitive to changes in code syntax and statistically learn to predict tokens related to blocks of code (e.g., brackets, parenthesis, semicolon) with less confounding bias as compared to other programming language constructs. These insights demonstrate the potential of $do_{code}$ as a useful model debugging mechanism that may aid in discovering biases and limitations in NCMs.
Abstract（参考訳）: コードのニューラル言語モデル(neural code model,ncms)は、研究プロトタイプから商用開発ツールへと急速に進歩している。このように、そのようなモデルの能力と限界を理解することが重要になっている。しかしながら、これらのモデルの能力は通常、実際のパフォーマンスの一部だけを明らかにする自動メトリクスを使用して測定される。一般的には、NCMのパフォーマンスは有望であるように思われるが、現在、そのようなモデルがどのように決定に達するかは不明である。そこで本研究では,モデル予測を記述可能なNCMに特有のポストホック解釈可能性手法である$do_{code}$を紹介する。 $do_{code}$は、言語指向の説明を可能にする因果推論に基づいている。 do_{code}$の理論的基盤は、異なるモデル特性を探索するために拡張可能であるが、プログラミング言語の性質におけるモデル挙動の説明を基礎として、突発的相関の影響を軽減することを目的とした具体的なインスタンス化を提供する。 do_{code}$の実際的な利点を示すために、2つの一般的なディープラーニングアーキテクチャと9つのncmをケーススタディすることで、フレームワークが提供できる洞察を説明します。このケース・スタディの結果から,ntmはコード構文の変化に敏感であり,他のプログラミング言語の構文に比べて偏りが少なく,コードブロック(ブラケット,括弧,セミコロンなど)に関連するトークンを統計的に予測できることがわかった。これらの洞察は、NCMのバイアスや制限を発見するのに役立つ有用なモデルデバッグメカニズムとして$do_{code}$の可能性を示している。

関連論文リスト

CAuSE: Decoding Multimodal Classifiers using Faithful Natural Language Explanation [46.9286703847151]
我々は,事前訓練されたマルチモーダル分類器に対して忠実なNLEを生成する新しいフレームワークであるCAuSE(Causal Abstraction under Simulated Explanations)を提案する。我々は、CAuSEが広範囲な経験的評価を通じてデータセットやモデルにまたがる一般化を実証する。さらに、マルチモーダル設定における因果的忠実度を測定するために、再設計された基準によってこれを検証する。
論文参考訳（メタデータ） (2025-12-07T12:15:21Z)
Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文参考訳（メタデータ） (2025-10-02T06:25:10Z)
On the Effect of Token Merging on Pre-trained Models for Code [11.029842116504726]
本研究では,同じ意味単位に属するサブトークンの隠蔽表現をマージする効果について検討する。 1つは表現を平均化することに基づく戦略であり、もう1つは学習に基づくアプローチを活用する戦略である。これらの戦略は浮動小数点演算数を1%$から19%$に削減できることを示している。
論文参考訳（メタデータ） (2025-07-19T00:48:20Z)
Towards a Science of Causal Interpretability in Deep Learning for Software Engineering [0.32634122554914]
ソフトウエアエンジニアリングのための深層学習(DL4SE)における因果解釈性を達成するための論文演説 Dissertationがニューラルネットワークモデル(NCM)の新しいポストホック解釈方法であるDoCodeを導入 DoCodeは因果推論を使用して、モデル予測のプログラミング言語指向の説明を提供する。
論文参考訳（メタデータ） (2025-05-21T02:13:11Z)
On Explaining (Large) Language Models For Code Using Global Code-Based Explanations [45.126233498200534]
Language Models for Code (LLM4Code)は、ソフトウェア工学(SE)のランドスケープを大きく変えた。我々は、厳密な数学的基盤を持つ手法であるコード論理(Code$Q$)を導入し、個々のコード予測を説明できるトークンのサブセットを特定する。評価の結果、Code$Q$は意味のある入力概念(すなわち自然言語粒子)が出力生成にどのように影響するかを説明するための強力な解釈可能性法であることがわかった。
論文参考訳（メタデータ） (2025-03-21T01:00:45Z)
DBR: Divergence-Based Regularization for Debiasing Natural Language Understanding Models [50.54264918467997]
プレトレーニング言語モデル(PLM)は、様々な自然言語処理タスクにおいて印象的な結果を得た。近年の研究では、これらのモデルが言語を真に理解するのではなく、表面的な特徴やショートカットに依存していることが明らかになっている。本稿では,このショートカット学習行動を軽減するために,ダイバージェンスに基づく正規化(DBR)を提案する。
論文参考訳（メタデータ） (2025-02-25T16:44:10Z)
EmbedLLM: Learning Compact Representations of Large Language Models [28.49433308281983]
大規模言語モデルのコンパクトなベクトル表現を学習するためのフレームワークである EmbedLLM を提案する。このような埋め込みを学習するためのエンコーダ-デコーダアプローチと,その有効性を評価するための体系的なフレームワークを導入する。 EmbedLLMはモデルルーティングにおいて,精度とレイテンシの両方において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2024-10-03T05:43:24Z)
Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2～3倍の高速化を実現した。
論文参考訳（メタデータ） (2024-07-22T18:00:00Z)
Standardizing Structural Causal Models [80.21199731817698]
ベンチマークアルゴリズムのための内部標準構造因果モデル(iSCM)を提案する。構成上、iSCMは$operatornameVar$-sortableではない。また、一般的に使用されるグラフ族に対して$operatornameR2$-sortableでないという経験的証拠も見つかる。
論文参考訳（メタデータ） (2024-06-17T14:52:21Z)
Perplexed: Understanding When Large Language Models are Confused [3.4208414448496027]
本稿では,言語モデルが複雑になる場所を探索するライブラリであるperplexedを紹介する。 Codetokenizerと呼ばれるコードモデルの解析を支援するために構築した追加ツールを使用して、コード生成のためのLLM(Large Language Models)に焦点を当てたケーススタディを実施しました。我々の研究したコードLLMは、コードが構文的に正しくないコーディング構造において、最悪のパフォーマンスを示しました。
論文参考訳（メタデータ） (2024-04-09T22:03:39Z)
Understanding How CodeLLMs (Mis)Predict Types with Activation Steering [6.975009142727399]
研究によると、Large Language Models (LLM) はプログラムのセマンティクスを深く理解していないことが多い。本研究では,タイプ予測の課題について検討する。ステアリングがPythonとTypeScriptで共有される型予測メカニズムをうまく起動することを示す。
論文参考訳（メタデータ） (2024-04-02T12:44:44Z)
Evaluating and Explaining Large Language Models for Code Using Syntactic Structures [74.93762031957883]
本稿では,コード用大規模言語モデルに特有の説明可能性手法であるASTxplainerを紹介する。その中核にあるASTxplainerは、トークン予測をASTノードに整合させる自動メソッドを提供する。私たちは、最も人気のあるGitHubプロジェクトのキュレートデータセットを使用して、コード用の12の人気のあるLLMに対して、実証的な評価を行います。
論文参考訳（メタデータ） (2023-08-07T18:50:57Z)
Language models are weak learners [71.33837923104808]
本研究では,プロンプトベースの大規模言語モデルは弱い学習者として効果的に動作可能であることを示す。これらのモデルをブースティングアプローチに組み込むことで、モデル内の知識を活用して、従来のツリーベースのブースティングよりも優れています。結果は、プロンプトベースのLLMが、少数の学習者だけでなく、より大きな機械学習パイプラインのコンポーネントとして機能する可能性を示している。
論文参考訳（メタデータ） (2023-06-25T02:39:19Z)
Great Truths are Always Simple: A Rather Simple Knowledge Encoder for Enhancing the Commonsense Reasoning Capacity of Pre-Trained Models [89.98762327725112]
自然言語における常識推論は、人工知能システムの望ましい能力である。複雑なコモンセンス推論タスクを解決するための典型的な解決策は、知識対応グラフニューラルネットワーク(GNN)エンコーダで事前訓練された言語モデル(PTM)を強化することである。有効性にもかかわらず、これらのアプローチは重いアーキテクチャ上に構築されており、外部知識リソースがPTMの推論能力をどのように改善するかを明確に説明できない。
論文参考訳（メタデータ） (2022-05-04T01:27:36Z)
Counterfactual Explanations for Models of Code [11.678590247866534]
機械学習(ML)モデルは、多くのソフトウェアエンジニアリングタスクにおいて、ますます一般的な役割を担っている。開発者が、なぜモデルが一定の結論に達したのか、モデルの予測にどのように対応すべきかを理解するのは難しいかもしれません。本稿では,ソースコードのモデルに対する反実的説明について考察する。
論文参考訳（メタデータ） (2021-11-10T14:44:19Z)
Explaining and Improving Model Behavior with k Nearest Neighbor Representations [107.24850861390196]
モデルの予測に責任のあるトレーニング例を特定するために, k 近傍表現を提案する。我々は,kNN表現が学習した素因関係を明らかにするのに有効であることを示す。以上の結果から,kNN手法により,直交モデルが逆入力に対してより堅牢であることが示唆された。
論文参考訳（メタデータ） (2020-10-18T16:55:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。