Fugu-MT 論文翻訳(概要): Can Large Language Models Understand Intermediate Representations?

論文の概要: Can Large Language Models Understand Intermediate Representations?

arxiv url: http://arxiv.org/abs/2502.06854v1
Date: Fri, 07 Feb 2025 17:23:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-12 18:22:47.745568
Title: Can Large Language Models Understand Intermediate Representations?
Title（参考訳）: 大規模言語モデルは中間表現に理解できるか?
Authors: Hailong Jiang, Jianfeng Zhu, Yao Wan, Bo Fang, Hongyu Zhang, Ruoming Jin, Qiang Guan,
Abstract要約: 本稿では、中間表現(IR)理解におけるLLM(Large Language Models)の機能について検討する。制御フローグラフ(CFG)再構成、逆コンパイル、コード要約、実行推論の4つのタスクのパフォーマンスを分析した。この研究は、構造化IRデータセットの微調整と明示的な制御フローモデルの統合により、IR関連タスクの理解と処理を強化することを推奨している。
参考スコア（独自算出の注目度）: 17.033963652676164
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Intermediate Representations (IRs) are essential in compiler design and program analysis, yet their comprehension by Large Language Models (LLMs) remains underexplored. This paper presents a pioneering empirical study to investigate the capabilities of LLMs, including GPT-4, GPT-3, Gemma 2, LLaMA 3.1, and Code Llama, in understanding IRs. We analyze their performance across four tasks: Control Flow Graph (CFG) reconstruction, decompilation, code summarization, and execution reasoning. Our results indicate that while LLMs demonstrate competence in parsing IR syntax and recognizing high-level structures, they struggle with control flow reasoning, execution semantics, and loop handling. Specifically, they often misinterpret branching instructions, omit critical IR operations, and rely on heuristic-based reasoning, leading to errors in CFG reconstruction, IR decompilation, and execution reasoning. The study underscores the necessity for IR-specific enhancements in LLMs, recommending fine-tuning on structured IR datasets and integration of explicit control flow models to augment their comprehension and handling of IR-related tasks.
Abstract（参考訳）: 中間表現(IR)はコンパイラ設計やプログラム解析に必須であるが、Large Language Models (LLM) による理解はいまだ未定である。本稿では, GPT-4, GPT-3, Gemma 2, LLaMA 3.1, Code LlamaなどのLCMのIR理解能力に関する先駆的な実証的研究を行った。制御フローグラフ(CFG)再構成、逆コンパイル、コード要約、実行推論の4つのタスクのパフォーマンスを分析した。この結果から,LLMはIR構文の解析や高次構造認識の能力を示す一方で,制御フローの推論,実行セマンティクス,ループ処理に苦慮していることが明らかとなった。具体的には、分岐命令を誤って解釈し、重要なIR操作を省略し、ヒューリスティックな推論に依存し、CFG再構成、IR逆コンパイル、実行推論の誤りを引き起こす。この研究は、LLMにおけるIR固有の拡張の必要性を強調し、構造化IRデータセットの微調整と明示的な制御フローモデルの統合を推奨し、IR関連タスクの理解と処理を強化する。

関連論文リスト

How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective [64.00022624183781]
大規模言語モデル(LLM)は、関連性を評価し、情報検索(IR)タスクをサポートする。メカニスティック・インタプリタビリティのレンズを用いて,異なるLLMモジュールが関係判断にどのように寄与するかを検討する。
論文参考訳（メタデータ） (2025-04-10T16:14:55Z)
RAG-Star: Enhancing Deliberative Reasoning with Retrieval Augmented Verification and Refinement [85.08223786819532]
既存の大規模言語モデル(LLM)は、例外的な問題解決能力を示すが、複雑な推論タスクに苦労する可能性がある。検索情報を統合した新しいRAG手法である textbfRAG-Star を提案する。 Llama-3.1-8B-Instruct と GPT-4o を併用した実験により,RAG-Star は従来のRAG と推理法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2024-12-17T13:05:36Z)
Benchmarking and Understanding Compositional Relational Reasoning of LLMs [1.915591735124465]
我々はまず、Generalized Associative Recall (GAR)と呼ばれる新しい合成ベンチマークを提案する。評価は、GARが既存のLLMにとって十分困難であることを示し、CRRの基本的な欠陥を明らかにしている。次に、属性パッチを用いて、Vicuna-33Bで再利用されたコア回路の様々なタスクと重要な注意点のセットを発見する。
論文参考訳（メタデータ） (2024-12-17T12:10:38Z)
Eliciting Critical Reasoning in Retrieval-Augmented Language Models via Contrastive Explanations [4.697267141773321]
Retrieval-augmented Generation (RAG) は、よりリッチな現実的コンテキストに体系的にアクセスする大規模言語モデル(LLM)をサポートするために、現代のNLPにおいて重要なメカニズムとして登場した。近年の研究では、LLMはRAGに基づくインコンテキスト情報(誤った推論や幻覚につながる可能性のある制限)を批判的に分析するのに苦慮していることが示されている。本稿では,RAGにおける批判的推論を,対照的な説明を通じてどのように引き起こすかを検討する。
論文参考訳（メタデータ） (2024-10-30T10:11:53Z)
Towards Learning Abductive Reasoning using VSA Distributed Representations [56.31867341825068]
本稿では,文脈認識モデルを用いた帰納的ルール学習手法を提案する。 ARLCは、誘引的推論のための、新しくより広く適用可能な訓練目標を特徴としている。プログラムされた知識の上に実例から漸進的に学習することで,ARLCのポストプログラミングトレーニングに対する堅牢性を示す。
論文参考訳（メタデータ） (2024-06-27T12:05:55Z)
Self-Retrieval: End-to-End Information Retrieval with One Large Language Model [97.71181484082663]
本稿では,新たなLLM駆動情報検索アーキテクチャであるSelf-Retrievalを紹介する。自己検索は、自己教師付き学習を通じて検索コーパスを内部化し、検索プロセスをシーケンシャルな通過生成に変換し、再ランク付けのための関連性評価を行う。
論文参考訳（メタデータ） (2024-02-23T18:45:35Z)
INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning [59.07490387145391]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な機能を示している。情報検索(IR)タスクへのそれらの適用は、自然言語における多くのIR固有の概念の頻繁な発生のため、いまだに困難である。我々は,3つの基本IRカテゴリにまたがる20のタスクを含む新しいインストラクションチューニングデータセット InterS を導入する。
論文参考訳（メタデータ） (2024-01-12T12:10:28Z)
FAIR: Flow Type-Aware Pre-Training of Compiler Intermediate Representations [36.030609139210426]
コンパイラ中間表現(IR)のためのフロー型認識事前学習モデルを提案する。具体的には、FAIRがIRトークンのセマンティクス、フロー型情報、およびIRの全体的な表現を学べるようにすることを提案する。実験の結果、FAIRは4つのコード関連下流タスクで最先端の結果を得ることができることがわかった。
論文参考訳（メタデータ） (2023-09-09T15:51:49Z)
LMs: Understanding Code Syntax and Semantics for Code Analysis [25.508254718438636]
我々は,大規模言語モデル(LLM)の機能と,ソフトウェア工学におけるコード解析の限界を評価する。 GPT4, GPT3.5, StarCoder, CodeLlama-13b-インストラクトという,最先端の4つの基礎モデルを採用している。
論文参考訳（メタデータ） (2023-05-20T08:43:49Z)
Search-in-the-Chain: Interactively Enhancing Large Language Models with Search for Knowledge-intensive Tasks [121.74957524305283]
本稿では、情報検索(IR)とLarge Language Model(LLM)のインタラクションのための、textbfSearch-in-the-Chain(SearChain)という新しいフレームワークを提案する。実験の結果、SearChainは複雑な知識集約タスクにおける最先端のベースラインを上回っていることがわかった。
論文参考訳（メタデータ） (2023-04-28T10:15:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。