論文の概要: Rethinking Code Similarity for Automated Algorithm Design with LLMs
- arxiv url: http://arxiv.org/abs/2603.02787v1
- Date: Tue, 03 Mar 2026 09:25:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.730516
- Title: Rethinking Code Similarity for Automated Algorithm Design with LLMs
- Title(参考訳): LLMを用いた自動アルゴリズム設計のためのコード類似性の再考
- Authors: Rui Zhang, Zhichao Lu,
- Abstract要約: 大言語モデルに基づく自動アルゴリズム設計(LLM-AAD)は、専門家レベルのアルゴリズムのコード実装を自律的に生成することでアルゴリズム開発を変革した。
本稿では,問題解決行動のレンズを通して,アルゴリズムの類似性を測定する新しい手法であるBehaveSimを提案する。
動的時間ワープ(DTW)を使用してPSTrajs間のアライメントを定量化することにより、BehaveSimは、構文的あるいは出力レベルの類似性にもかかわらず、分岐論理によるアルゴリズムを区別する。
- 参考スコア(独自算出の注目度): 16.918736214353814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of Large Language Model-based Automated Algorithm Design (LLM-AAD) has transformed algorithm development by autonomously generating code implementations of expert-level algorithms. Unlike traditional expert-driven algorithm development, in the LLM-AAD paradigm, the main design principle behind an algorithm is often implicitly embedded in the generated code. Therefore, assessing algorithmic similarity directly from code, distinguishing genuine algorithmic innovation from mere syntactic variation, becomes essential. While various code similarity metrics exist, they fail to capture algorithmic similarity, as they focus on surface-level syntax or output equivalence rather than the underlying algorithmic logic. We propose BehaveSim, a novel method to measure algorithmic similarity through the lens of problem-solving behavior as a sequence of intermediate solutions produced during execution, dubbed as problem-solving trajectories (PSTrajs). By quantifying the alignment between PSTrajs using dynamic time warping (DTW), BehaveSim distinguishes algorithms with divergent logic despite syntactic or output-level similarities. We demonstrate its utility in two key applications: (i) Enhancing LLM-AAD: Integrating BehaveSim into existing LLM-AAD frameworks (e.g., FunSearch, EoH) promotes behavioral diversity, significantly improving performance on three AAD tasks. (ii) Algorithm analysis: BehaveSim clusters generated algorithms by behavior, enabling systematic analysis of problem-solving strategies--a crucial tool for the growing ecosystem of AI-generated algorithms. Data and code of this work are open-sourced at https://github.com/RayZhhh/behavesim.
- Abstract(参考訳): 大規模言語モデルに基づく自動アルゴリズム設計(LLM-AAD)の台頭は、専門家レベルのアルゴリズムのコード実装を自律的に生成することによって、アルゴリズム開発を変革した。
従来の専門家主導のアルゴリズム開発とは異なり、LLM-AADパラダイムでは、アルゴリズムの背後にある主要な設計原則は、しばしば生成されたコードに暗黙的に埋め込まれる。
したがって、コードから直接アルゴリズム的類似性を評価し、真のアルゴリズム的革新と単なる構文的変動を区別することが不可欠である。
様々なコード類似度指標が存在するが、基礎となるアルゴリズム論理よりも表面レベルの構文や出力等価性に注目しているため、アルゴリズムの類似度を捉えることができない。
本稿では,PSTrajsと呼ばれる,実行中に生成する中間解の列として,問題解決行動のレンズを通してアルゴリズムの類似性を測定する新しい手法であるBehaveSimを提案する。
動的時間ワープ(DTW)を使用してPSTrajs間のアライメントを定量化することにより、BehaveSimは、構文的あるいは出力レベルの類似性にもかかわらず、分岐論理によるアルゴリズムを区別する。
私たちはそのユーティリティを2つの重要なアプリケーションで示します。
i) LLM-AAD の強化: BehaveSim を既存の LLM-AAD フレームワーク (例: FunSearch, EoH) に統合することで、振る舞いの多様性が促進され、3つの AAD タスクのパフォーマンスが大幅に向上する。
(ii)アルゴリズム分析:AI生成アルゴリズムのエコシステムを成長させる上で重要なツールである,問題解決戦略の体系的分析を可能にする,行動によって生成されたアルゴリズムをBehaveSimクラスタ化する。
この作業のデータとコードはhttps://github.com/RayZhhh/behavesim.comで公開されている。
関連論文リスト
- Towards a Measure of Algorithm Similarity [0.0]
同じ問題に対して2つのアルゴリズムが与えられた場合、それらが有意に異なるかどうかを判断できるだろうか?
本稿では,アルゴリズムの実装を下流タスクに適した機能空間に組み込む評価メモリ・操作・複雑度フレームワークEMOCを紹介する。
検証済みPython実装のキュレートされたデータセットであるPACDを3つの問題に分けてコンパイルし、EMOCがクラスタリングとアルゴリズム型の分類、ほぼ重複の検出、LCM生成プログラムにおける多様性の定量化をサポートすることを示す。
論文 参考訳(メタデータ) (2025-10-31T00:20:54Z) - Experience-Guided Reflective Co-Evolution of Prompts and Heuristics for Automatic Algorithm Design [124.54166764570972]
組合せ最適化問題は伝統的に手作りのアルゴリズムで取り組まれている。
最近の進歩は、大規模言語モデルによる自動設計の可能性を強調している。
本稿では,自動アルゴリズム設計のためのPmpt and Heuristics (EvoPH) を用いた経験進化的リフレクティブ・ガイドを提案する。
論文 参考訳(メタデータ) (2025-09-29T09:24:09Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - AlgOS: Algorithm Operating System [2.5352713493505785]
AlgOSはアルゴリズムの実装のためのモジュール化されていないフレームワークである。
新しいアルゴリズムの実装のオーバーヘッドを減らし、アルゴリズムの比較を標準化するように設計されている。
論文 参考訳(メタデータ) (2025-04-07T10:36:46Z) - Designing Algorithms Empowered by Language Models: An Analytical Framework, Case Studies, and Insights [86.06371692309972]
本研究では,大規模言語モデル(LLM)に基づくアルゴリズムの設計と解析のための分析フレームワークを提案する。
提案する枠組みは頭痛を緩和する試みとして機能する。
論文 参考訳(メタデータ) (2024-07-20T07:39:07Z) - From Optimization to Control: Quasi Policy Iteration [2.0769172070951067]
準政治反復(QPI)と呼ばれる新しい制御アルゴリズムを提案する。
QPIは、MDP特有の2つの線形構造制約を利用し、遷移確率カーネルの事前情報を組み込むことができる。
論文 参考訳(メタデータ) (2023-11-18T21:00:14Z) - Stochastic Ratios Tracking Algorithm for Large Scale Machine Learning
Problems [0.7614628596146599]
古典的なSGDフレームワークにおける適応的なステップ長選択のための新しいアルゴリズムを提案する。
妥当な条件下では、アルゴリズムは十分に確立された理論的な要件に従ってステップ長を生成する。
このアルゴリズムは,手動チューニングから得られる最良ステップ長に匹敵するステップ長を生成することができることを示す。
論文 参考訳(メタデータ) (2023-05-17T06:22:11Z) - Identifying Co-Adaptation of Algorithmic and Implementational
Innovations in Deep Reinforcement Learning: A Taxonomy and Case Study of
Inference-based Algorithms [15.338931971492288]
我々は、アルゴリズムの革新と実装決定を分離するために、一連の推論に基づくアクター批判アルゴリズムに焦点を当てる。
実装の詳細がアルゴリズムの選択に一致すると、パフォーマンスが大幅に低下します。
結果は、どの実装の詳細がアルゴリズムと共適応され、共進化しているかを示す。
論文 参考訳(メタデータ) (2021-03-31T17:55:20Z) - A Two-stage Framework and Reinforcement Learning-based Optimization
Algorithms for Complex Scheduling Problems [54.61091936472494]
本稿では、強化学習(RL)と従来の運用研究(OR)アルゴリズムを組み合わせた2段階のフレームワークを開発する。
スケジューリング問題は,有限マルコフ決定過程 (MDP) と混合整数計画過程 (mixed-integer programming process) の2段階で解決される。
その結果,本アルゴリズムは,アジャイルな地球観測衛星スケジューリング問題に対して,安定かつ効率的に十分なスケジューリング計画を得ることができた。
論文 参考訳(メタデータ) (2021-03-10T03:16:12Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling [8.14784681248878]
本稿では,現実的なスケジューリング問題を解決するための強化学習手法を提案する。
高性能コンピューティングコミュニティにおいて一般的に実行されるアルゴリズムであるColesky Factorizationに適用する。
我々のアルゴリズムは,アクター・クリティカル・アルゴリズム (A2C) と組み合わせてグラフニューラルネットワークを用いて,問題の適応表現をオンザフライで構築する。
論文 参考訳(メタデータ) (2020-11-09T10:57:21Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。