論文の概要: Distribution-Aware Algorithm Design with LLM Agents
- arxiv url: http://arxiv.org/abs/2605.14141v1
- Date: Wed, 13 May 2026 21:47:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.513377
- Title: Distribution-Aware Algorithm Design with LLM Agents
- Title(参考訳): LLMエージェントを用いた分布認識アルゴリズムの設計
- Authors: Saharsh Koganti, Priyadarsi Mishra, Pierfrancesco Beneventano, Tomer Galanti,
- Abstract要約: 学習対象が計算ではなく実行可能なコードである場合の学習について検討する。
未知のタスク分布からのサンプルが与えられた場合、学習者はソリューションの品質と実行時間の両方で、新鮮なインスタンスで評価されたコードを返す。
固定ライブラリのサンプル解法が, 精度と実行時間の両方で一般化されることを実証する。
- 参考スコア(独自算出の注目度): 6.525313911330893
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study learning when the learned object is executable solver code rather than a predictor. In this setting, correctness is not enough: two solvers may both return valid solutions on the deployment distribution while differing substantially in runtime. Given samples from an unknown task distribution, the learner returns code evaluated on fresh instances by both solution quality and execution time. Our central abstraction is a \emph{solver hint}: reusable structure inferred from samples and compiled into specialized solver code. We prove that the empirically fastest sample-consistent solver from a fixed library generalizes in both correctness and runtime, and that statistically identifiable hints can be recovered and compiled from polynomially many samples. Empirically, we instantiate the framework with LLM code agents on \(21\) structured combinatorial-optimization target distributions across seven problem classes. The synthesized solvers reach mean normalized quality \(0.971\), improve by \(+0.224\) over the average heuristic pool and by \(+0.098\) over the highest-quality heuristic, and are \(336.9\times\), \(342.8\times\), and \(16.1\times\) faster than the quality-best heuristic, Gurobi, and the selected time-limited exact backend, respectively. On released PACE 2025 Dominating Set private instances, the synthesized solver is valid on all \(100\) graphs and runs about two orders of magnitude faster than top competition solvers, with a moderate quality gap. Inspection shows that many gains come from changing the computational scale: replacing ambient exponential search or general-purpose optimization with compiled distribution-specific computation.
- Abstract(参考訳): 我々は,学習対象が予測器ではなく,実行可能なソルバコードである場合の学習について検討する。
この設定では、正確さは十分ではない: 2つのソルバはどちらも、実行時に大きく異なるが、デプロイメントディストリビューションで有効なソリューションを返すことができる。
未知のタスク分布からのサンプルが与えられた場合、学習者はソリューションの品質と実行時間の両方で、新鮮なインスタンスで評価されたコードを返す。
我々の中心的な抽象化は \emph{solver hint}: サンプルから推論され、特別なソルバコードにコンパイルされた再利用可能な構造です。
固定ライブラリのサンプル一貫性解法は, 精度と実行時間の両方で一般化し, 統計的に同定可能なヒントを多項式的に多くのサンプルから復元し, コンパイルできることを実証する。
経験的には、7つの問題クラスにまたがる組合せ最適化対象分布に対して,LLMコードエージェントを用いてフレームワークをインスタンス化する。
合成された解法は平均的ヒューリスティックプールより平均正規化品質 \(0.971\) 、最高品質ヒューリスティックプールより平均値 \(+0.224\) 、最高品質ヒューリスティックプールより平均値 \(+0.098\) 、最高品質ヒューリスティックプールより平均値 \(336.9\times\), \(342.8\times\), \(16.1\times\) となる。
リリースされた PACE 2025 Dominate Set のプライベートインスタンスでは、合成されたソルバはすべての \(100\) グラフ上で有効であり、上位のソルバよりも約 2 桁高速に動作し、中程度の品質差がある。
インスペクションは、周辺指数探索や汎用最適化をコンパイルされた分布固有計算に置き換えるなど、計算スケールの変更によって多くの利益が得られたことを示している。
関連論文リスト
- Sample, Don't Search: Rethinking Test-Time Alignment for Language Models [55.2480439325792]
新しいテストタイムアライメントアプローチであるQAlignを紹介します。
テスト時間計算をスケールする際、QAlignは各プロンプトの最適配向分布からのサンプリングに収束する。
マルコフ連鎖モンテカルロのテキスト生成における最近の進歩を取り入れることで、基礎となるモデルを変更したり、ロジットアクセスを必要とせずに、より良い整合出力を可能にする。
論文 参考訳(メタデータ) (2025-04-04T00:41:40Z) - Adaptive Sampled Softmax with Inverted Multi-Index: Methods, Theory and Applications [79.53938312089308]
MIDX-Samplerは、逆多重インデックスアプローチに基づく新しい適応型サンプリング戦略である。
本手法は, サンプリングバイアス, 勾配バイアス, 収束速度, 一般化誤差境界などの重要な問題に対処するため, 厳密な理論的解析によって裏付けられている。
論文 参考訳(メタデータ) (2025-01-15T04:09:21Z) - Provable Scaling Laws for the Test-Time Compute of Large Language Models [84.00141420901038]
本研究では,大規模言語モデルのテスト時間計算において,証明可能なスケーリング法則を享受する2つのアルゴリズムを提案する。
1つは2段階ノックアウト方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
もう1つは2段階のリーグ方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
論文 参考訳(メタデータ) (2024-11-29T05:29:47Z) - Learning distributed representations with efficient SoftMax normalization [3.8673630752805437]
有界ノルムを持つ埋め込みベクトルに対して$rm SoftMax(XYT)$の正規化定数を計算する線形時間近似を提案する。
本稿では,提案手法が競合手法よりも高い精度あるいは同等の精度を達成できるような事前学習した埋め込みデータセットについて述べる。
提案アルゴリズムは解釈可能で,任意の埋め込み問題に容易に適応できる。
論文 参考訳(メタデータ) (2023-03-30T15:48:26Z) - M-L2O: Towards Generalizable Learning-to-Optimize by Test-Time Fast
Self-Adaptation [145.7321032755538]
L2O(Learning to Optimize)は、複雑なタスクの最適化手順を著しく加速させるため、注目を集めている。
本稿では, アウト・オブ・ディストリビューションタスクへの高速なテスト時間自己適応を実現するL2Oをメタトレーニングすることで, このオープンな課題に対する潜在的な解決策を検討する。
論文 参考訳(メタデータ) (2023-02-28T19:23:20Z) - Global and Preference-based Optimization with Mixed Variables using Piecewise Affine Surrogates [0.6083861980670925]
本稿では,線形制約付き混合変数問題の解法として,新しいサロゲートに基づく大域的最適化アルゴリズムを提案する。
提案手法は, 目的関数の断片的なアフィンサロゲートを, 実現可能なサンプル上に構築することに基づいている。
この2つのアルゴリズムは、制約なしおよび制約付き混合変数ベンチマーク問題に対して評価される。
論文 参考訳(メタデータ) (2023-02-09T15:04:35Z) - Efficient Global Optimization of Two-Layer ReLU Networks: Quadratic-Time Algorithms and Adversarial Training [8.169499497403102]
人工知能(ANN)ランドスケープの非制約性は、本質的に最適化上の困難をもたらす。
我々は,ANNをグローバル収束保証で訓練する2つの効率的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-01-06T08:24:11Z) - ML Supported Predictions for SAT Solvers Performance [0.0]
内部のソルバランタイムパラメータが収集され、分析されている。
問題解決者の終了動作のバイナリ分類のための機械学習モデルが作成されている。
論文 参考訳(メタデータ) (2021-12-17T11:17:29Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。