論文の概要: Applying an Agentic Coding Tool for Improving Published Algorithm Implementations
- arxiv url: http://arxiv.org/abs/2604.13109v1
- Date: Sat, 11 Apr 2026 03:22:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.202519
- Title: Applying an Agentic Coding Tool for Improving Published Algorithm Implementations
- Title(参考訳): アルゴリズム実装改善のためのエージェント符号化ツールの適用
- Authors: Worasait Suwannik,
- Abstract要約: 本稿では,AI支援によるアルゴリズム実装の改善のための2段階パイプラインを提案する。
最初の段階では、研究能力を持つ大規模言語モデルにより、明示的な実験基準を満たすアルゴリズムが最近公開された。
第2段階では、Claude Codeは報告されたベースラインを再現し、改善プロセスを繰り返すプロンプトを与えられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a two-stage pipeline for AI-assisted improvement of published algorithm implementations. In the first stage, a large language model with research capabilities identifies recently published algorithms satisfying explicit experimental criteria. In the second stage, Claude Code is given a prompt to reproduce the reported baseline and then iterate an improvement process. We apply this pipeline to published algorithm implementations spanning multiple research domains. Claude Code reported that all eleven experiments yielded improvements. Each improvement could be achieved within a single working day. We analyse the human contributions that remain indispensable, including selecting the target, verifying experimental validity, assessing novelty and impact, providing computational resources, and writing with appropriate AI-use disclosure. Finally, we discuss implications for peer review and academic publishing.
- Abstract(参考訳): 本稿では,AI支援によるアルゴリズム実装の改善のための2段階パイプラインを提案する。
最初の段階では、研究能力を持つ大規模言語モデルにより、明示的な実験基準を満たすアルゴリズムが最近公開された。
第2段階では、Claude Codeは報告されたベースラインを再現し、改善プロセスを繰り返すプロンプトを与えられる。
このパイプラインを複数の研究領域にまたがるアルゴリズムの実装に応用する。
Claude Codeは、11の実験がすべて改善したと報告した。
各改善は1日で達成できる。
対象の選択、実験的妥当性の検証、新規性と影響の評価、計算資源の提供、適切なAI利用開示の書込みなど、必要不可欠な人的貢献を分析します。
最後に、ピアレビューと学術出版の意義について論じる。
関連論文リスト
- Early Discoveries of Algorithmist I: Promise of Provable Algorithm Synthesis at Scale [9.349595533902479]
Algorithmistは、GitHub Copilot上の自律的な研究者エージェントである。
プライベートデータ分析およびクラスタリングにおける研究レベルのタスクについて評価する。
結果は,LLMシステムが各データセットやデプロイメント設定に合わせて,研究論文品質のアルゴリズムアーティファクトを生成する新たなパラダイムを提案する。
論文 参考訳(メタデータ) (2026-03-23T04:06:55Z) - Llama-based source code vulnerability detection: Prompt engineering vs Fine tuning [0.6588840794922407]
大規模言語モデル(LLM)は、これまでで最も高性能なAIモデルであると考えられている。
それらの性能について検討し、その効果を高めるために様々な最先端技術を適用した。
我々は最近のオープンソースのLlama-3.1 8Bを活用し、BigVulデータセットとPrimeVulデータセットからソースコードサンプルを抽出した。
論文 参考訳(メタデータ) (2025-12-09T12:08:24Z) - AlphaResearch: Accelerating New Algorithm Discovery with Language Models [60.502137348923156]
大規模言語モデルは複雑だが検証が容易な問題において大きな進歩を遂げてきたが、未知の発見に苦戦している。
オープンエンド問題に対する新しいアルゴリズムの発見を目的とした,自律型研究エージェントである textbfAlphaResearch を提示する。
論文 参考訳(メタデータ) (2025-11-11T18:03:22Z) - On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [58.60617136236957]
ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。
DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。
現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文 参考訳(メタデータ) (2025-03-28T16:25:06Z) - Towards Coarse-to-Fine Evaluation of Inference Efficiency for Large Language Models [95.96734086126469]
大規模言語モデル(LLM)は、ユーザが仕事を達成するのを助けるアシスタントとして機能し、高度なアプリケーションの開発をサポートする。
LLMの幅広い応用にとって、推論効率は重要な問題であり、既存の研究で広く研究されている。
各種コードライブラリの推論性能の粗大な解析を行う。
論文 参考訳(メタデータ) (2024-04-17T15:57:50Z) - Leveraging Data Mining Algorithms to Recommend Source Code Changes [7.959841510571622]
本論文では、4つのデータマイニングアルゴリズムを用いてソースコード変更を推奨する自動手法を提案する。
性能(精度,リコール,F測定)と実行時間の比較を行った。
Aprioriは大規模プロジェクトに適しているように見えるが、Eclatは小規模プロジェクトに適しているようだ。
論文 参考訳(メタデータ) (2023-04-29T18:38:23Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [70.45113777449373]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
既存のアルゴリズムを比較し、より良いアルゴリズムを開発する上で重要な課題は、公開された金標準データの欠如である。
研究コミュニティにリリースした類似度スコアの新しいデータセットを収集します。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Current Studies and Applications of Shuffled Frog Leaping Algorithm: A
Review [28.522595817273295]
Shuffled Frog Leaping Algorithm (SFLA) は2006年に Eusuff と Lansey によって開発された。
SFLAは、メメティクスの利点と粒子群最適化を組み合わせた、人口ベースメタヒューリスティックアルゴリズムである。
様々な分野で、特に実装と限定変数のために工学的な問題に使われている。
論文 参考訳(メタデータ) (2022-01-27T13:26:26Z) - Identifying Co-Adaptation of Algorithmic and Implementational
Innovations in Deep Reinforcement Learning: A Taxonomy and Case Study of
Inference-based Algorithms [15.338931971492288]
我々は、アルゴリズムの革新と実装決定を分離するために、一連の推論に基づくアクター批判アルゴリズムに焦点を当てる。
実装の詳細がアルゴリズムの選択に一致すると、パフォーマンスが大幅に低下します。
結果は、どの実装の詳細がアルゴリズムと共適応され、共進化しているかを示す。
論文 参考訳(メタデータ) (2021-03-31T17:55:20Z) - Implementation Matters in Deep Policy Gradients: A Case Study on PPO and
TRPO [90.90009491366273]
本稿では,2つの一般的なアルゴリズムのケーススタディにより,ディープポリシー勾配アルゴリズムにおけるアルゴリズムの進歩のルーツについて検討する。
具体的には,「コードレベルの最適化」の結果について検討する。
以上の結果から, (a) TRPOに対するPPOの累積報酬のほとんどを担っていることが示され, (b) RL メソッドの動作方法が根本的に変化していることが示唆された。
論文 参考訳(メタデータ) (2020-05-25T16:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。