Fugu-MT 論文翻訳(概要): Oracular Programming: A Modular Foundation for Building LLM-Enabled Software

論文の概要: Oracular Programming: A Modular Foundation for Building LLM-Enabled Software

arxiv url: http://arxiv.org/abs/2502.05310v1
Date: Fri, 07 Feb 2025 20:24:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-11 18:57:49.332483
Title: Oracular Programming: A Modular Foundation for Building LLM-Enabled Software
Title（参考訳）: Oracular Programming: LLM対応ソフトウェア構築のためのモジュラー基盤
Authors: Jonathan Laurent, André Platzer,
Abstract要約: 大規模な言語モデルは、少数の例から幅広いタスクを解くのに驚くほど効果的であることが証明された。信頼性とモジュラリティの欠如は、多くの推論ステップを必要とする大きな問題に対処する能力を制限する。ドメインの専門家が高レベルな問題解決戦略を表現できるようにLCM対応アプリケーションを構築するための基礎パラダイムである分子プログラミングを提案する。
参考スコア（独自算出の注目度）: 5.294604210205507
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large Language Models have proved surprisingly effective at solving a wide range of tasks from just a handful of examples. However, their lack of reliability and modularity limits their capacity to tackle large problems that require many steps of reasoning. In response, researchers have proposed advanced pipelines that leverage domain-specific knowledge to chain smaller prompts, provide intermediate feedback and improve performance through search. However, the current complexity of writing, tuning, maintaining and improving such pipelines has limited their sophistication. We propose oracular programming, a foundational paradigm for building LLM-enabled applications that lets domain experts express high-level problem-solving strategies as programs with unresolved choice points. These choice points are resolved at runtime by LLMs, which generalize from user-provided examples of correct and incorrect decisions. An oracular program is composed of three orthogonal components: a strategy that consists in a nondeterministic program with choice points that can be reified into a search tree, a policy that specifies how to navigate this tree with the help of LLM oracles, and a set of demonstrations that describe successful and unsuccessful search tree navigation scenarios across diverse problem instances. Each component is expressed in a dedicated programming language and can be independently improved or substituted. We address the key programming language design challenges of modularly composing oracular programs and enforcing consistency between their components as they evolve.
Abstract（参考訳）: 大規模な言語モデルは、少数の例から幅広いタスクを解くのに驚くほど効果的であることが証明された。しかし、信頼性とモジュラリティの欠如は、多くの推論ステップを必要とする大きな問題に対処する能力を制限する。これに対し、研究者はドメイン固有の知識を活用して、より小さなプロンプトをチェーンし、中間的なフィードバックを提供し、検索によるパフォーマンスを向上させる高度なパイプラインを提案している。しかし、そのようなパイプラインの記述、チューニング、保守、改善の現在の複雑さは、その洗練度を制限している。ドメインの専門家が未解決の選択ポイントを持つプログラムとして高レベルな問題解決戦略を表現できるように、LLM対応アプリケーションを構築するための基礎パラダイムである分子プログラミングを提案する。これらの選択点は LLM によって実行時に解決される。論理プログラムは3つの直交的要素から構成される: 選択点を持つ非決定的プログラムからなる戦略と、LLMオーラクルの助けを借りてこのツリーをナビゲートする方法を規定するポリシーと、様々な問題インスタンスで成功し失敗する探索ツリーナビゲーションシナリオを記述する一連のデモである。各コンポーネントは専用のプログラミング言語で表現され、独立して改善や置換が可能である。分子プログラムをモジュール的に構成し、進化するにつれてコンポーネント間の一貫性を強制する重要なプログラミング言語設計課題に対処する。

関連論文リスト

Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文参考訳（メタデータ） (2024-11-21T04:23:17Z)
Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.667202878390526]
長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文参考訳（メタデータ） (2024-06-19T00:28:58Z)
Synthesizing Programmatic Reinforcement Learning Policies with Large Language Model Guided Search [7.769411917500852]
LLM誘導検索フレームワーク(LLM-GS)について紹介する。我々の重要な洞察は、LLMのプログラミングの専門知識と常識推論を活用して、仮定不要でランダムな探索手法の効率を高めることである。本研究では,プログラム探索空間を効率的に探索し,一貫したプログラムを改善するための探索アルゴリズムであるSchduled Hill Climbingを開発した。
論文参考訳（メタデータ） (2024-05-26T06:33:48Z)
If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練されるコードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文参考訳（メタデータ） (2024-01-01T16:51:20Z)
LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language Models [56.25156596019168]
本稿では,LMRL-Gymベンチマークを用いて,大規模言語モデル(LLM)のマルチターンRLの評価を行う。我々のベンチマークは8つの異なる言語タスクで構成されており、複数ラウンドの言語相互作用が必要であり、オープンエンド対話やテキストゲームにおける様々なタスクをカバーする。
論文参考訳（メタデータ） (2023-11-30T03:59:31Z)
CoLadder: Supporting Programmers with Hierarchical Code Generation in Multi-Level Abstraction [16.325032481071997]
CoLadderは、階層的なタスク分解、直接コードセグメント操作、結果評価を容易にすることで、プログラマをサポートするシステムである。 12人の経験豊富なプログラマによるユーザスタディでは、CoLadderがプログラマの問題解決意図を柔軟に外部化するのに有効であることが示された。
論文参考訳（メタデータ） (2023-10-12T20:07:01Z)
CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文参考訳（メタデータ） (2023-09-29T17:40:26Z)
When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文参考訳（メタデータ） (2023-08-29T17:22:39Z)
ANPL: Towards Natural Programming with Interactive Decomposition [33.58825633046242]
我々は,ユーザが常に生成したコードを洗練できるように,対話型ANPLシステムを導入する。 ANPLプログラムは、それが満たさなければならない入力出力のセットで構成される。ユーザは、スケッチを変更し、穴を記述するのに使用される言語を変更したり、特定の穴に追加の入力出力を提供することで、ANPLプログラムを更新する。
論文参考訳（メタデータ） (2023-05-29T14:19:40Z)
CREATOR: Tool Creation for Disentangling Abstract and Concrete Reasoning of Large Language Models [74.22729793816451]
大規模言語モデル(LLM)はツールの利用において大きな進歩を遂げているが、その能力はAPIの可用性によって制限されている。我々は、LCMがドキュメンテーションとコード実現を使って独自のツールを作成できる新しいフレームワークCREATORを提案する。我々は,MATH と TabMWP のベンチマークで CREATOR を評価する。
論文参考訳（メタデータ） (2023-05-23T17:51:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。