Fugu-MT 論文翻訳(概要): GoEX: Perspectives and Designs Towards a Runtime for Autonomous LLM Applications

論文の概要: GoEX: Perspectives and Designs Towards a Runtime for Autonomous LLM Applications

arxiv url: http://arxiv.org/abs/2404.06921v1
Date: Wed, 10 Apr 2024 11:17:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-11 14:50:32.799382
Title: GoEX: Perspectives and Designs Towards a Runtime for Autonomous LLM Applications
Title（参考訳）: GoEX: 自律LLMアプリケーションのランタイムに向けた展望と設計
Authors: Shishir G. Patil, Tianjun Zhang, Vivian Fang, Noppapon C., Roy Huang, Aaron Hao, Martin Casado, Joseph E. Gonzalez, Raluca Ada Popa, Ion Stoica,
Abstract要約: 大きな言語モデル(LLM)は、ツールに積極的に関与し、現実世界のアプリケーションやサービスでアクションを実行するために進化しています。現在、人間はLLM生成した出力の正確さと適切性を検証し、それらを実世界の実行に投入している。コードの理解は、悪名高いほど難しいことで知られています。本稿では,人類が将来,自律LLMと効率的に協力し,委譲し,監督する方法について検討する。
参考スコア（独自算出の注目度）: 46.85306320942487
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) are evolving beyond their classical role of providing information within dialogue systems to actively engaging with tools and performing actions on real-world applications and services. Today, humans verify the correctness and appropriateness of the LLM-generated outputs (e.g., code, functions, or actions) before putting them into real-world execution. This poses significant challenges as code comprehension is well known to be notoriously difficult. In this paper, we study how humans can efficiently collaborate with, delegate to, and supervise autonomous LLMs in the future. We argue that in many cases, "post-facto validation" - verifying the correctness of a proposed action after seeing the output - is much easier than the aforementioned "pre-facto validation" setting. The core concept behind enabling a post-facto validation system is the integration of an intuitive undo feature, and establishing a damage confinement for the LLM-generated actions as effective strategies to mitigate the associated risks. Using this, a human can now either revert the effect of an LLM-generated output or be confident that the potential risk is bounded. We believe this is critical to unlock the potential for LLM agents to interact with applications and services with limited (post-facto) human involvement. We describe the design and implementation of our open-source runtime for executing LLM actions, Gorilla Execution Engine (GoEX), and present open research questions towards realizing the goal of LLMs and applications interacting with each other with minimal human supervision. We release GoEX at https://github.com/ShishirPatil/gorilla/.
Abstract（参考訳）: 大きな言語モデル(LLM)は、対話システム内で情報を提供し、ツールと積極的に関わり、現実世界のアプリケーションやサービスでアクションを実行するという古典的な役割を超えて進化しています。現在、人間はLLMが生成した出力(例えば、コード、関数、アクション)の正確さと適切性を検証する。コードの理解は、悪名高いほど難しいことで知られています。本稿では,人類が将来,自律LLMと効率的に協力し,委譲し,監督する方法について検討する。多くの場合、出力を見た後に提案されたアクションの正当性を検証する"ポストファクト検証"は、前述の"プリファクト検証"設定よりもずっと簡単である、と我々は主張する。ポストファクト検証システムを実現する中核となる概念は、直感的なundo機能の統合と、LCM生成アクションに対する損傷抑制を、関連するリスクを軽減する効果的な戦略として確立することである。これを使用すれば、人間はLSMが生成した出力の効果を戻すか、潜在的なリスクが拘束されていることを確信することができる。 LLMエージェントが、限定された(ポストファクト)人間の関与を持つアプリケーションやサービスと対話する可能性の解放は、これが重要であると私たちは信じています。 LLMアクションを実行するためのオープンソースランタイムであるGorilla Execution Engine(GoEX)の設計と実装について述べ、LLMの目標を実現するためのオープンな研究課題と、人間による最小限の監督で相互に対話するアプリケーションについて述べる。 GoEXはhttps://github.com/ShishirPatil/gorilla/でリリースしています。

関連論文リスト

A Roadmap for Tamed Interactions with Large Language Models [5.133046277847902]
大規模言語モデル(LLM)によって駆動されるAI駆動ソフトウェアが誕生するのを私たちは目撃しています。これらのLSMの応用は印象的であり、数え切れないほどに思えるが、その堅牢性は採用を妨げる。 LSLでは, LLM出力の制御, 相互作用の構造の強制, 検証, 検証, 説明可能性の両面を統合することで, 上記の限界に対処することを目指している。
論文参考訳（メタデータ） (2025-10-28T13:46:07Z)
LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge [0.0]
大規模言語モデル(LLM)は、様々なタスクにまたがる自然な応答を生成する能力を実証した。本稿では,Google,Wikipedia,DuckDuckGoなどの複数のオンラインソースを統合して,データの精度を向上させるLLM ENHANCERシステムを提案する。
論文参考訳（メタデータ） (2025-04-29T19:27:04Z)
zsLLMCode: An Effective Approach for Functional Code Embedding via LLM with Zero-Shot Learning [6.976968804436321]
大型言語モデル(LLM)はゼロショット学習の能力を持ち、訓練や微調整を必要としない。 LLMを用いた関数型コード埋め込みを生成する新しいアプローチであるzsLLMCodeを提案する。
論文参考訳（メタデータ） (2024-09-23T01:03:15Z)
Are you still on track!? Catching LLM Task Drift with Activations [55.75645403965326]
タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳（メタデータ） (2024-06-02T16:53:21Z)
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [70.09561665520043]
本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。強化学習における重み付き回帰を多エージェントシステムに拡張して理論的解析を行う。 Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文参考訳（メタデータ） (2024-05-23T08:33:19Z)
Empowering Large Language Models on Robotic Manipulation with Affordance Prompting [23.318449345424725]
大規模な言語モデルは、制御シーケンスを適切に生成することで物理世界と相互作用することができない。既存のLLMベースのアプローチでは、事前定義されたスキルや事前訓練されたサブ政治に頼ることでこの問題を回避することができる。サブタスクプランナとモーションコントローラの両方をLLM+A(ffordance)と呼ぶフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-17T03:06:32Z)
Executable Code Actions Elicit Better LLM Agents [76.95566120678787]
この研究は、Pythonコードを使用して、Large Language Model(LLM)エージェントのアクションを統一されたアクション空間(CodeAct)に統合することを提案する。 Pythonインタプリタと統合されたCodeActは、コードアクションを実行し、事前アクションを動的に修正したり、マルチターンインタラクションを通じて新しい観察に新しいアクションを発行することができる。 CodeActのパフォーマンス向上は、解釈可能なコードを実行し、自然言語を使ってユーザとコラボレーションすることで、環境と対話するオープンソースのLLMエージェントを構築する動機となります。
論文参考訳（メタデータ） (2024-02-01T21:38:58Z)
Low-code LLM: Graphical User Interface over Large Language Models [115.08718239772107]
本稿では,人間-LLMインタラクションフレームワークであるLow-code LLMを紹介する。より制御可能で安定した応答を実現するために、6種類のシンプルなローコードビジュアルプログラミングインタラクションを組み込んでいる。ユーザフレンドリなインタラクション,制御可能な生成,広い適用性という,低コード LLM の3つの利点を強調した。
論文参考訳（メタデータ） (2023-04-17T09:27:40Z)
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback [127.75419038610455]
大規模言語モデル(LLM)は、ダウンストリームタスクの多くに対して、人間のような、流動的な応答を生成することができる。本稿では,プラグ・アンド・プレイモジュールのセットでブラックボックスのLSMを増強するLSM-Augmenterシステムを提案する。
論文参考訳（メタデータ） (2023-02-24T18:48:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。