論文の概要: Natural-Language Agent Harnesses
- arxiv url: http://arxiv.org/abs/2603.25723v1
- Date: Thu, 26 Mar 2026 17:58:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.419743
- Title: Natural-Language Agent Harnesses
- Title(参考訳): ナチュラル・ランゲージ・エージェント・ハーネス
- Authors: Linyue Pan, Lexiao Zou, Shuo Guo, Jingchen Ni, Hai-Tao Zheng,
- Abstract要約: 我々は、編集可能な自然言語でハーネスを表現するtextbfNatural-Language Agent Harnesses (NLAHs) と、明示的なアーティファクト、耐久性のあるアダプタ、軽量アダプタを通じてこれらのハーネスを実行する共有ランタイム textbfIntelligent Harness (IHR) を紹介する。
- 参考スコア(独自算出の注目度): 9.79040667445465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agent performance increasingly depends on \emph{harness engineering}, yet harness design is usually buried in controller code and runtime-specific conventions, making it hard to transfer, compare, and study as a scientific object. We ask whether the high-level control logic of an agent harness can instead be externalized as a portable executable artifact. We introduce \textbf{Natural-Language Agent Harnesses} (NLAHs), which express harness behavior in editable natural language, and \textbf{Intelligent Harness Runtime} (IHR), a shared runtime that executes these harnesses through explicit contracts, durable artifacts, and lightweight adapters. Across coding and computer-use benchmarks, we conduct controlled evaluations of operational viability, module ablation, and code-to-text harness migration.
- Abstract(参考訳): エージェントのパフォーマンスはますます \emph{harness engineering} に依存しているが、通常、設計はコントローラコードや実行時固有の規約に埋もれており、科学的な対象として転送、比較、研究が困難である。
エージェントハーネスの高レベル制御ロジックを、ポータブルな実行可能アーティファクトとして外部化できるかどうかを問う。
我々は、編集可能な自然言語でハーネスを表現した \textbf{Natural-Language Agent Harnesses} (NLAHs) と、明示的なコントラクト、耐久性のあるアーティファクト、軽量なアダプタを通じてこれらのハーネスを実行する共有ランタイムである \textbf{Intelligent Harness Runtime} (IHR) を紹介する。
プログラミングとコンピュータ利用のベンチマークを通じて,操作可能性,モジュールアブレーション,コード・ツー・テキスト・ハーネス・マイグレーションの制御評価を行う。
関連論文リスト
- Ground-Compose-Reinforce: Grounding Language in Agentic Behaviours using Limited Data [17.614395125762304]
認識と行動における接地言語は、人間や他のエージェントと対話できる位置にあるエージェントを構築する上で、言語を介して重要な課題である。
高レベルタスク仕様から直接RLエージェントを訓練するためのエンドツーエンドのニューロシンボリックフレームワークであるGround-Compose-Reinforceを提案する。
論文 参考訳(メタデータ) (2025-07-14T19:05:15Z) - CIE: Controlling Language Model Text Generations Using Continuous Signals [19.55268309121786]
我々は、LMが「低」トークンと「高」トークンの埋め込みの間に補間される制御ベクトルを期待するように微調整できることを示す。
本手法は,制御信号を離散信号として表現する文脈内学習法や微調整法よりも応答長制御をより確実に行う。
論文 参考訳(メタデータ) (2025-05-19T17:59:58Z) - DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation [57.07295906718989]
制約付き復号法は,事前訓練された大言語(Ms と PLMs)が生成するテキストの意味やスタイルを,推論時に様々なタスクに対して制御することを目的としている。
これらの方法は、しばしば、欲求的かつ明示的にターゲットを選択することによって、もっともらしい連続を導く。
認知二重プロセス理論に着想を得て,新しい復号化フレームワークDECDERを提案する。
論文 参考訳(メタデータ) (2024-03-04T11:49:08Z) - Successor Features for Efficient Multisubject Controlled Text Generation [48.37713738712319]
本稿では,後継機能 (SF) と言語モデル修正の2つの基本概念を基礎とするSF-GENを紹介する。
SF-GENはこの2つをシームレスに統合し、LCMのパラメータを変更することなくテキスト生成の動的ステアリングを可能にする。
我々の知る限り、本研究はテキスト生成における後継機能の最初の応用である。
論文 参考訳(メタデータ) (2023-11-03T00:17:08Z) - ETHER: Aligning Emergent Communication for Hindsight Experience Replay [0.1747623282473278]
自然言語条件強化学習(RL)エージェントは、構成性などの自然言語の性質が、複雑な政策を学ぶための強い帰納バイアスをもたらすことを示した。
Hindsight Experience Replay (HER)と言語コンディショニングの利点を組み合わせたHIGhERのような以前のアーキテクチャは、スパース報酬環境に対処する。
本研究では,BabyAIベンチマークの目標記述に使用される自然言語と一致した人工言語が出現することを示す。
論文 参考訳(メタデータ) (2023-07-28T11:42:31Z) - AmadeusGPT: a natural language interface for interactive animal
behavioral analysis [65.55906175884748]
動作の自然言語記述をマシン実行可能なコードに変換する自然言語インタフェースであるAmadeusGPTを紹介する。
MABE 2022の動作課題タスクで最先端のパフォーマンスを実現できることを示す。
アマデウスGPTは、深い生物学的知識、大規模言語モデル、そしてコアコンピュータビジョンモジュールをより自然に知的なシステムに統合する新しい方法を提示している。
論文 参考訳(メタデータ) (2023-07-10T19:15:17Z) - Augmented Language Models: a Survey [55.965967655575454]
この調査は、言語モデル(LM)が推論スキルとツールの使用能力で強化されているかのレビューを行う。
私たちはこれらをAugmented Language Models (ALMs)と呼ぶ。
トークンの目的の欠如により、ALMは標準的な自然言語タスクを実行しながら、推論、ツールの使用、さらには行動を学ぶことができる。
論文 参考訳(メタデータ) (2023-02-15T18:25:52Z) - COLD Decoding: Energy-based Constrained Text Generation with Langevin
Dynamics [69.8062252611486]
コールドデコーディングは、既製の左から右の言語モデルに直接適用可能なフレキシブルなフレームワークである。
制約付き生成タスクの実験は、自動評価と人的評価の両方の観点から、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2022-02-23T18:59:27Z) - On-the-Fly Controlled Text Generation with Experts and Anti-Experts [70.41630506059113]
本稿では,DExperts: Decoding-time Expertsを提案する。
私たちのアンサンブルの下では、出力トークンは専門家によって可能性が高く、おそらく反専門家によってのみ高い確率を得ます。
論文 参考訳(メタデータ) (2021-05-07T01:19:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。