論文の概要: ALLOY: Generating Reusable Agent Workflows from User Demonstration
- arxiv url: http://arxiv.org/abs/2510.10049v1
- Date: Sat, 11 Oct 2025 06:30:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.750463
- Title: ALLOY: Generating Reusable Agent Workflows from User Demonstration
- Title(参考訳): ALLOY: ユーザデモから再利用可能なエージェントワークフローを生成する
- Authors: Jiawen Li, Zheng Ning, Yuan Tian, Toby Jia-jun Li,
- Abstract要約: 大規模言語モデル(LLM)により、エンドユーザは自然言語を介して複雑なタスクを自律エージェントに委譲できる。
ユーザは、タスクの手続き的な要件を指定するのに苦労することが多い。
あるタスクに対する'successful'プロンプトは、同じタスクで再利用できないし、一般化できないこともある。
- 参考スコア(独自算出の注目度): 17.329536879065788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) enable end-users to delegate complex tasks to autonomous agents through natural language. However, prompt-based interaction faces critical limitations: Users often struggle to specify procedural requirements for tasks, especially those that don't have a factually correct solution but instead rely on personal preferences, such as posting social media content or planning a trip. Additionally, a ''successful'' prompt for one task may not be reusable or generalizable across similar tasks. We present ALLOY, a system inspired by classical HCI theories on Programming by Demonstration (PBD), but extended to enhance adaptability in creating LLM-based web agents. ALLOY enables users to express procedural preferences through natural demonstrations rather than prompts, while making these procedures transparent and editable through visualized workflows that can be generalized across task variations. In a study with 12 participants, ALLOY's demonstration--based approach outperformed prompt-based agents and manual workflows in capturing user intent and procedural preferences in complex web tasks. Insights from the study also show how demonstration--based interaction complements the traditional prompt-based approach.
- Abstract(参考訳): 大規模言語モデル(LLM)により、エンドユーザは自然言語を介して複雑なタスクを自律エージェントに委譲できる。
しかし、プロンプトベースのインタラクションは、重要な制限に直面している: ユーザーは、特に実際に正しい解決策を持っていない、代わりにソーシャルメディアコンテンツを投稿したり、旅行を計画したりといった個人的な好みに依存しているタスクの手続き的要件を特定するのに苦労する。
さらに、あるタスクに対する'successful'プロンプトは、同様のタスクで再利用できないし、一般化できないこともある。
本稿では,従来のプログラミングによるHCI理論にインスパイアされたシステムであるALLOYについて述べる。
ALLOYを使うと、ユーザーはプロンプトではなく自然なデモを通じて手続き的な好みを表現できる。
12人の参加者を対象にした調査で、ALLOYのデモベースのアプローチは、複雑なWebタスクにおけるユーザの意図と手続き的嗜好を捉える上で、プロンプトベースのエージェントや手動ワークフローよりも優れていた。
この研究から得られた洞察は、デモベースのインタラクションが従来のプロンプトベースのアプローチを補完することを示す。
関連論文リスト
- SignalLLM: A General-Purpose LLM Agent Framework for Automated Signal Processing [36.22027224597969]
大規模言語モデル(LLM)は、強力な推論能力、幅広い汎用知識、文脈内学習、モーダル間伝達能力を提供する。
本稿では,SPタスクのための汎用LLMベースのエージェントフレームワークであるSignalLLMを紹介する。
コミュニケーションとセンシングにおける5つの代表的なタスクを通して,SignalLLMの汎用性と有効性を示す。
論文 参考訳(メタデータ) (2025-09-21T18:54:54Z) - TORSO: Template-Oriented Reasoning Towards General Tasks [23.681707595200265]
テンプレート指向推論(TORSO)を導入し、内部推論能力を利用して、手動で数ショットの例を作成することなく、様々なタスクにまたがる適切な応答を生成するモデルを提案する。
実験の結果,TORSO は多種多様な LLM ベンチマークにおいて,合理的な有理性で高い性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-09-11T13:31:35Z) - DICE: Dynamic In-Context Example Selection in LLM Agents via Efficient Knowledge Transfer [50.64531021352504]
インコンテキスト学習(ICL)によって強化された大規模言語モデルベースエージェントは、複雑な推論やツール使用タスクにおいて強力な能力を示している。
既存のアプローチは典型的には、エージェントやマルチステップの設定を含むサンプルの選択に依存している。
推論の各ステップにおいて最も関連性の高い実演を選択できるエージェントタスクのための理論的に基礎付けられた ICL フレームワーク DICE を提案する。
論文 参考訳(メタデータ) (2025-07-31T13:42:14Z) - Thought-Augmented Planning for LLM-Powered Interactive Recommender Agent [56.61028117645315]
本稿では,蒸留した思考パターンを通じて複雑なユーザ意図に対処する,思考増強型対話型推薦エージェントシステム(TAIRA)を提案する。
具体的には、ユーザニーズを分解し、サブタスクを計画することでレコメンデーションタスクを編成するマネージャエージェントを備えたLLM方式のマルチエージェントシステムとして設計されている。
複数のデータセットにまたがる包括的な実験により、IRAは既存の手法に比べて大幅に性能が向上した。
論文 参考訳(メタデータ) (2025-06-30T03:15:50Z) - PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time [87.99027488664282]
PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。
パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。
テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
論文 参考訳(メタデータ) (2025-06-06T17:29:49Z) - Many Hands Make Light Work: Task-Oriented Dialogue System with Module-Based Mixture-of-Experts [9.129081545049992]
タスク指向対話システムは事前学習言語モデル(PLM)の恩恵を受けている
ソフト混合型タスク指向対話システム(SMETOD)を提案する。
SMETODは、Mixture-of-Experts(MoEs)のアンサンブルを利用してサブプロブレムを最適化し、タスク指向対話のための特殊な出力を生成する。
我々は,意図予測,対話状態追跡,対話応答生成という3つのベンチマーク機能に対して,我々のモデルを広範囲に評価した。
論文 参考訳(メタデータ) (2024-05-16T01:02:09Z) - Towards Generalist Prompting for Large Language Models by Mental Models [105.03747314550591]
大規模言語モデル(LLM)は多くのタスクにおいて素晴らしいパフォーマンスを示している。
最適な性能を達成するには、特別に設計されたプロンプト法が必要である。
本稿では,最適あるいは準最適性能を実現する設計原理に基づくジェネラリストプロンプトの概念を紹介する。
論文 参考訳(メタデータ) (2024-02-28T11:29:09Z) - Eliciting Human Preferences with Language Models [56.68637202313052]
言語モデル(LM)は、ラベル付き例や自然言語のプロンプトを使用してターゲットタスクを実行するように指示することができる。
タスク仕様プロセスのガイドには*LM自身を使うことを提案します。
我々は、メール検証、コンテンツレコメンデーション、道徳的推論の3つの領域でGATEを研究している。
論文 参考訳(メタデータ) (2023-10-17T21:11:21Z) - Improving Task Generalization via Unified Schema Prompt [87.31158568180514]
Unified Promptはフレキシブルでプロンプトの手法で、タスク入力スキーマに従って各タスクの学習可能なプロンプトを自動的にカスタマイズする。
異なるタスクスキーマの特徴を維持しながら、タスク間の共有知識をモデル化する。
このフレームワークは、8つのタスクタイプから下流に見えない16のタスクに対して、強力なゼロショットと少数ショットのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-05T15:26:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。