論文の概要: TimeArena: Shaping Efficient Multitasking Language Agents in a
Time-Aware Simulation
- arxiv url: http://arxiv.org/abs/2402.05733v1
- Date: Thu, 8 Feb 2024 15:08:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 14:26:11.714706
- Title: TimeArena: Shaping Efficient Multitasking Language Agents in a
Time-Aware Simulation
- Title(参考訳): TimeArena: Time-Aware シミュレーションによる効率的なマルチタスク言語エージェントの作成
- Authors: Yikai Zhang, Siyu Yuan, Caiyu Hu, Kyle Richardson, Yanghua Xiao,
Jiangjie Chen
- Abstract要約: TimeArenaは、複雑な時間的ダイナミクスと制約を組み込んだ、新しいテキストシミュレート環境である。
TimeArenaは、料理、家庭活動、実験室の仕事で30の現実世界の仕事をこなす。
- 参考スコア(独自算出の注目度): 43.02071402274328
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite remarkable advancements in emulating human-like behavior through
Large Language Models (LLMs), current textual simulations do not adequately
address the notion of time. To this end, we introduce TimeArena, a novel
textual simulated environment that incorporates complex temporal dynamics and
constraints that better reflect real-life planning scenarios. In TimeArena,
agents are asked to complete multiple tasks as soon as possible, allowing for
parallel processing to save time. We implement the dependency between actions,
the time duration for each action, and the occupancy of the agent and the
objects in the environment. TimeArena grounds to 30 real-world tasks in
cooking, household activities, and laboratory work. We conduct extensive
experiments with various state-of-the-art LLMs using TimeArena. Our findings
reveal that even the most powerful models, e.g., GPT-4, still lag behind humans
in effective multitasking, underscoring the need for enhanced temporal
awareness in the development of language agents.
- Abstract(参考訳): LLM(Large Language Models)による人間のような行動のエミュレートの顕著な進歩にもかかわらず、現在のテキストシミュレーションは時間の概念に十分対応していない。
そこで本稿では,リアルタイム計画シナリオをよりよく反映する複雑な時間ダイナミクスと制約を組み込んだ,テキストシミュレーション環境であるtimearenaを紹介する。
TimeArenaでは、エージェントはできるだけ早く複数のタスクを完了するよう求められ、並列処理で時間を節約できる。
我々は、アクション間の依存性、各アクションの時間長、エージェントと環境内のオブジェクトの占有度を実装します。
TimeArenaは、料理、家庭活動、実験室の仕事で30の現実世界の仕事をこなす。
我々はTimeArena を用いた様々な最先端 LLM 実験を行った。
以上の結果から, GPT-4のような最も強力なモデルでさえ, 効果的なマルチタスキングにおいて人間に遅れをとっており, 言語エージェントの開発における時間的意識の向上の必要性が示唆された。
関連論文リスト
- Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Towards Robust Temporal Reasoning of Large Language Models via a
Multi-Hop QA Dataset and Pseudo-Instruction Tuning [82.62140347732284]
大規模言語モデル(LLM)には時間的知識の概念を理解することが不可欠である。
本稿では,複数質問応答と複数ホップの時間的推論に焦点をあてた複雑な時間的質問応答データセットであるComplex-TRを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:49:29Z) - Time-LLM: Time Series Forecasting by Reprogramming Large Language Models [110.20279343734548]
時系列予測は多くの実世界の力学系において重要な意味を持つ。
時系列予測のための大規模言語モデルを再利用するための再プログラミングフレームワークであるTime-LLMを提案する。
Time-LLMは、最先端の特殊な予測モデルよりも優れた、強力な時系列学習者である。
論文 参考訳(メタデータ) (2023-10-03T01:31:25Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - An Interleaving Semantics of the Timed Concurrent Language for
Argumentation to Model Debates and Dialogue Games [0.0]
エージェント間の同時相互作用をモデル化する言語を提案する。
このような言語は、エージェントが彼らの信念の受容可能性についてコミュニケーションし、推論するために使用する共有メモリを利用する。
知的エージェント間で行われる議論や対話ゲームのようなインタラクションをモデル化するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2023-06-13T10:41:28Z) - Unlocking Temporal Question Answering for Large Language Models Using
Code Execution [38.945784849917004]
大規模言語モデル(LLM)は自然言語処理(NLP)において大きな進歩を遂げている。
本稿では,LLMの抽出能力とPythonソルバの論理的推論能力を組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-24T10:57:53Z) - Inner Monologue: Embodied Reasoning through Planning with Language
Models [81.07216635735571]
大規模言語モデル(LLM)は自然言語処理以外の領域に適用できる。
具体化された環境でのLLMの計画には、何をすべきかだけでなく、どのように、いつ行うべきかを考える必要がある。
環境フィードバックを活用することで、LLMはロボット制御シナリオにおいてよりリッチな処理と計画を行うことができる内部モノローグを形成することができる。
論文 参考訳(メタデータ) (2022-07-12T15:20:48Z) - DEER: A Data Efficient Language Model for Event Temporal Reasoning [44.21992914516526]
本稿では,事象の時間的関係に着目した言語モデルDEERを提案する。
我々の実験結果から, DEER は SOTA の結果を達成でき,低リソース環境では特に有効であることがわかった。
論文 参考訳(メタデータ) (2020-12-30T18:57:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。