論文の概要: InterAct: Exploring the Potentials of ChatGPT as a Cooperative Agent
- arxiv url: http://arxiv.org/abs/2308.01552v1
- Date: Thu, 3 Aug 2023 06:19:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 15:06:49.099339
- Title: InterAct: Exploring the Potentials of ChatGPT as a Cooperative Agent
- Title(参考訳): InterAct: 協調エージェントとしてのChatGPTの可能性を探る
- Authors: Po-Lin Chen, Cheng-Shang Chang
- Abstract要約: 本研究は,OpenAIのChatGPTを具体化エージェントシステムに統合し,対話型意思決定ベンチマークへの影響を評価した。
個性に応じて役割を仮定する人々の概念と平行して、InterActを紹介します。
このアプローチでは、ChatGPTにさまざまなプロンプトを与え、チェッカーやソータのような多数のロールを割り当て、元の言語モデルと統合します。
- 参考スコア(独自算出の注目度): 3.898689841227059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research paper delves into the integration of OpenAI's ChatGPT into
embodied agent systems, evaluating its influence on interactive decision-making
benchmark. Drawing a parallel to the concept of people assuming roles according
to their unique strengths, we introduce InterAct. In this approach, we feed
ChatGPT with varied prompts, assigning it a numerous roles like a checker and a
sorter, then integrating them with the original language model. Our research
shows a remarkable success rate of 98% in AlfWorld, which consists of 6
different tasks in a simulated household environment, emphasizing the
significance of proficient prompt engineering. The results highlight ChatGPT's
competence in comprehending and performing intricate tasks effectively in
real-world settings, thus paving the way for further advancements in task
planning.
- Abstract(参考訳): 本研究は,OpenAIのChatGPTを具体化エージェントシステムに統合し,対話型意思決定ベンチマークへの影響を評価した。
個性に応じて役割を仮定する人々の概念と平行して、InterActを紹介します。
このアプローチでは、ChatGPTにさまざまなプロンプトを与え、チェッカーやソータのような多数のロールを割り当て、元の言語モデルと統合します。
本研究は,家庭環境をシミュレートした6つの異なるタスクからなるalfworldの98%の成功率を示し,熟練したプロンプトエンジニアリングの重要性を強調した。
その結果,ChatGPTは現実の環境での複雑なタスクを効果的に理解・実行し,タスク計画のさらなる進歩への道を開いた。
関連論文リスト
- A Survey on Complex Tasks for Goal-Directed Interactive Agents [60.53915548970061]
この調査は、目標指向の対話エージェントを評価するための、関連するタスクと環境をコンパイルする。
関連リソースの最新のコンパイルは、プロジェクトのWebサイトにある。
論文 参考訳(メタデータ) (2024-09-27T08:17:53Z) - Exploring the Impact of ChatGPT on Student Interactions in
Computer-Supported Collaborative Learning [1.5961625979922607]
本稿では,コンピュータ支援型協調学習環境におけるChatGPTの適用性について検討する。
統計的分析を用いて,非同期グループブレインストーミングセッションにおける学生のインタラクションの変化を,ChatGPTを即時質問応答エージェントとして導入することで検証する。
論文 参考訳(メタデータ) (2024-03-11T18:18:18Z) - Exploring ChatGPT's Capabilities on Vulnerability Management [56.4403395100589]
我々は、70,346のサンプルを含む大規模なデータセットを用いて、完全な脆弱性管理プロセスを含む6つのタスクでChatGPTの機能を探求する。
注目すべき例として、ChatGPTのソフトウェアバグレポートのタイトル生成などのタスクにおける熟練度がある。
以上の結果から,ChatGPTが抱える障害が明らかとなり,将来的な方向性に光を当てた。
論文 参考訳(メタデータ) (2023-11-11T11:01:13Z) - Large Language Models Meet Open-World Intent Discovery and Recognition:
An Evaluation of ChatGPT [37.27411474856601]
Out-of-domain(OOD)インテントディスカバリと一般化インテントディスカバリ(GID)は、オープンワールドインテントセットにクローズドインテントを拡張することを目的としている。
従来の手法は微調整の識別モデルによってそれらに対処する。
ChatGPTはゼロショット設定で一貫したアドバンテージを示すが、細調整されたモデルに比べて依然として不利である。
論文 参考訳(メタデータ) (2023-10-16T08:34:44Z) - Extending the Frontier of ChatGPT: Code Generation and Debugging [0.0]
OpenAIが開発したChatGPTは,さまざまな問題領域に取り組むために人工知能(AI)を活用することによって,新たな時代を迎えている。
本稿では,ChatGPTのプログラミング問題に対する有効性について検討し,時間とメモリの複雑さの観点から,その解の正しさと効率性について検討する。
この研究は、ChatGPTが正しいソリューションを提供することができた問題の割合を示すため、総成功率は71.875%であることを示した。
論文 参考訳(メタデータ) (2023-07-17T06:06:58Z) - A Systematic Study and Comprehensive Evaluation of ChatGPT on Benchmark
Datasets [19.521390684403293]
本稿では,ChatGPTの性能を多種多様な学術データセット上で徹底的に評価する。
具体的には、140タスクにわたるChatGPTを評価し、これらのデータセットで生成される255Kの応答を分析する。
論文 参考訳(メタデータ) (2023-05-29T12:37:21Z) - ChatGPT Beyond English: Towards a Comprehensive Evaluation of Large
Language Models in Multilingual Learning [70.57126720079971]
大規模言語モデル(LLM)は、自然言語処理(NLP)において最も重要なブレークスルーとして登場した。
本稿では,高,中,低,低リソースの37言語を対象として,ChatGPTを7つのタスクで評価する。
従来のモデルと比較すると,様々なNLPタスクや言語に対するChatGPTの性能は低下していた。
論文 参考訳(メタデータ) (2023-04-12T05:08:52Z) - A Preliminary Evaluation of ChatGPT for Zero-shot Dialogue Understanding [55.37338324658501]
ゼロショット対話理解は、ユーザーのニーズをトレーニングデータなしで追跡できるようにすることを目的としている。
本研究では,ゼロショット対話理解タスクにおけるChatGPTの理解能力について検討する。
論文 参考訳(メタデータ) (2023-04-09T15:28:36Z) - ChatGPT-Crawler: Find out if ChatGPT really knows what it's talking
about [15.19126287569545]
本研究では,異なる対話型QAコーパスからChatGPTが生成する応答について検討する。
この研究はBERT類似度スコアを用いて、これらの回答を正しい回答と比較し、自然言語推論(NLI)ラベルを得る。
調査では、ChatGPTが質問に対する誤った回答を提供し、モデルがエラーを起こしやすい領域について洞察を与えている事例を特定した。
論文 参考訳(メタデータ) (2023-04-06T18:42:47Z) - A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on
Reasoning, Hallucination, and Interactivity [79.12003701981092]
8種類の共通NLPアプリケーションタスクをカバーする23のデータセットを用いてChatGPTの広範な技術的評価を行う。
これらのデータセットと、新たに設計されたマルチモーダルデータセットに基づいて、ChatGPTのマルチタスク、マルチリンガル、マルチモーダルの側面を評価する。
ChatGPTの精度は平均63.41%で、論理的推論、非テキスト的推論、コモンセンス推論の10の異なる推論カテゴリで正確である。
論文 参考訳(メタデータ) (2023-02-08T12:35:34Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。