論文の概要: Exploring The Design of Prompts For Applying GPT-3 based Chatbots: A
Mental Wellbeing Case Study on Mechanical Turk
- arxiv url: http://arxiv.org/abs/2209.11344v1
- Date: Thu, 22 Sep 2022 23:15:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 11:20:41.597148
- Title: Exploring The Design of Prompts For Applying GPT-3 based Chatbots: A
Mental Wellbeing Case Study on Mechanical Turk
- Title(参考訳): GPT-3型チャットボットを応用したプロンプト設計の探索--メカニカル・トルクのメンタル・ウェルビング・ケーススタディ
- Authors: Harsh Kumar, Ilya Musabirov, Jiakai Shi, Adele Lauzon, Kwan Kiu Choy,
Ofek Gross, Dana Kulzhabayeva, Joseph Jay Williams
- Abstract要約: GPT-3のような大型言語モデルは、HCIデザイナーや研究者が特定のアプリケーションのためにより人間らしく便利なチャットボットを作れる可能性を持っている。
GPT-3を簡単な5分間のチャットボットに適用し、誰でも自分の気分をよりよく管理できるケーススタディを提示する。
- 参考スコア(独自算出の注目度): 5.450133084887008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-Language Models like GPT-3 have the potential to enable HCI designers
and researchers to create more human-like and helpful chatbots for specific
applications. But evaluating the feasibility of these chatbots and designing
prompts that optimize GPT-3 for a specific task is challenging. We present a
case study in tackling these questions, applying GPT-3 to a brief 5-minute
chatbot that anyone can talk to better manage their mood. We report a
randomized factorial experiment with 945 participants on Mechanical Turk that
tests three dimensions of prompt design to initialize the chatbot (identity,
intent, and behaviour), and present both quantitative and qualitative analyses
of conversations and user perceptions of the chatbot. We hope other HCI
designers and researchers can build on this case study, for other applications
of GPT-3 based chatbots to specific tasks, and build on and extend the methods
we use for prompt design, and evaluation of the prompt design.
- Abstract(参考訳): GPT-3のような大型言語モデルは、HCIデザイナーや研究者が特定のアプリケーションのためにより人間らしく便利なチャットボットを作れる可能性を持っている。
しかし、これらのチャットボットの実現可能性を評価し、特定のタスクに対してGPT-3を最適化するプロンプトを設計することは困難である。
GPT-3を簡単な5分間のチャットボットに適用して,これらの質問に対処するケーススタディを提案する。
メカニカル・トルコの945人の参加者によるランダムな要因分析実験を行い、チャットボットを初期化するための3次元のプロンプト設計(アイデンティティ、意図、行動)を検証し、会話の量的および質的な分析とチャットボットのユーザ知覚を示す。
我々は、他のhciデザイナーや研究者が、このケーススタディに基づいて、gpt-3ベースのチャットボットを特定のタスクに適用し、プロンプトデザインやプロンプトデザインの評価に使用するメソッドを構築・拡張できることを期待している。
関連論文リスト
- Measuring and Controlling Instruction (In)Stability in Language Model Dialogs [72.38330196290119]
System-promptingは、言語モデルチャットボットをカスタマイズするツールで、特定の命令に従うことができる。
本稿では,仮説を検証し,セルフチャットによる命令安定性の評価を行うベンチマークを提案する。
我々は8ラウンドの会話で重要な指示ドリフトを明らかにした。
そこで本研究では,2つの強力なベースラインに対して良好に比較可能なsplit-softmaxという軽量な手法を提案する。
論文 参考訳(メタデータ) (2024-02-13T20:10:29Z) - ChatGPT: A Study on its Utility for Ubiquitous Software Engineering
Tasks [2.084078990567849]
ChatGPT (Chat Generative Pre-trained Transformer) - OpenAIが2022年11月30日に立ち上げた。
本研究では,ChatGPTが一般的なソフトウェアエンジニアリングタスクにどのように役立つかを検討する。
論文 参考訳(メタデータ) (2023-05-26T11:29:06Z) - InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT
Beyond Language [82.92236977726655]
InternGPTは textbfinteraction, textbfnonverbal, textbfchatbot の略である。
InternGPT(iGPT)という対話型視覚フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T17:58:34Z) - ChatGPT Beyond English: Towards a Comprehensive Evaluation of Large
Language Models in Multilingual Learning [70.57126720079971]
大規模言語モデル(LLM)は、自然言語処理(NLP)において最も重要なブレークスルーとして登場した。
本稿では,高,中,低,低リソースの37言語を対象として,ChatGPTを7つのタスクで評価する。
従来のモデルと比較すると,様々なNLPタスクや言語に対するChatGPTの性能は低下していた。
論文 参考訳(メタデータ) (2023-04-12T05:08:52Z) - ChatGPT for Robotics: Design Principles and Model Abilities [25.032064314822243]
我々は、迅速なエンジニアリングのための設計原則と高レベルの関数ライブラリの作成を組み合わせた戦略の概要を述べる。
我々は,様々なロボットタスクの実行に向けて,異なるプロンプトエンジニアリング手法とダイアログ戦略の有効性に焦点をあてる。
我々の研究は、基本的な論理的、幾何学的、数学的推論から、航空航法、操作、エンボディドエージェントといった複雑な領域まで、ロボット領域内の様々なタスクを含む。
論文 参考訳(メタデータ) (2023-02-20T06:39:06Z) - Conversational AI-Powered Design: ChatGPT as Designer, User, and Product [0.0]
本研究では,人間中心の設計プロセスにおけるChatGPTの機能について検討する。
この目的のために、ChatGPTを利用してペルソナを生成し、架空のユーザとのインタビューをシミュレートし、新しいデザインアイデアを作成し、使用シナリオをシミュレートし、ユーザエクスペリエンスを評価する仮説設計プロジェクトが行われた。
論文 参考訳(メタデータ) (2023-02-15T00:14:17Z) - Is ChatGPT a General-Purpose Natural Language Processing Task Solver? [113.22611481694825]
大規模言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクをゼロショットで実行できることを実証している。
近年、ChatGPTのデビューは自然言語処理(NLP)コミュニティから大きな注目を集めている。
ChatGPTが多くのNLPタスクをゼロショットで実行できるジェネラリストモデルとして機能するかどうかはまだ分かっていない。
論文 参考訳(メタデータ) (2023-02-08T09:44:51Z) - a survey on GPT-3 [5.672898304129217]
本稿では, GPT-3 の紹介調査を行う。
我々は、この技術の背後にある歴史的発展のいくつか、GPT-3の重要な特徴を取り上げ、機械学習モデルと使用するデータセットについて論じる。
本稿では,GPT-3が直面する課題として,学習の複雑さ,バイアス,幻覚/誤答などについて議論する。
論文 参考訳(メタデータ) (2022-12-01T20:24:19Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z) - Language Models are Few-Shot Learners [61.36677350504291]
言語モデルのスケールアップにより、タスクに依存しない、少数ショットのパフォーマンスが大幅に向上することを示す。
我々は、1750億のパラメータを持つ自動回帰言語モデルであるGPT-3を訓練し、その性能を数ショットでテストする。
GPT-3は、翻訳、質問応答、クローズタスクを含む多くのNLPデータセットで高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-05-28T17:29:03Z) - If I Hear You Correctly: Building and Evaluating Interview Chatbots with
Active Listening Skills [4.395837214164745]
オープンエンドの質問に対して、ユーザの自由テキスト応答を処理できる効果的なインタビューチャットボットを構築するのは難しい。
我々は,公開可能な実用的なAI技術を用いて,効果的なインタビューチャットボットの構築の実現可能性と有効性について検討している。
論文 参考訳(メタデータ) (2020-02-05T16:52:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。