論文の概要: Does ChatGPT have Theory of Mind?
- arxiv url: http://arxiv.org/abs/2305.14020v2
- Date: Wed, 13 Sep 2023 11:22:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 18:01:11.328330
- Title: Does ChatGPT have Theory of Mind?
- Title(参考訳): ChatGPTは心の理論を持っているか?
- Authors: Bart Holterman and Kees van Deemter
- Abstract要約: 心の理論 (Theory of Mind, ToM) とは、人間の思考と意思決定を理解する能力である。
本稿では,最近のChatGPT伝統における大規模言語モデル(Large Language Models)がToMをどの程度持っているかを検討する。
- 参考スコア(独自算出の注目度): 2.3129337924262927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Theory of Mind (ToM) is the ability to understand human thinking and
decision-making, an ability that plays a crucial role in social interaction
between people, including linguistic communication. This paper investigates to
what extent recent Large Language Models in the ChatGPT tradition possess ToM.
We posed six well-known problems that address biases in human reasoning and
decision making to two versions of ChatGPT and we compared the results under a
range of prompting strategies. While the results concerning ChatGPT-3 were
somewhat inconclusive, ChatGPT-4 was shown to arrive at the correct answers
more often than would be expected based on chance, although correct answers
were often arrived at on the basis of false assumptions or invalid reasoning.
- Abstract(参考訳): 心の理論は、人間の思考と意思決定を理解する能力であり、言語コミュニケーションを含む人々間の社会的相互作用において重要な役割を果たす能力である。
本稿では,近年のChatGPT伝統における大規模言語モデルがToMをどの程度持っているかを検討する。
人間の推論と意思決定のバイアスに対処する6つのよく知られた問題をChatGPTの2つのバージョンに提案し、その結果を一連のプロンプト戦略で比較した。
ChatGPT-3に関する結果は幾らか決定的ではなかったが、ChatGPT-4は偶然に予想されるよりも頻繁に正しい答えに到達した。
関連論文リスト
- Complementary Advantages of ChatGPTs and Human Readers in Reasoning:
Evidence from English Text Reading Comprehension [12.240611073541597]
ChatGPTはテキスト処理において大きな力を示しており、テキスト読み込みからの推論能力を含んでいる。
テキスト読解に関する推論能力において,人間読者とChatGPTの直接比較は行われていない。
本研究は,ChatGPTと中国の高校生が,英語の物語文からの推論能力について検討した。
論文 参考訳(メタデータ) (2023-11-17T06:13:02Z) - Primacy Effect of ChatGPT [69.49920102917598]
本稿では,ChatGPTの優位性について検討する。
実験と分析により、より信頼性の高いChatGPTベースのソリューションを構築する上で、さらなる洞察が得られればと思っています。
論文 参考訳(メタデータ) (2023-10-20T00:37:28Z) - Performance of ChatGPT on USMLE: Unlocking the Potential of Large
Language Models for AI-Assisted Medical Education [0.0]
本研究は,ChatGPTが複雑な医学的および臨床的な疑問に答える上で,いかに信頼性が高いかを検討した。
本研究は2方向ANOVAとポストホック解析を用いて得られた結果について検討した。
ChatGPTによる回答は、通常のGoogle検索結果よりもコンテキスト指向であることが判明した。
論文 参考訳(メタデータ) (2023-06-30T19:53:23Z) - ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models [49.52083248451775]
大規模言語モデル(LLM)はNLPに大きな進歩をもたらした。
特にChatGPTは,広く利用されており,アクセスしやすいLLMである。
我々は、ChatGPTの常識能力を評価するために、11のデータセットで一連の実験を行った。
論文 参考訳(メタデータ) (2023-03-29T03:05:43Z) - Consistency Analysis of ChatGPT [65.268245109828]
本稿では,ChatGPTとGPT-4の論理的一貫した行動に対する信頼性について検討する。
その結果,両モデルとも言語理解能力と推論能力が向上しているように見えるが,論理的に一貫した予測が得られないことが示唆された。
論文 参考訳(メタデータ) (2023-03-11T01:19:01Z) - Can ChatGPT Understand Too? A Comparative Study on ChatGPT and
Fine-tuned BERT [103.57103957631067]
チャットGPTは、人間の質問に対する流動的で高品質な応答を生成できるため、大きな注目を集めている。
そこで我々は,ChatGPTの理解能力を,最も人気のあるGLUEベンチマークで評価し,より詳細な4種類のBERTスタイルのモデルと比較した。
2)ChatGPTは,感情分析や質問応答タスクにおいて,BERTと同等のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2023-02-19T12:29:33Z) - Is ChatGPT a General-Purpose Natural Language Processing Task Solver? [113.22611481694825]
大規模言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクをゼロショットで実行できることを実証している。
近年、ChatGPTのデビューは自然言語処理(NLP)コミュニティから大きな注目を集めている。
ChatGPTが多くのNLPタスクをゼロショットで実行できるジェネラリストモデルとして機能するかどうかはまだ分かっていない。
論文 参考訳(メタデータ) (2023-02-08T09:44:51Z) - A Categorical Archive of ChatGPT Failures [47.64219291655723]
OpenAIが開発したChatGPTは、大量のデータを使って訓練され、人間の会話をシミュレートしている。
それは、広範囲の人間の問い合わせに効果的に答える能力のために、大きな注目を集めている。
しかし、ChatGPTの失敗の包括的分析は欠落しており、これが本研究の焦点となっている。
論文 参考訳(メタデータ) (2023-02-06T04:21:59Z) - How Close is ChatGPT to Human Experts? Comparison Corpus, Evaluation,
and Detection [8.107721810172112]
ChatGPTは、幅広い人間の質問に効果的に反応できる。
人々はChatGPTのような大きな言語モデル(LLM)が社会に与える影響を心配し始めています。
本研究では,人間の専門家とChatGPTの双方から,数万件の比較回答を収集した。
論文 参考訳(メタデータ) (2023-01-18T15:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。