論文の概要: Human or Not? A Gamified Approach to the Turing Test
- arxiv url: http://arxiv.org/abs/2305.20010v1
- Date: Wed, 31 May 2023 16:32:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 15:11:22.303608
- Title: Human or Not? A Gamified Approach to the Turing Test
- Title(参考訳): 人間か?
チューリングテストへのゲーム化アプローチ
- Authors: Daniel Jannai, Amos Meron, Barak Lenz, Yoav Levine, Yoav Shoham
- Abstract要約: チューリングテストに触発されたオンラインゲーム「Human or Not?
このゲームは1ヶ月で150万人以上のユーザーがプレイした。
全体として、ゲームの68%でパートナーの正体を正確に推測した。
ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%も下げていた。
- 参考スコア(独自算出の注目度): 11.454575816255039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present "Human or Not?", an online game inspired by the Turing test, that
measures the capability of AI chatbots to mimic humans in dialog, and of humans
to tell bots from other humans. Over the course of a month, the game was played
by over 1.5 million users who engaged in anonymous two-minute chat sessions
with either another human or an AI language model which was prompted to behave
like humans. The task of the players was to correctly guess whether they spoke
to a person or to an AI. This largest scale Turing-style test conducted to date
revealed some interesting facts. For example, overall users guessed the
identity of their partners correctly in only 68% of the games. In the subset of
the games in which users faced an AI bot, users had even lower correct guess
rates of 60% (that is, not much higher than chance). This white paper details
the development, deployment, and results of this unique experiment. While this
experiment calls for many extensions and refinements, these findings already
begin to shed light on the inevitable near future which will commingle humans
and AI.
- Abstract(参考訳): 我々は、チューリングテストにインスパイアされたオンラインゲーム「Human or Not?」を紹介し、AIチャットボットがダイアログで人間を模倣し、人間が他の人間からボットを伝える能力を測定する。
1ヵ月間、このゲームは150万人以上のユーザーによってプレイされ、匿名の2分間のチャットセッションを他の人間やAI言語モデルと交わし、人間のように振る舞うように促された。
プレイヤーのタスクは、人やAIに話しかけたかどうかを正確に推測することであった。
この最大のチューリング式試験は、いくつかの興味深い事実を明らかにした。
例えば、全体のユーザーは68%のゲームでパートナーの身元を正確に推測した。
ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%(偶然よりもそれほど高くない)に下げていた。
このホワイトペーパーは、このユニークな実験の開発、展開、結果について詳述する。
この実験は、多くの拡張と改良を求めているが、これらの発見はすでに、人間とAIの始まりとなる、避けられない未来に光を当て始めている。
関連論文リスト
- Prompting Fairness: Artificial Intelligence as Game Players [0.0]
公正さを測定するための実用的ゲームは、社会科学で何十年にもわたって研究されてきた。
独裁者のゲームの101ラウンド以上で、私はAIはそれに依存する公平さの強い感覚を持っていると結論付けます。
AIが人間と同じように不平等回避を経験する証拠があるかもしれない。
論文 参考訳(メタデータ) (2024-02-08T16:24:40Z) - A Turing Test: Are AI Chatbots Behaviorally Similar to Humans? [19.50537882161282]
ChatGPT-4は、ランダムなヒトの被験者と統計的に区別できない個性特性を示す。
彼らの行動は平均的行動と人的行動とは区別されることが多い。
私たちは、彼らが自分の平均とパートナーの支払いを最大化しているかのように振る舞うと見積もっています。
論文 参考訳(メタデータ) (2023-11-19T16:44:09Z) - Navigates Like Me: Understanding How People Evaluate Human-Like AI in
Video Games [36.96985093527702]
エージェントとベースラインAIエージェントが生成するナビゲーション行動の人間的類似性を比較したクラウドソースによる数百のアセスメントを収集する。
提案するエージェントはチューリングテストに合格するが,ベースラインエージェントは合格しない。
この研究は、ゴール指向のビデオゲームナビゲーションの文脈において、人間が人間的と考える特性に関する洞察を提供する。
論文 参考訳(メタデータ) (2023-03-02T18:59:04Z) - Playing the Werewolf game with artificial intelligence for language
understanding [0.7550566004119156]
ワイアウルフ(Werewolf)は、自由な自然言語通信に基づくソーシャル推論ゲームである。
本研究の目的は、自然言語会話を通じてWerewolfをプレイできるAIエージェントを開発することである。
論文 参考訳(メタデータ) (2023-02-21T13:03:20Z) - Human or Machine? Turing Tests for Vision and Language [22.110556671410624]
我々は、現在のAIを人間を模倣する能力で体系的にベンチマークする。
実験では、769人の人的エージェント、24人の最先端AIエージェント、896人の人的裁判官、8人のAI裁判官がテストされた。
その結果、現在のAIは、性別、年齢、教育レベルによって人間の裁判官を偽装できるわけではないことが判明した。
論文 参考訳(メタデータ) (2022-11-23T16:16:52Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - CheerBots: Chatbots toward Empathy and Emotionusing Reinforcement
Learning [60.348822346249854]
本研究では,複数の共感型チャットボットがユーザの暗黙の感情を理解し,複数の対話のターンに対して共感的に応答する枠組みを提案する。
チャットボットをCheerBotsと呼びます。CheerBotsは検索ベースまたは生成ベースで、深い強化学習によって微調整されます。
共感的態度で反応するため,CheerBotsの学習支援としてシミュレーションエージェントである概念人間モデルを開発し,今後のユーザの感情状態の変化を考慮し,共感を喚起する。
論文 参考訳(メタデータ) (2021-10-08T07:44:47Z) - Comparing Visual Reasoning in Humans and AI [66.89451296340809]
人間の行動や社会的相互作用を含む複雑なシーンのデータセットを作成しました。
ai/ヒューマンのシーン記述と、各シーンの他の5つの人間記述の地上真実との類似度を定量的に測定した。
結果は、機械/人間の合意シーンの説明は、私たちの複雑なシーンの人間/人間の合意よりもはるかに低いことを示しています。
論文 参考訳(メタデータ) (2021-04-29T04:44:13Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。