論文の概要: Human or Not? A Gamified Approach to the Turing Test
- arxiv url: http://arxiv.org/abs/2305.20010v1
- Date: Wed, 31 May 2023 16:32:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 15:11:22.303608
- Title: Human or Not? A Gamified Approach to the Turing Test
- Title(参考訳): 人間か?
チューリングテストへのゲーム化アプローチ
- Authors: Daniel Jannai, Amos Meron, Barak Lenz, Yoav Levine, Yoav Shoham
- Abstract要約: チューリングテストに触発されたオンラインゲーム「Human or Not?
このゲームは1ヶ月で150万人以上のユーザーがプレイした。
全体として、ゲームの68%でパートナーの正体を正確に推測した。
ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%も下げていた。
- 参考スコア(独自算出の注目度): 11.454575816255039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present "Human or Not?", an online game inspired by the Turing test, that
measures the capability of AI chatbots to mimic humans in dialog, and of humans
to tell bots from other humans. Over the course of a month, the game was played
by over 1.5 million users who engaged in anonymous two-minute chat sessions
with either another human or an AI language model which was prompted to behave
like humans. The task of the players was to correctly guess whether they spoke
to a person or to an AI. This largest scale Turing-style test conducted to date
revealed some interesting facts. For example, overall users guessed the
identity of their partners correctly in only 68% of the games. In the subset of
the games in which users faced an AI bot, users had even lower correct guess
rates of 60% (that is, not much higher than chance). This white paper details
the development, deployment, and results of this unique experiment. While this
experiment calls for many extensions and refinements, these findings already
begin to shed light on the inevitable near future which will commingle humans
and AI.
- Abstract(参考訳): 我々は、チューリングテストにインスパイアされたオンラインゲーム「Human or Not?」を紹介し、AIチャットボットがダイアログで人間を模倣し、人間が他の人間からボットを伝える能力を測定する。
1ヵ月間、このゲームは150万人以上のユーザーによってプレイされ、匿名の2分間のチャットセッションを他の人間やAI言語モデルと交わし、人間のように振る舞うように促された。
プレイヤーのタスクは、人やAIに話しかけたかどうかを正確に推測することであった。
この最大のチューリング式試験は、いくつかの興味深い事実を明らかにした。
例えば、全体のユーザーは68%のゲームでパートナーの身元を正確に推測した。
ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%(偶然よりもそれほど高くない)に下げていた。
このホワイトペーパーは、このユニークな実験の開発、展開、結果について詳述する。
この実験は、多くの拡張と改良を求めているが、これらの発見はすでに、人間とAIの始まりとなる、避けられない未来に光を当て始めている。
関連論文リスト
- Human Bias in the Face of AI: The Role of Human Judgement in AI Generated Text Evaluation [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。
ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文 参考訳(メタデータ) (2024-09-29T04:31:45Z) - The Impacts of AI Avatar Appearance and Disclosure on User Motivation [0.0]
本研究では,仮想インタラクションにおけるAI特徴がユーザのモチベーションに与える影響について検討する。
探索問題のみ, あるいはAIコンパニオンを用いて72,500人以上の参加者を対象に, ゲームベースの実験を行った。
論文 参考訳(メタデータ) (2024-07-31T10:48:55Z) - GPT-4 is judged more human than humans in displaced and inverted Turing tests [0.7437224586066946]
毎日のAI検出は、オンライン会話における人とAIの差別化を必要とする。
我々は、Turingテストの2つの修正版(反転と置換)を使って、人や大きな言語モデルがいかに差別化できるかを測定した。
論文 参考訳(メタデータ) (2024-07-11T20:28:24Z) - Prompting Fairness: Artificial Intelligence as Game Players [0.0]
公正さを測定するための実用的ゲームは、社会科学で何十年にもわたって研究されてきた。
独裁者のゲームの101ラウンド以上で、私はAIはそれに依存する公平さの強い感覚を持っていると結論付けます。
AIが人間と同じように不平等回避を経験する証拠があるかもしれない。
論文 参考訳(メタデータ) (2024-02-08T16:24:40Z) - A Turing Test: Are AI Chatbots Behaviorally Similar to Humans? [19.50537882161282]
ChatGPT-4は、ランダムなヒトの被験者と統計的に区別できない個性特性を示す。
彼らの行動は平均的行動と人的行動とは区別されることが多い。
私たちは、彼らが自分の平均とパートナーの支払いを最大化しているかのように振る舞うと見積もっています。
論文 参考訳(メタデータ) (2023-11-19T16:44:09Z) - Navigates Like Me: Understanding How People Evaluate Human-Like AI in
Video Games [36.96985093527702]
エージェントとベースラインAIエージェントが生成するナビゲーション行動の人間的類似性を比較したクラウドソースによる数百のアセスメントを収集する。
提案するエージェントはチューリングテストに合格するが,ベースラインエージェントは合格しない。
この研究は、ゴール指向のビデオゲームナビゲーションの文脈において、人間が人間的と考える特性に関する洞察を提供する。
論文 参考訳(メタデータ) (2023-03-02T18:59:04Z) - Can Machines Imitate Humans? Integrative Turing Tests for Vision and Language Demonstrate a Narrowing Gap [45.6806234490428]
3つの言語タスクと3つのビジョンタスクで人間を模倣する能力において、現在のAIをベンチマークします。
実験では、549人の人間エージェントと26人のAIエージェントがデータセットの作成に使われ、1,126人の人間審査員と10人のAI審査員が参加した。
結果として、現在のAIは、複雑な言語とビジョンの課題において人間を偽装できるものではないことが判明した。
論文 参考訳(メタデータ) (2022-11-23T16:16:52Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - CheerBots: Chatbots toward Empathy and Emotionusing Reinforcement
Learning [60.348822346249854]
本研究では,複数の共感型チャットボットがユーザの暗黙の感情を理解し,複数の対話のターンに対して共感的に応答する枠組みを提案する。
チャットボットをCheerBotsと呼びます。CheerBotsは検索ベースまたは生成ベースで、深い強化学習によって微調整されます。
共感的態度で反応するため,CheerBotsの学習支援としてシミュレーションエージェントである概念人間モデルを開発し,今後のユーザの感情状態の変化を考慮し,共感を喚起する。
論文 参考訳(メタデータ) (2021-10-08T07:44:47Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。