Fugu-MT 論文翻訳(概要): Human or Not? A Gamified Approach to the Turing Test

論文の概要: Human or Not? A Gamified Approach to the Turing Test

arxiv url: http://arxiv.org/abs/2305.20010v1
Date: Wed, 31 May 2023 16:32:22 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-01 15:11:22.303608
Title: Human or Not? A Gamified Approach to the Turing Test
Title（参考訳）: 人間か? チューリングテストへのゲーム化アプローチ
Authors: Daniel Jannai, Amos Meron, Barak Lenz, Yoav Levine, Yoav Shoham
Abstract要約: チューリングテストに触発されたオンラインゲーム「Human or Not? このゲームは1ヶ月で150万人以上のユーザーがプレイした。全体として、ゲームの68%でパートナーの正体を正確に推測した。ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%も下げていた。
参考スコア（独自算出の注目度）: 11.454575816255039
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present "Human or Not?", an online game inspired by the Turing test, that measures the capability of AI chatbots to mimic humans in dialog, and of humans to tell bots from other humans. Over the course of a month, the game was played by over 1.5 million users who engaged in anonymous two-minute chat sessions with either another human or an AI language model which was prompted to behave like humans. The task of the players was to correctly guess whether they spoke to a person or to an AI. This largest scale Turing-style test conducted to date revealed some interesting facts. For example, overall users guessed the identity of their partners correctly in only 68% of the games. In the subset of the games in which users faced an AI bot, users had even lower correct guess rates of 60% (that is, not much higher than chance). This white paper details the development, deployment, and results of this unique experiment. While this experiment calls for many extensions and refinements, these findings already begin to shed light on the inevitable near future which will commingle humans and AI.
Abstract（参考訳）: 我々は、チューリングテストにインスパイアされたオンラインゲーム「Human or Not?」を紹介し、AIチャットボットがダイアログで人間を模倣し、人間が他の人間からボットを伝える能力を測定する。 1ヵ月間、このゲームは150万人以上のユーザーによってプレイされ、匿名の2分間のチャットセッションを他の人間やAI言語モデルと交わし、人間のように振る舞うように促された。プレイヤーのタスクは、人やAIに話しかけたかどうかを正確に推測することであった。この最大のチューリング式試験は、いくつかの興味深い事実を明らかにした。例えば、全体のユーザーは68%のゲームでパートナーの身元を正確に推測した。ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%(偶然よりもそれほど高くない)に下げていた。このホワイトペーパーは、このユニークな実験の開発、展開、結果について詳述する。この実験は、多くの拡張と改良を求めているが、これらの発見はすでに、人間とAIの始まりとなる、避けられない未来に光を当て始めている。

関連論文リスト

AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games [63.29377274531968]
我々はAI GameStoreを紹介した。これはスケーラブルでオープンなプラットフォームで、新しい代表的人間のゲームを合成する。 Apple App StoreとSteamのトップチャートに基づいて100のゲームを生成し、短いプレイで7つのフロンティアビジョン言語モデル(VLM)を評価します。最高のモデルは、ほとんどのゲームで人間の平均スコアの10%未満を達成し、特に世界モデルの学習、記憶、計画に挑戦するゲームに苦戦した。
論文参考訳（メタデータ） (2026-02-19T18:17:25Z)
Humans learn to prefer trustworthy AI over human partners [0.7049575025146246]
我々は、最先端のLDMを用いた人間とロボットのハイブリッドミニ社会におけるダイナミクスについて検討した。ボットのアイデンティティが隠された時点では、ボットは優先的に選択されないことがわかった。ボットのアイデンティティの開示は、ボットが最初に選択される確率を減らし、徐々に人間に勝るようになるという二重効果を引き起こした。
論文参考訳（メタデータ） (2025-07-17T20:24:26Z)
The Many Challenges of Human-Like Agents in Virtual Game Environments [1.1586742546971471]
この記事では、ゲームで人間のようなAIを実装する上で最も重要な課題について調査する。独自のディープリカレント畳み込みニューラルネットワークを用いた機械学習手法を提案する。特定のゲームのために人間のようなAIを作るのが難しいほど、AI駆動のプレイヤーと人間を区別する手法を開発するのが簡単になる、という仮説を立てる。
論文参考訳（メタデータ） (2025-05-26T14:00:39Z)
Human Bias in the Face of AI: The Role of Human Judgement in AI Generated Text Evaluation [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文参考訳（メタデータ） (2024-09-29T04:31:45Z)
The Impacts of AI Avatar Appearance and Disclosure on User Motivation [0.0]
本研究では,仮想インタラクションにおけるAI特徴がユーザのモチベーションに与える影響について検討する。探索問題のみ, あるいはAIコンパニオンを用いて72,500人以上の参加者を対象に, ゲームベースの実験を行った。
論文参考訳（メタデータ） (2024-07-31T10:48:55Z)
GPT-4 is judged more human than humans in displaced and inverted Turing tests [0.7437224586066946]
毎日のAI検出は、オンライン会話における人とAIの差別化を必要とする。我々は、Turingテストの2つの修正版(反転と置換)を使って、人や大きな言語モデルがいかに差別化できるかを測定した。
論文参考訳（メタデータ） (2024-07-11T20:28:24Z)
Prompting Fairness: Artificial Intelligence as Game Players [0.0]
公正さを測定するための実用的ゲームは、社会科学で何十年にもわたって研究されてきた。独裁者のゲームの101ラウンド以上で、私はAIはそれに依存する公平さの強い感覚を持っていると結論付けます。 AIが人間と同じように不平等回避を経験する証拠があるかもしれない。
論文参考訳（メタデータ） (2024-02-08T16:24:40Z)
A Turing Test: Are AI Chatbots Behaviorally Similar to Humans? [19.50537882161282]
ChatGPT-4は、ランダムなヒトの被験者と統計的に区別できない個性特性を示す。彼らの行動は平均的行動と人的行動とは区別されることが多い。私たちは、彼らが自分の平均とパートナーの支払いを最大化しているかのように振る舞うと見積もっています。
論文参考訳（メタデータ） (2023-11-19T16:44:09Z)
Navigates Like Me: Understanding How People Evaluate Human-Like AI in Video Games [36.96985093527702]
エージェントとベースラインAIエージェントが生成するナビゲーション行動の人間的類似性を比較したクラウドソースによる数百のアセスメントを収集する。提案するエージェントはチューリングテストに合格するが,ベースラインエージェントは合格しない。この研究は、ゴール指向のビデオゲームナビゲーションの文脈において、人間が人間的と考える特性に関する洞察を提供する。
論文参考訳（メタデータ） (2023-03-02T18:59:04Z)
Can Machines Imitate Humans? Integrative Turing Tests for Vision and Language Demonstrate a Narrowing Gap [45.6806234490428]
3つの言語タスクと3つのビジョンタスクで人間を模倣する能力において、現在のAIをベンチマークします。実験では、549人の人間エージェントと26人のAIエージェントがデータセットの作成に使われ、1,126人の人間審査員と10人のAI審査員が参加した。結果として、現在のAIは、複雑な言語とビジョンの課題において人間を偽装できるものではないことが判明した。
論文参考訳（メタデータ） (2022-11-23T16:16:52Z)
DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文参考訳（メタデータ） (2022-10-31T06:29:08Z)
CheerBots: Chatbots toward Empathy and Emotionusing Reinforcement Learning [60.348822346249854]
本研究では,複数の共感型チャットボットがユーザの暗黙の感情を理解し,複数の対話のターンに対して共感的に応答する枠組みを提案する。チャットボットをCheerBotsと呼びます。CheerBotsは検索ベースまたは生成ベースで、深い強化学習によって微調整されます。共感的態度で反応するため,CheerBotsの学習支援としてシミュレーションエージェントである概念人間モデルを開発し,今後のユーザの感情状態の変化を考慮し,共感を喚起する。
論文参考訳（メタデータ） (2021-10-08T07:44:47Z)
Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文参考訳（メタデータ） (2021-03-30T15:24:37Z)
Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。 Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文参考訳（メタデータ） (2020-03-30T16:18:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。