Fugu-MT 論文翻訳(概要): The Meta-Turing Test

論文の概要: The Meta-Turing Test

arxiv url: http://arxiv.org/abs/2205.05268v1
Date: Wed, 11 May 2022 04:54:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-12 18:47:44.587808
Title: The Meta-Turing Test
Title（参考訳）: メタチューリングテスト
Authors: Toby Walsh
Abstract要約: 本研究では,人間と機械の非対称性を除去するチューリング試験の代替案を提案する。この新しいテストでは、人間と機械の両方がお互いを判断する。
参考スコア（独自算出の注目度）: 17.68987003293372
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose an alternative to the Turing test that removes the inherent asymmetry between humans and machines in Turing's original imitation game. In this new test, both humans and machines judge each other. We argue that this makes the test more robust against simple deceptions. We also propose a small number of refinements to improve further the test. These refinements could be applied also to Turing's original imitation game.
Abstract（参考訳）: チューリングのオリジナルの模倣ゲームにおいて、人間と機械の間に固有の非対称性を取り除くチューリングテストの代替案を提案する。この新しいテストでは、人間と機械の両方がお互いを判断する。これにより、単純な偽装に対してテストがより堅牢になる、と私たちは主張する。また,テストをさらに改善するための改良も少なからず提案する。これらの改良はチューリングのオリジナルの模倣ゲームにも適用できる。

関連論文リスト

The Imitation Game According To Turing [0.0]
近年の研究では、大規模言語モデル(LLM)が1950年代からAIの目標であるチューリングテストに合格できると主張している。 GPT-4-Turbo を用いた厳密なチューリングテストを行い,チューリングの指示に忠実に固執した。 LLMを正しく特定したのは1人以外で、今日の最も先進的なLLMの1つが厳格なチューリングテストに合格できないことを示している。
論文参考訳（メタデータ） (2025-01-29T13:08:17Z)
Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards [93.16294577018482]
このタイプの最も人気のあるベンチマークであるArenaは、ランダムに選択された2つのモデル間のより良いレスポンスを選択するようユーザに求めることで、モデルをランク付けする。攻撃者は、約1000票の費用で、リーダーボードを変更できる(お気に入りのモデルを宣伝したり、ライバルを降格させる)。私たちの攻撃は2つのステップで構成されている。まず、攻撃者が95%以上の精度で特定の応答を生成するためにどのモデルを使用したかを決定する方法を示し、次に、攻撃者はこの情報を使ってターゲットモデルに対して一貫して投票することができる。
論文参考訳（メタデータ） (2025-01-13T17:12:38Z)
Self-Directed Turing Test for Large Language Models [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すことができるかどうかを調べる。従来のチューリングテストでは、各参加者が1回に1つのメッセージだけを送信する厳格な対話形式を採用している。本稿では,バーストダイアログ形式を用いた自己指示チューリングテストを提案する。
論文参考訳（メタデータ） (2024-08-19T09:57:28Z)
How Well Can LLMs Echo Us? Evaluating AI Chatbots' Role-Play Ability with ECHO [55.25989137825992]
チューリングテストに触発された評価フレームワークECHOを紹介する。この枠組みは、人間と機械が生成した反応を区別するために、対象個人の知名度に係わる。基礎モデルとして GPT-3.5 と GPT-4 の3つのロールプレイング LLM をECHO を用いて評価した。
論文参考訳（メタデータ） (2024-04-22T08:00:51Z)
Turing's Test, a Beautiful Thought Experiment [0.0]
チューリング試験とその価値に関する主張と疑問が復活した。もしAIが量子物理学なら、現在までに数匹の"Schr"odinger's"猫が殺されただろう。本稿では, チューリングの1950年版に関するいくつかのオープンな疑問に対して, 新たな考古学的根拠を含む, 豊富な証拠を提示する。
論文参考訳（メタデータ） (2023-12-18T19:38:26Z)
Towards a Self-Replicating Turing Machine [0.0]
我々はフォン・ノイマンの普遍コンストラクタと普遍コーパの部分実装を提供する。同じ原理を用いてチューリングマシンも構築する。我々の構成は、望めば突然変異を許容し、簡単な記述言語を提供します。
論文参考訳（メタデータ） (2023-06-29T11:50:58Z)
The Human-or-Machine Matter: Turing-Inspired Reflections on an Everyday Issue [4.309879785418976]
マシンにインテリジェントなラベルを付けることができるのか、あるいは特定のコンテキストにおける人間の能力と一致すると言えるのか、という疑問を副次的に解決する。「私は人間や機械と対話しているか」という、日常のやりとりの中で、一見単純な質問に最初に注意を向ける。
論文参考訳（メタデータ） (2023-05-07T15:41:11Z)
The Turing Deception [0.0]
本研究は従来のチューリングテストを再検討し、ChatGPTのような最近の大規模言語モデルと比較する。アルゴリズムがチューリングの真の独創的な考えのヒントを表示するかどうかという問題は、現時点では未解決であり、潜在的に未解決である。
論文参考訳（メタデータ） (2022-12-09T16:32:11Z)
Sequential Causal Imitation Learning with Unobserved Confounders [82.22545916247269]
猿が猿を見なさい」とは、制度の根底にある仕組みを深く理解せずに「生」の模倣を指して、昔ながらの格言である。本稿では、エピソード毎に複数の意思決定をしなければならないシーケンシャルセッティングにおける因果模倣学習の問題について検討する。
論文参考訳（メタデータ） (2022-08-12T13:53:23Z)
HandoverSim: A Simulation Framework and Benchmark for Human-to-Robot Object Handovers [60.45158007016316]
HandoverSimは、人間からロボットへのオブジェクトハンドオーバのシミュレーションベンチマークである。我々は、物体の手でのつかみの最近のモーションキャプチャーデータセットを活用する。標準化されたプロトコルとメトリクスを使って受信機のトレーニングと評価環境を作成します。
論文参考訳（メタデータ） (2022-05-19T17:59:00Z)
Teach me to play, gamer! Imitative learning in computer games via linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文参考訳（メタデータ） (2021-01-06T21:14:10Z)
Reservoir memory machines [79.79659145328856]
本稿では,ニューラルチューリングマシンのベンチマークテストのいくつかを解くことができる貯水池メモリマシンを提案する。我々のモデルは、外部メモリによるエコー状態ネットワークの拡張と見なすことができ、干渉することなく任意の長さの記憶が可能となる。
論文参考訳（メタデータ） (2020-02-12T01:45:00Z)
Self-recognition in conversational agents [0.5156484100374058]
チューリングテストで自己の考えを持続することは、裁判官がテキストミラーとして振る舞うことを決めた場合、依然として可能である。成功している自己認識は、人工的な存在における自己認識の強い概念に道を開く可能性がある。
論文参考訳（メタデータ） (2020-02-06T16:32:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。