論文の概要: Turing Test 2.0: The General Intelligence Threshold
- arxiv url: http://arxiv.org/abs/2505.19550v1
- Date: Mon, 26 May 2025 06:13:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.204813
- Title: Turing Test 2.0: The General Intelligence Threshold
- Title(参考訳): チューリングテスト2.0: 一般知能の脅威
- Authors: Georgios Mappouras,
- Abstract要約: 本稿では,システムが汎用インテリジェンス(G.I.)を,シンプルで包括的で明確なフェール/パス方式で達成したかどうかを検出するための,テスト構築のための新しいフレームワークを提案する。
現代のA.I.モデル上でのチューリングテスト2.0フレームワークに従ってテストを適用する実例を実例で示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the rise of artificial intelligence (A.I.) and large language models like Chat-GPT, a new race for achieving artificial general intelligence (A.G.I) has started. While many speculate how and when A.I. will achieve A.G.I., there is no clear agreement on how A.G.I. can be detected in A.I. models, even when popular tools like the Turing test (and its modern variations) are used to measure their intelligence. In this work, we discuss why traditional methods like the Turing test do not suffice for measuring or detecting A.G.I. and provide a new, practical method that can be used to decide if a (computer or any other) system has reached or surpassed A.G.I. To achieve this, we make two new contributions. First, we present a clear definition for general intelligence (G.I.) and set a G.I. threshold (G.I.T.) that can be used to distinguish between systems that achieve A.G.I. and systems that do not. Second, we present a new framework on how to construct tests that can detect if a system has achieved G.I. in a simple, comprehensive, and clear-cut fail/pass way. We call this novel framework the Turing Tests 2.0. We then demonstrate real-life examples of applying tests that follow our Turing Tests 2.0 framework on modern A.I. models.
- Abstract(参考訳): 人工知能(A.I.)の台頭とChat-GPTのような大規模言語モデルにより、人工知能(A.G.I)を達成するための新たなレースが始まっている。
A.I.がA.G.I.をいつ達成するかを推測する人は多いが、チューリングテスト(およびその現代のバリエーション)のような一般的なツールが彼らの知性を測定するのに使われているとしても、A.G.I.がA.I.モデルでどのように検出できるかについては明確な合意はない。
本研究では,チューリング試験のような従来の手法がA.G.I.の測定や検出に適さない理由を論じ,A.G.I.に到達したか否かを判断する新しい実用的な方法を提案する。
まず、一般知性(G.I.)を明確に定義し、A.G.I.を達成するシステムとそうでないシステムとを区別するために使用できるG.I.しきい値(G.I.T.)を設定する。
第2に,システムがG.I.を達成できたかどうかを,シンプルで包括的で明確なフェール/パス方式で検出可能な,テスト構築のための新しいフレームワークを提案する。
私たちはこの新しいフレームワークをチューリングテスト2.0と呼びます。
次に、現代のA.I.モデルでチューリングテスト2.0フレームワークに従ってテストを適用する実例を紹介します。
関連論文リスト
- Generative AI Act II: Test Time Scaling Drives Cognition Engineering [28.818378991228563]
2024年現在)は、モデルが知識検索システムからテスト時間スケーリング技術を通じて思考構築エンジンへ移行している場所である。
この新たなパラダイムは、言語に基づく思考を通じて、AIとマインドレベルなつながりを確立する。
包括的なチュートリアルと最適化された実装を通じて、これらの先進的なアプローチを体系的に分解する。
論文 参考訳(メタデータ) (2025-04-18T17:55:58Z) - AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0]
本稿では,AGITB(Artificial General Intelligence Test Bed)を紹介する。
AGITBは、シンボル表現や事前訓練に頼ることなく、時間にわたってバイナリ信号を予測できるモデルの能力を通じて、インテリジェンスを評価する。
テストベッドは、事前のバイアスを前提とせず、意味的な意味から独立して動作し、残酷な力や記憶によって解決不可能性を確保する。
論文 参考訳(メタデータ) (2025-04-06T10:01:15Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - Evaluating Intelligence via Trial and Error [59.80426744891971]
本研究では,試行錯誤プロセスにおける失敗回数に基づいて知性を評価するためのフレームワークとして,Survival Gameを紹介した。
フェールカウントの期待と分散の両方が有限である場合、新しい課題に対するソリューションを一貫して見つける能力を示す。
我々の結果は、AIシステムは単純なタスクで自律レベルを達成するが、より複雑なタスクではまだまだ遠いことを示している。
論文 参考訳(メタデータ) (2025-02-26T05:59:45Z) - A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to
GPT-5 All You Need? [112.12974778019304]
生成AI(AIGC、つまりAI生成コンテンツ)は、テキスト、画像、その他を分析、作成する能力により、あらゆる場所で話題を呼んだ。
純粋な分析から創造へと移行するAIの時代において、ChatGPTは最新の言語モデルであるGPT-4とともに、多くのAIGCタスクからなるツールである。
本研究は,テキスト,画像,ビデオ,3Dコンテンツなど,出力タイプに基づいたAIGCタスクの技術的開発に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-21T10:09:47Z) - I2D2: Inductive Knowledge Distillation with NeuroLogic and
Self-Imitation [89.38161262164586]
本稿では,ジェネリック生成の課題に着目し,コモンセンス知識の生成モデルについて検討する。
我々は,西欧の記号的知識蒸留を緩やかに追従する新しいコモンセンス蒸留フレームワークであるI2D2を紹介する。
我々の研究はジェネリックの新たなコーパス、Gen-A-tomicに繋がる。
論文 参考訳(メタデータ) (2022-12-19T04:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。