Fugu-MT 論文翻訳(概要): Debate is efficient with your time

論文の概要: Debate is efficient with your time

arxiv url: http://arxiv.org/abs/2602.08630v1
Date: Mon, 09 Feb 2026 13:21:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-10 20:26:25.247356
Title: Debate is efficient with your time
Title（参考訳）: 議論は時間とともに効率的です
Authors: Jonah Brown-Cohen, Geoffrey Irving, Simon C. Marshall, Ilan Newman, Georgios Piliouras, Mario Szegedy,
Abstract要約: 本稿では,検証者が検証しなければならない最小のビット数について,議論を正しく決定するDQCについて紹介する。 PSPACE/poly は O(log n) クエリで決定可能な関数のクラスである。また、全ての入力ビットに依存する関数はOmega(log n)クエリを必要とし、サイズ s の回路で計算可能な関数は DQC(f) = log(s) + 3 を満たすことも確認した。
参考スコア（独自算出の注目度）: 26.121215987560635
License: http://creativecommons.org/licenses/by/4.0/
Abstract: AI safety via debate uses two competing models to help a human judge verify complex computational tasks. Previous work has established what problems debate can solve in principle, but has not analysed the practical cost of human oversight: how many queries must the judge make to the debate transcript? We introduce Debate Query Complexity}(DQC), the minimum number of bits a verifier must inspect to correctly decide a debate. Surprisingly, we find that PSPACE/poly (the class of problems which debate can efficiently decide) is precisely the class of functions decidable with O(log n) queries. This characterisation shows that debate is remarkably query-efficient: even for highly complex problems, logarithmic oversight suffices. We also establish that functions depending on all their input bits require Omega(log n) queries, and that any function computable by a circuit of size s satisfies DQC(f) <= log(s) + 3. Interestingly, this last result implies that proving DQC lower bounds of log(n) + 6 for languages in P would yield new circuit lower bounds, connecting debate query complexity to central questions in circuit complexity.
Abstract（参考訳）: 討論によるAI安全性は、2つの競合モデルを使用して、人間の判断が複雑な計算タスクを検証するのに役立つ。これまでの研究は、議論が原則的に解決できる問題を確立してきたが、人間の監視の実践的なコストを分析していない。本稿では,検証者が検証しなければならない最小のビット数について,議論を正しく決定するDQC(Debate Query Complexity)を紹介する。驚いたことに、PSPACE/poly(議論が効果的に決定できる問題のクラス)は正確にO(log n)クエリで決定できる関数のクラスである。この特徴付けは、議論は極めてクエリ効率が良く、非常に複雑な問題であっても対数的監視が十分であることを示している。また、全ての入力ビットに依存する関数はOmega(log n)クエリを必要とし、サイズ s の回路で計算可能な関数は DQC(f) <= log(s) + 3 を満たすことも確認した。興味深いことに、この最後の結果は、P の言語に対する DQC の log(n) + 6 の低い境界を証明すれば、新しい回路の低い境界が得られ、回路複雑性における中心的な問題と議論のクエリ複雑性が結合することを意味する。

関連論文リスト

OrLog: Resolving Complex Queries with LLMs and Probabilistic Reasoning [51.58235452818926]
そこで我々は,論理的推論から述語レベルの妥当性推定を分離するニューロシンボリック検索フレームワークOrLogを紹介する。大規模言語モデル (LLM) は1つの復号のない前方通過において原子述語に対する可視性スコアを提供し、確率論的推論エンジンはクエリ満足度の後方確率を導出する。
論文参考訳（メタデータ） (2026-01-30T15:31:58Z)
Avoiding Obfuscation with Prover-Estimator Debate [33.14645106993676]
本稿では,複雑な問題に対する人間の判断の正当性を保証するAI討論のためのプロトコルを提案する。不正直な議論者は、正直な相手に計算的に難解な問題を解くよう強制する計算効率のよい戦略を利用できる。
論文参考訳（メタデータ） (2025-06-16T15:37:33Z)
Efficient and Scalable Neural Symbolic Search for Knowledge Graph Complex Query Answering [50.1887329564127]
複雑なクエリに対する効率的でスケーラブルなシンボル検索フレームワークを提案する。我々のフレームワークは、ほぼ同じ性能を維持しながら、シンボリックメソッドの計算負荷を90%削減する。
論文参考訳（メタデータ） (2025-05-13T01:24:09Z)
Critical Thinking: Which Kinds of Complexity Govern Optimal Reasoning Length? [72.70486097967124]
決定論的有限オートマトン(DFAs)を用いたフレームワークの定式化正しい解を生成する確率が最大になるような推論トークンが最適に存在することを示す。新たな問題に対する推論トークンの最適個数を予測し、最適でない回答をフィルタリングすることで、一貫した精度の向上が得られる。
論文参考訳（メタデータ） (2025-04-02T17:45:58Z)
Advancing Algorithmic Approaches to Probabilistic Argumentation under the Constellation Approach [0.0]
完全拡張である引数の集合の確率を計算する複雑なタスクのアルゴリズムを開発する。実験的評価は我々のアプローチの可能性を示唆している。
論文参考訳（メタデータ） (2024-07-06T12:08:38Z)
On scalable oversight with weak LLMs judging strong LLMs [67.8628575615614]
我々は、2つのAIが1人の裁判官を納得させようとする議論、すなわち1人のAIが1人の裁判官を説得し、質問をする。大規模言語モデル(LLM)をAIエージェントと人間の判断のためのスタンドインの両方として使用し、判断モデルがエージェントモデルよりも弱いと判断する。
論文参考訳（メタデータ） (2024-07-05T16:29:15Z)
Exceeding Computational Complexity Trial-and-Error Dynamic Action and Intelligence [0.0]
計算複雑性 (Computational complexity) は、計算の難易度を規定する計算機科学のコア理論である。本稿では,概念を明確にし,不特定型コンピューティング,特化型コンピューティング,コンピュータエージェント,動的検索などの定義を提案する。また,このフレームワーク,すなわちトライアル・アンド・エラー+動的検索を提案し,議論する。
論文参考訳（メタデータ） (2022-12-22T21:23:27Z)
Successive Prompting for Decomposing Complex Questions [50.00659445976735]
最近の研究は、大規模言語モデル(LM)の機能を活用して、数ショットで複雑な質問応答を行う。そこでは、複雑なタスクを単純なタスクに繰り返し分解し、それを解決し、最終解を得るまでプロセスを繰り返します。我々の最良のモデル(逐次プロンプト付き)は、DROPデータセットの数ショットバージョンにおいて、5%の絶対F1の改善を実現します。
論文参考訳（メタデータ） (2022-12-08T06:03:38Z)
On Theoretical Complexity and Boolean Satisfiability [0.0]
この論文は、コンピューティング理論において最も中心的な概念をいくつか導入している。次に,Hhorn-SAT や 3-SAT などの抽出可能な変種を探索する。最後に,3-SATから有名なNP完全グラフ問題への還元を確立する。
論文参考訳（メタデータ） (2021-12-22T10:13:34Z)
A tetrachotomy of ontology-mediated queries with a covering axiom [1.749935196721634]
我々の懸念は、標準的なデータベースクエリへの記述とそれらの最適な書き換えを介し、クエリに応答する際のデータ複雑さを効率的に決定することである。我々は、疎結合シロップ(d-シロップ)と呼ばれるブール共役型クエリに焦点を当てる。一部のd-シロップは指数的な大きさの分解能しか持たないが、そのうちのいくつかは二重指数サイズの正存在量書き換えと単帰的データログ書き換えのみである。
論文参考訳（メタデータ） (2020-06-07T14:47:07Z)
From Checking to Inference: Actual Causality Computations as Optimization Problems [79.87179017975235]
本稿では、最適化問題として二元非巡回モデルよりも、因果推論の異なる概念を定式化するための新しいアプローチを提案する。 8000ドル以上の変数を持つモデルを用いて,MaxSAT が ILP を上回り,数秒単位でチェック処理を行う場合が多い。
論文参考訳（メタデータ） (2020-06-05T10:56:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。