論文の概要: A superpersuasive autonomous policy debating system
- arxiv url: http://arxiv.org/abs/2511.17854v1
- Date: Sat, 22 Nov 2025 00:45:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.477236
- Title: A superpersuasive autonomous policy debating system
- Title(参考訳): 超広汎な自律的政策議論システム
- Authors: Allen Roush, Devin Gonier, John Hines, Judah Goldfeder, Philippe Martin Wyder, Sanjay Basu, Ravid Shwartz Ziv,
- Abstract要約: DeepDebater(ディープデバター)は、2チームによる完全な競争政策の議論に参加し、勝利することのできる新しいシステムである。
本システムでは, 特殊なマルチエージェントエージェントの階層構造を採用している。
ライブでインタラクティブなエンドツーエンドのプレゼンテーションパイプラインは、AIスピーチとアニメーションによる議論を描画する。
- 参考スコア(独自算出の注目度): 7.113205880204546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The capacity for highly complex, evidence-based, and strategically adaptive persuasion remains a formidable great challenge for artificial intelligence. Previous work, like IBM Project Debater, focused on generating persuasive speeches in simplified and shortened debate formats intended for relatively lay audiences. We introduce DeepDebater, a novel autonomous system capable of participating in and winning a full, unmodified, two-team competitive policy debate. Our system employs a hierarchical architecture of specialized multi-agent workflows, where teams of LLM-powered agents collaborate and critique one another to perform discrete argumentative tasks. Each workflow utilizes iterative retrieval, synthesis, and self-correction using a massive corpus of policy debate evidence (OpenDebateEvidence) and produces complete speech transcripts, cross-examinations, and rebuttals. We introduce a live, interactive end-to-end presentation pipeline that renders debates with AI speech and animation: transcripts are surface-realized and synthesized to audio with OpenAI TTS, and then displayed as talking-head portrait videos with EchoMimic V1. Beyond fully autonomous matches (AI vs AI), DeepDebater supports hybrid human-AI operation: human debaters can intervene at any stage, and humans can optionally serve as opponents against AI in any speech, allowing AI-human and AI-AI rounds. In preliminary evaluations against human-authored cases, DeepDebater produces qualitatively superior argumentative components and consistently wins simulated rounds as adjudicated by an independent autonomous judge. Expert human debate coaches also prefer the arguments, evidence, and cases constructed by DeepDebater. We open source all code, generated speech transcripts, audio and talking head video here: https://github.com/Hellisotherpeople/DeepDebater/tree/main
- Abstract(参考訳): 高度に複雑でエビデンスをベースとし、戦略的に適応的な説得力を持つ能力は、人工知能にとって大きな課題だ。
IBM Project Debaterのような以前の研究は、比較的平凡なオーディエンスを対象とした、シンプルで簡潔な議論フォーマットで説得力のあるスピーチを生成することに重点を置いていた。
私たちはDeepDebaterを紹介します。DeepDebaterは、完全に修正されていない2チーム間の競争政策の議論に参加し、勝利することのできる、新しい自律システムです。
このシステムでは,LLMエージェントのチームが相互に協調し,個別の議論的タスクを実行するという,特殊なマルチエージェントワークフローの階層的アーキテクチャを採用している。
それぞれのワークフローは、ポリシー論争の証拠(OpenDebateEvidence)の膨大なコーパスを使用して反復的な検索、合成、自己補正を利用し、完全な音声の書き起こし、クロスエグゼマイション、そして反論を生成する。
テキストは、OpenAI TTSで音声に実現され合成され、EchoMimic V1でトーキングヘッドポートレートビデオとして表示される。
完全な自律試合(AI対AI)以外にも、DeepDebaterはハイブリッドな人間-AI操作をサポートしている。
DeepDebaterは、人間が許可したケースに対する予備的な評価において、質的に優れた議論的コンポーネントを生成し、独立した自律的裁判官によって判断されたシミュレートされたラウンドに一貫して勝利する。
専門家の人間討論のコーチはDeepDebaterによって構築された議論、証拠、事例も好んでいる。
私たちは、すべてのコード、生成された音声書き起こし、オーディオ、そして話のヘッドビデオを、ここでオープンソースにしています。
関連論文リスト
- An alignment safety case sketch based on debate [3.2504831918078168]
提案された解決策の1つは、システムの出力の欠陥を議論を通じて指摘するために、別の超人的システムを活用することである。
本稿では,AIの安全性に関する議論の価値について概説する。
論文 参考訳(メタデータ) (2025-05-06T21:53:44Z) - Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すかどうかを調べる。
従来の設定では、各参加者は一度に1つのメッセージに制限される。
本稿では,textitburstダイアログパターンを用いて,元のテストを強化するtextbftextscX-Turingを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z) - Can LLMs Beat Humans in Debating? A Dynamic Multi-agent Framework for Competitive Debate [22.813887723656023]
Agent for Debate (Agent4Debate)は、大規模言語モデル(LLM)に基づく動的マルチエージェントフレームワークである。
評価には、Debatrix自動スコアシステムと、確立されたDebatrix-EloとHuman-Eloのランキングに基づく専門家の人間レビュアーが使用されている。
実験の結果、最先端のAgent4Debateは人間の能力に匹敵する能力を示した。
論文 参考訳(メタデータ) (2024-08-08T14:02:45Z) - On scalable oversight with weak LLMs judging strong LLMs [67.8628575615614]
我々は、2つのAIが1人の裁判官を納得させようとする議論、すなわち1人のAIが1人の裁判官を説得し、質問をする。
大規模言語モデル(LLM)をAIエージェントと人間の判断のためのスタンドインの両方として使用し、判断モデルがエージェントモデルよりも弱いと判断する。
論文 参考訳(メタデータ) (2024-07-05T16:29:15Z) - CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations [97.75037148056367]
CoVoMixは、ゼロショット、人間ライク、マルチスピーカー、マルチラウンド対話音声生成のための新しいモデルである。
対話モデリングと生成の有効性を測定するための総合的なメトリクスセットを考案する。
論文 参考訳(メタデータ) (2024-04-10T02:32:58Z) - A Vector Quantized Approach for Text to Speech Synthesis on Real-World
Spontaneous Speech [94.64927912924087]
我々は、YouTubeやポッドキャストから現実の音声を使ってTSシステムを訓練する。
最近のText-to-Speechアーキテクチャは、複数のコード生成とモノトニックアライメントのために設計されている。
近年のテキスト・トゥ・スペーチ・アーキテクチャは,いくつかの客観的・主観的尺度において,既存のTSシステムより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-08T17:34:32Z) - Detection of AI-Synthesized Speech Using Cepstral & Bispectral
Statistics [0.0]
本稿では,AI合成音声と人間の音声を区別する手法を提案する。
高次統計は、合成音声と比較して人間の音声の相関が低い。
また, ケプストラム分析により, 合成音声に欠落する人間の音声の耐久性成分が明らかになった。
論文 参考訳(メタデータ) (2020-09-03T21:29:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。