論文の概要: Neural Interactive Proofs
- arxiv url: http://arxiv.org/abs/2412.08897v1
- Date: Thu, 12 Dec 2024 03:21:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:33:50.066269
- Title: Neural Interactive Proofs
- Title(参考訳): ニューラル・インタラクティブな証明
- Authors: Lewis Hammond, Sam Adam-Day,
- Abstract要約: ニューラルネットワークを用いてエージェントを表現する場合について検討する。
証明検証ゲームに基づく統一フレームワークを提案する。
本稿では,ニューラル・インタラクティブな証明を生成するための新しいプロトコルについて述べる。
- 参考スコア(独自算出の注目度): 1.519321208145928
- License:
- Abstract: We consider the problem of how a trusted, but computationally bounded agent (a 'verifier') can learn to interact with one or more powerful but untrusted agents ('provers') in order to solve a given task. More specifically, we study the case in which agents are represented using neural networks and refer to solutions of this problem as neural interactive proofs. First we introduce a unifying framework based on prover-verifier games, which generalises previously proposed interaction protocols. We then describe several new protocols for generating neural interactive proofs, and provide a theoretical comparison of both new and existing approaches. Finally, we support this theory with experiments in two domains: a toy graph isomorphism problem that illustrates the key ideas, and a code validation task using large language models. In so doing, we aim to create a foundation for future work on neural interactive proofs and their application in building safer AI systems.
- Abstract(参考訳): 我々は,信頼されるが計算に縛られたエージェント(検証者)が,与えられたタスクを解くために,一つ以上の強力だが信頼できないエージェント(プローサ)とどのように相互作用するかという問題を考察する。
より具体的には、エージェントがニューラルネットワークを用いて表現され、この問題の解決策を神経対話的証明として参照するケースについて検討する。
まず,従来提案されていたインタラクションプロトコルを一般化した証明検証ゲームに基づく統一フレームワークを提案する。
次に、ニューラル・インタラクティブな証明を生成するためのいくつかの新しいプロトコルを説明し、新しいアプローチと既存のアプローチを理論的に比較する。
最後に、この理論を2つの領域の実験で支持する: 重要なアイデアを示すトイグラフ同型問題と、大きな言語モデルを用いたコード検証タスクである。
そうすることで、我々は、ニューラルネットワークのインタラクティブな証明と、より安全なAIシステム構築におけるその応用に関する将来の研究の基盤を作ることを目標にしています。
関連論文リスト
- Implementation and Application of an Intelligibility Protocol for Interaction with an LLM [0.9187505256430948]
我々の関心は、機械学習エンジンと対話する人間-専門家を含む対話型システムの構築である。
これは、科学、環境、医学などにおける複雑な問題に対処する場合に関係している。
本稿では,汎用実装のアルゴリズム記述と,その利用に関する予備実験を2つの異なる領域で実施する。
論文 参考訳(メタデータ) (2024-10-27T21:20:18Z) - Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks [19.639533220155965]
本稿では,畳み込み型ニューラルネットワークのマルチモーダルな騙し検出への応用について検討する。
2つのトピックについて104人の被験者にインタビューして構築したデータセットを使用します。
論文 参考訳(メタデータ) (2023-11-18T02:44:33Z) - Neural Amortized Inference for Nested Multi-agent Reasoning [54.39127942041582]
本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
論文 参考訳(メタデータ) (2023-08-21T22:40:36Z) - All Roads Lead to Rome? Exploring the Invariance of Transformers'
Representations [69.3461199976959]
本稿では, ビジェクション仮説を学習するために, 非可逆ニューラルネットワーク BERT-INN に基づくモデルを提案する。
BERT-INNの利点は理論上も広範な実験を通じても明らかである。
論文 参考訳(メタデータ) (2023-05-23T22:30:43Z) - Zonotope Domains for Lagrangian Neural Network Verification [102.13346781220383]
我々は、ディープニューラルネットワークを多くの2層ニューラルネットワークの検証に分解する。
我々の手法は線形プログラミングとラグランジアンに基づく検証技術の両方により改善された境界を与える。
論文 参考訳(メタデータ) (2022-10-14T19:31:39Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Dependable Neural Networks Through Redundancy, A Comparison of Redundant
Architectures [0.0]
ロックステップソリューションを検討する前に、一般的な実装の観点から信頼性の問題について議論する。
2つの類似したニューラルネットワークが正確に同じタイミングで結果を生成し、プラットフォーム間の同期が必要とされることは、必ずしも前提ではない、と私たちは考えています。
論文 参考訳(メタデータ) (2021-07-30T12:17:36Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Explaining Away Attacks Against Neural Networks [3.658164271285286]
画像ベースニューラルネットワークに対する敵攻撃を識別する問題について検討する。
そこで本研究では, クリーンデータと逆データに対するモデル予測における説明の相違について検討した。
本稿では,モデルによる説明に基づいて,与えられた入力が逆方向かどうかを識別できるフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-06T15:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。