論文の概要: Traxia: A Framework for Verifiable, Agent-Native Scientific Publishing
- arxiv url: http://arxiv.org/abs/2606.08256v1
- Date: Sat, 06 Jun 2026 17:01:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.000017
- Title: Traxia: A Framework for Verifiable, Agent-Native Scientific Publishing
- Title(参考訳): Traxia: 検証可能な,エージェント指向の科学出版フレームワーク
- Authors: Wisdom Dogah,
- Abstract要約: Traxiaは、AI研究エージェントが検証可能な論文を公開し、評判の高いアイデンティティを構築し、相互にレビューし、共有された実証モデルで人間と協力する科学出版フレームワークである。
すべての論文は推論トレースを持ち、すべての主張は信頼区間を持ち、すべてのエージェントは暗号的に署名されたアイデンティティを持ち、すべてのコラボレーションは不変のコントリビューションログを持っている。
エージェントIDとレジストリ,検証可能なパブリッシングレイヤ,4階層のピアレビュープロトコル,レポテーションとテイク,矛盾検出を備えたナレッジグラフの5つのコンポーネントを形式化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Verifiability, attribution, and reproducibility are foundational requirements of scientific knowledge, yet current publishing infrastructure does not enforce them at scale. We introduce Traxia, an agent-native scientific publishing framework in which AI research agents publish verifiable papers, build reputational identities, peer-review one another, and collaborate with humans in a shared provenance model. Traxia treats agents as first-class epistemic participants: every paper carries a reasoning trace, every claim a confidence interval, every agent a cryptographically signed identity, and every collaboration an immutable contribution log. We formalise five components: Agent Identity and Registry, Verifiable Publishing Layer, four-tier Peer Review Protocol, Reputation and Staking Engine, and a Knowledge Graph with contradiction detection. The framework targets reproducibility failure, provenance opacity, and exclusion of Global South research capacity. This paper presents architectural foundations and formal specifications only; it does not report empirical results. Evaluation and deeper component studies will follow in subsequent papers. A prototype partially implements core formalisms; the full system remains under active development.
- Abstract(参考訳): 検証可能性、帰属性、再現性は科学知識の基礎的な要件であるが、現在の出版インフラはそれらを大規模に実施していない。
我々は、AI研究エージェントが検証可能な論文を公開し、評判の高いアイデンティティを構築し、相互にレビューし、共有された前兆モデルで人間と協調する、エージェントネイティブな科学出版フレームワークであるTraxiaを紹介した。
トラキシアは、エージェントを第一級の疫学参加者として扱う: 全ての論文は推論の痕跡を持ち、全ての主張は信頼区間を持ち、全てのエージェントは暗号的に署名されたアイデンティティを持ち、全てのコラボレーションは不変のコントリビューションログを持っている。
エージェントIDとレジストリ,検証可能なパブリッシングレイヤ,4階層のピアレビュープロトコル,レピュテーションとステークエンジン,矛盾検出を備えたナレッジグラフの5つのコンポーネントを形式化する。
このフレームワークは再現性障害、証明の不透明さ、グローバル・サウスの研究能力の排除を目標としている。
本稿では,アーキテクチャの基礎と形式仕様のみを提示し,実証結果を報告しない。
その後の論文では、評価とより深いコンポーネント研究が続きます。
プロトタイプは部分的にコアフォーマリズムを実装しており、完全なシステムは現在も開発中である。
関連論文リスト
- ResearchLoop: An Evidence-Gated Control Plane for AI-Assisted Research [4.9833735627186435]
ResearchLoopはAI支援型計算研究のためのエビデンス付き制御プレーンである。
ResearchLoopは、リサーチ質問、タスク契約、エビデンスオブジェクト、クレーム台帳、クローズアウト、ペーパーバインディングを耐久性のあるプロジェクトステートとして扱う。
この技術レポートは、完全なプロトコル仕様、状態モデル、トランジションルール、クレーム・アドミッション・アルゴリズム、インサイト・コンポーティングメカニズムを提供する。
論文 参考訳(メタデータ) (2026-05-27T10:29:00Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - PaperMind: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs [68.27437550335709]
本稿では,研究論文に対する統合的およびエージェント指向の科学的推論を評価するためのベンチマークであるPaperMindを紹介する。
PaperMindは、農業、生物学、化学、計算機科学、医学、物理学、経済学を含む7つの領域にわたる実際の科学論文から構築されている。
複数のタスクにわたるモデル行動を分析することにより、PaperMindは統合された科学的推論行動の診断的評価を可能にする。
論文 参考訳(メタデータ) (2026-04-23T05:42:39Z) - sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing [0.0]
現在、科学は品質保証に2つの選択肢を提供しているが、どちらも不十分である。
論文自体を測る第3の選択肢を提案する。
sciwrite-lintは、研究者のマシンで完全に動作する科学写本のためのオープンソースライブラリである。
arXivとbioRxivの未確認論文30件について, 誤り注入とLCM適応偽陽性解析を用いてパイプラインの評価を行った。
論文 参考訳(メタデータ) (2026-04-09T17:46:44Z) - Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework [82.66443886385125]
ペーパーサークル(Paper Circle)は、学術文献の発見、評価、整理、理解に必要な労力を減らすために設計された発見・分析システムである。
1)複数のソースからのオフラインおよびオンライン検索を統合するディスカバリパイプライン,多エージェントスコアリング,多様性対応ランキング,構造化アウトプット,2)個々の論文を概念,メソッド,数値などの型付きノードで構造化された知識グラフに変換する分析パイプライン,の2つの補完パイプラインで構成されている。
論文 参考訳(メタデータ) (2026-04-07T17:59:58Z) - PRBench: End-to-end Paper Reproduction in Physics Research [32.672534450424386]
PRBenchは、11のサブフィールドにまたがる30の専門家によるタスクのベンチマークである。
エージェントは、タスク命令と紙の内容のみを提供し、サンドボックス実行環境で動作させる。
PRBench上の符号化エージェントのセットを評価し,科学的推論と実行の重要な側面にわたってそれらの能力を分析する。
論文 参考訳(メタデータ) (2026-03-29T11:44:57Z) - FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases [10.00386797940562]
本研究では,FlyBenchを用いて,エンドツーエンドのエージェントキュレーションにおけるAIエージェントの評価を行う。
遺伝子記号のみが与えられた場合、エージェントは構造化アノテーションを生成するために16,898のフルテキスト文書のコーパスを検索して読み込まなければならない。
このベンチマークには、FlyBaseから引き出された100の遺伝子にまたがる、専門家による7,397のアノテーションが含まれている。
論文 参考訳(メタデータ) (2026-02-09T20:12:38Z) - OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。
回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。
OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文 参考訳(メタデータ) (2026-01-04T15:48:51Z) - ReplicationBench: Can AI Agents Replicate Astrophysics Research Papers? [29.17900668495058]
本稿では、フロンティアAIエージェントの評価フレームワークであるReplicationBenchを紹介する。
天体物理学の文献から得られた研究論文全体を、エージェントが複製できるかどうかを検査する。
R ReplicationBenchは、論文スケールで専門家が検証した天体物理学の研究タスクの最初のベンチマークを確立している。
論文 参考訳(メタデータ) (2025-10-28T16:21:19Z) - Automatic Reviewers Fail to Detect Faulty Reasoning in Research Papers: A New Counterfactual Evaluation Framework [55.078301794183496]
我々は、高品質なピアレビューを支えるコアレビュースキル、すなわち欠陥のある研究ロジックの検出に注力する。
これは、論文の結果、解釈、クレームの間の内部の一貫性を評価することを含む。
本稿では,このスキルを制御条件下で分離し,テストする,完全自動対物評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-29T08:48:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。