論文の概要: Toward an Engineering of Science: Rebalancing Generation and Verification in the Age of AI
- arxiv url: http://arxiv.org/abs/2605.10425v1
- Date: Mon, 11 May 2026 12:00:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.788028
- Title: Toward an Engineering of Science: Rebalancing Generation and Verification in the Age of AI
- Title(参考訳): 科学工学に向けて:AI時代における創出と検証の再バランス
- Authors: Jiaqi W. Ma,
- Abstract要約: AIシステムは、論文、レビュー、サーベイなどの有望な科学的アーティファクトを安価に生成できるようになった。
このことは、我々の科学的システムにおいて、不信だがもっともらしい人工物が、システムがフィルターを外すよりも早く蓄積されるという、仮死性汚染のリスクを生み出します。
- 参考スコア(独自算出の注目度): 3.0458514384586404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI systems can now cheaply generate plausible scientific artifacts such as papers, reviews, and surveys. This creates a risk of \emph{epistemic pollution} in our scientific systems, where unreliable but plausible-looking artifacts can accumulate faster than the system can filter them out. The problem is structural: the epistemic infrastructure of science was calibrated to a world where producing a plausible artifact required substantial expertise, labor, and time, so generation cost itself served as a rough filter; AI weakens that filter without comparably lowering verification cost. We argue that \textbf{AI-era science should treat this as an engineering problem: redesigning epistemic infrastructure to rebalance the costs of generation and verification}. The current paper-centered system makes verification expensive: papers compress long-context scientific logic into prose, forcing reviewers, human or AI, to reconstruct underlying argument structure before they can evaluate it. As one step in this direction, we propose \textbf{blueprints} as preliminary epistemic infrastructure: structured, decomposed research artifacts that represent claims, evidence, assumptions, and definitions as typed graph components. Blueprints are designed to trade an upfront generation cost for cheaper, more local, more distributed verification downstream. We have instantiated the proposal in a proof-of-concept prototype.
- Abstract(参考訳): AIシステムは、論文、レビュー、サーベイなどの有望な科学的アーティファクトを安価に生成できるようになった。
これは、我々の科学的システムにおいて、信頼できないが確実な外観のアーティファクトが、システムによってフィルタリングされるよりも早く蓄積されるという、emph{epistemic pollution}のリスクを生み出します。
問題は構造的であり、科学の疫学的な基盤は、もっともらしい人工物を作るには相当な専門知識、労力、時間を必要とする世界へと調整されたため、生成コスト自体が粗いフィルターとして機能し、AIはそのフィルターを、検証コストを比較的に下げることなく弱める。
我々は,『textbf{AI-era 』科学がこれを工学的な問題として扱うべきだと主張している。
論文は、長文の科学論理を散文に圧縮し、レビュアー、人間またはAIに、それを評価する前に基礎となる議論構造を再構築するよう強制する。
この方向の1つのステップとして、構造的、分解された研究成果物(クレーム、エビデンス、仮定、定義を型付きグラフコンポーネントとして表現する)として、先天的な基盤として、textbf{blueprints}を提案する。
Blueprintsは、より安く、よりローカルで、より分散的な検証を下流で行うために、事前生成コストをトレードオフするように設計されている。
我々はその提案を概念実証のプロトタイプでインスタンス化した。
関連論文リスト
- Repurposing Image Diffusion Models for Adversarial Synthetic Structured Data: A Case Study of Ground Truth Drift [0.0]
修正されていない安定拡散U-Netは、各行を小さな擬似画像に変換することにより、UCIアダルト所得データセットに適用する。
攻撃者は、それを受信するマシンのように考えることで、合成証拠で成功する。
論文 参考訳(メタデータ) (2026-05-01T17:11:04Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection [29.031594944403096]
我々は,AIによる科学的人物検出のための最初のベンチマークを示す。
その結果、現在の手法はゼロショット転送で劇的に失敗し、強力なジェネレータ固有のオーバーフィッティングを示し、一般的な後処理の腐敗の下でも脆弱であることがわかった。
このベンチマークが、堅牢で一般化可能な科学フィギュア法医学研究の基盤となることを願っている。
論文 参考訳(メタデータ) (2026-04-09T13:11:01Z) - The Verification Crisis: Expert Perceptions of GenAI Disinformation and the Case for Reproducible Provenance [47.03825808787752]
本稿では,AI研究者,政策立案者,偽情報専門家による縦断的専門家意識調査(N=21)の第1波から得られた知見について述べる。
テキスト、画像、オーディオ、ビデオといったマルチモーダルな脅威の重大さを調査し、現在の緩和戦略を評価する。
その結果、ディープフェイクビデオは即時「衝撃」の値を示す一方で、大規模テキスト生成は「印象的断片化」のシステム的リスクをもたらすことが示された。
論文 参考訳(メタデータ) (2026-02-02T13:45:12Z) - Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility [57.83550091882176]
生成パラダイム,評価,下流利用における科学的画像合成について検討する。
本稿では,情報の有用性と論理的妥当性に基づいて生成した画像を評価するSciGenBenchを紹介する。
厳密に検証された合成科学画像上の微調整された大規模マルチモーダルモデルにより、一貫した推論ゲインが得られることを示す。
論文 参考訳(メタデータ) (2026-01-17T14:18:36Z) - AI4X Roadmap: Artificial Intelligence for the advancement of scientific pursuit and its future directions [65.44445343399126]
我々は、生物学、化学、気候科学、数学、材料科学、物理学、自動運転研究所、非伝統的コンピューティングにまたがるAI可能な科学を考察する。
多様な信頼性のあるデータの必要性、伝達可能な電子構造と原子間モデル、AIシステムがエンドツーエンドの科学合成に統合される。
ドメイン全体にわたって、大規模な基礎モデル、アクティブラーニング、自動運転車研究所が、予測と検証の間のループを閉じる方法について強調する。
論文 参考訳(メタデータ) (2025-11-26T02:10:28Z) - Unlearning as Ablation: Toward a Falsifiable Benchmark for Generative Scientific Discovery [0.0]
大きな言語モデル(LLM)は本当に新しい知識を生成するのか、それとも単に記憶された断片をリミックスするだけなのか?
建設科学的発見のフレーバーとして,非学習的アズ・アブレーションを提案する。
論文 参考訳(メタデータ) (2025-08-25T05:24:15Z) - Atomic Reasoning for Scientific Table Claim Verification [83.14588611859826]
非専門家は、その高い情報密度と認識される信頼性のために、科学的表に基づく主張を誤解させるおそれがある。
既存のテーブルクレーム検証モデル、例えば最先端の大規模言語モデル(LLM)は、しばしば精密なきめ細かい推論に苦しむ。
認知負荷理論に触発されて、表に基づく主張を解釈するモデルの能力を高めるには、認知負荷を減らす必要がある。
論文 参考訳(メタデータ) (2025-06-08T02:46:22Z) - Synthetic Disinformation Attacks on Automated Fact Verification Systems [53.011635547834025]
本研究では,2つのシミュレーション環境において,自動ファクトチェッカーの合成正反対証拠に対する感度について検討する。
これらのシステムでは,これらの攻撃に対して大幅な性能低下がみられた。
偽情報の発生源としての現代のNLGシステムの脅威の増大について論じる。
論文 参考訳(メタデータ) (2022-02-18T19:01:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。