論文の概要: PROMETHEUS: Automating Deep Causal Research Integrating Text, Data and Models
- arxiv url: http://arxiv.org/abs/2605.12835v1
- Date: Wed, 13 May 2026 00:08:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.733868
- Title: PROMETHEUS: Automating Deep Causal Research Integrating Text, Data and Models
- Title(参考訳): PROMETHEUS:テキスト・データ・モデルの統合による深層因果研究の自動化
- Authors: Sridhar Mahadevan,
- Abstract要約: PROMETHEUSは、検索した文献、書類、レビュー、レポート、エージェントトレース、ソースデータ、コード、シミュレーション、科学モデルを因果アトラスに変換するフレームワークである。
各地域は、因果エピソード、構造化されたクレームテーブル、予測テスト、サポート統計、証明を含む。
結果として得られるトポス世界モデルは、単一の普遍グラフではない。
- 参考スコア(独自算出の注目度): 1.3295383263113112
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models can extract local causal claims from text, but those claims become more useful when organized as persistent, navigable world models rather than as flat summaries. We introduce PROMETHEUS, a framework that turns retrieved literature, filings, reviews, reports, agent traces, source data, code, simulations, and scientific models into causal atlases: sheaf-like families of local causal predictive-state models over an explicit cover of a research substrate. Each local region contains causal episodes, structured claim tables, predictive tests, support statistics, and provenance; restriction maps compare overlapping regions; gluing diagnostics expose agreement, drift, contradiction, and underdetermination. The resulting Topos World Model is not a single universal graph. It is a research instrument for navigating what a corpus says, where it says it, how strongly it is supported, and where local claims fail to assemble into a coherent global view. Three literature-atlas case studies -- ocean-temperature impacts on marine populations, GLP-1 weight-loss evidence, and resveratrol/red-wine health-benefit claims -- illustrate deep causal research from text with explicit locality, evidence, persistent state, and gluing tension. Four grounded-counterfactual case studies -- a Nature Climate Change microplastics forcing paper, an Indus Valley hydrology paper with VIC-derived figure data and model code, the canonical Sachs protein-signaling study with single-cell perturbation data, and a Nature singing-mouse study with MAPseq projection matrices -- show a stronger mode: when a paper ships source data, simulation outputs, or code, PROMETHEUS can evaluate a counterfactual against that scientific substrate and then rebuild the sheaf world model around the
- Abstract(参考訳): 大きな言語モデルはテキストから局所的な因果的主張を抽出することができるが、それらの主張は平らな要約としてではなく、永続的でナビゲート可能な世界モデルとして組織化されるときにより有用になる。
ProMETHEUSは,検索した文献,書類,レビュー,レポート,エージェントトレース,コード,シミュレーション,科学的モデルを因果アトラスに変換するフレームワークである。
各地域は、因果エピソード、構造化されたクレームテーブル、予測テスト、サポート統計、証明を含む。
結果として得られるトポス世界モデルは、単一の普遍グラフではない。
コーパスが何を言っているか、どのくらい強く支持されているか、そして現地の主張が一貫性のあるグローバルな視点に組み立てられていないかをナビゲートするための研究機器である。
海洋環境に対する海洋温度の影響、GLP-1体重の証拠、レスベラトロールと赤ワインの健康問題に関する3つのケーススタディは、明確な地域性、証拠、永続的な状態、緊張感のあるテキストからの深い因果研究を描いている。
基礎となる4つのケーススタディ -- 自然気候変化マイクロプラスチック強制紙、VIC由来の図形データとモデルコードを持つインダスバレー水文学論文、単一セル摂動データを用いたカノニカルサックスタンパク質シグナリング研究、MAPseqプロジェクション行列を用いたナチュラル歌唱マウス研究 -- は、より強力なモードを示す。
関連論文リスト
- CALM: A Causal Analysis Language Model for Tabular Data in Complex Systems with Local Scores, Conditional Independence Tests, and Relation Attributes [15.298086464296235]
観測データからの因果発見は生物学のような科学分野に不可欠である。
制約ベースのアプローチやスコアベースのアプローチを含む既存の手法は、重大な制限に直面している。
本稿では,表データに特化して設計された新しい因果解析言語CALMを紹介する。
論文 参考訳(メタデータ) (2025-10-10T20:19:20Z) - Beyond Memorization: Reasoning-Driven Synthesis as a Mitigation Strategy Against Benchmark Contamination [77.69093448529455]
本稿では,arXiv論文から直接研究レベルのQAを合成するために,無限にスケーラブルなフレームワークを用いて実証的研究を行う。
各種サイズ,開発者,リリース日といったモデルについて,知識カットオフ日に近い性能劣化の欠如を評価した。
合成パイプラインで要求される多段階の推論は、浅い記憶よりも深い複雑さをもたらしたと仮定する。
論文 参考訳(メタデータ) (2025-08-26T16:41:37Z) - Causal Representation Learning in Temporal Data via Single-Parent Decoding [66.34294989334728]
科学的研究はしばしば、システム内の高レベル変数の根底にある因果構造を理解しようとする。
科学者は通常、地理的に分布した温度測定などの低レベルの測定を収集する。
そこで本研究では,単一親の復号化による因果発見法を提案し,その上で下位の潜伏者と因果グラフを同時に学習する。
論文 参考訳(メタデータ) (2024-10-09T15:57:50Z) - Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Exploring Lexical Irregularities in Hypothesis-Only Models of Natural
Language Inference [5.283529004179579]
自然言語推論(NLI)またはテキスト関連認識(RTE)は、文のペア間の関係を予測するタスクです。
包含を理解するモデルは前提と仮説の両方をエンコードするべきである。
Poliakらによる実験。
仮説でのみ観察されたパターンに対するこれらのモデルの強い好みを明らかにした。
論文 参考訳(メタデータ) (2021-01-19T01:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。