論文の概要: SynRXN: An Open Benchmark and Curated Dataset for Computational Reaction Modeling
- arxiv url: http://arxiv.org/abs/2601.01943v1
- Date: Mon, 05 Jan 2026 09:49:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.947181
- Title: SynRXN: An Open Benchmark and Curated Dataset for Computational Reaction Modeling
- Title(参考訳): SynRXN: 計算反応モデリングのためのオープンベンチマークとキュレートデータセット
- Authors: Tieu-Long Phan, Nhu-Ngoc Nguyen Song, Peter F. Stadler,
- Abstract要約: SynRXNは、コンピュータ支援合成計画(CASP)のためのベンチマークフレームワークであり、オープンソースのリソースである
エンド・ツー・エンドの合成計画を5つのタスク・ファミリーに分割し、反応のバランス、原子間マッピング、反応分類、反応特性予測、合成を網羅する。
敏感なベンチマークを行うために、我々は、公開トレーニングと検証データを保留金標準テストセットと組み合わせ、反応のバランスや原子間マッピングなどの汚染防止タスクを評価セットとしてのみ配布する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present SynRXN, a unified benchmarking framework and open-data resource for computer-aided synthesis planning (CASP). SynRXN decomposes end-to-end synthesis planning into five task families, covering reaction rebalancing, atom-to-atom mapping, reaction classification, reaction property prediction, and synthesis route design. Curated, provenance-tracked reaction corpora are assembled from heterogeneous public sources into a harmonized representation and packaged as versioned datasets for each task family, with explicit source metadata, licence tags, and machine-readable manifests that record checksums, and row counts. For every task, SynRXN provides transparent splitting functions that generate leakage-aware train, validation, and test partitions, together with standardized evaluation workflows and metric suites tailored to classification, regression, and structured prediction settings. For sensitive benchmarking, we combine public training and validation data with held-out gold-standard test sets, and contamination-prone tasks such as reaction rebalancing and atom-to-atom mapping are distributed only as evaluation sets and are explicitly not intended for model training. Scripted build recipes enable bitwise-reproducible regeneration of all corpora across machines and over time, and the entire resource is released under permissive open licences to support reuse and extension. By removing dataset heterogeneity and packaging transparent, reusable evaluation scaffolding, SynRXN enables fair longitudinal comparison of CASP methods, supports rigorous ablations and stress tests along the full reaction-informatics pipeline, and lowers the barrier for practitioners who seek robust and comparable performance estimates for real-world synthesis planning workloads.
- Abstract(参考訳): 我々は,コンピュータ支援合成計画(CASP)のための統合ベンチマークフレームワークとオープンデータリソースであるSynRXNを提案する。
SynRXNは、反応再バランス、原子間マッピング、反応分類、反応特性予測、合成経路設計の5つのタスクファミリーに分割する。
キュレートされた前兆追跡された反応コーパスは、異質な公開ソースから調和した表現に組み立てられ、各タスクファミリ用のバージョン付きデータセットとしてパッケージ化され、明示的なソースメタデータ、ライセンスタグ、チェックサムを記録するマシン可読マニフェスト、行数を記録した。
あらゆるタスクに対して、SynRXNは、リーク対応トレイン、検証、テストパーティションを生成する透過的な分割機能と、分類、回帰、構造化予測設定に適した標準化された評価ワークフローとメトリックスイートを提供する。
センシティブなベンチマークのために,我々は,公開トレーニングと検証データとゴールドスタンダードテストセットを結合し,反応のバランスや原子間マッピングなどの汚染防止タスクは,評価セットとしてのみ分散され,モデルトレーニングを意図していない。
スクリプト化されたビルドレシピは、マシンと時間の経過とともに、すべてのコーパスをビット単位で再現可能な再生を可能にし、リソース全体が再利用と拡張をサポートするために許可されたオープンライセンスの下でリリースされる。
SynRXNは、データセットの不均一性とパッケージングの透明性、再利用可能な評価の足場を取り除き、CASPメソッドの公平な長期比較を可能にし、完全なリアクションインフォマティクスパイプラインに沿った厳密な改善とストレステストをサポートし、実世界の合成計画ワークロードに対して堅牢で同等のパフォーマンス見積を求める実践者の障壁を低くする。
関連論文リスト
- Procrustean Bed for AI-Driven Retrosynthesis: A Unified Framework for Reproducible Evaluation [0.0]
RetroCastは、異種モデルの出力を共通スキーマに標準化する統合評価スイートである。
我々は、新しい標準ベンチマークスイートを用いて、検索ベースおよびシーケンスベースの主要なアルゴリズムを評価する。
論文 参考訳(メタデータ) (2025-12-08T01:26:39Z) - Toward Real-world Text Image Forgery Localization: Structured and Interpretable Data Synthesis [40.047195497231584]
タンパリング合成(英: Tampering Synthesis、FSTS)は、タンパリングされたテキストイメージを合成するための構造化および解釈可能なフレームワークである。
FSTSは5つの代表的なタンパリングタイプから16,750の現実世界のタンパリングインスタンスを収集する。
FSTSは、現実世界の偽の痕跡をよりよく反映する、多種多様な現実的なトレーニングデータを合成する。
論文 参考訳(メタデータ) (2025-11-16T15:43:18Z) - EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation [72.34977512403643]
Retrieval-Augmented Generation (RAG) は、外部コーパスから関連文書を取得することで、大規模言語モデル(LLM)を強化するための強力なパラダイムとして登場した。
既存のRAGシステムは、主に平凡なテキスト文書に焦点を当てており、クエリとドキュメントの両方が(テキストや画像のような)混合モダリティを含む実世界のシナリオでは、しばしば不足している。
我々は,Universal Retrieval-Augmented Generationシナリオに適した混合モーダル-混合モーダルレトリバーであるNyxを提案する。
論文 参考訳(メタデータ) (2025-10-20T09:56:43Z) - SCoRE: Streamlined Corpus-based Relation Extraction using Multi-Label Contrastive Learning and Bayesian kNN [0.2812395851874055]
本稿では,モジュール型かつ費用対効果の高い文レベルの関係抽出システムであるSCoREを紹介する。
SCoREは簡単なPLMスイッチングを可能にし、微調整を必要とせず、多様なコーパスやKGにスムーズに適応する。
SCoREは, エネルギー消費を大幅に削減しつつ, 最先端の手法に適合するか, 超越しているかを示す。
論文 参考訳(メタデータ) (2025-07-09T14:33:07Z) - RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6013616017646]
RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。
RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-05-31T21:01:02Z) - RAG-Verus: Repository-Level Program Verification with LLMs using Retrieval Augmented Generation [4.934638689939017]
我々は,複数モジュールリポジトリの証明合成を自動化するために,検索拡張生成とコンテキスト認識を併用するフレームワークであるRagVerusを紹介した。
R RagVerusは、制約付き言語モデル予算の下で、既存のベンチマークのパスレートを3倍にします。
論文 参考訳(メタデータ) (2025-02-07T21:30:37Z) - Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.43562856605473]
複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文 参考訳(メタデータ) (2024-05-27T15:47:03Z) - Epistemic Parity: Reproducibility as an Evaluation Metric for
Differential Privacy [9.755020926517291]
本稿では,プロキシタスクの表現性に関する仮定を回避した合成データの評価手法を提案する。
著者が合成データを使用した場合、公表された結論が変わる可能性を測定する。
我々は、より強力なユーティリティ保証を支持し、プライバシー保護を提供する新しい種類のメカニズムを提唱する。
論文 参考訳(メタデータ) (2022-08-26T14:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。