Fugu-MT 論文翻訳(概要): The Open Catalyst 2020 (OC20) Dataset and Community Challenges

論文の概要: The Open Catalyst 2020 (OC20) Dataset and Community Challenges

arxiv url: http://arxiv.org/abs/2010.09990v5
Date: Fri, 24 Sep 2021 14:09:17 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-05 07:49:22.665444
Title: The Open Catalyst 2020 (OC20) Dataset and Community Challenges
Title（参考訳）: Open Catalyst 2020 (OC20)データセットとコミュニティチャレンジ
Authors: Lowik Chanussot, Abhishek Das, Siddharth Goyal, Thibaut Lavril, Muhammed Shuaibi, Morgane Riviere, Kevin Tran, Javier Heras-Domingo, Caleb Ho, Weihua Hu, Aini Palizhati, Anuroop Sriram, Brandon Wood, Junwoong Yoon, Devi Parikh, C. Lawrence Zitnick, Zachary Ulissi
Abstract要約: 触媒の発見と最適化は多くの社会的およびエネルギー的課題を解決する鍵となる。表面および吸着体の元素組成を一般化できるモデルを構築することは、依然としてオープンな課題である。
参考スコア（独自算出の注目度）: 36.556154866045894
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Catalyst discovery and optimization is key to solving many societal and energy challenges including solar fuels synthesis, long-term energy storage, and renewable fertilizer production. Despite considerable effort by the catalysis community to apply machine learning models to the computational catalyst discovery process, it remains an open challenge to build models that can generalize across both elemental compositions of surfaces and adsorbate identity/configurations, perhaps because datasets have been smaller in catalysis than related fields. To address this we developed the OC20 dataset, consisting of 1,281,040 Density Functional Theory (DFT) relaxations (~264,890,000 single point evaluations) across a wide swath of materials, surfaces, and adsorbates (nitrogen, carbon, and oxygen chemistries). We supplemented this dataset with randomly perturbed structures, short timescale molecular dynamics, and electronic structure analyses. The dataset comprises three central tasks indicative of day-to-day catalyst modeling and comes with pre-defined train/validation/test splits to facilitate direct comparisons with future model development efforts. We applied three state-of-the-art graph neural network models (CGCNN, SchNet, Dimenet++) to each of these tasks as baseline demonstrations for the community to build on. In almost every task, no upper limit on model size was identified, suggesting that even larger models are likely to improve on initial results. The dataset and baseline models are both provided as open resources, as well as a public leader board to encourage community contributions to solve these important tasks.
Abstract（参考訳）: 触媒の発見と最適化は、太陽燃料合成、長期エネルギー貯蔵、再生可能肥料生産など、多くの社会的およびエネルギー的課題を解決する鍵となる。計算触媒発見プロセスに機械学習モデルを適用するための触媒コミュニティの努力にもかかわらず、おそらくデータセットが関連する分野よりも触媒の小さいため、表面の元素組成と吸着したアイデンティティ/構成の両方を一般化できるモデルを構築することは、依然としてオープンな課題である。そこで我々は, 物質, 表面, 吸着剤 (窒素, 炭素, 酸素化学) の広範囲にわたる1,281,040 密度汎関数論 (DFT) 緩和 (~264,890,000点評価) からなる OC20 データセットを開発した。我々はこのデータセットを、ランダムな摂動構造、短い時間スケール分子動力学、電子構造解析で補足した。データセットは、日々の触媒モデリングを示す3つの中心的なタスクで構成されており、将来のモデル開発活動と直接比較するための事前定義されたトレイン/バリデーション/テストの分割が伴っている。我々はこれらのタスクに3つの最先端グラフニューラルネットワークモデル(CGCNN, SchNet, Dimenet++)を適用した。ほぼすべてのタスクにおいて、モデルサイズに対する上限は特定されず、さらに大きなモデルでも初期結果を改善する可能性が示唆された。データセットとベースラインモデルはどちらもオープンリソースとして提供され、これらの重要なタスクを解決するためにコミュニティの貢献を促すパブリックリーダーボードとして提供されている。

関連論文リスト

PluRel: Synthetic Data unlocks Scaling Laws for Relational Foundation Models [51.42043158297229]
マルチタブラルリレーショナルデータベースをスクラッチから合成するフレームワークであるPluelを紹介する。ステップバイステップの方法では,(1)有向グラフのスキーマ,(2)二部グラフのテーブル間一次外部キー接続,(3)条件因果機構によるテーブル内の特徴分布をモデル化する。
論文参考訳（メタデータ） (2026-02-03T21:35:18Z)
A Survey on Efficient Vision-Language-Action Models [153.11669266922993]
VLA(Vision-Language-Action Model)は、物理世界の相互作用によってデジタル知識を橋渡しすることを目的とした、インテリジェンスにおける重要なフロンティアである。これらの課題に緊急に対応する必要性から、この調査は、効率的なビジョン・ランゲージ・アクションモデルに関する最初の包括的なレビューを提示する。
論文参考訳（メタデータ） (2025-10-27T17:57:33Z)
AQCat25: Unlocking spin-aware, high-fidelity machine learning potentials for heterogeneous catalysis [0.0]
AQCat25は13.5万密度汎関数理論(DFT)単点計算を補完するデータセットである。我々は、AQCat25のような新しいデータセットとより広範なOpen Catalyst 2020 (OC20)データセットを統合する方法を検討する。例えば、FiLM(Feature-wise Linear Modulation)を用いることで、この課題に対処できることを示す。
論文参考訳（メタデータ） (2025-10-27T02:47:20Z)
Scaling Generalist Data-Analytic Agents [95.05161133349242]
DataMindは、汎用データ分析エージェントを構築するために設計されたスケーラブルなデータ合成およびエージェントトレーニングレシピである。 DataMindは、オープンソースのデータ分析エージェントを構築する上で重要な3つの課題に取り組む。
論文参考訳（メタデータ） (2025-09-29T17:23:08Z)
TUM2TWIN: Introducing the Large-Scale Multimodal Urban Digital Twin Benchmark Dataset [90.97440987655084]
都市デジタルツインズ(UDT)は、都市管理と多様なソースからの複雑な異種データの統合に欠かせないものとなっている。これらの課題に対処するために、最初の総合的マルチモーダルなUrban Digital TwinベンチマークデータセットTUM2TWINを紹介する。このデータセットには、地理的にセマンティックに整合した3Dモデルとネットワーク、およびさまざまな地球、モバイル、航空、衛星観測結果、約10,000ドル以上のデータサブセット、そして現在767GBのデータが含まれている。
論文参考訳（メタデータ） (2025-05-12T09:48:32Z)
Scaling Laws of Synthetic Data for Language Models [132.67350443447611]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文参考訳（メタデータ） (2025-03-25T11:07:12Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
A Foundation Model for the Solar Dynamics Observatory [2.63089646549647]
SDO-FMは、NASAのソーラー・ダイナミクス・オブザーバ(SDO)からのデータを用いた基礎モデルである。本稿では、Hugging Faceとsdofm.orgのコミュニティで利用可能な、事前トレーニングされたモデルと埋め込みデータセットのリリースを示す。
論文参考訳（メタデータ） (2024-10-03T14:36:32Z)
Efficient Materials Informatics between Rockets and Electrons [0.0]
この論文は、超高温耐火高エントロピー合金(RHEA)を組み込んだ機能性グレード材料(FGM)の設計に焦点を当てている。原子レベルでは、MPDDと呼ばれる450万以上の緩和された構造から機械学習(ML)に最適化されたデータエコシステムが、実験的な観察を知らせ、熱力学モデルを改善するために使用される。結果として生じるマルチレベル発見インフラストラクチャは、既存のソリューションを探すのではなく、問題のエンコーディングに重点を置いているため、非常に一般化可能である。
論文参考訳（メタデータ） (2024-07-05T17:03:26Z)
Lightweight Geometric Deep Learning for Molecular Modelling in Catalyst Discovery [0.0]
Open Catalyst Projectは、グラフニューラルネットワーク(GNN)の進歩を適用して、触媒発見の進展を加速することを目的としている。幾何学的および対称的なメッセージパッシングのようなロバストな設計パターンを実装することで、吸着と表面の相互作用の原子間力を予測するために、0.0748のMAEに達したGNNモデルを訓練することができた。
論文参考訳（メタデータ） (2024-04-05T17:13:51Z)
Foundation Models for Generalist Geospatial Artificial Intelligence [3.7002058945990415]
本稿では,大規模データに基づく基礎モデルの事前学習と微調整を効果的に行うための第1種フレームワークを提案する。我々はこの枠組みを利用して、マルチスペクトル衛星画像の1TB以上を事前トレーニングしたトランスフォーマーベースの基礎モデルであるPrithviを開発した。
論文参考訳（メタデータ） (2023-10-28T10:19:55Z)
Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文参考訳（メタデータ） (2023-10-20T17:14:25Z)
PhAST: Physics-Aware, Scalable, and Task-specific GNNs for Accelerated Catalyst Design [102.9593507372373]
触媒材料は産業プロセスに関わる電気化学反応において重要な役割を担っている。機械学習は、大量のデータから材料特性を効率的にモデル化する可能性を秘めている。本稿では,ほとんどのアーキテクチャに適用可能なタスク固有のイノベーションを提案し,計算効率と精度の両立を図っている。
論文参考訳（メタデータ） (2022-11-22T05:24:30Z)
The Open Catalyst 2022 (OC22) Dataset and Challenges for Oxide Electrocatalysis [9.9765107020148]
酸化物の化学空間にまたがる一般的な機械学習のポテンシャルは、まだ手の届かないところにある。 Open Catalyst 2022(OC22)データセットは62,521 密度汎関数論 (DFT) によって構成される。異なる材料や吸着剤を含む場合でも、データセットの組み合わせがより良い結果をもたらすかどうかを調査する。
論文参考訳（メタデータ） (2022-06-17T17:54:10Z)
Learning Large-scale Subsurface Simulations with a Hybrid Graph Network Simulator [57.57321628587564]
本研究では3次元地下流体の貯留層シミュレーションを学習するためのハイブリッドグラフネットワークシミュレータ (HGNS) を提案する。 HGNSは、流体の進化をモデル化する地下グラフニューラルネットワーク(SGNN)と、圧力の進化をモデル化する3D-U-Netで構成されている。産業標準地下フローデータセット(SPE-10)と1100万セルを用いて,HGNSが標準地下シミュレータの18倍の推算時間を短縮できることを実証した。
論文参考訳（メタデータ） (2022-06-15T17:29:57Z)
Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文参考訳（メタデータ） (2021-06-25T22:08:51Z)
Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文参考訳（メタデータ） (2020-06-11T17:29:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。