論文の概要: Open Polymer Challenge: Post-Competition Report
- arxiv url: http://arxiv.org/abs/2512.08896v1
- Date: Tue, 09 Dec 2025 18:38:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:08.095779
- Title: Open Polymer Challenge: Post-Competition Report
- Title(参考訳): Open Polymer Challenge: コンペティション後のレポート
- Authors: Gang Liu, Sobin Alosious, Subhamoy Mahajan, Eric Inae, Yihan Zhu, Yuhan Liu, Renzheng Zhang, Jiaxin Xu, Addison Howard, Ying Li, Tengfei Luo, Meng Jiang,
- Abstract要約: Open Polymer Challenge (OPC)は、コミュニティが開発した最初のポリマー情報学ベンチマークである。
この課題は、材料発見のための仮想スクリーニングパイプラインのコアステップであるマルチタスクのポリマー特性予測に焦点を当てている。
テストデータセットはhttps://www.kaggle.com/datasets/alexliu99/neurips-open- Polymer-prediction-2025-test-dataでリリースします。
- 参考スコア(独自算出の注目度): 34.36687017237976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML) offers a powerful path toward discovering sustainable polymer materials, but progress has been limited by the lack of large, high-quality, and openly accessible polymer datasets. The Open Polymer Challenge (OPC) addresses this gap by releasing the first community-developed benchmark for polymer informatics, featuring a dataset with 10K polymers and 5 properties: thermal conductivity, radius of gyration, density, fractional free volume, and glass transition temperature. The challenge centers on multi-task polymer property prediction, a core step in virtual screening pipelines for materials discovery. Participants developed models under realistic constraints that include small data, label imbalance, and heterogeneous simulation sources, using techniques such as feature-based augmentation, transfer learning, self-supervised pretraining, and targeted ensemble strategies. The competition also revealed important lessons about data preparation, distribution shifts, and cross-group simulation consistency, informing best practices for future large-scale polymer datasets. The resulting models, analysis, and released data create a new foundation for molecular AI in polymer science and are expected to accelerate the development of sustainable and energy-efficient materials. Along with the competition, we release the test dataset at https://www.kaggle.com/datasets/alexliu99/neurips-open-polymer-prediction-2025-test-data. We also release the data generation pipeline at https://github.com/sobinalosious/ADEPT, which simulates more than 25 properties, including thermal conductivity, radius of gyration, and density.
- Abstract(参考訳): 機械学習(ML)は、持続可能な高分子材料を発見するための強力な道を提供するが、大規模で高品質でオープンにアクセス可能なポリマーデータセットが欠如しているため、進歩は限られている。
Open Polymer Challenge (OPC)は、10Kポリマーと5つの特性を持つ熱伝導率、ジャイレーション半径、密度、分数自由体積、ガラス転移温度のデータセットを特徴とする、最初のコミュニティで開発されたポリマー情報学のベンチマークをリリースすることによって、このギャップに対処している。
この課題は、材料発見のための仮想スクリーニングパイプラインのコアステップであるマルチタスクのポリマー特性予測に焦点を当てている。
参加者は、小データ、ラベルの不均衡、異種シミュレーションソースを含む現実的な制約の下でモデルを開発し、特徴ベースの強化、移動学習、自己教師付き事前訓練、ターゲットアンサンブル戦略といった技術を使用した。
このコンペティションはまた、データ準備、分散シフト、グループ間シミュレーションの一貫性に関する重要な教訓を明らかにし、将来の大規模ポリマーデータセットのベストプラクティスを報告した。
得られたモデル、分析、リリースされたデータは、高分子科学における分子AIの新たな基盤を生み出し、持続可能なエネルギー効率の高い材料の開発を加速することが期待されている。
競合と共に、テストデータセットをhttps://www.kaggle.com/datasets/alexliu99/neurips-open- Polymer-prediction-2025-test-dataでリリースします。
また、熱伝導率、ジャイレーション半径、密度を含む25以上の特性をシミュレートするデータ生成パイプラインをhttps://github.com/sobinalosious/ADEPTでリリースする。
関連論文リスト
- Omics-scale polymer computational database transferable to real-world artificial intelligence applications [8.718893022299653]
PolyOmicsは、完全に自動化された分子動力学シミュレーションパイプラインによって生成されるオミクススケールの計算データベースである。
PolyOmicsで事前訓練された機械学習モデルは、広範囲の現実世界の下流タスクに対して効率的に微調整することができる。
論文 参考訳(メタデータ) (2025-11-07T09:03:07Z) - POINT$^{2}$: A Polymer Informatics Training and Testing Database [15.45788515943579]
POINT$2$ (Polymer Informatics Training and Testing) は、高分子情報学における重要な課題に対処するために設計されたベンチマークデータベースとプロトコルである。
我々は、量子ランダムフォレスト、ドロップアウト付き多層パーセプトロン、グラフニューラルネットワーク、事前訓練された大規模言語モデルを含むMLモデルのアンサンブルを開発する。
これらのモデルは、Morgan、MACCS、RDKit、Topological、Atom Pairの指紋、グラフベースの記述子といった多様なポリマー表現と結合している。
論文 参考訳(メタデータ) (2025-03-30T15:46:01Z) - Transferring a molecular foundation model for polymer property
predictions [3.067983186439152]
トランスモデルの自己教師付き事前トレーニングには、大規模なデータセットが必要である。
本研究では, 高分子特性を微調整し, 小分子で事前学習したトランスフォーマーを用いることで, 強化ポリマーデータセットでトレーニングしたトランスフォーマーと同等の精度が得られることを示す。
論文 参考訳(メタデータ) (2023-10-25T19:55:00Z) - ClimSim-Online: A Large Multi-scale Dataset and Framework for Hybrid ML-physics Climate Emulation [45.201929285600606]
我々は、ハイブリッドML物理シミュレータを開発するためのエンドツーエンドワークフローを含むClimSim-Onlineを提案する。
データセットはグローバルで、高いサンプリング頻度で10年間にわたっています。
MLモデルを運用環境シミュレータに統合するための、クロスプラットフォームでコンテナ化されたパイプラインを提供します。
論文 参考訳(メタデータ) (2023-06-14T21:26:31Z) - Copolymer Informatics with Multi-Task Deep Neural Networks [0.0]
コポリマーの性質予測の課題に取り組み、ホモポリマーを超えてポリマーインフォマティクスフレームワークを拡張します。
2つのモノマーのホモポリマーと共重合体のガラス転移、融解、分解温度の18,000以上のデータポイントを含む大きなデータセットを用いる。
開発されたモデルは、適切なデータが利用可能になったときに、よりコポリマー特性に正確、迅速、柔軟、スケーラブルです。
論文 参考訳(メタデータ) (2021-03-25T23:28:20Z) - Polymer Informatics: Current Status and Critical Next Steps [1.3238373064156097]
サロゲートモデルは、インスタントプロパティ予測のために利用可能なポリマーデータに基づいて訓練される。
データ駆動型戦略は, 高分子の化学的, 物理的多様性から生じる特異な課題に, 小規模かつ大規模に対処するものである。
アプリケーションターゲットを満たす高度なAIアルゴリズムを用いて, 高分子レコメンデーションを行う逆問題の解法について検討している。
論文 参考訳(メタデータ) (2020-11-01T14:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。