論文の概要: Clever Materials: When Models Identify Good Materials for the Wrong Reasons
- arxiv url: http://arxiv.org/abs/2602.17730v1
- Date: Wed, 18 Feb 2026 11:08:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.087347
- Title: Clever Materials: When Models Identify Good Materials for the Wrong Reasons
- Title(参考訳): クレーバー素材:モデルが間違った理由の良質な材料を識別する時
- Authors: Kevin Maik Jablonka,
- Abstract要約: 私は、プロパティ予測はコンバウンディングによって駆動できるという仮説をテストします。
MOF(熱と溶媒の安定性)、ペロブスカイト太陽電池(効率)、電池(キャパシティ)、TADFエミッタ(エミッション波長)の5つのタスクは、標準化学記述子で訓練されたモデルで著者の日誌を予測する。
結果は、多くのデータセットが成功の非化学的説明を除外していないことを示している。
- 参考スコア(独自算出の注目度): 0.184249738089435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning can accelerate materials discovery. Models perform impressively on many benchmarks. However, strong benchmark performance does not imply that a model learned chemistry. I test a concrete alternative hypothesis: that property prediction can be driven by bibliographic confounding. Across five tasks spanning MOFs (thermal and solvent stability), perovskite solar cells (efficiency), batteries (capacity), and TADF emitters (emission wavelength), models trained on standard chemical descriptors predict author, journal, and publication year well above chance. When these predicted metadata ("bibliographic fingerprints") are used as the sole input to a second model, performance is sometimes competitive with conventional descriptor-based predictors. These results show that many datasets do not rule out non-chemical explanations of success. Progress requires routine falsification tests (e.g., group/time splits and metadata ablations), datasets designed to resist spurious correlations, and explicit separation of two goals: predictive utility versus evidence of chemical understanding.
- Abstract(参考訳): 機械学習は材料発見を加速させる。
モデルは多くのベンチマークで素晴らしいパフォーマンスを発揮する。
しかし、強いベンチマーク性能は、モデルが化学を学習したという意味ではない。
私は、プロパティ予測が書誌の共起によって駆動されるという、具体的な代替仮説を検証します。
MOF(熱と溶媒の安定性)、ペロブスカイト太陽電池(効率)、電池(キャパシティ)、TADFエミッタ(エミッション波長)の5つのタスク、標準化学記述子で訓練されたモデル、著者、雑誌、出版年を予測している。
これらの予測メタデータ(書誌指紋)を第2モデルの唯一の入力として使用する場合、従来の記述子ベースの予測器と性能が競合することがある。
これらの結果は、多くのデータセットが成功の非化学的説明を除外していないことを示している。
進歩には、定期的なファルシフィケーションテスト(例えば、グループ/タイム分割とメタデータの短縮)、急激な相関に抵抗するために設計されたデータセット、および予測ユーティリティと化学的理解の証拠の2つの目標を明確に分離する必要がある。
関連論文リスト
- Beyond Memorization: Reasoning-Driven Synthesis as a Mitigation Strategy Against Benchmark Contamination [77.69093448529455]
本稿では,arXiv論文から直接研究レベルのQAを合成するために,無限にスケーラブルなフレームワークを用いて実証的研究を行う。
各種サイズ,開発者,リリース日といったモデルについて,知識カットオフ日に近い性能劣化の欠如を評価した。
合成パイプラインで要求される多段階の推論は、浅い記憶よりも深い複雑さをもたらしたと仮定する。
論文 参考訳(メタデータ) (2025-08-26T16:41:37Z) - Analysis of Transferability Estimation Metrics for Surgical Phase Recognition [3.3285108719932555]
微調整された事前学習モデルは現代の機械学習の基盤となり、限られたラベル付きデータで実践者がハイパフォーマンスを達成できるようになった。
専門的アノテーションが特に時間がかかり費用がかかる外科的ビデオ解析では、下流タスクに最適な事前学習モデルを特定することが重要かつ困難である。
我々は,2つの多様なデータセット上で,LogME,H-Score,TransRateの3つの代表的な指標の総合ベンチマークを行った。
論文 参考訳(メタデータ) (2025-08-22T18:05:33Z) - Atomic Reasoning for Scientific Table Claim Verification [83.14588611859826]
非専門家は、その高い情報密度と認識される信頼性のために、科学的表に基づく主張を誤解させるおそれがある。
既存のテーブルクレーム検証モデル、例えば最先端の大規模言語モデル(LLM)は、しばしば精密なきめ細かい推論に苦しむ。
認知負荷理論に触発されて、表に基づく主張を解釈するモデルの能力を高めるには、認知負荷を減らす必要がある。
論文 参考訳(メタデータ) (2025-06-08T02:46:22Z) - Learning Smooth and Expressive Interatomic Potentials for Physical Property Prediction [3.3974034548879213]
本稿では,分子動力学シミュレーションにおけるエネルギー保存の実践的能力に基づいて,機械学習の原子間ポテンシャルをテストすることを提案する。
我々は、このテストに失敗したモデルにつながる可能性のある選択を特定し、これらの観察を使用して高表現率モデルを改善する。
結果のモデルであるeSENは、様々な物理的特性予測タスクに関する最先端の結果を提供する。
論文 参考訳(メタデータ) (2025-02-17T18:57:32Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Retrieve to Explain: Evidence-driven Predictions for Explainable Drug Target Identification [0.791663505497707]
Retrieve to Explain (R2E) は検索に基づくモデルで、可能なすべての回答をスコア付けし、ランク付けする。
R2Eはそれぞれの答えを、その裏付けとしてのみ表現し、答え自体が隠蔽されている。
薬物標的同定の挑戦的科学的発見課題としてR2Eを開発した。
論文 参考訳(メタデータ) (2024-02-06T15:13:17Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Predicting Chemical Properties using Self-Attention Multi-task Learning
based on SMILES Representation [0.0]
本研究では,変圧器変圧器モデルの構造的差異について検討し,新しい自己注意モデルを提案する。
不均衡な化学データセットを用いたマルチタスク学習環境において,自己認識モジュールの表現学習性能を評価した。
論文 参考訳(メタデータ) (2020-10-19T09:46:50Z) - Machine learning with persistent homology and chemical word embeddings
improves prediction accuracy and interpretability in metal-organic frameworks [0.07874708385247352]
材料の構造と化学の複雑な表現をキャプチャする記述子を自動的に生成するエンド・ツー・エンドの機械学習モデルを提案する。
物質系から直接、幾何学的および化学的情報をカプセル化する。
提案手法は, 対象物間での精度, 転送可能性の両面において, 一般的に用いられている手作業による特徴量から構築したモデルに比べ, かなり改善されている。
論文 参考訳(メタデータ) (2020-10-01T16:31:46Z) - Chemical Property Prediction Under Experimental Biases [26.407895054724452]
本研究は,実験データセットにおけるバイアス軽減に焦点を当てた。
我々は因果推論とグラフニューラルネットワークを組み合わせた2つの手法を用いて分子構造を表現した。
4つのバイアスシナリオによる実験結果から,逆確率スコアリング法と反実回帰法が確固たる改善をもたらしたことが示唆された。
論文 参考訳(メタデータ) (2020-09-18T08:40:57Z) - ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning [85.33459673197149]
標準化された大学院受験試験から抽出した論理的推論(ReClor)を必要とする新たな読解データセットを提案する。
本稿では、偏りのあるデータポイントを識別し、それらをEASY集合と残りをHARD集合に分離することを提案する。
実験結果によると、最先端のモデルでは、データセットに含まれるバイアスをEASYセット上で高精度にキャプチャする能力に優れていた。
しかし、彼らはランダムな推測に近い性能のHARDセットに苦慮しており、現在のモデルの論理的推論能力を本質的に向上させるためには、より多くの研究が必要であることを示している。
論文 参考訳(メタデータ) (2020-02-11T11:54:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。