論文の概要: Enhancing Dimensionality Prediction in Hybrid Metal Halides via Feature Engineering and Class-Imbalance Mitigation
- arxiv url: http://arxiv.org/abs/2512.05367v1
- Date: Fri, 05 Dec 2025 02:05:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.868846
- Title: Enhancing Dimensionality Prediction in Hybrid Metal Halides via Feature Engineering and Class-Imbalance Mitigation
- Title(参考訳): 機能性工学とクラス不均衡緩和によるハイブリッド金属ハロゲン化物の寸法予測の強化
- Authors: Mariia Karabin, Isaac Armstrong, Leo Beck, Paulina Apanel, Markus Eisenbach, David B. Mitzi, Hanna Terletska, Hendrik Heinz,
- Abstract要約: ハイブリッド金属ハロゲン化物(HMHs)の構造寸法を予測するための機械学習フレームワークを提案する。
ケミカルインフォームド・フィーチャーエンジニアリングと高度なクラスアンバランスハンドリング技術を組み合わせています。
提案手法は, 未表現クラスに対するF1スコアを大幅に改善し, 全次元にわたる堅牢なクロスバリデーション性能を実現する。
- 参考スコア(独自算出の注目度): 0.9143903106691984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a machine learning framework for predicting the structural dimensionality of hybrid metal halides (HMHs), including organic-inorganic perovskites, using a combination of chemically-informed feature engineering and advanced class-imbalance handling techniques. The dataset, consisting of 494 HMH structures, is highly imbalanced across dimensionality classes (0D, 1D, 2D, 3D), posing significant challenges to predictive modeling. This dataset was later augmented to 1336 via the Synthetic Minority Oversampling Technique (SMOTE) to mitigate the effects of the class imbalance. We developed interaction-based descriptors and integrated them into a multi-stage workflow that combines feature selection, model stacking, and performance optimization to improve dimensionality prediction accuracy. Our approach significantly improves F1-scores for underrepresented classes, achieving robust cross-validation performance across all dimensionalities.
- Abstract(参考訳): 本稿では, 有機-無機ペロブスカイトを含むハイブリッド金属ハロゲン化物 (HMHs) の構造寸法を予測するための機械学習フレームワークを提案する。
494のHMH構造からなるこのデータセットは、次元のクラス(0D, 1D, 2D, 3D)間で非常に不均衡であり、予測モデリングにおいて重要な課題となっている。
このデータセットは後にSMOTE(Synthetic Minority Oversampling Technique)によって1336に拡張され、クラス不均衡の影響を緩和した。
我々はインタラクションベースの記述子を開発し、特徴選択、モデル積み上げ、性能最適化を組み合わせた多段階ワークフローに統合し、次元予測精度を向上した。
提案手法は, 未表現クラスに対するF1スコアを大幅に改善し, 全次元にわたる堅牢なクロスバリデーション性能を実現する。
関連論文リスト
- InstructPLM-mu: 1-Hour Fine-Tuning of ESM2 Beats ESM3 in Protein Mutation Predictions [54.19843038028329]
InstructPLM-muと呼ばれる微調整フレームワークを提案する。
構造入力を持つ細調整ESM2はESM3に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2025-10-03T07:42:22Z) - Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials [2.821973780014264]
我々は、ハミルトン予測のための普遍的な深層学習パラダイムを進化させるために、方法論とデータセットの双方に貢献する。
NextHAMは、効率的で一般化可能な電子構造ハミルトニアン予測のためのニューラルネットワークE(3)対称性および表現的補正法である。
Materials-HAM-SOCの実験結果から、NextHAMはハミルトニアンやバンド構造を予測するのに優れた精度と効率を達成することが示された。
論文 参考訳(メタデータ) (2025-09-24T08:30:58Z) - A Mixture of Experts Gating Network for Enhanced Surrogate Modeling in External Aerodynamics [0.28647133890966997]
Mixture of Experts (MoE) モデルは、3つの異種、最先端の代理モデルの予測を組み合わせる。
システム全体のトレーニングと検証は、自動車空気力学のための高忠実度CFDシミュレーションの大規模でパブリックなベンチマークであるDrivAerMLデータセットで行われている。
論文 参考訳(メタデータ) (2025-08-28T22:34:10Z) - Hybrid Machine Learning Framework for Predicting Geometric Deviations from 3D Surface Metrology [0.46085106405479537]
本稿では,高分解能な3Dスキャナーを用いて,異なるバッチで生成された237個のコンポーネントから多角面データを取得する手法を提案する。
データは正確なアライメント、ノイズ低減、マージによって処理され、正確な3D表現を生成する。
提案手法は,従来の統計的プロセス制御法よりも73%向上し,95%信頼度で0.012mmの予測精度を達成した。
論文 参考訳(メタデータ) (2025-08-09T05:59:35Z) - Hymba: A Hybrid-head Architecture for Small Language Models [65.94140459055244]
Hymbaは、ハイブリッドヘッド並列アーキテクチャを特徴とする、小さな言語モデルのファミリーである。
重要な情報を保持するプロンプトに先立って,学習可能なメタトークンを導入する。
このモデルは、層間鍵値共有と部分的スライディングウィンドウアテンションを組み込むことにより、さらに最適化される。
論文 参考訳(メタデータ) (2024-11-20T19:51:25Z) - Data-free Weight Compress and Denoise for Large Language Models [96.68582094536032]
パラメータ行列を圧縮する手法として,データフリーなジョイントランクk近似を提案する。
キャリブレーションデータなしで、元の性能の93.43%を維持しながら80%のパラメータのモデルプルーニングを実現する。
論文 参考訳(メタデータ) (2024-02-26T05:51:47Z) - Equivariant vector field network for many-body system modeling [65.22203086172019]
Equivariant Vector Field Network (EVFN) は、新しい同変層と関連するスカラー化およびベクトル化層に基づいて構築されている。
シミュレーションされたニュートン力学系の軌跡を全観測データと部分観測データで予測する手法について検討した。
論文 参考訳(メタデータ) (2021-10-26T14:26:25Z) - Balancing Predictive Relevance of Ligand Biochemical Activities [0.0]
従来の教師付き機械学習技術、すなわちSupport Vector Machinesを用いて、非校正モデルのトレーニングを行う。
SVMはトレーニングサンプルの中で不均衡なデータセット、アウトレーヤ、高い多重線形性に敏感である。
モデルの予測関連性のバランスをとる手法として,Plattのスケーリングを提案する。
論文 参考訳(メタデータ) (2021-04-06T06:05:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。