論文の概要: Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features
- arxiv url: http://arxiv.org/abs/2605.04905v2
- Date: Tue, 12 May 2026 09:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:06.638575
- Title: Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features
- Title(参考訳): エレクトロスピニングにおける特徴重要度のモデル間整合性:モデル依存的特徴からロバストを分離する
- Authors: Mehrab Mahdian, Ferenc Ender, Tamas Pardy,
- Abstract要約: 機械学習(ML)手法は、電子スピン化プロセスのモデル化にますます採用されている。
既存の研究の多くは単一のMLモデルに依存しており、結果として生じる特徴の重要性が堅牢で再現可能であることを暗黙的に仮定している。
本研究は,複数のMLモデルファミリーにまたがる特徴的重要性の一貫性を系統的に評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Electrospinning is a highly sensitive fabrication process in which small variations in operating parameters can significantly influence fiber morphology and material performance. Machine learning (ML) methods are increasingly employed to model these process-structure relationships and to identify the relative importance of processing variables. However, most existing studies rely on a single ML model, implicitly assuming that the resulting feature importance is robust and reproducible. In this study, the consistency of feature importance across multiple ML model families was systematically evaluated using a curated dataset of 96 polyvinyl alcohol (PVA) electrospinning experiments. Twenty-one ML models representing linear, tree-based, kernel-based, neural network, and instance-based approaches were trained and compared. To provide a unified interpretability framework, SHAP (SHapley Additive exPlanations) values were used to calculate feature importance consistently across all models. A rank-based statistical analysis was then performed to quantify inter-model agreement and assess the robustness of parameter rankings. The results demonstrate that predictive performance and interpretive reliability are fundamentally distinct properties. Although several models achieved comparable predictive accuracy, substantial differences were observed in their feature importance rankings. Solution concentration emerged as the most robust and consistently influential parameter (variability = 0), whereas flow rate and applied voltage exhibited high ranking variability (variability > 0.9), indicating strong model dependence. These findings suggest that feature importance derived from a single ML model may be unreliable, particularly for small experimental datasets, and highlight the importance of cross-model validation for achieving trustworthy interpretation in ML-assisted electrospinning research.
- Abstract(参考訳): 電気スピニング(Electrospinning)は、動作パラメータの小さな変化が繊維形態や材料性能に大きな影響を及ぼす、非常に敏感な製造法である。
機械学習(ML)手法は、これらのプロセス構造関係をモデル化し、処理変数の相対的重要性を特定するために、ますます採用されている。
しかしながら、既存のほとんどの研究は単一のMLモデルに依存しており、結果として生じる特徴の重要性が堅牢で再現可能であることを暗黙的に仮定している。
本研究では,96種類のポリビニルアルコール(PVA)エレクトロスピニング実験を用いて,複数のMLモデルファミリーにまたがる特徴の一貫性を系統的に評価した。
線形、ツリーベース、カーネルベース、ニューラルネットワーク、インスタンスベースのアプローチを表す21のMLモデルをトレーニングし、比較した。
統一的な解釈可能性フレームワークを提供するために、SHAP(SHapley Additive exPlanations)の値は、すべてのモデルで一貫した機能の重要度を計算するために使用された。
その後、ランクに基づく統計分析を行い、モデル間合意を定量化し、パラメータランキングのロバスト性を評価する。
その結果,予測性能と解釈信頼性は根本的に異なる特性であることがわかった。
いくつかのモデルは同等の予測精度を達成したが、その特徴的重要性のランキングでは大きな違いが見られた。
溶液濃度は最も頑健で一貫した影響パラメータ (変数 = 0) として出現し, 流量と印加電圧は高いランク変数 (変数 > 0.9) を示し, 強いモデル依存性を示した。
これらの結果から,1つのMLモデルから派生した特徴の重要性は信頼性に欠ける可能性が示唆され,特に小さな実験データセットにおいて,MLを用いた電子スピンリング研究において信頼性の高い解釈を実現するためのクロスモデル検証の重要性が強調された。
関連論文リスト
- Scalable Learning of Multivariate Distributions via Coresets [48.02318786960811]
我々は,多変量条件変換モデル(MCTM)のための新しいコアセットの構築を行い,そのスケーラビリティと訓練効率を向上させる。
提案手法は,重要サンプリングによる大幅なデータ削減を実現する。
これまでコアセットが組み込まれてきた従来のフルパラメトリックモデルと比較して,我々の半パラメトリックアプローチは適応性の向上を示す。
論文 参考訳(メタデータ) (2026-03-20T09:28:43Z) - Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - Why Knowledge Distillation Works in Generative Models: A Minimal Working Explanation [50.784080714897776]
知識蒸留(KD)は、現代の生産モデルの訓練と展開における中核的な要素である。
我々は,KDが学生モデルにおける精度とリコールのトレードオフを引き起こすことを示す。
本分析は、生成モデルにおけるKDの有効性について、単純かつ一般的な説明を提供する。
論文 参考訳(メタデータ) (2025-05-19T13:39:47Z) - Quantifying Uncertainty and Variability in Machine Learning: Confidence Intervals for Quantiles in Performance Metric Distributions [0.17265013728931003]
マシンラーニングモデルは、信頼性と堅牢性が重要であるアプリケーションで広く使用されている。
モデル評価は、しばしば、モデルパフォーマンスの固有の変数をキャプチャできないパフォーマンスメトリクスの単一ポイント推定に依存します。
この貢献は、そのような分布を分析するために量子と信頼区間を使うことを探求し、モデルの性能とその不確実性についてより完全な理解を提供する。
論文 参考訳(メタデータ) (2025-01-28T13:21:34Z) - Measuring Variable Importance in Heterogeneous Treatment Effects with Confidence [33.12963161545068]
因果機械学習は、複雑なデータから個々の治療効果を推定する約束を持っている。
本稿では,条件付き置換法(CPI)に基づくアルゴリズムPermuCATEを提案する。
シミュレーションおよび実世界の健康データセットにおけるPermuCATEの利点を実証的に示す。
論文 参考訳(メタデータ) (2024-08-23T11:44:07Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Building Robust Machine Learning Models for Small Chemical Science Data:
The Case of Shear Viscosity [3.4761212729163313]
我々はLennard-Jones (LJ)流体のせん断粘度を予測するために、いくつかの機械学習モデルを訓練する。
具体的には,モデル選択,性能評価,不確実性定量化に関する課題について検討した。
論文 参考訳(メタデータ) (2022-08-23T07:33:14Z) - How robust are pre-trained models to distribution shift? [82.08946007821184]
自己教師付き学習(SSL)と自己エンコーダベースモデル(AE)の相互関係が相互関係に与える影響を示す。
本研究では, 線形ヘッドの潜在バイアスから事前学習したモデルの性能を分離するために, アウト・オブ・ディストリビューション(OOD)データに基づいて訓練された線形ヘッドを用いた新しい評価手法を開発した。
論文 参考訳(メタデータ) (2022-06-17T16:18:28Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。