論文の概要: A Critical Examination of Active Learning Workflows in Materials Science
- arxiv url: http://arxiv.org/abs/2601.05946v1
- Date: Fri, 09 Jan 2026 17:01:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:50.050132
- Title: A Critical Examination of Active Learning Workflows in Materials Science
- Title(参考訳): 材料科学におけるアクティブラーニングワークフローの批判的考察
- Authors: Akhil S. Nair, Lucas Foppa,
- Abstract要約: アクティブラーニング(AL)は材料科学において重要な役割を担い、原子論シミュレーションのための機械学習の原子間ポテンシャルの構築や、自動運転研究所の運営などの応用を可能にしている。
広く使われているにもかかわらず、ALの信頼性と有効性は、体系的に調査されることが稀な暗黙の設計仮定に依存している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active learning (AL) plays a critical role in materials science, enabling applications such as the construction of machine-learning interatomic potentials for atomistic simulations and the operation of self-driving laboratories. Despite its widespread use, the reliability and effectiveness of AL workflows depend on implicit design assumptions that are rarely examined systematically. Here, we critically assess AL workflows deployed in materials science and investigate how key design choices, such as surrogate models, sampling strategies, uncertainty quantification and evaluation metrics, relate to their performance. By identifying common pitfalls and discussing practical mitigation strategies, we provide guidance to practitioners for the efficient design, assessment, and interpretation of AL workflows in materials science.
- Abstract(参考訳): アクティブラーニング(AL)は材料科学において重要な役割を担い、原子論シミュレーションのための機械学習の原子間ポテンシャルの構築や、自動運転研究所の運営などの応用を可能にしている。
広く使われているにもかかわらず、ALワークフローの信頼性と有効性は暗黙的な設計仮定に依存しており、体系的に研究されることはめったにない。
本稿では,材料科学に展開するALワークフローを批判的に評価し,サロゲートモデルやサンプリング戦略,不確実性定量化,評価指標などの重要な設計選択が,それらの性能に与える影響について検討する。
共通の落とし穴を特定し,実践的緩和戦略について議論することにより,材料科学におけるALワークフローの効率的な設計,評価,解釈の指導を行う。
関連論文リスト
- Understanding Specification-Driven Code Generation with LLMs: An Empirical Study Design [2.687678248171195]
大規模言語モデル(LLM)は、ますますソフトウェア開発に統合されているが、構造化された仕様駆動プロセスにおけるそれらの振る舞いは、いまだに理解されていない。
本稿では,LLM支援コード生成のためのヒューマン・イン・ザ・ループ・ワークフローを実現するVisual Studio Code拡張であるCURRANTEを用いた実証的研究設計を提案する。
本研究の目的は,LLM生成コードの品質と力学に人間による介入がどう影響するかを解析することである。
論文 参考訳(メタデータ) (2026-01-07T12:46:57Z) - Best Practices for Machine Learning Experimentation in Scientific Applications [3.093890460224435]
本稿では,科学的応用における機械学習実験の実践的かつ構造化されたガイドを提案する。
データセット作成からモデル選択,評価に至るまで,ステップバイステップのワークフローを概説する。
本稿では、対数オーバーフィッティング比(LOR)や複合オーバーフィッティングスコア(COS)など、折り畳みのオーバーフィッティングと不安定性を考慮に入れたメトリクスを提案する。
論文 参考訳(メタデータ) (2025-11-26T13:02:31Z) - Evaluating Large Language Models for Real-World Engineering Tasks [75.97299249823972]
本稿では,実運用指向のエンジニアリングシナリオから得られた100以上の質問をキュレートしたデータベースを提案する。
このデータセットを用いて、4つの最先端の大規模言語モデル(LLM)を評価する。
以上の結果から,LLMは時間的および構造的推論において強みを示すが,抽象的推論や形式的モデリング,文脈に敏感な工学的論理にはかなり苦労することがわかった。
論文 参考訳(メタデータ) (2025-05-12T14:05:23Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Active Learning for Derivative-Based Global Sensitivity Analysis with Gaussian Processes [70.66864668709677]
高価なブラックボックス関数のグローバル感度解析におけるアクティブラーニングの問題点を考察する。
関数評価は高価であるため,最も価値の高い実験資源の優先順位付けにアクティブラーニングを利用する。
本稿では,デリバティブに基づくグローバル感度測定の重要量を直接対象とする,新たな能動的学習獲得関数を提案する。
論文 参考訳(メタデータ) (2024-07-13T01:41:12Z) - FlowBench: Revisiting and Benchmarking Workflow-Guided Planning for LLM-based Agents [64.1759086221016]
ワークフロー誘導計画の最初のベンチマークであるFlowBenchを紹介します。
FlowBenchは6つのドメインから51のシナリオをカバーしている。
以上の結果から,現在のLLMエージェントは良好な計画を立てるためにかなりの改善が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T06:13:00Z) - A Case Study on Test Case Construction with Large Language Models:
Unveiling Practical Insights and Challenges [2.7029792239733914]
本稿では,ソフトウェア工学の文脈におけるテストケース構築における大規模言語モデルの適用について検討する。
定性分析と定量分析の混合により, LLMが試験ケースの包括性, 精度, 効率に与える影響を評価する。
論文 参考訳(メタデータ) (2023-12-19T20:59:02Z) - Benchmarking Active Learning Strategies for Materials Optimization and
Discovery [17.8738267360992]
本稿では,様々な獲得関数の形で,アクティブな学習戦略をベンチマークするための参照データセットを提案する。
本稿では,アルゴリズムの性能,材料探索空間,複雑さ,事前知識の具体化との関係について論じる。
論文 参考訳(メタデータ) (2022-04-12T14:27:33Z) - Rebuilding Trust in Active Learning with Actionable Metrics [77.99796068970569]
アクティブラーニング(AL)は研究の活発な領域であるが、プレッシャーのあるニーズにもかかわらず、業界ではほとんど使われない。
これは部分的には目的のずれによるものであり、研究は選択したデータセットで最高の結果を得るよう努力している。
積極的学習における産業実践者の信頼回復を支援するために,様々な活動可能な指標を提示する。
論文 参考訳(メタデータ) (2020-12-18T09:34:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。