論文の概要: Automated Creation and Human-assisted Curation of Computable Scientific
Models from Code and Text
- arxiv url: http://arxiv.org/abs/2202.13739v1
- Date: Fri, 28 Jan 2022 17:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-06 13:08:17.174272
- Title: Automated Creation and Human-assisted Curation of Computable Scientific
Models from Code and Text
- Title(参考訳): コードとテキストによる計算可能科学モデルの自動作成と人力支援
- Authors: Varish Mulwad, Andrew Crapo, Vijay S. Kumar, James Jobin, Alfredo
Gabaldon, Nurali Virani, Sharad Dixit, Narendra Joshi
- Abstract要約: ドメインエキスパートは、コードに詳しくなければ、科学的モデルの実装を完全に理解することはできない。
我々は,科学モデルの自動作成と人手によるキュレーションのためのシステムを開発した。
本研究では,NASAのハイパーソニック・エアロダイナミックス(Hypersonic Aerodynamics)のウェブサイトから得られたコードと関連テキストのデータセットを用いて実験を行った。
- 参考スコア(独自算出の注目度): 2.3746609573239756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific models hold the key to better understanding and predicting the
behavior of complex systems. The most comprehensive manifestation of a
scientific model, including crucial assumptions and parameters that underpin
its usability, is usually embedded in associated source code and documentation,
which may employ a variety of (potentially outdated) programming practices and
languages. Domain experts cannot gain a complete understanding of the
implementation of a scientific model if they are not familiar with the code.
Furthermore, rapid research and development iterations make it challenging to
keep up with constantly evolving scientific model codebases. To address these
challenges, we develop a system for the automated creation and human-assisted
curation of a knowledge graph of computable scientific models that analyzes a
model's code in the context of any associated inline comments and external
documentation. Our system uses knowledge-driven as well as data-driven
approaches to identify and extract relevant concepts from code and equations
from textual documents to semantically annotate models using domain
terminology. These models are converted into executable Python functions and
then can further be composed into complex workflows to answer different forms
of domain-driven questions. We present experimental results obtained using a
dataset of code and associated text derived from NASA's Hypersonic Aerodynamics
website.
- Abstract(参考訳): 科学モデルは複雑なシステムの振る舞いをよりよく理解し予測するための鍵を握る。
科学的モデルの最も包括的な表現は、そのユーザビリティを支える重要な仮定やパラメータを含むが、通常は関連するソースコードやドキュメントに埋め込まれ、様々な(潜在的に時代遅れの)プログラミングプラクティスや言語が用いられる。
ドメインの専門家は、コードに精通していない場合、科学的モデルの実装を完全に理解することができません。
さらに、急速な研究と開発イテレーションは、絶え間なく進化する科学モデルコードベースに追いつくのを難しくします。
これらの課題に対処するため、我々は、関連するインラインコメントや外部文書の文脈でモデルのコードを解析する計算可能な科学モデルの知識グラフの自動作成と人力によるキュレーションシステムを開発する。
本システムでは,知識駆動型およびデータ駆動型アプローチを用いて,コードや方程式からテキスト文書から,ドメイン用語を用いた意味論的注釈モデルまで,関連する概念を識別・抽出する。
これらのモデルは実行可能なpython関数に変換され、さらに複雑なワークフローに構成され、異なる形式のドメイン駆動質問に答えることができる。
我々は、nasaのhypersonic aerospaces webサイトから派生したコードと関連するテキストのデータセットを用いて実験結果を示す。
関連論文リスト
- The Future of Scientific Publishing: Automated Article Generation [0.0]
本研究では,Python コードからの学術論文の自動生成を目的とした,大規模言語モデル(LLM)プロンプトを活用した新しいソフトウェアツールを提案する。
Pythonは基本的な概念実証として機能するが、基盤となる方法論とフレームワークは、さまざまなGitHubリポジトリにまたがる適応性を示している。
この開発は高度な言語モデルエージェントに頼らずに達成され、一貫性と総合的な学術的コンテンツの自動生成において高い忠実性を確保した。
論文 参考訳(メタデータ) (2024-04-11T16:47:02Z) - Generative retrieval-augmented ontologic graph and multi-agent
strategies for interpretive large language model-based materials design [0.0]
トランスフォーマーニューラルネットワークは、特に材料分析、設計、製造において、有望な能力を示す。
本稿では,教材の工学的分析を支援するツールとして,大規模言語モデル(LLM)の利用について検討する。
論文 参考訳(メタデータ) (2023-10-30T20:31:50Z) - Large Language Models for Scientific Synthesis, Inference and
Explanation [56.41963802804953]
大規模言語モデルがどのように科学的合成、推論、説明を行うことができるかを示す。
我々は,この「知識」を科学的文献から合成することで,大きな言語モデルによって強化できることを示す。
このアプローチは、大きな言語モデルが機械学習システムの予測を説明することができるというさらなる利点を持っている。
論文 参考訳(メタデータ) (2023-10-12T02:17:59Z) - Generative Models as a Complex Systems Science: How can we make sense of
large language model behavior? [75.79305790453654]
事前訓練されたモデルから望ましい振る舞いを排除し、望ましくないモデルを避けながら、NLPを再定義した。
言語モデルの振る舞いをタスク間性能を説明するカテゴリに分解する体系的な取り組みについて論じる。
論文 参考訳(メタデータ) (2023-07-31T22:58:41Z) - Grounded Decoding: Guiding Text Generation with Grounded Models for
Embodied Agents [111.15288256221764]
グラウンデッドデコーディングプロジェクトは、両方のモデルの知識を活用することで、ロボット環境で複雑な長期タスクを解決することを目的としている。
我々はこれを確率的フィルタリングに類似した問題として、言語モデルの下で高い確率を持つシーケンスをデコードし、基底モデル対象のセットで高い確率を示す。
本研究では,3つのシミュレーション領域と実世界の領域にまたがって,そのような基底モデルがどのように得られるのかを実証し,両モデルの知識を活用して,ロボット環境での複雑な長期的タスクを解くことができることを示す。
論文 参考訳(メタデータ) (2023-03-01T22:58:50Z) - Constructing Effective Machine Learning Models for the Sciences: A
Multidisciplinary Perspective [77.53142165205281]
線形回帰モデルに変数間の変換や相互作用を手動で追加することで、非線形解が必ずしも改善されないことを示す。
データ駆動モデルを構築する前にこれを認識する方法や、そのような分析が本質的に解釈可能な回帰モデルへの移行にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2022-11-21T17:48:44Z) - An Overview on Controllable Text Generation via Variational
Auto-Encoders [15.97186478109836]
ニューラルベース生成モデリングの最近の進歩は、コンピュータシステムが人間と会話できるという期待を再燃させた。
変分自動エンコーダ(VAE)のような潜在変数モデル(LVM)は、テキストデータの分布パターンを特徴付けるように設計されている。
この概要は、既存の生成方式、テキスト変分自動エンコーダに関連する問題、および制御可能な生成に関するいくつかのアプリケーションについて概説する。
論文 参考訳(メタデータ) (2022-11-15T07:36:11Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - PHOTONAI -- A Python API for Rapid Machine Learning Model Development [2.414341608751139]
PHOTONAIは、機械学習モデル開発の簡素化と高速化を目的とした、ハイレベルなPython APIである。
これは統一フレームワークとして機能し、ユーザーは異なるツールボックスからのアルゴリズムをカスタムのアルゴリズムシーケンスに簡単にアクセスし、組み合わせることができる。
論文 参考訳(メタデータ) (2020-02-13T10:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。