Fugu-MT 論文翻訳(概要): CLAIMED -- the open source framework for building coarse-grained operators for accelerated discovery in science

論文の概要: CLAIMED -- the open source framework for building coarse-grained operators for accelerated discovery in science

arxiv url: http://arxiv.org/abs/2307.06824v1
Date: Wed, 12 Jul 2023 11:54:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-14 14:20:10.790454
Title: CLAIMED -- the open source framework for building coarse-grained operators for accelerated discovery in science
Title（参考訳）: claimed -- 科学における発見を加速するための粗粒演算子構築のためのオープンソースフレームワーク
Authors: Romeo Kienzler, Rafflesia Khan, Jerome Nilmeier, Ivan Nesic, Ibrahim Haddad
Abstract要約: CLAIMEDは、科学者が科学演算子を再コンパイルすることによって以前の研究から引き出すのを支援することで、再利用可能な演算子とスケーラブルな科学的不可知性を構築するためのフレームワークである。 CLAIMEDはプログラミング言語、科学ライブラリ、実行環境である。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In modern data-driven science, reproducibility and reusability are key challenges. Scientists are well skilled in the process from data to publication. Although some publication channels require source code and data to be made accessible, rerunning and verifying experiments is usually hard due to a lack of standards. Therefore, reusing existing scientific data processing code from state-of-the-art research is hard as well. This is why we introduce CLAIMED, which has a proven track record in scientific research for addressing the repeatability and reusability issues in modern data-driven science. CLAIMED is a framework to build reusable operators and scalable scientific workflows by supporting the scientist to draw from previous work by re-composing workflows from existing libraries of coarse-grained scientific operators. Although various implementations exist, CLAIMED is programming language, scientific library, and execution environment agnostic.
Abstract（参考訳）: 現代のデータ駆動科学では、再現性と再利用性が重要な課題である。科学者はデータから出版までのプロセスに精通している。一部の出版チャネルはソースコードとデータにアクセスできるようにする必要があるが、実験の再実行と検証は通常、標準の欠如のために難しい。したがって、最先端の研究から既存の科学データ処理コードを再利用することも困難である。 CLAIMEDは、現代のデータ駆動科学における再現性と再利用性の問題に対処するために、科学研究において実績がある。 claimedは、再利用可能な演算子とスケーラブルな科学ワークフローを構築するためのフレームワークで、粗粒の科学演算子の既存のライブラリからワークフローを再構成することで、科学者が以前の作業から引き出すことができる。様々な実装が存在するが、CLAIMEDはプログラミング言語、科学ライブラリ、実行環境に依存しない。

関連論文リスト

WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.16160754134139]
我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文参考訳（メタデータ） (2026-01-09T06:35:23Z)
Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。 BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。 SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文参考訳（メタデータ） (2025-12-23T16:04:41Z)
The Reproducible Research Platform establishes a unified open science environment bridging data and software lifecycles across disciplines, from proposal to publication [0.0]
我々は、オープンソースのReproducible Research Platform(RRP)を開発し、バージョン管理されたコンテナ化された計算環境と研究データ管理を統合する。 RRPは、誰でも手作業による検索やプラットフォーム固有のセットアップなしで、フルドキュメントのFAIRリサーチを実行、再利用、公開することができる。 10年以上にわたる研究を含む様々な研究の結果を再現し、持続的なユーザビリティを示すことにより、RPの影響を実証する。
論文参考訳（メタデータ） (2025-12-04T22:02:19Z)
Advancing Scientific Knowledge Retrieval and Reuse with a Novel Digital Library for Machine-Readable Knowledge [4.450387519903374]
ORKG rebornは、科学的知識の正確な、きめ細かい、再現可能な機械可読表現の発見、アクセス、再利用をサポートする、新興デジタルライブラリである。提案システムについて述べるとともに,現状のデジタルライブラリや文書中心の学術コミュニケーションとは対照的に,その実用性と情報検索の可能性を示す。
論文参考訳（メタデータ） (2025-11-11T17:20:02Z)
Scientific Open-Source Software Is Less Likely to Become Abandoned Than One Might Think! Lessons from Curating a Catalog of Maintained Scientific Software [11.900608344217844]
私たちは、World of Codeの公開ソフトウェアリポジトリを分類するために、大きな言語モデルを使用します。生存モデルを推定し、ドメイン、インフラ層、その他の属性がその寿命にどのように影響するかを理解する。私たちは、インフラ層、下流の依存関係、出版物の言及、そして政府の参加者が長寿命に結びついていることに気付きました。
論文参考訳（メタデータ） (2025-04-26T16:49:49Z)
Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists [6.2329239454115415]
本研究では、さまざまな分野の57人の科学者を対象に、コード可読性に関して直面するプログラミングの背景、実践、課題について調査する。科学者は主にPythonとRを使用し、可読性に関するドキュメントに依存している。以上の結果から,コード品質ツールの採用率の低下と,コード品質を改善するために大規模言語モデルを活用する傾向が示唆された。
論文参考訳（メタデータ） (2025-01-17T08:47:29Z)
Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.832818186789545]
Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。 VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-10-12T07:16:22Z)
A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文参考訳（メタデータ） (2024-06-16T08:03:24Z)
MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。 MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文参考訳（メタデータ） (2024-06-10T15:19:09Z)
DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows [72.40917624485822]
我々は、研究者が強力な大規模言語モデルを実装することができるオープンソースのPythonライブラリであるDataDreamerを紹介した。 DataDreamerはまた、オープンサイエンスを促進するために提案するベストプラクティスに研究者が従うのを助ける。
論文参考訳（メタデータ） (2024-02-16T00:10:26Z)
SciCat: A Curated Dataset of Scientific Software Repositories [4.77982299447395]
我々は、FLOSS(Free-Libre Open Source Software)プロジェクトの包括的なコレクションであるSciCatデータセットを紹介します。私たちのアプローチは、World of Codeのデータソースから、1億3100万の削除されたリポジトリのプールからプロジェクトを選択することです。本分類は, 科学的目的のために設計されたソフトウェア, 研究関連プロジェクト, 研究支援ソフトウェアに焦点をあてる。
論文参考訳（メタデータ） (2023-12-11T13:46:33Z)
A Backend Platform for Supporting the Reproducibility of Computational Experiments [2.1485350418225244]
同じフレームワークやコード、データソース、プログラミング言語、依存関係などを使って、同じ環境を再現することは困難です。本研究では,実験の共有,構成,パッケージング,実行を可能にする統合開発環境を提案する。これらの実験の20(80%)を再現し,その成果を最小限の努力で得られた。
論文参考訳（メタデータ） (2023-06-29T10:29:11Z)
Caching and Reproducibility: Making Data Science experiments faster and FAIRer [25.91002326340444]
小規模から中規模のデータサイエンス実験は、個々の科学者や小さなチームによってアドホックに開発された研究ソフトウェアに依存していることが多い。コードの最初の行が書かれる前にも、キャッシュを研究ソフトウェア開発プロセスの不可欠な部分にすることを提案します。
論文参考訳（メタデータ） (2022-11-08T07:11:02Z)
Modeling Information Change in Science Communication with Semantically Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。 SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。 SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文参考訳（メタデータ） (2022-10-24T07:44:38Z)
KnowledgeShovel: An AI-in-the-Loop Document Annotation System for Scientific Knowledge Base Construction [46.56643271476249]
KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。 KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。 7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
論文参考訳（メタデータ） (2022-10-06T11:38:18Z)
Automated Creation and Human-assisted Curation of Computable Scientific Models from Code and Text [2.3746609573239756]
ドメインエキスパートは、コードに詳しくなければ、科学的モデルの実装を完全に理解することはできない。我々は,科学モデルの自動作成と人手によるキュレーションのためのシステムを開発した。本研究では,NASAのハイパーソニック・エアロダイナミックス(Hypersonic Aerodynamics)のウェブサイトから得られたコードと関連テキストのデータセットを用いて実験を行った。
論文参考訳（メタデータ） (2022-01-28T17:31:38Z)
Fact or Fiction: Verifying Scientific Claims [53.29101835904273]
本稿では,研究文献から,REFUTESやREFUTESが与えられた科学的主張であることを示す証拠を含む抄録を抽出する新たな課題である,科学的クレーム検証を紹介する。 SciFactは、1.4Kの専門家による科学的主張と、ラベルや合理性に注釈を付けたエビデンスを含む抽象概念を組み合わせたデータセットである。このシステムは,CORD-19コーパスの証拠を同定することにより,新型コロナウイルス関連クレームを検証可能であることを示す。
論文参考訳（メタデータ） (2020-04-30T17:22:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。