論文の概要: A user-centered approach to designing an experimental laboratory data
platform
- arxiv url: http://arxiv.org/abs/2007.14443v1
- Date: Tue, 28 Jul 2020 19:26:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-07 22:57:32.616984
- Title: A user-centered approach to designing an experimental laboratory data
platform
- Title(参考訳): 実験データプラットフォームの設計におけるユーザ中心のアプローチ
- Authors: Ha-Kyung Kwon, Chirranjeevi Balaji Gopal, Jared Kirschner, Santiago
Caicedo, and Brian D. Storey
- Abstract要約: 実験的なデータプラットフォームにおいて、設計と機能の本質的な要素が何を求めているのかを理解するために、ユーザ中心のアプローチを採用しています。
リッチで複雑な実験データセットをコンテキスト化できる能力を持つことが、ユーザの主な要件であることに気付きました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While automated experiments and high-throughput methods are becoming more
mainstream in the age of data, empowering individual researchers to capture,
collate, and contextualize their data faster and more reproducibly still
remains a challenge in science. Despite the abundance of software products to
help digitize and organize scientific information, their broader adoption in
the scientific community has been hindered by the lack of a holistic
understanding of the diverse needs of researchers and their experimental
processes. In this work, we take a user-centered approach to understand what
essential elements of design and functionality researchers (in chemical and
materials science) want in an experimental data platform to address the problem
of data capture in their experimental processes. We found that having the
capability to contextualize rich, complex experimental datasets is the primary
user requirement. We synthesize this and other key findings into design
criteria for a potential solution.
- Abstract(参考訳): 自動実験と高スループットの手法は、データの時代においてより主流になりつつあるが、個々の研究者がデータをより速く、より再現的に取得し、照合し、コンテキスト化できるようにすることは、科学の課題である。
科学情報のデジタル化と組織化を支援するソフトウェア製品が豊富にあるにもかかわらず、科学コミュニティにおける彼らの広範な採用は、研究者の多様なニーズと実験過程の全体的理解の欠如によって妨げられている。
本研究では,実験データプラットフォームにおける設計と機能(化学・材料科学)の本質的要素が,実験プロセスにおけるデータキャプチャの問題にどう対処するかを理解するために,ユーザ中心のアプローチを採用する。
リッチで複雑な実験データセットをコンテキスト化できる能力を持つことが、ユーザの主な要件であることがわかった。
潜在的なソリューションの設計基準に、これとその他の重要な知見を合成する。
関連論文リスト
- Probing the limitations of multimodal language models for chemistry and materials research [3.422786943576035]
実世界の化学や材料科学のタスクを視覚言語モデルがどのように扱うかを評価するためのベンチマークであるMaCBenchを紹介する。
これらのシステムは、基本的な知覚タスクにおいて有望な能力を示すが、空間的推論、クロスモーダル情報合成、論理的推論の基本的な限界を示す。
私たちの洞察は、化学や材料科学以外にも重要な意味を持ち、信頼性の高いマルチモーダルAI科学アシスタントを開発するには、適切なトレーニングデータとそれらのモデルをトレーニングするためのアプローチのキュレーションの進歩が必要であることを示唆している。
論文 参考訳(メタデータ) (2024-11-25T21:51:45Z) - LLM-itation is the Sincerest Form of Data: Generating Synthetic Buggy Code Submissions for Computing Education [5.421088637597145]
大規模言語モデル(LLM)は、大規模でプライバシを保存する合成データを作成するための有望なアプローチを提供する。
本研究は,GPT-4oを用いた導入プログラミング演習のための合成バグギーコード生成について検討する。
合成データと実生データ間のテストケース故障の分布を比較し,実生データを模倣した合成データの精度を解析した。
論文 参考訳(メタデータ) (2024-11-01T00:24:59Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - To democratize research with sensitive data, we should make synthetic data more accessible [0.7770029179741429]
Erik-Jan van Kesteren氏は、プライバシ向上技術として合成データを広く採用するためには、データサイエンス研究コミュニティはより良い方法の開発から焦点を移すべきだ、と論じている。
論文 参考訳(メタデータ) (2024-04-26T09:18:54Z) - Toward a Team of AI-made Scientists for Scientific Discovery from Gene
Expression Data [9.767546641019862]
我々は、科学的な発見パイプラインを合理化するために設計された新しいフレームワーク、AIマニュフェストチーム(TAIS)を紹介する。
TAISは、プロジェクトマネージャ、データエンジニア、ドメインエキスパートを含むシミュレートされた役割で構成され、それぞれがLLM(Large Language Model)によって表現される。
これらの役割は、典型的にはデータ科学者が行うタスクを再現するために協力し、疾患予測遺伝子を特定することに焦点を当てている。
論文 参考訳(メタデータ) (2024-02-15T06:30:12Z) - Towards Controlled Table-to-Text Generation with Scientific Reasoning [46.87189607486007]
本稿では,科学的文書分析の自動化を目的とした,科学的データに対するユーザの嗜好に合致する,流動的で論理的な記述を生成するための新しいタスクを提案する。
学術文献から抽出したテーブル記述ペアからなる新しい挑戦的データセットSciTabを構築し,強調されたセルとそれに対応するドメイン固有知識ベースを構築した。
その結果、大規模なモデルでは、ユーザの好みに合わせて正確なコンテンツを生成するのに苦労していることがわかりました。
論文 参考訳(メタデータ) (2023-12-08T22:57:35Z) - A Backend Platform for Supporting the Reproducibility of Computational
Experiments [2.1485350418225244]
同じフレームワークやコード、データソース、プログラミング言語、依存関係などを使って、同じ環境を再現することは困難です。
本研究では,実験の共有,構成,パッケージング,実行を可能にする統合開発環境を提案する。
これらの実験の20(80%)を再現し,その成果を最小限の努力で得られた。
論文 参考訳(メタデータ) (2023-06-29T10:29:11Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。