論文の概要: Human-in-the-Loop and AI: Crowdsourcing Metadata Vocabulary for Materials Science
- arxiv url: http://arxiv.org/abs/2512.09895v1
- Date: Wed, 10 Dec 2025 18:22:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.632868
- Title: Human-in-the-Loop and AI: Crowdsourcing Metadata Vocabulary for Materials Science
- Title(参考訳): 人間-in-the-LoopとAI: 材料科学のためのメタデータ語彙のクラウドソーシング
- Authors: Jane Greenberg, Scott McClellan, Addy Ireland, Robert Sammarco, Colton Gerber, Christopher B. Rauch, Mat Kelly, John Kunze, Yuan An, Eric Toberer,
- Abstract要約: MatSci-YAMZは、人工知能(AI)とHuman-in-the-loop(HILT)を統合してメタデータ語彙開発をサポートするプラットフォームである。
本稿では,物質科学におけるAI-HILTモデルを評価する概念実証事例について報告する。
- 参考スコア(独自算出の注目度): 0.054137763452448064
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Metadata vocabularies are essential for advancing FAIR and FARR data principles, but their development constrained by limited human resources and inconsistent standardization practices. This paper introduces MatSci-YAMZ, a platform that integrates artificial intelligence (AI) and human-in-the-loop (HILT), including crowdsourcing, to support metadata vocabulary development. The paper reports on a proof-of-concept use case evaluating the AI-HILT model in materials science, a highly interdisciplinary domain Six (6) participants affiliated with the NSF Institute for Data-Driven Dynamical Design (ID4) engaged with the MatSci-YAMZ plaform over several weeks, contributing term definitions and providing examples to prompt the AI-definitions refinement. Nineteen (19) AI-generated definitions were successfully created, with iterative feedback loops demonstrating the feasibility of AI-HILT refinement. Findings confirm the feasibility AI-HILT model highlighting 1) a successful proof of concept, 2) alignment with FAIR and open-science principles, 3) a research protocol to guide future studies, and 4) the potential for scalability across domains. Overall, MatSci-YAMZ's underlying model has the capacity to enhance semantic transparency and reduce time required for consensus building and metadata vocabulary development.
- Abstract(参考訳): メタデータ語彙は、FAIRやFARRのデータ原則の進化に不可欠であるが、その開発は限られた人材と一貫性のない標準化の慣行に制約されている。
本稿では,AI(AI)とHuman-in-the-loop(HILT)を統合したメタデータ語彙開発を支援するプラットフォームであるMatSci-YAMZを紹介する。
論文は,物質科学におけるAI-HILTモデルを評価する概念実証のユースケースについて報告し,NSFデータ駆動力学設計研究所(ID4)に属する6人の参加者が数週間にわたってMatSci-YAMZプラフォームに携わり,用語定義に寄与し,AI-定義の洗練を促す事例を提供する。
19(19) AIの生成した定義は、AI-HILTの改良の実現可能性を示す反復的なフィードバックループによって、うまく作成されました。
発見者がAI-HILTモデルハイライトの実現可能性を確認する
1) 概念実証の成功
2)FAIRとオープンサイエンスの原則との整合性。
3)今後の研究を導くための研究議定書、及び
4) ドメイン間のスケーラビリティの可能性。
全体として、MatSci-YAMZの基盤となるモデルは、セマンティックな透明性を高め、コンセンサスの構築とメタデータの語彙開発に必要な時間を短縮する能力を持っている。
関連論文リスト
- Data Readiness for Scientific AI at Scale [0.0]
本稿では,AIのためのデータ準備性(DRAI)の原則が,基礎モデルのトレーニングに使用されるリーダーシップスケールの科学的データセットにどのように適用されるかを検討する。
我々は, 気候, 核融合, 生物・健康, 材料など, 4つの代表的な領域にわたる古細菌の分析を行った。
我々は、データ準備レベル(AI対応)とデータ処理ステージ(シャードに最も近い)からなる2次元準備性フレームワークを導入する。
論文 参考訳(メタデータ) (2025-07-30T18:30:37Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Survey on Vision-Language-Action Models [0.2636873872510828]
この研究は、オリジナルの研究を表現していないが、AIが文学レビューの自動化にどのように役立つかを強調している。
今後の研究は、AI支援文学レビューのための構造化されたフレームワークの開発に焦点を当てる。
論文 参考訳(メタデータ) (2025-02-07T11:56:46Z) - Roadmap towards Superhuman Speech Understanding using Large Language Models [60.57947401837938]
大規模言語モデル(LLM)は、音声データと音声データを統合したものである。
GPT-4oのような最近の進歩は、エンドツーエンドのLLMの可能性を強調している。
本稿では,基本自動音声認識(ASR)から高度な超人モデルまで,5段階のロードマップを提案する。
論文 参考訳(メタデータ) (2024-10-17T06:44:06Z) - Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.63497537202751]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文 参考訳(メタデータ) (2024-07-11T14:00:53Z) - The Case for Scalable, Data-Driven Theory: A Paradigm for Scientific
Progress in NLP [10.013604276642218]
言語構造に関するスケーラブルなデータ駆動理論の開発を中心に,NLPにおける科学的進歩のためのパラダイムを提案する。
データ収集と理論モデリングの原理を概説する。
論文 参考訳(メタデータ) (2023-12-01T04:55:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。