論文の概要: Human-in-the-Loop and AI: Crowdsourcing Metadata Vocabulary for Materials Science
- arxiv url: http://arxiv.org/abs/2512.09895v1
- Date: Wed, 10 Dec 2025 18:22:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.632868
- Title: Human-in-the-Loop and AI: Crowdsourcing Metadata Vocabulary for Materials Science
- Title(参考訳): 人間-in-the-LoopとAI: 材料科学のためのメタデータ語彙のクラウドソーシング
- Authors: Jane Greenberg, Scott McClellan, Addy Ireland, Robert Sammarco, Colton Gerber, Christopher B. Rauch, Mat Kelly, John Kunze, Yuan An, Eric Toberer,
- Abstract要約: MatSci-YAMZは、人工知能(AI)とHuman-in-the-loop(HILT)を統合してメタデータ語彙開発をサポートするプラットフォームである。
本稿では,物質科学におけるAI-HILTモデルを評価する概念実証事例について報告する。
- 参考スコア(独自算出の注目度): 0.054137763452448064
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Metadata vocabularies are essential for advancing FAIR and FARR data principles, but their development constrained by limited human resources and inconsistent standardization practices. This paper introduces MatSci-YAMZ, a platform that integrates artificial intelligence (AI) and human-in-the-loop (HILT), including crowdsourcing, to support metadata vocabulary development. The paper reports on a proof-of-concept use case evaluating the AI-HILT model in materials science, a highly interdisciplinary domain Six (6) participants affiliated with the NSF Institute for Data-Driven Dynamical Design (ID4) engaged with the MatSci-YAMZ plaform over several weeks, contributing term definitions and providing examples to prompt the AI-definitions refinement. Nineteen (19) AI-generated definitions were successfully created, with iterative feedback loops demonstrating the feasibility of AI-HILT refinement. Findings confirm the feasibility AI-HILT model highlighting 1) a successful proof of concept, 2) alignment with FAIR and open-science principles, 3) a research protocol to guide future studies, and 4) the potential for scalability across domains. Overall, MatSci-YAMZ's underlying model has the capacity to enhance semantic transparency and reduce time required for consensus building and metadata vocabulary development.
- Abstract(参考訳): メタデータ語彙は、FAIRやFARRのデータ原則の進化に不可欠であるが、その開発は限られた人材と一貫性のない標準化の慣行に制約されている。
本稿では,AI(AI)とHuman-in-the-loop(HILT)を統合したメタデータ語彙開発を支援するプラットフォームであるMatSci-YAMZを紹介する。
論文は,物質科学におけるAI-HILTモデルを評価する概念実証のユースケースについて報告し,NSFデータ駆動力学設計研究所(ID4)に属する6人の参加者が数週間にわたってMatSci-YAMZプラフォームに携わり,用語定義に寄与し,AI-定義の洗練を促す事例を提供する。
19(19) AIの生成した定義は、AI-HILTの改良の実現可能性を示す反復的なフィードバックループによって、うまく作成されました。
発見者がAI-HILTモデルハイライトの実現可能性を確認する
1) 概念実証の成功
2)FAIRとオープンサイエンスの原則との整合性。
3)今後の研究を導くための研究議定書、及び
4) ドメイン間のスケーラビリティの可能性。
全体として、MatSci-YAMZの基盤となるモデルは、セマンティックな透明性を高め、コンセンサスの構築とメタデータの語彙開発に必要な時間を短縮する能力を持っている。
関連論文リスト
- FITS: Towards an AI-Driven Fashion Information Tool for Sustainability [1.1246926724539141]
本研究は,ファッションブランドのサステナビリティデータの分類に自然言語処理(NLP)技術を適用する方法について検討する。
本稿では,持続可能性情報の抽出と分類を行うトランスフォーマシステムであるFITS(Fashion Information Tool for Sustainability)のプロトタイプを提案する。
FITSはユーザが関連するデータを検索し、自身のデータを分析し、インタラクティブなインターフェースを通じて情報を探索することを可能にする。
論文 参考訳(メタデータ) (2025-09-30T09:47:42Z) - Data Readiness for Scientific AI at Scale [0.0]
本稿では,AIのためのデータ準備性(DRAI)の原則が,基礎モデルのトレーニングに使用されるリーダーシップスケールの科学的データセットにどのように適用されるかを検討する。
我々は, 気候, 核融合, 生物・健康, 材料など, 4つの代表的な領域にわたる古細菌の分析を行った。
我々は、データ準備レベル(AI対応)とデータ処理ステージ(シャードに最も近い)からなる2次元準備性フレームワークを導入する。
論文 参考訳(メタデータ) (2025-07-30T18:30:37Z) - Teaching Large Language Models to Maintain Contextual Faithfulness via Synthetic Tasks and Reinforcement Learning [80.27561080938747]
CANOEは、人間のアノテーションを使わずに、下流のさまざまなタスクにまたがる大きな言語モデルの忠実性の幻覚を減らすためのフレームワークである。
Dual-GRPOはルールベースの強化学習手法であり、合成された短値QAデータから得られる3つのルールベースの報酬を含む。
実験の結果、CANOEは11のタスクにまたがるLLMの忠実さを大幅に改善し、最も進歩したLLMよりも優れていた。
論文 参考訳(メタデータ) (2025-05-22T10:10:07Z) - Advancing AI Research Assistants with Expert-Involved Learning [84.30323604785646]
大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Survey on Vision-Language-Action Models [0.2636873872510828]
この研究は、オリジナルの研究を表現していないが、AIが文学レビューの自動化にどのように役立つかを強調している。
今後の研究は、AI支援文学レビューのための構造化されたフレームワークの開発に焦点を当てる。
論文 参考訳(メタデータ) (2025-02-07T11:56:46Z) - The Future of AI: Exploring the Potential of Large Concept Models [0.5755004576310334]
ジェネレーティブAIは、Large Language Models (LLMs) という用語が日常のユビキタスな部分となったことで、重要な時代となった。
LLMは、テキスト要約、コード生成、クリエイティブな書き込みといったタスクにおいて、例外的な機能を示してきた。
これらの制限に対処するため、MetaはLarge Concept Models (LCM)を導入した。
LCMは概念を理解の基本単位として使用し、より洗練された意味論的推論と文脈対応の意思決定を可能にする。
論文 参考訳(メタデータ) (2025-01-08T18:18:37Z) - Multi-Stage Knowledge Integration of Vision-Language Models for Continual Learning [79.46570165281084]
蒸留法における人間の学習過程をエミュレートするマルチステージ知識統合ネットワーク(MulKI)を提案する。
Mulkiは、イデオロギーの排除、新しいイデオロギーの追加、イデオロギーの排除、コネクティクスの作りという4つの段階を通じてこれを達成している。
提案手法は,下流タスク間の連続学習をサポートしながら,ゼロショット能力の維持における大幅な改善を示す。
論文 参考訳(メタデータ) (2024-11-11T07:36:19Z) - Roadmap towards Superhuman Speech Understanding using Large Language Models [60.57947401837938]
大規模言語モデル(LLM)は、音声データと音声データを統合したものである。
GPT-4oのような最近の進歩は、エンドツーエンドのLLMの可能性を強調している。
本稿では,基本自動音声認識(ASR)から高度な超人モデルまで,5段階のロードマップを提案する。
論文 参考訳(メタデータ) (2024-10-17T06:44:06Z) - Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.63497537202751]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文 参考訳(メタデータ) (2024-07-11T14:00:53Z) - The Case for Scalable, Data-Driven Theory: A Paradigm for Scientific
Progress in NLP [10.013604276642218]
言語構造に関するスケーラブルなデータ駆動理論の開発を中心に,NLPにおける科学的進歩のためのパラダイムを提案する。
データ収集と理論モデリングの原理を概説する。
論文 参考訳(メタデータ) (2023-12-01T04:55:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。