Fugu-MT 論文翻訳(概要): KnowledgeShovel: An AI-in-the-Loop Document Annotation System for Scientific Knowledge Base Construction

論文の概要: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for Scientific Knowledge Base Construction

arxiv url: http://arxiv.org/abs/2210.02830v1
Date: Thu, 6 Oct 2022 11:38:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-07 17:39:27.057510
Title: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for Scientific Knowledge Base Construction
Title（参考訳）: KnowledgeShovel:科学知識ベース構築のためのAI-in-the-Loopドキュメンテーションアノテーションシステム
Authors: Shao Zhang, Yuting Jia, Hui Xu, Dakuo Wang, Toby Jia-jun Li, Ying Wen, Xinbing Wang, Chenghu Zhou
Abstract要約: KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。 KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。 7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
参考スコア（独自算出の注目度）: 46.56643271476249
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Constructing a comprehensive, accurate, and useful scientific knowledge base is crucial for human researchers synthesizing scientific knowledge and for enabling Al-driven scientific discovery. However, the current process is difficult, error-prone, and laborious due to (1) the enormous amount of scientific literature available; (2) the highly-specialized scientific domains; (3) the diverse modalities of information (text, figure, table); and, (4) the silos of scientific knowledge in different publications with inconsistent formats and structures. Informed by a formative study and iterated with participatory design workshops, we designed and developed KnowledgeShovel, an Al-in-the-Loop document annotation system for researchers to construct scientific knowledge bases. The design of KnowledgeShovel introduces a multi-step multi-modal human-AI collaboration pipeline that aligns with users' existing workflows to improve data accuracy while reducing the human burden. A follow-up user evaluation with 7 geoscience researchers shows that KnowledgeShovel can enable efficient construction of scientific knowledge bases with satisfactory accuracy.
Abstract（参考訳）: 包括的で正確で有用な科学的知識基盤を構築することは、科学的知識を合成し、al駆動の科学的発見を可能にするために重要である。しかし,(1)利用可能な膨大な科学文献,(2)高度に専門化された科学領域,(3)情報(文章,図形,表)の多様さ,(4)不整合な形式と構造を持つ出版物における科学知識のサイロなどにより,現状のプロセスは困難で誤りを生じやすい。そこで我々は,学術知識基盤を構築するためのAl-in-the-Loop文書アノテーションシステムであるKnowledgeShovelを設計・開発した。 KnowledgeShovelの設計では、ユーザの既存のワークフローと整合するマルチステップのヒューマン-AIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。 7つの地学研究者によるフォローアップユーザ評価は、知識ショベルが科学的知識ベースを十分な精度で効率的に構築できることを示している。

関連論文リスト

SciEvalKit: An Open-source Evaluation Toolkit for Scientific General Intelligence [99.30934038146965]
SciEvalKitは、科学知能のコア能力に焦点を当てている。物理学、化学から天文学、材料科学まで6つの主要な科学領域をサポートしている。このツールキットはオープンソースで、コミュニティ主導の開発とAI4Scienceの進歩を促進するために積極的にメンテナンスされている。
論文参考訳（メタデータ） (2025-12-26T17:36:02Z)
OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists [47.41269933143946]
我々は、人間の研究の基盤となるメカニズムをAI科学ワークフローにエンコードするフレームワークであるOmniScientistを紹介します。 OmniScientistは、データ基盤全体にわたるエンドツーエンドの自動化、文献レビュー、研究のアイデア、実験の自動化、科学的執筆、ピアレビューを実現している。このインフラは、エージェントが人間の知識システムを理解し、活用するだけでなく、協力し、共同開発することを可能にする。
論文参考訳（メタデータ） (2025-11-21T03:55:19Z)
Advancing Scientific Knowledge Retrieval and Reuse with a Novel Digital Library for Machine-Readable Knowledge [4.450387519903374]
ORKG rebornは、科学的知識の正確な、きめ細かい、再現可能な機械可読表現の発見、アクセス、再利用をサポートする、新興デジタルライブラリである。提案システムについて述べるとともに,現状のデジタルライブラリや文書中心の学術コミュニケーションとは対照的に,その実用性と情報検索の可能性を示す。
論文参考訳（メタデータ） (2025-11-11T17:20:02Z)
SciGPT: A Large Language Model for Scientific Literature Understanding and Knowledge Discovery [3.779883844533933]
本稿では、科学文献理解のためのドメイン適応モデルSciGPTと、科学的LLMを評価するためのオープンソースベンチマークSciGPTを提案する。 Qwen3アーキテクチャ上に構築されたSciGPTには、パフォーマンスと効率のバランスをとるために、(1)2段階のパイプラインによる低コストなドメイン蒸留、(2)32,000の長期的推論のために、メモリ消費を55%削減するスパース混合処理の注意機構、(3)ドメイン固有のニュアンスを統合する知識認識適応の3つの革新が含まれている。 ScienceBenchの実験結果によると、SciGPTは配列を含む中核的な科学的タスクにおいてGPT-4oを上回っている。
論文参考訳（メタデータ） (2025-09-09T16:09:19Z)
ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.33626657942169]
大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文参考訳（メタデータ） (2025-05-30T07:28:20Z)
Advancing the Scientific Method with Large Language Models: From Hypothesis to Discovery [35.888956949646]
大規模言語モデル (LLM) は科学的方法を変えて科学的研究を変革している。 LLMは、特に化学や生物学において、実験的な設計、データ分析、生産性の向上に関与している。 AI駆動科学への移行は、創造性、監視、責任に関する倫理的な疑問を提起する。
論文参考訳（メタデータ） (2025-05-22T10:05:48Z)
SciMantify -- A Hybrid Approach for the Evolving Semantification of Scientific Knowledge [0.4499833362998487]
本稿では、5つ星リンクオープンデータ(LOD)モデルにインスパイアされた知識表現の進化モデルを提案する。我々はSciMantifyと呼ばれるハイブリッドアプローチを開発し、その進化するセマンティフィケーションをサポートする。我々は、科学知識の発見性、アクセシビリティ、相互運用性、再利用性を改善するための確立されたプラットフォームであるOpen Research Knowledge Graph(ORKG)にこのアプローチを実装します。
論文参考訳（メタデータ） (2025-04-14T07:57:55Z)
Scaling Laws in Scientific Discovery with AI and Robot Scientists [72.3420699173245]
自律的なジェネラリスト科学者(AGS)の概念は、エージェントAIとエンボディロボットを組み合わせて、研究ライフサイクル全体を自動化している。 AGSは科学的発見に必要な時間と資源を大幅に削減することを目指している。これらの自律的なシステムが研究プロセスにますます統合されるにつれて、科学的な発見が新しいスケーリング法則に従うかもしれないという仮説を立てる。
論文参考訳（メタデータ） (2025-03-28T14:00:27Z)
Large Language Models: New Opportunities for Access to Science [0.0]
KM3NeTニュートリノ検出器のオープンサイエンス環境構築における検索型Augmented Generation-enhanced chatアプリケーションの取り込みは、我々の科学に大規模言語モデルが広く適用される可能性を探究するための焦点となる。
論文参考訳（メタデータ） (2025-01-13T11:58:27Z)
Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation [48.29699224989952]
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。このマルチエージェントアプローチは、新規で影響力のある科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-10-12T07:16:22Z)
Fine-tuning and Prompt Engineering with Cognitive Knowledge Graphs for Scholarly Knowledge Organization [0.14999444543328289]
本研究は,大規模言語モデル(LLM)を用いた構造化学術知識の効果的伝達に焦点をあてる。 LLMは学術論文を分類し、その貢献を構造化され、同等の方法で記述する。我々の方法論は、LLMの知識を活用し、CKGから得られた領域の専門家が検証した学術データと補完することである。
論文参考訳（メタデータ） (2024-09-10T11:31:02Z)
SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文参考訳（メタデータ） (2024-06-20T22:03:21Z)
SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models [35.98892300665275]
SciKnowEvalベンチマーク(SciKnowEval benchmark)は,5つの科学的知識の段階にわたる大規模言語モデル(LLM)を評価するフレームワークである。これらのレベルは、記憶、理解、推論、識別、応用を含むLLMにおける科学知識の幅と深さを評価することを目的としている。ゼロショットと少数ショットのプロンプト戦略を用いて、26の高度なオープンソースおよびプロプライエタリなLCMをベンチマークした。
論文参考訳（メタデータ） (2024-06-13T13:27:52Z)
Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文参考訳（メタデータ） (2023-10-11T08:22:37Z)
Modeling Information Change in Science Communication with Semantically Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。 SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。 SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文参考訳（メタデータ） (2022-10-24T07:44:38Z)
Retrieval of Scientific and Technological Resources for Experts and Scholars [20.89926457148302]
専門家や学者の科学的・技術的資源は主に基本的な属性と科学的研究の成果から成り立っている。情報非対称性やその他の理由により、専門家や学者の科学的・技術的資源は、タイムリーな方法で社会と結びつくことはできない。本稿では,テキスト関係抽出,テキスト知識表現学習,テキストベクトル検索,可視化システムという4つの側面から,本分野における関連する研究成果を整理する。
論文参考訳（メタデータ） (2022-04-13T02:32:09Z)
Integration of knowledge and data in machine learning [0.456877715768796]
知識の埋め込みを通じて、知識とデータの障壁を破り、物理的な常識を持つ機械学習モデルを形成することができる。知識発見は機械学習を利用して観察から新しい知識を抽出する。本研究は,既存の文献を要約・分析するだけでなく,研究のギャップと今後の可能性も提案する。
論文参考訳（メタデータ） (2022-02-15T10:35:53Z)
CitationIE: Leveraging the Citation Graph for Scientific Information Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文参考訳（メタデータ） (2021-06-03T03:00:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。