論文の概要: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction
- arxiv url: http://arxiv.org/abs/2210.02830v1
- Date: Thu, 6 Oct 2022 11:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:39:27.057510
- Title: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction
- Title(参考訳): KnowledgeShovel:科学知識ベース構築のためのAI-in-the-Loopドキュメンテーションアノテーションシステム
- Authors: Shao Zhang, Yuting Jia, Hui Xu, Dakuo Wang, Toby Jia-jun Li, Ying Wen,
Xinbing Wang, Chenghu Zhou
- Abstract要約: KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。
KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
- 参考スコア(独自算出の注目度): 46.56643271476249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constructing a comprehensive, accurate, and useful scientific knowledge base
is crucial for human researchers synthesizing scientific knowledge and for
enabling Al-driven scientific discovery. However, the current process is
difficult, error-prone, and laborious due to (1) the enormous amount of
scientific literature available; (2) the highly-specialized scientific domains;
(3) the diverse modalities of information (text, figure, table); and, (4) the
silos of scientific knowledge in different publications with inconsistent
formats and structures. Informed by a formative study and iterated with
participatory design workshops, we designed and developed KnowledgeShovel, an
Al-in-the-Loop document annotation system for researchers to construct
scientific knowledge bases. The design of KnowledgeShovel introduces a
multi-step multi-modal human-AI collaboration pipeline that aligns with users'
existing workflows to improve data accuracy while reducing the human burden. A
follow-up user evaluation with 7 geoscience researchers shows that
KnowledgeShovel can enable efficient construction of scientific knowledge bases
with satisfactory accuracy.
- Abstract(参考訳): 包括的で正確で有用な科学的知識基盤を構築することは、科学的知識を合成し、al駆動の科学的発見を可能にするために重要である。
しかし,(1)利用可能な膨大な科学文献,(2)高度に専門化された科学領域,(3)情報(文章,図形,表)の多様さ,(4)不整合な形式と構造を持つ出版物における科学知識のサイロなどにより,現状のプロセスは困難で誤りを生じやすい。
そこで我々は,学術知識基盤を構築するためのAl-in-the-Loop文書アノテーションシステムであるKnowledgeShovelを設計・開発した。
KnowledgeShovelの設計では、ユーザの既存のワークフローと整合するマルチステップのヒューマン-AIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価は、知識ショベルが科学的知識ベースを十分な精度で効率的に構築できることを示している。
関連論文リスト
- Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation [48.29699224989952]
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新規で影響力のある科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z) - Fine-tuning and Prompt Engineering with Cognitive Knowledge Graphs for Scholarly Knowledge Organization [0.14999444543328289]
本研究は,大規模言語モデル(LLM)を用いた構造化学術知識の効果的伝達に焦点をあてる。
LLMは学術論文を分類し、その貢献を構造化され、同等の方法で記述する。
我々の方法論は、LLMの知識を活用し、CKGから得られた領域の専門家が検証した学術データと補完することである。
論文 参考訳(メタデータ) (2024-09-10T11:31:02Z) - SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models [35.98892300665275]
SciKnowEvalベンチマーク(SciKnowEval benchmark)は,5つの科学的知識の段階にわたる大規模言語モデル(LLM)を評価するフレームワークである。
これらのレベルは、記憶、理解、推論、識別、応用を含むLLMにおける科学知識の幅と深さを評価することを目的としている。
ゼロショットと少数ショットのプロンプト戦略を用いて、26の高度なオープンソースおよびプロプライエタリなLCMをベンチマークした。
論文 参考訳(メタデータ) (2024-06-13T13:27:52Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Retrieval of Scientific and Technological Resources for Experts and
Scholars [20.89926457148302]
専門家や学者の科学的・技術的資源は主に基本的な属性と科学的研究の成果から成り立っている。
情報非対称性やその他の理由により、専門家や学者の科学的・技術的資源は、タイムリーな方法で社会と結びつくことはできない。
本稿では,テキスト関係抽出,テキスト知識表現学習,テキストベクトル検索,可視化システムという4つの側面から,本分野における関連する研究成果を整理する。
論文 参考訳(メタデータ) (2022-04-13T02:32:09Z) - Integration of knowledge and data in machine learning [0.456877715768796]
知識の埋め込みを通じて、知識とデータの障壁を破り、物理的な常識を持つ機械学習モデルを形成することができる。
知識発見は機械学習を利用して観察から新しい知識を抽出する。
本研究は,既存の文献を要約・分析するだけでなく,研究のギャップと今後の可能性も提案する。
論文 参考訳(メタデータ) (2022-02-15T10:35:53Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。