論文の概要: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction
- arxiv url: http://arxiv.org/abs/2210.02830v1
- Date: Thu, 6 Oct 2022 11:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:39:27.057510
- Title: KnowledgeShovel: An AI-in-the-Loop Document Annotation System for
Scientific Knowledge Base Construction
- Title(参考訳): KnowledgeShovel:科学知識ベース構築のためのAI-in-the-Loopドキュメンテーションアノテーションシステム
- Authors: Shao Zhang, Yuting Jia, Hui Xu, Dakuo Wang, Toby Jia-jun Li, Ying Wen,
Xinbing Wang, Chenghu Zhou
- Abstract要約: KnowledgeShovelは、研究者が科学的知識基盤を構築するための、Al-in-the-Loop文書アノテーションシステムである。
KnowledgeShovelの設計では、多段階のマルチモーダルAIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価では、知識ショベルは、十分な精度で科学的知識ベースを効率的に構築できることを示している。
- 参考スコア(独自算出の注目度): 46.56643271476249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constructing a comprehensive, accurate, and useful scientific knowledge base
is crucial for human researchers synthesizing scientific knowledge and for
enabling Al-driven scientific discovery. However, the current process is
difficult, error-prone, and laborious due to (1) the enormous amount of
scientific literature available; (2) the highly-specialized scientific domains;
(3) the diverse modalities of information (text, figure, table); and, (4) the
silos of scientific knowledge in different publications with inconsistent
formats and structures. Informed by a formative study and iterated with
participatory design workshops, we designed and developed KnowledgeShovel, an
Al-in-the-Loop document annotation system for researchers to construct
scientific knowledge bases. The design of KnowledgeShovel introduces a
multi-step multi-modal human-AI collaboration pipeline that aligns with users'
existing workflows to improve data accuracy while reducing the human burden. A
follow-up user evaluation with 7 geoscience researchers shows that
KnowledgeShovel can enable efficient construction of scientific knowledge bases
with satisfactory accuracy.
- Abstract(参考訳): 包括的で正確で有用な科学的知識基盤を構築することは、科学的知識を合成し、al駆動の科学的発見を可能にするために重要である。
しかし,(1)利用可能な膨大な科学文献,(2)高度に専門化された科学領域,(3)情報(文章,図形,表)の多様さ,(4)不整合な形式と構造を持つ出版物における科学知識のサイロなどにより,現状のプロセスは困難で誤りを生じやすい。
そこで我々は,学術知識基盤を構築するためのAl-in-the-Loop文書アノテーションシステムであるKnowledgeShovelを設計・開発した。
KnowledgeShovelの設計では、ユーザの既存のワークフローと整合するマルチステップのヒューマン-AIコラボレーションパイプラインを導入し、データの正確性を向上し、人的負担を軽減する。
7つの地学研究者によるフォローアップユーザ評価は、知識ショベルが科学的知識ベースを十分な精度で効率的に構築できることを示している。
関連論文リスト
- SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models [35.98892300665275]
SciKnowEvalは5つの進歩的な科学的知識のレベルにわたって大規模言語モデル(LLM)を評価するフレームワークである。
ゼロショットと少数ショットのプロンプト戦略を用いて、20のオープンソースおよびプロプライエタリなLCMをベンチマークする。
その結果、最先端性能を達成しているにもかかわらず、プロプライエタリなLLMには改善の余地があることが判明した。
論文 参考訳(メタデータ) (2024-06-13T13:27:52Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - CLAIMED -- the open source framework for building coarse-grained
operators for accelerated discovery in science [0.0]
CLAIMEDは、科学者が科学演算子を再コンパイルすることによって以前の研究から引き出すのを支援することで、再利用可能な演算子とスケーラブルな科学的不可知性を構築するためのフレームワークである。
CLAIMEDはプログラミング言語、科学ライブラリ、実行環境である。
論文 参考訳(メタデータ) (2023-07-12T11:54:39Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Retrieval of Scientific and Technological Resources for Experts and
Scholars [20.89926457148302]
専門家や学者の科学的・技術的資源は主に基本的な属性と科学的研究の成果から成り立っている。
情報非対称性やその他の理由により、専門家や学者の科学的・技術的資源は、タイムリーな方法で社会と結びつくことはできない。
本稿では,テキスト関係抽出,テキスト知識表現学習,テキストベクトル検索,可視化システムという4つの側面から,本分野における関連する研究成果を整理する。
論文 参考訳(メタデータ) (2022-04-13T02:32:09Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Integration of knowledge and data in machine learning [0.456877715768796]
知識の埋め込みを通じて、知識とデータの障壁を破り、物理的な常識を持つ機械学習モデルを形成することができる。
知識発見は機械学習を利用して観察から新しい知識を抽出する。
本研究は,既存の文献を要約・分析するだけでなく,研究のギャップと今後の可能性も提案する。
論文 参考訳(メタデータ) (2022-02-15T10:35:53Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - A user-centered approach to designing an experimental laboratory data
platform [0.0]
実験的なデータプラットフォームにおいて、設計と機能の本質的な要素が何を求めているのかを理解するために、ユーザ中心のアプローチを採用しています。
リッチで複雑な実験データセットをコンテキスト化できる能力を持つことが、ユーザの主な要件であることに気付きました。
論文 参考訳(メタデータ) (2020-07-28T19:26:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。