論文の概要: From Keywords to Structured Summaries: Streamlining Scholarly Information Access
- arxiv url: http://arxiv.org/abs/2402.14622v2
- Date: Wed, 23 Oct 2024 10:06:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-24 13:53:40.044352
- Title: From Keywords to Structured Summaries: Streamlining Scholarly Information Access
- Title(参考訳): キーワードから構造化要約へ:Scholarly Information Accessの合理化
- Authors: Mahsa Shamsabadi, Jennifer D'Souza,
- Abstract要約: 本稿では,科学コミュニティにおける情報検索(IR)エンジンの重要性の高まりについて述べる。
出版物の量が増えているため、従来のキーワードベースの検索エンジンの非効率性に対処する。
提案するソリューションには、構造化されたレコード、視覚化ダッシュボードを含む高度な情報技術(IT)ツールの基盤となるものが含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper highlights the growing importance of information retrieval (IR) engines in the scientific community, addressing the inefficiency of traditional keyword-based search engines due to the rising volume of publications. The proposed solution involves structured records, underpinning advanced information technology (IT) tools, including visualization dashboards, to revolutionize how researchers access and filter articles, replacing the traditional text-heavy approach. This vision is exemplified through a proof of concept centered on the "reproductive number estimate of infectious diseases" research theme, using a fine-tuned large language model (LLM) to automate the creation of structured records to populate a backend database that now goes beyond keywords. The result is a next-generation information access system as an IR method accessible at https://orkg.org/usecases/r0-estimates.
- Abstract(参考訳): 本稿では,学術界における情報検索(IR)エンジンの重要性の高まりに注目し,出版物の増加による従来のキーワードベース検索エンジンの非効率性に対処する。
提案されたソリューションは構造化されたレコードと、視覚化ダッシュボードを含む高度な情報技術(IT)ツールを基盤として、研究者が記事にアクセスしてフィルタリングする方法に革命をもたらし、従来のテキスト重み付けのアプローチに取って代わる。
このビジョンは、"感染症の生殖数推定"研究テーマを中心とした概念実証を通じて実証され、構造化されたレコードの作成を自動化するための微調整された大規模言語モデル(LLM)を用いて、今やキーワードを超えたバックエンドデータベースを起動する。
その結果、次世代の情報アクセスシステムが https://orkg.org/usecases/r0-etimates でアクセス可能になった。
関連論文リスト
- Automated Extraction and Maturity Analysis of Open Source Clinical Informatics Repositories from Scientific Literature [0.0]
本研究では、arXivにインデックスされた学術論文からGitHubリポジトリURLを体系的に抽出することにより、ギャップを埋める自動化手法を提案する。
当社のアプローチでは、関連論文に対するarXiv APIのクエリ、抽出したGitHub URLのクリーニング、GitHub APIによる包括的なリポジトリ情報の取得、スター、フォーク、オープンイシュー、コントリビュータなどの定義されたメトリクスに基づいてリポジトリの成熟度を分析しています。
論文 参考訳(メタデータ) (2024-03-20T17:06:51Z) - Navigating the Knowledge Sea: Planet-scale answer retrieval using LLMs [0.0]
情報検索は、技術と技術の継続的な改良によって特徴づけられる。
本稿では,従来の探索手法と解答の新たなパラダイムとのギャップを埋める上で,Large Language Models (LLMs) の役割に焦点を当てる。
論文 参考訳(メタデータ) (2024-02-07T23:39:40Z) - DiscoverPath: A Knowledge Refinement and Retrieval System for
Interdisciplinarity on Biomedical Research [96.10765714077208]
従来のキーワードベースの検索エンジンは、特定の用語に慣れていないユーザーを支援するのに不足している。
本稿では, バイオメディカル研究のための知識グラフに基づく紙検索エンジンを提案し, ユーザエクスペリエンスの向上を図る。
DiscoverPathと呼ばれるこのシステムは、名前付きエンティティ認識(NER)とPOSタグを使って、記事の要約から用語や関係を抽出し、KGを作成する。
論文 参考訳(メタデータ) (2023-09-04T20:52:33Z) - An approach based on Open Research Knowledge Graph for Knowledge
Acquisition from scientific papers [4.8951183832371]
Open Research Knowledge Graph (ORKG)は、研究論文から抽出されたキーインサイトを整理するコンピュータ支援ツールである。
現在、"食品情報工学"、"知識グラフマッチングへのタブラリデータ"、"クエストアンサーリング"研究問題、"Neuro-symbolic AI"ドメインの文書化に使用されている。
論文 参考訳(メタデータ) (2023-08-23T20:05:42Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Enhancing Keyphrase Extraction from Academic Articles with their
Reference Information [12.769066804715697]
文書情報を高度に要約するキーワードは、ユーザが文書を素早く入手し、理解するのに役立ちます。
参照のタイトル情報は、著者が指定したキーフレーズも含んでいる。
実験により、参照情報は自動キーフレーズ抽出の精度、リコール、F1を高めることができる。
論文 参考訳(メタデータ) (2021-11-28T11:14:16Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。