論文の概要: From Keywords to Structured Summaries: Streamlining Scholarly Knowledge
Access
- arxiv url: http://arxiv.org/abs/2402.14622v1
- Date: Thu, 22 Feb 2024 15:10:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-23 14:42:12.325771
- Title: From Keywords to Structured Summaries: Streamlining Scholarly Knowledge
Access
- Title(参考訳): キーワードから構造化要約へ:学術知識アクセスの合理化
- Authors: Mahsa Shamsabadi and Jennifer D'Souza
- Abstract要約: 本稿では,科学コミュニティにおける情報検索(IR)エンジンの重要性の高まりについて述べる。
出版物の量が増えているため、従来のキーワードベースの検索エンジンの非効率性に対処する。
提案するソリューションには、構造化されたレコード、視覚化ダッシュボードを含む高度な情報技術(IT)ツールの基盤となるものが含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This short paper highlights the growing importance of information retrieval
(IR) engines in the scientific community, addressing the inefficiency of
traditional keyword-based search engines due to the rising volume of
publications. The proposed solution involves structured records, underpinning
advanced information technology (IT) tools, including visualization dashboards,
to revolutionize how researchers access and filter articles, replacing the
traditional text-heavy approach. This vision is exemplified through a proof of
concept centered on the ``reproductive number estimate of infectious diseases''
research theme, using a fine-tuned large language model (LLM) to automate the
creation of structured records to populate a backend database that now goes
beyond keywords. The result is a next-generation IR method accessible at
https://orkg.org/usecases/r0-estimates.
- Abstract(参考訳): 本稿では,学術界における情報検索(IR)エンジンの重要性の高まりに注目し,出版物の増加による従来のキーワードベース検索エンジンの非効率性に対処する。
提案されたソリューションは構造化されたレコードと、視覚化ダッシュボードを含む高度な情報技術(IT)ツールを基盤として、研究者が記事にアクセスしてフィルタリングする方法に革命をもたらし、従来のテキスト重みのアプローチを置き換える。
このビジョンは,「感染症の繁殖数推定」研究テーマを中心にした概念実証を通じて実証され,構造化されたレコードの自動生成と,今やキーワードを超えたバックエンドデータベースの出現に活用されている。
その結果、次世代のIRメソッドがhttps://orkg.org/usecases/r0-estimatesでアクセスできるようになった。
関連論文リスト
- Navigating the Knowledge Sea: Planet-scale answer retrieval using LLMs [0.0]
情報検索は、技術と技術の継続的な改良によって特徴づけられる。
本稿では,従来の探索手法と解答の新たなパラダイムとのギャップを埋める上で,Large Language Models (LLMs) の役割に焦点を当てる。
論文 参考訳(メタデータ) (2024-02-07T23:39:40Z) - Keyword Augmented Retrieval: Novel framework for Information Retrieval
integrated with speech interface [0.0]
言語モデルを使って幻覚なしで素早く低コストで回答を取得することは大きなハードルです。
これは知識検索自動化における言語モデルの利用を防止するためである。
商用検索やチャットボットアプリケーションでは、GPT 3.5などの商用大規模言語モデル(LLM)への完全依存は非常にコストがかかる。
論文 参考訳(メタデータ) (2023-10-06T12:44:04Z) - DiscoverPath: A Knowledge Refinement and Retrieval System for
Interdisciplinarity on Biomedical Research [96.10765714077208]
従来のキーワードベースの検索エンジンは、特定の用語に慣れていないユーザーを支援するのに不足している。
本稿では, バイオメディカル研究のための知識グラフに基づく紙検索エンジンを提案し, ユーザエクスペリエンスの向上を図る。
DiscoverPathと呼ばれるこのシステムは、名前付きエンティティ認識(NER)とPOSタグを使って、記事の要約から用語や関係を抽出し、KGを作成する。
論文 参考訳(メタデータ) (2023-09-04T20:52:33Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Enhancing Keyphrase Extraction from Academic Articles with their
Reference Information [12.769066804715697]
文書情報を高度に要約するキーワードは、ユーザが文書を素早く入手し、理解するのに役立ちます。
参照のタイトル情報は、著者が指定したキーフレーズも含んでいる。
実験により、参照情報は自動キーフレーズ抽出の精度、リコール、F1を高めることができる。
論文 参考訳(メタデータ) (2021-11-28T11:14:16Z) - A Framework for Neural Topic Modeling of Text Corpora [6.340447411058068]
テキストの特徴を抽出し,組み込むための効率的なメカニズムを実現するためのオープンソースフレームワークであるFAMEを紹介した。
本ライブラリの有効性を示すために,よく知られたNews-Groupデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-08-19T23:32:38Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - Talk to Papers: Bringing Neural Question Answering to Academic Search [8.883733362171034]
Talk to Papersは、最近のオープンドメイン質問応答(QA)技術を利用して、学術検索の現在の経験を改善する。
研究者が自然言語クエリを使って正確な答えを見つけ、大量の学術論文から洞察を抽出できるように設計されています。
論文 参考訳(メタデータ) (2020-04-04T19:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。