論文の概要: Interactive Extractive Search over Biomedical Corpora
- arxiv url: http://arxiv.org/abs/2006.04148v1
- Date: Sun, 7 Jun 2020 13:26:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 08:21:40.740649
- Title: Interactive Extractive Search over Biomedical Corpora
- Title(参考訳): 生物医学コーパスにおける対話的抽出探索
- Authors: Hillel Taub-Tabib, Micah Shlain, Shoval Sadde, Dan Lahav, Matan Eyal,
Yaara Cohen, Yoav Goldberg
- Abstract要約: 本稿では,生命科学研究者が言語的に注釈付けされたテキストのコーパスを検索できるようにするシステムを提案する。
本稿では,下層の言語表現の詳細を知る必要のない軽量なクエリ言語を提案する。
探索は,効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で行われる。
- 参考スコア(独自算出の注目度): 41.72755714431404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a system that allows life-science researchers to search a
linguistically annotated corpus of scientific texts using patterns over
dependency graphs, as well as using patterns over token sequences and a
powerful variant of boolean keyword queries. In contrast to previous attempts
to dependency-based search, we introduce a light-weight query language that
does not require the user to know the details of the underlying linguistic
representations, and instead to query the corpus by providing an example
sentence coupled with simple markup. Search is performed at an interactive
speed due to efficient linguistic graph-indexing and retrieval engine. This
allows for rapid exploration, development and refinement of user queries. We
demonstrate the system using example workflows over two corpora: the PubMed
corpus including 14,446,243 PubMed abstracts and the CORD-19 dataset, a
collection of over 45,000 research papers focused on COVID-19 research. The
system is publicly available at https://allenai.github.io/spike
- Abstract(参考訳): 本稿では, 生命科学研究者が, 依存グラフ上のパターンやトークン配列上のパターンを用いて, 言語的に注釈付けされた学術テキストのコーパスを検索できるシステムを提案する。
従来の係り受けベースの検索とは対照的に,ユーザが基礎となる言語表現の詳細を知る必要がなく,単純なマークアップと結合した例文を提供することでコーパスを問合せする軽量なクエリ言語を導入する。
効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で検索を行う。
これにより、ユーザクエリの迅速な探索、開発、洗練が可能になる。
14,446,243のPubMed抽象化を含むPubMedコーパスと,新型コロナウイルス研究に焦点を当てた45,000以上の研究論文集であるCORD-19データセットである。
システムはhttps://allenai.github.io/spikeで公開されている。
関連論文リスト
- ELCC: the Emergent Language Corpus Collection [1.6574413179773761]
Emergent Language Corpus Collection (ELCC)は、緊急通信システムのオープンソース実装から収集されたコーパスのコレクションである。
各コーパスには、ソースコードの特徴を記述したメタデータと、コーパスの分析スイートが添付されている。
論文 参考訳(メタデータ) (2024-07-04T21:23:18Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - DiscoverPath: A Knowledge Refinement and Retrieval System for
Interdisciplinarity on Biomedical Research [96.10765714077208]
従来のキーワードベースの検索エンジンは、特定の用語に慣れていないユーザーを支援するのに不足している。
本稿では, バイオメディカル研究のための知識グラフに基づく紙検索エンジンを提案し, ユーザエクスペリエンスの向上を図る。
DiscoverPathと呼ばれるこのシステムは、名前付きエンティティ認識(NER)とPOSタグを使って、記事の要約から用語や関係を抽出し、KGを作成する。
論文 参考訳(メタデータ) (2023-09-04T20:52:33Z) - SciLit: A Platform for Joint Scientific Literature Discovery,
Summarization and Citation Generation [11.186252009101077]
本稿では,関連論文を自動的に推薦し,ハイライトを抽出するパイプラインSciLitを提案し,論文の引用として参照文を提案する。
SciLitは、2段階の事前フェッチと再ランクの文献検索システムを使用して、数億の論文の大規模なデータベースから論文を効率的に推奨する。
論文 参考訳(メタデータ) (2023-06-06T09:34:45Z) - Dense Sparse Retrieval: Using Sparse Language Models for Inference
Efficient Dense Retrieval [37.22592489907125]
本研究では,高密度検索にスパース言語モデルを用いて推論効率を向上する方法について検討する。
スパース言語モデルは、ほとんど精度を落とさず、推論速度を最大4.3倍改善した直接置換として使用することができる。
論文 参考訳(メタデータ) (2023-03-31T20:21:32Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z) - Syntactic Search by Example [44.69040040007045]
本稿では,依存グラフ上の構文パターンを用いて,言語的に注釈付けされた大規模コーパスを検索するシステムを提案する。
本稿では,下層の構文表現の詳細を知る必要のない軽量なクエリ言語を提案する。
探索は,効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で行われる。
論文 参考訳(メタデータ) (2020-06-04T16:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。