Fugu-MT 論文翻訳(概要): Syntactic Search by Example

論文の概要: Syntactic Search by Example

arxiv url: http://arxiv.org/abs/2006.03010v1
Date: Thu, 4 Jun 2020 16:59:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-25 10:01:07.036418
Title: Syntactic Search by Example
Title（参考訳）: 例による構文検索
Authors: Micah Shlain, Hillel Taub-Tabib, Shoval Sadde, Yoav Goldberg
Abstract要約: 本稿では,依存グラフ上の構文パターンを用いて,言語的に注釈付けされた大規模コーパスを検索するシステムを提案する。本稿では,下層の構文表現の詳細を知る必要のない軽量なクエリ言語を提案する。探索は,効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で行われる。
参考スコア（独自算出の注目度）: 44.69040040007045
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a system that allows a user to search a large linguistically annotated corpus using syntactic patterns over dependency graphs. In contrast to previous attempts to this effect, we introduce a light-weight query language that does not require the user to know the details of the underlying syntactic representations, and instead to query the corpus by providing an example sentence coupled with simple markup. Search is performed at an interactive speed due to an efficient linguistic graph-indexing and retrieval engine. This allows for rapid exploration, development and refinement of syntax-based queries. We demonstrate the system using queries over two corpora: the English wikipedia, and a collection of English pubmed abstracts. A demo of the wikipedia system is available at: https://allenai.github.io/spike
Abstract（参考訳）: 本稿では,ユーザが依存グラフ上の構文パターンを用いて,大きな言語的注釈付きコーパスを検索できるシステムを提案する。この効果に対する以前の試みとは対照的に、ユーザが構文表現の詳細を知る必要がなく、代わりに単純なマークアップと結合したサンプル文を提供することでコーパスをクエリする軽量なクエリ言語を導入する。効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で検索を行う。これにより、構文ベースのクエリの迅速な探索、開発、改善が可能になる。本稿では,2つのコーパス(ウィキペディア,英文パブ付き要約)を問うクエリを用いたシステムについて紹介する。 wikipediaシステムのデモは、https://allenai.github.io/spikeで見ることができる。

関連論文リスト

A Scalable Pipeline for Estimating Verb Frame Frequencies Using Large Language Models [0.0]
VFF(Verb Frame Frequencies)を推定するための自動パイプラインを提案する。 VFFは、人間と機械言語システムの両方において、強力な構文への窓を提供する。我々は、大言語モデル(LLM)を用いて、476の英動詞を含む文のコーパスを生成する。
論文参考訳（メタデータ） (2025-07-29T19:30:11Z)
SoftMatcha: A Soft and Fast Pattern Matcher for Billion-Scale Corpus Searches [5.80278230280824]
本稿では,単語埋め込みと曲面レベルのマッチングを緩和することにより,意味的かつ効率的なパターンマッチングを実現する新しいアルゴリズムを提案する。提案手法は,数十億のコーパスを1秒以内で探索できることを実証した。
論文参考訳（メタデータ） (2025-03-05T17:53:11Z)
QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval [12.543590253664492]
我々は、$textitQueryBuilder$という、インタラクティブな新しいシステムを提示します。初心者の英語を話すユーザは、少量の労力でクエリを作成できる。ユーザの情報要求に応じた言語間情報検索クエリを迅速に開発する。
論文参考訳（メタデータ） (2024-09-07T00:46:58Z)
Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。本稿では,高密度検索のための新しい検索ユニット,命題を提案する。実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文参考訳（メタデータ） (2023-12-11T18:57:35Z)
Visualizing Linguistic Diversity of Text Datasets Synthesized by Large Language Models [9.808214545408541]
LinguisticLensは,データセットの構文的多様性を理解し解析するための,新たなインタラクティブな可視化ツールである。テキストデータセットの階層的な可視化をサポートしており、ユーザーは概要を素早くスキャンし、個々の例を検査することができる。
論文参考訳（メタデータ） (2023-05-19T00:53:45Z)
Dense Sparse Retrieval: Using Sparse Language Models for Inference Efficient Dense Retrieval [37.22592489907125]
本研究では,高密度検索にスパース言語モデルを用いて推論効率を向上する方法について検討する。スパース言語モデルは、ほとんど精度を落とさず、推論速度を最大4.3倍改善した直接置換として使用することができる。
論文参考訳（メタデータ） (2023-03-31T20:21:32Z)
Semantic Parsing for Conversational Question Answering over Knowledge Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。本稿では,2つの意味解析手法を提案し,その課題を強調した。私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文参考訳（メタデータ） (2023-01-28T14:45:11Z)
Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。 on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文参考訳（メタデータ） (2022-02-22T07:40:42Z)
Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文参考訳（メタデータ） (2021-05-31T21:14:58Z)
Interactive Extractive Search over Biomedical Corpora [41.72755714431404]
本稿では,生命科学研究者が言語的に注釈付けされたテキストのコーパスを検索できるようにするシステムを提案する。本稿では,下層の言語表現の詳細を知る必要のない軽量なクエリ言語を提案する。探索は,効率的な言語グラフインデクシングと検索エンジンにより,対話的な速度で行われる。
論文参考訳（メタデータ） (2020-06-07T13:26:32Z)
A Methodology for Creating Question Answering Corpora Using Inverse Data Annotation [16.914116942666976]
本稿では,構造化データに対する質問応答のためのコーパスを効率的に構築するための新しい手法を提案する。本研究では,文脈自由文法からOTをランダムに生成する。提案手法を適用して,大規模な意味解析コーパスであるOTTA(Operation Trees and Token Assignment)を作成する。
論文参考訳（メタデータ） (2020-04-16T12:50:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。