論文の概要: Towards Proactive Information Retrieval in Noisy Text with Wikipedia
Concepts
- arxiv url: http://arxiv.org/abs/2210.09877v1
- Date: Tue, 18 Oct 2022 14:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 14:15:49.395909
- Title: Towards Proactive Information Retrieval in Noisy Text with Wikipedia
Concepts
- Title(参考訳): ウィキペディア概念を用いたノイズテキストの能動的情報検索に向けて
- Authors: Tabish Ahmed and Sahan Bulathwela
- Abstract要約: 本研究は,クエリのコンテキストをウィキペディアの概念で活用することで,ノイズのあるテキスト上でのプロアクティブな情報検索を改善する方法について検討する。
ポッドキャストセグメント検索タスクに関する実験は、ウィキペディアの概念に関連性の明確なシグナルがあることを実証している。
また、クエリの背景コンテキストをWikifyingすることで、クエリの意味を曖昧にし、さらにプロアクティブな情報検索を支援することができる。
- 参考スコア(独自算出の注目度): 6.744385328015561
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting useful information from the user history to clearly understand
informational needs is a crucial feature of a proactive information retrieval
system. Regarding understanding information and relevance, Wikipedia can
provide the background knowledge that an intelligent system needs. This work
explores how exploiting the context of a query using Wikipedia concepts can
improve proactive information retrieval on noisy text. We formulate two models
that use entity linking to associate Wikipedia topics with the relevance model.
Our experiments around a podcast segment retrieval task demonstrate that there
is a clear signal of relevance in Wikipedia concepts while a ranking model can
improve precision by incorporating them. We also find Wikifying the background
context of a query can help disambiguate the meaning of the query, further
helping proactive information retrieval.
- Abstract(参考訳): ユーザ履歴から有用な情報を抽出して情報ニーズを明確に理解することは,積極的な情報検索システムの重要な特徴である。
情報と関連性の理解に関して、wikipediaは知的システムに必要な背景知識を提供することができる。
本研究は,wikipedia の概念を用いたクエリの文脈の活用によって,雑音の多いテキストに対する積極的な情報検索を改善する方法について検討する。
関連モデルとウィキペディアトピックを関連付けるためにエンティティリンクを使用する2つのモデルを定式化する。
ポッドキャストセグメント検索タスクに関する実験により,ウィキペディアの概念に関連性の明確なシグナルがあることが示され,ランキングモデルにより精度が向上することが示された。
また、クエリの背景コンテキストをWikifyingすることで、クエリの意味を曖昧にし、さらにプロアクティブな情報検索を支援することができる。
関連論文リスト
- EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.02148880719576]
知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。
ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。
The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文 参考訳(メタデータ) (2024-07-17T16:55:42Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Curious Rhythms: Temporal Regularities of Wikipedia Consumption [15.686850035802667]
日中交替のグローバルなパターンを除去した後も,個々の物品の消費習慣は日中変化が強く維持されていることを示す。
我々はウィキペディアの記事のアクセスリズムの話題的・文脈的相関を調査し、記事の話題、読者国、アクセスデバイス(モバイル対デスクトップ)が日々の注意パターンの重要な予測因子であることを示す。
論文 参考訳(メタデータ) (2023-05-16T14:48:08Z) - KERM: Knowledge Enhanced Reasoning for Vision-and-Language Navigation [61.08389704326803]
VLN(Vision-and-Language Navigation)は、実シーンにおける自然言語命令に続く遠隔地への移動を可能にするタスクである。
以前のアプローチのほとんどは、ナビゲート可能な候補を表現するために、機能全体やオブジェクト中心の機能を利用している。
本稿では,知識を活用したエージェントナビゲーション能力向上のための知識強化推論モデル(KERM)を提案する。
論文 参考訳(メタデータ) (2023-03-28T08:00:46Z) - Data-Efficient Autoregressive Document Retrieval for Fact Verification [7.935530801269922]
本稿では,自己回帰型レトリバーの学習にアノテーションを要さない遠隔スーパービジョン手法を提案する。
タスク固有の微調整, 自動回帰検索による2つのウィキペディアベースの事実検証タスクが, 完全監督に近づいたり, 超えたりできることを示す。
論文 参考訳(メタデータ) (2022-11-17T07:27:50Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A Bayesian Framework for Information-Theoretic Probing [51.98576673620385]
我々は、探索は相互情報を近似するものとみなすべきであると論じる。
これは、表現が元の文とターゲットタスクに関する全く同じ情報をエンコードしているというかなり直感的な結論を導いた。
本稿では,ベイズ的相互情報(Bayesian mutual information)と呼ぶものを測定するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-08T18:08:36Z) - Supporting search engines with knowledge and context [1.0152838128195467]
本論文の第1部では,構造化知識をユーザによりアクセスしやすいものにする方法について検討する。
本論文の第2部では,インタラクティブな知識収集を改善する方法について考察する。
本論文の最後のパートでは,ニュース分野のプロフェッショナルライターを対象とした検索エンジンサポートに注目した。
論文 参考訳(メタデータ) (2021-02-12T20:28:25Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z) - Natural language processing for word sense disambiguation and
information extraction [0.0]
Thesaurus を用いた Word Sense Disambiguation の新しいアプローチを提案する。
ファジィ論理に基づく文書検索手法について解説し,その応用例を示した。
この戦略は、明らかな推論のデンプスター・シェーファー理論に基づく新しい戦略の提示で締めくくられる。
論文 参考訳(メタデータ) (2020-04-05T17:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。