論文の概要: Cross-language Information Retrieval
- arxiv url: http://arxiv.org/abs/2111.05988v1
- Date: Wed, 10 Nov 2021 23:37:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-13 01:24:13.908044
- Title: Cross-language Information Retrieval
- Title(参考訳): 言語間情報検索
- Authors: Petra Galu\v{s}\v{c}\'akov\'a, Douglas W. Oard, Suraj Nair
- Abstract要約: Cross-Language Information Retrieval (CLIR)は、複数の言語で情報を取得するツールである。
本章では,言語間情報検索技術の現状を概観し,いくつかのオープンな研究課題について概説する。
- 参考スコア(独自算出の注目度): 17.694720737295505
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Two key assumptions shape the usual view of ranked retrieval: (1) that the
searcher can choose words for their query that might appear in the documents
that they wish to see, and (2) that ranking retrieved documents will suffice
because the searcher will be able to recognize those which they wished to find.
When the documents to be searched are in a language not known by the searcher,
neither assumption is true. In such cases, Cross-Language Information Retrieval
(CLIR) is needed. This chapter reviews the state of the art for cross-language
information retrieval and outlines some open research questions.
- Abstract(参考訳): 2つの重要な仮定がランク付けされた検索の一般的な見方を形作っている:(1)検索者が見たい文書に現れる可能性のあるクエリの単語を選択できること、(2)検索した文書のランク付けは、検索者が検索したいものを認識できるので十分である。
検索対象の文書が、検索者が知らない言語に属する場合、どちらの仮定も真実ではない。
このような場合、CLIR(Cross-Language Information Retrieval)が必要である。
本章では,言語間情報検索技術の現状を概観し,いくつかのオープンな研究課題について概説する。
関連論文リスト
- Conversational Query Reformulation with the Guidance of Retrieved Documents [4.438698005789677]
本稿では,最初に検索した文書からキーのinfFormationを活用することでクエリを洗練するフレームワークである GuideCQRを紹介する。
GuideCQRは,人間によるクエリであっても,さまざまなタイプのクエリを用いた会話検索において,さらなるパフォーマンス向上が期待できることを示す。
論文 参考訳(メタデータ) (2024-07-17T07:39:16Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z) - Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - ExcluIR: Exclusionary Neural Information Retrieval [74.08276741093317]
本稿では,排他的検索のためのリソースセットであるExcluIRを提案する。
評価ベンチマークには3,452の高品質な排他的クエリが含まれている。
トレーニングセットには70,293の排他的クエリが含まれており、それぞれに正のドキュメントと負のドキュメントがペアリングされている。
論文 参考訳(メタデータ) (2024-04-26T09:43:40Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Unbiased Sentence Encoder For Large-Scale Multi-lingual Search Engines [0.0]
本稿では,クエリおよび文書エンコーダとして検索エンジンで使用可能な多言語文エンコーダを提案する。
この埋め込みにより、クエリとドキュメント間のセマンティックな類似性スコアが可能になり、ドキュメントのランク付けと関連性において重要な機能となる。
論文 参考訳(メタデータ) (2021-03-01T07:19:16Z) - Cross-Lingual Document Retrieval with Smooth Learning [31.638708227607214]
言語間文書検索は、クエリの言語が文書の言語と異なる情報検索タスクである。
本稿では,異なる文書言語を用いた言語間検索の性能向上を実現するための,新しいエンドツーエンドロバストフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-02T03:17:39Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - Exploratory Search with Sentence Embeddings [0.0]
本稿では,階層クラスタと文書要約に基づく探索探索システムを提案する。
文書をその埋め込み文の平均として表現し、この文書表現に近い文を含む要約を抽出し、文書表現に近いキーフレーズを抽出する。
論文 参考訳(メタデータ) (2020-07-22T04:46:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。