論文の概要: Logical Consistency is Vital: Neural-Symbolic Information Retrieval for Negative-Constraint Queries
- arxiv url: http://arxiv.org/abs/2505.22299v2
- Date: Thu, 29 May 2025 04:07:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 13:10:25.789761
- Title: Logical Consistency is Vital: Neural-Symbolic Information Retrieval for Negative-Constraint Queries
- Title(参考訳): 論理的一貫性は生命である:負制約クエリのためのニューラルシンボリック情報検索
- Authors: Ganlin Xu, Zhoujia Zhang, Wangyi Mei, Jiaqing Liang, Weijia Lu, Xiaodong Zhang, Zhifei Yang, Xiaofeng Ma, Yanghua Xiao, Deqing Yang,
- Abstract要約: 現在の密集した検索者は、類似性を埋め込むことで、コーパス内の関連文書を検索する。
本研究では,ニューラルシンボリックな情報検索手法である textbfNS-IR を提案し,ナイーブな自然言語の埋め込みを最適化する。
実験により、NS-IRは、Web検索および低リソース検索タスクにおいて、より優れたゼロショット検索性能が得られることを示した。
- 参考スコア(独自算出の注目度): 36.93438185371322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Information retrieval plays a crucial role in resource localization. Current dense retrievers retrieve the relevant documents within a corpus via embedding similarities, which compute similarities between dense vectors mainly depending on word co-occurrence between queries and documents, but overlook the real query intents. Thus, they often retrieve numerous irrelevant documents. Particularly in the scenarios of complex queries such as \emph{negative-constraint queries}, their retrieval performance could be catastrophic. To address the issue, we propose a neuro-symbolic information retrieval method, namely \textbf{NS-IR}, that leverages first-order logic (FOL) to optimize the embeddings of naive natural language by considering the \emph{logical consistency} between queries and documents. Specifically, we introduce two novel techniques, \emph{logic alignment} and \emph{connective constraint}, to rerank candidate documents, thereby enhancing retrieval relevance. Furthermore, we construct a new dataset \textbf{NegConstraint} including negative-constraint queries to evaluate our NS-IR's performance on such complex IR scenarios. Our extensive experiments demonstrate that NS-IR not only achieves superior zero-shot retrieval performance on web search and low-resource retrieval tasks, but also performs better on negative-constraint queries. Our scource code and dataset are available at https://github.com/xgl-git/NS-IR-main.
- Abstract(参考訳): 情報検索は資源のローカライゼーションにおいて重要な役割を担っている。
現在の高密度検索者は、コーパス内の関連文書を埋め込み類似性により検索し、クエリとドキュメント間の単語の共起に大きく依存する密度ベクトル間の類似性を計算するが、実際のクエリの意図を見落としている。
そのため、多くの無関係な文書を回収することが多い。
特に \emph{ negative-constraint query} のような複雑なクエリのシナリオでは、その検索性能は破滅的なものになる可能性がある。
この問題に対処するために,一階述語論理(FOL)を利用したニューロシンボリック情報検索手法を提案する。
具体的には,2つの新しい手法, \emph{logic alignment} と \emph{connective constraint} を導入し, 候補文書を再参照し, 検索関連性を高める。
さらに、この複雑なIRシナリオ上でNS-IRの性能を評価するために、負制約クエリを含む新しいデータセット「textbf{NegConstraint」を構築した。
大規模な実験により、NS-IRは、Web検索および低リソース検索タスクにおいて優れたゼロショット検索性能を得るだけでなく、負制約クエリ上でも優れた性能を発揮することが示された。
コードとデータセットはhttps://github.com/xgl-git/NS-IR-main.comで公開しています。
関連論文リスト
- ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文 参考訳(メタデータ) (2025-05-17T08:48:43Z) - Cognitive-Aligned Document Selection for Retrieval-augmented Generation [2.9060210098040855]
本稿では,クエリを動的に更新し,高品質で信頼性の高い検索文書をフィルタリングするGGatrievalを提案する。
ユーザクエリを構文コンポーネントにパースし、検索したドキュメントときめ細かいグラウンドアライメントを実行する。
提案手法では,検索した文書をフィルタリングするための新しい基準を導入し,ターゲット情報を取得するための人的戦略を密にエミュレートする。
論文 参考訳(メタデータ) (2025-02-17T13:00:15Z) - Constructing Set-Compositional and Negated Representations for First-Stage Ranking [23.123116796159717]
本稿では,クエリの否定的な部分のみをペナライズするDistangled Negationと,交点を扱うLSRの能力を向上するCombined Pseudo-Termアプローチを紹介する。
私たちのゼロショットアプローチは競争力があり、しばしば合成データに基づいて調整されたレトリバーよりも優れています。
論文 参考訳(メタデータ) (2025-01-13T20:32:38Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - Improving Query Representations for Dense Retrieval with Pseudo
Relevance Feedback [29.719150565643965]
本稿では,疑似関連性フィードバック(PRF)を用いて高密度検索のためのクエリ表現を改善する新しいクエリエンコーダであるANCE-PRFを提案する。
ANCE-PRF は BERT エンコーダを使用し、検索モデルである ANCE からクエリとトップ検索されたドキュメントを消費し、関連ラベルから直接クエリの埋め込みを生成する。
PRFエンコーダは、学習された注意機構でノイズを無視しながら、PRF文書から関連および補完的な情報を効果的にキャプチャする。
論文 参考訳(メタデータ) (2021-08-30T18:10:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。