論文の概要: Context-Aware Search and Retrieval Over Erasure Channels
- arxiv url: http://arxiv.org/abs/2507.11894v1
- Date: Wed, 16 Jul 2025 04:21:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.221722
- Title: Context-Aware Search and Retrieval Over Erasure Channels
- Title(参考訳): 消去チャンネルにおける文脈認識検索と検索
- Authors: Sara Ghasvarianjahromi, Yauhen Yakimenka, Jörg Kliewer,
- Abstract要約: 本稿では,シンボル消去チャネル上で動作している遠隔文書検索システムの情報理論解析について述べる。
提案モデルは、言語コーパスの項周波数重みから導かれるクエリの特徴ベクトルを符号化する。
我々は、検索誤差確率、すなわち、より類似の少ない文書が選択される確率の明示的な式を導出する。
- 参考スコア(独自算出の注目度): 12.794591022795355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces and analyzes a search and retrieval model that adopts key semantic communication principles from retrieval-augmented generation. We specifically present an information-theoretic analysis of a remote document retrieval system operating over a symbol erasure channel. The proposed model encodes the feature vector of a query, derived from term-frequency weights of a language corpus by using a repetition code with an adaptive rate dependent on the contextual importance of the terms. At the decoder, we select between two documents based on the contextual closeness of the recovered query. By leveraging a jointly Gaussian approximation for both the true and reconstructed similarity scores, we derive an explicit expression for the retrieval error probability, i.e., the probability under which the less similar document is selected. Numerical simulations on synthetic and real-world data (Google NQ) confirm the validity of the analysis. They further demonstrate that assigning greater redundancy to critical features effectively reduces the error rate, highlighting the effectiveness of semantic-aware feature encoding in error-prone communication settings.
- Abstract(参考訳): 本稿では,検索拡張生成からキーセマンティックコミュニケーションの原則を取り入れた検索・検索モデルを紹介し,分析する。
具体的には,シンボル消去チャネル上で動作している遠隔文書検索システムの情報理論解析について述べる。
提案モデルは,単語の文脈的重要性に依存する適応率の反復符号を用いて,言語コーパスの項周波数重みから導出されるクエリの特徴ベクトルを符号化する。
復号器では、回復したクエリの文脈的近接度に基づいて、2つの文書を選択する。
真の類似度スコアと再構成された類似度スコアの両方にガウス近似を併用することにより、検索誤差確率の明示的な式、すなわち、より類似度の低い文書が選択される確率を導出する。
合成および実世界のデータ(Google NQ)の数値シミュレーションにより,解析の有効性が確認された。
さらに、重要な機能に冗長性を割り当てることによってエラー率を効果的に低減し、エラー発生時の通信設定における意味認識機能エンコーディングの有効性を強調した。
関連論文リスト
- Constrained Auto-Regressive Decoding Constrains Generative Retrieval [71.71161220261655]
ジェネレーティブ検索は、従来の検索インデックスデータ構造を1つの大規模ニューラルネットワークに置き換えようとしている。
本稿では,制約とビームサーチという2つの本質的な視点から,制約付き自己回帰生成の固有の制約について検討する。
論文 参考訳(メタデータ) (2025-04-14T06:54:49Z) - Unsupervised dense retrieval with conterfactual contrastive learning [16.679649921935482]
そこで本研究では,高密度検索モデルの高感度化により,高密度検索モデルのロバスト性を向上させることを提案する。
この文脈での感度を達成するモデルは、クエリとの関連性を決定するドキュメントのキーパスが修正されたときに高いばらつきを示すべきである。
因果関係と反事実分析に動機付け, 一連の反事実正則化手法を提案する。
論文 参考訳(メタデータ) (2024-12-30T07:01:34Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Efficient and Interpretable Information Retrieval for Product Question Answering with Heterogeneous Data [2.7624021966289605]
拡張強調語彙表現は語彙ミスマッチ問題を最小化することにより情報検索(IR)を改善する。
本稿では,その欠点を最小化しつつ,語彙と意味のマッチングを最大化するハイブリッド情報検索機構を提案する。
論文 参考訳(メタデータ) (2024-05-21T19:46:35Z) - Adapting Dual-encoder Vision-language Models for Paraphrased Retrieval [55.90407811819347]
モデルが類似した結果を返すことを目的とした,パラフレーズ付きテキスト画像検索の課題について考察する。
我々は、大きなテキストコーパスで事前訓練された言語モデルから始まる二重エンコーダモデルを訓練する。
CLIPやOpenCLIPのような公開デュアルエンコーダモデルと比較して、最高の適応戦略で訓練されたモデルは、パラフレーズクエリのランク付けの類似性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-05-06T06:30:17Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - RegaVAE: A Retrieval-Augmented Gaussian Mixture Variational Auto-Encoder
for Language Modeling [79.56442336234221]
可変オートエンコーダ(VAE)に基づく検索拡張言語モデルであるRegaVAEを紹介する。
テキストコーパスを潜在空間にエンコードし、ソースとターゲットの両方のテキストから現在と将来の情報をキャプチャする。
各種データセットに対する実験結果から,テキスト生成品質と幻覚除去の大幅な改善が示された。
論文 参考訳(メタデータ) (2023-10-16T16:42:01Z) - Semantic Text Compression for Classification [17.259824817932294]
本研究では,テキストに含まれる意味をソースデコーダに伝達するテキストのセマンティック圧縮について検討する。
そこで,文の埋め込みと意味的歪み量を用いて意味を保存したテキストに対する意味量化と圧縮手法を提案する。
論文 参考訳(メタデータ) (2023-09-19T17:50:57Z) - Tram: A Token-level Retrieval-augmented Mechanism for Source Code Summarization [76.57699934689468]
ニューラルモデルの性能を高めるために,デコーダ側で詳細なTokenレベル検索強化機構(Tram)を提案する。
文脈的コードセマンティクスの取得におけるトークンレベルの検索の課題を克服するために,コードセマンティクスを個々の要約トークンに統合することを提案する。
論文 参考訳(メタデータ) (2023-05-18T16:02:04Z) - Leveraging Cognitive Search Patterns to Enhance Automated Natural
Language Retrieval Performance [0.0]
ユーザの検索行動を模倣する認知的再構成パターンが強調されている。
問合せの概念表現を考慮し,これらのパターンの適用を形式化する。
遺伝的アルゴリズムに基づく重み付けプロセスでは、概念的役割タイプに応じて用語に重点を置くことができる。
論文 参考訳(メタデータ) (2020-04-21T14:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。