論文の概要: Learning To Rank Resources with GNN
- arxiv url: http://arxiv.org/abs/2304.07946v1
- Date: Mon, 17 Apr 2023 02:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 16:31:46.937271
- Title: Learning To Rank Resources with GNN
- Title(参考訳): GNNでリソースのランク付けを学ぶ
- Authors: Ulugbek Ergashev, Eduard C. Dragut, Weiyi Meng
- Abstract要約: 本稿では,資源クエリと資源リソースの関係をモデル化可能なグラフニューラルネットワーク(GNN)に基づく学習からランクへのアプローチを提案する。
提案手法は,様々なパフォーマンス指標において,最先端の6.4%から42%を上回っている。
- 参考スコア(独自算出の注目度): 7.337247167823921
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As the content on the Internet continues to grow, many new dynamically
changing and heterogeneous sources of data constantly emerge. A conventional
search engine cannot crawl and index at the same pace as the expansion of the
Internet. Moreover, a large portion of the data on the Internet is not
accessible to traditional search engines. Distributed Information Retrieval
(DIR) is a viable solution to this as it integrates multiple shards (resources)
and provides a unified access to them. Resource selection is a key component of
DIR systems. There is a rich body of literature on resource selection
approaches for DIR. A key limitation of the existing approaches is that they
primarily use term-based statistical features and do not generally model
resource-query and resource-resource relationships. In this paper, we propose a
graph neural network (GNN) based approach to learning-to-rank that is capable
of modeling resource-query and resource-resource relationships. Specifically,
we utilize a pre-trained language model (PTLM) to obtain semantic information
from queries and resources. Then, we explicitly build a heterogeneous graph to
preserve structural information of query-resource relationships and employ GNN
to extract structural information. In addition, the heterogeneous graph is
enriched with resource-resource type of edges to further enhance the ranking
accuracy. Extensive experiments on benchmark datasets show that our proposed
approach is highly effective in resource selection. Our method outperforms the
state-of-the-art by 6.4% to 42% on various performance metrics.
- Abstract(参考訳): インターネット上のコンテンツが成長を続けるにつれ、多くの新しい動的変化と異種データ源が絶えず出現する。
従来の検索エンジンは、インターネットの拡大と同じペースでクロールやインデックスを行うことはできない。
さらに、インターネット上のデータの大部分は、従来の検索エンジンではアクセスできない。
分散情報検索(dir)は、複数のシャード(リソース)を統合し、それらへの統一的なアクセスを提供するため、実現可能なソリューションである。
資源選択はDIRシステムの重要な構成要素である。
DIRの資源選択手法に関する文献が豊富にある。
既存のアプローチの鍵となる制限は、主に項ベースの統計機能を使用し、一般にリソースクエリとリソースリソースの関係をモデル化しないことである。
本稿では,資源クエリと資源リソースの関係をモデル化可能なグラフニューラルネットワーク(GNN)に基づく学習とランクのアプローチを提案する。
具体的には、事前学習言語モデル(PTLM)を用いて、クエリやリソースから意味情報を取得する。
そして,クエリ-リソース関係の構造情報を保存するための異種グラフを明示的に構築し,GNNを用いて構造情報を抽出する。
さらに、ヘテロジニアスグラフにはリソースリソース型エッジが強化され、ランキング精度がさらに向上する。
ベンチマークデータセットに関する広範な実験は,提案手法が資源選択に非常に有効であることを示す。
本手法は,様々なパフォーマンス指標において,最先端の6.4%から42%を上回っている。
関連論文リスト
- ReSLLM: Large Language Models are Strong Resource Selectors for
Federated Search [35.44746116088232]
フェデレーション検索は、Retrieval-Augmented Generationパイプラインのコンテキストにおいて、ますます重要になる。
現在のSOTA資源選択手法は特徴に基づく学習手法に依存している。
ゼロショット環境でのフェデレーション検索における資源選択を促進するために,ReSLLMを提案する。
論文 参考訳(メタデータ) (2024-01-31T07:58:54Z) - Query of CC: Unearthing Large Scale Domain-Specific Knowledge from
Public Corpora [104.16648246740543]
大規模言語モデルに基づく効率的なデータ収集手法を提案する。
この方法は、大きな言語モデルを通してシード情報をブートストラップし、公開コーパスから関連データを検索する。
特定のドメインに関する知識関連のデータを収集するだけでなく、潜在的な推論手順でデータを抽出する。
論文 参考訳(メタデータ) (2024-01-26T03:38:23Z) - Towards a Gateway for Knowledge Graph Schemas Collection, Analysis, and
Embedding [10.19939896927137]
本稿は、Live Semantic Webイニシアチブ、すなわち、多くの既存の知識グラフによって収集された関係データの金鉱の活用を主目的とするゲートウェイの最初のバージョンについて述べる。
論文 参考訳(メタデータ) (2023-11-21T09:22:02Z) - Low Resource Summarization using Pre-trained Language Models [1.26404863283601]
そこで本稿では,低リソースの要約に自己注意型トランスフォーマーベースアーキテクチャモデル(mBERT,mT5)を適用する手法を提案する。
適応的な要約モデル textiturT5 は、高リソース言語英語の最先端モデルに匹敵する評価スコア(最大46.35 ROUGE-1,77 BERTScore)で、低リソース言語の文脈情報を効果的にキャプチャすることができる。
論文 参考訳(メタデータ) (2023-10-04T13:09:39Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z) - Towards Realistic Low-resource Relation Extraction: A Benchmark with
Empirical Baseline Study [51.33182775762785]
本稿では,低リソース環境下での関係抽出システムを構築するための実証的研究について述べる。
低リソース環境での性能を評価するための3つのスキームについて検討する。 (i) ラベル付きラベル付きデータを用いた異なるタイプのプロンプトベース手法、 (ii) 長期分布問題に対処する多様なバランシング手法、 (iii) ラベル付きインドメインデータを生成するためのデータ拡張技術と自己学習。
論文 参考訳(メタデータ) (2022-10-19T15:46:37Z) - A Transfer Learning Pipeline for Educational Resource Discovery with
Application in Leading Paragraph Generation [71.92338855383238]
本稿では,新しいドメインに対するWebリソース発見を自動化するパイプラインを提案する。
パイプラインは2つの類似しているが新規なターゲットドメインで評価すると、F1スコアは0.94と0.82となる。
本研究は,サーベイジェネレーションのための各種Webリソースを考察した最初の研究である。
論文 参考訳(メタデータ) (2022-01-07T03:35:40Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - HRKD: Hierarchical Relational Knowledge Distillation for Cross-domain
Language Model Compression [53.90578309960526]
大規模事前学習言語モデル(PLM)は、従来のニューラルネットワーク手法と比較して圧倒的な性能を示している。
階層的および領域的関係情報の両方を抽出する階層的関係知識蒸留法(HRKD)を提案する。
論文 参考訳(メタデータ) (2021-10-16T11:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。