論文の概要: Automatic generation of semantic corpora for improving intent estimation
of taxonomy-driven search engines
- arxiv url: http://arxiv.org/abs/2203.16230v1
- Date: Wed, 30 Mar 2022 12:06:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 13:21:27.826575
- Title: Automatic generation of semantic corpora for improving intent estimation
of taxonomy-driven search engines
- Title(参考訳): 分類型検索エンジンの意図推定を改善する意味コーパスの自動生成
- Authors: Lorenzo Massai
- Abstract要約: 本稿では,セマンティック拡張に基づく検索システムにおいて,どの意味関係が最も影響を与えるかを示す。
評価は、分類学駆動のドメインを問合せできる単純な自然言語処理システムを構築する。
いくつかのコーパスが、分類ラベルに対応する擬似クエリを推定するために、NLPインフラストラクチャにガゼターとして組み込まれている。
- 参考スコア(独自算出の注目度): 0.609170287691728
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the increasing demand of intelligent systems capable of operating in
different user contexts (e.g. users on the move) the correct interpretation of
the user-need by such systems has become crucial to give a consistent answer to
the user query. The most effective techniques which are used to address such
task are in the fields of natural language processing and semantic expansion of
terms. Such systems are aimed at estimating the actual meaning of input
queries, addressing the concepts of the words which are expressed within the
user questions. The aim of this paper is to demonstrate which semantic relation
impacts the most in semantic expansion-based retrieval systems and to identify
the best tradeoff between accuracy and noise introduction when combining such
relations. The evaluations are made building a simple natural language
processing system capable of querying any taxonomy-driven domain, making use of
the combination of different semantic expansions as knowledge resources. The
proposed evaluation employs a wide and varied taxonomy as a use-case,
exploiting its labels as basis for the expansions. To build the knowledge
resources several corpora have been produced and integrated as gazetteers into
the NLP infrastructure with the purpose of estimating the pseudo-queries
corresponding to the taxonomy labels, considered as the possible intents.
- Abstract(参考訳): 異なるユーザコンテキスト(例えば移動中のユーザ)で動作可能なインテリジェントシステムの需要が高まる中、このようなシステムによるユーザニーズの正しい解釈は、ユーザクエリに対して一貫した回答を与えるために重要になっている。
このような課題に対処するために最も効果的な技術は、自然言語処理と用語の意味的拡張の分野である。
このようなシステムは、ユーザの質問の中で表現される単語の概念に対処して、入力クエリの実際の意味を推定することを目的としている。
本研究の目的は, 意味的拡張に基づく検索システムにおいて, 意味的関係が最も影響を与えているかを示し, それらの関係を組み合わせる際に, 正確性と雑音導入の最良のトレードオフを明らかにすることである。
評価は、知識資源として異なる意味展開の組み合わせを利用して、任意の分類駆動ドメインをクエリできるシンプルな自然言語処理システムを構築した。
提案手法は広く多様な分類をユースケースとして採用し,拡張の基盤としてラベルを活用した。
知識資源を構築するために、分類ラベルに対応する擬似クエリを推定するために、いくつかのコーパスが作成され、ガゼターとしてNLPインフラストラクチャに統合されている。
関連論文リスト
- Likelihood as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
言語モデルの性能の効果的な指標としての可能性を示す。
提案手法は,より優れた性能をもたらすプロンプトの選択と構築のための尺度として,疑似可能性を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - Efficient Information Extraction in Few-Shot Relation Classification through Contrastive Representation Learning [23.992247765851204]
本稿では,複数文表現とコントラスト学習を組み合わせた情報抽出手法を提案する。
本手法では,これらの表現から相補的識別情報を抽出するために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-03-25T08:36:06Z) - Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - Multiple Relations Classification using Imbalanced Predictions
Adaptation [0.0]
関係分類タスクは、対象物と対象物のペアに適切な意味関係を割り当てる。
現在の関係分類モデルは、1つの文で複数の関係を識別する追加の手順を用いる。
本稿では,これらの課題に対処する複数の関係分類モデルを提案する。
論文 参考訳(メタデータ) (2023-09-24T18:36:22Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization
for Relation Extraction [111.74812895391672]
シナジスティック最適化(KnowPrompt)を用いた知識認識型Promptチューニング手法を提案する。
関係ラベルに含まれる潜在知識をインジェクトして,学習可能な仮想型語と解答語で構築する。
論文 参考訳(メタデータ) (2021-04-15T17:57:43Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z) - Natural language technology and query expansion: issues,
state-of-the-art and perspectives [0.0]
クエリのあいまいさや誤解釈を引き起こす言語特性と、追加の要因は、ユーザの情報ニーズを正確に表現する能力に影響を与える。
汎用言語に基づく問合せ拡張フレームワークの解剖学を概説し,モジュールに基づく分解を提案する。
それぞれのモジュールについて、文献における最先端のソリューションをレビューし、使用するテクニックの光の下で分類する。
論文 参考訳(メタデータ) (2020-04-23T11:39:07Z) - Coupled intrinsic and extrinsic human language resource-based query
expansion [0.0]
本稿では,クエリ構成エンコーディングや拡張概念抽出,概念重み付けといった言語特性を活かしたクエリ拡張フレームワークを提案する。
実世界のデータセットに対する徹底的な経験的評価は、ユニグラム言語モデル、関連モデル、逐次依存に基づく手法に対する我々のアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-23T11:22:38Z) - Leveraging Cognitive Search Patterns to Enhance Automated Natural
Language Retrieval Performance [0.0]
ユーザの検索行動を模倣する認知的再構成パターンが強調されている。
問合せの概念表現を考慮し,これらのパターンの適用を形式化する。
遺伝的アルゴリズムに基づく重み付けプロセスでは、概念的役割タイプに応じて用語に重点を置くことができる。
論文 参考訳(メタデータ) (2020-04-21T14:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。