論文の概要: Intent Classification on Low-Resource Languages with Query Similarity Search
- arxiv url: http://arxiv.org/abs/2505.18241v1
- Date: Fri, 23 May 2025 15:11:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.258254
- Title: Intent Classification on Low-Resource Languages with Query Similarity Search
- Title(参考訳): 問合せ類似度探索を用いた低リソース言語におけるインテント分類
- Authors: Arjun Bhalla, Qi Huang,
- Abstract要約: 本稿では,クエリ類似性探索問題としてキャスティング意図分類を提案する。
我々は、インテントを定義するために、また、最も類似したクエリのラベルに基づいて、入ってくるクエリを分類するクエリ類似性メソッドとして、以前の例クエリを使用します。
ゼロショット設定で低リソース言語でのクエリに対する合理的な意図分類性能を実現することができる。
- 参考スコア(独自算出の注目度): 0.49394382134960696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intent classification is an important component of a functional Information Retrieval ecosystem. Many current approaches to intent classification, typically framed as a classification problem, can be problematic as intents are often hard to define and thus data can be difficult and expensive to annotate. The problem is exacerbated when we need to extend the intent classification system to support multiple and in particular low-resource languages. To address this, we propose casting intent classification as a query similarity search problem - we use previous example queries to define an intent, and a query similarity method to classify an incoming query based on the labels of its most similar queries in latent space. With the proposed approach, we are able to achieve reasonable intent classification performance for queries in low-resource languages in a zero-shot setting.
- Abstract(参考訳): インテント分類は機能的情報検索エコシステムの重要な構成要素である。
意図分類への現在の多くのアプローチ(典型的には分類問題)は、意図を定義するのが難しく、データに注釈をつけるのが難しくて費用がかかるため、問題となることがある。
この問題は、複数の低リソース言語、特に低リソース言語をサポートするために意図分類システムを拡張する必要がある場合、さらに悪化する。
そこで本稿では,クエリ類似性検索問題としてキャストインテント分類を提案する - インテントを定義するために,以前の例クエリと,遅延空間における最も類似したクエリのラベルに基づいて,入ってくるクエリを分類するクエリ類似性手法を用いる。
提案手法により、ゼロショット設定で低リソース言語におけるクエリに対する合理的な分類性能を実現することができる。
関連論文リスト
- Dynamic Label Name Refinement for Few-Shot Dialogue Intent Classification [10.850826520563967]
そこで本研究では,文脈内学習による対話意図分類のための新しい手法を提案する。
本手法は,テスト入力に関する関連事例をトレーニングセットから検索する。
我々は,意味的理解に基づくインテントラベルを動的に洗練するために,大規模言語モデルを活用する。
論文 参考訳(メタデータ) (2024-12-20T06:53:57Z) - QUIDS: Query Intent Generation via Dual Space Modeling [12.572815037915348]
本稿では,検索意図の理解を説明するために,返却文書における意味的関連性および無関係情報を利用する二重空間モデルを提案する。
提案手法は高品質な問合せインテント記述を生成し,既存の手法と最先端の問合せベース要約手法を比較検討する。
論文 参考訳(メタデータ) (2024-10-16T09:28:58Z) - Mitigating Word Bias in Zero-shot Prompt-based Classifiers [55.60306377044225]
一致したクラス先行は、オラクルの上界性能と強く相関していることを示す。
また,NLPタスクに対するプロンプト設定において,一貫したパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2023-09-10T10:57:41Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - Few-shot Intent Classification and Slot Filling with Retrieved Examples [30.45269507626138]
そこで我々は,新しいバッチソフトマックスの手法を用いて,同じラベルを持つスパンの類似した文脈表現を学習するスパンレベル検索手法を提案する。
提案手法は,CLINCおよびSNIPSベンチマークにおいて,様々な数ショット設定で過去のシステムより優れていた。
論文 参考訳(メタデータ) (2021-04-12T18:50:34Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z) - Coupled intrinsic and extrinsic human language resource-based query
expansion [0.0]
本稿では,クエリ構成エンコーディングや拡張概念抽出,概念重み付けといった言語特性を活かしたクエリ拡張フレームワークを提案する。
実世界のデータセットに対する徹底的な経験的評価は、ユニグラム言語モデル、関連モデル、逐次依存に基づく手法に対する我々のアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-23T11:22:38Z) - Don't Judge an Object by Its Context: Learning to Overcome Contextual
Bias [113.44471186752018]
既存のモデルは、認識精度を向上させるために、オブジェクトとそのコンテキスト間の共起を利用することが多い。
この研究は、学習した特徴表現の堅牢性を改善するために、そのような文脈バイアスに対処することに焦点を当てている。
論文 参考訳(メタデータ) (2020-01-09T18:31:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。