論文の概要: HINT3: Raising the bar for Intent Detection in the Wild
- arxiv url: http://arxiv.org/abs/2009.13833v2
- Date: Sat, 10 Oct 2020 07:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 06:10:13.020608
- Title: HINT3: Raising the bar for Intent Detection in the Wild
- Title(参考訳): hint3: インテント検出のためのバーを野生で立ち上げる
- Authors: Gaurav Arora, Chirag Jain, Manas Chaturvedi, Krupal Modi
- Abstract要約: さまざまなドメインのライブチャットボットから生成された3つの新しいデータセットを紹介します。
クラウドソースされている既存のデータセットとは異なり、私たちのデータセットにはチャットボットが受信した実際のユーザクエリが含まれています。
性能分類器がテストセット上で不適切なレベルに飽和するのは、すべてのシステムがトレーニングデータにおいて意図しないパターンにラッチオンするためである。
- 参考スコア(独自算出の注目度): 0.9634859579172252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intent Detection systems in the real world are exposed to complexities of
imbalanced datasets containing varying perception of intent, unintended
correlations and domain-specific aberrations. To facilitate benchmarking which
can reflect near real-world scenarios, we introduce 3 new datasets created from
live chatbots in diverse domains. Unlike most existing datasets that are
crowdsourced, our datasets contain real user queries received by the chatbots
and facilitates penalising unwanted correlations grasped during the training
process. We evaluate 4 NLU platforms and a BERT based classifier and find that
performance saturates at inadequate levels on test sets because all systems
latch on to unintended patterns in training data.
- Abstract(参考訳): 実世界のインテント検出システムは、意図の知覚、意図しない相関、ドメイン固有の収差を含む不均衡データセットの複雑さにさらされる。
現実世界に近いシナリオを反映できるベンチマークを容易にするため、さまざまなドメインのライブチャットボットから生成された3つの新しいデータセットを紹介します。
クラウドソーシングされた既存のデータセットと異なり、当社のデータセットにはチャットボットが受信した実際のユーザクエリが含まれており、トレーニングプロセス中に把握された望ましくない相関関係のペナライズが容易です。
我々は,4つのNLUプラットフォームとBERTベースの分類器を評価し,全てのシステムが学習データにおいて意図しないパターンに干渉するため,テストセットにおける性能が不適切なレベルに飽和していることを見出した。
関連論文リスト
- How Hard is this Test Set? NLI Characterization by Exploiting Training Dynamics [49.9329723199239]
本稿では, 実例と非実例を手作業で構築することなく, 挑戦的なテストセットを自動生成する手法を提案する。
一般的なNLIデータセットのテストセットを,トレーニングダイナミクスを利用した3つの難易度に分類する。
我々の評価法がトレーニングセットに適用された場合、トレーニング対象データのごく一部でトレーニングされたモデルは、フルデータセットでトレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-10-04T13:39:21Z) - Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection [64.08296187555095]
Uni$2$Detは3D検出のための統一的で普遍的なマルチデータセットトレーニングのためのフレームワークである。
マルチデータセット3D検出のためのマルチステージプロンプトモジュールを提案する。
ゼロショットクロスデータセット転送の結果は,提案手法の一般化能力を検証する。
論文 参考訳(メタデータ) (2024-09-30T17:57:50Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - LORD: Leveraging Open-Set Recognition with Unknown Data [10.200937444995944]
LORDは未知のデータを活用することでオープンセット認識を活用するためのフレームワークである。
我々は、背景データを利用した3つのモデルに依存しない訓練戦略を特定し、それらを確立された分類器に適用する。
論文 参考訳(メタデータ) (2023-08-24T06:12:41Z) - Perception Datasets for Anomaly Detection in Autonomous Driving: A
Survey [4.731404257629232]
異常検出手法の評価のために複数の知覚データセットが作成されている。
このサーベイは構造化され、私たちの知る限り、自律運転における異常検出のための知覚データセットの完全な概要と比較を提供する。
論文 参考訳(メタデータ) (2023-02-06T14:07:13Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。