論文の概要: HINT3: Raising the bar for Intent Detection in the Wild
- arxiv url: http://arxiv.org/abs/2009.13833v2
- Date: Sat, 10 Oct 2020 07:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 06:10:13.020608
- Title: HINT3: Raising the bar for Intent Detection in the Wild
- Title(参考訳): hint3: インテント検出のためのバーを野生で立ち上げる
- Authors: Gaurav Arora, Chirag Jain, Manas Chaturvedi, Krupal Modi
- Abstract要約: さまざまなドメインのライブチャットボットから生成された3つの新しいデータセットを紹介します。
クラウドソースされている既存のデータセットとは異なり、私たちのデータセットにはチャットボットが受信した実際のユーザクエリが含まれています。
性能分類器がテストセット上で不適切なレベルに飽和するのは、すべてのシステムがトレーニングデータにおいて意図しないパターンにラッチオンするためである。
- 参考スコア(独自算出の注目度): 0.9634859579172252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intent Detection systems in the real world are exposed to complexities of
imbalanced datasets containing varying perception of intent, unintended
correlations and domain-specific aberrations. To facilitate benchmarking which
can reflect near real-world scenarios, we introduce 3 new datasets created from
live chatbots in diverse domains. Unlike most existing datasets that are
crowdsourced, our datasets contain real user queries received by the chatbots
and facilitates penalising unwanted correlations grasped during the training
process. We evaluate 4 NLU platforms and a BERT based classifier and find that
performance saturates at inadequate levels on test sets because all systems
latch on to unintended patterns in training data.
- Abstract(参考訳): 実世界のインテント検出システムは、意図の知覚、意図しない相関、ドメイン固有の収差を含む不均衡データセットの複雑さにさらされる。
現実世界に近いシナリオを反映できるベンチマークを容易にするため、さまざまなドメインのライブチャットボットから生成された3つの新しいデータセットを紹介します。
クラウドソーシングされた既存のデータセットと異なり、当社のデータセットにはチャットボットが受信した実際のユーザクエリが含まれており、トレーニングプロセス中に把握された望ましくない相関関係のペナライズが容易です。
我々は,4つのNLUプラットフォームとBERTベースの分類器を評価し,全てのシステムが学習データにおいて意図しないパターンに干渉するため,テストセットにおける性能が不適切なレベルに飽和していることを見出した。
関連論文リスト
- Exploring higher-order neural network node interactions with total
correlation [0.7366405857677226]
そこで我々は,局所的規模で高次変動相互作用(HOI)を捉えるために,CorEx(Local correlation Explanation)と呼ばれる新しい手法を提案する。
我々はLocal CorExを用いて、合成および実世界のデータ中のHOIを探索し、データ構造に関する隠れた洞察を抽出する。
論文 参考訳(メタデータ) (2024-02-06T22:20:53Z) - LORD: Leveraging Open-Set Recognition with Unknown Data [10.200937444995944]
LORDは未知のデータを活用することでオープンセット認識を活用するためのフレームワークである。
我々は、背景データを利用した3つのモデルに依存しない訓練戦略を特定し、それらを確立された分類器に適用する。
論文 参考訳(メタデータ) (2023-08-24T06:12:41Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Perception Datasets for Anomaly Detection in Autonomous Driving: A
Survey [4.731404257629232]
異常検出手法の評価のために複数の知覚データセットが作成されている。
このサーベイは構造化され、私たちの知る限り、自律運転における異常検出のための知覚データセットの完全な概要と比較を提供する。
論文 参考訳(メタデータ) (2023-02-06T14:07:13Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。