論文の概要: Interpretability of the Intent Detection Problem: A New Approach
- arxiv url: http://arxiv.org/abs/2601.17156v1
- Date: Fri, 23 Jan 2026 20:27:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.311658
- Title: Interpretability of the Intent Detection Problem: A New Approach
- Title(参考訳): インテント検出問題の解釈可能性:新しいアプローチ
- Authors: Eduardo Sanchez-Karhunen, Jose F. Quesada-Moreno, Miguel A. Gutiérrez-Naranjo,
- Abstract要約: リカレントニューラルネットワークが意図検出タスクを解くための内部メカニズムは理解されていない。
動的システム理論を用いて、RNNアーキテクチャがこの問題にどのように対処するかを分析する。
我々のフレームワークは、読み出しアライメントから幾何学的分離を分離し、実世界の性能格差に対する新しいメカニスティックな説明を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intent detection, a fundamental text classification task, aims to identify and label the semantics of user queries, playing a vital role in numerous business applications. Despite the dominance of deep learning techniques in this field, the internal mechanisms enabling Recurrent Neural Networks (RNNs) to solve intent detection tasks are poorly understood. In this work, we apply dynamical systems theory to analyze how RNN architectures address this problem, using both the balanced SNIPS and the imbalanced ATIS datasets. By interpreting sentences as trajectories in the hidden state space, we first show that on the balanced SNIPS dataset, the network learns an ideal solution: the state space, constrained to a low-dimensional manifold, is partitioned into distinct clusters corresponding to each intent. The application of this framework to the imbalanced ATIS dataset then reveals how this ideal geometric solution is distorted by class imbalance, causing the clusters for low-frequency intents to degrade. Our framework decouples geometric separation from readout alignment, providing a novel, mechanistic explanation for real world performance disparities. These findings provide new insights into RNN dynamics, offering a geometric interpretation of how dataset properties directly shape a network's computational solution.
- Abstract(参考訳): Intent Detectionは、基本的なテキスト分類タスクであり、ユーザクエリのセマンティクスを特定し、ラベル付けすることを目的としており、多くのビジネスアプリケーションにおいて重要な役割を果たす。
この分野ではディープラーニング技術の優位性にもかかわらず、リカレントニューラルネットワーク(RNN)が意図検出タスクを解くための内部メカニズムは理解されていない。
本研究では, バランスの取れたSNIPSと非バランスのATISデータセットの両方を用いて, RNNアーキテクチャがこの問題にどう対処するかを解析するために, 動的システム理論を適用した。
文を隠れ状態空間の軌跡として解釈することにより、まずバランスの取れたSNIPSデータセットにおいて、ネットワークは理想的な解を学習する。
不均衡なATISデータセットへのこのフレームワークの適用により、この理想的な幾何学的解がクラス不均衡によって歪められ、低周波インテントのクラスタが劣化することを明らかにする。
我々のフレームワークは、読み出しアライメントから幾何学的分離を分離し、実世界の性能格差に対する新しいメカニスティックな説明を提供する。
これらの発見は、RNNのダイナミックスに対する新たな洞察を与え、データセットプロパティがネットワークの計算ソリューションを直接形作る方法の幾何学的解釈を提供する。
関連論文リスト
- Set-Valued Sensitivity Analysis of Deep Neural Networks [7.249038561506896]
本稿では,ディープニューラルネットワーク(DNN)のセット値マッピングに基づく感度解析フレームワークを提案する。
集合間の距離、集合の収束、集合値写像の微分、解集合全体の安定性などの集合レベルのメトリクスを開発することにより、完全連結ニューラルネットワークの解集合がリプシッツ的な性質を持つことを示す。
論文 参考訳(メタデータ) (2024-12-15T05:22:38Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Steinmetz Neural Networks for Complex-Valued Data [23.80312814400945]
本稿では,並列実数値処理と結合出力を組み合わせたDNNを用いた複素数値データ処理手法を提案する。
提案するアーキテクチャのクラスは、Steinmetz Neural Networksと呼ばれ、多視点学習を取り入れて、潜在空間におけるより解釈可能な表現を構築する。
この数値実験では,提案するネットワークがベンチマークデータセットと合成例を用いて提案する付加雑音に対する性能改善と頑健性について述べる。
論文 参考訳(メタデータ) (2024-09-16T08:26:06Z) - Interpretation of the Intent Detection Problem as Dynamics in a Low-dimensional Space [0.0]
本研究では,異なるRNNアーキテクチャがSNIPSインテント検出問題をどのように解決するかを検討する。
予測を生成するため、RNNは、出力層行列列方向に空間的に整列して、具体的な領域に向かって軌道を操縦する。
本研究は,意図検出タスクを解くネットワークの内部動作に関する新たな知見を提供する。
論文 参考訳(メタデータ) (2024-08-05T21:22:36Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - Optimal Transport Based Refinement of Physics-Informed Neural Networks [0.0]
我々は、最適輸送(OT)の概念に基づく偏微分方程式(PDE)の解法として、よく知られた物理情報ニューラルネットワーク(PINN)の改良戦略を提案する。
PINNの解法は、完全接続された病理のスペクトルバイアス、不安定な勾配、収束と精度の難しさなど、多くの問題に悩まされている。
本稿では,既存の PINN フレームワークを補完する OT-based sample を用いて,Fokker-Planck-Kolmogorov Equation (FPKE) を解くための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-05-26T02:51:20Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z) - Fusing the Old with the New: Learning Relative Camera Pose with
Geometry-Guided Uncertainty [91.0564497403256]
本稿では,ネットワークトレーニング中の2つの予測系間の確率的融合を含む新しい枠組みを提案する。
本ネットワークは,異なる対応間の強い相互作用を強制することにより学習を駆動する自己追跡グラフニューラルネットワークを特徴とする。
学習に適したモーションパーマリゼーションを提案し、難易度の高いDeMoNおよびScanNetデータセットで最新のパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-04-16T17:59:06Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。