論文の概要: Speaker-change Aware CRF for Dialogue Act Classification
- arxiv url: http://arxiv.org/abs/2004.02913v2
- Date: Sun, 31 May 2020 01:58:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:35:46.863803
- Title: Speaker-change Aware CRF for Dialogue Act Classification
- Title(参考訳): 対話行為分類のための話者認識CRF
- Authors: Guokan Shang (1 and 2), Antoine Jean-Pierre Tixier (1), Michalis
Vazirgiannis (1 and 3), Jean-Pierre Lorr\'e (2) ((1) \'Ecole Polytechnique,
(2) Linagora, (3) AUEB)
- Abstract要約: ダイアログ法(DA)の分類における最近の研究は、シーケンスラベリング問題としてタスクにアプローチしている。
本稿では,話者変化を考慮したCRF層の簡易な修正を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work in Dialogue Act (DA) classification approaches the task as a
sequence labeling problem, using neural network models coupled with a
Conditional Random Field (CRF) as the last layer. CRF models the conditional
probability of the target DA label sequence given the input utterance sequence.
However, the task involves another important input sequence, that of speakers,
which is ignored by previous work. To address this limitation, this paper
proposes a simple modification of the CRF layer that takes speaker-change into
account. Experiments on the SwDA corpus show that our modified CRF layer
outperforms the original one, with very wide margins for some DA labels.
Further, visualizations demonstrate that our CRF layer can learn meaningful,
sophisticated transition patterns between DA label pairs conditioned on
speaker-change in an end-to-end way. Code is publicly available.
- Abstract(参考訳): ダイアログ法(DA)分類における最近の研究は、条件付きランダムフィールド(CRF)と結合したニューラルネットワークモデルを用いて、シーケンスラベリング問題としてタスクにアプローチしている。
CRFは、入力発話シーケンスが与えられたターゲットDAラベルシーケンスの条件確率をモデル化する。
しかし、このタスクには別の重要な入力シーケンス、すなわち以前の作業では無視される話者のシーケンスが含まれる。
この制限に対処するため,本論文では,話者変化を考慮したCRF層の簡易な修正を提案する。
SwDAコーパスの実験では、修正されたCRF層が元のものよりも優れており、一部のDAラベルには非常に広いマージンがある。
さらに,crf層は,話者変化を条件としたdaラベルペア間の有意義で洗練された遷移パターンをエンドツーエンドで学習できることを示す。
コードは公開されている。
関連論文リスト
- BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR [54.23941663326509]
話者の頻繁な変化は、話者の変化を予測するのを難しくする。
境界対応型直列出力訓練(BA-SOT)を提案する。
オリジナルのSOTと比較して、BA-SOTはCER/UD-CERを5.1%/14.0%削減している。
論文 参考訳(メタデータ) (2023-05-23T06:08:13Z) - Neural Diarization with Non-autoregressive Intermediate Attractors [37.49735004139322]
本稿では,フレーム間のラベル依存を導入した新しいEENDモデルを提案する。
2話者CALLHOMEデータセットを用いた実験により,提案した非自己回帰型中間誘引器を用いた中間ラベルによりダイアリゼーション性能が向上した。
論文 参考訳(メタデータ) (2023-03-13T01:28:55Z) - Latent Class-Conditional Noise Model [54.56899309997246]
本稿では,ベイズ的枠組みの下での雑音遷移をパラメータ化するためのLatent Class-Conditional Noise Model (LCCN)を提案する。
次に、Gibs sampler を用いて遅延真のラベルを効率的に推測できる LCCN の動的ラベル回帰法を導出する。
提案手法は,サンプルのミニバッチから事前の任意チューニングを回避するため,ノイズ遷移の安定な更新を保護している。
論文 参考訳(メタデータ) (2023-02-19T15:24:37Z) - Joint Span Segmentation and Rhetorical Role Labeling with Data
Augmentation for Legal Documents [1.4072904523937537]
法的判断の修辞的役割ラベル付けは、検索や隣接タスクにおいて重要な役割を果たす。
我々は、同じ修辞的役割ラベルを共有する複数の連続した文のスパンを識別する作業として、スパンレベルでのタスクを再構築する。
我々は半マルコフ条件ランダム場(CRF)を用いてスパンセグメンテーションとスパンラベル割り当てを共同で学習する。
論文 参考訳(メタデータ) (2023-02-13T15:28:02Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Extended Graph Temporal Classification for Multi-Speaker End-to-End ASR [77.82653227783447]
ニューラルネットワークによるラベル遷移とラベル遷移の両方をモデル化するための GTC の拡張を提案する。
例として,多話者音声認識タスクに拡張GTC(GTC-e)を用いる。
論文 参考訳(メタデータ) (2022-03-01T05:02:02Z) - Masked Conditional Random Fields for Sequence Labeling [2.982218441172364]
条件付きランダムフィールド(CRF)ベースのニューラルモデルは、シーケンスラベリング問題を解決する最も高性能な方法の一つである。
我々は,学習段階と復号段階の両方において,候補経路の制約を課すCRFの簡易な実装法であるMasked Conditional Random Field (MCRF)を提案する。
本稿では,提案手法がこの問題を徹底的に解決し,既存のCRFモデルに対してほぼゼロのコストで一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-03-19T08:23:24Z) - Integrating end-to-end neural and clustering-based diarization: Getting
the best of both worlds [71.36164750147827]
クラスタリングに基づくアプローチでは、xベクトルのような話者埋め込みをクラスタリングすることで、話者ラベルを音声領域に割り当てる。
EEND(End-to-end Neural Diarization)は、ニューラルネットワークを使用してダイアリゼーションラベルを直接予測する。
重なり合う音声と、任意の数の話者を含む長い録音のために、単純だが効果的なハイブリッドダイアリゼーションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-26T06:33:02Z) - Constrained Decoding for Computationally Efficient Named Entity
Recognition Taggers [15.279850826041066]
現在の研究は、スパン符号化方式がどのように機能するかについての事前知識を導き、遷移が違法であり、グローバルコヒーレンスを促進することができない条件付きランダムフィールド(CRF)学習に依存している。
不正な遷移を抑制するために出力を制限することにより、統計的に重要でないF1の違いでCRFの2倍の速度で、クロスエントロピー損失のタガーを訓練できることがわかった。
論文 参考訳(メタデータ) (2020-10-09T04:07:52Z) - Cross-Thought for Sentence Encoder Pre-training [89.32270059777025]
Cross-Thoughtは、事前トレーニングシーケンスエンコーダに対する新しいアプローチである。
我々は、Transformerベースのシーケンスエンコーダを、多数の短いシーケンスに対してトレーニングする。
質問応答とテキストのエンコーダタスクの実験は、事前学習したエンコーダが最先端のエンコーダより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-07T21:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。