論文の概要: Span Classification with Structured Information for Disfluency Detection
in Spoken Utterances
- arxiv url: http://arxiv.org/abs/2203.16028v1
- Date: Wed, 30 Mar 2022 03:22:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 16:32:19.656121
- Title: Span Classification with Structured Information for Disfluency Detection
in Spoken Utterances
- Title(参考訳): 音声の拡散検出のための構造化情報を用いたスパン分類
- Authors: Sreyan Ghosh, Sonal Kumar, Yaman Kumar Singla, Rajiv Ratn Shah, S.
Umesh
- Abstract要約: 本稿では,音声音声からテキスト中の不一致を検出する新しいアーキテクチャを提案する。
提案手法は, 広範に使われているイングリッシュスイッチボードを用いて, ディフルエンシ検出の最先端化を実現する。
- 参考スコア(独自算出の注目度): 47.05113261111054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches in disfluency detection focus on solving a token-level
classification task for identifying and removing disfluencies in text.
Moreover, most works focus on leveraging only contextual information captured
by the linear sequences in text, thus ignoring the structured information in
text which is efficiently captured by dependency trees. In this paper, building
on the span classification paradigm of entity recognition, we propose a novel
architecture for detecting disfluencies in transcripts from spoken utterances,
incorporating both contextual information through transformers and
long-distance structured information captured by dependency trees, through
graph convolutional networks (GCNs). Experimental results show that our
proposed model achieves state-of-the-art results on the widely used English
Switchboard for disfluency detection and outperforms prior-art by a significant
margin. We make all our codes publicly available on GitHub
(https://github.com/Sreyan88/Disfluency-Detection-with-Span-Classification)
- Abstract(参考訳): 既存のディフルエンシー検出のアプローチでは、テキストのディフルエンシーを識別および削除するためのトークンレベルの分類タスクの解決に重点を置いている。
さらに、ほとんどの作品は、テキストの線形シーケンスでキャプチャされたコンテキスト情報のみを活用することに重点を置いているため、依存木によって効率的にキャプチャされるテキストの構造化情報を無視している。
本稿では,エンティティ認識のスパン分類パラダイムを基盤として,言語発話からの転写の不一致を検出する新しいアーキテクチャを提案し,依存木が取得したコンバータと長距離構造化情報の両方をグラフ畳み込みネットワーク(GCN)を介して組み込んだ。
実験の結果,提案手法は,不流動性検出に広く用いられている英語スイッチボードにおいて最先端の成果を達成し,先行技術を大きく上回った。
コードはすべてGitHubで公開しています(https://github.com/Sreyan88/Disfluency-Detection-with-Span-Classification)。
関連論文リスト
- LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model [20.007650672107566]
ビデオテキストスポッティング(VTS)は、ビデオ内のテキストインスタンスを同時にローカライズ、認識、追跡することを目的としている。
最近の方法では、最先端の画像テキストスポッターのゼロショット結果を直接追跡する。
特定のデータセット上の微調整トランスフォーマーベースのテキストスポッターにより、パフォーマンスが向上する可能性がある。
論文 参考訳(メタデータ) (2024-05-29T15:35:09Z) - Incremental Image Labeling via Iterative Refinement [4.7590051176368915]
特に、意味ギャップ問題の存在は、画像から抽出した情報とその言語的記述との間に、多対多のマッピングをもたらす。
この避けられないバイアスにより、現在のコンピュータビジョンタスクのパフォーマンスはさらに低下する。
我々は、ラベリングプロセスを駆動するガイドラインを提供するために、知識表現(KR)ベースの方法論を導入する。
論文 参考訳(メタデータ) (2023-04-18T13:37:22Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - Cross-lingual Text Classification with Heterogeneous Graph Neural
Network [2.6936806968297913]
言語間テキスト分類は、ソース言語上の分類器を訓練し、その知識を対象言語に伝達することを目的としている。
近年の多言語事前学習言語モデル (mPLM) は言語間分類タスクにおいて顕著な結果をもたらす。
言語間テキスト分類のための言語内および言語間における異種情報を統合するための,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-05-24T12:45:42Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Investigating Typed Syntactic Dependencies for Targeted Sentiment
Classification Using Graph Attention Neural Network [10.489983726592303]
型付き構文依存情報を統合する新しい関係グラフアテンションネットワークについて検討する。
その結果,本手法は目標感情分類性能を改善するためにラベル情報を効果的に活用できることが示唆された。
論文 参考訳(メタデータ) (2020-02-22T11:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。