論文の概要: Deep segmental phonetic posterior-grams based discovery of
non-categories in L2 English speech
- arxiv url: http://arxiv.org/abs/2002.00205v1
- Date: Sat, 1 Feb 2020 13:21:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 01:14:12.948398
- Title: Deep segmental phonetic posterior-grams based discovery of
non-categories in L2 English speech
- Title(参考訳): l2英語音声における非カテゴリー発見に基づく深部音韻後部グラム
- Authors: Xu Li, Xixin Wu, Xunying Liu, Helen Meng
- Abstract要約: 第二言語(L2)音声は、しばしばネイティブ、電話のカテゴリーでラベル付けされる。
多くの場合、L2セグメントが持つカテゴリ電話を決定することは困難である。
- 参考スコア(独自算出の注目度): 65.04834943405673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Second language (L2) speech is often labeled with the native, phone
categories. However, in many cases, it is difficult to decide on a categorical
phone that an L2 segment belongs to. These segments are regarded as
non-categories. Most existing approaches for Mispronunciation Detection and
Diagnosis (MDD) are only concerned with categorical errors, i.e. a phone
category is inserted, deleted or substituted by another. However,
non-categorical errors are not considered. To model these non-categorical
errors, this work aims at exploring non-categorical patterns to extend the
categorical phone set. We apply a phonetic segment classifier to generate
segmental phonetic posterior-grams (SPPGs) to represent phone segment-level
information. And then we explore the non-categories by looking for the SPPGs
with more than one peak. Compared with the baseline system, this approach
explores more non-categorical patterns, and also perceptual experimental
results show that the explored non-categories are more accurate with increased
confusion degree by 7.3% and 7.5% under two different measures. Finally, we
preliminarily analyze the reason behind those non-categories.
- Abstract(参考訳): 第二言語(L2)音声は、しばしばネイティブ、電話のカテゴリーでラベル付けされる。
しかし、多くの場合、L2セグメントが属するカテゴリ電話を決定することは困難である。
これらのセグメントは非カテゴリと見なされる。
Mispronunciation Detection and Diagnosis (MDD) の既存のアプローチは、電話カテゴリが挿入、削除、置換されるという分類上の誤りにのみ関係している。
しかし、非分類的な誤りは考慮されない。
これらの非分類的誤りをモデル化するために、この研究は、分類的電話セットを拡張する非分類的パターンを探究することを目的としている。
音声のセグメントレベル情報を表現するために,音声セグメント分類器をsppg(segmental phonetic posterior-gram)として適用する。
そして、複数のピークを持つSPPGを探すことによって、非カテゴリを探索する。
ベースラインシステムと比較して,本手法はより非分類パターンを探索し,また知覚的実験結果から,2つの異なる測定方法により,探索された非分類が7.3%,7.5%の混乱度でより正確であることが示された。
最後に、これらの非カテゴリの背後にある理由を予め分析する。
関連論文リスト
- Category-Extensible Out-of-Distribution Detection via Hierarchical Context Descriptions [35.20091752343433]
この研究は2つの階層的文脈、すなわち知覚的文脈と刺激的文脈を導入し、正確な圏境界を注意深く記述する。
2つの文脈は、あるカテゴリの正確な記述を階層的に構成するが、これはまず、予測されたカテゴリにサンプルを大まかに分類する。
CATegory-Extensible OOD Detection (CATEX)
論文 参考訳(メタデータ) (2024-07-23T12:53:38Z) - Unsupervised Universal Image Segmentation [59.0383635597103]
本稿では,Unsupervised Universal Model (U2Seg) を提案する。
U2Segは、自己教師付きモデルを利用して、これらのセグメンテーションタスクの擬似意味ラベルを生成する。
次に、これらの擬似意味ラベル上でモデルを自己学習し、かなりの性能向上をもたらす。
論文 参考訳(メタデータ) (2023-12-28T18:59:04Z) - Generalized Category Discovery with Decoupled Prototypical Network [27.1635162759448]
Decoupled Prototypeal Network (DPN) と呼ばれる新しいモデルを提案する。
カテゴリプロトタイプの2部マッチング問題を定式化することにより、DPNは異なるトレーニング目標を効果的に達成することができる。
DPNは、SPL(Semantic-aware Prototypeal Learning)によって、既知のカテゴリと新しいカテゴリの両方のより差別的な特徴を学習することができる。
論文 参考訳(メタデータ) (2022-11-28T08:05:45Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z) - Classifying with Uncertain Data Envelopment Analysis [0.0]
本稿では,不完全データの現実を前提とした新しい分類手法を提案する。
本モデルでは、不確実なデータ包絡分析を用いて、公平な効率に対する分類の近接性を定義する。
本研究は, ダウ・ジョーンズ工業平均の30株をパフォーマンスレベルに分類し, 前立腺治療を臨床効果カテゴリーに分類することで結論付けた。
論文 参考訳(メタデータ) (2022-09-02T13:41:19Z) - SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。
未発見のオブジェクトを扱うには不備だ。
このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文 参考訳(メタデータ) (2021-04-30T07:58:19Z) - DeepCAT: Deep Category Representation for Query Understanding in
E-commerce Search [15.041444067591007]
本稿では,問合せ理解のプロセスを強化するために,共同語分類表現を学習する深層学習モデルDeepCATを提案する。
その結果,emマイノリティクラスではdeepcatが10%改善され,最先端ラベル埋め込みモデルではemtailクエリが7.1%向上した。
論文 参考訳(メタデータ) (2021-04-23T18:04:44Z) - DropLoss for Long-Tail Instance Segmentation [56.162929199998075]
珍しいカテゴリーと頻繁なカテゴリーのアンバランスを補う新しい適応損失であるDropLossを開発しています。
LVISデータセットでは,レア,一般的,頻繁なカテゴリにまたがる最先端のmAPを示す。
論文 参考訳(メタデータ) (2021-04-13T17:59:22Z) - Adaptive Class Suppression Loss for Long-Tail Object Detection [49.7273558444966]
アダプティブクラス抑圧損失(ACSL:Adaptive Class Suppression Loss)を考案し,尾部カテゴリの検出性能を改善する。
当社のACSLはResNet50-FPNで5.18%と5.2%の改善を実現し,新たな最先端技術を実現した。
論文 参考訳(メタデータ) (2021-04-02T05:12:31Z) - Generating CCG Categories [20.154553201329712]
分類するよりもカテゴリを生成することを提案する。
このカテゴリに関する詳細なビューにより、異なるカテゴリのアノテーションを共有でき、文コンテキストとのインタラクションが強化できることを示した。
提案されたカテゴリジェネレータは、標準的なCCGBankで最先端のタグ付け(95.5%の精度)と解析(89.8%のラベル付きF1)を行うことができる。
論文 参考訳(メタデータ) (2021-03-15T05:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。