論文の概要: Confidence intervals for forced alignment boundaries using model ensembles
- arxiv url: http://arxiv.org/abs/2506.01256v1
- Date: Mon, 02 Jun 2025 02:12:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.010009
- Title: Confidence intervals for forced alignment boundaries using model ensembles
- Title(参考訳): モデルアンサンブルを用いた強制アライメント境界に対する信頼区間
- Authors: Matthew C. Kelley,
- Abstract要約: 強制アライメントは、音声を正書法や音声の書き起こしと整列するための一般的なツールである。
本稿では,ニューラルネットワークアンサンブル手法を用いて,これらの境界に対する信頼区間を導出する手法を提案する。
- 参考スコア(独自算出の注目度): 0.38073142980732994
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Forced alignment is a common tool to align audio with orthographic and phonetic transcriptions. Most forced alignment tools provide only a single estimate of a boundary. The present project introduces a method of deriving confidence intervals for these boundaries using a neural network ensemble technique. Ten different segment classifier neural networks were previously trained, and the alignment process is repeated with each model. The alignment ensemble is then used to place the boundary at the median of the boundaries in the ensemble, and 97.85% confidence intervals are constructed using order statistics. On the Buckeye and TIMIT corpora, the ensemble boundaries show a slight improvement over using just a single model. The confidence intervals are incorporated into Praat TextGrids using a point tier, and they are also output as a table for researchers to analyze separately as diagnostics or to incorporate uncertainty into their analyses.
- Abstract(参考訳): 強制アライメントは、音声を正書法や音声の書き起こしと整列するための一般的なツールである。
ほとんどの強制アライメントツールは境界の単一の推定しか提供しない。
本稿では,ニューラルネットワークアンサンブル手法を用いて,これらの境界に対する信頼区間を導出する手法を提案する。
10の異なるセグメント分類器ニューラルネットワークを前もってトレーニングし、各モデルでアライメントプロセスを繰り返した。
その後、アライメントアンサンブルを用いて境界線をアンサンブルの中央に配置し、97.85%の信頼区間を順序統計を用いて構築する。
BuckeyeとTIMITのコーパスでは、アンサンブルの境界はたった1つのモデルよりもわずかに改善されている。
信頼区間は点層を用いてPrat TextGridsに組み込まれ、研究者が個別に診断として分析したり、不確実性を解析に組み込むためのテーブルとして出力される。
関連論文リスト
- Improving action segmentation via explicit similarity measurement [5.303583360581161]
本稿では,セグメント化精度を高めるために,フレーム間および予測間の明らかな類似性評価を提案する。
教師付き学習アーキテクチャでは,トランスフォーマーエンコーダへの入力として,フレームレベルのマルチレゾリューション機能を利用する。
本稿では,連続フレーム間の特徴類似性に基づいた境界補正アルゴリズムを提案する。
また,非教師付き境界検出補正を提案する。
論文 参考訳(メタデータ) (2025-02-15T08:02:38Z) - Entrywise Inference for Missing Panel Data: A Simple and Instance-Optimal Approach [27.301741710016223]
停滞した採用によって引き起こされたパネルデータの欠落データバージョンに関連する推論的疑問を考察する。
我々は、予め特定されたカバレッジでエントリワイドな信頼区間を構築するためのデータ駆動方式を開発し、分析する。
我々は、欠落したエントリを推定する際に、そのエラーに非漸近的かつ高い確率境界を証明した。
論文 参考訳(メタデータ) (2024-01-24T18:58:18Z) - Learning Saliency From Fixations [0.9208007322096533]
本稿では, 画像の並列デコードを利用して, 修正マップからのみサリエンシを学習する, 画像中のサリエンシ予測のための新しいアプローチを提案する。
我々のアプローチは、Saliency TRansformer (SalTR) と呼ばれ、SaliconとMIT300ベンチマークの最先端のアプローチと同等のスコアを得る。
論文 参考訳(メタデータ) (2023-11-23T16:04:41Z) - Show Your Work with Confidence: Confidence Bands for Tuning Curves [51.12106543561089]
チューニング作業の関数としての曲線プロット検証性能。
そこで我々は,曲線のチューニングに有効な信頼帯域を構築するための最初の方法を提案する。
提案手法と比較し,提案手法の有効性を検証し,サンプルサイズの影響を解析し,モデルの比較に関するガイダンスを提供する。
論文 参考訳(メタデータ) (2023-11-16T00:50:37Z) - Semantic Self-adaptation: Enhancing Generalization with a Single Sample [45.111358665370524]
セマンティックセグメンテーションのための自己適応型アプローチを提案する。
整合正則化を用いて畳み込み層のパラメータを入力画像に微調整する。
実験により, 自己適応は訓練時のモデル正規化の確立した実践を補完する可能性が示唆された。
論文 参考訳(メタデータ) (2022-08-10T12:29:01Z) - Parameter Decoupling Strategy for Semi-supervised 3D Left Atrium
Segmentation [0.0]
本稿では,パラメータ分離戦略に基づく半教師付きセグメンテーションモデルを提案する。
提案手法は,Atrial Challengeデータセット上での最先端の半教師付き手法と競合する結果を得た。
論文 参考訳(メタデータ) (2021-09-20T14:51:42Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Unsupervised Intra-domain Adaptation for Semantic Segmentation through
Self-Supervision [73.76277367528657]
畳み込みニューラルネットワークに基づくアプローチは、セマンティックセグメンテーションにおいて顕著な進歩を遂げた。
この制限に対処するために、グラフィックエンジンから生成された注釈付きデータを使用してセグメンテーションモデルをトレーニングする。
ドメイン間およびドメイン間ギャップを最小化する2段階の自己教師付きドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T15:24:11Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。