論文の概要: Segment Boundary Detection via Class Entropy Measurements in
Connectionist Phoneme Recognition
- arxiv url: http://arxiv.org/abs/2401.05717v1
- Date: Thu, 11 Jan 2024 07:47:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 19:36:58.823541
- Title: Segment Boundary Detection via Class Entropy Measurements in
Connectionist Phoneme Recognition
- Title(参考訳): 接続音素認識におけるクラスエントロピー測定によるセグメント境界検出
- Authors: Giampiero Salvi
- Abstract要約: 本稿では,コネクショニスト音素認識器の出力のクラスエントロピーを用いて,音韻クラス間の時間境界を予測する可能性について検討する。
エントロピーの値は、認識ネットワークによってよくモデル化された(既知の)2つのセグメント間の遷移の近接性を高める必要がある。
エントロピーとエントロピーの分化に基づく多くの測度は、分離と組み合わせで用いられる。
- 参考スコア(独自算出の注目度): 6.5458610824731664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article investigates the possibility to use the class entropy of the
output of a connectionist phoneme recogniser to predict time boundaries between
phonetic classes. The rationale is that the value of the entropy should
increase in proximity of a transition between two segments that are well
modelled (known) by the recognition network since it is a measure of
uncertainty. The advantage of this measure is its simplicity as the posterior
probabilities of each class are available in connectionist phoneme recognition.
The entropy and a number of measures based on differentiation of the entropy
are used in isolation and in combination. The decision methods for predicting
the boundaries range from simple thresholds to neural network based procedure.
The different methods are compared with respect to their precision, measured in
terms of the ratio between the number C of predicted boundaries within 10 or 20
msec of the reference and the total number of predicted boundaries, and recall,
measured as the ratio between C and the total number of reference boundaries.
- Abstract(参考訳): 本稿では,接続音素認識器の出力のクラスエントロピーを用いて,音素クラス間の時間境界を予測する可能性について検討する。
その理論的根拠は、エントロピーの値は、認識ネットワークによってよくモデル化された(知られている)2つのセグメント間の遷移の近傍に、不確かさの尺度であるために増加することである。
この尺度の利点は、各クラスの後続確率が接続音素認識で利用できるため、その単純さである。
エントロピーの微分に基づくエントロピーといくつかの尺度は、分離および組み合わせに使用される。
境界を予測するための決定方法は、単純なしきい値からニューラルネットワークベースの手順まで様々である。
基準値の10〜20msec以内の予測境界の数cと予測境界の総数との比で測定した精度と、cと基準境界の総数との比率として測定したリコールとを比較した。
関連論文リスト
- An Information-Theoretic Approach to Generalization Theory [27.87324770020133]
学習アルゴリズムと学習データ間の依存度を定量化する情報理論境界を解析する。
一定のプライバシーパラメータを持つ場合であっても,最大リークが制限されたアルゴリズムにより一般化が保証されることを示す。
論文 参考訳(メタデータ) (2024-08-20T10:08:21Z) - Fundamental bounds for parameter estimation with few measurements [0.0]
我々は、推定器に課せられる異なる線形(Barankin-like)条件について議論し、これらの条件が有限分散の最適推定器を持つことを解析する。
負荷条件の数が測定結果の数より大きい場合、一般に有限分散の対応する推定器は存在しないことを示す。
我々は、バランキン境界が未定義の状況において有限分散と互換性のある拡張クラムエル・ラオ境界を導出する。
論文 参考訳(メタデータ) (2024-02-22T12:40:08Z) - Temporal Performance Prediction for Deep Convolutional Long Short-Term
Memory Networks [0.0]
本稿では,畳み込み型長期記憶ネットワークの予測性能を推定する時間後処理手法を提案する。
この目的のために,セグメントごとの時間セル状態に基づく入力メトリクスを作成し,予測品質を推定するための異なるモデルについて検討する。
論文 参考訳(メタデータ) (2023-11-13T17:11:35Z) - Fast Entropy-Based Methods of Word-Level Confidence Estimation for
End-To-End Automatic Speech Recognition [86.21889574126878]
本研究では,フレーム単位のエントロピー値を正規化して集約し,単位単位当たりの信頼度と単語毎の信頼度を求める方法を示す。
提案手法をLibriSpeechテストセット上で評価した結果,最大フレーム当たりの信頼度推定値の最大値から,信頼度推定値の最大値の最大値の最大値の最大値の最大値の2倍,4倍の精度を示した。
論文 参考訳(メタデータ) (2022-12-16T20:27:40Z) - Composed Image Retrieval with Text Feedback via Multi-grained
Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。
提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文 参考訳(メタデータ) (2022-11-14T14:25:40Z) - Rank-one matrix estimation with groupwise heteroskedasticity [5.202966939338455]
本研究では,異なるノイズレベル下で行列の異なるブロックが観測されるガウス観測からランク1行列を推定する問題について検討する。
行列と潜伏変数の両方を推定する際、最小平均二乗誤差の正確な公式を証明した。
我々は、近似メッセージパッシングアルゴリズムと勾配降下アルゴリズムを導出し、これらのアルゴリズムが特定の状況における情報理論的限界を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-06-22T17:48:36Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Generalized quantum measurements with matrix product states:
Entanglement phase transition and clusterization [58.720142291102135]
本研究では,多体量子格子系の時間的発展を連続的およびサイト分解的測定により研究する手法を提案する。
測定によって引き起こされる粒子クラスター化の現象は, 頻繁な中等度な測定のためではなく, 頻繁な測定のためにのみ発生する。
論文 参考訳(メタデータ) (2021-04-21T10:36:57Z) - Neural network approximation and estimation of classifiers with
classification boundary in a Barron class [0.0]
本稿では、ReLUニューラルネットワークを用いて、ある二項分類関数の近似と推定のバウンダリを証明した。
我々の推定バウンダリは、適切な大きさのネットワークを用いて経験的リスクを優先的に保証する。
論文 参考訳(メタデータ) (2020-11-18T16:00:31Z) - Neural Methods for Point-wise Dependency Estimation [129.93860669802046]
我々は,2つの結果が共起する確率を定量的に測定する点依存度(PD)の推定に焦点をあてる。
提案手法の有効性を,1)MI推定,2)自己教師付き表現学習,3)クロスモーダル検索タスクで示す。
論文 参考訳(メタデータ) (2020-06-09T23:26:15Z) - Approximate MMAP by Marginal Search [78.50747042819503]
本稿では,グラフィカルモデルにおける最小値MAPクエリの戦略を提案する。
提案した信頼度尺度は,アルゴリズムが正確であるインスタンスを適切に検出するものである。
十分に高い信頼度を得るために、アルゴリズムは正確な解を与えるか、正確な解からハミング距離が小さい近似を与える。
論文 参考訳(メタデータ) (2020-02-12T07:41:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。