論文の概要: Unsupervised Word Segmentation Using Temporal Gradient Pseudo-Labels
- arxiv url: http://arxiv.org/abs/2304.00993v1
- Date: Thu, 30 Mar 2023 17:59:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 15:13:09.850894
- Title: Unsupervised Word Segmentation Using Temporal Gradient Pseudo-Labels
- Title(参考訳): 時間勾配擬似ラベルを用いた教師なし単語セグメンテーション
- Authors: Tzeviya Sylvia Fuchs and Yedid Hoshen
- Abstract要約: 近年の深層自己監督機能は単語セグメンテーションに非常に有効であるが,分類ヘッドの訓練には指導が必要であることが示唆された。
教師なし単語セグメンテーションにその効果を拡大するため,擬似ラベル方式を提案する。
その単純さと高速な実行時間にもかかわらず、我々の手法は2つのデータセット上で以前の方法よりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 35.458787162722665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised word segmentation in audio utterances is challenging as, in
speech, there is typically no gap between words. In a preliminary experiment,
we show that recent deep self-supervised features are very effective for word
segmentation but require supervision for training the classification head. To
extend their effectiveness to unsupervised word segmentation, we propose a
pseudo-labeling strategy. Our approach relies on the observation that the
temporal gradient magnitude of the embeddings (i.e. the distance between the
embeddings of subsequent frames) is typically minimal far from the boundaries
and higher nearer the boundaries. We use a thresholding function on the
temporal gradient magnitude to define a psuedo-label for wordness. We train a
linear classifier, mapping the embedding of a single frame to the pseudo-label.
Finally, we use the classifier score to predict whether a frame is a word or a
boundary. In an empirical investigation, our method, despite its simplicity and
fast run time, is shown to significantly outperform all previous methods on two
datasets.
- Abstract(参考訳): 音声発話における教師なし単語のセグメンテーションは、通常、音声では単語の間に隙間がないため、難しい。
予備実験では,最近の深い自己教師付き特徴が単語分割に非常に有効であるが,分類ヘッドの訓練には監督が必要であることを示す。
その効果を教師なし単語セグメンテーションに拡張するために,擬似ラベル戦略を提案する。
我々のアプローチは、埋め込みの時間的勾配の大きさ(つまり、後のフレームの埋め込み間の距離)が、通常境界から最小であり、境界に近いという観察に依存している。
時間勾配大小のしきい値関数を用いて,単語性のためのpsuedoラベルを定義する。
線形分類器を訓練し、一つのフレームの埋め込みを擬似ラベルにマッピングする。
最後に、フレームが単語なのか境界なのかを予測するために分類器スコアを使用する。
実証的な調査により,提案手法は単純かつ高速な実行時間にもかかわらず,従来の手法を2つのデータセットで大幅に上回ることがわかった。
関連論文リスト
- LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.06002976797879]
参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。
本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。
ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文 参考訳(メタデータ) (2024-10-17T07:47:41Z) - Scribble Hides Class: Promoting Scribble-Based Weakly-Supervised
Semantic Segmentation with Its Class Label [16.745019028033518]
画像レベルのクラスから情報を得たスクリブルアノテーションと擬似ラベルと、監督のためのグローバルセマンティクスの両方を利用するクラス駆動型スクリブルプロモーションネットワークを提案する。
スクリブルアノテーションの異なる性質を持つScribbleSupデータセットの実験は、従来の手法よりも優れており、本手法の優位性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-02-27T14:51:56Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Timestamp-Supervised Action Segmentation from the Perspective of
Clustering [12.661218632080207]
既存のほとんどの手法は、各ビデオ内のすべてのフレームに対して擬似ラベルを生成し、セグメンテーションモデルを訓練する。
本稿では,クラスタリングの観点から,以下の2つの部分を含む新しいフレームワークを提案する。
反復クラスタリングは、クラスタリングによって擬似ラベルをあいまいな間隔に反復的に伝播し、擬似ラベルシーケンスを更新してモデルをトレーニングする。
論文 参考訳(メタデータ) (2022-12-22T13:35:00Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - A Survey on Label-efficient Deep Segmentation: Bridging the Gap between
Weak Supervision and Dense Prediction [115.9169213834476]
本稿では,ラベル効率の高いセグメンテーション手法について概説する。
まず,様々な種類の弱いラベルによって提供される監督に従って,これらの手法を整理する分類法を開発する。
次に,既存のラベル効率のセグメンテーション手法を統一的な視点から要約する。
論文 参考訳(メタデータ) (2022-07-04T06:21:01Z) - Weakly-supervised Text Classification Based on Keyword Graph [30.57722085686241]
GNN によるキーワードグラフ上のキーワードキーワード相関を探索する ClassKG という新しいフレームワークを提案する。
フレームワークは反復的なプロセスであり、各イテレーションでまずキーワードグラフを構築し、擬似ラベルをアサインするタスクをキーワードサブグラフに変換する。
サブグラフアノテータによって生成された擬似ラベルを用いて、未ラベルのテキストを分類するためにテキスト分類器を訓練する。
論文 参考訳(メタデータ) (2021-10-06T08:58:02Z) - Segmental Contrastive Predictive Coding for Unsupervised Word
Segmentation [33.35220574193796]
本稿では,信号構造を音素レベルでより高レベルにモデル化できるSCPC( segmental contrastive predictive coding)フレームワークを提案する。
微分可能な境界検出器は可変長のセグメントを見つけ、NCEを介してセグメントエンコーダを最適化する。
本稿では,TIMITおよびBuckeyeデータセットにおける既存の音素・単語分割手法より,単一モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2021-06-03T23:12:05Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - PCAMs: Weakly Supervised Semantic Segmentation Using Point Supervision [12.284208932393073]
本稿では,ある点レベルのアノテーションが与えられた画像から意味的セグメンテーションを生成する新しい手法を提案する。
提案するCNNは,通常,地上の真理ラベルの代わりに擬似ラベルを用いて完全に教師される。
提案手法は,PASCAL VOC 2012 データセットを引用した PASCAL VOC 2012 のセマンティックセマンティックセマンティフィケーションのための技術結果の状態を達成し,より強いバウンディングボックスやリスグル管理のための技術手法よりも優れていた。
論文 参考訳(メタデータ) (2020-07-10T21:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。