Fugu-MT 論文翻訳(概要): Handling the Alignment for Wake Word Detection: A Comparison Between Alignment-Based, Alignment-Free and Hybrid Approaches

論文の概要: Handling the Alignment for Wake Word Detection: A Comparison Between Alignment-Based, Alignment-Free and Hybrid Approaches

arxiv url: http://arxiv.org/abs/2302.08950v1
Date: Fri, 17 Feb 2023 15:33:47 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-20 14:16:04.330348
Title: Handling the Alignment for Wake Word Detection: A Comparison Between Alignment-Based, Alignment-Free and Hybrid Approaches
Title（参考訳）: ウェイクワード検出のためのアライメント処理:アライメントベース,アライメントフリー,ハイブリッドアプローチの比較
Authors: Vinicius Ribeiro, Yiteng Huang, Yuan Shangguan, Zhaojun Yang, Li Wan, Ming Sun
Abstract要約: ウェイクワード検出は、ほとんどの知的な家庭や携帯機器に存在している。これらのデバイスは、低コストの電力とコンピューティングで呼び出された時に"覚醒"する機能を提供する。本稿では、一般的なフレーズに答えるウェイクワードシステムの開発におけるアライメントの役割を理解することに焦点を当てる。
参考スコア（独自算出の注目度）: 11.697736752054642
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Wake word detection exists in most intelligent homes and portable devices. It offers these devices the ability to "wake up" when summoned at a low cost of power and computing. This paper focuses on understanding alignment's role in developing a wake-word system that answers a generic phrase. We discuss three approaches. The first is alignment-based, where the model is trained with frame-wise cross-entropy. The second is alignment-free, where the model is trained with CTC. The third, proposed by us, is a hybrid solution in which the model is trained with a small set of aligned data and then tuned with a sizeable unaligned dataset. We compare the three approaches and evaluate the impact of the different aligned-to-unaligned ratios for hybrid training. Our results show that the alignment-free system performs better alignment-based for the target operating point, and with a small fraction of the data (20%), we can train a model that complies with our initial constraints.
Abstract（参考訳）: ウェイクワード検出は、ほとんどのインテリジェントホームやポータブルデバイスに存在する。これらのデバイスは、低コストの電力とコンピューティングで呼び出された時に"覚醒"する機能を提供する。本稿では,総称句に応答するウェイクワードシステムの開発におけるアライメントの役割を理解することに焦点を当てる。 3つのアプローチについて論じる。ひとつはアライメントベースで、モデルにはフレーム間のクロスエントロピーをトレーニングする。 2つ目はアライメントフリーで、モデルがCTCでトレーニングされる。私たちの提案した第3のソリューションはハイブリッドなソリューションで,モデルを小さなアライメントされたデータセットでトレーニングし,サイズ可能なアンアライメントデータセットでチューニングするものです。 3つのアプローチを比較し,ハイブリッドトレーニングにおけるアライメントとアンライメントの異なる比率の影響を評価する。その結果,アライメントフリーシステムは目標操作点に対してより優れたアライメントを行うことができ,データのごく一部(20%)で初期制約に対応するモデルを訓練できることがわかった。

関連論文リスト

SOTAlign: Semi-Supervised Alignment of Unimodal Vision and Language Models via Optimal Transport [43.640561199880274]
プラトン表現仮説(英: Platonic Representation hypothesis)は、ニューラルネットワークが世界の共有統計モデルに向かって収束するという仮説である。最近の研究は、凍結した事前学習された視覚と言語モデルを軽量なアライメント層に整列させることによって、この収束を利用する。我々は、極めて少ない監督で有意義なアライメントが達成できるかどうか尋ねる。事前訓練された単調エンコーダを少数の画像テキストペアと大量の未ペアデータを用いてアライメントする半教師付き設定を導入する。
論文参考訳（メタデータ） (2026-02-26T18:55:06Z)
FACT: Multinomial Misalignment Classification for Point Cloud Registration [1.256245863497516]
本稿では,登録ライダー点雲対のアライメント品質(登録誤差)を予測するためのFACTを提案する。 FACTは、登録されたペアからローカル特徴を抽出し、ポイントトランスフォーマーベースのネットワークで処理し、ミスアライメントクラスを予測する。
論文参考訳（メタデータ） (2025-04-09T07:01:57Z)
Anchored Alignment for Self-Explanations Enhancement [10.322090458234735]
本稿では,大規模言語モデルによる推論の表現能力の向上を目的としたアライメント手法を提案する。提案手法は,説明品質評価,自己指導データセット生成,モデルアライメントという3つの重要な要素から構成される。
論文参考訳（メタデータ） (2024-10-17T04:42:48Z)
Not Everything is All You Need: Toward Low-Redundant Optimization for Large Language Model Alignment [126.34547428473968]
大規模言語モデル(LLM)は、複雑なタスクやシナリオにおいて、人間の好みに合わせるのに依然として苦労しています。我々は、最も有用な教師付き信号を用いて、最も関連性の高いニューロンを最適化することに焦点を当てた、textbfALLOという低輝度アライメント手法を提案する。 10個のデータセットに対する実験結果から、ALLOの有効性が示された。
論文参考訳（メタデータ） (2024-06-18T13:34:40Z)
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback [70.32795295142648]
リニアアライメントは、言語モデルと人間の好みを1つの推論ステップで整列する新しいアルゴリズムである。一般的な選好データセットとパーソナライズされた選好データセットの実験により、線形アライメントはLLMアライメントの性能と効率を大幅に向上させることが示された。
論文参考訳（メタデータ） (2024-01-21T10:46:23Z)
Handbook on Leveraging Lines for Two-View Relative Pose Estimation [82.72686460985297]
本稿では,画像ペア間の相対的なポーズを,点,線,およびそれらの一致をハイブリッド方式で共同で推定する手法を提案する。我々のハイブリッドフレームワークは、すべての構成の利点を組み合わせて、挑戦的な環境で堅牢で正確な見積もりを可能にします。
論文参考訳（メタデータ） (2023-09-27T21:43:04Z)
WSPAlign: Word Alignment Pre-training via Large-Scale Weakly Supervised Span Prediction [31.96433679860807]
既存の単語アライメント手法の多くは、手動アライメントデータセットやパラレルコーパスに依存している。我々は正しい、完全に整合した、平行した文の要求を緩和する。次に、このような大規模弱教師付きデータセットを用いて、スパン予測による単語アライメント事前学習を行う。
論文参考訳（メタデータ） (2023-06-09T03:11:42Z)
NAIST-SIC-Aligned: an Aligned English-Japanese Simultaneous Interpretation Corpus [23.49376007047965]
同時解釈(SI)データが同時機械翻訳(SiMT)に与える影響は依然として疑問である。自動整列した英語と日本語のSIデータセットであるNAIST-SIC-Alignedを導入する。その結果,SIデータでトレーニングしたモデルでは,ベースラインよりも翻訳品質とレイテンシが大幅に向上することがわかった。
論文参考訳（メタデータ） (2023-04-23T23:03:58Z)
Third-Party Aligner for Neural Word Alignments [18.745852103348845]
本稿では,ニューラルネットワークによる単語アライメントトレーニングの監督のために,サードパーティ製単語アライメント器によって生成された単語アライメントを提案する。実験により、我々のアプローチは第三者の監督に対して驚くほど自己補正が可能であることが示された。我々は最先端の単語アライメント性能を達成し、最高のサードパーティアライメントよりも平均2ポイント以上低いアライメント誤り率を持つ。
論文参考訳（メタデータ） (2022-11-08T12:30:08Z)
CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文参考訳（メタデータ） (2022-06-01T03:02:07Z)
Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文参考訳（メタデータ） (2022-05-12T02:23:25Z)
Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。 NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文参考訳（メタデータ） (2022-04-27T04:24:35Z)
Rationalizing Text Matching: Learning Sparse Alignments via Optimal Transport [14.86310501896212]
本研究では,この選択的合理化アプローチをテキストマッチングに拡張する。目標は、下流の予測の正当化として、トークンや文などのテキストを共同で選択し、調整することである。我々のアプローチでは、入力間の最小コストアライメントを見つけるために最適なトランスポート(OT)を採用している。
論文参考訳（メタデータ） (2020-05-27T01:20:49Z)
Wake Word Detection with Alignment-Free Lattice-Free MMI [66.12175350462263]
音声言語インタフェース、例えばパーソナルデジタルアシスタントは、音声入力の処理を開始するためにウェイクワードに依存している。本稿では,部分的にラベル付けされたトレーニングデータから,ハイブリッドDNN/HMM覚醒単語検出システムの学習方法を提案する。提案手法を2つの実データ集合上で評価し, 前報よりも50%～90%の誤報率の減少率を示した。
論文参考訳（メタデータ） (2020-05-17T19:22:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。