論文の概要: Whispering in Norwegian: Navigating Orthographic and Dialectic
Challenges
- arxiv url: http://arxiv.org/abs/2402.01917v1
- Date: Fri, 2 Feb 2024 21:38:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 23:26:59.533713
- Title: Whispering in Norwegian: Navigating Orthographic and Dialectic
Challenges
- Title(参考訳): ノルウェーのWhispering: オルソグラフィーと弁証的挑戦の旅
- Authors: Per E Kummervold, Javier de la Rosa, Freddy Wetjen, Rolv-Arild
Braaten, Per Erik Solberg
- Abstract要約: 本稿では,NB-Whisperを紹介する。NB-WhisperはOpenAIのWhisperの適応であり,特にノルウェー語自動音声認識(ASR)用に微調整されている。
我々は、その重要な貢献を強調し、話されたノルウェー語を書式に変換し、他の言語をノルウェー語に翻訳することで得られた結果を要約する。
- 参考スコア(独自算出の注目度): 0.2984347156162651
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This article introduces NB-Whisper, an adaptation of OpenAI's Whisper,
specifically fine-tuned for Norwegian language Automatic Speech Recognition
(ASR). We highlight its key contributions and summarise the results achieved in
converting spoken Norwegian into written forms and translating other languages
into Norwegian. We show that we are able to improve the Norwegian Bokm{\aa}l
transcription by OpenAI Whisper Large-v3 from a WER of 10.4 to 6.6 on the
Fleurs Dataset and from 6.8 to 2.2 on the NST dataset.
- Abstract(参考訳): この記事では、ノルウェー語自動音声認識(asr)用に特に微調整されたopenaiのwhisperを適応させたnb-whisperを紹介する。
我々は、その重要な貢献を強調し、ノルウェー語を書体に変換し、他の言語をノルウェー語に翻訳することで得られた結果を要約する。
我々は、openai whisper large-v3によるノルウェーのbokm{\aa}l転写をfleursデータセット上では10.4から6.6、nstデータセットでは6.8から2.2まで改善できることを示した。
関連論文リスト
- Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。
本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。
この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文 参考訳(メタデータ) (2024-08-05T07:58:58Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian [4.062031248854444]
ノルウェーの人口はわずか500万人で、NLPのタスクで最も印象的なブレークスルーの中では、表現力に乏しい。
このギャップを埋めるために、既存のノルウェーデータセットをコンパイルし、4つのノルウェーオープン言語モデルを事前訓練しました。
GPT-3.5はノルウェーの文脈を理解する能力に限界があることがわかった。
論文 参考訳(メタデータ) (2023-12-03T08:09:45Z) - Boosting Norwegian Automatic Speech Recognition [0.0]
本稿では,ノルウェーの2つの公用語であるボクマール語とニノルスク語に対する自動音声認識(ASR)モデルについて述べる。
複数のノルウェー語音声データセットにおける様々な大きさのモデルと事前学習アプローチの性能を比較した。
我々は,ノルウェー議会音声コーパス (NPSC) の言語誤り率 (WER) を17.10%から7.60%に改善し,ボクマールでは5.81%,ニノルスクでは11.54%とした。
論文 参考訳(メタデータ) (2023-07-04T12:05:15Z) - NorQuAD: Norwegian Question Answering Dataset [0.03281128493853064]
データセットは、手動で作成した4,752組の質問応答ペアで構成されている。
本稿では,複数の言語モデルとノルウェーの単言語モデルを比較し,その性能を比較した。
データセットは無償で提供される。
論文 参考訳(メタデータ) (2023-05-03T08:17:07Z) - NorDiaChange: Diachronic Semantic Change Dataset for Norwegian [63.65426535861836]
NorDiaChangeはノルウェーにおける最初のダイアクロニックなセマンティックチェンジデータセットである。
ノルウェーの約80の名詞が、時間とともに格付けされた意味変化で注釈付けされている。
論文 参考訳(メタデータ) (2022-01-13T18:27:33Z) - BitextEdit: Automatic Bitext Editing for Improved Low-Resource Machine
Translation [53.55009917938002]
自動編集によりマイニングしたビットクストを改良することを提案する。
提案手法は,5つの低リソース言語ペアと10の翻訳方向に対して,最大8個のBLEUポイントでCCMatrixマイニングビットクストの品質を向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T16:00:39Z) - Multilingual Unsupervised Neural Machine Translation with Denoising
Adapters [77.80790405710819]
単言語データのみを持つ言語を翻訳・翻訳する多言語無教師機械翻訳の問題点を考察する。
この問題に対して、モノリンガルデータを活用するための標準的な手順は、計算コストが高くチューニングが難しいバックトランスレーションである。
本稿では,事前学習したmBART-50上に,デノナイジング対象のアダプタ層であるデノナイジングアダプタを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-20T10:18:29Z) - Large-Scale Contextualised Language Modelling for Norwegian [7.5722195869569]
本稿では,elmo と bert の両フレームワークに基づく,ノルウェー初の大規模単言語モデルを提案する。
トレーニングプロセスの詳細に加えて,ノルウェーにおけるNLPタスクのスイートに対して,コントラスト的なベンチマーク結果を示す。
論文 参考訳(メタデータ) (2021-04-13T23:18:04Z) - Unsupervised Transfer Learning in Multilingual Neural Machine
Translation with Cross-Lingual Word Embeddings [72.69253034282035]
我々は、言語独立多言語文表現を活用し、新しい言語に容易に一般化する。
複数のロマンス言語を含むベースシステムを用いてポルトガル語から盲目的に復号し、ポルトガル語では36.4 BLEU、ロシア語では12.8 BLEUのスコアを得た。
非反復的逆翻訳によるより実用的な適応アプローチを探求し、高品質の翻訳を生産するモデルの能力を活用します。
論文 参考訳(メタデータ) (2021-03-11T14:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。