Fugu-MT 論文翻訳(概要): Named Entity Recognition for Address Extraction in Speech-to-Text Transcriptions Using Synthetic Data

論文の概要: Named Entity Recognition for Address Extraction in Speech-to-Text Transcriptions Using Synthetic Data

arxiv url: http://arxiv.org/abs/2402.05545v1
Date: Thu, 8 Feb 2024 10:29:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-09 15:41:01.473366
Title: Named Entity Recognition for Address Extraction in Speech-to-Text Transcriptions Using Synthetic Data
Title（参考訳）: 合成データを用いた音声合成におけるアドレス抽出のための名前付きエンティティ認識
Authors: Bibi\'ana Laj\v{c}inov\'a, Patrik Val\'abek and Michal Spi\v{s}iak
Abstract要約: 本稿では,BERTアーキテクチャによる双方向表現に基づく名前付きエンティティ認識(NER)モデルの構築手法を提案する。このNERモデルは、音声からテキストへの書き起こしから取得したデータからアドレス部分を抽出する。合成データのみを訓練したNERモデルの性能を,小さな実データを用いて評価した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper introduces an approach for building a Named Entity Recognition (NER) model built upon a Bidirectional Encoder Representations from Transformers (BERT) architecture, specifically utilizing the SlovakBERT model. This NER model extracts address parts from data acquired from speech-to-text transcriptions. Due to scarcity of real data, a synthetic dataset using GPT API was generated. The importance of mimicking spoken language variability in this artificial data is emphasized. The performance of our NER model, trained solely on synthetic data, is evaluated using small real test dataset.
Abstract（参考訳）: 本稿では,BERTアーキテクチャを用いた双方向エンコーダ表現(BERT)に基づく名前付きエンティティ認識(NER)モデルの構築手法を提案する。このNERモデルは、音声からテキストへの書き起こしから取得したデータからアドレス部分を抽出する。実データが少ないため、GPT APIを用いた合成データセットが生成される。この人工データにおける音声言語変動の模倣の重要性が強調される。合成データのみを訓練したNERモデルの性能を,小さな実データを用いて評価した。

関連論文リスト

Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。合成データがモデル一般化をどのように改善するかを批判的に検討する。本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文参考訳（メタデータ） (2025-09-07T19:28:52Z)
RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs [3.41612427812159]
デジタルコンテンツ作成ツールでは、ユーザは、API呼び出しにマップしなければならない自然言語クエリを通じて、ニーズを表現します。既存の合成データ生成アプローチでは、実世界のデータ分散を複製することができない。高品質な合成学習データを生成するルータベースのアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-05-15T16:53:45Z)
Data-Constrained Synthesis of Training Data for De-Identification [0.0]
臨床領域に適応する大言語モデル(LLM)について検討した。我々は,個人識別可能な情報にタグを付加した人工的な臨床テキストを生成する。合成コーパスは合成NERモデルの訓練に使用される。
論文参考訳（メタデータ） (2025-02-20T16:09:27Z)
"I've Heard of You!": Generate Spoken Named Entity Recognition Data for Unseen Entities [59.22329574700317]
名前付きエンティティ認識(NER)は、名前付きエンティティを音声から識別することを目的としている。しかし、新しい名前のエンティティが毎日現れ、Spoken NERデータに注釈をつけるのはコストがかかる。そこで本稿では,NEDに基づく音声NERデータ生成手法を提案する。
論文参考訳（メタデータ） (2024-12-26T07:43:18Z)
Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文参考訳（メタデータ） (2024-07-26T07:30:41Z)
Speech Emotion Recognition under Resource Constraints with Data Distillation [64.36799373890916]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす。モノのインターネットにおけるエッジデバイスの出現は、複雑なディープラーニングモデルを構築する上での課題を示している。本研究では,IoTアプリケーションにおけるSERモデルの効率的な開発を容易にするためのデータ蒸留フレームワークを提案する。
論文参考訳（メタデータ） (2024-06-21T13:10:46Z)
Code-Switching Text Generation and Injection in Mandarin-English ASR [57.57570417273262]
業界で広く使われているストリーミングモデルTransformer-Transducer(T-T)の性能向上のためのテキスト生成とインジェクションについて検討する。まず、コードスイッチングテキストデータを生成し、テキスト-to-Speech(TTS)変換または暗黙的に音声とテキストの潜在空間を結び付けることによって、T-Tモデルに生成されたテキストを明示的に注入する戦略を提案する。実際のマンダリン・イングリッシュ音声の1,800時間を含むデータセットを用いて訓練したT-Tモデルの実験結果から,生成したコードスイッチングテキストを注入する手法により,T-Tモデルの性能が著しく向上することが示された。
論文参考訳（メタデータ） (2023-03-20T09:13:27Z)
Advancing Semi-Supervised Learning for Automatic Post-Editing: Data-Synthesis by Mask-Infilling with Erroneous Terms [5.366354612549173]
高品質な合成データを作成するためのデータ合成手法に着目する。本稿では,結果の合成データが実際のデータにある翻訳誤りを模倣するデータ合成手法を提案する。実験結果から, 提案手法により生成した合成データを用いることで, 既存の合成データよりもAPEの性能が有意に向上することがわかった。
論文参考訳（メタデータ） (2022-04-08T07:48:57Z)
End-to-end model for named entity recognition from speech without paired training data [12.66131972249388]
本稿では,意味情報を抽出するエンド・ツー・エンドのニューラルモデルを構築するアプローチを提案する。我々のアプローチは、テキストからベクトル表現のシーケンスを生成するために訓練された外部モデルを使用することに基づいている。 quEROコーパスを用いた名前付きエンティティ認識実験は,このアプローチが有望であることを示す。
論文参考訳（メタデータ） (2022-04-02T08:14:27Z)
Hierarchical Transformer Model for Scientific Named Entity Recognition [0.20646127669654832]
名前付きエンティティ認識のためのシンプルで効果的なアプローチを提案する。提案手法の主な考え方は、入力サブワードシーケンスをBERTのような事前学習された変換器で符号化することである。科学的NERのための3つのベンチマークデータセットに対するアプローチを評価した。
論文参考訳（メタデータ） (2022-03-28T12:59:06Z)
Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文参考訳（メタデータ） (2022-03-16T23:21:05Z)
Synt++: Utilizing Imperfect Synthetic Data to Improve Speech Recognition [18.924716098922683]
合成データによる機械学習は、合成データと実際のデータ分布のギャップのため、簡単ではない。本稿では,分散ギャップに起因する問題を緩和するために,トレーニング中の2つの新しい手法を提案する。これらの手法は,合成データを用いた音声認識モデルの訓練を著しく改善することを示す。
論文参考訳（メタデータ） (2021-10-21T21:11:42Z)
Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。 PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。 GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文参考訳（メタデータ） (2021-04-12T21:24:02Z)
Relative Positional Encoding for Speech Recognition and Direct Translation [72.64499573561922]
相対位置符号化方式を音声変換器に適用する。その結果,ネットワークは音声データに存在する変動分布に適応できることがわかった。
論文参考訳（メタデータ） (2020-05-20T09:53:06Z)
Have Your Text and Use It Too! End-to-End Neural Data-to-Text Generation with Semantic Fidelity [3.8673630752805432]
本稿では,ニューラルでエンドツーエンドなデータ・ツー・テキスト生成システムであるDataTunerを紹介する。我々は2段階の世代レベルのアプローチを採り、微調整言語モデルと意味的忠実さを組み合わせた。我々は、DataTunerが4つの主要なD2Tデータセットにまたがる自動メトリクスにおいて、技術結果の状態を達成していることを示す。
論文参考訳（メタデータ） (2020-04-08T11:16:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。