論文の概要: Euskarazko lehen C1 ebaluatzaile automatikoa
- arxiv url: http://arxiv.org/abs/2503.01851v1
- Date: Tue, 18 Feb 2025 14:56:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-09 04:18:59.666584
- Title: Euskarazko lehen C1 ebaluatzaile automatikoa
- Title(参考訳): Euskarazko lehen C1 ebaluatzaile Automaticikoa
- Authors: Ekhi Azurmendi, Oier Lopez de Lacalle,
- Abstract要約: 我々はバスク語の合成がC1レベルに達するかどうかを判断する自動評価器の開発を試みた。
我々は,HABEとHiTZの合意により1万点の書写文を入手し,システムの訓練を行った。
我々は、EDA、SCL、規制など、データの不足やシステムの過度な適合を避けるために、さまざまな手法を開発してきた。
- 参考スコア(独自算出の注目度): 3.1736931903492724
- License:
- Abstract: Throughout this project, we have attempted to develop an automatic evaluator that determines whether Basque language compositions meet the C1 level. To achieve our goal, we obtained 10,000 transcribed compositions through an agreement between HABE and HiTZ to train our system. We have developed different techniques to avoid data scarcity and system overfitting: EDA, SCL and regulation; We have also conducted tests with different Language Models to analyze their behavior. Finally, we have also performed analyses of different system behaviors to measure model calibration and the impact of artifacts. -- Proiektu honetan zehar euskarazko idazlanek C1 maila duten edo ez zehazten duen ebaluatzaile automatiko bat garatzen saiatu gara. Gure helburua betetzeko HABE eta HiTZ arteko hitzarmenaren bitartez 10.000 transkribatutako idazlan eskuratu ditugu gure sistema entrenatzeko. Datu eskasia eta sistemaren gaindoitzea ekiditeko teknika ezberdinak landu ditugu: EDA, SCL eta erregulazioa; Hizkuntza Eredu ezberdinekin ere probak egin ditugu duten portaera aztertzeko. Azkenik, sistema ezberdinen portaeren analisiak ere egin ditugu, ereduen kalibrazioa eta artefaktuen eragina neurtzeko.
- Abstract(参考訳): このプロジェクトを通じて,バスク語構成がC1レベルに達するかどうかを判定する自動評価器の開発を試みた。
目的を達成するため,HABEとHiTZの合意により1万点の書写文を入手し,システムの学習を行った。
EDA, SCL, 規制など, データの不足や過度なオーバーフィッティングを避けるために, さまざまな手法を開発してきた。
最後に,モデルのキャリブレーションとアーティファクトの影響を計測するために,異なるシステム挙動の分析を行った。
--Proiektu honetan zehar euskarazko idazlanek C1 maila duten edo ez zehazten due in ebaluatzaile Automaticiko bat garatzen saiatu gara
Gure helburua betetzeko HABE eta HiTZ arteko hitzarmenaren bitartez 10.000 transkribatutako idazlan eskuratu ditutu gure sistema entrenatzeko
EDA, SCL eta erregulazioa; Hizkuntza Eredu ezberdinekin ere probak egin ditugu duten portaera aztertzeko, EDA, SCL eta erregulazioa; Hizkuntza Eredu ezberdinekin ere probak egin ditugu duten portaera aztertzeko
Azkenik, sistema ezberdinen portaeren analisiak ere Egin ditugu, ereduen kalibrazioa eta artefaktuen eragina neurtzeko
関連論文リスト
- TCG CREST System Description for the Second DISPLACE Challenge [19.387615374726444]
2024年の第2回DisPLACEチャレンジのために,我々のチームが開発した話者ダイアリゼーション(SD)と言語ダイアリゼーション(LD)システムについて述べる。
コントリビューションは,多言語および多話者シナリオにおいて,トラック1 for SDとトラック2 for LDに充てられた。
論文 参考訳(メタデータ) (2024-09-16T05:13:34Z) - USTC-KXDIGIT System Description for ASVspoof5 Challenge [30.962424920219224]
ASVspoof5 Challenge for Track 1(音声ディープフェイク検出)とTrack 2(音声自動話者検証,SASV)に提出されたUSTC-KXDIGITシステムについて述べる。
トラック1は、潜在的な処理アルゴリズムから様々な技術的品質を示し、オープン条件とクローズ条件の両方を含んでいる。
トラック2では、トラック1からのCMシステムの使用を継続し、CNNベースのASVシステムと融合した。
この手法は閉条件で0.2814 min-aDCF、開条件で0.0756 min-aDCFを達成し、優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-03T08:28:58Z) - PRESENT: Zero-Shot Text-to-Prosody Control [41.62954081589881]
PreSENT (Prosody Editing without Style Embeddings or New Training) は、FastSpeech2ベースのモデルにおいて、推論プロセスを直接修正することで明示的な韻律予測を利用する。
我々は、それぞれドイツ語、ハンガリー語、スペイン語の文字誤り率(CER)を12.8%、18.7%、および5.9%とし、3つの言語で前回のCERを2倍以上上回った。
論文 参考訳(メタデータ) (2024-08-13T11:39:07Z) - Prosody in Cascade and Direct Speech-to-Text Translation: a case study
on Korean Wh-Phrases [79.07111754406841]
本研究は,韻律が重要な役割を果たす発話を明瞭にするための直接S2TTシステムの能力を評価するために,コントラスト評価を用いることを提案する。
本結果は,カスケード翻訳モデルよりも直接翻訳システムの価値を明確に示すものである。
論文 参考訳(メタデータ) (2024-02-01T14:46:35Z) - Bag of Tricks for Effective Language Model Pretraining and Downstream
Adaptation: A Case Study on GLUE [93.98660272309974]
このレポートでは、ジェネラル言語理解評価のリーダーボードに関するVega v1を簡潔に紹介します。
GLUEは、質問応答、言語受容性、感情分析、テキスト類似性、パラフレーズ検出、自然言語推論を含む9つの自然言語理解タスクのコレクションである。
最適化された事前学習と微調整の戦略により、13億のモデルは4/9タスクに新しい最先端のタスクを設定し、91.3の平均スコアを達成しました。
論文 参考訳(メタデータ) (2023-02-18T09:26:35Z) - Sequence-level self-learning with multiple hypotheses [53.04725240411895]
我々は、自動音声認識(ASR)のためのアテンションベースシーケンス・ツー・シーケンス(seq2seq)モデルを用いた新しい自己学習手法を開発した。
従来の教師なし学習手法とは対照的に,我々はEmphmulti-task Learning(MTL)フレームワークを採用する。
実験の結果,本手法は,英語データのみを用いてトレーニングしたベースラインモデルと比較して,英文音声データのWERを14.55%から10.36%に削減できることがわかった。
論文 参考訳(メタデータ) (2021-12-10T20:47:58Z) - HuBERT: Self-Supervised Speech Representation Learning by Masked
Prediction of Hidden Units [81.53783563025084]
本稿では、BERTのような予測損失に対して、アライメントされたターゲットラベルを提供するオフラインクラスタリングステップを提案する。
提案手法の重要な要素は,マスク領域にのみ予測損失を適用することである。
HuBERTは、より困難なdev-otherおよびtest-other評価サブセットに対して、最大19%と13%の相対的なWER削減を示す。
論文 参考訳(メタデータ) (2021-06-14T14:14:28Z) - Knowledge Distillation for Improved Accuracy in Spoken Question
Answering [63.72278693825945]
我々は,音声文書や書面文書から知識蒸留を行うための訓練戦略を考案した。
我々の研究は、言語モデルから知識の抽出を監督信号として進めている。
実験により,本手法はSpken-SQuADデータセット上で,最先端の言語モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-21T15:18:01Z) - A Machine Learning-based Approach to Detect Threats in Bio-Cyber DNA
Storage Systems [20.27498894606937]
我々は,生物工学的細菌を用いて,DNAにコード化されていたデータの保存と検索を行う自動アーカイブアーキテクチャを提案する。
これらの生物学的メディアと古典的メディアの類似性は、悪意ある当事者が以前のアーカイブシステムに対する伝統的な攻撃を複製する可能性があるため、欠点となる可能性がある。
本稿では、まず、ストレージシステムの主な特徴と、その上で実行できる様々な種類の攻撃について分析する。
そして、現在進行中の攻撃を特定することを目的として、従来のメトリクスや機械学習アルゴリズムに依存する検出手法を提案し、評価する。
論文 参考訳(メタデータ) (2020-09-28T14:55:20Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。