Fugu-MT 論文翻訳(概要): A Finetuned SpeechLLM for Joint Multi-Granular L2 Assessment and Natural-Language Rationales

論文の概要: A Finetuned SpeechLLM for Joint Multi-Granular L2 Assessment and Natural-Language Rationales

arxiv url: http://arxiv.org/abs/2606.09470v1
Date: Mon, 08 Jun 2026 13:27:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:42:07.088189
Title: A Finetuned SpeechLLM for Joint Multi-Granular L2 Assessment and Natural-Language Rationales
Title（参考訳）: 混合多粒性L2評価のための微調整音声LLMと自然言語の合理化
Authors: Aditya Kamlesh Parikh, Cristian Tejedor-Garcia, Catia Cucchiarini, Helmer Strik,
Abstract要約: 本稿では,マルチアスペクト・マルチグラニュラーアセスメントのためのルーリック誘導型SpeechLLMを提案する。このモデルは、文レベル(正確性、流布度、韻律)、単語/音素レベルの精度を共同で予測し、同じ応答で自然言語の論理を生成する。
参考スコア（独自算出の注目度）: 8.300738063140129
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated L2 speech assessment can assign proficiency labels, but often lacks interpretability. We propose a rubric-guided SpeechLLM for multi-aspect, multi-granular assessment, trained with a hybrid objective combining supervised fine-tuning and Bounded Direct Preference Optimization. The model jointly predicts ordinal labels at the sentence-level (accuracy, fluency, prosody), word/phoneme-level accuracy, and generates a natural-language rationale in the same response. On SpeechOcean762, our approach matches or outperforms single-granularity models while remaining competitive with prior approaches. We analyze rationale reliability along two axes: self-consistency with model predictions and alignment with ground-truth labels, using sentiment consistency (plausibility) and mention-based agreement (faithfulness). Rationales are plausible at the sentence level, but faithfulness degrades at the word/phoneme level: references are sparse and weakly aligned with token-level labels.
Abstract（参考訳）: 自動L2音声アセスメントは、熟練度ラベルを割り当てることができるが、しばしば解釈性に欠ける。教師付き微調整と境界直接選好最適化を組み合わせたハイブリッド目標を用いた多視点多粒度評価のためのルーブリック誘導型SpeechLLMを提案する。このモデルは、文レベル(正確性、流布度、韻律)、単語/音素レベルの精度を共同で予測し、同じ応答で自然言語の論理を生成する。 SpeechOcean762では,従来のアプローチと競合しながら,単一粒度モデルに適合する,あるいは性能が向上する。モデル予測との自己整合性,地道ラベルとの整合性,感情整合性(楽観性)と言及に基づく合意(忠実性)の2つの軸に沿って合理的な信頼性を分析する。格言は文のレベルでは妥当であるが、忠実度は単語/音素のレベルで低下し、参照は狭くトークンレベルのラベルと弱く一致している。

関連論文リスト

Holistic Reliability Propagation: Decoupling Annotation and Prediction for Robust Noisy-Label [3.7874902461360627]
バイレベルメタラーニングでは、サンプル毎に2つのバッチ正規化スカラー、与えられたラベルのアルファ、擬似ラベルのベータを生成する。信頼性に配慮したMixupと、入力ブランチのグローバルゲーティングと、コントラストブランチのβ-ゲート擬似ラベルポジティクスを併用する。合成および実世界のベンチマークでは、HRPは強いベースラインよりも平均精度を向上し、最高のノイズレートで競争力を維持する。
論文参考訳（メタデータ） (2026-05-20T05:24:37Z)
Extending Minimal Pairs with Ordinal Surprisal Curves and Entropy Across Applied Domains [0.0]
本研究は,二項文法から順序スケールの分類とスコアリングタスクまで,素性に基づく評価を拡張した。モデルに回答を求めるのではなく、情報理論の「サプライズ」を測る。この枠組みは, 社会・生態・技術系の分類, 因果文の識別(バイナリとスケール), 図形言語検出, 帰納的定性的符号化の4分野にまたがる。
論文参考訳（メタデータ） (2026-03-15T14:31:00Z)
Rubric-Guided Fine-tuning of SpeechLLMs for Multi-Aspect, Multi-Rater L2 Reading-Speech Assessment [8.300738063140129]
本稿では,多視点評価基準を明示的に符号化したルーリック誘導推論フレームワークを提案する。我々は、解釈可能な信頼区間に対する共形キャリブレーションによって支持される不確実性校正回帰手法を開発する。以上の結果から,ルーブリック誘導型不確実性校正推論は,信頼性と説明可能なSpeechLLMに基づく音声評価への原則的道筋を提供することが示された。
論文参考訳（メタデータ） (2026-02-28T11:08:24Z)
Judging with Confidence: Calibrating Autoraters to Preference Distributions [56.17041629492863]
信頼性の高いオートラッターは、対象の個体群によって定義される嗜好の完全な分布をモデル化することを学ぶ必要がある、と我々は主張する。異なるデータ条件に合わせた2つの学習方法を提案する。この結果から, 分布マッチング目的の微調整オートレーダは, 目的の好み分布に整合した有言確率予測を導出することがわかった。
論文参考訳（メタデータ） (2025-09-30T20:36:41Z)
Weakly-Supervised Contrastive Learning for Imprecise Class Labels [50.57424331797865]
正対と負対を定義するために「連続的意味的類似性」の概念を導入する。弱教師付きコントラスト学習のためのグラフ理論フレームワークを提案する。我々のフレームワークは非常に多用途であり、多くの弱い教師付き学習シナリオに適用できる。
論文参考訳（メタデータ） (2025-05-28T06:50:40Z)
Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。 QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文参考訳（メタデータ） (2024-10-09T22:53:48Z)
Rectifying Pseudo Label Learning via Uncertainty Estimation for Domain Adaptive Semantic Segmentation [49.295165476818866]
本稿では、意味的セグメンテーションの文脈において、ソースドメインからターゲットドメインへの知識伝達の教師なし領域適応に焦点を当てる。既存のアプローチでは、通常、擬似ラベルを未ラベルのターゲットドメインデータを完全に活用するための基礎的真理とみなす。本稿では,擬似ラベル学習の修正のために,学習中の予測の不確かさを明示的に推定することを提案する。
論文参考訳（メタデータ） (2020-03-08T12:37:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。