Fugu-MT 論文翻訳(概要): Speech-based Slot Filling using Large Language Models

論文の概要: Speech-based Slot Filling using Large Language Models

arxiv url: http://arxiv.org/abs/2311.07418v1
Date: Mon, 13 Nov 2023 15:54:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-14 13:45:45.065860
Title: Speech-based Slot Filling using Large Language Models
Title（参考訳）: 大型言語モデルを用いた音声によるスロット充填
Authors: Guangzhi Sun, Shutong Feng, Dongcheng Jiang, Chao Zhang, Milica Ga\v{s}i\'c, Philip C. Woodland
Abstract要約: 本稿では,大言語モデル(LLM)の雑音ASR転写によるスロット充填への応用の可能性について検討する。ノイズASR転写によるスロット充填におけるLCMのロバスト性向上のための設計と微調整手法が提案されている。
参考スコア（独自算出の注目度）: 15.226786670710409
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recently, advancements in large language models (LLMs) have shown an unprecedented ability across various language tasks. This paper investigates the potential application of LLMs to slot filling with noisy ASR transcriptions, via both in-context learning and task-specific fine-tuning. Dedicated prompt designs and fine-tuning approaches are proposed to improve the robustness of LLMs for slot filling with noisy ASR transcriptions. Moreover, a linearised knowledge injection (LKI) scheme is also proposed to integrate dynamic external knowledge into LLMs. Experiments were performed on SLURP to quantify the performance of LLMs, including GPT-3.5-turbo, GPT-4, LLaMA-13B and Vicuna-13B (v1.1 and v1.5) with different ASR error rates. The use of the proposed fine-tuning together with the LKI scheme for LLaMA-13B achieved an 8.3% absolute SLU-F1 improvement compared to the strong Flan-T5-base baseline system on a limited data setup.
Abstract（参考訳）: 近年,大規模言語モデル(LLM)の進歩は,様々な言語タスクにおいて前例のない能力を示している。本稿では,テキスト内学習とタスク固有の微調整の両方を通して,雑音の多いASR文字によるスロットフィリングへのLLMの適用の可能性について検討する。ノイズASR転写によるスロット充填におけるLCMのロバスト性を改善するために, 逐次設計と微調整手法を提案する。さらに、動的外部知識をLLMに統合するために、線形化知識注入(LKI)方式も提案されている。 SLURPでは、GPT-3.5-turbo、GPT-4、LLaMA-13B、Vicuna-13B(v1.1、v1.5)などのLSMの性能を数値化するために実験が行われた。 LLaMA-13BのLKIスキームと組み合わせて提案した微調整は、データ設定が限られている強力なFlan-T5ベースラインシステムと比較して8.3%の絶対的なSLU-F1の改善を実現した。

関連論文リスト

LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models [3.5297361401370053]
そこで我々は,Large Language Models (LLMs) を利用した多用途フレームワークを導入し,実データから生成された擬似ラベルを補正する。 LESSフレームワーク内では、教師なしデータのASR(Automatic Speech Recognition)またはAST(Automatic Speech Translation)からの擬似ラベル付きテキストをLLMにより洗練する。マンダリンASRとスペイン語と英語のASTの両タスクの実験は、LESSが3.77%の絶対的なWER削減を達成したことを示している。
論文参考訳（メタデータ） (2025-06-05T03:00:04Z)
Facilitating large language model Russian adaptation with Learned Embedding Propagation [0.0]
オープンソースの命令調整型大言語モデル(LLM)は、GPT-4のような最先端の言語モデルと同じテキスト生成品質を持つ。 LLMの著者は、結果の複製に必要なトレーニングデータを公開していないため、成果をモデル排他的にしている。本稿では,言語適応パイプラインの限界に対処し,コストを削減するために,Learned Embedding propagation (LEP)を提案する。
論文参考訳（メタデータ） (2024-12-30T18:15:45Z)
Transducer-Llama: Integrating LLMs into Streamable Transducer-based Speech Recognition [26.79555533538622]
本稿では,大規模言語モデル(LLM)をFactized Transducer(FT)モデルに統合する新しいモデルアーキテクチャであるTransducer-Llamaを提案する。提案されたストリーミングTransducer-Llamaアプローチは、強いFTベースラインに17%の相対的なWER削減(WERR)、RNN-Tベースラインに32%のWERRを与えた。
論文参考訳（メタデータ） (2024-12-21T03:35:49Z)
Adaptive Pruning for Large Language Models with Structural Importance Awareness [66.2690963378878]
大規模言語モデル(LLM)は言語理解と生成能力を大幅に改善した。 LLMは、高い計算およびストレージリソース要求のため、リソース制約のあるエッジデバイスにデプロイするのは難しい。モデル性能を維持しつつ,計算コストとメモリコストを大幅に削減する構造的適応型プルーニング(SAAP)を提案する。
論文参考訳（メタデータ） (2024-12-19T18:08:04Z)
LLaVA-KD: A Framework of Distilling Multimodal Large Language Models [70.19607283302712]
本稿では,l-MLLMからs-MLLMへ知識を伝達する新しいフレームワークを提案する。具体的には,l-MLLMとs-MLLMの視覚的テキスト出力分布のばらつきを最小限に抑えるために,MDist(Multimodal Distillation)を導入する。また,S-MLLMの可能性を完全に活用するための3段階学習手法を提案する。
論文参考訳（メタデータ） (2024-10-21T17:41:28Z)
GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを融合して、最小の外部入力で正確な推論を改善する新しい推論手法である。 GIVE は LLM エージェントをガイドして,最も関連する専門家データ (observe) を選択し,クエリ固有の発散思考 (reflect) に従事し,その情報を合成して最終的な出力 (speak) を生成する。
論文参考訳（メタデータ） (2024-10-11T03:05:06Z)
Beyond ChatGPT: Enhancing Software Quality Assurance Tasks with Diverse LLMs and Validation Techniques [14.230480872339463]
本稿では,複数の大規模言語モデル(LLM)が2つのSQAタスク(障害局所化と脆弱性検出)にまたがる機能について検討する。 LLMの結果を組み合わせる投票機構を実装することで,両タスクにおいてGPT-3.5よりも10%以上の改善を実現した。このアプローチにより、障害のローカライゼーションが16%、脆弱性検出が12%、GPT-3.5が4%向上した。
論文参考訳（メタデータ） (2024-09-02T07:26:19Z)
R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [83.77114091471822]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。 SFLの課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータが相手のジャミングに感受性を持つことである。これは、言語理解に不可欠である大規模言語モデル(LLM)における単語埋め込みパラメータに対して特に顕著である。無線ネットワーク上でのLLM(R-SFLLM)を用いたレジリエンスSFLのための物理層フレームワークを開発した。
論文参考訳（メタデータ） (2024-07-16T12:21:29Z)
Applying RLAIF for Code Generation with API-usage in Lightweight LLMs [15.366324461797582]
Reinforcement Learning from AI Feedback (RLAIF)は、さまざまな領域で大きな可能性を証明している。本稿では,軽量 (1B パラメータ) LLM のコード生成能力を改善するための RLAIF フレームワークを提案する。
論文参考訳（メタデータ） (2024-06-28T17:16:03Z)
An Empirical Study of LLaMA3 Quantization: From LLMs to MLLMs [54.91212829143966]
本研究では、LLaMA3の低ビット幅への量子化能力について検討する。我々は,LLaMA3の1-8ビットおよび多種多様なデータセットに対して,学習後量子化とLLaMA3のLoRAファインタニング法を10種類評価した。実験の結果,LLaMA3は言語的・視覚的文脈において,相変わらず非言語的劣化をきたしていることが明らかとなった。
論文参考訳（メタデータ） (2024-04-22T10:03:03Z)
LLM-Oriented Retrieval Tuner [25.563739811422874]
Dense Retrieval(DR)は現在、LLM(Large Language Models)の記憶能力を高めるための有望なツールと考えられている。本稿では,LLM から DR 容量を分離する効率的な LLM-Oriented Retrieval Tuner,すなわち LMORT を提案する。提案手法は,強力なDRモデルと比較して,競争力のあるゼロショット検索性能を実現することができる。
論文参考訳（メタデータ） (2024-03-04T12:50:25Z)
SCALE: Synergized Collaboration of Asymmetric Language Translation Engines [105.8983433641208]
本稿では,コンパクトな特殊翻訳モデル (STM) と汎用大言語モデル (LLM) を1つの統合翻訳エンジンとして結合する協調フレームワークを提案する。 STMからの翻訳を3重項インコンテキストのデモに導入することで、SCALEはLLMの洗練とピボット能力を解放する。実験の結果,SCALEは低リソース環境において,少数ショットLLM (GPT-4) と特殊モデル (NLLB) の両方を著しく上回っていることがわかった。
論文参考訳（メタデータ） (2023-09-29T08:46:38Z)
Improving Translation Faithfulness of Large Language Models via Augmenting Instructions [89.76691340615848]
SWIE(Segment-Weighted Instruction Embedding)と命令追従データセットOVERMISSを提案する。 SWIEは、以下の入力および応答表現に大域的な命令表現を追加することにより、モデル命令理解を改善する。 OVERMISSは、オーバー翻訳とミス翻訳の結果を正しい翻訳と比較することにより、モデルの忠実度を向上させる。
論文参考訳（メタデータ） (2023-08-24T09:32:29Z)
Zero-Shot Cross-Lingual Summarization via Large Language Models [108.30673793281987]
言語間要約(CLS)は、異なる対象言語で要約を生成する。近年のLarge Language Models (LLMs) の出現は、計算言語学コミュニティから広く注目を集めている。本稿では,異なるパラダイムからゼロショットCLSを実行するために,LSMを誘導するために様々なプロンプトを経験的に使用した。
論文参考訳（メタデータ） (2023-02-28T01:27:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。