論文の概要: CIKMar: A Dual-Encoder Approach to Prompt-Based Reranking in Educational Dialogue Systems
- arxiv url: http://arxiv.org/abs/2408.08805v1
- Date: Fri, 16 Aug 2024 15:29:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-19 15:03:59.326416
- Title: CIKMar: A Dual-Encoder Approach to Prompt-Based Reranking in Educational Dialogue Systems
- Title(参考訳): CIKMar:教育対話システムにおけるプロンプトに基づく再ランク付けのためのデュアルエンコーダアプローチ
- Authors: Joanito Agili Lopo, Marina Indah Prasasti, Alma Permatasari,
- Abstract要約: Gemma言語モデルを用いた教育対話システムに対する効果的なアプローチであるCIKMarを紹介する。
BERTScoreメトリクスを用いて,CIKMarが堅牢なリコールを実現し,F1スコアが0.70となった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we introduce CIKMar, an efficient approach to educational dialogue systems powered by the Gemma Language model. By leveraging a Dual-Encoder ranking system that incorporates both BERT and SBERT model, we have designed CIKMar to deliver highly relevant and accurate responses, even with the constraints of a smaller language model size. Our evaluation reveals that CIKMar achieves a robust recall and F1-score of 0.70 using BERTScore metrics. However, we have identified a significant challenge: the Dual-Encoder tends to prioritize theoretical responses over practical ones. These findings underscore the potential of compact and efficient models like Gemma in democratizing access to advanced educational AI systems, ensuring effective and contextually appropriate responses.
- Abstract(参考訳): 本研究では,Gemma言語モデルを用いた教育対話システムに対する効果的なアプローチであるCIKMarを紹介する。
BERTモデルとSBERTモデルの両方を組み込んだDual-Encoderランキングシステムを利用して、より小さな言語モデルサイズの制約があっても、高い関連性と正確な応答を提供するCIKMarを設計した。
BERTScoreメトリクスを用いて,CIKMarが堅牢なリコールを実現し,F1スコアが0.70となった。
しかし、我々は重要な課題を特定した。デュアルエンコーダは実際よりも理論的な応答を優先する傾向がある。
これらの発見は、高度な教育AIシステムへのアクセスを民主化し、効果的で文脈的に適切な応答を確実にするGemmaのようなコンパクトで効率的なモデルの可能性を強調している。
関連論文リスト
- DARA: Decomposition-Alignment-Reasoning Autonomous Language Agent for Question Answering over Knowledge Graphs [70.54226917774933]
本稿では,DARA(Decomposition Alignment-Reasoning Agent)フレームワークを提案する。
DARAは2つのメカニズムを通じて、質問を形式的なクエリに効果的に解析する。
我々は,DARAがKGQAの最先端列挙およびランク付けに基づく手法に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2024-06-11T09:09:37Z) - Semi-Supervised Knowledge-Grounded Pre-training for Task-Oriented Dialog
Systems [25.164042288343683]
半教師付き/強化TODシステム構築における最初の課題である,SereTOD 2022 チャレンジのトラック2のモデルを提案する。
我々は,対話履歴とローカルKBを入力として定式化し,システム応答を予測するための知識基底ダイアログモデルを構築した。
また,ラベル付きデータとラベルなしデータの両方で,半教師付き事前学習を行う。
論文 参考訳(メタデータ) (2022-10-17T09:10:03Z) - Integrate Lattice-Free MMI into End-to-End Speech Recognition [87.01137882072322]
音声認識(ASR)研究において、識別基準はDNN-HMMシステムにおいて優れた性能を達成している。
このモチベーションにより、差別的基準の採用は、エンドツーエンド(E2E)のASRシステムの性能を高めることを約束している。
これまでの研究は、最小ベイズリスク(MBR、差別基準の一つ)をE2E ASRシステムに導入してきた。
本研究では,他の広く使われている識別基準であるLF-MMIをE2Eに統合する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-29T14:32:46Z) - Weakly Supervised Semantic Segmentation via Alternative Self-Dual
Teaching [82.71578668091914]
本稿では,分類とマスク・リファインメント・コンポーネントを統合された深層モデルに組み込む,コンパクトな学習フレームワークを確立する。
本稿では,高品質な知識相互作用を促進するために,新たな自己双対学習(ASDT)機構を提案する。
論文 参考訳(メタデータ) (2021-12-17T11:56:56Z) - Sequence-level self-learning with multiple hypotheses [53.04725240411895]
我々は、自動音声認識(ASR)のためのアテンションベースシーケンス・ツー・シーケンス(seq2seq)モデルを用いた新しい自己学習手法を開発した。
従来の教師なし学習手法とは対照的に,我々はEmphmulti-task Learning(MTL)フレームワークを採用する。
実験の結果,本手法は,英語データのみを用いてトレーニングしたベースラインモデルと比較して,英文音声データのWERを14.55%から10.36%に削減できることがわかった。
論文 参考訳(メタデータ) (2021-12-10T20:47:58Z) - Consistent Training and Decoding For End-to-end Speech Recognition Using
Lattice-free MMI [67.13999010060057]
本稿では,LF-MMI基準をE2E ASRフレームワークに統合する新たな手法を提案する。
LF-MMI基準の導入は、一貫して大きなパフォーマンス改善をもたらすことが実験的に示唆されている。
論文 参考訳(メタデータ) (2021-12-05T07:30:17Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - MinTL: Minimalist Transfer Learning for Task-Oriented Dialogue Systems [75.43457658815943]
タスク指向対話システムのシステム設計プロセスを簡単にするミニマリスト変換学習(MinTL)を提案する。
MinTLはシンプルだが効果的な転送学習フレームワークであり、事前訓練されたSeq2seqモデルのプラグインと再生を可能にする。
トレーニング済みの2つのバックボーン(T5とBART)で学習フレームワークをインスタンス化し、MultiWOZで評価する。
論文 参考訳(メタデータ) (2020-09-25T02:19:13Z) - An Effective End-to-End Modeling Approach for Mispronunciation Detection [12.113290059233977]
誤認識検出タスクに対するCTCAttention(CTCAttention)アプローチの新たな利用法を提案する。
また,テキストプロンプト情報による入力拡張を行い,結果のE2EモデルをMDタスクに適したものにする。
一連のマンダリンMD実験は、我々のアプローチが体系的および実質的な性能改善をもたらすことを示した。
論文 参考訳(メタデータ) (2020-05-18T03:37:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。