Fugu-MT 論文翻訳(概要): dzFinNlp at AraFinNLP: Improving Intent Detection in Financial Conversational Agents

論文の概要: dzFinNlp at AraFinNLP: Improving Intent Detection in Financial Conversational Agents

arxiv url: http://arxiv.org/abs/2407.13565v1
Date: Thu, 18 Jul 2024 14:37:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-19 15:00:55.951987
Title: dzFinNlp at AraFinNLP: Improving Intent Detection in Financial Conversational Agents
Title（参考訳）: AraFinNLPにおけるdzFinNlp: 金融対話エージェントにおけるインテント検出の改善
Authors: Mohamed Lichouri, Khaled Lounnas, Mohamed Zakaria Amziane,
Abstract要約: 本稿では、金融対話エージェントにおける意図検出へのdzFinNlpチームの貢献について述べる。我々の実験は有望な結果を示し、最良のモデルはArBanking77データセットで93.02%と67.21%のマイクロF1スコアを達成した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we present our dzFinNlp team's contribution for intent detection in financial conversational agents, as part of the AraFinNLP shared task. We experimented with various models and feature configurations, including traditional machine learning methods like LinearSVC with TF-IDF, as well as deep learning models like Long Short-Term Memory (LSTM). Additionally, we explored the use of transformer-based models for this task. Our experiments show promising results, with our best model achieving a micro F1-score of 93.02% and 67.21% on the ArBanking77 dataset, in the development and test sets, respectively.
Abstract（参考訳）: 本稿では、AraFinNLP共有タスクの一環として、金融対話エージェントにおける意図検出へのdzFinNlpチームの貢献を示す。 TF-IDFを使用したLinearSVCや、Long Short-Term Memory (LSTM)のようなディープラーニングモデルなど、さまざまなモデルや機能構成を実験しました。さらに,このタスクにおけるトランスフォーマーモデルの利用について検討した。我々の実験は、ArBanking77データセットでそれぞれ93.02%と67.21%のマイクロF1スコアを達成し、開発とテストセットで有望な結果を示した。

関連論文リスト

Advanced Data Collection Techniques in Cloud Security: A Multi-Modal Deep Learning Autoencoder Approach [0.0]
本研究では,多数のデータソースとモダリティをマルチモーダルなディープラーニングオートエンコーダと統合することにより,クラウドセキュリティに革新的な手法を提案する。提案設計では,MMDLA(Multi-Modal Deep Learning Autoencoder),ADAM(Adaptive Metric Learning)を用いた異常検出,ADADELTA,ADAGRAD,RMSPROP,Stacked Graph Transformer(SGT)の6つの深層学習モデルの優れた特徴を統合した。
論文参考訳（メタデータ） (2025-11-26T17:10:54Z)
Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs [111.69640966866059]
ミキチャー・オブ・エキスパート(MoE)と1兆近いパラメータを持つ疎大言語モデル(LLM)が、最も有能な言語モデルの領域を支配している。本稿では,Ascend NPU上でそのようなスケールを利用するレシピを明らかにすることを目的としている。主な目的は、動的スパースモデル構造下でのコンピューティングリソースのより良い使用と、実際のハードウェアで期待されるパフォーマンス向上の実現である。
論文参考訳（メタデータ） (2025-05-07T15:46:36Z)
ZiGong 1.0: A Large Language Model for Financial Credit [8.49779245416985]
大規模言語モデル (LLM) は様々な自然言語処理 (NLP) タスクにおいて高い性能を示している。しかし、金融信用評価の応用における効果は、依然として準最適である。マルチタスク制御による微調整により強化されたMistralベースのモデルであるZiGongを提案する。
論文参考訳（メタデータ） (2025-02-22T09:27:56Z)
High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。 2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2024-09-10T08:04:11Z)
DISC-FinLLM: A Chinese Financial Large Language Model based on Multiple Experts Fine-tuning [74.99318727786337]
金融大規模言語モデル(LLM)を構築するための多言語エキスパートファインチューニングフレームワークを提案する。 DISC-FIN-SFTという金融インストラクションチューニングデータセットを構築し、4つのカテゴリ(コンサルト、NLPタスク、コンピューティング、検索強化ジェネレーション)のインストラクションサンプルを含む。複数のベンチマークで評価した結果, 様々な財務シナリオにおいて, ベースラインモデルよりも優れた性能を示した。
論文参考訳（メタデータ） (2023-10-23T11:33:41Z)
Conversational Factor Information Retrieval Model (ConFIRM) [2.855224352436985]
ConFIRM(Conversational Factor Information Retrieval Method)は、ドメイン固有の検索タスクのための大規模言語モデル(LLM)を微調整する新しい手法である。本研究では、金融セクターにおけるケーススタディを通じて、パーソナライズされたデータを用いてLlama-2-7bモデルを微調整し、ConFIRMの有効性を実証する。結果のモデルでは、ファイナンシャルクエリの分類において91%の精度が達成され、NVIDIA A100 GPU上での平均推論時間は0.61秒であった。
論文参考訳（メタデータ） (2023-10-06T12:31:05Z)
The Languini Kitchen: Enabling Language Modelling Research at Different Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文参考訳（メタデータ） (2023-09-20T10:31:17Z)
An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文参考訳（メタデータ） (2023-04-28T15:43:21Z)
WHEN FLUE MEETS FLANG: Benchmarks and Large Pre-trained Language Model for Financial Domain [42.093876880881886]
ドメイン固有型金融LANGuageモデル(FLANG)を提案する。ファイナンシャルキーワードとフレーズを使用して、スパン境界目的とインフィリング目的ととともに、マスキングを改善する。私たちのモデル、コード、ベンチマークデータはGithubとHuggingfaceで公開されています。
論文参考訳（メタデータ） (2022-10-31T18:35:18Z)
Explored An Effective Methodology for Fine-Grained Snake Recognition [8.908667065576632]
我々は,様々なメタ情報を活用し,きめ細かい識別を支援するために,強力なマルチモーダルバックボーンを設計する。ラベルのないデータセットを最大限に活用するために,自己教師付き学習と教師付き学習共同学習を用いる。本手法は,個人用および公開用データセットにおいて,それぞれ92.7%,89.4%のマクロf1スコアを達成できる。
論文参考訳（メタデータ） (2022-07-24T02:19:15Z)
RoBLEURT Submission for the WMT2021 Metrics Task [72.26898579202076]
本稿では,共有メトリクスタスクであるRoBLEURTについて紹介する。我々のモデルは10対の英語言語対のうち8対でWMT 2020の人間のアノテーションと最先端の相関に達する。
論文参考訳（メタデータ） (2022-04-28T08:49:40Z)
FedNLP: A Research Platform for Federated Learning in Natural Language Processing [55.01246123092445]
NLPのフェデレーションラーニングのための研究プラットフォームであるFedNLPを紹介します。 FedNLPは、テキスト分類、シーケンスタグ付け、質問応答、Seq2seq生成、言語モデリングなど、NLPで一般的なタスクの定式化をサポートしている。 FedNLPによる予備実験では、分散型データセットと集中型データセットの学習には大きなパフォーマンスギャップが存在することが明らかになった。
論文参考訳（メタデータ） (2021-04-18T11:04:49Z)
Comparative Study of Language Models on Cross-Domain Data with Model Agnostic Explainability [0.0]
この研究は、最先端の言語モデルであるBERT、ELECTRAとその派生品であるRoBERTa、ALBERT、DistilBERTを比較した。実験結果は、2013年の格付けタスクとフィナンシャル・フレーズバンクの感情検出タスクの69%、そして88.2%の精度で、新たな最先端の「評価タスク」を確立した。
論文参考訳（メタデータ） (2020-09-09T04:31:44Z)
Gestalt: a Stacking Ensemble for SQuAD2.0 [0.0]
本稿では,文脈文中の質問に対する正しい回答を見つけ出し,提示する深層学習システムを提案する。我々のゴールは、各アンサンブルで最高のモデルを上回る異種SQuAD2.0モデルのアンサンブルを学習することである。
論文参考訳（メタデータ） (2020-04-02T08:09:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。