論文の概要: EHSAN: Leveraging ChatGPT in a Hybrid Framework for Arabic Aspect-Based Sentiment Analysis in Healthcare
- arxiv url: http://arxiv.org/abs/2508.02574v1
- Date: Mon, 04 Aug 2025 16:28:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.430281
- Title: EHSAN: Leveraging ChatGPT in a Hybrid Framework for Arabic Aspect-Based Sentiment Analysis in Healthcare
- Title(参考訳): EHSAN: 医療におけるアラビア語による知覚分析のためのハイブリッドフレームワークにおけるチャットGPTの活用
- Authors: Eman Alamoudi, Ellis Solaiman,
- Abstract要約: EHSANはデータ中心のハイブリッドパイプラインで、ChatGPTの擬似ラベリングと人間のレビューを融合して、医療のための最初の説明可能なアラビア語のアスペクトベースの感情データセットを構築する。
各文はアスペクトと感情ラベル(肯定的、否定的、中立的)で注釈付けされ、医療のテーマに沿った先駆的なアラビアのデータセットを形成する。
今後の方向性には、病院全体の一般化、迅速な改善、データ駆動モデリングの解釈などが含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Arabic-language patient feedback remains under-analysed because dialect diversity and scarce aspect-level sentiment labels hinder automated assessment. To address this gap, we introduce EHSAN, a data-centric hybrid pipeline that merges ChatGPT pseudo-labelling with targeted human review to build the first explainable Arabic aspect-based sentiment dataset for healthcare. Each sentence is annotated with an aspect and sentiment label (positive, negative, or neutral), forming a pioneering Arabic dataset aligned with healthcare themes, with ChatGPT-generated rationales provided for each label to enhance transparency. To evaluate the impact of annotation quality on model performance, we created three versions of the training data: a fully supervised set with all labels reviewed by humans, a semi-supervised set with 50% human review, and an unsupervised set with only machine-generated labels. We fine-tuned two transformer models on these datasets for both aspect and sentiment classification. Experimental results show that our Arabic-specific model achieved high accuracy even with minimal human supervision, reflecting only a minor performance drop when using ChatGPT-only labels. Reducing the number of aspect classes notably improved classification metrics across the board. These findings demonstrate an effective, scalable approach to Arabic aspect-based sentiment analysis (SA) in healthcare, combining large language model annotation with human expertise to produce a robust and explainable dataset. Future directions include generalisation across hospitals, prompt refinement, and interpretable data-driven modelling.
- Abstract(参考訳): アラビア語の患者からのフィードバックは、方言の多様性と少ないアスペクトレベルの感情ラベルが自動評価を妨げるため、まだ分析されていない。
このギャップに対処するため、私たちは、ChatGPTの擬似ラベリングと人間のレビューを融合したデータ中心のハイブリッドパイプラインであるEHSANを導入し、医療のための最初の説明可能なアラビアアスペクトベースの感情データセットを構築しました。
各文には、アスペクトと感情ラベル(肯定的、否定的、中立的)がアノテートされ、医療テーマに沿った先駆的なアラビアデータセットを形成し、各ラベルに対してChatGPT生成論理が提供され、透明性が向上する。
アノテーションの品質がモデル性能に与える影響を評価するため,人間によってレビューされた全てのラベルからなる完全教師付きセット,50%の人間がレビューする半教師付きセット,機械生成ラベルのみを含む教師なしセットの3種類のトレーニングデータを作成した。
アスペクト分類と感情分類の両方のために,これらのデータセット上で2つのトランスフォーマーモデルを微調整した。
実験結果から,ChatGPTのみのラベルを用いた場合のわずかな性能低下のみを反映し,人間の監督を最小限に抑えつつも,アラビア固有モデルの精度が向上したことが明らかとなった。
アスペクトクラスの数を減らすことで、ボード全体の分類基準が格段に向上した。
これらの結果は、医療におけるアラビア語のアスペクトベース感情分析(SA)に対する効果的でスケーラブルなアプローチを示し、大きな言語モデルアノテーションと人間の専門知識を組み合わせて、堅牢で説明可能なデータセットを作成する。
今後の方向性には、病院全体の一般化、迅速な改善、データ駆動モデリングの解釈などが含まれる。
関連論文リスト
- CrosGrpsABS: Cross-Attention over Syntactic and Semantic Graphs for Aspect-Based Sentiment Analysis in a Low-Resource Language [0.5937476291232802]
Aspect-Based Sentiment Analysis (ABSA) は自然言語処理の基本的なタスクであり、テキストで表現された意見に対するきめ細かい洞察を提供する。
本研究は,構文グラフとセマンティックグラフ間の双方向の相互アテンションを活用し,アスペクトレベルの感情分類を強化する新しいハイブリッドフレームワークであるCrosGrpsABSを提案する。
低リソースのBengali ABSAデータセットと高リソースのSemEval 2014 Task 4データセットでCrosGrpsABSを評価した。
論文 参考訳(メタデータ) (2025-05-25T07:42:32Z) - The Empirical Impact of Data Sanitization on Language Models [1.1359551336076306]
本稿では,複数のベンチマーク言語モデリングタスクにおけるデータ・サニタイズの効果を実証的に分析する。
以上の結果から,感情分析やエンテーメントなどのタスクでは,リアクションの影響は極めて低く,典型的には1~5%程度であることが示唆された。
理解的なQ&Aのようなタスクでは、オリジナルのものと比較して、再実行クエリで観測されるパフォーマンスの25%が大幅に低下している。
論文 参考訳(メタデータ) (2024-11-08T21:22:37Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - CARBD-Ko: A Contextually Annotated Review Benchmark Dataset for
Aspect-Level Sentiment Classification in Korean [3.2146698079532867]
本稿では,事前学習言語モデル(PLM)におけるアスペクトベース感情分類(ABSC)による課題について検討する。
本稿では、アスペクト固有とアスペクト非依存の感情分類を区別するために、アスペクトとデュアルタグの極性を組み込んだベンチマークデータセットであるCARBD-Koを紹介する。
実験結果から,両極性を正確に予測することの難しさを浮き彫りにし,文脈的感情分析モデルの重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-23T01:49:38Z) - Explore Spurious Correlations at the Concept Level in Language Models for Text Classification [28.832684088975622]
言語モデル(LM)は多くのNLPタスクで顕著な成功を収めた。
トレーニングデータやICLの実践者の不均衡なラベル分布から生じる急激な相関による堅牢性の問題に直面している。
本稿では,2つの主なコントリビューションを紹介する。まず,概念ラベルをテキストに割り当てるためにChatGPTを用い,テストデータ上での微調整時のモデルにおける概念バイアスやICLを評価する。
第2に,ChatGPT生成した反ファクトデータを組み込んだデータ再バランス手法を導入し,ラベル分布のバランスを保ち,突発的相関を緩和する。
論文 参考訳(メタデータ) (2023-11-15T01:58:54Z) - CBBQ: A Chinese Bias Benchmark Dataset Curated with Human-AI
Collaboration for Large Language Models [52.25049362267279]
本稿では,人的専門家と生成言語モデルによって共同で構築された100万以上の質問からなる中国語バイアスベンチマークデータセットを提案する。
データセットのテストインスタンスは、手作業による厳格な品質管理を備えた3K以上の高品質テンプレートから自動的に抽出される。
大規模な実験により、データセットがモデルバイアスを検出することの有効性が実証された。
論文 参考訳(メタデータ) (2023-06-28T14:14:44Z) - Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization [80.94424037751243]
ゼロショット多言語抽出テキスト要約では、通常、モデルは英語のデータセットに基づいて訓練され、他の言語の要約データセットに適用される。
本研究では,NLS(Neural Label Search for Summarization)を提案する。
我々はMLSUMとWikiLinguaのデータセット上で多言語ゼロショット要約実験を行い、人間と自動両方の評価を用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2022-04-28T14:02:16Z) - TextFlint: Unified Multilingual Robustness Evaluation Toolkit for
Natural Language Processing [73.16475763422446]
NLPタスク(TextFlint)のための多言語ロバスト性評価プラットフォームを提案する。
普遍的なテキスト変換、タスク固有の変換、敵攻撃、サブポピュレーション、およびそれらの組み合わせを取り入れ、包括的な堅牢性分析を提供する。
TextFlintは、モデルの堅牢性の欠点に対処するために、完全な分析レポートとターゲットとした拡張データを生成します。
論文 参考訳(メタデータ) (2021-03-21T17:20:38Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。