論文の概要: Exploring Subjective Tasks in Farsi: A Survey Analysis and Evaluation of Language Models
- arxiv url: http://arxiv.org/abs/2509.05719v1
- Date: Sat, 06 Sep 2025 13:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.668924
- Title: Exploring Subjective Tasks in Farsi: A Survey Analysis and Evaluation of Language Models
- Title(参考訳): Farsiにおける主観的課題の探索:言語モデルの分析と評価
- Authors: Donya Rooein, Flor Miriam Plaza-del-Arco, Debora Nozza, Dirk Hovy,
- Abstract要約: 本稿では,Farsiにおける3つの主観的課題(感情分析,感情分析,毒性検出)に焦点を当てた。
データ可用性の全体的な増加にもかかわらず、データの可用性と品質に大きな課題があります。
以上の結果から,NLPにおける言語の将来性を大幅に向上させるには,データの量は不十分であることが示唆された。
- 参考スコア(独自算出の注目度): 34.178266171488744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given Farsi's speaker base of over 127 million people and the growing availability of digital text, including more than 1.3 million articles on Wikipedia, it is considered a middle-resource language. However, this label quickly crumbles when the situation is examined more closely. We focus on three subjective tasks (Sentiment Analysis, Emotion Analysis, and Toxicity Detection) and find significant challenges in data availability and quality, despite the overall increase in data availability. We review 110 publications on subjective tasks in Farsi and observe a lack of publicly available datasets. Furthermore, existing datasets often lack essential demographic factors, such as age and gender, that are crucial for accurately modeling subjectivity in language. When evaluating prediction models using the few available datasets, the results are highly unstable across both datasets and models. Our findings indicate that the volume of data is insufficient to significantly improve a language's prospects in NLP.
- Abstract(参考訳): ファージの話者ベースが1億2700万人を超え、ウィキペディアの13万記事を含むデジタルテキストの入手が増加していることを考えると、この言語はミドルソース言語と見なされている。
しかし、このラベルは状況がより詳しく調べられるとすぐに崩れる。
我々は3つの主観的タスク(感情分析、感情分析、毒性検出)に注目し、データ可用性の全体的な増加にもかかわらず、データの可用性と品質に大きな課題を見出した。
我々は、Farsiにおける主観的なタスクに関する110の論文をレビューし、公開データセットの欠如を観察する。
さらに、既存のデータセットには、言語における主観性を正確にモデル化する上で不可欠な年齢や性別といった、重要な人口統計要因が欠如していることが多い。
利用可能な数少ないデータセットを使用して予測モデルを評価する場合、結果はデータセットとモデルの両方で非常に不安定である。
以上の結果から,NLPにおける言語の将来性を大幅に向上させるには,データの量は不十分であることが示唆された。
関連論文リスト
- Data Quality Issues in Multilingual Speech Datasets: The Need for Sociolinguistic Awareness and Proactive Language Planning [5.730241441689874]
一部の言語では、データセットは重要な品質問題に悩まされ、下流の評価結果を難なくする可能性がある。
マクロレベルの問題は、制度化されていない、しばしばリソース不足の言語でより一般的であることが分かりました。
今後のデータセット開発においてこれらの問題を緩和するためのガイドラインと勧告を提案する。
論文 参考訳(メタデータ) (2025-06-21T00:34:18Z) - The Empirical Impact of Data Sanitization on Language Models [1.1359551336076306]
本稿では,複数のベンチマーク言語モデリングタスクにおけるデータ・サニタイズの効果を実証的に分析する。
以上の結果から,感情分析やエンテーメントなどのタスクでは,リアクションの影響は極めて低く,典型的には1~5%程度であることが示唆された。
理解的なQ&Aのようなタスクでは、オリジナルのものと比較して、再実行クエリで観測されるパフォーマンスの25%が大幅に低下している。
論文 参考訳(メタデータ) (2024-11-08T21:22:37Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - The curse of language biases in remote sensing VQA: the role of spatial
attributes, language diversity, and the need for clear evaluation [32.7348470366509]
RSVQAの目的は、リモートセンシング画像に関する自然言語で定式化された質問に答えることである。
言語バイアスの問題はしばしばリモートセンシングコミュニティで見過ごされている。
本研究の目的は,RSVQAにおける言語バイアスの問題を3重解析戦略を用いて強調することである。
論文 参考訳(メタデータ) (2023-11-28T13:45:15Z) - When a Language Question Is at Stake. A Revisited Approach to Label
Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。
得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文 参考訳(メタデータ) (2023-11-17T13:35:10Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Zero- and Few-Shot Prompting with LLMs: A Comparative Study with Fine-tuned Models for Bangla Sentiment Analysis [6.471458199049549]
本研究では,33,606件のニュースツイートとFacebookコメントを含む手動注釈付きデータセットを提案する。
また,Flan-T5,GPT-4,Bloomzなどの言語モデルを用いて,ゼロショットと少数ショットのインコンテキスト学習についても検討した。
以上の結果から,モノリンガルトランスフォーマーに基づくモデルは,ゼロおよび少数ショットシナリオにおいても,他のモデルよりも一貫して優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-08-21T15:19:10Z) - Improving Classifier Training Efficiency for Automatic Cyberbullying
Detection with Feature Density [58.64907136562178]
言語支援の異なる特徴前処理手法を用いて特徴密度(FD)の有効性を検討した。
データセットの複雑さを推定することで、必要な実験の数を削減できると仮定する。
データセットの言語的複雑さの違いにより、言語的に支援された単語前処理の有効性を議論することが可能になる。
論文 参考訳(メタデータ) (2021-11-02T15:48:28Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - What Can We Learn from Collective Human Opinions on Natural Language
Inference Data? [88.90490998032429]
ChaosNLIは、集合HumAnオピニオンSを研究するための合計464,500のアノテーションを持つデータセットである。
このデータセットは、SNLIとMNLIの3,113例とAbductive-NLIの1,532例に対して、100のアノテーションを例に集めて作成されている。
論文 参考訳(メタデータ) (2020-10-07T17:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。