論文の概要: An Enhanced Text Classification to Explore Health based Indian
Government Policy Tweets
- arxiv url: http://arxiv.org/abs/2007.06511v2
- Date: Tue, 18 Aug 2020 12:37:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 22:47:48.909198
- Title: An Enhanced Text Classification to Explore Health based Indian
Government Policy Tweets
- Title(参考訳): 健康ベースのインド政府の政策ツイートを探索するテキスト分類の強化
- Authors: Aarzoo Dhiman and Durga Toshniwal
- Abstract要約: そこで本稿では,Twitter のさまざまな保健制度の分類を改良したテキスト分類フレームワークを提案する。
そこで我々は,新しいGloVe単語埋め込みとクラス固有の感情に基づくテキスト拡張手法(Mod-EDA)を提案する。
- 参考スコア(独自算出の注目度): 2.2082422928825136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Government-sponsored policy-making and scheme generations is one of the means
of protecting and promoting the social, economic, and personal development of
the citizens. The evaluation of effectiveness of these schemes done by
government only provide the statistical information in terms of facts and
figures which do not include the in-depth knowledge of public perceptions,
experiences and views on the topic. In this research work, we propose an
improved text classification framework that classifies the Twitter data of
different health-based government schemes. The proposed framework leverages the
language representation models (LR models) BERT, ELMO, and USE. However, these
LR models have less real-time applicability due to the scarcity of the ample
annotated data. To handle this, we propose a novel GloVe word embeddings and
class-specific sentiments based text augmentation approach (named Mod-EDA)
which boosts the performance of text classification task by increasing the size
of labeled data. Furthermore, the trained model is leveraged to identify the
level of engagement of citizens towards these policies in different communities
such as middle-income and low-income groups.
- Abstract(参考訳): 政府による政策作成と計画の世代は、市民の社会的、経済的、個人的発展を保護し、促進する手段の1つである。
政府によるこれらのスキームの有効性の評価は、公共の認識、経験、見解の深い知識を含まない事実や数字の観点でのみ統計情報を提供する。
本研究では,様々な保健制度のtwitterデータを分類するための改良されたテキスト分類フレームワークを提案する。
提案するフレームワークは,言語表現モデル(LRモデル)BERT,ELMO,USEを利用する。
しかし,これらのLRモデルはアノテートデータが少ないため,リアルタイム適用性が低い。
そこで本研究では,ラベル付きデータのサイズを増大させることでテキスト分類タスクの性能を向上させる,新しいGloVe単語埋め込みとクラス固有の感情に基づくテキスト拡張アプローチ(Mod-EDA)を提案する。
さらに、訓練されたモデルは、中所得層や低所得層などの異なるコミュニティにおけるこれらの政策に対する市民の関与のレベルを特定するために活用される。
関連論文リスト
- "We Demand Justice!": Towards Social Context Grounding of Political
Texts [22.016345507132808]
ソーシャルメディアの談話は、しばしば「政治的スペクトルの対立する側が使用する、見事に類似した言語」で構成されている。
本稿では、そのような曖昧な文を計算環境で完全に理解するために必要なコンテキストを定義する。
本論文では,テキストの現実的コンテキストを理解する必要がある2つの挑戦的データセットを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:53:35Z) - A Unique Training Strategy to Enhance Language Models Capabilities for
Health Mention Detection from Social Media Content [6.053876125887214]
ソーシャルメディアから健康関連コンテンツを抽出することは、様々なタイプのアプリケーションの開発に有用である。
この欠点の主な理由は、ソーシャルメディア利用者が一般的に使用する標準化されていない書き込みスタイルにある。
鍵となるゴールは、ランダムな重み付き摂動と対照的な学習戦略を取り入れることによって達成される。
ソーシャルメディアテキストの投稿を非健康・健康関連クラスに識別するための5つの異なる言語モデルの利点を享受するメタ予測器を提案する。
論文 参考訳(メタデータ) (2023-10-29T16:08:33Z) - Bias and Fairness in Large Language Models: A Survey [76.65471160523444]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - FLIRT: Feedback Loop In-context Red Teaming [71.38594755628581]
我々は、与えられたモデルを評価し、その脆弱性を明らかにする自動レッドチーム化フレームワークを提案する。
私たちのフレームワークは、レッドチームモデルに対するフィードバックループでコンテキスト内学習を使用し、それらを安全でないコンテンツ生成にトリガーします。
論文 参考訳(メタデータ) (2023-08-08T14:03:08Z) - DeAR: Debiasing Vision-Language Models with Additive Residuals [5.672132510411465]
大規模な事前学習型視覚言語モデル(VLM)は、リッチで適応可能な画像とテキスト表現を提供する。
これらのモデルは、トレーニングデータ中の様々なアイデンティティ群が歪んだ分布のため、社会的バイアスに悩まされる。
本稿では,元の表現をオフセットする付加的残像表現を学習する新しいデバイアス法であるDeARを提案する。
論文 参考訳(メタデータ) (2023-03-18T14:57:43Z) - Verifying the Robustness of Automatic Credibility Assessment [79.08422736721764]
テキスト分類法は信頼性の低い内容を検出する手段として広く研究されている。
入力テキストの無意味な変更は、モデルを誤解させることがある。
偽情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAを紹介する。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Toward Fairness in Text Generation via Mutual Information Minimization
based on Importance Sampling [23.317845744611375]
そこで本研究では,生成した文のセマンティクスと人口極性との間の相互情報の最小化を提案する。
このように、人口集団の言及は、生成したテキストに記述される方法から独立することが奨励される。
また, 脱バイアス後のPLMの言語モデリング能力を維持する蒸留機構を提案する。
論文 参考訳(メタデータ) (2023-02-25T18:29:02Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - Towards Understanding and Mitigating Social Biases in Language Models [107.82654101403264]
大規模事前訓練言語モデル(LM)は、望ましくない表現バイアスを示すのに潜在的に危険である。
テキスト生成における社会的バイアスを軽減するためのステップを提案する。
我々の経験的結果と人的評価は、重要な文脈情報を保持しながらバイアスを緩和する効果を示す。
論文 参考訳(メタデータ) (2021-06-24T17:52:43Z) - Towards Debiasing Sentence Representations [109.70181221796469]
Sent-Debiasはバイアスを取り除くのに有効であり、同時に文レベルの下流タスクのパフォーマンスを保っていることを示す。
我々は、より公平なNLPのための広く採用されている文表現から社会的偏見を識別・除去する今後の研究に刺激を与えることを期待している。
論文 参考訳(メタデータ) (2020-07-16T04:22:30Z) - Adapting Deep Learning for Sentiment Classification of Code-Switched
Informal Short Text [1.6752182911522517]
コードスイッチによる非公式テキストの感情分類のために,MultiSentiというラベル付きデータセットを提案する。
コードスイッチトされた非公式短文の感情分類のための深層学習に基づくモデルを提案する。
論文 参考訳(メタデータ) (2020-01-04T06:31:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。