論文の概要: Gender Recognition in Informal and Formal Language Scenarios via
Transfer Learning
- arxiv url: http://arxiv.org/abs/2107.02759v1
- Date: Wed, 23 Jun 2021 15:32:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-11 11:34:03.558906
- Title: Gender Recognition in Informal and Formal Language Scenarios via
Transfer Learning
- Title(参考訳): トランスファーラーニングによるインフォーマル・フォーマル言語シナリオにおけるジェンダー認識
- Authors: Daniel Escobar-Grisales, Juan Camilo Vasquez-Correa, Juan Rafael
Orozco-Arroyave
- Abstract要約: テキストデータに基づく性別、年齢、場所、性格などの人口統計特性の認識と識別は、異なるマーケティング戦略を改善するのに役立つ。
本稿では,再帰的・畳み込み型ニューラルネットワークの利用と,非公式言語や形式言語で書かれた文書における性別認識のための伝達学習戦略を提案する。
- 参考スコア(独自算出の注目度): 11.048994919361034
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The interest in demographic information retrieval based on text data has
increased in the research community because applications have shown success in
different sectors such as security, marketing, heath-care, and others.
Recognition and identification of demographic traits such as gender, age,
location, or personality based on text data can help to improve different
marketing strategies. For instance it makes it possible to segment and to
personalize offers, thus products and services are exposed to the group of
greatest interest. This type of technology has been discussed widely in
documents from social media. However, the methods have been poorly studied in
data with a more formal structure, where there is no access to emoticons,
mentions, and other linguistic phenomena that are only present in social media.
This paper proposes the use of recurrent and convolutional neural networks, and
a transfer learning strategy for gender recognition in documents that are
written in informal and formal languages. Models are tested in two different
databases consisting of Tweets and call-center conversations. Accuracies of up
to 75\% are achieved for both databases. The results also indicate that it is
possible to transfer the knowledge from a system trained on a specific type of
expressions or idioms such as those typically used in social media into a more
formal type of text data, where the amount of data is more scarce and its
structure is completely different.
- Abstract(参考訳): テキストデータに基づく人口統計情報検索への関心は,セキュリティ,マーケティング,ヒースケアなどさまざまな分野において,アプリケーションが成功を収めていることから,研究コミュニティで高まっている。
テキストデータに基づく性別、年齢、場所、性格などの人口統計特性の認識と識別は、異なるマーケティング戦略を改善するのに役立つ。
例えば、オファーのセグメンテーションとパーソナライズを可能にすることで、製品やサービスを最も関心のあるグループに公開することができる。
この種の技術は、ソーシャルメディアの文書で広く議論されている。
しかし、これらの手法は、ソーシャルメディアにしか存在しないエモティコン、言及、その他の言語現象へのアクセスがない、より形式的な構造を持つデータで研究されていない。
本稿では,再帰的・畳み込み型ニューラルネットワークと,非公式言語と形式言語で書かれた文書における性別認識のための伝達学習戦略を提案する。
モデルは、ツイートとコールセンター会話からなる2つの異なるデータベースでテストされる。
両方のデータベースで最大75\%のアキュラティが達成される。
また、ソーシャルメディアで一般的に使用されるような特定の表現やイディオムに基づいて訓練されたシステムから、より形式的なテキストデータに知識を移すことも可能であり、データ量が少なく、構造が完全に異なることを示している。
関連論文リスト
- The Echoes of the 'I': Tracing Identity with Demographically Enhanced Word Embeddings [0.0]
アイデンティティは社会科学において最もよく研究されている構成要素の1つである。
本稿では,社会デミノグラフィ情報を用いた単語埋め込みの強化によるアイデンティティ研究の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2024-06-29T06:59:35Z) - MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts [0.6053347262128919]
MultiSocial データセットには 472,097 のテキストが含まれており、そのうち約58k が人文で書かれている。
このベンチマークを用いて、ゼロショットの既存の検出手法と微調整形式を比較した。
以上の結果から,微調整された検出器はソーシャルメディア上でのトレーニングに問題はないことが示唆された。
論文 参考訳(メタデータ) (2024-06-18T12:26:09Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Exploring Fake News Detection with Heterogeneous Social Media Context
Graphs [4.2177790395417745]
フェイクニュースの検出は、社会全体に直接的な影響を与えるため、純粋に学術的な関心を超える研究領域となっている。
本稿では,ニュース記事を取り巻く異質なソーシャルコンテキストグラフを構築し,問題をグラフ分類タスクとして再構築することを提案する。
論文 参考訳(メタデータ) (2022-12-13T13:29:47Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - A Multi-input Multi-output Transformer-based Hybrid Neural Network for
Multi-class Privacy Disclosure Detection [3.04585143845864]
本稿では,伝達学習,言語学,メタデータを用いて隠れパターンを学習するマルチインプット・マルチアウトプットハイブリッドニューラルネットワークを提案する。
我々は,5,400のツイートを含む人間の注釈付き真実データセットを用いて,我々のモデルを訓練し,評価した。
論文 参考訳(メタデータ) (2021-08-19T03:58:49Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - TopicBERT: A Transformer transfer learning based memory-graph approach
for multimodal streaming social media topic detection [8.338441212378587]
急激な短いメッセージと、様々なトピックにまたがる大規模なデータスケールを持つソーシャルネットワークは、多くの研究者の関心を集めている。
ビッグデータの5'Vとして知られるこれらのソーシャルネットワークの特性は、大規模なソーシャルネットワークデータセットやデータストリームに適用される多くのユニークで啓蒙的なアルゴリズムやテクニックを生み出している。
論文 参考訳(メタデータ) (2020-08-16T10:39:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。