論文の概要: Text2Gender: A Deep Learning Architecture for Analysis of Blogger's Age
and Gender
- arxiv url: http://arxiv.org/abs/2305.08633v1
- Date: Mon, 15 May 2023 13:26:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 14:24:28.756799
- Title: Text2Gender: A Deep Learning Architecture for Analysis of Blogger's Age
and Gender
- Title(参考訳): Text2Gender: ブロガーの年齢と性別分析のためのディープラーニングアーキテクチャ
- Authors: Vishesh Thakur and Aneesh Tickoo
- Abstract要約: 本稿では,ブロガーの年齢と性別を予測するため,BERTに基づく分類手法を提案する。
年齢予測の精度は84.2%、性別予測の精度は86.32%である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning techniques have gained a lot of traction in the field of NLP
research. The aim of this paper is to predict the age and gender of an
individual by inspecting their written text. We propose a supervised BERT-based
classification technique in order to predict the age and gender of bloggers.
The dataset used contains 681284 rows of data, with the information of the
blogger's age, gender, and text of the blog written by them. We compare our
algorithm to previous works in the same domain and achieve a better accuracy
and F1 score. The accuracy reported for the prediction of age group was 84.2%,
while the accuracy for the prediction of gender was 86.32%. This study relies
on the raw capabilities of BERT to predict the classes of textual data
efficiently. This paper shows promising capability in predicting the
demographics of the author with high accuracy and can have wide applicability
across multiple domains.
- Abstract(参考訳): 深層学習技術はNLP研究の分野で大きな注目を集めている。
本研究の目的は,文章を検査することにより,個人の年齢と性別を予測することである。
本稿では,ブロガーの年齢と性別を予測するため,BERTに基づく分類手法を提案する。
使用するデータセットには681284行のデータが含まれており、ブロガーの年齢、性別、ブログのテキストに関する情報が含まれている。
我々は、アルゴリズムを同じ領域の前の作業と比較し、精度とF1のスコアを得る。
年齢層予測の精度は84.2%であり、性別予測の精度は86.32%であった。
本研究は,テキストデータのクラスを効率的に予測するBERTの生の能力に依存する。
本稿では,著者の人口動態を高い精度で予測し,複数の領域にまたがって適用可能であることを示す。
関連論文リスト
- The Impact of Debiasing on the Performance of Language Models in
Downstream Tasks is Underestimated [70.23064111640132]
我々は、幅広いベンチマークデータセットを用いて、複数の下流タスクのパフォーマンスに対するデバイアスの影響を比較した。
実験により、デバイアスの効果は全てのタスクにおいて一貫して見積もられていることが示されている。
論文 参考訳(メタデータ) (2023-09-16T20:25:34Z) - Text2Time: Transformer-based Article Time Period Prediction [0.11470070927586018]
本研究は,テキストの内容に基づいて,文章,特にニュース記事の出版時期を予測することの問題点を考察する。
私たちは、ニューヨーク・タイムズが60年以上にわたって発行した35万件以上のニュース記事のラベル付きデータセットを作成しました。
提案手法では,テキスト分類のタスク,特に時刻予測のために,事前訓練されたBERTモデルを用いている。
論文 参考訳(メタデータ) (2023-04-21T10:05:03Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Predicting article quality scores with machine learning: The UK Research
Excellence Framework [6.582887504429817]
正確性は、医学・物理科学ユニット・オブ・アセスメント(UoAs)と経済学で最も高い。
社会科学、数学、工学、芸術、人文科学、そしてUoAsの基準の上の予測精度は、より低いかゼロに近いものであった。
提案手法は,能動的学習戦略による精度の向上と,予測確率の高い記事の選択により,アルゴリズムによって推定される結果の予測回数を大幅に削減する。
論文 参考訳(メタデータ) (2022-12-11T05:45:12Z) - Gender Bias in Big Data Analysis [0.0]
性別予測ソフトウェアツールが歴史的ビッグデータ研究で使用されるとき、性別バイアスを測定する。
性別バイアスは、よく認識されたDBLPデータセットにおいて、個人が特定したコンピュータサイエンスの著者と対比することによって測定される。
論文 参考訳(メタデータ) (2022-11-17T20:13:04Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - LeQua@CLEF2022: Learning to Quantify [76.22817970624875]
LeQua 2022は、テキストデータセットで'を定量化する方法を評価するための新しい実験室である。
本研究の目的は、バイナリ設定とシングルラベルのマルチクラス設定の両方において、学習方法の比較評価のための設定を提供することである。
論文 参考訳(メタデータ) (2021-11-22T14:54:20Z) - Gender prediction using limited Twitter Data [0.0]
本稿では,ソーシャルメディア上でのジェンダー予測におけるBERT(単語埋め込み用トランスフォーマーモデル)の有用性について検討する。
オランダのBERTモデルは、性別をラベル付けしたオランダのTwitterデータセットの異なるサンプルに基づいて微調整される。
その結果、比較的少量のデータであっても、BERTを微調整してTwitterユーザーの性別を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2020-09-29T11:46:07Z) - Investigating Gender Bias in BERT [22.066477991442003]
我々は、感情や感情の強さの予測に関連する5つの下流タスクにおいて、それが引き起こすジェンダーバイアスを分析した。
本稿では,各BERT層に対する1つの主方向という,きめ細かい性別方向を求めるアルゴリズムを提案する。
実験により, 下流タスクにおけるBERT誘発バイアスの低減に成功していることがわかった。
論文 参考訳(メタデータ) (2020-09-10T17:38:32Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。