論文の概要: Personal-ITY: A Novel YouTube-based Corpus for Personality Prediction in
Italian
- arxiv url: http://arxiv.org/abs/2011.05688v1
- Date: Wed, 11 Nov 2020 10:51:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:58:01.683876
- Title: Personal-ITY: A Novel YouTube-based Corpus for Personality Prediction in
Italian
- Title(参考訳): パーソナリティ: イタリア語でパーソナリティを予測するYouTubeベースの新しいコーパス
- Authors: Elisa Bassignana, Malvina Nissim and Viviana Patti
- Abstract要約: 本稿では,イタリア語における人格予測のための新しいコーパスについて述べる。
コーパスはDistant Supervisionを利用して構築されており、Myers-Briggs Type Indicator (MBTI) ラベルをYouTubeコメントに割り当て、さまざまな実験を行うことができる。
今後の作業のベースラインとして機能するパーソナリティに関する予備実験について報告し、いくつかのタイプが他よりも予測し易いことを示すとともに、データセット間の予測のパークについて論じる。
- 参考スコア(独自算出の注目度): 11.38723572165938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel corpus for personality prediction in Italian, containing a
larger number of authors and a different genre compared to previously available
resources. The corpus is built exploiting Distant Supervision, assigning
Myers-Briggs Type Indicator (MBTI) labels to YouTube comments, and can lend
itself to a variety of experiments. We report on preliminary experiments on
Personal-ITY, which can serve as a baseline for future work, showing that some
types are easier to predict than others, and discussing the perks of
cross-dataset prediction.
- Abstract(参考訳): 本稿では,これまでに入手した資料に比べて多くの著者と異なるジャンルを含む,イタリア語におけるパーソナリティ予測のための新しいコーパスを提案する。
コーパスはDistant Supervisionを利用して構築されており、Myers-Briggs Type Indicator (MBTI) ラベルをYouTubeコメントに割り当て、さまざまな実験を行うことができる。
我々は,将来の作業のベースラインとして機能する個人性に関する予備実験について報告し,いくつかのタイプは他よりも予測が容易であることを示すとともに,データセット横断予測の要点について議論する。
関連論文リスト
- Reddit is all you need: Authorship profiling for Romanian [49.1574468325115]
著者プロファイリング(英: Authorship profiling)とは、著者の著作に基づいて著者の特徴を特定する過程である。
本稿では,ルーマニア語における短いテキストのコーパスについて紹介する。
論文 参考訳(メタデータ) (2024-10-13T16:27:31Z) - Is Personality Prediction Possible Based on Reddit Comments? [0.0]
本研究では,人物の性格型と書いた文章の関連性について検討する。
これを実現するため、著者のMyers-Briggs Type Indicator (MBTI)にラベル付けされたRedditコメントのデータセットを集約し、BERTに基づいて異なる教師付き分類器を構築し、著者の性格をテキストで予測しようとした。
論文 参考訳(メタデータ) (2024-08-28T18:43:07Z) - Humans and language models diverge when predicting repeating text [52.03471802608112]
我々は,人間とLMのパフォーマンスが分岐するシナリオを提示する。
人間とGPT-2 LMの予測はテキストスパンの最初のプレゼンテーションで強く一致しているが、メモリが役割を担い始めると、その性能は急速にバラバラになる。
このシナリオが,LMを人間の行動に近づける上で,今後の作業に拍車をかけることを期待しています。
論文 参考訳(メタデータ) (2023-10-10T08:24:28Z) - Testing the Predictions of Surprisal Theory in 11 Languages [77.45204595614]
本研究では,11言語における副次的時間と読解時間の関係について検討する。
より多様な言語に焦点をあてることで、これらの結果は、情報理論と言語間のインクリメンタル言語処理の最も堅牢なリンクを提供すると論じる。
論文 参考訳(メタデータ) (2023-07-07T15:37:50Z) - Myers-Briggs personality classification from social media text using
pre-trained language models [0.0]
本稿では, MBTI分類を行うために, BERTモデルによる双方向表現を微調整した一連の実験について述べる。
本研究の主目的は, 単語のバッグや静的な単語の埋め込みなどに基づいて, テキスト分類モデルの性能を著しく向上させることである。
論文 参考訳(メタデータ) (2022-07-10T14:38:09Z) - Square One Bias in NLP: Towards a Multi-Dimensional Exploration of the
Research Manifold [88.83876819883653]
我々は、最近のNLP研究論文のマニュアル分類を通して、これが事実であることを示す。
NLP研究は正方形ではなく、精度だけでなく、公平性や解釈可能性にも焦点をあてる。
論文 参考訳(メタデータ) (2022-06-20T13:04:23Z) - Exploring Personality and Online Social Engagement: An Investigation of
MBTI Users on Twitter [0.0]
自称マイアーズ・ブリッグス性格特性(MBTI)を用いたTwitterのプロフィール3848件について検討する。
我々は、ディープラーニングに基づく最先端のNLPアーキテクチャであるBERTを利用して、タスクに最も予測力を持つさまざまなテキストソースを分析します。
MBTIシステムの全次元に対して, 伝記, ステータス, お気に入りツイートが有意な予測力を持っていることがわかった。
論文 参考訳(メタデータ) (2021-09-14T02:26:30Z) - DOCENT: Learning Self-Supervised Entity Representations from Large
Document Collections [18.62873757515885]
本稿では、大量の関連テキストからリッチな自己教師型エンティティ表現を学習する。
事前学習すると、これらのモデルは、ランク付けされた検索、知識ベース補完、質問応答など、複数のエンティティ中心のタスクに適用できる。
我々は,従来のアプローチとは異なり,単語や実体を共同で予測する訓練戦略をいくつか提示する。
論文 参考訳(メタデータ) (2021-02-26T01:00:12Z) - Matching Theory and Data with Personal-ITY: What a Corpus of Italian
YouTube Comments Reveals About Personality [11.38723572165938]
私たちはイタリア語でYouTubeコメントの新しいコーパスを作成し、そこでは作家が個性的な特徴をラベル付けしている。
この特徴はMBTIという心理学研究における主要な個性理論の1つに由来する。
本研究は, TwiStyだけでなく, コーパス上での個性予測の課題について検討する。
論文 参考訳(メタデータ) (2020-11-11T12:45:33Z) - Pre-training Multilingual Neural Machine Translation by Leveraging
Alignment Information [72.2412707779571]
mRASPは、汎用多言語ニューラルマシン翻訳モデルを事前訓練するためのアプローチである。
我々は,低,中,豊かな資源を含む多種多様な環境における42の翻訳方向の実験を行い,エキゾチックな言語対への変換を行った。
論文 参考訳(メタデータ) (2020-10-07T03:57:54Z) - Intrinsic Probing through Dimension Selection [69.52439198455438]
現代のほとんどのNLPシステムは、様々なタスクにおいて驚くほど高いパフォーマンスが得られる事前訓練された文脈表現を使用している。
このような高いパフォーマンスは、ある種の言語構造がこれらの表現に根ざしない限りはあり得ず、それを探究する研究が盛んに行われている。
本稿では,言語情報が表現内でどのように構造化されているかを示す内在的探索と,先行研究で広く普及している外在的探索とを区別し,抽出に成功したことを示すことによって,そのような情報の存在を主張するのみである。
論文 参考訳(メタデータ) (2020-10-06T15:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。