論文の概要: HyperPersona: A Multi-Level Hypergraph Framework for Text-Based Automatic Personality Prediction
- arxiv url: http://arxiv.org/abs/2605.17355v1
- Date: Sun, 17 May 2026 09:49:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.916671
- Title: HyperPersona: A Multi-Level Hypergraph Framework for Text-Based Automatic Personality Prediction
- Title(参考訳): HyperPersona: テキストベースの自動パーソナリティ予測のためのマルチレベルハイパーグラフフレームワーク
- Authors: Sina Heydari, Majid Ramezani,
- Abstract要約: テキストベースの自動パーソナリティ予測(APP)は、言語行動からパーソナリティを推測する。
ハイパーグラフ構造を通じてテキスト(文書,文,単語)の階層構造を明示的にモデル化するフレームワークであるHyperPersonaを提案する。
我々は,HyperPersonaがマルチレベル言語的手がかりを効果的に統合し,最先端のベースラインよりも優れた性能を実現していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a modern commodity, language has become a vast repository of socially and psychologically significant traits and concepts, reflecting the ways people encode pattern of thoughts, behaviors, and emotions into words. Text-based Automatic Personality Prediction (APP), seeks to infer personality from linguistic behavior, offering a scalable alternative to traditional psychometric assessments. Although text is inherently hierarchical, with the document-level capturing global features, the sentence-level encoding local semantics, and the word-level providing fine-grained lexical information, most existing approaches rely on shallow, sequential, or single-level representations that ignore the multi-level structure of written language. To address this, we propose HyperPersona, a framework that explicitly models the hierarchical organization of text (document, sentence, and word) through hypergraph structure, where a document and its sentences are represented as hyperedges, and the words are represented as nodes, enabling joint modeling of global, local, and lexical dependencies of text. Followed by a transformer-based graph encoder that learns interactions within and across these linguistic layers, yielding context-sensitive and structurally grounded feature representations for personality prediction. Experiments on the Big Five personality dimensions show that, while relying solely on text, HyperPersona effectively integrates multi-level linguistic cues, achieving superior performance compared to state-of-the-art baselines. These findings underscore the critical role of textual hierarchy in advancing human-like personality inference from natural language.
- Abstract(参考訳): 現代の商品として、言語は、人々が思考、行動、感情のパターンを言葉にエンコードする方法を反映して、社会的、心理的に重要な特徴と概念の広大なリポジトリになっている。
テキストベースの自動パーソナリティ予測(APP)は、言語行動からパーソナリティを推定し、従来の心理測定アセスメントに代わるスケーラブルな代替手段を提供する。
テキストは本質的に階層的であるが、文書レベルでのグローバルな特徴、局所的な意味論を符号化する文レベル、そして単語レベルでの詳細な語彙情報を提供するが、既存のアプローチのほとんどは、筆記言語のマルチレベル構造を無視した浅い、シーケンシャル、あるいは単一レベルの表現に依存している。
そこで本研究では,文書とその文をハイパーエッジとして表現し,単語をノードとして表現することで,テキストのグローバル,ローカル,レキシカルな依存関係のモデリングを可能にするハイパーグラフ構造を通じて,テキストの階層的構造(文書,文,単語)を明示的にモデル化するフレームワークであるHyperPersonaを提案する。
これらの言語層間の相互作用を学習するトランスフォーマーベースのグラフエンコーダによって追跡され、パーソナリティ予測のための文脈に敏感で構造的な特徴表現が生成される。
ビッグファイブの人格次元の実験では、ハイパーペルソナはテキストのみに頼っているものの、多水準の言語的手がかりを効果的に統合し、最先端のベースラインよりも優れたパフォーマンスを実現している。
これらの知見は、自然言語から人間のような人格推論を推し進める上で、テキスト階層の重要性を浮き彫りにした。
関連論文リスト
- Human vs. Machine Deception: Distinguishing AI-Generated and Human-Written Fake News Using Ensemble Learning [0.13999481573773068]
本研究では,人書きニュースとAI生成フェイクニュースの言語的,構造的,感情的差異について検討する。
文書レベルの特徴表現は、文構造、語彙の多様性、句読点パターン、可読性指標、感情に基づく特徴を用いて構成される。
その結果,可読性に基づく特徴が最も有意義な予測因子として出現し,信頼性と一貫した分類性能が示された。
論文 参考訳(メタデータ) (2026-04-10T23:51:28Z) - HIPPD: Brain-Inspired Hierarchical Information Processing for Personality Detection [15.590715592593535]
テキストからのパーソナリティ検出は、言語パターンに基づいて個人の性格特性を推測することを目的としている。
本稿では,ヒト脳の階層的情報処理をエミュレートする人格検出フレームワークであるHIPPDを提案する。
論文 参考訳(メタデータ) (2025-10-10T22:20:35Z) - Hierarchical Text-to-Vision Self Supervised Alignment for Improved Histopathology Representation Learning [64.1316997189396]
病理組織像のための新しい言語型自己教師学習フレームワーク,階層型言語型自己監督(HLSS)を提案する。
その結果,OpenSRH と TCGA の2つの医用画像ベンチマークにおいて,最先端の性能が得られた。
論文 参考訳(メタデータ) (2024-03-21T17:58:56Z) - Threads of Subtlety: Detecting Machine-Generated Texts Through Discourse Motifs [19.073560504913356]
人造テキストと機械生成テキストの境界線は、ますますぼやけつつある。
本稿は,人間によって書かれたテキストにおいて,識別可能な言語的特徴と独特な言語的特性を識別する調査について述べる。
論文 参考訳(メタデータ) (2024-02-16T11:20:30Z) - Personalized Text Generation with Fine-Grained Linguistic Control [9.668216418094316]
複数の言語的次元にまたがる微粒な属性の制御に焦点をあてる。
生成モデルを訓練するための新しいベンチマークを導入し、パーソナライズされたテキストを生成する能力を評価する。
論文 参考訳(メタデータ) (2024-02-07T14:41:08Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language
Representations [51.08119762844217]
SenteConは、深層言語表現に人間の解釈可能性を導入する方法である。
SenteConは、下流タスクにおける予測性能にほとんど、あるいは全くコストをかからない高レベルな解釈性を提供する。
論文 参考訳(メタデータ) (2023-05-24T05:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。