論文の概要: Can x2vec Save Lives? Integrating Graph and Language Embeddings for
Automatic Mental Health Classification
- arxiv url: http://arxiv.org/abs/2001.01126v1
- Date: Sat, 4 Jan 2020 20:56:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 12:31:25.718707
- Title: Can x2vec Save Lives? Integrating Graph and Language Embeddings for
Automatic Mental Health Classification
- Title(参考訳): x2vecは生きられるか?
自動メンタルヘルス分類のためのグラフと言語埋め込みの統合
- Authors: Alexander Ruch
- Abstract要約: グラフと言語の埋め込みモデル(metapath2vec と doc2vec)がリソース制限を回避する方法を示します。
統合されると、両データは高度に正確な予測を生成する(90%、偽陽性10%、偽陰性12%)。
これらの結果は、大規模ネットワークにおける行動と言語を同時に分析することの重要性の研究を拡大する。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph and language embedding models are becoming commonplace in large scale
analyses given their ability to represent complex sparse data densely in
low-dimensional space. Integrating these models' complementary relational and
communicative data may be especially helpful if predicting rare events or
classifying members of hidden populations - tasks requiring huge and sparse
datasets for generalizable analyses. For example, due to social stigma and
comorbidities, mental health support groups often form in amorphous online
groups. Predicting suicidality among individuals in these settings using
standard network analyses is prohibitive due to resource limits (e.g., memory),
and adding auxiliary data like text to such models exacerbates complexity- and
sparsity-related issues. Here, I show how merging graph and language embedding
models (metapath2vec and doc2vec) avoids these limits and extracts unsupervised
clustering data without domain expertise or feature engineering. Graph and
language distances to a suicide support group have little correlation (\r{ho} <
0.23), implying the two models are not embedding redundant information. When
used separately to predict suicidality among individuals, graph and language
data generate relatively accurate results (69% and 76%, respectively); however,
when integrated, both data produce highly accurate predictions (90%, with 10%
false-positives and 12% false-negatives). Visualizing graph embeddings
annotated with predictions of potentially suicidal individuals shows the
integrated model could classify such individuals even if they are positioned
far from the support group. These results extend research on the importance of
simultaneously analyzing behavior and language in massive networks and efforts
to integrate embedding models for different kinds of data when predicting and
classifying, particularly when they involve rare events.
- Abstract(参考訳): グラフおよび言語埋め込みモデルは、低次元空間において複雑なスパースデータを密に表現する能力から、大規模解析において一般的なものになりつつある。
これらのモデルの補完的なリレーショナルデータとコミュニケーティブデータを統合することは、レアイベントの予測や隠れた集団のメンバの分類において特に有用である。
例えば、社会的汚名と共生のため、メンタルヘルスサポートグループはしばしばアモルファスなオンライングループで形成される。
これらの設定において、標準的なネットワーク分析を用いて個人間のスーシダリティを予測することは、リソース制限(例えばメモリ)によって禁止され、そのようなモデルにテキストのような補助データを追加することは、複雑さとスパーシティに関する問題を悪化させる。
ここでは、グラフと言語埋め込みモデル(metapath2vecとdoc2vec)がこれらの制限を回避し、ドメインの専門知識や機能エンジニアリングなしに教師なしのクラスタリングデータを抽出する方法を示します。
自殺支援グループへのグラフと言語の距離は相関がほとんどない(\r{ho} < 0.23)。
個人間のsuicidityの予測に別々に使用する場合、グラフデータと言語データは、比較的正確な結果(それぞれ69%と76%)を生成するが、統合されると、どちらのデータも非常に正確な予測(90%、10%の偽陽性、2%の偽陰性)を生成する。
グラフ埋め込みの可視化と潜在的自殺者の予測は、統合モデルが支援グループから遠く離れていてもそのような個人を分類できることを示している。
これらの結果は、大規模ネットワークにおける行動と言語を同時に分析することの重要性と、予測と分類、特に稀なイベントを伴う場合における、異なる種類のデータへの埋め込みモデルの統合への取り組みに関する研究を拡張したものである。
関連論文リスト
- GraphextQA: A Benchmark for Evaluating Graph-Enhanced Large Language
Models [33.56759621666477]
本稿では,言語モデルへのグラフ知識の統合を評価するためのベンチマークデータセットを提案する。
提案したデータセットは,グラフの理解能力を評価し,回答生成に利用するように設計されている。
言語のみのモデルと提案したグラフ言語モデルを用いて,ペアグラフの有用性を検証し,課題の難しさを実証する。
論文 参考訳(メタデータ) (2023-10-12T16:46:58Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Neural Graph Revealers [2.692919446383274]
確率的グラフモデルとスパースグラフリカバリ手法を効率的にマージするために,NGR(Neural Graph Revealers)を提案する。
NGRはニューラルネットワークを「ガラス箱」、より具体的にはマルチタスク学習フレームワークとみなしている。
重度乳幼児死亡データに対するスパースグラフの回収と確率的推定をCenters for Disease Control and Preventionにより行った実験結果について報告する。
論文 参考訳(メタデータ) (2023-02-27T08:40:45Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Multilayer Clustered Graph Learning [66.94201299553336]
我々は、観測された層を代表グラフに適切に集約するために、データ忠実度用語として対照的な損失を用いる。
実験により,本手法がクラスタクラスタw.r.tに繋がることが示された。
クラスタリング問題を解くためのクラスタリングアルゴリズムを学習する。
論文 参考訳(メタデータ) (2020-10-29T09:58:02Z) - Edge-variational Graph Convolutional Networks for Uncertainty-aware
Disease Prediction [7.6146285961466]
本研究では、画像データと非画像データを自動的に統合し、不確実性を考慮した疾患予測を行うための一般化可能なフレームワークを提案する。
4つのデータベースを用いた実験結果から,自閉症スペクトラム障害,アルツハイマー病,眼疾患の診断精度を一貫して改善できることがわかった。
論文 参考訳(メタデータ) (2020-09-06T15:53:17Z) - Generative Compositional Augmentations for Scene Graph Prediction [27.535630110794855]
シーングラフの形で画像からオブジェクトとその関係を推定することは、視覚と言語を交わす多くのアプリケーションで有用である。
本稿では,この課題において,長い尾データ分布から生じる合成一般化の課題について考察する。
本研究では,条件付き生成逆数ネットワーク(GAN)に基づくモデルの提案と実証研究を行い,乱れたシーングラフの視覚的特徴を生成する。
論文 参考訳(メタデータ) (2020-07-11T12:11:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。