論文の概要: Data Augmentation for Modeling Human Personality: The Dexter Machine
- arxiv url: http://arxiv.org/abs/2301.08606v1
- Date: Fri, 20 Jan 2023 14:36:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-23 13:01:00.502333
- Title: Data Augmentation for Modeling Human Personality: The Dexter Machine
- Title(参考訳): 人格モデリングのためのデータ拡張:デクスターマシン
- Authors: Yair Neuman, Vladyslav Kozhukhov, Dan Vilenchik
- Abstract要約: 我々は人格のためのテキストベースのデータ拡張アプローチ(PEDANT)を開発した。
PEDANTは、一般的なラベル付きデータではなく、生成事前訓練モデル(GPT)とドメインの専門知識の組み合わせに依存しています。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling human personality is important for several AI challenges, from the
engineering of artificial psychotherapists to the design of persona bots.
However, the field of computational personality analysis heavily relies on
labeled data, which may be expensive, difficult or impossible to get. This
problem is amplified when dealing with rare personality types or disorders
(e.g., the anti-social psychopathic personality disorder). In this context, we
developed a text-based data augmentation approach for human personality
(PEDANT). PEDANT doesn't rely on the common type of labeled data but on the
generative pre-trained model (GPT) combined with domain expertise. Testing the
methodology on three different datasets, provides results that support the
quality of the generated data.
- Abstract(参考訳): 人格のモデル化は、人工精神療法士の工学からペルソナロボットの設計に至るまで、いくつかのAI課題において重要である。
しかし、計算パーソナリティ分析の分野はラベル付きデータに大きく依存しており、費用がかかるか、難しいか、あるいは入手が困難である。
この問題は、まれな性格タイプや障害(例えば、反社会的精神病性パーソナリティ障害)を扱う際に増幅される。
本研究では,人格のためのテキストベースのデータ拡張手法(PEDANT)を開発した。
PEDANTは、一般的なラベル付きデータではなく、生成事前訓練モデル(GPT)とドメインの専門知識の組み合わせに依存しています。
3つの異なるデータセットで方法論をテストすると、生成されたデータの品質をサポートする結果が得られる。
関連論文リスト
- MentalArena: Self-play Training of Language Models for Diagnosis and Treatment of Mental Health Disorders [59.515827458631975]
メンタルヘルス障害は世界で最も深刻な病気の1つである。
プライバシーに関する懸念は、パーソナライズされた治療データのアクセシビリティを制限する。
MentalArenaは、言語モデルをトレーニングするためのセルフプレイフレームワークである。
論文 参考訳(メタデータ) (2024-10-09T13:06:40Z) - Chatting Up Attachment: Using LLMs to Predict Adult Bonds [0.0]
GPT-4とClaude 3 Opusを使用して、さまざまなプロファイル、子供時代の記憶、アタッチメントスタイルを持つ大人をシミュレートするエージェントを作成します。
我々は,同一の面接プロトコルを施行し,精神保健専門家によって分析・ラベル付けされた9人のヒトの転写データセットを用いて,我々のモデルを評価した。
以上の結果から,合成データのみを用いたモデルトレーニングは,人間のデータを用いたモデルトレーニングに匹敵する性能を発揮することが示唆された。
論文 参考訳(メタデータ) (2024-08-31T04:29:19Z) - Embracing Massive Medical Data [8.458637345001758]
大規模医療データからAIを訓練するオンライン学習手法を提案する。
提案手法は,データの特異性と予測の不確実性に基づいて,現在のAIモデルの最も重要なサンプルを同定する。
一般的なトレーニングパラダイムと比較して,本手法は連続的なデータストリームのトレーニングを可能にすることにより,データ効率を向上させるだけでなく,破滅的な忘れを緩和する。
論文 参考訳(メタデータ) (2024-07-05T17:50:30Z) - Synthetic data: How could it be used for infectious disease research? [0.16752458252726457]
人工データセット生成の可能性に関連する潜在的な負の要因について懸念が高まっている。
これには、サイバー犯罪のような分野における生成的人工知能の潜在的な誤用が含まれる。
合成データは、特にデータプライバシ、研究、データセットのバランシングと機械学習モデルのバイアス低減において、大きなメリットを提供する。
論文 参考訳(メタデータ) (2024-07-03T17:13:04Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.501751261878]
人為的なデータに基づく微調整言語モデル(LM)が普及している。
我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。
ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:17:43Z) - Can AI Serve as a Substitute for Human Subjects in Software Engineering
Research? [24.39463126056733]
本稿では,人工知能(AI)の能力を活用したソフトウェア工学研究における定性データ収集手法を提案する。
定性的データの代替源としてAI生成合成テキストの可能性を探る。
観察研究とユーザ評価における人間の行動のエミュレートを目的とした新しい基礎モデルの開発について論じる。
論文 参考訳(メタデータ) (2023-11-18T14:05:52Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Skill Preferences: Learning to Extract and Execute Robotic Skills from
Human Feedback [82.96694147237113]
Skill Preferencesは、人間の好みよりもモデルを学習し、オフラインデータから人間に沿ったスキルを抽出するアルゴリズムである。
SkiPは複雑なマルチステップ操作タスクをシミュレートしたキッチンロボットで実現できることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:04:08Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Model-agnostic Fits for Understanding Information Seeking Patterns in
Humans [0.0]
不確実な意思決定タスクでは、人間はそのタスクに関連する情報を探し、統合し、行動する際、特徴的なバイアスを示す。
ここでは,これらのバイアスを総合的に測定・分類した,大規模に収集した先行設計実験のデータを再検討した。
これらのバイアスを集約的に再現するディープラーニングモデルを設計し、個々の行動の変化を捉えます。
論文 参考訳(メタデータ) (2020-12-09T04:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。