論文の概要: The Book of Life approach: Enabling richness and scale for life course research
- arxiv url: http://arxiv.org/abs/2507.03027v1
- Date: Wed, 02 Jul 2025 21:49:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.540249
- Title: The Book of Life approach: Enabling richness and scale for life course research
- Title(参考訳): 人生の書」アプローチ : 生活科研究のための豊かさとスケールの創出
- Authors: Mark D. Verhagen, Benedikt Stroebl, Tiffany Liu, Lydia T. Liu, Matthew J. Salganik,
- Abstract要約: 定性的アプローチの深さと定量的手法のスケールを結合したハイブリッドアプローチを想像する。
私たちはこのデータ表現を「生命の書」と呼んでいる。
我々は,生活のさまざまな側面をカバーする1億冊以上の生活書を執筆することで,我々のアプローチの実現可能性を説明する。
- 参考スコア(独自算出の注目度): 6.351417809549948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For over a century, life course researchers have faced a choice between two dominant methodological approaches: qualitative methods that analyze rich data but are constrained to small samples, and quantitative survey-based methods that study larger populations but sacrifice data richness for scale. Two recent technological developments now enable us to imagine a hybrid approach that combines some of the depth of the qualitative approach with the scale of quantitative methods. The first development is the steady rise of ''complex log data,'' behavioral data that is logged for purposes other than research but that can be repurposed to construct rich accounts of people's lives. The second is the emergence of large language models (LLMs) with exceptional pattern recognition capabilities on plain text. In this paper, we take a necessary step toward creating this hybrid approach by developing a flexible procedure to transform complex log data into a textual representation of an individual's life trajectory across multiple domains, over time, and in context. We call this data representation a ''book of life.'' We illustrate the feasibility of our approach by writing over 100 million books of life covering many different facets of life, over time and placed in social context using Dutch population-scale registry data. We open source the book of life toolkit (BOLT), and invite the research community to explore the many potential applications of this approach.
- Abstract(参考訳): 1世紀以上にわたって、ライフコース研究者は、リッチデータを分析するが、小さなサンプルに制限される定性的な方法と、より大きな人口を調査する量的調査に基づく方法と、大規模データ豊かさを犠牲にする方法の2つの主要な方法の選択肢に直面してきた。
最近の2つの技術開発により、定性的アプローチの深さと定量的手法のスケールを組み合わせたハイブリッドアプローチが想像できるようになりました。
最初の発展は「複合ログデータ」の着実な増加であり、研究以外の目的のためにログされているが、人々の生活の豊かな説明を構築するために再利用できる行動データである。
2つ目は、プレーンテキストに例外的なパターン認識機能を持つ大規模言語モデル(LLM)の出現である。
本稿では、複雑なログデータを複数のドメイン、時間、文脈にまたがる個人の生活軌跡のテキスト表現に変換するフレキシブルな手順を開発することで、このハイブリッドなアプローチを構築するための必要なステップを取る。
我々は、このデータ表現を「生命の書」と呼び、オランダの人口規模登録データを用いて、様々な生活の側面をカバーする1億冊以上の生命の書物を書き、社会的文脈に配置することで、我々のアプローチの実現可能性を説明する。
生活ツールキット(BOLT)の書籍をオープンソースとして公開し,このアプローチの潜在的な応用の可能性を探るため,研究コミュニティを招待する。
関連論文リスト
- A Comprehensive Survey of Synthetic Tabular Data Generation [31.576625554168473]
タブラルデータ(英: Tabular data)は、医療、金融、教育といった現実世界のアプリケーションにおいて、最も一般的で重要なデータフォーマットの1つである。
本調査は,本分野の総合的な理解を研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-04-23T08:33:34Z) - Scalable Sampling for High Utility Patterns [1.2154569665167423]
大規模量データベースのための新しい高能率パターンサンプリングアルゴリズムとそのオンディスクバージョンを提案する。
提案手法は,ユーザ中心方式に必要な対話性と,ランダムサンプリングによる強い統計的保証の両方を保証する。
提案手法の興味を示すために,考古学的知識グラフによる発見を応用した,魅力的なユースケースを提案する。
論文 参考訳(メタデータ) (2024-10-30T12:22:54Z) - Deep End-to-End Survival Analysis with Temporal Consistency [49.77103348208835]
本稿では,大規模長手データの処理を効率的に行うために,Survival Analysisアルゴリズムを提案する。
我々の手法における中心的な考え方は、時間とともにデータにおける過去と将来の成果が円滑に進化するという仮説である時間的一貫性である。
我々のフレームワークは、安定したトレーニング信号を提供することで、時間的一貫性を大きなデータセットに独自に組み込む。
論文 参考訳(メタデータ) (2024-10-09T11:37:09Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Few-Shot Learning on Graphs: from Meta-learning to Pre-training and
Prompting [56.25730255038747]
この調査は、最近の展開を合成し、比較洞察を提供し、将来の方向性を特定するための取り組みである。
我々は,既存の研究をメタラーニングアプローチ,事前学習アプローチ,ハイブリッドアプローチの3つの主要なファミリーに体系的に分類した。
これらの手法間の関係を解析し,その強みと限界を比較する。
論文 参考訳(メタデータ) (2024-02-02T14:32:42Z) - Deep Learning for Survival Analysis: A Review [7.016568778869699]
深層学習(DL)技術の生存分析分野への流入は,方法論的な進歩をもたらした。
本研究は,DL関連属性およびDL関連属性に基づいて,DLに基づく時間-時間分析手法の体系的レビューを行う。
論文 参考訳(メタデータ) (2023-05-24T09:56:20Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - CustOmics: A versatile deep-learning based strategy for multi-omics
integration [0.0]
本稿では,高次元マルチソース統合の場合のデータセットに適応する,カスタマイズ可能なオートエンコーダモデルを構築するための新しい戦略を提案する。
我々は,統合戦略が潜在表現に与える影響を評価し,新しい手法であるCustOmicsを提案する最善の戦略を組み合わせる。
論文 参考訳(メタデータ) (2022-09-12T14:20:29Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Deep Generative Modeling in Network Science with Applications to Public
Policy Research [0.0]
ネットワークデータは、量的かつデータ駆動の公共政策研究にますます利用されている。
深層生成法は、マイクロシミュレーションやエージェントベースモデルに有用なリアルな合成ネットワークを生成するために使用できる。
疫学モデルで一般的に使用される大規模社会接触ネットワークに適用可能な,新たな生成フレームワークを開発した。
論文 参考訳(メタデータ) (2020-10-15T16:47:34Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - GS-WGAN: A Gradient-Sanitized Approach for Learning Differentially
Private Generators [74.16405337436213]
我々は、GS-WGAN(Gradient-sanitized Wasserstein Generative Adrial Networks)を提案する。
GS-WGANは、厳格なプライバシー保証を備えた機密データの衛生的な形式での公開を可能にする。
このアプローチは、複数のメトリクスにわたる最先端のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2020-06-15T10:01:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。