論文の概要: Paths of A Million People: Extracting Life Trajectories from Wikipedia
- arxiv url: http://arxiv.org/abs/2406.00032v1
- Date: Sat, 25 May 2024 06:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-09 16:09:32.336567
- Title: Paths of A Million People: Extracting Life Trajectories from Wikipedia
- Title(参考訳): 何百万人もの人々の道:Wikipediaから人生の軌跡を抽出する
- Authors: Ying Zhang, Xiaofeng Li, Zhaoyang Liu, Haipeng Zhang,
- Abstract要約: 我々は、軌跡記述の多様性と不均一性から生じる一般化問題に取り組む。
半教師付き学習とコントラスト学習を組み合わせた組立モデルCOSMOSは,F1スコア85.95%を達成している。
我々はまた、8,852(人、時間、場所)のトリプルからなる手作業によるデータセットWikiLifeTrajectoryを作成しました。
- 参考スコア(独自算出の注目度): 20.02210503453678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Notable people's life trajectories have been a focus of study -- the locations and times of various activities, such as birth, death, education, marriage, competition, work, delivering a speech, making a scientific discovery, finishing a masterpiece, and fighting a battle, and how these people interact with others, carry important messages for the broad research related to human dynamics. However, the scarcity of trajectory data in terms of volume, density, and inter-person interactions, limits relevant studies from being comprehensive and interactive. We mine millions of biography pages from Wikipedia and tackle the generalization problem stemming from the variety and heterogeneity of the trajectory descriptions. Our ensemble model COSMOS, which combines the idea of semi-supervised learning and contrastive learning, achieves an F1 score of 85.95%. For this task, we also create a hand-curated dataset, WikiLifeTrajectory, consisting of 8,852 (person, time, location) triplets as ground truth. Besides, we perform an empirical analysis on the trajectories of 8,272 historians to demonstrate the validity of the extracted results. To facilitate the research on trajectory extractions and help the analytical studies to construct grand narratives, we make our code, the million-level extracted trajectories, and the WikiLifeTrajectory dataset publicly available.
- Abstract(参考訳): 出生、死、教育、結婚、競争、仕事、スピーチの提供、科学的発見の実施、傑作の完成、戦いの終結、そしてこれらの人々が他人とどのように交流するかといった様々な活動の場所や時期が研究の対象となっている。
しかし、音量、密度、対人相互作用の観点での軌跡データの不足は、関連する研究が包括的でインタラクティブであることを制限する。
我々は、ウィキペディアから数百万の伝記ページを抽出し、軌跡記述の多様性と不均一性から生じる一般化問題に取り組む。
半教師付き学習とコントラスト学習を組み合わせた組立モデルCOSMOSは,F1スコア85.95%を達成している。
このタスクでは,8,852(人,時間,位置)のトリプルからなる手作業によるデータセットWikiLifeTrajectoryも作成する。
さらに,8,272人の歴史家の軌跡を実験的に分析し,抽出結果の有効性を実証した。
トラジェクトリ抽出の研究を円滑に進めるとともに,分析研究によるグランド・ナラティブ構築を支援するため,コード,百万レベルのトラジェクトリ,WikiLifeTrajectoryデータセットを公開している。
関連論文リスト
- Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - SAGA: A Participant-specific Examination of Story Alternatives and Goal Applicability for a Deeper Understanding of Complex Events [13.894639630989563]
このような知識は参加者達成レンズを通じて引き出すことができると我々は主張する。
我々は,参加者の意図した成果に基づいて,物語の中の複雑な出来事を分析する。
データセットに微調整された小さなモデルでは、より大きなモデルを上回るパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2024-08-11T14:52:40Z) - MobilityDL: A Review of Deep Learning From Trajectory Data [0.8999666725996975]
軌道データは、時系列、空間データ、そして(時には不合理な)動きの振る舞いの複雑さを組み合わせる。
本稿では,軌道データに対する深層学習のアプローチについて概観する。
論文 参考訳(メタデータ) (2024-02-01T16:30:00Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Telling Stories for Common Sense Zero-Shot Action Recognition [11.166901260737786]
本稿では,WikiHowの記事から抽出した多様なアクションクラスに対するリッチなテキスト記述を含む,新しいデータセットであるStoriesを紹介する。
各クラスに対して、アクションを特徴付けるために必要なステップ、シーン、オブジェクト、動詞を詳述した多文の物語を抽出する。
このコンテキストデータは、アクション間のニュアンス付き関係のモデリングを可能にし、ゼロショット転送への道を開く。
論文 参考訳(メタデータ) (2023-09-29T15:34:39Z) - Wikibio: a Semantic Resource for the Intersectional Analysis of
Biographical Events [3.8455936323976694]
文献的事象検出のための新しいコーパスを提示する。
このモデルでは、Fスコア0.808のバイオグラフィーでターゲットエンティリティのすべての言及を検出することができた。
また、ウィキペディアの伝記の中で、女性と非西洋人の偏見の分析にも使用された。
論文 参考訳(メタデータ) (2023-06-15T20:59:37Z) - A dataset of mentorship in science with semantic and demographic
estimations [4.317131795436002]
112分野にわたる738989科学者間の743176のメンターシップ関係のクラウドソーシングデータセットについて述べる。
我々は、Microsoft Academic Graphの出版データとディープラーニングコンテンツ分析を用いた研究の「セマンティック」表現で科学者のプロファイルを豊かにする。
我々は、プロファイル-パブリケーションマッチング、セマンティックコンテンツ、人口統計学的推測の広範な検証を行う。
論文 参考訳(メタデータ) (2021-06-11T16:12:15Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Batch Exploration with Examples for Scalable Robotic Reinforcement
Learning [63.552788688544254]
BEE(Batch Exploration with Examples)は、重要状態の画像の少ない数の人間がガイドする状態空間の関連領域を探索する。
BEEは、シミュレーションと本物のフランカロボットの両方で、視覚ベースの操作に挑戦することができる。
論文 参考訳(メタデータ) (2020-10-22T17:49:25Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Human in Events: A Large-Scale Benchmark for Human-centric Video
Analysis in Complex Events [106.19047816743988]
我々は、Human-in-Events(Human-in-Events)またはHiEve(HiEve)という、包括的なアノテーションを備えた新しい大規模データセットを提案する。
これには、複雑なイベントにおけるアクションインスタンスの最大数(>56k)と、長時間続くトラジェクトリの最大数(>1M)が含まれている。
多様なアノテーションに基づいて、アクション認識とポーズ推定のための2つのシンプルなベースラインを提示する。
論文 参考訳(メタデータ) (2020-05-09T18:24:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。