論文の概要: Unsupervised embedding of trajectories captures the latent structure of
scientific migration
- arxiv url: http://arxiv.org/abs/2012.02785v3
- Date: Fri, 17 Nov 2023 20:32:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 21:37:11.511200
- Title: Unsupervised embedding of trajectories captures the latent structure of
scientific migration
- Title(参考訳): 軌道の非教師的埋め込みは科学的移動の潜在構造を捉える
- Authors: Dakota Murray, Jisung Yoon, Sadamori Kojaku, Rodrigo Costas, Woo-Sung
Jung, Sta\v{s}a Milojevi\'c, Yong-Yeol Ahn
- Abstract要約: 移動軌跡からの個別位置間のニュアンス関係を符号化するモデルワード2vecの能力を示す。
移動パターンを符号化する Word2vec のパワーは、移動の重力モデルと数学的に等価であることに起因している。
セマンティック構造を利用する手法を用いて、埋め込みが科学的なマイグレーションの基盤となるリッチな構造を学習できることを実証する。
- 参考スコア(独自算出の注目度): 4.028844692958469
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human migration and mobility drives major societal phenomena including
epidemics, economies, innovation, and the diffusion of ideas. Although human
mobility and migration have been heavily constrained by geographic distance
throughout the history, advances and globalization are making other factors
such as language and culture increasingly more important. Advances in neural
embedding models, originally designed for natural language, provide an
opportunity to tame this complexity and open new avenues for the study of
migration. Here, we demonstrate the ability of the model word2vec to encode
nuanced relationships between discrete locations from migration trajectories,
producing an accurate, dense, continuous, and meaningful vector-space
representation. The resulting representation provides a functional distance
between locations, as well as a digital double that can be distributed,
re-used, and itself interrogated to understand the many dimensions of
migration. We show that the unique power of word2vec to encode migration
patterns stems from its mathematical equivalence with the gravity model of
mobility. Focusing on the case of scientific migration, we apply word2vec to a
database of three million migration trajectories of scientists derived from the
affiliations listed on their publication records. Using techniques that
leverage its semantic structure, we demonstrate that embeddings can learn the
rich structure that underpins scientific migration, such as cultural,
linguistic, and prestige relationships at multiple levels of granularity. Our
results provide a theoretical foundation and methodological framework for using
neural embeddings to represent and understand migration both within and beyond
science.
- Abstract(参考訳): 人類の移住と移動は、疫病、経済、イノベーション、アイデアの拡散など、社会的な現象を引き起こす。
人類の移動と移住は歴史を通じて地理的距離によって厳しく制限されてきたが、進歩とグローバリゼーションは言語や文化などの他の要素をますます重要にしている。
元々自然言語用に設計されたニューラル埋め込みモデルの進歩は、この複雑さをテームし、移行の研究のための新しい道を開く機会を提供する。
本稿では,モデル word2vec が移動軌跡から離散的位置間のニュアンス関係をエンコードし,精度,高密度,連続的,有意義なベクトル空間表現を生成する能力を示す。
結果として得られる表現は、ロケーション間の機能的な距離と、分散、再使用、およびそれ自体が、マイグレーションのさまざまな次元を理解するために尋問されるデジタルダブルを提供する。
移動パターンをエンコードするword2vecのユニークな力は、移動の重力モデルと数学的に同値であることを示している。
科学的な移動の事例に焦点を当てて、word2vec を出版記録に記載されたアフィリエイトから派生した科学者の300万の移動軌跡のデータベースに適用する。
セマンティック構造を利用する手法を用いて, 埋め込みは, 文化的, 言語的, 権威的な関係を, さまざまなレベルの粒度で学習することができることを示す。
本研究は, 科学内外の移動を表現・理解するために, ニューラルネットワークを用いた理論的基礎と方法論的枠組みを提供する。
関連論文リスト
- Combining Twitter and Mobile Phone Data to Observe Border-Rush: The Turkish-European Border Opening [2.5693085674985117]
2020年にトルコが国境管理を廃止すると決定すると、多くの個人がギリシャ、ブルガリア、トルコの国境に向かって旅した。
しかし、メディアレポートと実際の移行パターンの間の不規則な移動と不一致に関する検証可能な統計が欠如しているため、さらなる調査が必要である。
本研究は,新しいデータソース,特に携帯電話とTwitterのデータを活用することで,この知識ギャップを埋めることを目的とする。
論文 参考訳(メタデータ) (2024-05-21T09:51:15Z) - Named Entity Recognition Under Domain Shift via Metric Learning for Life Sciences [55.185456382328674]
名前付きエンティティ認識モデルの拡張のための転写学習の適用性について検討する。
本モデルでは,(1)アノテートイベントからの知識を付加してエンティティ間の関係を確立するソースドメインにおけるエンティティグループ化,2) 対象ドメインにおけるエンティティの識別を擬似ラベリングとコントラスト学習に頼って,2つのドメイン内のエンティティ間の識別を強化する,という2つの段階で構成されている。
論文 参考訳(メタデータ) (2024-01-19T03:49:28Z) - SciGLM: Training Scientific Language Models with Self-Reflective
Instruction Annotation and Tuning [60.14510984576027]
SciGLMは、大学レベルの科学的推論を行うことができる科学言語モデルのスイートである。
本研究では, 自己回帰的指示アノテーションの枠組みを適用し, 難解な科学的問題に対する段階的推論を生成する。
言語モデルのChatGLMをSciInstructで微調整し、科学的および数学的推論能力を向上した。
論文 参考訳(メタデータ) (2024-01-15T20:22:21Z) - Unveiling A Core Linguistic Region in Large Language Models [49.860260050718516]
本稿では,脳局在化をプロトタイプとして用いた類似研究を行う。
我々は、言語能力に対応する大規模言語モデルにおいて、中核領域を発見した。
我々は,言語能力の向上が必ずしもモデルの知識レベルの向上に伴わないことを観察する。
論文 参考訳(メタデータ) (2023-10-23T13:31:32Z) - The diaspora model for human migration [0.07852714805965527]
既存のモデルは、フローの変動を説明するために、主に人口規模と移動距離に依存している。
本稿では,移住のダイアスポラモデルを提案し,移住者数(移住者数)と移住者数(国内での目的地)を取り入れた。
本モデルでは,移住者が特定の居住地を選択する確率に影響を及ぼすように,目的地国における既存のディアスポラサイズのみを考慮に入れている。
論文 参考訳(メタデータ) (2023-09-06T15:17:53Z) - Priority-Centric Human Motion Generation in Discrete Latent Space [59.401128190423535]
テキスト・ツー・モーション生成のための優先中心運動離散拡散モデル(M2DM)を提案する。
M2DMは、コード崩壊に対処するために、グローバルな自己注意機構と正規化用語を組み込んでいる。
また、各動きトークンの重要度から決定される革新的なノイズスケジュールを用いた動き離散拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-08-28T10:40:16Z) - MoDi: Unconditional Motion Synthesis from Diverse Data [51.676055380546494]
多様な動きを合成する無条件生成モデルであるMoDiを提案する。
我々のモデルは、多様な、構造化されていない、ラベルなしのモーションデータセットから完全に教師なしの設定で訓練されている。
データセットに構造が欠けているにもかかわらず、潜在空間は意味的にクラスタ化可能であることを示す。
論文 参考訳(メタデータ) (2022-06-16T09:06:25Z) - Recognition of Implicit Geographic Movement in Text [3.3241479835797123]
人間、動物、その他の現象の地理的移動を分析することは、研究の領域の増大である。
我々は地理的な動きを記述しているとラベル付けされた文のコーパスを作成しました。
我々は,より多くのラベルを予測するために,手によるラベル付け,群衆投票による確認,機械学習を用いた反復的なプロセスを開発した。
論文 参考訳(メタデータ) (2022-01-30T12:22:55Z) - Investigating internal migration with network analysis and latent space
representations: An application to Turkey [0.0]
トルコにおける2008年から2020年までの内部移住の構造と動態を詳細に調査する。
古典的マイグレーション法則の集合を同定し,署名付きネットワーク解析,エゴネットワーク解析,表現学習,時間的安定性解析,ネットワーク可視化の様々な手法を用いて検証する。
この結果は、古典的な移住法に従って、ほとんどの移住リンクは、大きな経済活動を持つ都市を含むいくつかの例外と地理的に結びついていることを示している。
論文 参考訳(メタデータ) (2022-01-10T18:58:02Z) - Capturing the diversity of multilingual societies [0.0]
我々は、理論とデータ駆動の観点から、言語シフトにおける作業プロセスについて考察する。
twitterと国勢調査データを用いた多言語社会における言語空間パターンの大規模実証研究は、幅広い多様性をもたらす。
本稿では,他言語の学習が促進され,両言語が絶滅危惧言語の使用を好む場合に,言語共存が達成できるモデルを提案する。
論文 参考訳(メタデータ) (2021-05-06T10:27:43Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。