論文の概要: Beyond coauthorship: semantic structure and phantom collaborators in transportation research, 1967--2025
- arxiv url: http://arxiv.org/abs/2604.23699v1
- Date: Sun, 26 Apr 2026 13:26:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.505519
- Title: Beyond coauthorship: semantic structure and phantom collaborators in transportation research, 1967--2025
- Title(参考訳): 共著者の超越:輸送研究における意味構造と幻の協力者,1967年-2025年
- Authors: Seongjin Choi,
- Abstract要約: 1967年から2025年の間に発行された34の査読論文からなる120,323の論文から構築された輸送研究の意味的構造的アトラスについて述べる。
OpenAlexとCrossrefをオープンなCC0ライセンスのデータソースとして使用し、OpenAlexの作者IDを通じて作者のアイデンティティを解決し、SPECTER2にすべての論文を埋め込む。
- 参考スコア(独自算出の注目度): 0.9185901163605424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a semantic-structural atlas of transportation research built from 120{,}323 papers across 34 peer-reviewed journals published between 1967 and 2025, roughly an order of magnitude larger than and a decade beyond Sun and Rahwan's~(2017) coauthorship study. We use OpenAlex and Crossref as open, CC0-licensed data sources, resolve author identity through OpenAlex author IDs, ORCID records, and manual alias resolution, and embed every paper with SPECTER2 with Arora-style whitening concatenated with concept TF--IDF and venue linear-discriminant projections. On this substrate we report three findings. First, Leiden on the author-level semantic k-nearest-neighbor graph yields 23 topic communities that agree only weakly with the 172 coauthor communities (normalized mutual information $0.23$), opening room for a predictive layer that neither source encodes alone. Second, a multiplex Leiden partition combining both edge types recovers 181 communities and localizes where collaboration and topic structure decouple. Third -- the paper's core methodological contribution -- we define \emph{phantom collaborators}, pairs of authors who are top-$K$ semantic neighbors yet $\geq 3$ hops apart in the coauthor graph, and show via a temporal hold-out (training cutoff 2019) that phantom pairs become real coauthors in 2020--2025 at a rate $16$ to $33$ times above random, popularity-weighted, and same-venue baselines, with a $68$-fold monotone gradient between the highest- and lowest-similarity buckets. All artifacts are released as a live, reproducible web atlas at https://choi-seongjin.github.io/transport-atlas/.
- Abstract(参考訳): 1967年から2025年にかけて発行された34の査読論文のうち120{,}323の論文から構築された輸送研究の意味的構造的アトラスについて述べる。
我々はオープンなCC0ライセンスのデータソースとしてOpenAlexとCrossrefを使用し、OpenAlexの著者ID、ORCIDレコード、手動エイリアス解決を通じて著者の身元を解決し、すべての紙にSPECTER2を埋め込む。
本報告では3つの知見を報告する。
第一に、著者レベルのセマンティックk-アレスト近傍グラフ上のライデンは、172の共著者コミュニティ(正規化相互情報$0.23$)にのみ一致する23のトピックコミュニティを産み出す。
第2に、両方のエッジタイプを組み合わせた多重ライデンパーティションが181のコミュニティを回復し、コラボレーションとトピック構造が分離される場所をローカライズする。
第3に -- 論文の中核的な方法論的貢献 -- は "emph{phantom collaborators}" を定義します。 セマンティックな隣人のトップ-$K$ セマンティックな隣人でありながら$\geq 3$ ホップを共著者グラフから分離した著者のペアを定義します。そして、テンポラリなホールトアウト(2019年のトレーニングカットオフ)を通じて、ファントムペアが2020-2025年に真の共著者となることを示します。
すべてのアーティファクトは、https://choi-seongjin.github.io/transport-atlas/で、ライブで再現可能なWebアトラスとしてリリースされている。
関連論文リスト
- Explainable Disentangled Representation Learning for Generalizable Authorship Attribution in the Era of Generative AI [70.05655131235999]
EAVAE(Explainable Authorship Variational Autoencoder)は、コンテンツからスタイルを明示的に切り離す新しいフレームワークである。
ディスタングルメントは、新規な差別者を通じて実施される。
EAVAEは、AI生成テキスト検出のためのM4データセットよりも、数ショットの学習に優れています。
論文 参考訳(メタデータ) (2026-04-23T05:34:20Z) - Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework [82.66443886385125]
ペーパーサークル(Paper Circle)は、学術文献の発見、評価、整理、理解に必要な労力を減らすために設計された発見・分析システムである。
1)複数のソースからのオフラインおよびオンライン検索を統合するディスカバリパイプライン,多エージェントスコアリング,多様性対応ランキング,構造化アウトプット,2)個々の論文を概念,メソッド,数値などの型付きノードで構造化された知識グラフに変換する分析パイプライン,の2つの補完パイプラインで構成されている。
論文 参考訳(メタデータ) (2026-04-07T17:59:58Z) - Paper Espresso: From Paper Overload to Research Insight [53.45135239997754]
本稿では,最新のarXiv論文を自動的に発見,要約,分析するオープンソースプラットフォームであるPaper Espressoを紹介する。
このシステムは、大きな言語モデル(LLM)を使用して、トピックラベルとキーワードで構造化された要約を生成する。
35ヶ月の継続的デプロイメントを経て、Paper Espressoは13,300以上の論文を処理し、構造化されたメタデータをすべて公開している。
論文 参考訳(メタデータ) (2026-04-06T09:45:21Z) - HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature [6.001574550157585]
本稿では,スケーラブルでゼロショットの科学知識グラフ構築のための2段階フレームワークを提案する。
階層的関係抽出のためのベンチマークSPHEREをリリースする。
ゼロショット設定では、NERが10.76%、REが26.2%に達する。
論文 参考訳(メタデータ) (2026-03-24T12:35:10Z) - Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - S2AMP: A High-Coverage Dataset of Scholarly Mentorship Inferred from
Publications [15.505003540774625]
メンターシップ研究に2つのデータセットを貢献する。
1人目は30万人以上の真理学のメンターとメンターのペアを持つ。
2番目は2400万ノードのうち、1億3700万の重み付けされたメンターシップエッジを持つ。
論文 参考訳(メタデータ) (2022-04-22T17:31:55Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。