論文の概要: Cross-Lingual Citations in English Papers: A Large-Scale Analysis of
Prevalence, Usage, and Impact
- arxiv url: http://arxiv.org/abs/2111.05097v1
- Date: Sun, 7 Nov 2021 15:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-11 03:45:48.542090
- Title: Cross-Lingual Citations in English Papers: A Large-Scale Analysis of
Prevalence, Usage, and Impact
- Title(参考訳): 英語論文における言語間共用: 有病率, 使用状況, 影響の大規模分析
- Authors: Tarek Saier, Michael F\"arber, Tornike Tsereteli
- Abstract要約: 本稿では,100万以上の英文論文に基づく言語間引用の分析を行う。
私たちの発見の中には、中国語で書かれた出版物への引用率の増加がある。
さらなる研究を容易にするため,収集したデータとソースコードを公開している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Citation information in scholarly data is an important source of insight into
the reception of publications and the scholarly discourse. Outcomes of citation
analyses and the applicability of citation based machine learning approaches
heavily depend on the completeness of such data. One particular shortcoming of
scholarly data nowadays is that non-English publications are often not included
in data sets, or that language metadata is not available. Because of this,
citations between publications of differing languages (cross-lingual citations)
have only been studied to a very limited degree. In this paper, we present an
analysis of cross-lingual citations based on over one million English papers,
spanning three scientific disciplines and a time span of three decades. Our
investigation covers differences between cited languages and disciplines,
trends over time, and the usage characteristics as well as impact of
cross-lingual citations. Among our findings are an increasing rate of citations
to publications written in Chinese, citations being primarily to local
non-English languages, and consistency in citation intent between cross- and
monolingual citations. To facilitate further research, we make our collected
data and source code publicly available.
- Abstract(参考訳): 学術データにおける引用情報は、出版物の受容と学術談話に関する重要な洞察源である。
引用分析の結果と引用ベースの機械学習手法の適用性は、データの完全性に大きく依存する。
学術データの特に欠点の1つは、英語以外の出版物がデータセットに含まれないことや、言語メタデータが利用できないことである。
このため、異なる言語(言語間の引用)の出版物間の引用は、非常に限られた程度にしか研究されていない。
本稿では,100万以上の英文論文に基づく言語間引用の分析を行い,3つの科学的分野と30年間の時間について述べる。
本調査では,引用言語と規律の違い,時間的傾向,使用特性,言語間引用の影響について検討した。
以上の結果から,中国語で書かれた出版物に対する引用率の上昇,現地の非英語言語への引用率,言語間および単言語による引用意図の一貫性が確認された。
さらなる研究を容易にするため,収集したデータとソースコードを公開している。
関連論文リスト
- Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - Context-Enhanced Language Models for Generating Multi-Paper Citations [35.80247519023821]
本稿では,Large Language Models (LLMs) を用いて多文文を生成する手法を提案する。
提案手法は,複数文の引用文を含むコヒーレントな段落に終止符を打つ,単一のソース・ペーパーと対象論文の集合を包含する。
論文 参考訳(メタデータ) (2024-04-22T04:30:36Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Lost in Translation -- Multilingual Misinformation and its Evolution [52.07628580627591]
本稿では,95言語にまたがる25万以上のファクトチェックの分析を通じて,多言語誤報の頻度とダイナミクスについて検討する。
誤報のクレームの大部分は1回だけ事実チェックされているが、21,000件以上のクレームに対応する11.7%は複数回チェックされている。
誤情報拡散のプロキシとしてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が見つかる。
論文 参考訳(メタデータ) (2023-10-27T12:21:55Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Predicting Long-Term Citations from Short-Term Linguistic Influence [20.78217545537925]
研究論文の影響の基準尺度は、その引用回数である。
本稿では,タイムスタンプによる文書収集における言語的影響の定量化手法を提案する。
論文 参考訳(メタデータ) (2022-10-24T22:03:26Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - How are journals cited? characterizing journal citations by type of
citation [0.0]
本稿では,引用関数に基づく引用の統計的特徴付けに関する最初の結果を示す。
また,雑誌が受ける支持率と論争の比率を,品質の潜在的指標として特徴づける最初の結果も提示する。
論文 参考訳(メタデータ) (2021-02-22T14:15:50Z) - Characterizing References from Different Disciplines: A Perspective of
Citation Content Analysis [7.171503036026183]
この研究は、データとしてPLoSの記事を取り、Citation Content Analysis(CCA)に基づく異なる分野からの参照を特徴付ける。
ほとんどの文献は自然科学からの引用であるが、人文科学と社会科学は記事の紹介と背景セクションにおいて重要な役割を担っている。
論文 参考訳(メタデータ) (2021-01-19T13:30:00Z) - A Decade of In-text Citation Analysis based on Natural Language
Processing and Machine Learning Techniques: An overview of empirical studies [3.474275085556876]
情報科学者は、フルテキストデータ処理技術の進歩に踏み込んで、従来の書誌学をはるかに超えてきた。
本稿は、これらの発展に関する研究を物語的にレビューすることを目的としている。
その主な焦点は、自然言語処理と機械学習技術を使って引用を分析した出版物である。
論文 参考訳(メタデータ) (2020-08-29T17:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。