論文の概要: Citations are not opinions: a corpus linguistics approach to
understanding how citations are made
- arxiv url: http://arxiv.org/abs/2104.08087v1
- Date: Fri, 16 Apr 2021 12:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 14:17:24.320615
- Title: Citations are not opinions: a corpus linguistics approach to
understanding how citations are made
- Title(参考訳): 引用は意見ではない:コーパス言語学的アプローチによる引用の作り方
- Authors: Domenic Rosati
- Abstract要約: 引用内容分析の重要な問題は、引用の異なるクラスを特徴付ける言語構造を見つけることである。
本研究では,分類済みの引用コーパスの大規模なサンプルから始めて,発声スマート引用データセットの各クラスから200万の引用を行う。
各引用型の比較表を生成することにより,引用型を特徴付ける興味深い言語特徴を多数提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Citation content analysis seeks to understand citations based on the language
used during the making of a citation. A key issue in citation content analysis
is looking for linguistic structures that characterize distinct classes of
citations for the purposes of understanding the intent and function of a
citation. Previous works have focused on modeling linguistic features first and
drawn conclusions on the language structures unique to each class of citation
function based on the performance of a classification task or inter-annotator
agreement. In this study, we start with a large sample of a pre-classified
citation corpus, 2 million citations from each class of the scite Smart
Citation dataset (supporting, disputing, and mentioning citations), and analyze
its corpus linguistics in order to reveal the unique and statistically
significant language structures belonging to each type of citation. By
generating comparison tables for each citation type we present a number of
interesting linguistic features that uniquely characterize citation type. What
we find is that within citation collocates, there is very low correlation
between citation type and sentiment. Additionally, we find that the
subjectivity of citation collocates across classes is very low. These findings
suggest that the sentiment of collocates is not a predictor of citation
function and that due to their low subjectivity, an opinion-expressing mode of
understanding citations, implicit in previous citation sentiment analysis
literature, is inappropriate. Instead, we suggest that citations can be better
understood as claims-making devices where the citation type can be explained by
understanding how two claims are being compared. By presenting this approach,
we hope to inspire similar corpus linguistic studies on citations that derive a
more robust theory of citation from an empirical basis using citation corpora
- Abstract(参考訳): 引用内容分析は、引用を行う際に使用される言語に基づいて引用を理解することを目指す。
引用内容分析における重要な問題は、引用の意図と機能を理解する目的で、引用の異なるクラスを特徴付ける言語構造を探すことである。
従来の研究は、まず言語特徴のモデル化に重点を置いており、分類タスクやアノテーション間の合意に基づく引用関数の各クラス固有の言語構造に関する結論を導いた。
本研究は,事前分類された引用コーパスの大規模なサンプルから始まり,発声スマート引用データセットの各クラスから200万の引用(引用のサポート,発言,言及)を抽出し,そのコーパス言語学を分析し,各種類の引用に属する固有かつ統計的に有意な言語構造を明らかにする。
各引用型の比較表を作成することで、引用型を特徴付ける興味深い言語特徴を多数提示する。
引用コロケーション内では、引用タイプと感情の間には、非常に低い相関関係があることが分かりました。
さらに, 引用の主観性はクラスをまたがって非常に低いことが判明した。
これらの結果から,コロケート感情は引用関数の予測因子ではなく,その主観性が低いため,先行する引用感情分析文献において暗黙の認識形態が不適切であることが示唆された。
代わりに、2つの主張がどのように比較されているかを理解することによって、引用型を説明することができるクレーム作成装置として、引用をよりよく理解することができることを示唆する。
このアプローチを提示することにより、引用コーパスを用いたより堅牢な引用理論を導出する引用に関する類似のコーパス言語研究のインスピレーションを期待する。
関連論文リスト
- SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models [51.90867482317985]
SelfCiteは自己教師型のアプローチで、LLMを調整して、生成された応答における文に対する高品質できめ細かい文レベルの引用を生成する。
コストと労働集約的なアノテーションに頼る代わりに、SelfCiteはLLM自体が提供する報酬シグナルをコンテキストアブレーションを通じて活用する。
SelfCiteの有効性は、5つの長文質問応答タスクにわたるLongBench-Citeベンチマークにおいて、引用F1を5.3ポイントまで増やすことによって示される。
論文 参考訳(メタデータ) (2025-02-13T18:55:13Z) - Citation Recommendation based on Argumentative Zoning of User Queries [7.596930973436683]
議論的区分とは、科学的文学における議論的かつ修辞的な構造を特定することである。
本稿では,引用レコメンデーションと議論的偏差分類のためのマルチタスク学習モデルを構築した。
論文 参考訳(メタデータ) (2025-01-30T12:08:00Z) - CiteBART: Learning to Generate Citations for Local Citation Recommendation [0.138120109831448]
本稿では,局所的引用レコメンデーション(LCR)を実現するために,引用トークンマスキングに基づくカスタムBART事前トレーニングであるCiteBARTを提案する。
ベーススキームでは、局所的な引用コンテキストにおける引用トークンをマスクして、引用予測を行う。
グローバルな意味では、論文のタイトルを再構築し、ローカルな引用コンテキストに抽象化し、引用トークンを学ぶ。
この効果は、例えばRefseerやArXivのようなより大きなベンチマークにおいて重要である。
論文 参考訳(メタデータ) (2024-12-23T12:58:30Z) - ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。
我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。
複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文 参考訳(メタデータ) (2024-06-19T09:16:14Z) - Hidden Citations Obscure True Impact in Science [1.5279567721070433]
発見が常識となると、引用は編入によって消滅する。
ここでは、隠れた引用を体系的に識別するために、各論文の全文に適用された教師なしの解釈可能な機械学習を頼りにしている。
本研究は, 暗黙の引用の頻度は引用数ではなく, 原稿のテキスト中の話題に関する言説の程度によってもたらされることを示す。
論文 参考訳(メタデータ) (2023-10-24T20:58:07Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - How are journals cited? characterizing journal citations by type of
citation [0.0]
本稿では,引用関数に基づく引用の統計的特徴付けに関する最初の結果を示す。
また,雑誌が受ける支持率と論争の比率を,品質の潜在的指標として特徴づける最初の結果も提示する。
論文 参考訳(メタデータ) (2021-02-22T14:15:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。