論文の概要: Finding Pragmatic Differences Between Disciplines
- arxiv url: http://arxiv.org/abs/2310.00204v1
- Date: Sat, 30 Sep 2023 00:46:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 05:51:44.609613
- Title: Finding Pragmatic Differences Between Disciplines
- Title(参考訳): 学際的差異の発見
- Authors: Lee Kezar, Jay Pujara
- Abstract要約: 文書セクションのドメインに依存しない記述子の固定セットを学習し、これらの記述子にコーパスを"再最適化"する。
我々は、これらの記述子の位置と順序を文書間で分析し、規律と構造の関係を理解する。
本研究は,研究の質,ドメインスタイルの移譲,さらに実践的な分析を行うための基礎となるものである。
- 参考スコア(独自算出の注目度): 14.587150614245123
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Scholarly documents have a great degree of variation, both in terms of
content (semantics) and structure (pragmatics). Prior work in scholarly
document understanding emphasizes semantics through document summarization and
corpus topic modeling but tends to omit pragmatics such as document
organization and flow. Using a corpus of scholarly documents across 19
disciplines and state-of-the-art language modeling techniques, we learn a fixed
set of domain-agnostic descriptors for document sections and "retrofit" the
corpus to these descriptors (also referred to as "normalization"). Then, we
analyze the position and ordering of these descriptors across documents to
understand the relationship between discipline and structure. We report
within-discipline structural archetypes, variability, and between-discipline
comparisons, supporting the hypothesis that scholarly communities, despite
their size, diversity, and breadth, share similar avenues for expressing their
work. Our findings lay the foundation for future work in assessing research
quality, domain style transfer, and further pragmatic analysis.
- Abstract(参考訳): 学術文書は、内容(意味論)と構造(実用論)の両面で大きなバリエーションを持っている。
学術文書理解における先行研究は、文書要約とコーパストピックモデリングを通じて意味論を強調するが、文書の組織化やフローのような実用性を省略する傾向がある。
19分野にわたる学術文書のコーパスと最先端の言語モデリング技術を用いて、文書セクションのドメインに依存しない記述子の固定セットを学習し、これらの記述子(正規化とも呼ばれる)にコーパスを「再適合」する。
そして,これらの記述子の位置と順序を文書間で分析し,規律と構造の関係を理解する。
我々は,学内構造アーチタイプ,変動性,学際間比較を報告し,その大きさ,多様性,広さに関わらず,学術的なコミュニティが自分たちの作品を表現するための類似の道筋を共有しているという仮説を裏付ける。
本研究は,研究の質,ドメインスタイルの移譲,さらに実践的な分析を行うための基礎となるものである。
関連論文リスト
- Trajectories of Change: Approaches for Tracking Knowledge Evolution [0.0]
SEN(Socsocial-epistemic Network)の枠組みを通じて,知識システムの局所的・グローバル的進化を探求する。
まず,相対エントロピーに基づく情報理論を用いてセマンティックシフトを検出し,その意義を評価し,鍵となる駆動特徴を同定する。
第二に、文書の埋め込みのバリエーションは意味的近傍の変化を明らかにし、類似文書の濃度がどのように上昇するか、安定したまま、あるいは分散し続けるかを追跡する。
論文 参考訳(メタデータ) (2024-12-31T11:09:37Z) - Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Inferring Scientific Cross-Document Coreference and Hierarchy with Definition-Augmented Relational Reasoning [7.086262532457526]
本稿では,全文文献を検索することで,概念記述の文脈依存的な定義を生成する手法を提案する。
さらに,2つの概念がどのように関連しているか,あるいは異なるのかを記述したリレーショナル定義を生成し,論文間のリンクの推論に関わる爆発に対処する効率的な再分類アプローチを設計する。
論文 参考訳(メタデータ) (2024-09-23T15:20:27Z) - Leveraging Collection-Wide Similarities for Unsupervised Document Structure Extraction [61.998789448260005]
本稿では,コレクション内の文書の典型的構造を特定することを提案する。
任意のヘッダのパラフレーズを抽象化し、各トピックを各ドキュメントのロケーションにグルーピングします。
文書間の類似性を利用した教師なしグラフベース手法を開発した。
論文 参考訳(メタデータ) (2024-02-21T16:22:21Z) - ATLANTIC: Structure-Aware Retrieval-Augmented Language Model for
Interdisciplinary Science [0.0]
大きな言語モデルは、多くの自然言語処理タスクで印象的なパフォーマンスを記録します。
Retrieval augmentationは、外部の知識ソースからコンテキストを取得することで、効果的なソリューションを提供する。
本稿では,検索強化時に文書構造に対応する構造対応検索言語モデルを提案する。
論文 参考訳(メタデータ) (2023-11-21T02:02:46Z) - Document AI: A Comparative Study of Transformer-Based, Graph-Based
Models, and Convolutional Neural Networks For Document Layout Analysis [3.231170156689185]
Document AIは、自然言語処理とコンピュータビジョン技術を活用して、文書を自動的に分析することを目的としている。
Document AIの主要なタスクの1つはドキュメントレイアウト分析であり、レイアウト、画像、テキストの内容と空間的関係を解釈することでドキュメントページを構造化する。
論文 参考訳(メタデータ) (2023-08-29T16:58:03Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Domain-Specific Word Embeddings with Structure Prediction [3.057136788672694]
ニューヨーク・タイムズの記事と2つの英語のウィキペディアデータセットに科学と哲学に関する記事を載せた実証的な評価を提示する。
提案手法は,Word2Vec with Structure Prediction (W2VPred) と呼ばれ,一般的なアナロジーテストにおいて,ベースラインよりも優れた性能を提供する。
デジタル人文科学の分野でのユースケースとして、ドイツ語テキストアーカイブからハイ文学のための新しい研究課題を提起する方法を実証する。
論文 参考訳(メタデータ) (2022-10-06T12:45:48Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。