論文の概要: Causal Knowledge Extraction from Scholarly Papers in Social Sciences
- arxiv url: http://arxiv.org/abs/2006.08904v1
- Date: Tue, 16 Jun 2020 03:37:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 21:23:30.694779
- Title: Causal Knowledge Extraction from Scholarly Papers in Social Sciences
- Title(参考訳): 社会科学における学術論文からの因果知識抽出
- Authors: Victor Zitian Chen, Felipe Montano-Campos and Wlodek Zadrozny
- Abstract要約: ビジネス・マネジメントにおいて学術文書の文章を分類するモデルを開発する。
これらの論文から仮説を特定し,その原因と効果を抽出する。
我々のアプローチは、幅広い社会科学の学術文献に一般化できるかもしれない。
- 参考スコア(独自算出の注目度): 1.976652238476722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scale and scope of scholarly articles today are overwhelming human
researchers who seek to timely digest and synthesize knowledge. In this paper,
we seek to develop natural language processing (NLP) models to accelerate the
speed of extraction of relationships from scholarly papers in social sciences,
identify hypotheses from these papers, and extract the cause-and-effect
entities. Specifically, we develop models to 1) classify sentences in scholarly
documents in business and management as hypotheses (hypothesis classification),
2) classify these hypotheses as causal relationships or not (causality
classification), and, if they are causal, 3) extract the cause and effect
entities from these hypotheses (entity extraction). We have achieved high
performance for all the three tasks using different modeling techniques. Our
approach may be generalizable to scholarly documents in a wide range of social
sciences, as well as other types of textual materials.
- Abstract(参考訳): 今日の学術論文の規模と範囲は、知識をタイムリーに消化し、合成しようとする圧倒的な人間研究者である。
本稿では,自然言語処理(nlp)モデルを開発し,社会科学における学術論文からの関係抽出の速度を加速し,これらの論文から仮説を特定し,原因・影響要素を抽出する。
具体的には モデルを開発し
1)ビジネスにおける学術文書の文章の分類と管理を仮説(仮説分類)として分類する。
2) これらの仮説を因果関係に分類し(因果分類)、因果関係を因果関係とする場合
3)これらの仮説(エンティティ抽出)から原因と効果の実体を抽出する。
異なるモデリング技術を用いて、3つのタスクすべてで高いパフォーマンスを達成しました。
我々のアプローチは、幅広い社会科学の学術文献だけでなく、他の種類のテキスト資料にも一般化できるかもしれない。
関連論文リスト
- Language agents achieve superhuman synthesis of scientific knowledge [0.7635132958167216]
PaperQA2は、ファクトリティの改善、マッチング、あるいは課題の専門家のパフォーマンスを上回るように最適化されたフロンティア言語モデルエージェントである。
PaperQA2は、Wikipediaのような科学的トピックの要約を引用している。
本稿では,人間にとって重要な科学的課題である科学文献の矛盾を明らかにするためにPaperQA2を適用した。
論文 参考訳(メタデータ) (2024-09-10T16:37:58Z) - Hypothesizing Missing Causal Variables with LLMs [55.28678224020973]
我々は、入力が欠落変数を持つ部分因果グラフであるような新しいタスクを定式化し、出力は部分グラフを完成させるための欠落変数に関する仮説である。
原因と効果の間の媒介変数を仮説化するLLMの強い能力を示す。
また,オープンソースモデルの一部がGPT-4モデルより優れているという驚くべき結果も得られた。
論文 参考訳(メタデータ) (2024-09-04T10:37:44Z) - Understanding Fine-grained Distortions in Reports of Scientific Findings [46.96512578511154]
歪んだ科学コミュニケーションは、不健康な行動の変化を招き、科学機関の信頼を低下させる可能性があるため、個人や社会に害を与える。
近年の科学コミュニケーションの増大を考えると、科学出版物からの発見が一般大衆にどのように報告されるかについて、きめ細かい理解が不可欠である。
論文 参考訳(メタデータ) (2024-02-19T19:00:01Z) - Neural Causal Abstractions [63.21695740637627]
我々は、変数とそのドメインをクラスタリングすることで、因果抽象化の新しいファミリーを開発する。
本稿では,ニューラルネットワークモデルを用いて,そのような抽象化が現実的に学習可能であることを示す。
本実験は、画像データを含む高次元設定に因果推論をスケールする方法を記述し、その理論を支持する。
論文 参考訳(メタデータ) (2024-01-05T02:00:27Z) - Can Large Language Models Discern Evidence for Scientific Hypotheses? Case Studies in the Social Sciences [3.9985385067438344]
強い仮説は、既存の証拠に基づく最良の推理であり、関連する文献の包括的な見解によって知らされる。
毎年発行される科学論文の数が指数関数的に増加すると、ある仮説に関連する証拠の手作業による集約と合成は困難である。
我々は,社会科学における研究のコミュニティ主導のアノテーションを用いた科学的仮説の課題のための新しいデータセットを共有する。
論文 参考訳(メタデータ) (2023-09-07T04:15:17Z) - Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。
従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。
パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文 参考訳(メタデータ) (2023-09-06T05:19:41Z) - Improving Primary Healthcare Workflow Using Extreme Summarization of
Scientific Literature Based on Generative AI [8.901148687545103]
本研究の目的は, 実践者が経験する認知負荷を低減させるための, 生成的人工知能の可能性を検討することである。
文献レビューにおける生成AIの利用は効率的かつ効果的であることを示す。
論文 参考訳(メタデータ) (2023-07-24T21:42:27Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Low Resource Recognition and Linking of Biomedical Concepts from a Large
Ontology [30.324906836652367]
生物医学論文のデータベースで最も有名なPubMedは、これらのアノテーションを追加するために人間のキュレーターに依存しています。
提案手法は,従来の認識/リンクとセマンティックインデックスに基づく評価において,UMLSの新たな最先端結果を実現する。
論文 参考訳(メタデータ) (2021-01-26T06:41:12Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。