論文の概要: Integrating Unstructured Text into Causal Inference: Empirical Evidence from Real Data
- arxiv url: http://arxiv.org/abs/2602.14274v1
- Date: Sun, 15 Feb 2026 18:55:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.928561
- Title: Integrating Unstructured Text into Causal Inference: Empirical Evidence from Real Data
- Title(参考訳): 非構造化テキストを因果推論に統合する:実データによる実証的エビデンス
- Authors: Boning Zhou, Ziyu Wang, Han Hong, Haoqi Hu,
- Abstract要約: 本稿では,非構造化テキストを用いた因果推論を行うためにトランスフォーマーに基づく言語モデルを利用するフレームワークを提案する。
本研究では,非構造化テキストから得られた因果推定値と,人口,集団,個人レベルで得られた構造化データとを比較して,本フレームワークの有効性を実証する。
我々のアプローチは、因果推論手法の適用性を、テキストデータのみが利用可能なシナリオに拡張する。
- 参考スコア(独自算出の注目度): 3.6081423220512945
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal inference, a critical tool for informing business decisions, traditionally relies heavily on structured data. However, in many real-world scenarios, such data can be incomplete or unavailable. This paper presents a framework that leverages transformer-based language models to perform causal inference using unstructured text. We demonstrate the effectiveness of our framework by comparing causal estimates derived from unstructured text against those obtained from structured data across population, group, and individual levels. Our findings show consistent results between the two approaches, validating the potential of unstructured text in causal inference tasks. Our approach extends the applicability of causal inference methods to scenarios where only textual data is available, enabling data-driven business decision-making when structured tabular data is scarce.
- Abstract(参考訳): 因果推論(Causal inference)は、ビジネス判断を伝える重要なツールであり、伝統的に構造化データに大きく依存している。
しかし、多くの実世界のシナリオでは、そのようなデータは不完全または利用できない可能性がある。
本稿では,非構造化テキストを用いた因果推論を行うためにトランスフォーマーに基づく言語モデルを利用するフレームワークを提案する。
本研究では,非構造化テキストから得られた因果推定値と,人口,集団,個人レベルで得られた構造化データとを比較して,本フレームワークの有効性を実証する。
本研究は, 因果推論タスクにおける非構造化テキストの可能性を検証するため, 2つのアプローチの間に一貫した結果が得られた。
我々のアプローチは、因果推論手法の適用性を、テキストデータのみが利用可能なシナリオに拡張し、構造化表データが不足している場合に、データ駆動型のビジネス意思決定を可能にする。
関連論文リスト
- A Unifying Framework for Robust and Efficient Inference with Unstructured Data [2.07180164747172]
本稿では、非構造化データから導出されるパラメータの効率的な推論を行うための一般的な枠組みを提案する。
提案手法は,既存の推論手法を統一し拡張するフレームワークであるMAR-Sで定式化する。
このフレームワーク内では、記述的および因果推定の両方のための堅牢で効率的な推定器を開発する。
論文 参考訳(メタデータ) (2025-05-01T04:11:25Z) - Enhancing Systematic Decompositional Natural Language Inference Using Informal Logic [51.967603572656266]
我々は,分解包含を注釈付けするための一貫した理論的なアプローチを導入する。
我々の新しいデータセットRDTEは、前回の分解エンターメントデータセットよりもかなり高い内部整合性(+9%)を持つことがわかった。
また,RDTE による知識蒸留によるエンテーメント分類器の訓練や,エンテーメントツリー推論エンジンへの導入により,精度と検証精度が向上することが確認された。
論文 参考訳(メタデータ) (2024-02-22T18:55:17Z) - Towards Causal Relationship in Indefinite Data: Baseline Model and New
Datasets [23.035761299444953]
「不確定データ」は多構造データと多値表現を特徴とする。
高品質なデータセットとして、CausalogueとCausactionの2つをリリースしています。
このギャップに3つの設計されたハイライトを取り入れた確率的フレームワークをベースラインとして提案する。
論文 参考訳(メタデータ) (2024-01-16T09:15:43Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Enhancing Argument Structure Extraction with Efficient Leverage of
Contextual Information [79.06082391992545]
本稿では,コンテキスト情報を完全に活用する効率的なコンテキスト認識モデル(ECASE)を提案する。
文脈情報や議論情報を集約するために,シーケンスアテンションモジュールと距離重み付き類似度損失を導入する。
各種ドメインの5つのデータセットに対する実験により,我々のモデルが最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2023-10-08T08:47:10Z) - StructGPT: A General Framework for Large Language Model to Reason over
Structured Data [117.13986738340027]
我々は,構造化データに基づく質問応答タスクの解法として,emphIterative Reading-then-Reasoning(IRR)アプローチを開発した。
提案手法はChatGPTの性能を大幅に向上させ,全データの教師付きベースラインに対して同等のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-16T17:45:23Z) - Multi-Modal Causal Inference with Deep Structural Equation Models [3.5271614282612314]
我々は、因果推論の中で非構造化データを活用する技術を開発し、そうでなければ説明できない共同設立者のために修正する。
我々は、ゲノム学と医療におけるタスクを実証的に実証し、構造化されていないデータを様々なコンバウンディングソースの修正に使うことができることを実証した。
論文 参考訳(メタデータ) (2022-03-18T00:44:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。