論文の概要: LLM-based Atomic Propositions help weak extractors: Evaluation of a Propositioner for triplet extraction
- arxiv url: http://arxiv.org/abs/2604.02866v1
- Date: Fri, 03 Apr 2026 08:31:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.400634
- Title: LLM-based Atomic Propositions help weak extractors: Evaluation of a Propositioner for triplet extraction
- Title(参考訳): LLMに基づく原子プロポジションは抽出器の弱化を助ける:三重項抽出のためのプロポーズ器の評価
- Authors: Luc Pommeret, Thomas Gerald, Patrick Paroubek, Sahar Ghannay, Christophe Servan, Sophie Rosset,
- Abstract要約: MPropositionneur-V2は6つのヨーロッパ言語をカバーする小さな多言語モデルである。
SMiLER、FewRel、DocRED、CaRBの実験は、原子命題がより弱い抽出器の恩恵を受けることを示した。
より強力なLCMに対して、フォールバック組合せ戦略は、関係抽出における利得を維持しながらエンティティリコール損失を回復する。
- 参考スコア(独自算出の注目度): 6.356031718676497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge Graph construction from natural language requires extracting structured triplets from complex, information-dense sentences. In this paper, we investigate if the decomposition of text into atomic propositions (minimal, semantically autonomous units of information) can improve the triplet extraction. We introduce MPropositionneur-V2, a small multilingual model covering six European languages trained by knowledge distillation from Qwen3-32B into a Qwen3-0.6B architecture, and we evaluate its integration into two extraction paradigms: entity-centric (GLiREL) and generative (Qwen3). Experiments on SMiLER, FewRel, DocRED and CaRB show that atomic propositions benefit weaker extractors (GLiREL, CoreNLP, 0.6B models), improving relation recall and, in the multilingual setting, overall accuracy. For stronger LLMs, a fallback combination strategy recovers entity recall losses while preserving the gains in relation extraction. These results show that atomic propositions are an interpretable intermediate data structure that complements extractors without replacing them.
- Abstract(参考訳): 自然言語からの知識グラフ構築には、複雑で情報に富んだ文から構造化された三つ子を抽出する必要がある。
本稿では,テキストをアトミックな命題(最小かつ意味論的に自律的な情報単位)に分解することで,三重項抽出を改善することができるかどうかを検討する。
MPropositionneur-V2は,Qwen3-32BからQwen3-0.6Bアーキテクチャへの知識蒸留によって訓練された6つのヨーロッパ言語をカバーする小型多言語モデルであり,エンティティ中心(GLiREL)と生成(Qwen3)の2つの抽出パラダイムへの統合を評価する。
SMiLER、FewRel、DocRED、CARBの実験では、原子命題はより弱い抽出器(GLiREL、CoreNLP、0.6Bモデル)の恩恵を受け、関係のリコールを改善し、多言語設定では全体的な精度が向上した。
より強力なLCMに対して、フォールバック組合せ戦略は、関係抽出における利得を維持しながらエンティティリコール損失を回復する。
これらの結果は、原子命題が解釈可能な中間データ構造であり、それらを置き換えることなく抽出器を補完することを示している。
関連論文リスト
- Knowledge Restoration-driven Prompt Optimization: Unlocking LLM Potential for Open-Domain Relational Triplet Extraction [4.01163688152329]
三重項のオープンマイニングは、事前に定義されたスキーマなしで構造化された知識の基礎となる。
既存の手法では曖昧さの脆弱性が示され、しばしば誤った抽出パターンが永続的である。
本稿では,Large Language Models (LLM) の抽出能力を継続的に改善するための知識再構成駆動型プロンプト最適化(KRPO)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-21T14:42:13Z) - Extractive Fact Decomposition for Interpretable Natural Language Inference in one Forward Pass [4.990228412613982]
JEDIは、原子の事実分解と解釈可能な推論を共同で行うエンコーダのみのアーキテクチャである。
学習を容易にするため、複数のNLIベンチマークをカバーする合成的合理性の大規模なコーパスを生成する。
本研究は, エンコーダのみのアーキテクチャと合成論理を用いて, NLIの解釈可能性とロバストな一般化を実現することができることを示す。
論文 参考訳(メタデータ) (2025-09-23T11:30:42Z) - AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning [49.24235059299745]
我々は、原子レベルで正確な異種知識推論を行うための大規模な言語モデルのためのフレームワークAtomRを紹介する。
AtomRは複雑な質問を、各葉ノードが原子知識演算子に対応する推論木に分解する。
推論実行段階では、AtomRは各原子知識演算子を実行し、弾力的に異種源から原子レベルの知識を選択し、取得し、操作する。
論文 参考訳(メタデータ) (2024-11-25T15:35:51Z) - Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction [44.716502690026026]
長い文から三重項の集合を出力する関係三重抽出は、知識獲得において重要な役割を果たす。
大規模な言語モデルでは、適切な命令が与えられた場合、簡単な文から数ショットの学習や微調整によってトリプルを正確に抽出することができる。
本稿では,大規模言語モデルと小さなモデルを統合した評価フィルタリングフレームワークを設計する。
論文 参考訳(メタデータ) (2024-04-15T09:03:05Z) - TriSum: Learning Summarization Ability from Large Language Models with Structured Rationale [66.01943465390548]
本稿では,大規模言語モデルのテキスト要約能力を,コンパクトで局所的なモデルに抽出するフレームワークであるTriSumを紹介する。
本手法は,様々なベンチマーク上での局所モデル性能を向上させる。
また、要約の合理性に関する洞察を提供することで、解釈可能性も向上する。
論文 参考訳(メタデータ) (2024-03-15T14:36:38Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Modeling Multi-Granularity Hierarchical Features for Relation Extraction [26.852869800344813]
本稿では,原文のみに基づく多粒度特徴抽出手法を提案する。
外部知識を必要とせずに,効果的な構造的特徴が達成可能であることを示す。
論文 参考訳(メタデータ) (2022-04-09T09:44:05Z) - RelationPrompt: Leveraging Prompts to Generate Synthetic Data for
Zero-Shot Relation Triplet Extraction [65.4337085607711]
ゼロショット関係トリプルト抽出(ZeroRTE)のタスク設定について紹介する。
入力文が与えられた後、抽出された各三重項は、トレーニング段階で関係ラベルが見えないヘッドエンティティ、リレーションラベル、テールエンティティから構成される。
本稿では、言語モデルに構造化テキストを生成するよう促すことで、関係例を合成する。
論文 参考訳(メタデータ) (2022-03-17T05:55:14Z) - Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction [11.344977846840747]
本稿では,三重項の異なる要素に対する抽出条件を条件付け,三重項を反復的に抽出する神経多言語OpenIEシステムを提案する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
論文 参考訳(メタデータ) (2021-10-15T15:19:11Z) - Contrastive Triple Extraction with Generative Transformer [72.21467482853232]
生成変換器を用いた新しい3重抽出モデルを提案する。
具体的には,エンコーダデコーダをベースとした1つの共有トランスフォーマモジュールを提案する。
忠実な結果を得るために,新しい三重項コントラストトレーニングオブジェクトを提案する。
論文 参考訳(メタデータ) (2020-09-14T05:29:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。