論文の概要: FineREX: Fine-Tuned NER-RE for Human Smuggling Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2606.19710v1
- Date: Thu, 18 Jun 2026 02:09:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.609307
- Title: FineREX: Fine-Tuned NER-RE for Human Smuggling Knowledge Graphs
- Title(参考訳): FineREX:人間の密輸知識グラフのための微調整NER-RE
- Authors: Elijah Feldman, Dipak Meher, Carlotta Domeniconi,
- Abstract要約: FineREXは、名前付きエンティティ認識と関係抽出のための微調整LDMを中心に構築された知識グラフ構築パイプラインである。
512$のテキストチャンクを手動でアノテートしたデータセットを使用して、FineREXはエンティティとリレーションF1スコアでそれぞれ15.50%と31.46%の絶対的な改善を実現している。
この結果から,ドメイン固有の微調整は,より大きな汎用モデルよりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 8.222584338135986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Court proceedings contain valuable evidence about human smuggling networks, but this information is often buried within unstructured, jargon-heavy legal documents. While large language models (LLMs) can support knowledge graph construction through automated information extraction, existing approaches rely on general-purpose models that are not tailored to the entity and relationship definitions required in this domain. We introduce FineREX, a streamlined knowledge graph construction pipeline built around a fine-tuned LLM for named entity recognition and relationship extraction (NER-RE). Using a manually annotated dataset of $512$ text chunks, FineREX achieves absolute improvements of 15.50% and 31.46% in entity and relationship F1-score, respectively, compared to a larger general-purpose baseline. These gains translate into higher-quality knowledge graphs, reducing legal noise by nearly half and lowering node duplication on long documents from 17.78% to 11.17%. By eliminating document rewriting and redundant extraction stages, FineREX also reduces end-to-end processing time by 50.0%. Our results demonstrate that domain-specific fine-tuning can substantially outperform larger general-purpose models while improving both the quality and efficiency of knowledge graph construction for illicit network analysis.
- Abstract(参考訳): 裁判所の手続きには、人間の密輸ネットワークに関する貴重な証拠が含まれているが、この情報は、しばしば非構造化で重大な法的文書の中に埋もれている。
大規模言語モデル(LLM)は、自動情報抽出による知識グラフ構築をサポートするが、既存のアプローチは、このドメインで必要とされるエンティティや関係の定義に適合しない汎用モデルに依存している。
我々は、名前付きエンティティ認識と関係抽出(NER-RE)のための微調整LDMを中心に構築された知識グラフ構築パイプラインであるFineREXを紹介する。
512$のテキストチャンクを手動でアノテートしたデータセットを使用して、FineREXは、より大きな汎用ベースラインと比較して、エンティティとリレーションF1スコアの15.50%と31.46%の絶対的な改善を実現している。
これらの利得は、高品質な知識グラフに変換され、法的なノイズを半分近く減らし、長い文書のノード重複を17.78%から11.17%に下げる。
文書の書き直しや冗長抽出の段階をなくすことで、FineREXはエンドツーエンドの処理時間を50.0%削減する。
この結果から,ドメイン固有の微調整は,知識グラフ構築の質と効率を向上しつつ,より大規模な汎用モデルよりも優れていることが示された。
関連論文リスト
- VeriGraph: Towards Verifiable Data-Analytic Agents [71.17693022916896]
LLMをベースとしたエージェントは、データ集約分析タスクにおいて強力な能力を示してきたが、その出力は滅多に検証されていない。
We propose VeriGraph, a traceable neuro-symbolic reasoning framework that agent can construct an explicit heterogeneous evidence directed acyclic graph。
以上の結果から,明示的なエビデンスグラフ構築がデータ分析エージェントの検証に期待できる道のりであることが示唆された。
論文 参考訳(メタデータ) (2026-06-15T11:50:56Z) - Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - Graph-based Document Structure Analysis [26.79096546002763]
本稿では,新しいグラフベース文書構造解析(gDSA)タスクを提案する。
このタスクでは、モデルが文書要素を検出するだけでなく、グラフ構造の形で空間的および論理的関係を生成する必要がある。
関係グラフに基づく文書構造解析データセット(GraphDoc)を80Kの文書画像と4.13Mの関連アノテーションで構築する。
論文 参考訳(メタデータ) (2025-02-04T17:16:14Z) - A Contextualized BERT model for Knowledge Graph Completion [0.0]
知識グラフ補完(KGC)のためのコンテキスト化BERTモデルを提案する。
本モデルでは,エンティティ記述や負の三重項サンプリングの必要性を排除し,計算要求を低減し,性能を向上する。
FB15k-237とWN18RRでは,Hit@1が5.3%向上し,4.88%向上した。
論文 参考訳(メタデータ) (2024-12-15T02:03:16Z) - Graph Neural Re-Ranking via Corpus Graph [12.309841763251406]
Graph Neural Re-Ranking(GNRR)は、グラフニューラルネットワーク(GNN)に基づくパイプラインで、推論中に各クエリがドキュメントの分散を考慮できるようにする。
我々は、GNNが文書間の相互作用を効果的に捉え、人気のあるランキング指標の性能を向上させることを実証した。
論文 参考訳(メタデータ) (2024-06-17T16:38:19Z) - Learning from Litigation: Graphs and LLMs for Retrieval and Reasoning in eDiscovery [6.037276428689637]
文書のランク付けと分類を強化するために知識グラフを統合する新システムであるDISCOGを導入する。
DISCOGは、F1スコア、精度、リコールにおいて、バランスの取れたデータセットと不均衡なデータセットの両方において、強力なベースラインを上回っている。
現実世界のデプロイメントでは、訴訟関連のドキュメントレビューコストを約98%削減し、ビジネス上の大きな影響を示している。
論文 参考訳(メタデータ) (2024-05-29T15:08:55Z) - Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.443478448031886]
RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文 参考訳(メタデータ) (2024-05-28T20:54:47Z) - Grounded Keys-to-Text Generation: Towards Factual Open-Ended Generation [92.1582872870226]
そこで我々は,新しい接地型キー・ツー・テキスト生成タスクを提案する。
タスクは、ガイドキーと接地パスのセットが与えられたエンティティに関する事実記述を生成することである。
近年のQAに基づく評価手法に着想を得て,生成した記述の事実的正当性を示す自動計量MAFEを提案する。
論文 参考訳(メタデータ) (2022-12-04T23:59:41Z) - FactGraph: Evaluating Factuality in Summarization with Semantic Graph
Representations [114.94628499698096]
文書と要約を構造化された意味表現(MR)に分解するFactGraphを提案する。
MRは、コアセマンティックの概念とその関係を記述し、文書と要約の両方の主要な内容を標準形式で集約し、データの疎結合を減少させる。
事実性を評価するための異なるベンチマークの実験では、FactGraphは以前のアプローチよりも最大15%優れていた。
論文 参考訳(メタデータ) (2022-04-13T16:45:33Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。