論文の概要: Snippet-Driven Supply Chain Discovery with LLMs: Scaling Visibility in China
- arxiv url: http://arxiv.org/abs/2605.27845v1
- Date: Wed, 27 May 2026 02:02:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.681867
- Title: Snippet-Driven Supply Chain Discovery with LLMs: Scaling Visibility in China
- Title(参考訳): LLMによるスニペット駆動型サプライチェーン発見:中国のスケーリング可視性
- Authors: Hiroto Fukada, Takayuki Mizuno,
- Abstract要約: 金融と経済の研究は、しばしば構造化されたサプライチェーンの開示と商業データベースに依存している。
中国では、サプライヤー・カストマーの開示は通常上場企業の主要パートナーに限られる。
本稿では,サプライチェーン知識グラフ(SCKG)をノードとして構築し,エッジとして相互確認を行うスニペット駆動方式を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial and economic research often relies on structured supply-chain disclosures and commercial databases. In China, supplier--customer disclosure is typically limited to major partners of listed firms, leaving unlisted firms and long-tail inter-firm links poorly captured in structured data. Public web evidence can partly complement this gap through corporate, government, and trade-media disclosures; however, full-text web mining at scale is costly because pages are often inaccessible or expensive to process with large language models (LLMs). We propose a snippet-driven method for constructing a supply chain knowledge graph (SCKG), with firms as nodes and inter-firm relationships as edges. Web search snippets are query-biased summaries returned with search results. We use them as a scalable first-pass evidence layer for LLM-based relationship extraction. We evaluate the pipeline in terms of extraction efficiency and coverage. For extraction efficiency, exhaustive full-text chunking discovers 19.8$\times$ more unique relationships than snippets, but requires 251.2$\times$ more input tokens and yields higher redundancy. For coverage, we use 130,685 Chinese firms as search seeds, covering Shanghai/Shenzhen-listed firms and large unlisted firms as of 2024. In the listed-firm subset, the resulting SCKG covers 7.2$\times$ more firms and 9.3$\times$ more relationships than the CSMAR disclosure-based benchmark, while revealing heavy-tailed degree patterns. Retained provenance metadata make the SCKG an auditable complement to disclosure-based databases.
- Abstract(参考訳): 金融と経済の研究は、しばしば構造化されたサプライチェーンの開示と商業データベースに依存している。
中国では、サプライヤー・カストマーの開示は通常上場企業の主要パートナーに限られる。
公共のWebエビデンスはこのギャップを、企業、政府、貿易メディアの開示を通じて部分的に補うことができるが、大規模なWebマイニングは、ページが大きな言語モデル(LLM)で処理するためにアクセス不能またはコストがかかるため、コストがかかる。
本稿では,サプライチェーン知識グラフ(SCKG)を構築するためのスニペット駆動方式を提案する。
Web検索スニペットは、検索結果で返されるクエリバイアスの要約である。
LLMに基づく関係抽出のためのスケーラブルなファーストパスエビデンス層として使用する。
抽出効率とカバレッジの観点から,パイプラインの評価を行った。
抽出効率を上げるために、全文チャンキングはスニペットよりも19.8$\times$ユニークな関係を見つけ出すが、251.2$\times$多くの入力トークンを必要とし、高い冗長性をもたらす。
対象としては、中国企業130,685社を検索種として使用し、上海・深セン上場企業や、2024年時点では未上場企業を対象としています。
リストアップされたサブセットでは、結果のSCKGは7.2$\times$以上の企業と9.3$\times$以上の関係をカバーし、CSMARの開示ベースのベンチマークでは重み付けの度合いパターンを明らかにしている。
保証メタデータの保持により、SCKGは開示ベースのデータベースの監査可能な補完となる。
関連論文リスト
- AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases [0.7176906280023592]
本稿では,企業知識ベース上での検索と分析のためのエージェントハーネスであるAgenticRAGを提案する。
我々のアプローチは、既存のエンタープライズ検索インフラの上に軽量なハーネスを積み重ねることで、この過度さを軽減します。
本研究は,実環境における実運用環境への適合性を示すものである。
論文 参考訳(メタデータ) (2026-05-07T00:39:22Z) - Fin-RATE: A Real-world Financial Analytics and Tracking Evaluation Benchmark for LLMs on SEC Filings [31.87459935714186]
Fin-RATE(フィン・ラテ)は、米国証券取引委員会(SEC)の申請書類と財務アナリストを反映したベンチマークである。
我々は、オープンソース、クローズドソース、金融特化モデルにまたがって、Large Language Models(LLM)をリードする17のベンチマークを行った。
その結果、タスクが単一文書推論から縦断的、横断的分析へ移行するにつれて、精度が18.60%低下し、14.35%低下した。
論文 参考訳(メタデータ) (2026-02-07T00:54:37Z) - Enhancing Business Analytics through Hybrid Summarization of Financial Reports [0.152292571922932]
財務報告と決算報告には大量の構造化情報と半構造化情報が含まれている。
本稿では,抽出的および抽象的手法を組み合わせて,簡潔かつ現実的に信頼性の高い要約を生成するハイブリッド要約フレームワークを提案する。
これらの知見は、長い財務文書を有効活用できるビジネスインテリジェンスに蒸留する実用的な要約システムの開発を支援するものである。
論文 参考訳(メタデータ) (2025-12-28T16:25:12Z) - Exploring Network-Knowledge Graph Duality: A Case Study in Agentic Supply Chain Risk Analysis [3.734145313091892]
ネットワークと知識グラフの本質的にの双対性を利用する。
ネットワーク集中度スコアで導かれるグラフトラバーサは、最も経済的に健全なリスクパスを効率的に抽出する。
エージェントアーキテクチャは、数値係数テーブルとニュースストリームのデータとともに、このグラフ検索をオーケストレーションする。
論文 参考訳(メタデータ) (2025-10-01T17:02:14Z) - FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - FinTagging: Benchmarking LLMs for Extracting and Structuring Financial Information [47.37027539828975]
FinTaggingは構造認識とフルスコープのための最初の包括的なベンチマークである。
タグ付け
数値識別用FinNIは、数値エンティティとそのタイプを抽出する。
財務報告
概念リンクのためのFinCLは、抽出された各実体を米国の完全な分類学における対応する概念にマッピングする。
論文 参考訳(メタデータ) (2025-05-27T02:55:53Z) - FABLES: Evaluating faithfulness and content selection in book-length summarization [55.50680057160788]
本稿では,本書の忠実度と内容選択の大規模評価を行う。
LLMが生成した26冊のサマリーで作成した3,158冊の注釈のデータセットであるFABLESを5.2KUSDで収集する。
注釈の分析によると、ほとんどの不誠実な主張は出来事や登場人物の状態に関係しており、物語を無効にするために間接的推論を必要とする。
論文 参考訳(メタデータ) (2024-04-01T17:33:38Z) - CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market [61.59326951366202]
我々は、中国株式政策検索データセット(CSPRD)を導入して、新たな課題である政策検索を提案する。
CSPRDは、中国の政策コーパスの10k以上の項目から、経験豊富な専門家によってラベル付けされた700以上のパスを提供する。
我々の最高のパフォーマンスベースラインは56.1% MRR@10、28.5% NDCG@10、37.5% Recall@10、80.6% Precision@10である。
論文 参考訳(メタデータ) (2023-09-08T15:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。