論文の概要: An Automated LLM-based Pipeline for Asset-Level Database Creation to Assess Deforestation Impact
- arxiv url: http://arxiv.org/abs/2505.05494v1
- Date: Mon, 05 May 2025 15:17:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:09.983731
- Title: An Automated LLM-based Pipeline for Asset-Level Database Creation to Assess Deforestation Impact
- Title(参考訳): 森林破壊影響評価のためのアセットレベルデータベース作成のための自動LLMパイプライン
- Authors: Avanija Menon, Ovidiu Serban,
- Abstract要約: 欧州連合森林伐採規制(EUDR)は、企業が森林伐採に寄与していないことを証明しなければならない。
現在のデータベースには必要な詳細が欠けており、広範な財務メトリクスと手動のデータ収集に大きく依存している。
本研究では,LLMを用いて構造化データベースの作成,クリーン化,検証を行う,エンドツーエンドの自動データ抽出パイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The European Union Deforestation Regulation (EUDR) requires companies to prove their products do not contribute to deforestation, creating a critical demand for precise, asset-level environmental impact data. Current databases lack the necessary detail, relying heavily on broad financial metrics and manual data collection, which limits regulatory compliance and accurate environmental modeling. This study presents an automated, end-to-end data extraction pipeline that uses LLMs to create, clean, and validate structured databases, specifically targeting sectors with a high risk of deforestation. The pipeline introduces Instructional, Role-Based, Zero-Shot Chain-of-Thought (IRZ-CoT) prompting to enhance data extraction accuracy and a Retrieval-Augmented Validation (RAV) process that integrates real-time web searches for improved data reliability. Applied to SEC EDGAR filings in the Mining, Oil & Gas, and Utilities sectors, the pipeline demonstrates significant improvements over traditional zero-shot prompting approaches, particularly in extraction accuracy and validation coverage. This work advances NLP-driven automation for regulatory compliance, CSR (Corporate Social Responsibility), and ESG, with broad sectoral applicability.
- Abstract(参考訳): EUDR(EU Deforestation Regulation)は、企業が自社製品が森林伐採に寄与しないことを証明し、正確な資産レベルの環境影響データに対する重要な需要を生み出すことを要求している。
現在のデータベースは必要な詳細を欠き、広範囲の財務指標と手動のデータ収集に大きく依存しており、規制の遵守と正確な環境モデリングを制限している。
本研究では, 森林破壊のリスクが高い分野を対象として, LLMを用いて構造化データベースの作成, クリーン化, 検証を行う, エンドツーエンドの自動データ抽出パイプラインを提案する。
このパイプラインでは、データの抽出精度を高めるための命令、ロールベース、ゼロショットチェーン(IRZ-CoT)と、データの信頼性を向上させるためにリアルタイムWeb検索を統合する検索拡張バリデーション(RAV)プロセスが導入されている。
Mining, Oil & Gas, and UtilitiesのSEC EDGARの申請書に適用されるこのパイプラインは、従来のゼロショットプロンプトアプローチ(特に抽出精度と検証カバレッジ)よりも大幅に改善されている。
この作業は、規制遵守のためのNLP駆動の自動化、CSR(Corporate Social Responsibility)、ESGを広範囲に適用可能な形で推進する。
関連論文リスト
- TVR: Automotive System Requirement Traceability Validation and Recovery Through Retrieval-Augmented Generation [7.50061902435987]
利害関係者の要求とシステム要件の間のトレーサビリティは、一貫性、正確性、規制の遵守を保証するために不可欠である。
既存のアプローチは、ステークホルダーとシステム要件の間のトレーサビリティに対処せず、オープンソースデータに依存し、エンジニアが確立した手動リンクの検証に対処しない。
本稿では,主に自動車システムを対象とした要求トレーサビリティ検証とリカバリ手法であるTVRを紹介する。
論文 参考訳(メタデータ) (2025-04-21T20:37:23Z) - Lawful and Accountable Personal Data Processing with GDPR-based Access and Usage Control in Distributed Systems [0.0]
本稿では,データ処理活動の合法性に関する法的議論を確立するための,自動規範推論のためのケースジェネリック手法を提案する。
議論は、プライバシーの専門家によるケース固有の法的資格に基づいて確立され、人間をループに導く。
GPDRから抽出した要求に対して、結果のシステムは設計され、批判的に評価される。
論文 参考訳(メタデータ) (2025-03-10T10:49:34Z) - Optimizing Product Provenance Verification using Data Valuation Methods [24.59951827145763]
安定同位体比分析(SIRA)に適用された機械学習モデルのトレーニングデータの選択と活用を促進するために設計された新しいデータ評価フレームワークを提案する。
我々は,その方法論を広範な実験で検証し,証明の検証を著しく強化し,不正取引を緩和し,グローバルサプライチェーンの規制執行を強化する可能性を実証した。
論文 参考訳(メタデータ) (2025-02-21T03:16:19Z) - The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.18519360412294]
大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。
本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。
我々は,DeepSeek-R1をベンチマークでテストした結果を解析し,この高い評価を得たモデルがもたらす批判的倫理的懸念を明らかにする。
論文 参考訳(メタデータ) (2025-01-20T06:35:01Z) - Climate AI for Corporate Decarbonization Metrics Extraction [7.522638089716454]
コーポレートデカーボライズメトリックス抽出(CAI)モデルとパイプラインについて紹介する。
本研究では, 企業公開情報からのデータキュレーション, 検証, 評価を自動化することにより, データの収集効率と精度を向上させることを実証する。
論文 参考訳(メタデータ) (2024-11-05T18:37:51Z) - Enhancing Legal Compliance and Regulation Analysis with Large Language Models [0.0]
本研究では,法律規定を正確に分類し,コンプライアンスチェックを自動化するために,LLM(Large Language Models)の適用について検討する。
以上より, LLMsは, 法的コンプライアンスと規制分析の効率化, 特に手作業量削減, 適切な時間的金融制約下での精度向上に寄与する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-26T16:40:49Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。