論文の概要: Climate AI for Corporate Decarbonization Metrics Extraction
- arxiv url: http://arxiv.org/abs/2411.03402v1
- Date: Tue, 05 Nov 2024 18:37:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-07 19:24:40.165977
- Title: Climate AI for Corporate Decarbonization Metrics Extraction
- Title(参考訳): コーポレート脱炭メトリクス抽出のための気候AI
- Authors: Aditya Dave, Mengchen Zhu, Dapeng Hu, Sachin Tiwari,
- Abstract要約: コーポレートデカーボライズメトリックス抽出(CAI)モデルとパイプラインについて紹介する。
本研究では, 企業公開情報からのデータキュレーション, 検証, 評価を自動化することにより, データの収集効率と精度を向上させることを実証する。
- 参考スコア(独自算出の注目度): 7.522638089716454
- License:
- Abstract: Corporate Greenhouse Gas (GHG) emission targets are important metrics in sustainable investing [12, 16]. To provide a comprehensive view of company emission objectives, we propose an approach to source these metrics from company public disclosures. Without automation, curating these metrics manually is a labor-intensive process that requires combing through lengthy corporate sustainability disclosures that often do not follow a standard format. Furthermore, the resulting dataset needs to be validated thoroughly by Subject Matter Experts (SMEs), further lengthening the time-to-market. We introduce the Climate Artificial Intelligence for Corporate Decarbonization Metrics Extraction (CAI) model and pipeline, a novel approach utilizing Large Language Models (LLMs) to extract and validate linked metrics from corporate disclosures. We demonstrate that the process improves data collection efficiency and accuracy by automating data curation, validation, and metric scoring from public corporate disclosures. We further show that our results are agnostic to the choice of LLMs. This framework can be applied broadly to information extraction from textual data.
- Abstract(参考訳): コーポレート・温室効果ガス(GHG)排出目標は持続可能な投資 [12, 16] において重要な指標である。
企業の排出目標を包括的に把握するために,企業の公開情報からこれらの指標を抽出するアプローチを提案する。
自動化がなければ、これらのメトリクスを手作業でキュレートするのは、標準フォーマットに従わない長い企業持続可能性開示をマージする必要がある、労働集約的なプロセスです。
さらに、得られたデータセットは、サブジェクト・マター・エキスパート(SME)によって徹底的に検証され、市場投入までの時間を延長する必要がある。
コーポレート・デカーボライズ・メトリックス抽出のための気候人工知能(CAI)モデルとパイプラインを導入し,企業情報からリンクメトリクスを抽出し,検証する大規模言語モデル(LLM)を用いた新しいアプローチを提案する。
本研究では, 企業公開情報からのデータキュレーション, 検証, 評価を自動化することにより, データの収集効率と精度を向上させることを実証する。
さらに, LLMの選択には無関係であることを示す。
このフレームワークは、テキストデータから情報抽出に広く適用することができる。
関連論文リスト
- A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models [0.0]
SEC10-Kの申請に基づいて企業の業績を分析し,評価する,新たなデータ駆動型アプローチを提案する。
提案手法は、データパイプラインを実行して視覚化を作成するためのノーコードソリューションとして、対話型GUI上に実装される。
このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
論文 参考訳(メタデータ) (2024-09-26T06:57:22Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Automating Customer Needs Analysis: A Comparative Study of Large Language Models in the Travel Industry [2.4244694855867275]
大規模言語モデル(LLM)は、大量のテキストデータから貴重な洞察を抽出するための強力なツールとして登場した。
本研究では,TripAdvisor 投稿から旅行客のニーズを抽出するための LLM の比較分析を行った。
特にMistral 7Bは,大規模クローズドモデルに匹敵する性能を示した。
論文 参考訳(メタデータ) (2024-04-27T18:28:10Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - Harnessing the Web and Knowledge Graphs for Automated Impact Investing
Scoring [2.4107880640624706]
持続可能な開発目標のフレームワークを作成するプロセスを自動化するための,データ駆動システムについて説明する。
本稿では,異なるWebソースからテキストのデータセットを収集・フィルタリングする新しい手法と,企業の集合に関連する知識グラフを提案する。
以上の結果から,我々の最高性能モデルでは,マイクロ平均F1スコア0.89でSDGスコアを正確に予測できることがわかった。
論文 参考訳(メタデータ) (2023-08-04T15:14:16Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - METAM: Goal-Oriented Data Discovery [9.73435089036831]
METAMは目標指向のフレームワークで、下流タスクを候補データセットでクエリし、フィードバックループを形成して、発見と拡張プロセスを自動的に管理する。
我々はMETAMの理論的保証を示し、それらを幅広いタスクセットで実証的に示す。
論文 参考訳(メタデータ) (2023-04-18T15:42:25Z) - Greenhouse gases emissions: estimating corporate non-reported emissions
using interpretable machine learning [0.0]
2022年現在、温室効果ガス(GHG)排出量の報告と監査はすべての企業に対して義務付けられていない。
我々は、まだ報告していない企業のスコープ1とスコープ2のGHG排出量を推定する機械学習モデルを提案する。
論文 参考訳(メタデータ) (2022-12-21T08:36:02Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。