論文の概要: EcoVerse: An Annotated Twitter Dataset for Eco-Relevance Classification, Environmental Impact Analysis, and Stance Detection
- arxiv url: http://arxiv.org/abs/2404.05133v1
- Date: Mon, 8 Apr 2024 01:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 15:43:25.330222
- Title: EcoVerse: An Annotated Twitter Dataset for Eco-Relevance Classification, Environmental Impact Analysis, and Stance Detection
- Title(参考訳): EcoVerse:Eco-Relevance分類、環境影響分析、スタンス検出のためのアノテーション付きTwitterデータセット
- Authors: Francesca Grasso, Stefano Locci, Giovanni Siragusa, Luigi Di Caro,
- Abstract要約: EcoVerseは、さまざまな環境トピックにまたがる3,023のツイートからなる、英語の注釈付きTwitterデータセットである。
本研究では,環境関連分類,スタンス検出,環境影響分析のための独自のアプローチの導入を目的とした3段階のアノテーションスキームを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anthropogenic ecological crisis constitutes a significant challenge that all within the academy must urgently face, including the Natural Language Processing (NLP) community. While recent years have seen increasing work revolving around climate-centric discourse, crucial environmental and ecological topics outside of climate change remain largely unaddressed, despite their prominent importance. Mainstream NLP tasks, such as sentiment analysis, dominate the scene, but there remains an untouched space in the literature involving the analysis of environmental impacts of certain events and practices. To address this gap, this paper presents EcoVerse, an annotated English Twitter dataset of 3,023 tweets spanning a wide spectrum of environmental topics. We propose a three-level annotation scheme designed for Eco-Relevance Classification, Stance Detection, and introducing an original approach for Environmental Impact Analysis. We detail the data collection, filtering, and labeling process that led to the creation of the dataset. Remarkable Inter-Annotator Agreement indicates that the annotation scheme produces consistent annotations of high quality. Subsequent classification experiments using BERT-based models, including ClimateBERT, are presented. These yield encouraging results, while also indicating room for a model specifically tailored for environmental texts. The dataset is made freely available to stimulate further research.
- Abstract(参考訳): 人類学的な生態危機は、NLP(Natural Language Processing)コミュニティを含む、アカデミー内のすべての人が緊急に直面しなければならない重要な課題である。
近年、気候中心の談話を中心に活動が活発化しているが、気候変動以外の重要な環境や生態に関する話題は、その重要な重要性にもかかわらず、ほとんど未解決のままである。
感情分析のようなメインストリームのNLPタスクが現場を支配しているが、特定の事象や実践の環境影響の分析を含む文献には、まだ触れられていない領域が残っている。
このギャップに対処するために、EcoVerseは、幅広い環境トピックにまたがる3,023のつぶやきからなる注釈付き英語のTwitterデータセットである。
本研究では,環境関連分類,スタンス検出,環境影響分析のための独自のアプローチの導入を目的とした3段階のアノテーションスキームを提案する。
データセットの作成に繋がったデータ収集、フィルタリング、ラベル付けのプロセスについて詳述する。
Remarkable Inter-Annotator Agreementは、アノテーションスキームが高品質の一貫性のあるアノテーションを生成することを示している。
BERTモデルを用いたその後の分類実験について述べる。
これらの結果は、特に環境テキストに適したモデルのための余地を示す一方で、奨励的な結果をもたらす。
このデータセットは、さらなる研究を刺激するために自由に利用できる。
関連論文リスト
- Multi-environment Topic Models [8.609587510471943]
我々は,グローバルおよび環境特化用語を分離した教師なし確率モデルであるマルチ環境トピックモデル(MTM)を導入する。
MTMは、異なる環境特化語で解釈可能なグローバルトピックを生成する。
また、正確な因果関係の発見も可能である。
論文 参考訳(メタデータ) (2024-10-31T16:50:39Z) - Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - VegeDiff: Latent Diffusion Model for Geospatial Vegetation Forecasting [58.12667617617306]
地理空間植生予測タスクのためのVegeDiffを提案する。
VegeDiffは、植物の変化過程の不確かさを確率的に捉えるために拡散モデルを使用した最初の企業である。
植生の変化の不確かさを捉え、関連する変数の複雑な影響をモデル化することで、VegeDiffは既存の決定論的手法より優れている。
論文 参考訳(メタデータ) (2024-07-17T14:15:52Z) - Towards A Comprehensive Assessment of AI's Environmental Impact [0.5982922468400899]
機械学習に対する最近の関心の高まりは、AI/MLの大規模採用に拍車をかけた。
ライフサイクルを通じて、AI/MLから環境への影響と劣化を監視するフレームワークが必要である。
本研究では、オープンなエネルギーデータとグローバルに取得した衛星観測を用いて、データセンター周辺におけるAIの多面的影響に関連する環境変数を追跡する手法を提案する。
論文 参考訳(メタデータ) (2024-05-22T21:19:35Z) - FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems [28.166089112650926]
FREEは利用可能な環境データをテキスト空間にマッピングし、環境科学における従来の予測モデリングタスクを意味認識問題に変換する。
長期予測に使用する場合、FREEは将来予測を強化するために新たに収集した観測を組み込む柔軟性を持つ。
FREEの有効性は、2つの社会的に重要な実世界の応用の文脈で評価され、デラウェア川流域の河川水温を予測し、イリノイ州とアイオワ州で毎年トウモロコシの収量を予測する。
論文 参考訳(メタデータ) (2023-11-17T00:53:09Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - Unraveling the hidden environmental impacts of AI solutions for
environment [0.04588028371034406]
過去10年間、人工知能はこのような劇的な進歩に遭遇し、現在、環境問題を解決するツールとして選択されている。
ディープラーニングコミュニティは、より多くのパラメータを持つトレーニングモデルには大量のエネルギーと結果としてGHG排出量が必要であることに気付き始めた。
本稿では,「緑のためのAI」の負の影響について考察する。
論文 参考訳(メタデータ) (2021-10-22T14:56:47Z) - Analyzing Sustainability Reports Using Natural Language Processing [68.8204255655161]
近年、企業は環境への影響を緩和し、気候変動の状況に適応することを目指している。
これは、環境・社会・ガバナンス(ESG)の傘下にある様々な種類の気候リスクと暴露を網羅する、ますます徹底した報告を通じて報告されている。
本稿では,本稿で開発したツールと方法論について紹介する。
論文 参考訳(メタデータ) (2020-11-03T21:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。