論文の概要: CLIMATELI: Evaluating Entity Linking on Climate Change Data
- arxiv url: http://arxiv.org/abs/2406.16732v1
- Date: Mon, 24 Jun 2024 15:36:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 14:15:21.804136
- Title: CLIMATELI: Evaluating Entity Linking on Climate Change Data
- Title(参考訳): CLIMATELI: 気候変動データに基づくエンティティリンクの評価
- Authors: Shijia Zhou, Siyao Peng, Barbara Plank,
- Abstract要約: 気候変動(CC)は世界的重要性のトピックであり、研究分野に注目が集まっている。
我々は3,087個のエンティティをWikipediaにリンクする最初の手動注釈付きCCデータセットであるCLIMATELIを提示する。
ELモデルの性能はトークンレベルとエンティティレベルの両方で人間に遅れていることが判明した。
- 参考スコア(独自算出の注目度): 23.059491714512077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Climate Change (CC) is a pressing topic of global importance, attracting increasing attention across research fields, from social sciences to Natural Language Processing (NLP). CC is also discussed in various settings and communication platforms, from academic publications to social media forums. Understanding who and what is mentioned in such data is a first critical step to gaining new insights into CC. We present CLIMATELI (CLIMATe Entity LInking), the first manually annotated CC dataset that links 3,087 entity spans to Wikipedia. Using CLIMATELI (CLIMATe Entity LInking), we evaluate existing entity linking (EL) systems on the CC topic across various genres and propose automated filtering methods for CC entities. We find that the performance of EL models notably lags behind humans at both token and entity levels. Testing within the scope of retaining or excluding non-nominal and/or non-CC entities particularly impacts the models' performances.
- Abstract(参考訳): 気候変動(CC)は、社会科学から自然言語処理(NLP)まで、研究分野に注目が集まっている。
CCはまた、学術出版物からソーシャルメディアフォーラムまで、様々な設定やコミュニケーションプラットフォームで議論されている。
このようなデータで言及されている誰と何を理解することは、CCに対する新たな洞察を得るための最初の重要なステップである。
今回,CLIMATELI(CLIMATe Entity LInking)について紹介する。
CLIMATELI(CLIMATe Entity Linking)を用いて,CCトピック上の既存のエンティティリンク(EL)システムの評価を行い,CCエンティティの自動フィルタリング手法を提案する。
ELモデルの性能はトークンレベルとエンティティレベルの両方で人間に遅れていることが判明した。
非nominalおよび/または非CCエンティティの保持または除外の範囲内でのテストは、特にモデルのパフォーマンスに影響を与える。
関連論文リスト
- CCUP: A Controllable Synthetic Data Generation Pipeline for Pretraining Cloth-Changing Person Re-Identification Models [6.892813084970311]
衣服交換者再識別(CC-ReID)はコンピュータビジョンにおいて重要かつ困難な研究課題である。
CC-ReIDデータの構築コストが高いため、既存のデータ駆動モデルは、限られたデータで効率的にトレーニングするのは難しい。
制御可能かつ高品質な合成データを生成するための低コストで効率的なパイプラインを提案する。
論文 参考訳(メタデータ) (2024-10-17T14:04:02Z) - Real World Conversational Entity Linking Requires More Than Zeroshots [50.5691094768954]
本研究では,資源制約下でのELモデルの有効性を評価するための評価シナリオを設計する。
本稿では、Fandomと新しいゼロショット対話型エンティティリンクデータセットを用いて、ELモデルの未知KBへの一般化能力を評価する。
その結果,既存のゼロショットELモデルでは,事前トレーニングなしで新しいドメイン固有KBを導入するとフェールすることがわかった。
論文 参考訳(メタデータ) (2024-09-02T10:37:53Z) - Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.00092709848619]
コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。
POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。
本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:32:41Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - KEPLET: Knowledge-Enhanced Pretrained Language Model with Topic Entity
Awareness [12.90996504014071]
Topicエンティティ認識を備えた知識強化型LanguagEモデルKEPLETを提案する。
エンドツーエンドの方法で、KEPLETはトピックエンティティの情報をWikipediaの文に追加する場所を特定する。
2つの代表KEPLMに適用したKePLETの一般性と優越性を示す実験を行った。
論文 参考訳(メタデータ) (2023-05-02T22:28:26Z) - TempEL: Linking Dynamically Evolving and Newly Emerging Entities [50.980331847622026]
進化を続ける世界では、エンティティは時間とともに変化し、これまで存在していなかった、あるいは未知の、新しいエンティティが現れます。
本研究では,この進化シナリオが,十分に確立されたエンティティリンク(EL)タスクの性能に与える影響について検討する。
我々は,2013年から2022年までの英語ウィキペディアスナップショットからなるエンティティリンクデータセットであるTempELを紹介した。
論文 参考訳(メタデータ) (2023-02-05T22:34:36Z) - Scene-to-Patch Earth Observation: Multiple Instance Learning for Land
Cover Classification [6.595290783361959]
土地被覆分類 (LCC) は気候変動の緩和と適応において重要なプロセスである。
LCCのための地球観測データと機械学習を使用する既存のアプローチは、完全に注釈付きおよびセグメント化されたデータセットに依存している。
我々は,高レベルなシーンラベルのみを必要とするマルチインスタンス学習(MIL)を利用したLCCアプローチであるScene-to-Patchモデルを提案する。
論文 参考訳(メタデータ) (2022-11-15T15:58:34Z) - Beyond Supervised Continual Learning: a Review [69.9674326582747]
連続学習(Continuous Learning, CL)は、定常データ分布の通常の仮定を緩和または省略する機械学習のフレーバーである。
データ分布の変化は、いわゆる破滅的な忘れ(CF)効果、すなわち、過去の知識の突然の喪失を引き起こす可能性がある。
本稿では、CLを他の環境で研究する文献をレビューする。例えば、監督を減らした学習、完全に教師なしの学習、強化学習などである。
論文 参考訳(メタデータ) (2022-08-30T14:44:41Z) - One-Class Classification: A Survey [96.17410674315816]
One-Class Classification (OCC) は、トレーニング中に観測されたデータが単一の正のクラスからのものであるマルチクラス分類の特別なケースである。
視覚認識のための古典的統計的および最近の深層学習に基づくOCC手法のサーベイを提供する。
論文 参考訳(メタデータ) (2021-01-08T15:30:29Z) - ClimaText: A Dataset for Climate Change Topic Detection [2.9767565026354186]
文に基づく気候変動トピック検出のためのデータセットであるtextscClimaTextを紹介した。
一般的なキーワードベースのモデルは、そのような複雑で進化するタスクには不十分であることがわかった。
我々の分析は、いくつかの面で改善する大きな可能性を明らかにしている。
論文 参考訳(メタデータ) (2020-12-01T13:42:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。