Fugu-MT 論文翻訳(概要): Monitoring geometrical properties of word embeddings for detecting the emergence of new topics

論文の概要: Monitoring geometrical properties of word embeddings for detecting the emergence of new topics

arxiv url: http://arxiv.org/abs/2111.03496v1
Date: Fri, 5 Nov 2021 13:31:56 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-08 17:53:32.857325
Title: Monitoring geometrical properties of word embeddings for detecting the emergence of new topics
Title（参考訳）: 新しい話題の出現を検知する単語埋め込みの幾何学的性質のモニタリング
Authors: Cl\'ement Christophe, Julien Velcin, Jairo Cugliari, Manel Boumghar, Philippe Suignard
Abstract要約: 徐々に出現するトピックを早期に検出する問題に対処する。本稿では,埋め込み空間における単語表現の挙動を監視することを提案する。論文と学術論文の2つの公開データセットにおいて,最先端の手法よりも優れた結果が得られた。
参考スコア（独自算出の注目度）: 2.4411595994266797
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Slow emerging topic detection is a task between event detection, where we aggregate behaviors of different words on short period of time, and language evolution, where we monitor their long term evolution. In this work, we tackle the problem of early detection of slowly emerging new topics. To this end, we gather evidence of weak signals at the word level. We propose to monitor the behavior of words representation in an embedding space and use one of its geometrical properties to characterize the emergence of topics. As evaluation is typically hard for this kind of task, we present a framework for quantitative evaluation. We show positive results that outperform state-of-the-art methods on two public datasets of press and scientific articles.
Abstract（参考訳）: トピック検出の遅さは、さまざまな単語の振る舞いを短時間に集約するイベント検出と、その長期的な進化を監視する言語進化の間のタスクである。本研究では,徐々に出現するトピックを早期に検出する問題に対処する。この目的のために、我々は単語レベルで弱い信号の証拠を収集する。本稿では,埋め込み空間における単語表現の挙動を監視し,その幾何学的特性の1つを用いてトピックの出現を特徴付けることを提案する。評価はこの種のタスクでは一般的に難しいので,定量的評価のための枠組みを提案する。論文と学術論文の2つの公開データセットにおいて,最先端の手法よりも優れた結果が得られた。

関連論文リスト

BERTrend: Neural Topic Modeling for Emerging Trends Detection [0.0]
BERTrendは、大規模で進化しているテキストコーパスの出現傾向を監視する新しい方法である。オンライン環境で神経トピックモデリングを使用して、意味のある弱い信号を正確に検出し、追跡する。この手法は過去の出来事の振り返り分析にも利用できる。
論文参考訳（メタデータ） (2024-11-08T19:31:19Z)
Double Mixture: Towards Continual Event Detection from Speech [60.33088725100812]
音声イベント検出は、セマンティックイベントと音響イベントの両方のタグ付けを含むマルチメディア検索に不可欠である。本稿では, 音声イベント検出における主な課題として, 過去の出来事を忘れることなく新たな事象を連続的に統合すること, 音響イベントからの意味のゆがみについて述べる。本稿では,適応性を向上し,忘れることを防止するために,音声の専門知識と堅牢な記憶機構を融合する新しい手法「ダブルミキチャー」を提案する。
論文参考訳（メタデータ） (2024-04-20T06:32:00Z)
Graph-based Clustering for Detecting Semantic Change Across Time and Languages [10.058655884092094]
本稿では,高頻度・低周波両方の単語知覚におけるニュアンス変化を時間的・言語的に捉えたグラフベースのクラスタリング手法を提案する。提案手法は,4言語にわたるSemEval 2020バイナリ分類タスクにおいて,従来のアプローチを大幅に上回っている。
論文参考訳（メタデータ） (2024-02-01T21:27:19Z)
An Overview Of Temporal Commonsense Reasoning and Acquisition [20.108317515225504]
時間的コモンセンス推論(英: Temporal Commonsense reasoning)とは、フレーズ、行動、出来事の典型的な時間的文脈を理解する能力である。大規模言語モデルの性能に関する最近の研究は、しばしば推論においてショートカットを行い、単純な言語トラップに陥ることが示唆されている。
論文参考訳（メタデータ） (2023-07-28T01:30:15Z)
A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and Future [6.4105103117533755]
分類学は、まず様々なタスクと方法論を整理するために開発された。提案した分類法は、オブジェクト検出、セマンティック/インスタンス/パノプティクスのセグメンテーション、3Dとビデオの理解など、さまざまなタスクにまたがって普遍的である。
論文参考訳（メタデータ） (2023-07-18T12:52:49Z)
Topics in the Haystack: Extracting and Evaluating Topics beyond Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文参考訳（メタデータ） (2023-03-30T12:24:25Z)
Spatio-temporal predictive tasks for abnormal event detection in videos [60.02503434201552]
オブジェクトレベルの正規化パターンを学習するための制約付きプレテキストタスクを提案する。我々のアプローチは、ダウンスケールの視覚的クエリとそれに対応する正常な外観と運動特性のマッピングを学習することである。いくつかのベンチマークデータセットの実験では、異常の局所化と追跡のためのアプローチの有効性が示されている。
論文参考訳（メタデータ） (2022-10-27T19:45:12Z)
Fine-Grained Visual Entailment [51.66881737644983]
そこで本稿では,テキストから画像への微粒な知識要素の論理的関係を予測することを目的として,このタスクの拡張を提案する。従来の研究とは異なり、本手法は本質的に説明可能であり、異なるレベルの粒度で論理的予測を行う。本手法は,手動でアノテートした知識要素のデータセットを用いて評価し,この課題に対して68.18%の精度を達成できることを示す。
論文参考訳（メタデータ） (2022-03-29T16:09:38Z)
UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-05-28T19:44:24Z)
Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文参考訳（メタデータ） (2021-02-03T18:19:16Z)
Be More with Less: Hypergraph Attention Networks for Inductive Text Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文参考訳（メタデータ） (2020-11-01T00:21:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。