論文の概要: Monitoring geometrical properties of word embeddings for detecting the
emergence of new topics
- arxiv url: http://arxiv.org/abs/2111.03496v1
- Date: Fri, 5 Nov 2021 13:31:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-08 17:53:32.857325
- Title: Monitoring geometrical properties of word embeddings for detecting the
emergence of new topics
- Title(参考訳): 新しい話題の出現を検知する単語埋め込みの幾何学的性質のモニタリング
- Authors: Cl\'ement Christophe, Julien Velcin, Jairo Cugliari, Manel Boumghar,
Philippe Suignard
- Abstract要約: 徐々に出現するトピックを早期に検出する問題に対処する。
本稿では,埋め込み空間における単語表現の挙動を監視することを提案する。
論文と学術論文の2つの公開データセットにおいて,最先端の手法よりも優れた結果が得られた。
- 参考スコア(独自算出の注目度): 2.4411595994266797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Slow emerging topic detection is a task between event detection, where we
aggregate behaviors of different words on short period of time, and language
evolution, where we monitor their long term evolution. In this work, we tackle
the problem of early detection of slowly emerging new topics. To this end, we
gather evidence of weak signals at the word level. We propose to monitor the
behavior of words representation in an embedding space and use one of its
geometrical properties to characterize the emergence of topics. As evaluation
is typically hard for this kind of task, we present a framework for
quantitative evaluation. We show positive results that outperform
state-of-the-art methods on two public datasets of press and scientific
articles.
- Abstract(参考訳): トピック検出の遅さは、さまざまな単語の振る舞いを短時間に集約するイベント検出と、その長期的な進化を監視する言語進化の間のタスクである。
本研究では,徐々に出現するトピックを早期に検出する問題に対処する。
この目的のために、我々は単語レベルで弱い信号の証拠を収集する。
本稿では,埋め込み空間における単語表現の挙動を監視し,その幾何学的特性の1つを用いてトピックの出現を特徴付けることを提案する。
評価はこの種のタスクでは一般的に難しいので,定量的評価のための枠組みを提案する。
論文と学術論文の2つの公開データセットにおいて,最先端の手法よりも優れた結果が得られた。
関連論文リスト
- Graph-based Clustering for Detecting Semantic Change Across Time and
Languages [10.058655884092094]
本稿では,高頻度・低周波両方の単語知覚におけるニュアンス変化を時間的・言語的に捉えたグラフベースのクラスタリング手法を提案する。
提案手法は,4言語にわたるSemEval 2020バイナリ分類タスクにおいて,従来のアプローチを大幅に上回っている。
論文 参考訳(メタデータ) (2024-02-01T21:27:19Z) - The devil is in the fine-grained details: Evaluating open-vocabulary
object detectors for fine-grained understanding [9.063831016543437]
本研究では,動的語彙生成に基づく評価プロトコルを導入し,モデルがオブジェクトに対して正確な粒度記述を検出し,識別し,割り当てるかどうかを検証する。
提案プロトコルを用いて,最先端のオープンボキャブラリオブジェクト検出器を複数評価することにより,研究をさらに強化する。
論文 参考訳(メタデータ) (2023-11-29T10:40:52Z) - An Overview Of Temporal Commonsense Reasoning and Acquisition [20.108317515225504]
時間的コモンセンス推論(英: Temporal Commonsense reasoning)とは、フレーズ、行動、出来事の典型的な時間的文脈を理解する能力である。
大規模言語モデルの性能に関する最近の研究は、しばしば推論においてショートカットを行い、単純な言語トラップに陥ることが示唆されている。
論文 参考訳(メタデータ) (2023-07-28T01:30:15Z) - Inverse Dynamics Pretraining Learns Good Representations for Multitask
Imitation [66.86987509942607]
このようなパラダイムを模倣学習でどのように行うべきかを評価する。
本稿では,事前学習コーパスがマルチタスクのデモンストレーションから成り立つ環境について考察する。
逆動力学モデリングはこの設定に適していると主張する。
論文 参考訳(メタデータ) (2023-05-26T14:40:46Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Spatio-temporal predictive tasks for abnormal event detection in videos [60.02503434201552]
オブジェクトレベルの正規化パターンを学習するための制約付きプレテキストタスクを提案する。
我々のアプローチは、ダウンスケールの視覚的クエリとそれに対応する正常な外観と運動特性のマッピングを学習することである。
いくつかのベンチマークデータセットの実験では、異常の局所化と追跡のためのアプローチの有効性が示されている。
論文 参考訳(メタデータ) (2022-10-27T19:45:12Z) - Temporal Analysis on Topics Using Word2Vec [0.0]
本研究では,トレンド検出と可視化の新しい手法を提案する。具体的には,話題の変化を時間とともにモデル化する。
この手法は、20のNews Groupsデータセットに存在する様々なメディアハウスの記事群でテストされた。
論文 参考訳(メタデータ) (2022-09-23T16:51:29Z) - Fine-Grained Visual Entailment [51.66881737644983]
そこで本稿では,テキストから画像への微粒な知識要素の論理的関係を予測することを目的として,このタスクの拡張を提案する。
従来の研究とは異なり、本手法は本質的に説明可能であり、異なるレベルの粒度で論理的予測を行う。
本手法は,手動でアノテートした知識要素のデータセットを用いて評価し,この課題に対して68.18%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-03-29T16:09:38Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。
何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文 参考訳(メタデータ) (2021-02-03T18:19:16Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。