論文の概要: Identifying Emerging Concepts in Large Corpora
- arxiv url: http://arxiv.org/abs/2502.21315v1
- Date: Fri, 28 Feb 2025 18:59:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:44:15.779010
- Title: Identifying Emerging Concepts in Large Corpora
- Title(参考訳): 大規模コーパスにおける創発概念の同定
- Authors: Sibo Ma, Julian Nyarko,
- Abstract要約: 大規模テキストコーパスにおける新しい概念を識別する手法を提案する。
基礎となる埋め込み空間の熱マップの変化を解析することにより、これらの概念を発生直後に高い精度で検出することができる。
- 参考スコア(独自算出の注目度): 0.1478468781294373
- License:
- Abstract: We introduce a new method to identify emerging concepts in large text corpora. By analyzing changes in the heatmaps of the underlying embedding space, we are able to detect these concepts with high accuracy shortly after they originate, in turn outperforming common alternatives. We further demonstrate the utility of our approach by analyzing speeches in the U.S. Senate from 1941 to 2015. Our results suggest that the minority party is more active in introducing new concepts into the Senate discourse. We also identify specific concepts that closely correlate with the Senators' racial, ethnic, and gender identities. An implementation of our method is publicly available.
- Abstract(参考訳): 大規模テキストコーパスにおける新しい概念を識別する手法を提案する。
基礎となる埋め込み空間の熱マップの変化を解析することにより、これらの概念を発生直後に高い精度で検出することができ、結果として共通の選択肢よりも優れている。
1941年から2015年までのアメリカ合衆国上院での演説を分析することで、我々のアプローチの有用性をさらに実証する。
以上の結果から,少数党は上院の言論に新たな概念を導入する上で,より活発であることが示唆された。
我々はまた、上院議員の人種、民族、性別のアイデンティティと密接に関連している特定の概念を特定する。
提案手法の実装が公開されている。
関連論文リスト
- Scaling Concept With Text-Guided Diffusion Models [53.80799139331966]
概念を置き換える代わりに、概念自体を強化するか、あるいは抑圧できるだろうか?
ScalingConceptは、分解された概念を、新しい要素を導入することなく、実際の入力でスケールアップまたはスケールダウンする、シンプルで効果的な方法である。
さらに重要なのは、ScalingConceptは画像とオーディオドメインにまたがる様々な新しいゼロショットアプリケーションを可能にすることだ。
論文 参考訳(メタデータ) (2024-10-31T17:09:55Z) - PanoSent: A Panoptic Sextuple Extraction Benchmark for Multimodal Conversational Aspect-based Sentiment Analysis [74.41260927676747]
本稿では,マルチモーダル対話感分析(ABSA)を導入することでギャップを埋める。
タスクをベンチマークするために、手動と自動の両方で注釈付けされたデータセットであるPanoSentを構築し、高品質、大規模、マルチモーダル、マルチ言語主義、マルチシナリオを特徴とし、暗黙の感情要素と明示的な感情要素の両方をカバーする。
課題を効果的に解決するために,新しい多モーダルな大規模言語モデル(すなわちSentica)とパラフレーズベースの検証機構とともに,新しい感覚の連鎖推論フレームワークを考案した。
論文 参考訳(メタデータ) (2024-08-18T13:51:01Z) - LEACE: Perfect linear concept erasure in closed form [103.61624393221447]
概念消去は、特定の特徴を表現から削除することを目的としている。
LEAst-squares Concept Erasure (LEACE) は、線形分類器が可能な限り少ない表現で概念を検出することを確実に防止する閉形式手法である。
LEACEを"concept scrubbing"と呼ばれる新しい手法で大規模言語モデルに適用し、ネットワーク内の各層からターゲット概念情報を消去する。
論文 参考訳(メタデータ) (2023-06-06T16:07:24Z) - Exploring and Verbalizing Academic Ideas by Concept Co-occurrence [42.16213986603552]
本研究は,学術的アイデアインスピレーションのための概念共起に基づく枠組みを考案する。
我々は20の分野やトピックから概念の共起関係に基づき、進化する概念グラフを構築する。
我々は、共起励磁法と呼ばれる新しいデータ構造に基づくアイデアの記述を生成する。
論文 参考訳(メタデータ) (2023-06-04T07:01:30Z) - Unsupervised Detection of Contextualized Embedding Bias with Application
to Ideology [20.81930455526026]
本研究では,コンテキスト適応型埋め込みにおけるバイアスを検出するための教師なし手法を提案する。
本手法をオンラインディスカッションフォーラムに適用し,提案手法を提案する。
我々の実験は、イデオロギーのサブスペースが抽象的な評価意味論を符号化し、ドナルド・トランプの大統領在任中に政治的左翼スペクトルの変化を反映していることを示唆している。
論文 参考訳(メタデータ) (2022-12-14T23:31:14Z) - Comparing Voting Districts with Uncertain Data Envelopment Analysis [0.0]
ジェリーマンダーリングの投票地区は現代アメリカ社会の最も健全な関心事の1つである。
本研究では、不確実なデータ包絡分析を用いて、様々なメトリクスのマップを評価する方法を示す。
論文 参考訳(メタデータ) (2022-09-02T20:12:27Z) - Mundus vult decipi, ergo decipiatur: Visual Communication of Uncertainty
in Election Polls [56.8172499765118]
我々は、今放送と予測におけるバイアスの潜在的な源について論じる。
概念は、誤認識された正確性の問題を軽減するために提示される。
主要なアイデアの1つは、パーティーシェアではなくイベントの確率を使うことである。
論文 参考訳(メタデータ) (2021-04-28T07:02:24Z) - Positionality-Weighted Aggregation Methods for Cumulative Voting [0.0]
そこで本稿では,少数派が中心的累積投票における地位を重み付けする集計手法を提案する。
マイノリティの意見は、上記の3つの方法のうちの2つの方法で分布の平均に比例して反映される可能性が高い。
集計結果の分析からマイノリティの数と位置を可視化することが可能である。
論文 参考訳(メタデータ) (2020-08-20T03:55:49Z) - EmotiCon: Context-Aware Multimodal Emotion Recognition using Frege's
Principle [71.47160118286226]
EmotiConは、ビデオや画像から知覚された人間の感情認識をコンテキスト認識する学習アルゴリズムである。
心理学からフレーゲの文脈原理に動機づけられた我々のアプローチは、感情認識のための文脈の3つの解釈を組み合わせたものである。
平均精度 (AP) スコアは26クラスで35.48であり, 従来の手法よりも7-8の改善が見られた。
論文 参考訳(メタデータ) (2020-03-14T19:55:21Z) - InfoBot: Transfer and Exploration via the Information Bottleneck [105.28380750802019]
強化学習における中心的な課題は、報酬がわずかに分散されたタスクに対する効果的なポリシーを見つけることである。
我々は、事前の経験から意思決定状態について学ぶことを提案する。
この単純なメカニズムは、部分的に観察された状態であっても、決定状態を効果的に識別する。
論文 参考訳(メタデータ) (2019-01-30T15:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。