論文の概要: Identifying Emerging Concepts in Large Corpora
- arxiv url: http://arxiv.org/abs/2502.21315v1
- Date: Fri, 28 Feb 2025 18:59:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 16:38:46.127284
- Title: Identifying Emerging Concepts in Large Corpora
- Title(参考訳): 大規模コーパスにおける創発概念の同定
- Authors: Sibo Ma, Julian Nyarko,
- Abstract要約: 大規模テキストコーパスにおける新しい概念を識別する手法を提案する。
基礎となる埋め込み空間の熱マップの変化を解析することにより、これらの概念を発生直後に高い精度で検出することができる。
- 参考スコア(独自算出の注目度): 0.1478468781294373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a new method to identify emerging concepts in large text corpora. By analyzing changes in the heatmaps of the underlying embedding space, we are able to detect these concepts with high accuracy shortly after they originate, in turn outperforming common alternatives. We further demonstrate the utility of our approach by analyzing speeches in the U.S. Senate from 1941 to 2015. Our results suggest that the minority party is more active in introducing new concepts into the Senate discourse. We also identify specific concepts that closely correlate with the Senators' racial, ethnic, and gender identities. An implementation of our method is publicly available.
- Abstract(参考訳): 大規模テキストコーパスにおける新しい概念を識別する手法を提案する。
基礎となる埋め込み空間の熱マップの変化を解析することにより、これらの概念を発生直後に高い精度で検出することができ、結果として共通の選択肢よりも優れている。
1941年から2015年までのアメリカ合衆国上院での演説を分析することで、我々のアプローチの有用性をさらに実証する。
以上の結果から,少数党は上院の言論に新たな概念を導入する上で,より活発であることが示唆された。
我々はまた、上院議員の人種、民族、性別のアイデンティティと密接に関連している特定の概念を特定する。
提案手法の実装が公開されている。
関連論文リスト
- Synchronization between media followers and political supporters during an election process: towards a real time study [0.18749305679160366]
我々は、2022年のフランス大統領選挙における様々な候補者の支持者の間で、Twitterにおける議論のダイナミクス(Xになる前)について分析する。
本研究は,特定のトピックに関する異なるグループ間の関心の同期を自動的に検出できることを実証する。
論文 参考訳(メタデータ) (2025-03-07T16:25:58Z) - Scaling Concept With Text-Guided Diffusion Models [53.80799139331966]
概念を置き換える代わりに、概念自体を強化するか、あるいは抑圧できるだろうか?
ScalingConceptは、分解された概念を、新しい要素を導入することなく、実際の入力でスケールアップまたはスケールダウンする、シンプルで効果的な方法である。
さらに重要なのは、ScalingConceptは画像とオーディオドメインにまたがる様々な新しいゼロショットアプリケーションを可能にすることだ。
論文 参考訳(メタデータ) (2024-10-31T17:09:55Z) - PanoSent: A Panoptic Sextuple Extraction Benchmark for Multimodal Conversational Aspect-based Sentiment Analysis [74.41260927676747]
本稿では,マルチモーダル対話感分析(ABSA)を導入することでギャップを埋める。
タスクをベンチマークするために、手動と自動の両方で注釈付けされたデータセットであるPanoSentを構築し、高品質、大規模、マルチモーダル、マルチ言語主義、マルチシナリオを特徴とし、暗黙の感情要素と明示的な感情要素の両方をカバーする。
課題を効果的に解決するために,新しい多モーダルな大規模言語モデル(すなわちSentica)とパラフレーズベースの検証機構とともに,新しい感覚の連鎖推論フレームワークを考案した。
論文 参考訳(メタデータ) (2024-08-18T13:51:01Z) - P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.571395694391654]
既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文 参考訳(メタデータ) (2023-11-16T10:14:28Z) - A Geometric Notion of Causal Probing [85.49839090913515]
線形部分空間仮説は、言語モデルの表現空間において、動詞数のような概念に関するすべての情報が線形部分空間に符号化されていることを述べる。
理想線型概念部分空間を特徴づける内在的基準のセットを与える。
2つの言語モデルにまたがる少なくとも1つの概念に対して、この概念のサブスペースは、生成された単語の概念値を精度良く操作することができる。
論文 参考訳(メタデータ) (2023-07-27T17:57:57Z) - LEACE: Perfect linear concept erasure in closed form [103.61624393221447]
概念消去は、特定の特徴を表現から削除することを目的としている。
LEAst-squares Concept Erasure (LEACE) は、線形分類器が可能な限り少ない表現で概念を検出することを確実に防止する閉形式手法である。
LEACEを"concept scrubbing"と呼ばれる新しい手法で大規模言語モデルに適用し、ネットワーク内の各層からターゲット概念情報を消去する。
論文 参考訳(メタデータ) (2023-06-06T16:07:24Z) - Exploring and Verbalizing Academic Ideas by Concept Co-occurrence [42.16213986603552]
本研究は,学術的アイデアインスピレーションのための概念共起に基づく枠組みを考案する。
我々は20の分野やトピックから概念の共起関係に基づき、進化する概念グラフを構築する。
我々は、共起励磁法と呼ばれる新しいデータ構造に基づくアイデアの記述を生成する。
論文 参考訳(メタデータ) (2023-06-04T07:01:30Z) - Large Language Models Can Be Used to Estimate the Latent Positions of
Politicians [3.9940425551415597]
既存の政治家の潜伏姿勢を推定するアプローチは、関連するデータが限られると失敗することが多い。
我々は、生成的大言語モデルに埋め込まれた知識を活用して、特定の政治的・政策的な側面に沿って議員の立場を測定する。
我々は、リベラル保守的イデオロギー、銃規制、中絶に関する米国上院議員の立場に関する新しい措置を見積もる。
論文 参考訳(メタデータ) (2023-03-21T17:48:00Z) - Unsupervised Detection of Contextualized Embedding Bias with Application
to Ideology [20.81930455526026]
本研究では,コンテキスト適応型埋め込みにおけるバイアスを検出するための教師なし手法を提案する。
本手法をオンラインディスカッションフォーラムに適用し,提案手法を提案する。
我々の実験は、イデオロギーのサブスペースが抽象的な評価意味論を符号化し、ドナルド・トランプの大統領在任中に政治的左翼スペクトルの変化を反映していることを示唆している。
論文 参考訳(メタデータ) (2022-12-14T23:31:14Z) - Comparing Voting Districts with Uncertain Data Envelopment Analysis [0.0]
ジェリーマンダーリングの投票地区は現代アメリカ社会の最も健全な関心事の1つである。
本研究では、不確実なデータ包絡分析を用いて、様々なメトリクスのマップを評価する方法を示す。
論文 参考訳(メタデータ) (2022-09-02T20:12:27Z) - Mundus vult decipi, ergo decipiatur: Visual Communication of Uncertainty
in Election Polls [56.8172499765118]
我々は、今放送と予測におけるバイアスの潜在的な源について論じる。
概念は、誤認識された正確性の問題を軽減するために提示される。
主要なアイデアの1つは、パーティーシェアではなくイベントの確率を使うことである。
論文 参考訳(メタデータ) (2021-04-28T07:02:24Z) - Positionality-Weighted Aggregation Methods for Cumulative Voting [0.0]
そこで本稿では,少数派が中心的累積投票における地位を重み付けする集計手法を提案する。
マイノリティの意見は、上記の3つの方法のうちの2つの方法で分布の平均に比例して反映される可能性が高い。
集計結果の分析からマイノリティの数と位置を可視化することが可能である。
論文 参考訳(メタデータ) (2020-08-20T03:55:49Z) - InfoBot: Transfer and Exploration via the Information Bottleneck [105.28380750802019]
強化学習における中心的な課題は、報酬がわずかに分散されたタスクに対する効果的なポリシーを見つけることである。
我々は、事前の経験から意思決定状態について学ぶことを提案する。
この単純なメカニズムは、部分的に観察された状態であっても、決定状態を効果的に識別する。
論文 参考訳(メタデータ) (2019-01-30T15:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。