論文の概要: The X Types -- Mapping the Semantics of the Twitter Sphere
- arxiv url: http://arxiv.org/abs/2409.14584v1
- Date: Sun, 22 Sep 2024 20:22:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 22:08:18.057368
- Title: The X Types -- Mapping the Semantics of the Twitter Sphere
- Title(参考訳): X型 -- Twitter Sphereのセマンティックスをマッピングする
- Authors: Ogen Schlachet Drukerman, Einat Minkov,
- Abstract要約: ソーシャルネットワークは、影響力のあるエンティティが人気のあるアカウントに対応する世界知識の貴重な情報源を形成する。
意味オントロジーを保持する事実知識ベース(KB)とは異なり、構造化された意味情報はソーシャルメディアでは利用できない。
本研究では、約200万のTwitterアカウントのソーシャルKBについて検討する。
例えば、あるアカウントが政治家や音楽家に属しているかどうかを判断する。
- 参考スコア(独自算出の注目度): 2.6641834518599303
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Social networks form a valuable source of world knowledge, where influential entities correspond to popular accounts. Unlike factual knowledge bases (KBs), which maintain a semantic ontology, structured semantic information is not available on social media. In this work, we consider a social KB of roughly 200K popular Twitter accounts, which denotes entities of interest. We elicit semantic information about those entities. In particular, we associate them with a fine-grained set of 136 semantic types, e.g., determine whether a given entity account belongs to a politician, or a musical artist. In the lack of explicit type information in Twitter, we obtain semantic labels for a subset of the accounts via alignment with the KBs of DBpedia and Wikidata. Given the labeled dataset, we finetune a transformer-based text encoder to generate semantic embeddings of the entities based on the contents of their accounts. We then exploit this evidence alongside network-based embeddings to predict the entities semantic types. In our experiments, we show high type prediction performance on the labeled dataset. Consequently, we apply our type classification model to all of the entity accounts in the social KB. Our analysis of the results offers insights about the global semantics of the Twitter sphere. We discuss downstream applications that should benefit from semantic type information and the semantic embeddings of social entities generated in this work. In particular, we demonstrate enhanced performance on the key task of entity similarity assessment using this information.
- Abstract(参考訳): ソーシャルネットワークは、影響力のあるエンティティが人気のあるアカウントに対応する世界知識の貴重な情報源を形成する。
意味オントロジーを保持する事実知識ベース(KB)とは異なり、構造化された意味情報はソーシャルメディアでは利用できない。
本研究では、約200万のTwitterアカウントのソーシャルKBについて検討する。
これらのエンティティに関するセマンティック情報を求めます。
特に、特定のエンティティアカウントが政治家または音楽アーティストのものであるかどうかを判断するなど、136のセマンティックタイプからなるきめ細かいセットを関連付ける。
Twitter には明示的な型情報がないため,DBpedia および Wikidata の KB と整合して,アカウントのサブセットのセマンティックラベルを取得する。
ラベル付きデータセットが与えられたら、トランスフォーマーベースのテキストエンコーダを微調整して、アカウントの内容に基づいてエンティティのセマンティック埋め込みを生成する。
次に、このエビデンスとネットワークベースの埋め込みを併用して、エンティティのセマンティックタイプを予測する。
実験ではラベル付きデータセット上で高い型予測性能を示す。
その結果,ソーシャルKBのすべてのエンティティアカウントに型分類モデルを適用した。
この結果から,Twitterのグローバルセマンティクスに関する知見が得られた。
本研究で生成したソーシャルエンティティのセマンティックな型情報とセマンティックな埋め込みの恩恵を受けるべき下流アプリケーションについて論じる。
特に,この情報を用いたエンティティ類似度評価の重要課題における性能向上を示す。
関連論文リスト
- Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Seed-Guided Fine-Grained Entity Typing in Science and Engineering
Domains [51.02035914828596]
科学・工学分野において,シード誘導型細粒度エンティティタイピングの課題について検討する。
まず、ラベルのないコーパスから各タイプのエンティティを抽出し、弱い監視力を高めるSETypeを提案する。
そして、リッチなエンティティをラベルなしのテキストにマッチさせ、擬似ラベル付きサンプルを取得し、見知らぬ型と見えない型の両方に推論できるテキストエンテリメントモデルを訓練する。
論文 参考訳(メタデータ) (2024-01-23T22:36:03Z) - HuBERTopic: Enhancing Semantic Representation of HuBERT through
Self-supervision Utilizing Topic Model [62.995175485416]
本稿では,HuBERTのセマンティック表現を豊かにするための新しいアプローチを提案する。
トピックラベルを教師として使用することにより、HuBERTに補助的なトピック分類タスクを追加する。
実験の結果,本手法は,ほとんどのタスクにおいて,ベースラインと同等あるいは優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-06T02:19:09Z) - KEPLET: Knowledge-Enhanced Pretrained Language Model with Topic Entity
Awareness [12.90996504014071]
Topicエンティティ認識を備えた知識強化型LanguagEモデルKEPLETを提案する。
エンドツーエンドの方法で、KEPLETはトピックエンティティの情報をWikipediaの文に追加する場所を特定する。
2つの代表KEPLMに適用したKePLETの一般性と優越性を示す実験を行った。
論文 参考訳(メタデータ) (2023-05-02T22:28:26Z) - ISA-bEL: Intelligent Search Algorithm based on Entity Linking [0.0]
知識グラフに基づく自然言語処理パイプラインを提案する。
コンテキストで入力されたエンティティは、知識グラフによってサポートされている特定のドメインに投影される。
これらのリンクされたエンティティは、知識グラフ内のトップレベルの集約概念を検索する鍵として機能します。
論文 参考訳(メタデータ) (2022-05-09T14:26:52Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Low-rank Subspaces for Unsupervised Entity Linking [5.863045195556266]
固有テーマは、文書に真に言及されているエンティティが、文書内のすべての候補エンティティの集合の意味的に密接なサブセットを形成する傾向があるという事実を利用する。
実証的な面では,既存の最先端技術と比較して,複数の強靭なベースラインを導入する。
論文 参考訳(メタデータ) (2021-04-18T06:24:48Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z) - Between Subjectivity and Imposition: Power Dynamics in Data Annotation
for Computer Vision [1.933681537640272]
本稿では,産業的文脈における画像データアノテーションの実践について検討する。
我々は、アノテータがラベルを使ってデータに意味を割り当てる、センスメイキングの実践としてデータアノテーションを定義します。
論文 参考訳(メタデータ) (2020-07-29T15:02:56Z) - Automatic Discovery of Novel Intents & Domains from Text Utterances [18.39942131996558]
本稿では,ラベルのない大量のデータから新しいドメインや意図を自動的に発見する新しいフレームワークADVINを提案する。
ADVINは3つのベンチマークデータセットのベースラインと、商用音声処理エージェントからの実際のユーザ発話を大きく上回る。
論文 参考訳(メタデータ) (2020-05-22T00:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。