論文の概要: Concept Identification of Directly and Indirectly Related Mentions
Referring to Groups of Persons
- arxiv url: http://arxiv.org/abs/2107.00955v1
- Date: Fri, 2 Jul 2021 10:38:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-05 20:13:12.920486
- Title: Concept Identification of Directly and Indirectly Related Mentions
Referring to Groups of Persons
- Title(参考訳): 人集団を参照する直接的及び間接的関連項の概念識別
- Authors: Anastasia Zhukova, Felix Hamborg, Karsten Donnay and Bela Gipp
- Abstract要約: クラスタリングは意味的に関連する単語やフレーズを識別する一般的な手法である。
対象者の集団を識別するための教師なしアプローチの最初の成果を実証する。
- 参考スコア(独自算出の注目度): 9.379650501033465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised concept identification through clustering, i.e., identification
of semantically related words and phrases, is a common approach to identify
contextual primitives employed in various use cases, e.g., text dimension
reduction, i.e., replace words with the concepts to reduce the vocabulary size,
summarization, and named entity resolution. We demonstrate the first results of
an unsupervised approach for the identification of groups of persons as actors
extracted from a set of related articles. Specifically, the approach clusters
mentions of groups of persons that act as non-named entity actors in the texts,
e.g., "migrant families" = "asylum-seekers." Compared to our baseline, the
approach keeps the mentions of the geopolitical entities separated, e.g., "Iran
leaders" != "European leaders," and clusters (in)directly related mentions with
diverse wording, e.g., "American officials" = "Trump Administration."
- Abstract(参考訳): クラスタリングによる非教師なし概念識別(unsupervised concept identification)、すなわち意味的関連のある単語やフレーズの識別は、様々なユースケースで使用される文脈的プリミティブ(例えば、テキスト次元の縮小)、すなわち語彙のサイズ、要約、名前付きエンティティの解決を減らすために単語を概念に置き換える、という一般的なアプローチである。
本稿では,関連記事から抽出した人物群をアクタとして識別するための教師なしアプローチの最初の結果を示す。
具体的には、「移民家族」=「亡命者」など、無名の実体俳優として活動する人々の集団について言及している。
私たちの基準と比較すると、このアプローチは「イランの指導者」と「ヨーロッパの指導者」と、「アメリカの役人」=「トランプ政権」といった様々な言葉で間接的に関連のある言及を分離した地政学的実体の言及を維持する。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Identifying and interpreting non-aligned human conceptual
representations using language modeling [0.0]
先天性失明は,a-モダル語と知覚関連言語ドメインの両方において概念的再編成を引き起こすことを示す。
視覚障害者は、より強く社会的・認知的な意味と、行動に関連する動詞を関連づける。
一部の動詞では、盲目と盲目の表現は非常に似ている。
論文 参考訳(メタデータ) (2024-03-10T13:02:27Z) - Leveraging multilingual transfer for unsupervised semantic acoustic word
embeddings [23.822788597966646]
音響単語埋め込み(AWEs)は、音声の内容を符号化する音声セグメントの固定次元ベクトル表現である。
本稿ではセマンティックAWEモデリングについて考察する。
AWEがダウンストリームのセマンティッククエリ・バイ・サンプル検索に使用できることを初めて示します。
論文 参考訳(メタデータ) (2023-07-05T07:46:54Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - An Investigation on Word Embedding Offset Clustering as Relationship
Classification [0.0]
本研究は,一対の単語ベクトル間の関係のベクトル表現を導出する試みである。
我々は6つのプーリング戦略を使ってベクトル関係を表現している。
本研究の目的は,単語の組込みに基づく教師なし手法により,一対の単語で表される関係の性質を識別することである。
論文 参考訳(メタデータ) (2023-05-07T13:03:17Z) - Dialectograms: Machine Learning Differences between Discursive
Communities [0.0]
単語の埋め込みを利用して、単語の使い方を地図化することで、完全な埋め込み空間の豊かさを活用するための一歩を踏み出した。
そこで本研究では,単語の用法に違いがあり,頻繁な単語や多文語を抽出する既存手法の傾向を克服する新しい尺度を提案する。
論文 参考訳(メタデータ) (2023-02-11T11:32:08Z) - Cross-Lingual Speaker Identification Using Distant Supervision [84.51121411280134]
本稿では,文脈推論の欠如や言語間一般化の低さといった問題に対処する話者識別フレームワークを提案する。
その結果,2つの英語話者識別ベンチマークにおいて,従来の最先端手法よりも9%の精度,5%の精度で性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-11T20:49:44Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - YouRefIt: Embodied Reference Understanding with Language and Gesture [95.93218436323481]
具体的参照の理解について研究する。
あるエージェントは、言語とジェスチャーの両方を使用して、共有された物理的環境でオブジェクトを別のエージェントに参照する。
クラウドソースされたYouRefItデータセットには、432の屋内シーンで4,195のユニークな参照クリップが含まれている。
論文 参考訳(メタデータ) (2021-09-08T03:27:32Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Novel Aficionados and Doppelg\"angers: a referential task for semantic
representations of individual entities [0.0]
固有名詞と共通名詞の意味的区別は,それらの言語分布に反映されることを示す。
結果は、異なる個々の実体の分布表現は、共通の名詞のそれらよりも明確に区別できないことを示している。
論文 参考訳(メタデータ) (2021-04-20T22:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。