論文の概要: Effect of Text Color on Word Embeddings
- arxiv url: http://arxiv.org/abs/2004.08526v1
- Date: Sat, 18 Apr 2020 05:14:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 05:01:39.317158
- Title: Effect of Text Color on Word Embeddings
- Title(参考訳): テキスト色が単語埋め込みに与える影響
- Authors: Masaya Ikoma, Brian Kenji Iwana, Seiichi Uchida
- Abstract要約: 自然の場面や文書では、テキストとその色の間に相関関係を見出すことができる。
単語の埋め込みにテキストカラーを用いるというアイデアを提案する。
- 参考スコア(独自算出の注目度): 14.567067583556717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In natural scenes and documents, we can find the correlation between a text
and its color. For instance, the word, "hot", is often printed in red, while
"cold" is often in blue. This correlation can be thought of as a feature that
represents the semantic difference between the words. Based on this
observation, we propose the idea of using text color for word embeddings. While
text-only word embeddings (e.g. word2vec) have been extremely successful, they
often represent antonyms as similar since they are often interchangeable in
sentences. In this paper, we try two tasks to verify the usefulness of text
color in understanding the meanings of words, especially in identifying
synonyms and antonyms. First, we quantify the color distribution of words from
the book cover images and analyze the correlation between the color and meaning
of the word. Second, we try to retrain word embeddings with the color
distribution of words as a constraint. By observing the changes in the word
embeddings of synonyms and antonyms before and after re-training, we aim to
understand the kind of words that have positive or negative effects in their
word embeddings when incorporating text color information.
- Abstract(参考訳): 自然の場面や文書では、テキストとその色の間に相関関係を見出すことができる。
例えば「ホット」という言葉は赤で印刷されることが多いが、「コールド」は青で印刷されることが多い。
この相関は、単語間の意味的な違いを表す特徴と考えることができる。
そこで本研究では,単語の埋め込みにテキストカラーを用いることを提案する。
テキストのみの単語埋め込み(例: word2vec)は非常に成功したが、しばしば文で交換可能であるため、同義語を表す。
本稿では,単語の意味を理解する上で,テキストカラーの有用性を検証するために,特に同義語やアンソニムの識別において2つのタスクを試行する。
まず,書籍の表紙画像から単語の色分布を定量化し,単語の色と意味の相関関係を解析する。
第2に,単語の色分布を制約として,単語埋め込みを再学習する。
再学習前後における同義語・異義語の単語埋め込みの変化を観察することで、テキストカラー情報を取り込む際に、単語埋め込みに肯定的または否定的な影響を及ぼす単語の種類を理解することを目的とする。
関連論文リスト
- RealCustom: Narrowing Real Text Word for Real-Time Open-Domain
Text-to-Image Customization [57.86083349873154]
テキスト・ツー・イメージのカスタマイズは、与えられた被験者に対してテキスト駆動の画像を合成することを目的としている。
既存の作品は擬似語パラダイム、すなわち、与えられた主題を擬似語として表現し、与えられたテキストで合成する。
我々は、RealCustomを初めて、被写体の影響を関連部分のみに正確に制限することで、制御性から類似性を解き放つことを提示する。
論文 参考訳(メタデータ) (2024-03-01T12:12:09Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Lost in Context? On the Sense-wise Variance of Contextualized Word
Embeddings [11.475144702935568]
各単語感覚の文脈的埋め込みが、典型的な事前学習モデルにおける文脈によってどの程度異なるかを定量化する。
単語表現は位置バイアスを受けており、異なる文脈における最初の単語はより類似する傾向にある。
論文 参考訳(メタデータ) (2022-08-20T12:27:25Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Identification of Biased Terms in News Articles by Comparison of
Outlet-specific Word Embeddings [9.379650501033465]
我々は2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。
我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。
本稿では,単語の埋め込みによって測定されたバイアス語の文脈を詳細に考察する。
論文 参考訳(メタデータ) (2021-12-14T13:23:49Z) - The World of an Octopus: How Reporting Bias Influences a Language
Model's Perception of Color [73.70233477125781]
報告バイアスがテキストのみのトレーニングに悪影響を及ぼし、本質的に制限されていることを示す。
次に、マルチモーダルモデルが視覚的トレーニングを利用してこれらの効果を緩和できることを実証する。
論文 参考訳(メタデータ) (2021-10-15T16:28:17Z) - Can Language Models Encode Perceptual Structure Without Grounding? A
Case Study in Color [18.573415435334105]
我々は,知覚的に有意な距離測定値を持つ色空間であるCIELABで表されるモノレキセミックカラー用語とカラーチップのデータセットを用いる。
この空間における色の構造的アライメントをテキスト由来の色項表現で評価する2つの手法を用いて,有意な対応性を見出した。
温かい色は、平均すると、より涼しい色よりも知覚的な色空間に合わせた方がよいことがわかりました。
論文 参考訳(メタデータ) (2021-09-13T17:09:40Z) - Frequency-based Distortions in Contextualized Word Embeddings [29.88883761339757]
本研究は,文脈化単語埋め込みの幾何学的特徴を2つの新しいツールを用いて探究する。
高頻度と低頻度の単語は、その表現幾何学に関して大きく異なる。
BERT-Baseは、北米やヨーロッパ諸国よりも南アメリカとアフリカ諸国の差別化が難しい。
論文 参考訳(メタデータ) (2021-04-17T06:35:48Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Semantic-driven Colorization [78.88814849391352]
最近の着色は、白黒画像の着色を学習しながら意味情報を暗黙的に予測する。
そこで本研究では,まず,人間の動作をシミュレートして,画像の理解を学習し,色づけする。
論文 参考訳(メタデータ) (2020-06-13T08:13:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。