論文の概要: A proposed new metric for the conceptual diversity of a text
- arxiv url: http://arxiv.org/abs/2312.16548v1
- Date: Wed, 27 Dec 2023 12:19:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 19:03:52.563665
- Title: A proposed new metric for the conceptual diversity of a text
- Title(参考訳): テキストの概念的多様性のための新しい尺度の提案
- Authors: \.Ilknur D\"onmez Phd, Mehmet Hakl{\i}d{\i}r Phd
- Abstract要約: 本研究は,AIの自然言語処理分野に寄与する。
標準化された方法と、異なるテキストやドメインにおける概念の多様性を評価するための一般的な指標を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A word may contain one or more hidden concepts. While the "animal" word
evokes many images in our minds and encapsulates many concepts (birds, dogs,
cats, crocodiles, etc.), the `parrot' word evokes a single image (a colored
bird with a short, hooked beak and the ability to mimic sounds). In spoken or
written texts, we use some words in a general sense and some in a detailed way
to point to a specific object. Until now, a text's conceptual diversity value
cannot be determined using a standard and precise technique. This research
contributes to the natural language processing field of AI by offering a
standardized method and a generic metric for evaluating and comparing concept
diversity in different texts and domains. It also contributes to the field of
semantic research of languages. If we give examples for the diversity score of
two sentences, "He discovered an unknown entity." has a high conceptual
diversity score (16.6801), and "The endoplasmic reticulum forms a series of
flattened sacs within the cytoplasm of eukaryotic cells." sentence has a low
conceptual diversity score which is 3.9068.
- Abstract(参考訳): 単語は1つ以上の隠された概念を含むことができる。
動物」という言葉は私たちの心に多くのイメージを喚起し、多くの概念(鳥、犬、猫、ワニなど)をカプセル化する一方で、「parrot」という言葉は1つのイメージ(短いくちばしと音を模倣する色のついた鳥)を連想させる。
話し言葉や書き言葉では、一般的な意味での単語と、特定の対象を指し示すための詳細な方法を使用する。
これまで、テキストの概念的多様性の値は標準的かつ正確な手法で決定できない。
本研究は、異なるテキストとドメインにおける概念の多様性を評価し比較するための標準化された方法とジェネリックメトリックを提供することにより、aiの自然言語処理分野に寄与する。
また、言語の意味研究の分野にも貢献している。
2つの文の多様性スコアの例を挙げると、"He found an unknown entity"は高い概念的多様性スコア(16.6801)を持ち、"the endoplasmic reticulum form a series of flattened sacs in the cytoplasm of eukaryotic cells"は3.9068である。
関連論文リスト
- Scaling Concept With Text-Guided Diffusion Models [53.80799139331966]
概念を置き換える代わりに、概念自体を強化するか、あるいは抑圧できるだろうか?
ScalingConceptは、分解された概念を、新しい要素を導入することなく、実際の入力でスケールアップまたはスケールダウンする、シンプルで効果的な方法である。
さらに重要なのは、ScalingConceptは画像とオーディオドメインにまたがる様々な新しいゼロショットアプリケーションを可能にすることだ。
論文 参考訳(メタデータ) (2024-10-31T17:09:55Z) - Analyzing Polysemy Evolution Using Semantic Cells [0.0]
本研究は, セマンティック・セルの進化的帰結として, ポリーセミー(polysemy)という言葉が現れることを示唆する。
特に、Chat GPTを用いて収集された単語Springの4つの感覚のそれぞれに対して、ある順序で1000文の文列を解析すると、単語が最も多節単調に取得されることを示す。
論文 参考訳(メタデータ) (2024-07-23T00:52:12Z) - An Image is Worth Multiple Words: Discovering Object Level Concepts using Multi-Concept Prompt Learning [8.985668637331335]
テクスチュラル・インバージョンは、画像のスタイルと外観を表現するために、新しい「単語」を埋め込む特異テキストを学習する。
我々は,複数の未知の単語を1つの文と画像のペアから同時に学習する,MCPL(Multi-Concept Prompt Learning)を導入する。
当社のアプローチでは,テキスト埋め込みのみから学習することを重視しており,ストレージスペースの10%未満を他と比較して使用しています。
論文 参考訳(メタデータ) (2023-10-18T19:18:19Z) - The Hidden Language of Diffusion Models [70.03691458189604]
本稿では,テキスト概念の内部表現を拡散モデルで解釈する新しい手法であるConceptorを提案する。
概念間の驚くべき視覚的つながりは、それらのテキスト意味論を超越している。
我々はまた、模範的、偏見、名高い芸術様式、あるいは複数の意味の同時融合に依存する概念も発見する。
論文 参考訳(メタデータ) (2023-06-01T17:57:08Z) - An Image is Worth One Word: Personalizing Text-to-Image Generation using
Textual Inversion [60.05823240540769]
テキスト・ツー・イメージモデルは、自然言語による創造をガイドする前例のない自由を提供する。
ここでは、そのような創造的な自由を可能にするシンプルなアプローチを提示します。
一つの単語の埋め込みが、ユニークで多様な概念を捉えるのに十分であることを示す。
論文 参考訳(メタデータ) (2022-08-02T17:50:36Z) - ConceptBeam: Concept Driven Target Speech Extraction [69.85003619274295]
本研究では,ConceptBeamと呼ばれる意味情報に基づくターゲット音声抽出のための新しいフレームワークを提案する。
提案手法では,概念記述子を共有埋め込み空間にマッピングすることにより,概念を意味埋め込みとして符号化する。
我々は、モダリティに依存した情報、すなわち混合中の音声セグメント、および特定のモダリティに依存しない概念をブリッジするためにそれを使用する。
論文 参考訳(メタデータ) (2022-07-25T08:06:07Z) - FALCON: Fast Visual Concept Learning by Integrating Images, Linguistic
descriptions, and Conceptual Relations [99.54048050189971]
自然に発生する複数のデータストリームによってガイドされる新しい視覚概念を素早く学習するフレームワークを提案する。
学習された概念は、未知の画像について推論することで質問に答えるなど、下流のアプリケーションをサポートする。
合成と実世界の両方のデータセットにおけるモデルの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-30T19:45:00Z) - Contextualized Word Embeddings Encode Aspects of Human-Like Word Sense
Knowledge [0.0]
NLPの最近の進歩、特に文脈的単語埋め込みは、英語の単語感覚間の人間的な区別を捉えているかどうかを考察する。
BERT埋め込み空間における感覚間の距離と,感覚間の関連性に関する被験者の判断が相関していることが判明した。
本研究は,意味の連続空間表現の有用性を示唆するものである。
論文 参考訳(メタデータ) (2020-10-25T07:56:52Z) - Multimodal Word Sense Disambiguation in Creative Practice [2.9398911304923447]
アート画像のあいまいな記述のデータセット(ADARI)を提案する。
総計240万枚の画像に記述文をラベル付けして整理されている。
建築、芸術、デザイン、ファッション、家具、製品デザイン、テクノロジーのサブドメインも併設されている。
論文 参考訳(メタデータ) (2020-07-15T15:34:35Z) - A Deep Neural Framework for Contextual Affect Detection [51.378225388679425]
感情を持たない短い単純なテキストは、その文脈と共に読むときに強い感情を表現することができる。
文中の単語の相互依存を学習する文脈影響検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-28T05:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。