論文の概要: Multimodal Semantic Transfer from Text to Image. Fine-Grained Image
Classification by Distributional Semantics
- arxiv url: http://arxiv.org/abs/2001.02372v1
- Date: Tue, 7 Jan 2020 14:26:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 20:08:53.835649
- Title: Multimodal Semantic Transfer from Text to Image. Fine-Grained Image
Classification by Distributional Semantics
- Title(参考訳): テキストから画像へのマルチモーダル意味変換。
分布セマンティックスによる微粒化画像分類
- Authors: Simon Donig, Maria Christoforaki, Bernhard Bermeitinger, Siegfried
Handschuh
- Abstract要約: ここで、畳み込みニューラルネットワーク(CNN)は、出力が通常のように平らなテキストラベルのシリーズではなく、意味的にロードされたベクトルのシリーズである。
これらのベクトルは、次元テキストコーパスから生成される分布意味モデル(DSM)から生じる。
- 参考スコア(独自算出の注目度): 7.356227585532971
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the last years, image classification processes like neural networks in the
area of art-history and Heritage Informatics have experienced a broad
distribution (Lang and Ommer 2018). These methods face several challenges,
including the handling of comparatively small amounts of data as well as
high-dimensional data in the Digital Humanities. Here, a Convolutional Neural
Network (CNN) is used that output is not, as usual, a series of flat text
labels but a series of semantically loaded vectors. These vectors result from a
Distributional Semantic Model (DSM) which is generated from an in-domain text
corpus.
-----
In den letzten Jahren hat die Verwendung von Bildklassifizierungsverfahren
wie neuronalen Netzwerken auch im Bereich der historischen Bildwissenschaften
und der Heritage Informatics weite Verbreitung gefunden (Lang und Ommer 2018).
Diese Verfahren stehen dabei vor einer Reihe von Herausforderungen, darunter
dem Umgangmit den vergleichsweise kleinen Datenmengen sowie zugleich
hochdimensionalen Da-tenr\"aumen in den digitalen Geisteswissenschaften. Meist
bilden diese Methoden dieKlassifizierung auf einen vergleichsweise flachen Raum
ab. Dieser flache Zugang verliert im Bem\"uhen um ontologische Eindeutigkeit
eine Reihe von relevanten Dimensionen, darunter taxonomische, mereologische und
assoziative Beziehungen zwischenden Klassen beziehungsweise dem nicht
formalisierten Kontext. Dabei wird ein Convolutional Neural Network (CNN)
genutzt, dessen Ausgabe im Trainingsprozess, anders als herk\"ommlich, nicht
auf einer Serie flacher Textlabel beruht, sondern auf einer Serie von Vektoren.
Diese Vektoren resultieren aus einem Distributional Semantic Model (DSM),
welches aus einem Dom\"ane-Textkorpus generiert wird.
- Abstract(参考訳): 過去数年間、美術史と遺産情報学の領域におけるニューラルネットワークのような画像分類プロセスは、広く分布している(Lang and Ommer 2018)。
これらの手法は、比較的少量のデータを扱うことや、Digital Humanitiesの高次元データなど、いくつかの課題に直面している。
ここで、畳み込みニューラルネットワーク(CNN)は、出力が通常のように平らなテキストラベルのシリーズではなく、意味的にロードされたベクトルのシリーズである。
これらのベクトルは、ドメイン内のテキストコーパスから生成される分散意味モデル(DSM)から生じる。
In den letzten Jahren hat die Verwendung von Bildklassifizierungsverfahren wie neuronalen Netzwerken auch im Bereich der historischen Bildwissenschaften und der Heritage Informatics weite Verbreitung gefunden (Lang und Ommer 2018)
シュテイン・ダベイ(stehen dabei vor einer reihe von herausforderungen, darunter dem umgangmit den vergleichsweise kleinen datenmengen sowie zugleich hochdimensionalen da-tenr\"aumen in den digitalen geisteswissenschaften. シュテイン・シュテイン(stehen dabei vor einer reihe von herausforderungen, darunter dem umgangmit den vergleichsweise kleinen datenmengen sochdimensionalen dachdimensionalen da-tenr\"aumen in den digitalen geisteswissenschaften.
フラメン・ラウム・アブ(flachen raum ab)に就て : ビルデン・ディーズ・メソジスト・メソジスト・メソジスト・ジクラーズ・ジクラーズ・イズ・アヴ・エッネン・ヴェルグレヒスヴァイス・フラメン・フラメン・ラウム・ラウム・アブ(meist bilden diese methoden dieklassifizierung auf einen vergleichsweise flachen raum ab)に就て
英語: Dieser flache Zugang verliert im Bem\"uhen um ontologische Eindeutigkeit eine Reihe von relevanten Dimensionen, darunter taxonomische, mereologische und assoziative Beziehungen zwischenden Klassen beziehungsweise dem nicht formalisierten Kontext。
Dabei wird ein Convolutional Neural Network (CNN) genutzt, dessen Ausgabe im Trainingsprozess, Anders als herk\"ommlich, nicht auf einer Serie flacher Textlabel beruht, sondern auf einer Serie von Vektoren。
Diese Vektoren resultieren aus einem Distributional Semantic Model (DSM)、welches aus einem Dom\"ane-Textkorpus generiert wird。
関連論文リスト
- Semantics Alignment via Split Learning for Resilient Multi-User Semantic
Communication [56.54422521327698]
最近の意味コミュニケーションの研究は、ディープジョイントソースやチャネルコーディング(DeepJSCC)のようなニューラルネットワーク(NN)ベースのトランシーバに依存している。
従来のトランシーバとは異なり、これらのニューラルトランシーバは実際のソースデータとチャネルを使用してトレーニング可能であり、セマンティクスを抽出し通信することができる。
本稿では,分割学習(SL)と部分的NN微調整技術を活用する分散学習ベースソリューションを提案する。
論文 参考訳(メタデータ) (2023-10-13T20:29:55Z) - Hyperbolic Convolutional Neural Networks [14.35618845900589]
データを埋め込みするために非ユークリッド空間を使用すると、より堅牢で説明可能なモデルが得られる。
我々は、データ内の階層をキャプチャする双曲空間の能力は、より良いパフォーマンスをもたらすと仮定する。
論文 参考訳(メタデータ) (2023-08-29T21:20:16Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Hidden Classification Layers: Enhancing linear separability between
classes in neural networks layers [0.0]
トレーニング手法の深層ネットワーク性能への影響について検討する。
本稿では,全てのネットワークレイヤの出力を含むエラー関数を誘導するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-09T10:52:49Z) - Towards Unsupervised Open World Semantic Segmentation [6.445605125467575]
視覚的類似性に基づいて未知のオブジェクトをクラスタ化する手法を提案する。
予測セマンティックセグメンテーションの連結成分はセグメンテーション品質推定によって評価される。
DNNのクラス空間は,基礎的な真理にアクセスできなくても,しかも少ないデータでも,新しいクラスによって拡張可能であることを実証する。
論文 参考訳(メタデータ) (2022-01-04T10:29:34Z) - Redundant representations help generalization in wide neural networks [71.38860635025907]
様々な最先端の畳み込みニューラルネットワークの最後に隠された層表現について検討する。
最後に隠された表現が十分に広ければ、そのニューロンは同一の情報を持つグループに分裂し、統計的に独立したノイズによってのみ異なる傾向にある。
論文 参考訳(メタデータ) (2021-06-07T10:18:54Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Emotional Semantics-Preserved and Feature-Aligned CycleGAN for Visual
Emotion Adaptation [85.20533077846606]
教師なしドメイン適応(UDA)は、あるラベル付きソースドメインで訓練されたモデルを別のラベル付きターゲットドメインに転送する問題を研究する。
本稿では,感情分布学習と支配的感情分類の両面での視覚的感情分析におけるUDAに着目した。
本稿では,CycleEmotionGAN++と呼ばれる,エンドツーエンドのサイクル整合対向モデルを提案する。
論文 参考訳(メタデータ) (2020-11-25T01:31:01Z) - Multi-Subspace Neural Network for Image Recognition [33.61205842747625]
画像分類タスクでは, 特徴抽出は常に大きな問題であり, クラス内変動により抽出器の設計が困難になる。
近年、ディープラーニングはデータから機能を自動的に学習することに多くの注意を払っている。
本研究では,畳み込みニューラルネットワーク(CNN)のキーコンポーネントをサブスペースの概念と組み合わせたマルチサブスペースニューラルネットワーク(MSNN)を提案する。
論文 参考訳(メタデータ) (2020-06-17T02:55:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。