論文の概要: The FaCells. An Exploratory Study about LSTM Layers on Face Sketches
Classifiers
- arxiv url: http://arxiv.org/abs/2102.11361v1
- Date: Mon, 22 Feb 2021 21:05:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 14:10:55.831170
- Title: The FaCells. An Exploratory Study about LSTM Layers on Face Sketches
Classifiers
- Title(参考訳): FaCells (複数形 FaCells)
顔スケッチ分類器上のLSTM層に関する探索的研究
- Authors: Xavier Ignacio Gonz\'alez
- Abstract要約: 本稿では,セレブの肖像の性別を,幅広い,より芸術的な意味での探索の言い訳として分類する無意味な動機を提案する。
実験では、ネットワークで入力されるドローを表現する異なる方法を比較し、座標 (x, y) の絶対形式が相対的な役柄よりも優れていることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Lines are human mental abstractions. A bunch of lines may form a drawing. A
set of drawings can feed an LSTM network input layer, considering each draw as
a list of lines and a line a list of points. This paper proposes the pointless
motive to classify the gender of celebrities' portraits as an excuse for
exploration in a broad, more artistic sense. Investigation results drove
compelling ideas here discussed. The experiments compared different ways to
represent draws to be input in a network and showed that an absolute format of
coordinates (x, y) was a better performer than a relative one (Dx, Dy) with
respect to prior points, most frequent in the reviewed literature. Experiments
also showed that, due to the recurrent nature of LSTMs, the order of lines
forming a drawing is a relevant factor for input in an LSTM classifier not
studied before. A minimum 'pencil' traveled length criteria for line ordering
proved suitable, possible by reducing it to a TSP particular instance. The best
configuration for gender classification appears with an LSTM layer that returns
the hidden state value for each input point step, followed by a global average
layer along the sequence, before the output dense layer. That result guided the
idea of removing the average in the network pipeline and return a per-point
attribute score just by adjusting tensors dimensions. With this trick, the
model detects an attribute in a drawing and also recognizes the points linked
to it. Moreover, by overlapping filtered lines of portraits, an attribute's
visual essence is depicted. Meet the FaCells.
- Abstract(参考訳): 線は人間の精神的な抽象である。
ラインの束は図面を形成することができます。
図面のセットは、各描画を行のリストと点のリストとして考慮し、LSTMネットワーク入力層に供給することができます。
本稿では,セレブの肖像の性別を,幅広い,より芸術的な意味での探索の言い訳として分類する無意味な動機を提案する。
調査の結果、説得力のあるアイデアが議論された。
実験は、ネットワーク内の入力に描画を表現するさまざまな方法を比較し、絶対座標形式(x, y)が、レビューされた文献で最も頻繁に、先行点に関して相対的なもの(Dx, Dy)よりも優れたパフォーマーであることを示した。
実験はまた、LSTMの反復性のために、描画を形成する線の順序は、これまで研究されていないLSTM分類器の入力に関連する要因であることを示しました。
最小の「鉛筆」移動長さ基準は、TSP特定のインスタンスに減らすことにより、ラインオーダリングに適切であることが証明された。
性別分類のための最良の構成は、各入力ポイントステップの隠された状態値を返すLSTM層と、出力密度層の前にシーケンスに沿ってグローバル平均層で表示されます。
その結果、ネットワークパイプラインの平均を取り除き、テンソル次元を調整するだけでポイント毎の属性スコアを返すというアイデアが導かれた。
このトリックにより、モデルは描画中の属性を検出し、それに関連する点を認識する。
また、フィルタされた肖像画を重ね合わせることで、属性の視覚的本質が描かれる。
FaCellsをご覧ください。
関連論文リスト
- Accurate Explanation Model for Image Classifiers using Class Association Embedding [5.378105759529487]
本稿では,グローバルな知識とローカルな知識の利点を組み合わせた生成的説明モデルを提案する。
クラスアソシエーション埋め込み(CAE)は、各サンプルを1組のクラス関連コードと個別コードにエンコードする。
クラス関連特徴を個々の特徴から効率的に分離するビルディングブロック・コヒーレンシー特徴抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:41:00Z) - IDLS: Inverse Depth Line based Visual-Inertial SLAM [9.38589798999922]
Inverse Depth Line SLAM (IDLS) を提案する。
IDLSは、複数の知覚的整合性データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-04-23T20:53:05Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Convolutional Neural Networks from Image Markers [62.997667081978825]
特徴 画像マーカーからの学習(FLIM)は、ごく少数の画像でユーザーが描画したストロークから、バックプロパゲーションのない畳み込みフィルタを推定するために最近提案されました。
本稿では、フルコネクテッド層に対してFLIMを拡張し、異なる画像分類問題について実証する。
その結果、FLIMベースの畳み込みニューラルネットワークは、バックプロパゲーションによってゼロから訓練された同じアーキテクチャを上回ります。
論文 参考訳(メタデータ) (2020-12-15T22:58:23Z) - Cross-Modal Hierarchical Modelling for Fine-Grained Sketch Based Image
Retrieval [147.24102408745247]
我々は、これまで見過ごされてきたスケッチのさらなる特性、すなわち、詳細レベルの階層性について研究する。
本稿では,スケッチ固有の階層を育成し,それを利用して,対応する階層レベルでのスケッチと写真とのマッチングを行う新しいネットワークを設計する。
論文 参考訳(メタデータ) (2020-07-29T20:50:25Z) - Sliced Iterative Normalizing Flows [7.6146285961466]
我々は,任意の確率分布関数(PDF)を対象のPDFに変換することができる反復型(欲求型)ディープラーニング(DL)アルゴリズムを開発した。
本アルゴリズムの特殊な場合として,データから潜在空間(GIS)にマップする2つの反復正規化フロー(SINF)モデルを導入する。
論文 参考訳(メタデータ) (2020-07-01T18:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。