論文の概要: Automatic Face Understanding: Recognizing Families in Photos
- arxiv url: http://arxiv.org/abs/2102.08941v1
- Date: Sun, 10 Jan 2021 22:37:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 08:52:39.324531
- Title: Automatic Face Understanding: Recognizing Families in Photos
- Title(参考訳): 顔の自動認識:写真の家族を認識する
- Authors: Joseph P Robinson
- Abstract要約: 親族認識のための最大のデータベースを構築します。
ビデオダイナミックス、オーディオ、テキストキャプションは、親族認識システムの意思決定に使用することができる。
- 参考スコア(独自算出の注目度): 6.131589026706621
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We built the largest database for kinship recognition. The data were labeled
using a novel clustering algorithm that used label proposals as side
information to guide more accurate clusters. Great savings in time and human
input was had. Statistically, FIW shows enormous gains over its predecessors.
We have several benchmarks in kinship verification, family classification,
tri-subject verification, and large-scale search and retrieval. We also trained
CNNs on FIW and deployed the model on the renowned KinWild I and II to gain
SOTA. Most recently, we further augmented FIW with MM. Now, video dynamics,
audio, and text captions can be used in the decision making of kinship
recognition systems. We expect FIW will significantly impact research and
reality. Additionally, we tackled the classic problem of facial landmark
localization. A majority of these networks have objectives based on L1 or L2
norms, which inherit several disadvantages. The locations of landmarks are
determined from generated heatmaps from which predicted landmark locations get
penalized without accounting for the spread: a high scatter corresponds to low
confidence and vice-versa. To address this, we introduced an objective that
penalizes for low confidence. Another issue is a dependency on labeled data,
which is expensive to collect and susceptible to error. We addressed both
issues by proposing an adversarial training framework that leverages unlabeled
data to improve model performance. Our method claims SOTA on renowned
benchmarks. Furthermore, our model is robust with a reduced size: 1/8 the
number of channels is comparable to SOTA in real-time on a CPU. Finally, we
built BFW to serve as a proxy to measure bias across ethnicity and gender
subgroups, allowing us to characterize FR performances per subgroup. We show
performances are non-optimal when a single threshold is used to determine
whether sample pairs are genuine.
- Abstract(参考訳): 私たちは親族認識のための最大のデータベースを構築しました。
データは、ラベルの提案をサイド情報として使用して、より正確なクラスタをガイドする新しいクラスタリングアルゴリズムを使用してラベル付けされた。
時間と人間の入力に大きな節約があった。
統計学的には、fiwは前機種を大きく上回っている。
血縁検証,家族分類,三目的検証,大規模検索・検索にいくつかのベンチマークを行った。
また、FIW上でCNNを訓練し、そのモデルを有名なKinWild I, IIに展開し、SOTAを得た。
最近では、MMによるFIWをさらに強化する。
現在、ビデオダイナミクス、オーディオ、テキストキャプションは、キンシップ認識システムの意思決定に使用できる。
FIWは研究と現実に大きな影響を与えるだろう。
さらに、顔のランドマークの定位に関する古典的な問題にも取り組んだ。
これらのネットワークの大部分は、L1またはL2ノルムに基づく目的を持ち、いくつかの欠点を継承している。
ランドマークの位置は、予測されたランドマークの位置がスプレッドを考慮せずにペナルティ化される生成したヒートマップから決定される。
この問題に対処するため,信頼度を低くする目的を導入した。
もうひとつの問題はラベル付きデータへの依存であり、収集にコストがかかり、エラーの影響を受けやすい。
モデル性能を改善するためにラベルのないデータを活用する逆トレーニングフレームワークを提案することで、両方の問題に対処した。
我々の手法は有名なベンチマークで sota を主張する。
1/8のチャネル数は、CPU上でリアルタイムにSOTAに匹敵する。
最後に、BFWを構築し、民族と性別のサブグループ間のバイアスを測定するプロキシとして機能し、サブグループごとのFRパフォーマンスを特徴付ける。
サンプルペアが本物かどうかを判断するために単一のしきい値を使用する場合、パフォーマンスは最適でないことを示す。
関連論文リスト
- Semi-Supervised Crowd Counting with Contextual Modeling: Facilitating Holistic Understanding of Crowd Scenes [19.987151025364067]
本稿では,信頼度の高い群集カウントモデルをトレーニングするための,新しい半教師付き手法を提案する。
モデルの本質的な'サブタイズ'能力を育み、領域の数を正確に見積もることができる。
提案手法は,従来の手法を,挑戦的ベンチマークにおいて大きな差で上回り,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-16T12:42:43Z) - Spuriosity Rankings: Sorting Data to Measure and Mitigate Biases [62.54519787811138]
本稿では,突発的手がかりに依存したモデルバイアスを簡易かつ効果的に測定・緩和する手法を提案する。
我々は,解釈可能なネットワークの深部神経的特徴をベースとして,それらのクラス内の画像のランク付けを行う。
以上の結果から,素早い特徴依存によるモデルバイアスは,モデルがどのようにトレーニングされたかよりも,モデルがトレーニングされていることの影響がはるかに大きいことが示唆された。
論文 参考訳(メタデータ) (2022-12-05T23:15:43Z) - Incorporating Crowdsourced Annotator Distributions into Ensemble
Modeling to Improve Classification Trustworthiness for Ancient Greek Papyri [3.870354915766567]
このようなデータセットの問題を複雑にする2つの問題は、クラス不均衡とラベリングにおける地道不確実性である。
このようなデータセットに対するアンサンブルモデリングの応用は、地上の真実が疑問視されている画像を特定し、それらのサンプルの信頼性を定量化するのに役立ちます。
論文 参考訳(メタデータ) (2022-10-28T19:39:14Z) - Securing Federated Learning against Overwhelming Collusive Attackers [7.587927338603662]
局所モデル間の相関を利用して,最小スパンニング木とk-Densestグラフに基づく2つのグラフ理論アルゴリズムを提案する。
我々のFLモデルは、攻撃者の影響を最大70%まで無効にすることができる。
我々は、精度、攻撃成功率、早期検出ラウンドを用いて、既存のアルゴリズムよりもアルゴリズムの優位性を確立する。
論文 参考訳(メタデータ) (2022-09-28T13:41:04Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Newer is not always better: Rethinking transferability metrics, their
peculiarities, stability and performance [5.650647159993238]
小さなカスタマイズされたデータセット上で、大規模で事前訓練された画像と言語モデルの微調整が人気を集めている。
共分散推定における統計的問題により,Hスコアの性能が低下することが示唆された。
そこで我々は,そのような設定における相対的精度に対する相関性能を補正し,評価することを推奨する。
論文 参考訳(メタデータ) (2021-10-13T17:24:12Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Improving Semi-supervised Federated Learning by Reducing the Gradient
Diversity of Models [67.66144604972052]
Federated Learning(FL)は、ユーザのプライバシを維持しながらモバイルデバイスのコンピューティングパワーを使用する、有望な方法だ。
テスト精度に影響を与える重要な問題は、異なるユーザーからのモデルの勾配の多様性であることを示す。
本稿では,FedAvg平均化を代替するグループモデル平均化手法を提案する。
論文 参考訳(メタデータ) (2020-08-26T03:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。