論文の概要: ArxNet Model and Data: Building Social Networks from Image Archives
- arxiv url: http://arxiv.org/abs/2309.09775v1
- Date: Mon, 18 Sep 2023 13:57:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 13:10:24.370777
- Title: ArxNet Model and Data: Building Social Networks from Image Archives
- Title(参考訳): ArxNetモデルとデータ:画像アーカイブからソーシャルネットワークを構築する
- Authors: Haley Seaward, Jasmine Talley and David Beskow
- Abstract要約: 人々とその活動は、定期的にデジタル画像やビデオファイルに記録される。
その性質上、これらの画像やビデオは、しばしば社会的および専門的なつながりを描いている。
本研究は,現代の顔検出技術とソーシャル・ネットワーク分析を用いて,画像中のソーシャル・コネクションを同定し,モデル化することを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A corresponding explosion in digital images has accompanied the rapid
adoption of mobile technology around the world. People and their activities are
routinely captured in digital image and video files. By their very nature,
these images and videos often portray social and professional connections.
Individuals in the same picture are often connected in some meaningful way. Our
research seeks to identify and model social connections found in images using
modern face detection technology and social network analysis. The proposed
methods are then demonstrated on the public image repository associated with
the 2022 Emmy's Award Presentation.
- Abstract(参考訳): 対応するデジタル画像の爆発は、世界中のモバイルテクノロジーの急速な普及に伴うものだ。
人々とその活動は、デジタル画像とビデオファイルに定期的に記録される。
その性質上、これらの画像やビデオはしばしば社会的および専門的なつながりを描いている。
同じ写真の個人は、意味のある方法で接続されることが多い。
本研究は,現代の顔検出技術とソーシャルネットワーク分析を用いて,画像中の社会的つながりを同定し,モデル化することを目的とする。
提案手法は2022年のエミー賞授賞式に関連付けられた公開画像リポジトリで実証される。
関連論文リスト
- Face Clustering for Connection Discovery from Event Images [1.9181612035055007]
ソーシャルグラフは、リコメンデーションやコミュニティ検出など、多くのアプリケーションで有用である。
イベントイメージはまた、参加者間のインタラクションをキャプチャし、そこからソーシャルなつながりを発見し、ソーシャルグラフを形成する。
本稿では,イベント画像から社会的つながりを発見するシステムを提案する。
論文 参考訳(メタデータ) (2023-09-03T06:06:43Z) - Analysis of Adversarial Image Manipulations [0.7734726150561088]
オンラインでアップロードされた画像は、ユーザーの同意や知識なしに取り除くことができる。
本稿では,シンプルな画像操作技術が顔認識ソフトウェアの精度に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T16:52:43Z) - A Friendly Face: Do Text-to-Image Systems Rely on Stereotypes when the
Input is Under-Specified? [7.586041161211335]
視覚的に不特定なプロンプトに応答して生成された画像の特性について検討する。
多くの場合、画像はステレオタイプ文学で報告されているものと類似した人口統計バイアスを含む。
論文 参考訳(メタデータ) (2023-02-14T16:11:06Z) - Human Image Generation: A Comprehensive Survey [60.63589576693112]
本稿では,人間の画像生成技術を3つのパラダイム,すなわちデータ駆動手法,知識誘導手法,ハイブリッド手法に分割する。
異なる手法の利点と特徴は、モデルアーキテクチャと入出力要求の観点から要約される。
幅広い応用可能性のために、合成された人間の画像の典型的なダウンストリーム利用、すなわち、個人認識タスクのためのデータ拡張と、ファッション顧客のためのバーチャルトライオンの2つがカバーされている。
論文 参考訳(メタデータ) (2022-12-17T15:19:45Z) - On the detection of synthetic images generated by diffusion models [18.12766911229293]
拡散モデル(DM)に基づく手法が注目されている。
DMはテキストベースのビジュアルコンテンツの作成を可能にする。
悪意のあるユーザーは、自分の攻撃に完全に適合した偽のメディアを生成し、配布することができる。
論文 参考訳(メタデータ) (2022-11-01T18:10:55Z) - Multiface: A Dataset for Neural Face Rendering [108.44505415073579]
本研究では,新しいマルチビュー,高解像度のヒューマン・フェイス・データセットであるMultifaceを提案する。
顔のパフォーマンスの高解像度同期映像をキャプチャする大規模なマルチカメラ装置であるMugsyを紹介する。
Multifaceの目的は、学術コミュニティにおける高品質データへのアクセシビリティのギャップを埋め、VRテレプレゼンスの研究を可能にすることである。
論文 参考訳(メタデータ) (2022-07-22T17:55:39Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - Detecting Damage Building Using Real-time Crowdsourced Images and
Transfer Learning [53.26496452886417]
本稿では,Twitterなどのソーシャルメディアプラットフォームから地震後の建物画像を自動的に抽出する手法を提案する。
トランスファーラーニングと6500枚の手動ラベル付き画像を用いて,現場に損傷のある建物を画像として認識する深層学習モデルを訓練した。
訓練されたモデルは、異なる場所で新たに取得した地震の画像でテストし、トルコのM7.0地震の後、Twitterのフィードでほぼリアルタイムで実行された。
論文 参考訳(メタデータ) (2021-10-12T06:31:54Z) - Continuous Emotion Recognition with Spatiotemporal Convolutional Neural
Networks [82.54695985117783]
In-theld でキャプチャした長いビデオシーケンスを用いて,持続的な感情認識のための最先端のディープラーニングアーキテクチャの適合性を検討する。
我々は,2D-CNNと長期記憶ユニットを組み合わせた畳み込みリカレントニューラルネットワークと,2D-CNNモデルの微調整時の重みを膨らませて構築した膨らませた3D-CNNモデルを開発した。
論文 参考訳(メタデータ) (2020-11-18T13:42:05Z) - State of the Art on Neural Rendering [141.22760314536438]
我々は,古典的コンピュータグラフィックス技術と深層生成モデルを組み合わせることで,制御可能かつフォトリアリスティックな出力を得るアプローチに焦点をあてる。
本報告は,新しいビュー合成,セマンティック写真操作,顔と身体の再現,リライティング,自由視点ビデオ,バーチャルおよび拡張現実テレプレゼンスのためのフォトリアリスティックアバターの作成など,記述されたアルゴリズムの多くの重要なユースケースに焦点をあてる。
論文 参考訳(メタデータ) (2020-04-08T04:36:31Z) - On-device Filtering of Social Media Images for Efficient Storage [0.0]
ソーシャルメディア画像のオンデバイスフィルタリングのための畳み込みニューラルネットワーク(CNN)に基づく新しい手法を提案する。
提案したソリューションは、Places-365データセットで98.25%、Syntheticイメージデータセットで95.81%の精度を実現している。
論文 参考訳(メタデータ) (2020-04-06T08:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。