Fugu-MT 論文翻訳(概要): Deep Learning based Multi-Label Image Classification of Protest Activities

論文の概要: Deep Learning based Multi-Label Image Classification of Protest Activities

arxiv url: http://arxiv.org/abs/2301.04212v1
Date: Tue, 10 Jan 2023 21:25:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-12 14:13:06.068740
Title: Deep Learning based Multi-Label Image Classification of Protest Activities
Title（参考訳）: 深層学習に基づく抗議活動のマルチラベル画像分類
Authors: Yingzhou Lu, Kosaku Sato, Jialu Wang
Abstract要約: 我々は、画像分類によってソーシャルメディアデータを分析し、社会的不安を検出するためにディープラーニング技術を用いた。また、全国の抗議行動を表示するために地図の可視化も利用した。
参考スコア（独自算出の注目度）: 1.0214749455979086
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the rise of internet technology amidst increasing rates of urbanization, sharing information has never been easier thanks to globally-adopted platforms for digital communication. The resulting output of massive amounts of user-generated data can be used to enhance our understanding of significant societal issues particularly for urbanizing areas. In order to better analyze protest behavior, we enhanced the GSR dataset and manually labeled all the images. We used deep learning techniques to analyze social media data to detect social unrest through image classification, which performed good in predict multi-attributes, then also used map visualization to display protest behaviors across the country.
Abstract（参考訳）: 都市化が進む中、インターネット技術の台頭により、デジタル通信のためのグローバルなプラットフォームのおかげで、情報の共有が容易になったことはない。大量のユーザ生成データのアウトプットは、特に都市化における重要な社会問題に対する理解を高めるために利用することができる。抗議行動をよりよく分析するために,gsrデータセットを拡張し,すべての画像を手作業でラベル付けした。深層学習技術を用いてソーシャルメディアデータを解析し,複数属性の予測に優れた画像分類による社会的不安の検出を行い,さらに全国の抗議行動の地図可視化を行った。

関連論文リスト

Unsupervised Urban Land Use Mapping with Street View Contrastive Clustering and a Geographical Prior [16.334202302817783]
本研究は、地理的事前に組み込まれたストリートビュー画像に対する教師なしコントラストクラスタリングモデルを提案する。本研究では,2つの都市の地理タグ付きストリートビュー画像データセットから土地利用地図を作成できることを実験的に示す。
論文参考訳（メタデータ） (2025-04-24T13:41:27Z)
AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.34659640776723]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文参考訳（メタデータ） (2024-07-11T03:18:53Z)
mTREE: Multi-Level Text-Guided Representation End-to-End Learning for Whole Slide Image Analysis [16.472295458683696]
マルチモーダル学習は視覚とテキストのデータを統合するが、その病理像やテキスト解析への応用は依然として困難である。マルチレベルテキストガイド表現のエンド・ツー・エンド・ラーニング(mTREE)を導入する。この新しいテキスト誘導アプローチは、テキスト病理情報からの情報を活用することで、WSI(Whole Slide Images)を効果的にキャプチャする。
論文参考訳（メタデータ） (2024-05-28T04:47:44Z)
Mitigating Urban-Rural Disparities in Contrastive Representation Learning with Satellite Imagery [19.93324644519412]
土地被覆の特徴の特定における都市と農村の格差のリスクを考察する。本稿では,畳み込みニューラルネットワークモデルの多レベル潜在空間を非バイアス化する手法として,コントラッシブラーニングを用いた高密度表現(FairDCL)を提案する。得られた画像表現は、下流の都市と農村の予測格差を軽減し、現実の衛星画像の最先端のベースラインを上回ります。
論文参考訳（メタデータ） (2022-11-16T04:59:46Z)
Adversarial Learning of Hard Positives for Place Recognition [5.142439069733352]
本稿では,画像検索ネットワークをトレーニングするためのハードポジティクスの作成を指導する逆法を提案する。提案手法は,Pitts250および東京24/7ベンチマークにおける最先端のリコールを実現する。
論文参考訳（メタデータ） (2022-05-08T13:54:03Z)
Dataset and Case Studies for Visual Near-Duplicates Detection in the Context of Social Media [11.569861200214294]
視覚的に類似したコンテンツの追跡は、そのようなコンテンツの拡散に関連する社会現象を研究・分析する上で重要な課題である。ソーシャルメディア画像のデータセットを構築し、画像検索といくつかの高度な視覚特徴抽出手法に基づいて視覚近距離検索手法を評価する。
論文参考訳（メタデータ） (2022-03-14T15:10:30Z)
Detecting Damage Building Using Real-time Crowdsourced Images and Transfer Learning [53.26496452886417]
本稿では,Twitterなどのソーシャルメディアプラットフォームから地震後の建物画像を自動的に抽出する手法を提案する。トランスファーラーニングと6500枚の手動ラベル付き画像を用いて,現場に損傷のある建物を画像として認識する深層学習モデルを訓練した。訓練されたモデルは、異なる場所で新たに取得した地震の画像でテストし、トルコのM7.0地震の後、Twitterのフィードでほぼリアルタイムで実行された。
論文参考訳（メタデータ） (2021-10-12T06:31:54Z)
WEDGE: Web-Image Assisted Domain Generalization for Semantic Segmentation [72.88657378658549]
本稿では,Web画像の多様性を一般化可能なセマンティックセグメンテーションに活用したWEb画像支援ドメインゲネラライゼーション手法を提案する。また,ウェブクローラー画像のスタイルをトレーニング中のトレーニング画像に注入する手法を提案する。
論文参考訳（メタデータ） (2021-09-29T05:19:58Z)
Enhancing Social Relation Inference with Concise Interaction Graph and Discriminative Scene Representation [56.25878966006678]
我々はtextbfSocial rtextbfElation (PRISE) における textbfPractical textbfInference のアプローチを提案する。人の対話的特徴と全体主義的な場面の識別的特徴を簡潔に学習する。 PRISEはPIPAデータセットにおけるドメイン分類の改善を6.8$%で達成している。
論文参考訳（メタデータ） (2021-07-30T04:20:13Z)
Exploring Visual Engagement Signals for Representation Learning [56.962033268934015]
VisEは、クラスタ化されたエンゲージメント信号から派生した擬似ラベルにソーシャルイメージをマップする弱い教師付き学習アプローチである。この方法でトレーニングされたモデルが、感情認識や政治的バイアス検出といった主観的なコンピュータビジョンタスクにどのように役立つかを研究する。
論文参考訳（メタデータ） (2021-04-15T20:50:40Z)
GINet: Graph Interaction Network for Scene Parsing [58.394591509215005]
画像領域に対する文脈推論を促進するために,グラフインタラクションユニット(GIユニット)とセマンティックコンテキストロス(SC-loss)を提案する。提案されたGINetは、Pascal-ContextやCOCO Stuffなど、一般的なベンチマークにおける最先端のアプローチよりも優れている。
論文参考訳（メタデータ） (2020-09-14T02:52:45Z)
Analysis of Social Media Data using Multimodal Deep Learning for Disaster Response [6.8889797054846795]
本稿では,ソーシャルメディアデータのテキストと画像のモダリティを併用して,最先端のディープラーニング技術を用いて共同表現を学習することを提案する。実世界の災害データセットの実験により、提案されたマルチモーダルアーキテクチャは、単一のモダリティを用いてトレーニングされたモデルよりも優れたパフォーマンスが得られることが示された。
論文参考訳（メタデータ） (2020-04-14T19:36:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。