論文の概要: Bengal-HP_RU: A Dataset of Bengal People For Head Pose Estimation
- arxiv url: http://arxiv.org/abs/2606.24122v1
- Date: Tue, 23 Jun 2026 04:13:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.761256
- Title: Bengal-HP_RU: A Dataset of Bengal People For Head Pose Estimation
- Title(参考訳): Bengal-HP_RU: ヘッドポーズ推定のためのベンガル人のデータセット
- Authors: Md. Ahanaf Arif Khan, Md. Tawhidur Rahman, Sangeeta Biswas, Md. Iqbal Aziz Khan, Subrata Pramanik, Sanjoy Kumar Chakravarty, Bimal Kumar Pramanik,
- Abstract要約: 既存の頭ポーズデータセットは、主に西または東アジア起源の被写体を特徴とし、南アジアの人口、特にベンガル人の個体は、ほとんど表現されていない。
ベンガルHP_RUは,12,894個のラベル付きヘッドイメージを連続ヨー,ピッチ,ロール値でアノテートしたベンガル型ヘッドポーズデータセットである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Existing head pose datasets predominantly feature subjects of Western or East Asian origin, leaving South Asian populations, particularly Bengali individuals, largely underrepresented. We introduce Bengal-HP_RU, the first publicly available head pose dataset centred on Bengali subjects, comprising 12,894 labelled head images annotated with continuous yaw, pitch, and roll values. Images were collected from Wikimedia Commons under free licences and processed through an automated pipeline followed by manual label correction. The dataset is partitioned by Wikimedia uploader identity to prevent data contamination, yielding 10,494 training and 2,400 test images across 296 unique uploaders. Bengal-HP_RU exhibits substantial diversity in subject age, gender, occlusion, illumination, and background, reflecting realistic in-the-wild conditions. The dataset is publicly available at https://doi.org/10.17632/xbw9kr37jb.2.
- Abstract(参考訳): 既存の頭ポーズデータセットは、主に西または東アジア起源の被写体を特徴とし、南アジアの人口、特にベンガル人の個体は、ほとんど表現されていない。
ベンガルHP_RUは,12,894個のラベル付きヘッドイメージを連続ヨー,ピッチ,ロール値でアノテートしたベンガル型ヘッドポーズデータセットである。
画像はウィキメディア・コモンズ(Wikimedia Commons)からフリーライセンスで収集され、自動パイプラインを通して処理され、その後手動でラベルの修正が行われた。
データセットはWikimediaのアップロード者IDによって分割され、データ汚染を防止し、296のユニークなアップロード者に対して10,494のトレーニングと2,400のテストイメージが生成される。
Bengal-HP_RUは、被写体年齢、性別、排他性、照明、背景にかなりの多様性を示し、現実的な眼内条件を反映している。
データセットはhttps://doi.org/10.17632/xbw9kr37jb.2で公開されている。
関連論文リスト
- IndicFairFace: Balanced Indian Face Dataset for Auditing and Mitigating Geographical Bias in Vision-Language Models [33.41922953936466]
VLM(Vision-Language Models)は、Webスケールのトレーニングデータから社会的バイアスを継承し、増幅することが知られている。
IndicFairFaceは、インドの地理的多様性を表す14,400の画像からなる、新しくバランスの取れた顔データセットである。
論文 参考訳(メタデータ) (2026-02-13T06:41:03Z) - BengaliSent140: A Large-Scale Bengali Binary Sentiment Dataset for Hate and Non-Hate Speech Classification [0.1784233255402269]
既存の7つのベンガルテキストデータセットを統一コーパスに統合して構築した大規模なバイナリ感情データセットであるBengaliSent140を紹介する。
結果として得られたデータセットは、68,548のヘイトと71,244のNot-hateインスタンスを含む、139,792のユニークなテキストサンプルで構成されている。
複数のソースやドメインからのデータを統合することで、BengaliSent140はより広範な言語的および文脈的カバレッジを提供する。
論文 参考訳(メタデータ) (2026-01-27T23:47:46Z) - Person-Centric Annotations of LAION-400M: Auditing Bias and Its Transfer to Models [81.45743826739054]
大きな障壁は、LAION-400MのようなWebスケールデータセットにおける人口統計アノテーションの欠如である。
2億7600万以上のバウンディングボックスや、性別や人種/民族ラベルの認識、キャプションの自動生成など、完全なデータセットのための人中心アノテーションを作成します。
それらを用いて、黒人や中東と見なされる男性や個人と犯罪に関連する負のコンテンツとの不均等な結びつきなど、人口不均衡や有害な関連を明らかにする。
論文 参考訳(メタデータ) (2025-10-04T07:51:59Z) - IndiBias: A Benchmark Dataset to Measure Social Biases in Language Models for Indian Context [32.48196952339581]
インドにおける社会的バイアスを評価するためのベンチマークデータセットであるIndiBiasを紹介する。
バイアスの次元には、性別、宗教、キャスト、年齢、地域、身体的外観、職業が含まれる。
我々のデータセットには800の文対と300の偏差測定が含まれている。
論文 参考訳(メタデータ) (2024-03-29T12:32:06Z) - CBBQ: A Chinese Bias Benchmark Dataset Curated with Human-AI
Collaboration for Large Language Models [52.25049362267279]
本稿では,人的専門家と生成言語モデルによって共同で構築された100万以上の質問からなる中国語バイアスベンチマークデータセットを提案する。
データセットのテストインスタンスは、手作業による厳格な品質管理を備えた3K以上の高品質テンプレートから自動的に抽出される。
大規模な実験により、データセットがモデルバイアスを検出することの有効性が実証された。
論文 参考訳(メタデータ) (2023-06-28T14:14:44Z) - Inspecting the Geographical Representativeness of Images from
Text-to-Image Models [52.80961012689933]
本研究では,27カ国540人の参加者からなるクラウドソーシング調査を用いて,生成された画像の地理的代表性を測定した。
国名のない故意に特定されていない入力に対して、生成された画像は、主にアメリカの周囲を反映しており、その後インドが続く。
多くの国でのスコアは依然として低いままで、将来のモデルがより地理的に包括的である必要性を強調している。
論文 参考訳(メタデータ) (2023-05-18T16:08:11Z) - OOD-Speech: A Large Bengali Speech Recognition Dataset for
Out-of-Distribution Benchmarking [1.277758355297812]
OOD-Speechはベンガル語自動音声認識(ASR)のための最初のアウト・オブ・ディストリビューション・ベンチマークデータセットである
私たちのトレーニングデータセットは、大規模なオンラインクラウドソーシングキャンペーンを通じて収集され、1177.94時間、南アジアから22,645ドルのベンガル語話者から収集され、キュレートされた。
論文 参考訳(メタデータ) (2023-05-15T18:00:39Z) - Studying Bias in GANs through the Lens of Race [91.95264864405493]
本研究では, 画像生成モデルの性能と評価が, 学習データセットの人種構成にどのように影響するかを検討する。
その結果, 生成した画像の人種構成は, トレーニングデータの保存に成功していることがわかった。
しかし、推論中に高品質な画像を生成する手法であるトランケーションは、データの人種的不均衡を悪化させる。
論文 参考訳(メタデータ) (2022-09-06T22:25:56Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - RoI Tanh-polar Transformer Network for Face Parsing in the Wild [50.8865921538953]
顔解析は、画像中のターゲット顔の顔成分のピクセルワイズラベルを予測することを目的としている。
既存のアプローチは通常、前処理中に計算されたバウンディングボックスに関して、入力画像からターゲット顔を取得する。
本稿では,画像全体を顔領域とコンテキストの固定比でTanh極表現に変換するRoI Tanh極変換を提案する。
第3に、Tanh極空間とTanh-Cartesian空間の両方に畳み込み層を含むハイブリッド残差表現学習ブロック、HybridBlockを提案する。
論文 参考訳(メタデータ) (2021-02-04T16:25:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。