論文の概要: CoCoHD: Congress Committee Hearing Dataset
- arxiv url: http://arxiv.org/abs/2410.03099v1
- Date: Fri, 4 Oct 2024 02:49:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-03 03:46:34.612510
- Title: CoCoHD: Congress Committee Hearing Dataset
- Title(参考訳): CoCoHD:議会委員会、データセットを聴取
- Authors: Arnav Hiray, Yunsong Liu, Mingxiao Song, Agam Shah, Sudheer Chava,
- Abstract要約: 我々は、1997年から2024年までの86委員会における聴聞を32,697レコードでカバーする連邦議会聴聞データセット(CoCoHD)を提案する。
このデータセットは、医療、LGBTQ+の権利、気候正義といった重要な問題に関する政策言語の研究を可能にする。
化石燃料消費に関するエネルギー商務委員会(Energy and Commerce Committee)のスタンスを分析し,1000件のエネルギー関連文に関する事例研究でその可能性を実証した。
- 参考スコア(独自算出の注目度): 4.637027109495763
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: U.S. congressional hearings significantly influence the national economy and social fabric, impacting individual lives. Despite their importance, there is a lack of comprehensive datasets for analyzing these discourses. To address this, we propose the Congress Committee Hearing Dataset (CoCoHD), covering hearings from 1997 to 2024 across 86 committees, with 32,697 records. This dataset enables researchers to study policy language on critical issues like healthcare, LGBTQ+ rights, and climate justice. We demonstrate its potential with a case study on 1,000 energy-related sentences, analyzing the Energy and Commerce Committee's stance on fossil fuel consumption. By fine-tuning pre-trained language models, we create energy-relevant measures for each hearing. Our market analysis shows that natural language analysis using CoCoHD can predict and highlight trends in the energy sector.
- Abstract(参考訳): アメリカ議会の公聴会は国民経済と社会の織物に大きな影響を与え、個人の生活に影響を及ぼした。
その重要性にもかかわらず、これらの談話を分析するための包括的なデータセットが欠如している。
これに対応するために、1997年から2024年までの86の委員会における聴聞を32,697レコードでカバーする連邦議会聴聞データセット(CoCoHD)を提案する。
このデータセットは、医療、LGBTQ+の権利、気候正義といった重要な問題に関する政策言語の研究を可能にする。
化石燃料消費に関するエネルギー商務委員会(Energy and Commerce Committee)のスタンスを分析し,1000件のエネルギー関連文に関するケーススタディでその可能性を実証した。
事前学習した言語モデルを微調整することにより、各聴力に対するエネルギー関連尺度を作成する。
市場分析の結果,CoCoHDを用いた自然言語分析がエネルギーセクターのトレンドを予測・強調できることがわかった。
関連論文リスト
- SpeakGer: A meta-data enriched speech corpus of German state and federal parliaments [0.12277343096128711]
SpeakGerデータセットは、1947年から2023年までのドイツ連邦議会とドイツ連邦議会の16州すべてからの議論で構成されている。
このデータセットには、聴衆からのスピーチに対する反応と、講演者のパーティー、年齢、選挙区、政党の政治的アライメントに関する情報という形で、豊富なメタデータが含まれている。
論文 参考訳(メタデータ) (2024-10-23T14:00:48Z) - EARS: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation [83.29199726650899]
EARSデータセットは、さまざまなバックグラウンドから107人の話者で構成され、100時間のクリーンで無響な音声データである。
データセットには、感情的なスピーチ、異なる読み方、非言語音、会話の自由なスピーチなど、幅広い種類の話し方が含まれている。
提案手法は,データセット上での音声強調とデバーベレーションのための様々な手法をベンチマークし,その性能を測定値を用いて評価する。
論文 参考訳(メタデータ) (2024-06-10T11:28:29Z) - Crisis talk: analysis of the public debate around the energy crisis and
cost of living [0.5371337604556311]
2020年代初頭の英国における顕著なメディアの話題は、英国とヨーロッパの大半に影響を及ぼすエネルギー危機である。
これは、エネルギー依存と持続可能性、経済的負担の公平な分配、生活費に関する単一の公的な議論をもたらす。
エネルギー危機と生活費に関する公衆の談話を調査し、これらの重要かつ矛盾した問題がどのように和解されるかを明らかにする。
論文 参考訳(メタデータ) (2024-02-28T04:42:59Z) - Analyzing the Impact of Fake News on the Anticipated Outcome of the 2024
Election Ahead of Time [7.1970442944315245]
フェイクニュースに関する認識と研究の高まりにもかかわらず、北米の政治演説の中で人種的スラリーや偏見を特にターゲットとするデータセットは、依然として大きな必要性がある。
本研究では、これらの誤情報の重要な側面を照らす包括的データセットを紹介する。
論文 参考訳(メタデータ) (2023-12-01T20:14:16Z) - The Energy Prediction Smart-Meter Dataset: Analysis of Previous
Competitions and Beyond [7.031661826410534]
本稿では,2020年のIEEE Computerutational Intelligence Society (IEEE-CIS) Technical Challenge on Energy Prediction from Smart Meter data (EP) と,2021年のIEEE International Conference on Fuzzy Systems (FUZZ-IEEE) におけるそのフォローアップ課題について述べる。
データセットは3,248個のスマートメーターで構成され、データ可用性は最低1ヶ月から1年間まで様々である。
本稿では,提供された実世界のスマートメーターデータに関する課題,解決方法,および課題を分析し,家庭レベルでの正確な予測を開発し,解釈可能性を評価するための評価基準を導入する。
論文 参考訳(メタデータ) (2023-11-07T14:05:01Z) - COVID-19 Imposes Rethinking of Conferencing -- Environmental Impact
Assessment of Artificial Intelligence Conferences [0.0]
人工知能のような最先端の課題を体系的に定量化し、より広い環境意識の枠組みにおける会議のフットプリントを定義するのは、これが初めてだ。
最適な会議の場所選択の代替手段は、最大63.9%の大気汚染二酸化炭素排出量の削減を実証している。
論文 参考訳(メタデータ) (2023-11-06T18:04:02Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z) - Climate Change & Computer Audition: A Call to Action and Overview on
Audio Intelligence to Help Save the Planet [98.97255654573662]
この研究は、オーディオインテリジェンスが気候に関わる課題を克服するために貢献できる領域の概要を提供する。
我々は、地球、水、空気、火、エーテルの5つの要素に従って、潜在的なコンピュータオーディションの応用を分類する。
論文 参考訳(メタデータ) (2022-03-10T13:32:31Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - ReCO: A Large Scale Chinese Reading Comprehension Dataset on Opinion [58.12255665973199]
本稿では,オピニオン上の中国語読解データセットであるReCOについて述べる。
ReCOの質問は、商用検索エンジンに発行された意見に基づくクエリである。
この通路は、検索した文書から支持スニペットを抽出するクラウドワーカーによって提供される。
論文 参考訳(メタデータ) (2020-06-22T11:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。