論文の概要: The 2025 PNPL Competition: Speech Detection and Phoneme Classification in the LibriBrain Dataset
- arxiv url: http://arxiv.org/abs/2506.10165v1
- Date: Wed, 11 Jun 2025 20:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.444489
- Title: The 2025 PNPL Competition: Speech Detection and Phoneme Classification in the LibriBrain Dataset
- Title(参考訳): 2025 PNPLコンペティション:LibriBrainデータセットにおける音声検出と音素分類
- Authors: Gilad Landau, Miran Özdogan, Gereon Elvers, Francesco Mantegna, Pratik Somaiya, Dulhan Jayalath, Luisa Kurth, Teyun Kwon, Brendan Shillingford, Greg Farquhar, Minqi Jiang, Karim Jerbi, Hamza Abdelhedi, Yorguin Mantilla Ramos, Caglar Gulcehre, Mark Woolrich, Natalie Voets, Oiwi Parker Jones,
- Abstract要約: 非侵襲的な脳データからの音声復号は、社会的影響の可能性を秘めている。
2025年のPNPLコンペティションの最終的な目標は、「ImageNet moment」の条件を作成することである。
我々は、ユーザフレンドリーなPythonライブラリ(pnpl)とともに、これまで記録された最大のオブジェクト内MEGデータセット(LibriBrain)を提示する。
このコンペティションには、アルゴリズムのイノベーションを強調するスタンダードトラックと、大規模コンピューティングに報いると思われる拡張トラックが特徴だ。
- 参考スコア(独自算出の注目度): 10.214825301231025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advance of speech decoding from non-invasive brain data holds the potential for profound societal impact. Among its most promising applications is the restoration of communication to paralysed individuals affected by speech deficits such as dysarthria, without the need for high-risk surgical interventions. The ultimate aim of the 2025 PNPL competition is to produce the conditions for an "ImageNet moment" or breakthrough in non-invasive neural decoding, by harnessing the collective power of the machine learning community. To facilitate this vision we present the largest within-subject MEG dataset recorded to date (LibriBrain) together with a user-friendly Python library (pnpl) for easy data access and integration with deep learning frameworks. For the competition we define two foundational tasks (i.e. Speech Detection and Phoneme Classification from brain data), complete with standardised data splits and evaluation metrics, illustrative benchmark models, online tutorial code, a community discussion board, and public leaderboard for submissions. To promote accessibility and participation the competition features a Standard track that emphasises algorithmic innovation, as well as an Extended track that is expected to reward larger-scale computing, accelerating progress toward a non-invasive brain-computer interface for speech.
- Abstract(参考訳): 非侵襲的な脳データからの音声復号の進歩は、深い社会的影響の可能性を秘めている。
その最も有望な応用は、高リスクな外科的介入を必要とせず、難聴などの言語障害によって影響を受ける麻痺した個人へのコミュニケーションの回復である。
2025年のPNPLコンペティションの最終的な目的は、機械学習コミュニティの集合力を生かして、"ImageNet moment"や非侵襲的ニューラルデコードにおけるブレークスルーの条件を作ることである。
このビジョンを促進するために、ユーザフレンドリなPythonライブラリ(pnpl)とともに、現在記録されている最大のオブジェクト内MEGデータセット(LibriBrain)を紹介します。
コンペティションのために、標準化されたデータ分割と評価指標、イラストレーションベンチマークモデル、オンラインチュートリアルコード、コミュニティディスカッションボード、提出のための公開リーダーボードを備えた2つの基本的なタスク(脳データからの音声検出と音素分類)を定義します。
アクセシビリティとコンペへの参加を促進するため、アルゴリズムの革新を強調するスタンダードトラックと、大規模コンピューティングに報いると思われる拡張トラックが、音声のための非侵襲的な脳-コンピュータインターフェースへの進歩を加速する。
関連論文リスト
- LibriBrain: Over 50 Hours of Within-Subject MEG to Improve Speech Decoding Methods at Scale [2.225053366951265]
LibriBrainは、音声復号のためにこれまでで最大の単一オブジェクトMEGデータセットである。
オブジェクト内データのこの前例のない深さ」は、これまで非侵襲的な方法で利用できなかったスケールでの神経表現の探索を可能にする。
論文 参考訳(メタデータ) (2025-06-02T17:59:41Z) - Few-shot Hate Speech Detection Based on the MindSpore Framework [2.6396343924017915]
我々は,MindSporeディープラーニングプラットフォーム上に実装された数発のヘイトスピーチ検出のための,高速化されたニューラルネットワークフレームワークであるMS-Hateを提案する。
HateXplain と HSOL-demonstrate という2つのベンチマークデータセットの実験結果から、我々のアプローチは精度、リコール、F1スコアの競争ベースラインを上回っている。
これらの知見は, 素早い学習と敵対的増強を併用して, 数ショットシナリオで頑健かつ適応可能なヘイトスピーチ検出を可能にする可能性を示唆している。
論文 参考訳(メタデータ) (2025-04-22T15:42:33Z) - Brain-to-Text Benchmark '24: Lessons Learned [30.41641771704316]
音声脳とコンピュータのインターフェイスは、人が神経活動だけで何を言おうとしているのかを解読することを目的としている。
Brain-to-Text Benchmark '24は、ニューラルアクティビティをテキストに変換するデコードアルゴリズムの進歩を促進する。
このベンチマークは、ブレイン・トゥ・テキスト・アルゴリズムの精度向上に向けたさらなる取り組みを支援するために、無期限に公開される。
論文 参考訳(メタデータ) (2024-12-23T02:44:35Z) - Hypergame Theory for Decentralized Resource Allocation in Multi-user Semantic Communications [60.63472821600567]
マルチユーザSCシステムにおける分散コンピューティングと通信資源割り当てのための新しいフレームワークを提案する。
通信資源と計算資源を効率的に割り当てることの課題は、Stackelbergハイパーゲーム理論の適用によって解決される。
シミュレーションの結果,提案したStackelbergハイパーゲームは通信資源と計算資源を効率的に利用することができることがわかった。
論文 参考訳(メタデータ) (2024-09-26T15:55:59Z) - Semantic Meta-Split Learning: A TinyML Scheme for Few-Shot Wireless Image Classification [50.28867343337997]
本研究は,TinyMLを用いた無線画像分類のためのセマンティック・コミュニケーション・フレームワークを提案する。
我々は、プライバシ保護を確保しつつ、エンドユーザーによって実行される計算を制限するために分割学習を利用する。
メタ学習は、データ可用性の懸念を克服し、同様のトレーニングされたタスクを利用することで、トレーニングを高速化する。
論文 参考訳(メタデータ) (2024-09-03T05:56:55Z) - MindSpeech: Continuous Imagined Speech Decoding using High-Density fNIRS and Prompt Tuning for Advanced Human-AI Interaction [0.0]
本稿では,脳とAIの直接インターフェースを開発することによって,人間とAIのインタラクションを実現する新しい手法を提案する。
我々はMindSpeechと呼ばれる新しいAIモデルについて論じる。
4名中3名に対してBLEU-1,BERT Pスコアなどの指標を有意に改善した。
論文 参考訳(メタデータ) (2024-07-25T16:39:21Z) - Sequential Best-Arm Identification with Application to Brain-Computer
Interface [34.87975833920409]
脳コンピュータインタフェース(BCI)は、脳と外部デバイスまたはコンピュータシステムとの直接通信を可能にする技術である。
脳波(EEG)と事象関連電位(ERP)に基づくスペルシステム(ERP)は、物理キーボードを使わずに単語をスペルできるBCIの一種である。
本稿では,固定信頼度設定と固定予算設定の下での逐次トップ2トンプソンサンプリング(STTS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-17T18:49:44Z) - data2vec: A General Framework for Self-supervised Learning in Speech,
Vision and Language [85.9019051663368]
data2vecは、音声、NLP、コンピュータビジョンのいずれかに同じ学習方法を使用するフレームワークである。
中心となる考え方は、自己蒸留装置における入力のマスキングビューに基づいて、完全な入力データの潜在表現を予測することである。
音声認識、画像分類、自然言語理解に関する主要なベンチマークの実験は、新しい技術や競争性能の状態を実証している。
論文 参考訳(メタデータ) (2022-02-07T22:52:11Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。