論文の概要: Exploration and Comparison of Deep Learning Architectures to Predict
Brain Response to Realistic Pictures
- arxiv url: http://arxiv.org/abs/2309.09983v1
- Date: Mon, 11 Sep 2023 16:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-24 03:51:37.064838
- Title: Exploration and Comparison of Deep Learning Architectures to Predict
Brain Response to Realistic Pictures
- Title(参考訳): リアル画像に対する脳反応予測のためのディープラーニングアーキテクチャの探索と比較
- Authors: Riccardo Chimisso, Sathya Bur\v{s}i\'c, Paolo Marocco, Giuseppe
Vizzari, Dimitri Ognibene
- Abstract要約: 本稿では,2023年のAlgonauts Challengeにおいて,現実的な画像に対する脳反応を予測する機械学習アーキテクチャについて検討する。
我々の研究は、様々な事前訓練されたモデルで広範な実験を行った。
各被験者の脳の各半球のROIに特化して、複数の単純なモデルを採用すると、最も良い結果が得られます。
- 参考スコア(独自算出の注目度): 0.7115361505241359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an exploration of machine learning architectures for predicting
brain responses to realistic images on occasion of the Algonauts Challenge
2023. Our research involved extensive experimentation with various pretrained
models. Initially, we employed simpler models to predict brain activity but
gradually introduced more complex architectures utilizing available data and
embeddings generated by large-scale pre-trained models. We encountered typical
difficulties related to machine learning problems, e.g. regularization and
overfitting, as well as issues specific to the challenge, such as difficulty in
combining multiple input encodings, as well as the high dimensionality, unclear
structure, and noisy nature of the output. To overcome these issues we tested
single edge 3D position-based, multi-region of interest (ROI) and hemisphere
predictor models, but we found that employing multiple simple models, each
dedicated to a ROI in each hemisphere of the brain of each subject, yielded the
best results - a single fully connected linear layer with image embeddings
generated by CLIP as input. While we surpassed the challenge baseline, our
results fell short of establishing a robust association with the data.
- Abstract(参考訳): 本稿では,algonauts challenge 2023において,現実画像に対する脳反応を予測するための機械学習アーキテクチャの探索を行う。
我々の研究は、様々な事前訓練されたモデルで広範な実験を行った。
当初、我々はより単純なモデルを用いて脳の活動を予測するが、より複雑なアーキテクチャを導入し、利用可能なデータと大規模事前学習モデルによる埋め込みを導入した。
複数の入力エンコーディングを組み合わせることの難しさや、高次元性、不明瞭な構造、そして出力のノイズの性質といった課題に対して、正規化やオーバーフィッティングといった機械学習問題に関連する典型的な困難に直面した。
これらの問題を克服するために、我々は単一エッジ3D位置ベース、多領域利息予測モデル(ROI)および半球予測モデルを検討したが、複数の単純なモデルを用いることで、各被験者の脳の各半球のROIに特化して、入力としてCLIPによって生成された画像埋め込みを備えた単一の完全に連結された線形層(英語版))が最高の結果を得た。
挑戦のベースラインを超えましたが、結果はデータとの堅牢な関連を確立するには至りませんでした。
関連論文リスト
- A Survey on State-of-the-art Deep Learning Applications and Challenges [0.0]
ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文 参考訳(メタデータ) (2024-03-26T10:10:53Z) - Fantastic Gains and Where to Find Them: On the Existence and Prospect of
General Knowledge Transfer between Any Pretrained Model [74.62272538148245]
事前訓練されたモデルの任意のペアリングに対して、一方のモデルは他方では利用できない重要なデータコンテキストを抽出する。
このような「補的」な知識を,性能劣化を伴わずに,あるモデルから別のモデルへ伝達できるかどうかを検討する。
論文 参考訳(メタデータ) (2023-10-26T17:59:46Z) - Towards Causal Foundation Model: on Duality between Causal Inference and Attention [18.046388712804042]
治療効果推定のための因果認識基盤モデルの構築に向けて第一歩を踏み出す。
我々はCInA(Causal Inference with Attention)と呼ばれる新しい理論的に正当化された手法を提案する。
論文 参考訳(メタデータ) (2023-10-01T22:28:34Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Homological Neural Networks: A Sparse Architecture for Multivariate
Complexity [0.0]
我々は,基礎となるデータのホモロジー構造上に構築された,疎密な高階グラフィカルアーキテクチャを特徴とする,新しいディープニューラルネットワークユニットを開発する。
その結果、この新しい設計の利点は、ごく少数のパラメータだけで最先端の機械学習モデルとディープラーニングモデルの結果を結び付けるか、克服することができる。
論文 参考訳(メタデータ) (2023-06-27T09:46:16Z) - Multi-teacher knowledge distillation as an effective method for
compressing ensembles of neural networks [0.0]
大規模深層モデルは非常に成功したが、膨大な計算複雑性と巨大なストレージ要件により、リアルタイムアプリケーションでは実装が困難である。
単一モデルの重み空間に全アンサンブルモデルを圧縮できる改良された知識蒸留フレームワークを提案する。
知識蒸留は,1つの学生モデルで複数の教師の知識を集約し,同じ計算量で,標準手法で訓練したモデルと比較して,優れた性能のモデルが得られることを示す。
論文 参考訳(メタデータ) (2023-02-14T17:40:36Z) - Generalizable Neural Performer: Learning Robust Radiance Fields for
Human Novel View Synthesis [52.720314035084215]
この研究は、一般のディープラーニングフレームワークを使用して、任意の人間の演奏者の自由視点画像を合成することを目的としている。
我々は、汎用的で堅牢な神経体表現を学習するシンプルな、かつ強力なフレームワーク、Generalizable Neural Performer(GNR)を提案する。
GeneBody-1.0とZJU-Mocapの実験は、最近の最先端の一般化可能な手法よりも、我々の手法の堅牢性を示している。
論文 参考訳(メタデータ) (2022-04-25T17:14:22Z) - WenLan 2.0: Make AI Imagine via a Multimodal Foundation Model [74.4875156387271]
我々は,膨大なマルチモーダル(視覚的・テキスト的)データを事前学習した新しい基礎モデルを開発する。
そこで本研究では,様々な下流タスクにおいて,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T12:25:21Z) - Generalization of Neural Combinatorial Solvers Through the Lens of
Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。
本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。
他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。
驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文 参考訳(メタデータ) (2021-10-21T07:28:11Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Seismic horizon detection with neural networks [62.997667081978825]
本稿では,複数の実地震立方体上での地平線検出にバイナリセグメンテーションを適用し,予測モデルのキューブ間一般化に着目したオープンソースの研究である。
本研究の主な貢献は,複数実地震立方体における地平線検出にバイナリセグメンテーションを適用し,予測モデルのキューブ間一般化に着目したオープンソースの研究である。
論文 参考訳(メタデータ) (2020-01-10T11:30:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。