Pre-Training Transformer Decoder for End-to-End ASR Model with Unpaired
Speech Data [146.0] 本稿では,音響単位,すなわち擬似符号を用いたエンコーダ・デコーダネットワークのための2つの事前学習タスクを提案する。
提案したSpeech2Cは,デコーダを事前学習することなく,単語誤り率(WER)を19.2%削減できる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:33:56 GMT)
Scaling Up Models and Data with $\texttt{t5x}$ and $\texttt{seqio}$ [118.0] $texttt5x$と$texttseqio$は、言語モデルの構築とトレーニングのためのオープンソースのソフトウェアライブラリである。
これらのライブラリは、複数のテラバイトのトレーニングデータを持つデータセット上で、数十億のパラメータを持つモデルをトレーニングするために使用されています。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:12:13 GMT)
An Exploration of Prompt Tuning on Generative Spoken Language Model for
Speech Processing Tasks [112.2] 生成音声言語モデル(GSLM)に基づく音声処理タスクの即時チューニングパラダイムの最初の検討について報告する。
実験結果から, 学習可能なパラメータが少ない音声分類タスクにおいて, 高精度なダウンストリームモデルよりも, 即時チューニング手法が競合性能を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:26:55 GMT)
TransEditor: Transformer-Based Dual-Space GAN for Highly Controllable
Facial Editing [110.8] 本稿では、より制御しやすい編集を実現するために、デュアルスペースGANにおけるインタラクションを強化する新しいトランスフォーマーベースのフレームワークであるTransEditorを提案する。
画像品質と編集能力において提案するフレームワークの優位性を示す実験により,高い制御性を有する顔編集におけるTransEditorの有効性が示唆された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:58:13 GMT)
BRIO: Bringing Order to Abstractive Summarization [108.0] 非決定論的分布を前提とした新しい学習パラダイムを提案する。
提案手法は, CNN/DailyMail (47.78 ROUGE-1) と XSum (49.07 ROUGE-1) のデータセット上で, 最新の結果が得られる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:19:38 GMT)
Mixed-Phoneme BERT: Improving BERT with Mixed Phoneme and Sup-Phoneme
Representations for Text to Speech [104.7] 学習能力を高めるために,音素と音素の混合表現を用いたBERTモデルの新たな変種であるMixedPhoneme BERTを提案する。
実験の結果,提案したMixed-Phoneme BERTは,FastSpeech 2ベースラインと比較して0.30CMOSゲインでTTS性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:12:26 GMT)
MeMOT: Multi-Object Tracking with Memory [97.5] 私たちのモデルはMeMOTと呼ばれ、トランスフォーマーベースの3つの主要モジュールで構成されています。
MeMOTは広く採用されているMOTデータセット上で非常に競争力のあるパフォーマンスを観測する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:33:20 GMT)
DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.4] DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:38 GMT)
UNICON: Combating Label Noise Through Uniform Selection and Contrastive
Learning [89.6] UNICONは,高ラベル雑音に対して頑健な,シンプルで効果的なサンプル選択法である。
90%のノイズレートでCIFAR100データセットの最先端データよりも11.4%改善した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:41:20 GMT)
Lossless Speedup of Autoregressive Translation with Generalized
Aggressive Decoding [89.3] GAD(Generalized Aggressive Decoding)は、自動回帰翻訳を品質損失なく高速化するための新しいアプローチである。
GADは自動回帰翻訳と同じ性能を達成しているが、NATの起草と自己回帰検証は並列計算のため高速であるため、はるかに効率的に行うことができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:54:41 GMT)
Fine-grained Temporal Contrastive Learning for Weakly-supervised
Temporal Action Localization [87.5] 本稿では,シーケンス・ツー・シーケンスの区別を文脈的に比較することで学習が,弱い教師付き行動の局所化に不可欠な帰納的バイアスをもたらすことを論じる。
微分可能な動的プログラミングの定式化の下では、FSD(Fen-fine Sequence Distance)とLCS(Longest Common Subsequence)の2つの相補的コントラストが設計されている。
提案手法は,2つのベンチマークにおいて最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:13:50 GMT)
Towards Robust Rain Removal Against Adversarial Attacks: A Comprehensive
Benchmark Analysis and Beyond [85.1] 雨の除去は、画像やビデオから雨の流れを取り除き、雨による破壊的な影響を減らすことを目的としている。
本稿では, 深層学習に基づく雨害防止手法の強靭性に関する総合的な研究を初めて行おうとする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:22:24 GMT)
Analyzing Wrap-Up Effects through an Information-Theoretic Lens [84.4] 本研究は,ラップアップ効果と情報理論量との関係について検討する。
先行文脈における情報の分布は文末RTや節末RTで予測されることが多い。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:41:03 GMT)
TransGeo: Transformer Is All You Need for Cross-view Image
Geo-localization [81.7] クロスビュー画像のジオローカライゼーションのためのCNNに基づく手法は,大域的相関をモデル化できない。
本稿では,これらの制約に対処するためのトランスジェオ (TransGeo) を提案する。
TransGeoは、都市と農村の両方のデータセットで最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:19:41 GMT)
VFDS: Variational Foresight Dynamic Selection in Bayesian Neural
Networks for Efficient Human Activity Recognition [81.3] 変動予測動的選択(VFDS)は、観測する次の機能サブセットを選択するポリシーを学ぶ。
本稿では,その実践においてパフォーマンスコストのトレードオフが重要となるヒューマンアクティビティ認識(HAR)タスクに,VFDSを適用した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:52:43 GMT)
ReSTR: Convolution-free Referring Image Segmentation Using Transformers [81.0] 本稿では,ReSTRと呼ばれる変換器を用いた画像セグメンテーションのための最初の畳み込みフリーモデルを提案する。
変換器エンコーダを通じて両方のモダリティの特徴を抽出するため、ReSTRは各モダリティ内のエンティティ間の長距離依存関係をキャプチャすることができる。
また、ReSTRは自己アテンションエンコーダによって2つのモードの特徴を融合させ、融合過程における2つのモード間のフレキシブルで適応的な相互作用を可能にする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:55:39 GMT)
Speaker Extraction with Co-Speech Gestures Cue [79.9] 話者抽出のための話者キューとして,手動や体の動きなど,共同音声ジェスチャシーケンスの活用について検討する。
目標話者に対する注意深い聴取を行うために,共音声ジェスチャキューを用いて2つのネットワークを提案する。
実験結果から, 対象話者の関連付けにおいて, 共音声のジェスチャーキューが有意であり, 抽出した音声の品質は未処理の混合音声よりも有意に向上したことが示された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:48:52 GMT)
Rethinking Portrait Matting with Privacy Preserving [79.4] P3M-10kは、プライバシ保存ポートレートマッチング(P3M)のための最初の大規模匿名化ベンチマークである。
P3M-10kは1万枚の高解像度の顔黒の肖像画と高品質のアルファマットで構成されている。
本稿では,プライバシに敏感なセマンティック認識と詳細保存されたマッティングを同時に行うことができる3つの注意深く設計された統合モジュールからなる,P3M-Netという統合マッティングモデルを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:26:07 GMT)
Templates for 3D Object Pose Estimation Revisited: Generalization to New
Objects and Robustness to Occlusions [79.3] 本稿では,新しい物体を認識でき,RGB画像の3次元ポーズを部分閉塞下でも推定できる手法を提案する。
ローカルオブジェクト表現を学習するために、トレーニングオブジェクトの小さなセットに依存します。
LINEMOD と Occlusion-LINEMOD のデータセットを再トレーニングせずに一般化を示すのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:50:35 GMT)
CogNGen: Constructing the Kernel of a Hyperdimensional Predictive
Processing Cognitive Architecture [79.1] 神経生物学的に妥当な2つの計算モデルを組み合わせた新しい認知アーキテクチャを提案する。
我々は、現代の機械学習技術の力を持つ認知アーキテクチャを開発することを目指している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:44:28 GMT)
On the probability-quality paradox in language generation [76.7] 我々は情報理論レンズを用いて言語生成を分析する。
人間の言語は自然文字列上の分布のエントロピーに近い量の情報を含むべきであると仮定する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:43:53 GMT)
R2L: Distilling Neural Radiance Field to Neural Light Field for
Efficient Novel View Synthesis [76.1] 一つのピクセルをレンダリングするには、数百回もNeural Radiance Fieldネットワークに問い合わせる必要がある。
NeLFは、新しい視点において、NeRFに対してより直接的な表現を提示する。
ディープNeLFネットワークをうまく学習する鍵は、十分なデータを持つことである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:57:05 GMT)
ImpDet: Exploring Implicit Fields for 3D Object Detection [74.6] 我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:52:12 GMT)
Equivariant Diffusion for Molecule Generation in 3D [74.3] この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:52:25 GMT)
Neural Architecture Search for Speech Emotion Recognition [72.2] 本稿では,SERモデルの自動構成にニューラルアーキテクチャサーチ(NAS)技術を適用することを提案する。
NASはモデルパラメータサイズを維持しながらSER性能(54.89%から56.28%)を向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:16:10 GMT)
Semantic-shape Adaptive Feature Modulation for Semantic Image Synthesis [71.6] きめ細かい部分レベルのセマンティックレイアウトは、オブジェクトの詳細生成に役立ちます。
各画素の位置特徴を記述するために,SPD (Shape-aware Position Descriptor) を提案する。
セマンティック形状適応特徴変調 (SAFM) ブロックは, 与えられた意味マップと位置特徴を組み合わせるために提案される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:06:04 GMT)
rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1] 56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:15:22 GMT)
SingAug: Data Augmentation for Singing Voice Synthesis with
Cycle-consistent Training Strategy [69.2] 深層学習に基づく歌唱音声合成システム(SVS)は、より優れた品質の歌唱を柔軟に生成することが実証されている。
本研究では,SVSシステムのトレーニングを促進するために,さまざまなデータ拡張手法について検討する。
トレーニングをさらに安定させるために,サイクル一貫性トレーニング戦略を導入する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:50:10 GMT)
Tuning long-range fermion-mediated interactions in cold-atom quantum
simulators [68.8] コールド原子量子シミュレータにおける工学的な長距離相互作用は、エキゾチックな量子多体挙動を引き起こす。
そこで本研究では,現在実験プラットフォームで利用可能ないくつかのチューニングノブを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:32:12 GMT)
Learning from few examples with nonlinear feature maps [68.8] 我々はこの現象を探求し、AIモデルの特徴空間の次元性、データ分散の非退化、モデルの一般化能力の間の重要な関係を明らかにする。
本分析の主な推力は、元のデータを高次元および無限次元空間にマッピングする非線形特徴変換が結果のモデル一般化能力に与える影響である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:36:50 GMT)
Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement
by Re-Synthesis [67.7] 本稿では,AR/VRにおける高忠実度通信のための新しい音声・視覚音声強調フレームワークを提案する。
提案手法は音声・視覚音声の手がかりを利用してニューラル音声のコードを生成することで,ノイズ信号からクリーンでリアルな音声を効率的に合成する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:57:10 GMT)
SpatioTemporal Focus for Skeleton-based Action Recognition [66.9] グラフ畳み込みネットワーク(GCN)は骨格に基づく行動認識において広く採用されている。
近年提案されている骨格に基づく行動認識法の性能は以下の要因によって制限されていると論じる。
近年の注目機構に着想を得て,アクション関連関係情報を取得するためのマルチグラインド・コンテキスト集中モジュール MCF を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:45:24 GMT)
ViSTA: Vision and Scene Text Aggregation for Cross-Modal Retrieval [66.7] 単一$textbfVi$sionでクロスモーダル検索シナリオを統合するためのフルトランスフォーマーアーキテクチャを提案する。
画像-テキストペアと融合-テキストペアの両方を共通モード空間に埋め込むために、二重対照的な学習損失を発生させる。
実験の結果、ViSTAはシーンテキスト認識検索タスクに対して少なくとも$bf8.4%のRecall@1で他のメソッドよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:40:21 GMT)
Leverage Your Local and Global Representations: A New Self-Supervised
Learning Strategy [65.6] 自己教師付き学習(SSL)手法は、同じ画像の異なる作物から抽出された特徴の類似性を最大化することにより、ビュー不変表現を学習することを目的としている。
本質的に、この戦略は、2つの作物が背景や小さな物体などの異なる画像情報を真に含んでいるという事実を無視しており、それによって学習された表現の多様性を抑える傾向にある。
そこで我々は,bf Local と bf Glbf Obal crops を明示的に理由づける,新たな自己教師型学習戦略 LoGo を導入する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:31:22 GMT)
Accelerating Code Search with Deep Hashing and Code Classification [64.4] コード検索とは、自然言語クエリに基づいてソースコードコーパスから再利用可能なコードスニペットを検索することである。
深層ハッシュとコード分類を用いたコード検索を高速化する新しい手法CoSHCを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:01:55 GMT)
Causal Feature Selection for Algorithmic Fairness [61.8] データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:09:21 GMT)
Traffic4cast at NeurIPS 2021 - Temporal and Spatial Few-Shot Transfer
Learning in Gridded Geo-Spatial Processes [61.2] NeurIPS 2019と2020のIARAI Traffic4castコンペティションでは、ニューラルネットワークが将来の交通条件を1時間以内に予測することに成功した。
U-Netsは、この複雑な現実世界の地理空間的プロセスにおいて、関連する特徴を抽出する能力を実証し、勝利したアーキテクチャであることが証明された。
コンペティションは2年間で10都市をカバーし、1012以上のGPSプローブデータから収集したデータを提供する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:40:01 GMT)
Perceptual Quality Assessment of UGC Gaming Videos [60.7] 我々は、ゲームビデオの成功に特化して設計された新しいVQAモデルを作成しました。
GAME-VQPは、ゲームビデオのユニークな統計特性をうまく予測する。
どちらも他の主流の一般的なVQAモデルよりも優れており、ゲームビデオ用に特別に設計されたVQAモデルより優れている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:44:26 GMT)
Hypergraph Convolutional Networks via Equivalency between Hypergraphs
and Undirected Graphs [59.7] 本稿では,EDVWおよびEIVWハイパーグラフを処理可能な一般学習フレームワークであるGeneral Hypergraph Spectral Convolution(GHSC)を提案する。
本稿では,提案するフレームワークが最先端の性能を達成できることを示す。
ソーシャルネットワーク分析,視覚的客観的分類,タンパク質学習など,様々な分野の実験により,提案手法が最先端の性能を達成できることが実証された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:46:47 GMT)
Synthesis and Execution of Communicative Robotic Movements with
Generative Adversarial Networks [59.1] 我々は、繊細な物体を操作する際に人間が採用するのと同じキネマティクス変調を2つの異なるロボットプラットフォームに転送する方法に焦点を当てる。
我々は、ロボットのエンドエフェクターが採用する速度プロファイルを、異なる特徴を持つ物体を輸送する際に人間が何をするかに触発されて調整する。
我々は、人体キネマティクスの例を用いて訓練され、それらを一般化し、新しい有意義な速度プロファイルを生成する、新しいジェネレーティブ・アドバイサル・ネットワークアーキテクチャを利用する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:22:50 GMT)
A Dataset of Images of Public Streetlights with Operational Monitoring
using Computer Vision Techniques [56.8] 街路灯画像のデータセットが提示される。
私たちのデータセットは、英国のサウスグロスターシャー地方に設置された140のUMBRELLAノードから撮影された$sim350rmtextk$イメージで構成されています。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:36:07 GMT)
Learning Decoupling Features Through Orthogonality Regularization [55.8] 音声認識におけるキースポッティング(KWS)と話者検証(SV)は2つの重要なタスクである。
我々は,同じネットワーク構造を持つ2分岐のディープネットワーク(KWSブランチとSVブランチ)を開発する。
KWS と SV のパフォーマンスを同時に向上させるために,新しいデカップリング特徴学習法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:18:13 GMT)
Data Sampling Affects the Complexity of Online SGD over Dependent Data [54.9] 本研究では,データサンプリング方式の違いが,高依存データに対するオンライン勾配勾配勾配の複雑さにどのように影響するかを示す。
データサンプルのサブサンプリングさえも、高度に依存したデータに対するオンラインSGDの収束を加速することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:48:30 GMT)
CREATE: A Benchmark for Chinese Short Video Retrieval and Title
Generation [54.8] そこで本研究では,中国初の大規模ShoRt vidEo retrievAlおよびTitle gEnベンチマークであるCREATEを提案する。
CREATEは、高品質なラベル付き210Kデータセットと、2つの大規模3M/10M事前トレーニングデータセットで構成されており、51のカテゴリ、50K以上のタグ、537Kマニュアルの注釈付きタイトルとキャプション、10M以上のショートビデオを含んでいる。
CREATEに基づいて、マルチモーダルアライメントWIの目的を達成するために、ビデオ検索とビデオタイトリングタスクを組み合わせた新しいモデルALWIGを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:39:18 GMT)
Truth Serum: Poisoning Machine Learning Models to Reveal Their Secrets [53.9] トレーニングデータセットを有害にすることができる敵が、このデータセットでトレーニングされたモデルに、他の当事者のプライベート詳細を漏洩させる可能性があることを示す。
私たちの攻撃は、メンバーシップ推論、属性推論、データ抽出に効果的です。
私たちの結果は、機械学習のためのマルチパーティプロトコルにおける暗号化プライバシ保証の関連性に疑問を投げかけました。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:06:28 GMT)
A Comparative Study on Speaker-attributed Automatic Speech Recognition
in Multi-party Meetings [53.1] 会議シナリオにおける話者分散自動音声認識(SA-ASR)の3つのアプローチを評価する。
WD-SOT法は平均話者依存文字誤り率(SD-CER)を10.7%削減する
TS-ASRアプローチはFD-SOTアプローチよりも優れ、16.5%の相対的なSD-CER削減をもたらす。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:39:14 GMT)
Open Source MagicData-RAMC: A Rich Annotated Mandarin
Conversational(RAMC) Speech Dataset [51.8] 本稿では,MagicData-RAMCと呼ばれる高品質なリッチ・アノテート・マンダリン音声データセットを提案する。
MagicData-RAMCコーパスには、中国語の母語話者が携帯電話上で16kHzのサンプリングレートで記録した180時間の会話音声データが含まれている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:01:06 GMT)
SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.7] SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:08:27 GMT)
3D Equivariant Graph Implicit Functions [51.6] 局所的詳細のモデリングを容易にする同変層を持つグラフ暗黙関数の新しいファミリを導入する。
提案手法は,ShapeNet再構成作業において既存の回転同変暗黙関数を0.69から0.89に改善する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:51:25 GMT)
Model Predictive Control for Fluid Human-to-Robot Handovers [50.7] 人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 23:08:20 GMT)
$k$NN-NER: Named Entity Recognition with Nearest Neighbor Search [47.9] $k$近くのNER$k$NN-NER)フレームワークは、トレーニングセットから取得した$k$近くの隣人を割り当てることで、エンティティラベルの配布を強化する。
$k$NN-NERは、トレーニングフェーズ中に追加の操作を必要とせず、近くの$k$近くの隣人がバニラNERモデルに検索することで、$k$NN-NERは一貫してバニラモデルよりも優れている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:21:43 GMT)
PANGUBOT: Efficient Generative Dialogue Pre-training from Pre-trained
Language Model [47.9] 本稿では,PANGUBOTについて紹介する。PANGUBOTは,PANGU-alpha(PLM)をベースとした,中国語の事前学習型対話生成モデルである。
PANGUBOTは最先端の中国語対話システムより優れていることを示す。
また,PANGUBOTは,さらなるトレーニングを行なわずに感情的な反応を生成できることを示した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:09:12 GMT)
Time Lens++: Event-based Frame Interpolation with Parametric Non-linear
Flow and Multi-scale Fusion [47.6] イベントや画像から1ショットの非線形なフレーム間動きを複数スケールのフィーチャレベル融合と計算する。
提案手法は,PSNRで最大0.2dB,LPIPSで最大15%の再現性向上を実現する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:14:58 GMT)
High fidelity two-qubit gates on fluxoniums using a tunable coupler [47.2] 超伝導フラクソニウム量子ビットは、大規模量子コンピューティングへの道のトランスモンに代わる有望な代替手段を提供する。
マルチキュービットデバイスにおける大きな課題は、スケーラブルなクロストークのないマルチキュービットアーキテクチャの実験的なデモンストレーションである。
ここでは、可変カプラ素子を持つ2量子フッソニウム系量子プロセッサを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:50:54 GMT)
Forecasting from LiDAR via Future Object Detection [47.1] そこで本研究では,センサの生計測に基づく検出と動作予測のためのエンドツーエンドアプローチを提案する。
未来と現在の場所を多対一でリンクすることで、我々のアプローチは複数の未来を推論することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:17:09 GMT)
Deformable Video Transformer [44.7] 本稿では,DVT(Deformable Video Transformer)を導入し,ビデオパッチの少数のサブセットを動作情報に基づいて,各クエリロケーションへの参加を予測した。
本モデルでは,計算コストが同じか低い場合に高い精度を達成し,4つのデータセットに対して最先端の計算結果が得られる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:52:27 GMT)
How Pre-trained Language Models Capture Factual Knowledge? A
Causal-Inspired Analysis [43.9] PLMは, 効果的な手がかりやショートカットパターンに頼って, 欠落した単語を生成する方法を示す。
欠落した単語に典型的な3つの関連がある単語(知識依存、位置近接、高度に共起する単語)をチェックする。
PLMは、不適切な関連性に依存するため、事実知識を効果的に捉えていないと結論付けている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:01:26 GMT)
Partial Coupling of Optimal Transport for Spoken Language Identification [43.8] 我々は、最適輸送(OT)に基づく関節分布アライメント(JDA)モデルを提案した。
トレーニングデータセットとテストデータセットの相違点の測定をJDAに導入した。
提案するUDAは, OTの部分結合を考慮した結果, 性能が有意に向上した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:00:49 GMT)
Deformation and Correspondence Aware Unsupervised Synthetic-to-Real
Scene Flow Estimation for Point Clouds [43.8] 我々はGTA-Vエンジンのためのポイントクラウドコレクタとシーンフローアノテータを開発し、人間の介入なしに多様なトレーニングサンプルを自動的に取得する。
対象ドメインの擬似ラベルを自己生成する平均教師型ドメイン適応フレームワークを提案する。
本フレームワークは、6つのソースターゲットデータセットペアに対して優れた適応性を実現し、平均的なドメインギャップを60%削減する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:03:23 GMT)
GALA: Toward Geometry-and-Lighting-Aware Object Search for Compositing [43.1] GALAは、幾何学と照明の整合性に関する識別モデルを用いた、汎用的な前景オブジェクト探索手法である。
大規模なオープンワールドデータセット、すなわちPixabayとOpen Imagesをうまく一般化する。
さらに,入力バウンディングボックスを使わずに背景画像のみを提供する非ボックスシナリオを効果的に処理できる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:36:08 GMT)
FindIt: Generalized Localization with Natural Language Queries [43.1] FindItは、さまざまな視覚的グラウンドとローカライゼーションタスクを統合する、シンプルで汎用的なフレームワークである。
我々のアーキテクチャの鍵は、異なるローカライゼーション要求を統一する効率的なマルチスケール融合モジュールである。
エンドツーエンドのトレーニング可能なフレームワークは、幅広い参照表現、ローカライゼーション、検出クエリに柔軟かつ正確に対応します。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:30 GMT)
Exploiting Explainable Metrics for Augmented SGD [43.0] 最適化下での学習が実際にどのように機能するか、また、特定の戦略が他の方法よりも優れている理由について、未解決の疑問がいくつかある。
ネットワーク層内の冗長な情報を計測する新しい説明可能性指標を提案する。
次に、これらの指標を利用して、各レイヤの学習率を適応的に調整し、一般化性能を向上させることにより、グラディエント・ディフレッシュ(SGD)を増大させる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:16:44 GMT)
Stochastic Backpropagation: A Memory Efficient Strategy for Training
Video Models [42.3] 本稿では,ビデオ上でディープニューラルネットワークをトレーニングするための,バックプロパゲーション(SBP)というメモリ効率のよい手法を提案する。
実験の結果、SBPはビデオタスクの幅広いモデルに適用可能であり、最大80.0%のGPUメモリを節約し、10%のトレーニングスピードアップを実現し、1%未満の精度でアクション認識と時間的アクション検出を行うことができた。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:24:53 GMT)
Revisiting Document Image Dewarping by Grid Regularization [41.9] 本稿では,文書画像のデウォープの問題に対処する。
制約のある最適化の観点から、テキスト行とドキュメント境界を考慮に入れます。
提案手法は,テキスト行の境界点と画素をまず学習する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:18:30 GMT)
AKF-SR: Adaptive Kalman Filtering-based Successor Representation [40.9] 後継表現(SR)ベースのモデルは、モデルフリーアルゴリズムよりも高速にゴール位置の変更や報酬関数に適応する。
このような表現が、動物が意思決定の不確実性を管理するのにどのように役立つかは分かっていない。
本稿では、適応カルマンフィルタに基づく逐次表現(AKF-SR)と呼ばれるカルマンフィルタに基づくSRフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 19:09:25 GMT)
AI-Empowered Data Offloading in MEC-Enabled IoV Networks [40.8] 本稿では、信頼性、セキュリティ、エネルギー管理、サービス販売者利益の4つの主要な問題に基づいて分類された、データオフロードプロセスの一部としてAIを使用する研究を調査する。
MEC対応のIoVネットワークでデータをオフロードするプロセスにおけるさまざまな課題として、高いモバイル環境における信頼性のオフロード、同一ネットワーク内のユーザに対するセキュリティ、ネットワークへの不活性化を防ぐためのエネルギ管理などがある。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:31:53 GMT)
Reflection and Rotation Symmetry Detection via Equivariant Learning [40.6] 我々は、EquiSymと呼ばれる対称性検出のためのグループ同変畳み込みネットワークを導入する。
DENse と Diverse symmetric (DENDI) という新しいデータセットを提案し、既存の反射・回転対称性検出のためのベンチマークの制限を緩和する。
実験により,LDRSおよびDENDIデータセットの対称性検出において,本手法が芸術の状態を達成できることが確認された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:18:33 GMT)
BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera
Images via Spatiotemporal Transformers [39.3] マルチカメラ画像に基づく3次元検出やマップセグメンテーションを含む3次元視覚認識タスクは、自律運転システムに不可欠である。
本稿では,複数の自律運転認識タスクをサポートするために,変圧器を用いた統合BEV表現を学習するBEVFormerという新しいフレームワークを提案する。
BEVFormerは低視認性条件下での物体の速度推定とリコールの精度を著しく向上することを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:01 GMT)
Rethinking Video Salient Object Ranking [39.1] SOR(Salient Object Ranking)は、入力画像内の複数のSORオブジェクトのSOR(Salient Object Ranking)をランク付けする。
最近では、予測固定マップに基づいて、入力ビデオ中の有能なオブジェクトをランク付けする手法が提案されている。
本稿では2つの新しいモジュールを持つビデオ・サリエント・オブジェクト・ランキング(VSOR)のエンドツーエンド手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:55:54 GMT)
Quantum-Aided Meta-Learning for Bayesian Binary Neural Networks via Born
Machines [38.5] 本稿では,バイナリベイズニューラルネットワークの学習におけるBornマシンの利用について検討する。
ボルンマシンは、ニューラルネットワークの2重みの変動分布をモデル化するために使用される。
本手法は,ボルンマシンによる勾配に基づくメタラーニングと変分推論を組み合わせ,従来の共同学習戦略より優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:09:04 GMT)
MyStyle: A Personalized Generative Prior [38.3] MyStyleはパーソナライズされたディープジェネレーティブで、個人を数枚のショットで訓練する。
MyStyleは、特定の人の画像を再構成、拡張、編集することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:19 GMT)
Learning from many trajectories [37.3] 非独立なco変数の多くの独立配列から教師付き学習を研究する。
私たちのセットアップは、独立した例から学ぶことと、1つの自動相関シーケンスから学ぶことの間にあります。
重要なポイントは、トラジェクトリが定期的にリセットされるドメインでは、エラー率は最終的にすべての例が完全に独立しているかのように振る舞うことである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:17:08 GMT)
An End-to-end Chinese Text Normalization Model based on Rule-guided
Flat-Lattice Transformer [37.1] 本稿では,漢字を直接入力として受け入れるエンドツーエンドの中国語テキスト正規化モデルを提案する。
また、中国語のテキスト正規化のための、初めて一般公開された大規模データセットもリリースしました。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:19:53 GMT)
A Character-level Span-based Model for Mandarin Prosodic Structure
Prediction [36.9] 最適な韻律構造木を得るために,スパンに基づくマンダリン韻律構造予測モデルを提案する。
リッチ言語的特徴は漢字レベルのBERTによって提供され、自己注意型アーキテクチャでエンコーダに送信される。
提案手法は,異なるレベルの韻律ラベルを同時に予測し,その処理を漢字から直接行うことができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:47:08 GMT)
LAKe-Net: Topology-Aware Point Cloud Completion by Localizing Aligned
Keypoints [35.8] LAKe-Netは、整列キーポイントをローカライズする新しいポイントクラウド補完モデルである。
新しいタイプの骨格であるSurface-Skeletonは、幾何学的先行に基づくキーポイントから生成される。
実験結果から,本手法はポイントクラウド完了時の最先端性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:14:48 GMT)
Multimodal Fusion Transformer for Remote Sensing Image Classification [35.6] 視覚変換器(ViT)は、畳み込みニューラルネットワーク(CNN)と比較して、期待できる性能のため、画像分類タスクのトレンドとなっている。
ハイパースペクトル画像(HSI)分類のための新しいMFT(Multimodal fusion transformer)ネットワークを導入する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:18:41 GMT)
Time Series Data Augmentation for Deep Learning: A Survey [35.2] 時系列データに対する様々なデータ拡張手法を体系的に検討する。
時系列分類や異常検出,予測など,さまざまなタスクに対するデータ拡張手法を実証的に比較した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:22:00 GMT)
Improving Adversarial Transferability via Neuron Attribution-Based
Attacks [35.0] 本稿では,より正確なニューロン重要度推定を行う機能レベルアタック(NAA)を提案する。
我々は、オーバーヘッドを大幅に減らすために、ニューロンの属性の近似スキームを導出する。
実験により、最先端のベンチマークに対する我々のアプローチの優位性が確認された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:47:30 GMT)
Bringing Old Films Back to Life [33.8] 本稿では,過度に劣化した古いフィルムを復元するために,RTN(Recurrent Transformer Network)という学習ベースのフレームワークを提案する。
本手法は,隠蔽に関する豊富な情報を含む隣接フレームから学習した隠れ知識に基づいている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:59 GMT)
Multi-Granularity Alignment Domain Adaptation for Object Detection [33.3] ドメイン適応型オブジェクト検出は、ソースドメインとターゲットドメインの間に特有のデータ分布があるため、難しい。
ドメイン不変な特徴学習に向けた多粒度アライメントに基づくオブジェクト検出フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:05:06 GMT)
Continuous Scene Representations for Embodied AI [33.0] 連続シーン表現 (Continuous Scene Representations, CSR) は、空間内を移動するエンボディエージェントによって構築されたシーン表現である。
私たちの重要な洞察は、オブジェクト間のペアワイズ関係を潜在空間に埋め込むことです。
CSRは、エージェントがシーン内を移動するときにオブジェクトを追跡し、それに従って表現を更新し、部屋の構成の変更を検出する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:55:33 GMT)
MPS-NeRF: Generalizable 3D Human Rendering from Multiview Images [32.8] 本論文は,複数視点画像のみを入力として,トレーニング中に見えない人のための新しいビューと新しいポーズのレンダリングを扱う。
鍵となる要素は、正準NeRFと体積変形スキームを組み合わせた専用表現である。
本手法の有効性を総合的に示すために,新しいビュー合成とアニメーションタスクを用いた実データと合成データの両方の実験を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:09:03 GMT)
Logit Normalization for Long-tail Object Detection [32.2] 歪んだ分布を示す現実世界のデータは、既存の物体検出器に深刻な課題をもたらす。
バッチ正規化と同様な方法で検出器の分類されたロジットを自己校正する手法であるLogit Normalization(LogN)を提案する。
一般的に、当社のLogNは、トレーニングとチューニングの不要(つまり、追加のトレーニングとチューニングのプロセスを必要としない)、モデルとラベルの分布に依存しない、そしてプラグインとプレイである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:28:51 GMT)
AdaMixer: A Fast-Converging Query-Based Object Detector [32.2] 本稿では,AdaMixerという高速収束型クエリベースオブジェクト検出器を提案する。
AdaMixerは、明示的なピラミッドネットワークを必要としない、アーキテクチャの単純さを持っている。
私たちの研究は、クエリベースのオブジェクト検出のためのシンプルで正確で高速な収束アーキテクチャに光を当てています。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:22:26 GMT)
Investigating Modality Bias in Audio Visual Video Parsing [31.8] 本稿では,時間的境界を持つ音声・視覚イベントラベルを検出するAVVP問題に焦点をあてる。
AVVPの既存の最先端モデルでは、ハイブリットアテンションネットワーク(HAN)を使用して、オーディオと視覚の両モードのクロスモーダルな特徴を生成する。
セグメントレベルとイベントレベルでの視覚的および音声視覚的イベントに対して,Fスコアが約2%と1.6%の絶対的な増加をもたらすHANの特徴集約の変種を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:43:01 GMT)
Performative Power [31.4] 我々は、パフォーマンスパワーと市場パワーの経済理論を関連づける。
ハイパフォーマンスなパワーは、プラットフォームが参加者の行動を操ることから利益を得ることを可能にする一方、低パフォーマンスなパワーは、歴史的データからの学習が最適に近いことを保証します。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:49:50 GMT)
Online Learning for Traffic Routing under Unknown Preferences [30.8] トラフィックネットワークに料金を設定するオンライン学習手法を提案し、異種ユーザをシステム効率のよいトラフィックパターンに向けて異なる時間的価値で駆動する。
特に,ネットワークの道路上で観測された集合フローに基づいて,各時間ごとの料金を調整できる簡易かつ効果的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:21:29 GMT)
Memory-Efficient Training of RNN-Transducer with Sampled Softmax [30.6] 本稿では,RNN-Transducerにサンプルソフトマックスを適用することを提案する。
We present experimental results on LibriSpeech, AISHELL-1, and CSJ-APS。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:51:43 GMT)
End-to-End Trajectory Distribution Prediction Based on Occupancy Grid
Maps [29.7] 本稿では,実世界における移動エージェントの将来の軌跡分布を予測することを目的としている。
我々は、接地構造分布に対する明示的かつシーン順応的な近似として、占有格子マップを用いて対称的クロスエントロピーで分布を学習する。
実験では,Stanford Drone データセットとIntersection Drone データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:24:32 GMT)
Visual Prompting: Modifying Pixel Space to Adapt Pre-trained Models [29.4] 本稿では,この摂動によって引き起こされる凍結事前学習モデルが新たなタスクを実行するように,タスク固有のイメージ摂動を学習する視覚的プロンプトを導入する。
数ピクセルだけを変えるだけで、新しいタスクやデータセットにモデルを適用することができ、線形探索と同等の性能を発揮することが分かりました。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:30 GMT)
A 23 MW data centre is all you need [29.3] 我々は、人類の未来において、英国におけるカラーの綴りが、グローバルなワード処理ソフトウェア市場の80%以上にわたってデフォルトの綴りとなるように、抽出可能なアルゴリズムを提案する。
アナログアラームクロックの設定により、人類の未来において、英国におけるカラーの綴りが、世界のワード処理ソフトウェア市場の80%以上でデフォルトの綴りとなるように、抽出可能なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:58:10 GMT)
Acoustic-Net: A Novel Neural Network for Sound Localization and
Quantification [28.7] アコースティックネットと呼ばれる新しいニューラルネットワークが提案され、音源の特定と定量化が可能である。
実験により,提案手法は音源予測の精度と計算速度を大幅に向上させることを示した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:20:09 GMT)
A Closer Look at Rehearsal-Free Continual Learning [28.5] リハーサルを伴わない強力な連続学習性能を実現する方法を示す。
まず、パラメータ正規化手法が1つの拡張タスクのリハーサルなし連続学習に失敗するという一般的な仮定を論じる。
次に、リハーサルなし連続学習における事前学習モデルからの知識を活用する方法について検討し、バニラL2パラメータ正則化がEWCパラメータ正則化および特徴蒸留より優れていることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:00 GMT)
Imitate and Repurpose: Learning Reusable Robot Movement Skills From
Human and Animal Behaviors [28.2] そこで本研究では,人間と動物の運動に関する事前知識を用いて,実足歩行ロボットの運動能力を学習する。
我々のアプローチは、人や犬のモーションキャプチャー(MoCap)データを模倣して、運動スキルモジュールを学ぶという以前の研究に基づいている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:01:32 GMT)
Efficient Maximal Coding Rate Reduction by Variational Forms [25.1] 我々は,最大符号化率低下の原理を,訓練精度を損なうことなく大幅にスケール可能な形式に再構成する。
画像分類実験により,提案した定式化が元のMCR$2$目標値の最適化よりも大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:39:53 GMT)
Perceptual Contrast Stretching on Target Feature for Speech Enhancement [25.0] 知覚コントラストストストレッチ(PCS)アプローチによるSE性能の向上。
PCSは、クリティカルバンド重要度関数に基づいて導出され、SEモデルのターゲットを変更するために適用される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:24:51 GMT)
Scientific and Technological Text Knowledge Extraction Method of based
on Word Mixing and GRU [25.0] 知識抽出タスクは 構造化されていないテキストデータから 3つの関係を抽出する。
ピペリン」とは、名前付きエンティティ認識とエンティティ関係抽出を分離する手法である。
結合抽出(Joint extract)とは、ニューラルネットワークによって実装され、エンティティ認識と関係抽出を実現するためのエンド・ツー・エンドモデルである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:52:35 GMT)
A Rich Recipe Representation as Plan to Support Expressive Multi Modal
Queries on Recipe Content and Preparation Process [24.9] 機械理解可能なリッチレシピ表現(R3)の構築について論じる。
R3には、アレルゲンに関する情報や成分のイメージなどの追加の知識が注がれている。
また,レシピ検索ツールであるTREATをR3を用いて,レシピの内容に対するマルチモーダル推論を行う。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:29:38 GMT)
Adaptive Estimation of Random Vectors with Bandit Feedback [24.3] 平均二乗誤差(MSE)を推定するために逐次学習する問題を考察する。
まず、観測可能な各部分集合に対する MSE の推定値に束縛された指数集中を確立する。
次に、ベストサブセット識別設定において、帯域幅フィードバックによる推定問題をフレーム化する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:33:32 GMT)
An Empirical Study of Language Model Integration for Transducer based
Speech Recognition [23.8] 密度比 (DR) やILME (ILME) などの手法が開発され, 古典的な浅層核融合 (SF) 法よりも優れていた。
DRのための低次弱ILMをトレーニングし、低次密度比法(LODR)を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:33:50 GMT)
Point Scene Understanding via Disentangled Instance Mesh Reconstruction [21.9] 本稿では,効率的なポイントシーン理解のために,aDisentangled Instance Mesh Reconstruction (DIMR) フレームワークを提案する。
セグメント化ベースのバックボーンは、偽陽性オブジェクトの提案を減らすために適用される。
メッシュを意識した潜在コード空間を活用して、シェイプコンプリートとメッシュ生成のプロセスを切り離します。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:36:07 GMT)
Exploiting Single-Channel Speech for Multi-Channel End-to-End Speech
Recognition: A Comparative Study [20.7] 3つのスキームを比較して、マルチチャネルエンドツーエンドASRのための外部単一チャネルデータを利用する。
CHiME-4 と AISHELL-4 データセットを用いた実験により,3 つの手法がすべてマルチチャネルのエンドツーエンド音声認識性能を向上させることを示した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:28:11 GMT)
Do Vision-Language Pretrained Models Learn Primitive Concepts? [20.1] 本研究では,事前学習された視覚言語モデルから,色や形状の属性といった原始概念の概念が自動的に現れるかどうかを考察する。
我々は、原始概念の活性化を合成概念にマッピングする構成的導出を学ぶ。
我々の研究は、最先端のVL事前訓練モデルが視覚記述子として非常に有用な原始概念を学習していることを明らかにする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:59:05 GMT)
CTA-RNN: Channel and Temporal-wise Attention RNN Leveraging Pre-trained
ASR Embeddings for Speech Emotion Recognition [20.0] 本稿では,事前学習されたASRモデルの中間表現に基づく新しいチャネルと時間的注意RNNアーキテクチャを提案する。
本稿では,IEMOCAP と MSP-IMPROV の2つのベンチマークデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:32:51 GMT)
Towards Driving-Oriented Metric for Lane Detection Models [19.8] 我々は、車線検出のための2つの新しい駆動指向メトリクスを設計する:エンド・ツー・エンド横方向偏差距離(E2E-LD)とフレームごとの擬似横方向偏差距離(PSLD)。
提案手法の有効性を評価するため,TuSimpleデータセットと新たに構築したComma2k19-LDの4種類のレーン検出手法を用いて大規模実験を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:24:44 GMT)
TraHGR: Transformer for Hand Gesture Recognition via ElectroMyography [19.5] ハンドジェスチャ認識のためのトランスフォーマー(TraHGR)に基づくハイブリッドフレームワークを提案する。
TraHGRは2つの並列パスで構成され、各モジュールの利点を統合するための融合センターとして機能する線形レイヤが続く。
提案するTraHGRアーキテクチャを検証し,検証するために,幅広い実験を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 01:50:55 GMT)
TrajGen: Generating Realistic and Diverse Trajectories with Reactive and
Feasible Agent Behaviors for Autonomous Driving [19.1] 既存のシミュレーターは、背景車両のシステムに基づく行動モデルに依存しており、現実のシナリオにおける複雑なインタラクティブな振る舞いを捉えることはできない。
そこで我々は,人間の実演からより現実的な行動を直接捉えることができる2段階の軌道生成フレームワークであるTrajGenを提案する。
また,データ駆動型シミュレータI-Simを開発した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:48:29 GMT)
Bayesian Image Super-Resolution with Deep Modeling of Image Statistics [18.6] 本稿では,自然画像統計をスムーズさと空間性の組み合わせでモデル化したベイズ画像復元フレームワークを提案する。
本研究では,後方推定のための変分ベイズ的手法を開発し,教師なしトレーニング戦略を提案する。
理想的なSISR, 現実的なSISR, 実世界のSISRという3つの画像復元タスクの実験により, 本手法は様々なノイズレベルや劣化カーネルに対して優れたモデル一般化性を有することを示した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:52:59 GMT)
Speech Enhancement with Score-Based Generative Models in the Complex
STFT Domain [18.1] 複素数値深層ニューラルネットワークを用いた音声強調のための新しい訓練課題を提案する。
微分方程式の定式化の中でこのトレーニングタスクを導出することにより、予測子-相関子標本化が可能となる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:53:47 GMT)
CUSIDE: Chunking, Simulating Future Context and Decoding for Streaming
ASR [18.0] 音声認識のための新しいフレームワーク、チャンキング, 未来コンテキスト, 復号化(CUSIDE)を提案する。
将来のコンテキストを待つことなく、将来のコンテキストフレームをシミュレートするために、新しいシミュレーションモジュールが導入された。
実験により、現実のフレームを適切なコンテキストとして使用するのに対し、シミュレーションされた将来のコンテキストを使用すると、認識精度を維持しながら遅延を大幅に低減できることが示された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:28:48 GMT)
Human Instance Segmentation and Tracking via Data Association and
Single-stage Detector [17.5] 人間のビデオインスタンスのセグメンテーションは、人間の活動のコンピュータ理解において重要な役割を果たす。
現在のVISメソッドのほとんどはMask-RCNNフレームワークに基づいている。
単段検出器を用いた人間のビデオ・インスタンス・セグメンテーションのための新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:36:09 GMT)
DeepFry: Identifying Vocal Fry Using Deep Neural Networks [16.5] 声質フライ(Vocal fry)は、不規則な声門の開口と低ピッチを特徴とする声質を指す。
不規則な周期性のため、難解な音声は自動音声認識システムに挑戦する。
本稿では,流速音声における難解な音声を検出するためのディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:23:24 GMT)
An unsupervised cluster-level based method for learning node
representations of heterogeneous graphs in scientific papers [16.0] 本稿では、クラスタレベルの非教師付き科学論文ヘテロジニアスグラフノード表現学習法(UCHL)を提案する。
ヘテロジニアスグラフ表現に基づいて、不均一グラフ全体のリンク予測を行い、ノードのエッジ、すなわち論文と論文の関係を求める。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:13:39 GMT)
Generating High Fidelity Data from Low-density Regions using Diffusion
Models [15.8] 拡散過程に基づく生成モデルを用いて,低密度領域からの新規画像の合成を行う。
合成データの忠実度を同時に維持しながら,低密度領域へ誘導するサンプリングプロセスを修正した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:56:25 GMT)
Fast, Accurate and Memory-Efficient Partial Permutation Synchronization [15.8] 観測された部分置換の劣化レベルを推定するための改良されたアルゴリズムCEMP-Partialを提案する。
敵対的腐敗の下では、付加的なノイズが無く、特定の仮定でCEMP-Partialは、破損した部分置換を正確に分類することができる。
提案手法の精度,高速化,メモリ効率を,合成データと実データの両方で実証する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:14:52 GMT)
Visual-Tactile Multimodality for Following Deformable Linear Objects
Using Reinforcement Learning [15.8] 本稿では,視覚と触覚入力を併用して変形可能な線形物体を追従するタスクを完遂する問題について検討する。
我々は,異なる感覚モーダルを用いた強化学習エージェントを作成し,その動作をどのように促進するかを検討する。
実験の結果,視覚入力と触覚入力の両方を使用することで,最大92%の症例で作業が完了することがわかった。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:59:08 GMT)
It's All In the Teacher: Zero-Shot Quantization Brought Closer to the
Teacher [15.2] AITはゼロショット量子化のためのシンプルだが強力な技術である。
AITは、多くの既存のメソッドのパフォーマンスを大きなマージンで上回る。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:06:09 GMT)
Scaling Language Model Size in Cross-Device Federated Learning [15.2] サーバ側通信やデバイス上での計算ボトルネックの軽減に,さまざまな手法を活用している。
部分モデルトレーニング、量子化、効率的な伝達学習、通信効率の体系的な応用により、同様の大きさのLSTMと同じ難易度を達成する21ドルのパラメータを訓練することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:51:53 GMT)
SimVQA: Exploring Simulated Environments for Visual Question Answering [15.0] 視覚空間と言語空間を完全に制御するために,合成コンピュータ生成データを用いて検討する。
我々は、実世界のVQAベンチマークにおける合成データの効果を定量化し、実際のデータに一般化する結果を生成する。
VQAモデルをよりドメイン不変にするために、トレーニング中にオブジェクトレベルの機能をランダムに切り替える機能スワッピング(F-SWAP)を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:44:27 GMT)
When Physics Meets Machine Learning: A Survey of Physics-Informed
Machine Learning [14.3] 物理インフォームド機械学習(PIML)は、トレーニングデータの不足を軽減し、モデルの一般化性を高め、結果の物理的妥当性を確保する効果的な方法である。
1)PIMLの動機,(2)PIMLの物理知識,(3)PIMLの物理知識統合の方法の3つの側面から,PIMLにおける最近の多くの研究を概説する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:58:27 GMT)
Weakly Supervised Patch Label Inference Networks for Efficient Pavement
Distress Detection and Recognition in the Wild [14.2] Weakly Supervised Patch Label Inference Networks (WSPLIN) という,シンプルで効果的なエンドツーエンドディープラーニングアプローチを提案する。
WSPLINはまず、異なるスケールで舗装イメージを異なるコレクション戦略のパッチに分割し、それからパッチのラベルを推測するためにパッチラベル推論ネットワーク(PLIN)を使用する。
そこで我々は,CQU-BPDDという大規模舗装救難データセットを用いて本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:01:02 GMT)
Adversarial Examples in Random Neural Networks with General Activations [14.1] 逆の例は、サブ指数幅とReLUまたはスムーズなアクティベーションを持つ2層ネットワークでユビキタスである。
逆の例 $boldsymbol x'$ が勾配の方向に沿って高い確率で見つかることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:36:15 GMT)
BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection [14.1] BEVDet4Dは空間のみの3次元空間から時空間の4次元空間へ拡張性のあるBEVDetパラダイムを持ち上げるために提案されている。
我々は,BEVDet4Dに頑健な一般化性能を持たせるエゴモーションと時間の要因を除去し,速度学習タスクを簡素化する。
課題ベンチマークnuScenesでは,BEVDet4D-Baseと呼ばれる高性能な構成で51.5% NDSを記録した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:21:19 GMT)
Generative Pre-Trained Transformers for Biologically Inspired Design [13.9] 本稿では,事前学習言語モデル(PLM)に基づく生成設計手法を提案する。
問題空間表現のゆるさに応じて、3種類の設計概念生成器をPLMから同定し、微調整する。
このアプローチは、自然にインスパイアされた軽量の空飛ぶ車の概念の生成と評価に微調整されたモデルを適用するケーススタディによってテストされる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:13:22 GMT)
Doubly-Robust Estimation for Unbiased Learning-to-Rank from
Position-Biased Click Feedback [13.6] IPS推定の代わりにランク毎の待遇を期待する新しいDR推定器を提案する。
我々の結果は、最適な性能で収束するためには、桁違いに少ないデータポイントを必要とすることを示唆している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:38:25 GMT)
A Temporal Learning Approach to Inpainting Endoscopic Specularities and
Its effect on Image Correspondence [13.3] 本稿では,時間的生成的対位ネットワーク(GAN)を用いて,隠蔽解剖学を特異性の下で描くことを提案する。
これは、胃内視鏡(Hyper-Kvasir)の生検データを用いて、完全に教師なしの方法で達成される。
また,3次元再構成とカメラモーション推定の基盤となるコンピュータビジョンタスクにおける本手法の有効性を評価する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:14:00 GMT)
QuClassi: A Hybrid Deep Neural Network Architecture based on Quantum
State Fidelity [13.2] 本稿では,量子ニューラルネットワークQuClassiを提案する。
量子微分関数とハイブリッド量子古典設計により、QuClassiはデータを量子ビットでエンコードし、量子回路を生成し、最良の状態のために量子プラットフォームにプッシュする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:56:06 GMT)
Self-distillation Augmented Masked Autoencoders for Histopathological
Image Classification [13.0] 病理画像解析にマスク付きオートエンコーダ(MAE)を導入する。
新しいSD-MAEモデルを提案し,生のMAE上に自己蒸留型SSLを実現する。
SD-MAEを2つの病的および1つの自然画像データセット上の画像分類タスクに適用する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:09:20 GMT)
Manipulation of oral cancer speech using neural articulatory synthesis [12.5] 調音合成システムは、調音軌跡を操作でき、合成された音声が、基底真実の口腔癌音声に存在する問題を再現することができる。
客観的かつ主観的な評価は、このフレームワークが自然性を受け入れており、さらなる調査に値することを示している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:40:51 GMT)
Reinforcement Learning with Dual-Observation for General Video Game
Playing [12.3] General Video Game AI Learning Competitionは、トレーニング中に見えないさまざまなゲームレベルをプレイできるエージェントを開発することを目的としている。
本稿では,5年間の一般ゲームAI学習コンペティションを要約する。
汎用ゲームプレイのための2重観測を用いた新しい強化学習手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:11:52 GMT)
Efficient Active Learning with Abstention [12.3] 計算効率のよい能動学習アルゴリズムを開発した。
このアルゴリズムの重要な特徴は、アクティブな学習でしばしば見られる望ましくない「ノイズ探索」行動を避けることである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:34:57 GMT)
RobIn: A Robust Interpretable Deep Network for Schizophrenia Diagnosis [12.2] 統合失調症は、長く複雑な診断プロセスを必要とする重度の精神疾患である。
脳画像データから統合失調症の診断にディープラーニングを応用しようとする試みは、将来性を示しているが、大きなトレーニングと応用のギャップに悩まされている。
我々は、アクセスしやすいデータに焦点をあてて、このトレーニングとアプリケーション間のギャップを減らすことを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:01:35 GMT)
Ternary and Binary Quantization for Improved Classification [11.5] ランダムプロジェクションによりまずデータ次元を減らし、3次符号や2次符号への投影を定量化する手法について検討する。
量子化すべきデータは、共通のフィルタで生成されるスパースな特徴であるので、量子化が同等で、しばしばより優れた精度を提供できることを観察する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:04:52 GMT)
A Temporal-oriented Broadcast ResNet for COVID-19 Detection [11.3] モデルサイズを小さくして効率的な計算と高精度を実現するための時間指向放送残差学習手法を提案する。
The EfficientNet architecture, our novel network, named Temporal-oriented ResNet(TorNet)は,放送学習ブロックを構成する。
ABブロックにより、ネットワークは、リカレントニューラルネットワーク(RNN)よりもはるかに少ない計算で有用な音声時間的特徴と高レベルの埋め込みを効果的に得る。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:11:57 GMT)
Instance Weighted Incremental Evolution Strategies for Reinforcement
Learning in Dynamic Environments [11.1] 本研究では,動的環境における進化戦略(ES)の体系的漸進学習手法を提案する。
目標は、環境が変わるたびに、学習済みのポリシーを新しいポリシーに漸進的に調整することだ。
本稿では、動的環境への高速な学習適応を実現するため、RLドメインのためのスケーラブルなESアルゴリズムのファミリーを紹介する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:28:02 GMT)
Improving speaker de-identification with functional data analysis of f0
trajectories [10.8] フォーマント修正は、訓練データを必要としない話者識別のための、シンプルで効果的な方法である。
本研究は, 簡易な定式化シフトに加えて, 関数データ解析に基づくf0トラジェクトリを操作する新しい話者識別手法を提案する。
提案手法は,音素的に制御可能なピッチ特性を最適に識別し,フォルマントに基づく話者識別を最大25%改善する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 01:34:15 GMT)
Quantum spin liquids bootstrapped from Ising criticality in Rydberg
arrays [10.6] 我々は、Rydberg配列における量子スピン液体として知られる分数化相の族にアクセスするための新しい戦略を開発する。
具体的には、Ising相転移に合わせたRydberg鎖から集められた配列を研究するために、有効場の理論手法を特に用いている。
我々の研究は、適切に調整されたリドベルクアレイが固体の「キタエフ材料」に匹敵する冷原子を与えることを示唆している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:00:00 GMT)
SELFIES and the future of molecular string representations [10.4] 将来を考察し、分子列表現とそれらの機会と課題について論じる。
文字列は分子グラフを表現する一般的なツールであり、最も一般的な分子文字列表現であるSMILESは1980年代後半から化学情報学を駆使している。
100%堅牢性を保証する新しい分子の言語SELFIESが2020年に導入された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 19:39:20 GMT)
Supervised Learning by Chiral-Network-Based Photonic Quantum Computing [10.2] 本稿では,教師付き学習タスクを実行するための新しいフォトニック量子計算手法を提案する。
光量子計算のゲートは、適切に設計された原子-光子-キラル結合によって実現される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:53:40 GMT)
Direction of Arrival Estimation of Sound Sources Using Icosahedral CNNs [10.1] Icosahedral Convolutional Neural Network (CNN) に基づく音源の指向性(DOA)推定の新しいモデルを提案する。
このイコサヘドラルCNNは、球状回転の連続空間のよい近似を示すイコサヘドロンの60回転対称性に同値である。
問題の等式に適合するモデルを使用することで、計算コストの低減とロバスト性の向上により、他の最先端モデルよりも優れることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:52:19 GMT)
Fractal superconducting nanowires detect infrared single photons with
84% system detection efficiency, 1.02 polarization sensitivity, and 20.8 ps
timing resolution [9.4] 超伝導ナノワイヤ単光子検出器(SNSPD)
可視・近赤外・中赤外スペクトル範囲での動作を可能にするSNSPDの新しいデバイス構造
SDEと高タイミング分解能を備えた偏光非感光単光子検出の道を開いた。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:04:30 GMT)
Graph Neural Networks in IoT: A Survey [9.3] IoT(Internet of Things)ブームは、人々の日常生活のほぼすべての部分に革命をもたらした。
ディープラーニングモデルは、IoTタスクの解決に広く採用されている。
グラフニューラルネットワーク(GNN)は、多くのIoT学習タスクで最先端の結果を達成するために実証されている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:31:37 GMT)
Universal Lymph Node Detection in T2 MRI using Neural Networks [9.3] T2 Magnetic Resonance Imaging (MRI) における転移を疑う腹部リンパ節の同定は, 増殖性疾患の進行に重要である。
LN検出の以前の研究は、単一のMRスライスで身体の特定の解剖学的領域(骨盤、直腸)に限られていた。
本研究では,ニューラルネットワークを用いた容積T2MRIにおける腹部LNを普遍的に同定するCADパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:52:35 GMT)
Graph-based Active Learning for Semi-supervised Classification of SAR
Data [8.9] 本稿では,グラフベース学習法とニューラルネットワーク法を組み合わせた合成開口レーダ(SAR)データの分類手法を提案する。
CNNVAEの機能埋め込みとグラフ構築はラベル付きデータを必要としないため、オーバーフィッティングが軽減される。
この方法は、データラベリングプロセスにおいて、アクティブラーニングのためのヒューマン・イン・ザ・ループを容易に組み込む。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:14:06 GMT)
A General Theory of the Stochastic Linear Bandit and Its Applications [8.1] 本稿では,線形バンディット問題に対する一般解析フレームワークとアルゴリズム群を紹介する。
予測における最適化という新たな概念は、OFULの過剰探索問題を減少させるSieeved greedy(SG)と呼ばれる新しいアルゴリズムを生み出します。
SGが理論的に最適であることを示すことに加えて、実験シミュレーションにより、SGはgreedy、OFUL、TSといった既存のベンチマークよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:56:43 GMT)
The impact of using voxel-level segmentation metrics on evaluating
multifocal prostate cancer localisation [8.0] Dice similarity coefficient (DSC) と Hausdorff distance (HD) は医用画像セグメンテーションの評価に広く用いられている。
本研究は、まず、前立腺がんの手術計画において、対象検出に使用されるものを適応する、新しい非対称検出指標を提案する。
今回我々は, DSCとHDの相互一致と相関について報告し, 2) ボクセルレベルDSCと病変レベルでのリコール制御精度について報告する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:19:37 GMT)
Adaptive Mean-Residue Loss for Robust Facial Age Estimation [7.7] 本稿では,分布学習による顔年齢推定のための損失関数を提案する。
FG-NETとCLAP2016のデータセットでの実験結果により、提案された損失の有効性が検証された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:28:34 GMT)
A Statistical Decision-Theoretical Perspective on the Two-Stage Approach
to Parameter Estimation [7.6] 2段階(TS)アプローチは、信頼できるパラメトリック推定を得るために適用することができる。
独立したサンプルと同一のサンプルのモデルにTSアプローチを適用する方法を示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:19:47 GMT)
JETS: Jointly Training FastSpeech2 and HiFi-GAN for End to End Text to
Speech [7.5] 本稿では、簡易な訓練パイプラインを持ち、個別に学習したモデルのカスケードを上回り、エンドツーエンドのテキスト音声合成(E2E-TTS)モデルを提案する。
提案モデルでは,アライメントモジュールを用いたFastSpeech2とHiFi-GANを併用する。
LJSpeechコーパスの実験では、提案されたモデルはESPNet2-TTSの最先端実装よりも優れていた。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:25:11 GMT)
Compressing LSTM Networks by Matrix Product Operators [7.4] Long Short Term Memory(LSTM)モデルは、多くの最先端自然言語処理(NLP)と音声強調(SE)アルゴリズムの構築ブロックである。
ここでは、量子多体物理学における量子状態の局所的相関を記述するMPO分解を紹介する。
LSTMモデルを置き換えるために,行列積演算子(MPO)に基づくニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:54:05 GMT)
Deep Hyperspectral Unmixing using Transformer Network [7.3] トランスを用いた新しい深層混合モデルを提案する。
提案モデルは畳み込みオートエンコーダと変圧器の組み合わせである。
データは畳み込みデコーダを用いて再構成される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:47:36 GMT)
An Optimal Control Method to Compute the Most Likely Transition Path for
Stochastic Dynamical Systems with Jumps [7.2] メタスタブル状態間の遷移経路は、これらの稀な事象が特定のシナリオに高い影響を与える可能性があるため、おそらく重要である。
非ガウス的L'evyノイズの下での力学系の遷移経路の最も可能性の高い計算の課題の1つは、関連する速度関数が経路によって明示的に表現できないことである。
最適制御問題を定式化し、最も可能性の高い遷移経路として最適状態を得る。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:06:29 GMT)
Message Passing Neural Networks for Hypergraphs [7.0] 本稿では,ハイパーグラフ構造データを処理可能なメッセージパッシングに基づく,最初のグラフニューラルネットワークを提案する。
提案モデルでは,ハイパーグラフのためのニューラルネットワークモデルの設計空間が定義され,既存のハイパーグラフモデルが一般化されることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:38:22 GMT)
Cross-modal Learning of Graph Representations using Radar Point Cloud
for Long-Range Gesture Recognition [7.0] 長距離(1m~2m)ジェスチャー認識のための新しいアーキテクチャを提案する。
私たちは、カメラポイントクラウドから60GHzのFMCWレーダポイントクラウドまで、ポイントクラウドベースのクロスラーニングアプローチを使用します。
実験結果では,5つのジェスチャーに対して98.4%の総合精度と一般化能力を示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:34:36 GMT)
Optimize Deep Learning Models for Prediction of Gene Mutations Using
Unsupervised Clustering [6.5] ディープ・ラーニング(Deep Learning)は、全スライディングのデジタル病理画像の解析と解釈において、主流の方法論選択となっている。
本稿では, 教師なしクラスタリングに基づくマルチインスタンス学習を提案するとともに, 3種類の癌からのWSIを用いた遺伝子変異予測のための深層学習モデルの構築に本手法を適用した。
画像パッチの教師なしクラスタリングは, 予測パッチの同定, 予測情報の欠如を排除し, 3種類の癌における遺伝子変異の予測を改善できることを示した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:48:21 GMT)
Training strategy for a lightweight countermeasure model for automatic
speaker verification [6.2] 本稿では,ASVのための軽量CMモデルのトレーニング戦略を提案する。
ASVspoof 2021 Logical Accessタスクのevalua-tionフェーズでは、軽量ResNetSEモデルがmin t-DCF 0.2695とEER 3.54%に達する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:52:43 GMT)
CADG: A Model Based on Cross Attention for Domain Generalization [6.1] ドメイン一般化(DG)タスクでは、モデルは、ソースドメインからのトレーニングデータのみを使用して、目に見えないターゲットドメインの一般化を達成することで訓練される。
本稿では,分布シフト問題に対処するため,CADGというモデル(領域一般化のためのクロスアテンション)を設計する。
実験により,提案手法は様々な領域の一般化ベンチマークにおいて最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:35:21 GMT)
A Pixel-based Encryption Method for Privacy-Preserving Deep Learning
Models [5.7] 本稿では,効率的な画素ベースの知覚暗号化手法を提案する。
この方法は、原画像の固有の特性を保ちながら、必要なレベルのセキュリティを提供する。
これにより、暗号化ドメイン内のディープラーニング(DL)アプリケーションを可能にする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:42:11 GMT)
No Calm in The Storm: Investigating QAnon Website Relationships [5.6] QAnonは極右陰謀論であり、その支持者はオンラインでほとんど組織化されている。
インターネット上の最大2つのQAnonホットベッド、Voatと8kunからシードされたWebクロールを使用して、QAnon中心のドメインベースのハイパーリンクグラフを構築します。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 18:09:44 GMT)
Casual 6-DoF: free-viewpoint panorama using a handheld 360 camera [5.2] 従来の360デグカメラで捉えた360デグパノラマの非構造コレクションを用いて,広い範囲で6-DoF体験を提供する新しい手法を提案する。
提案手法は,360degデータキャプチャ,高品質な球面深度パノラマ生成のための新しい深度推定,高忠実度自由視点生成からなる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:25:46 GMT)
We cannot believe we overlooked these Majorana discoveries [5.1] 2011-2012年に、マヨラナフェルミオンのシグネチャを生じるハイブリッド超伝導体-半導体ナノワイヤデバイスの実験を行った。
この論文では、最近の古いデータを10年分の知識で検証しながら、2012年にはMajoranaの発見が2つの突破口があることに気づきました。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:28:18 GMT)
Domain Adaptation for Sparse-Data Settings: What Do We Gain by Not Using
Bert? [4.8] 特定のドメインで利用可能なラベル付きトレーニングデータが少ない場合に、NLPアプリケーションを構築するためのガイドラインを提供する。
我々は、最大175Kの速度でトレーニングでき、1つのGPUを必要としないモデルを含む、いくつかの代替手段のパフォーマンス上のトレードオフについて検討する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:59:08 GMT)
Time-coded Spiking Fourier Transform in Neuromorphic Hardware [4.4] 本研究では,Fourier変換と数学的に等価な時間ベースのスパイクニューラルネットワークを提案する。
我々はニューロモルフィックチップLoihiにネットワークを実装し、自動車周波数変調連続波レーダを用いた5つの実シナリオの実験を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:34:13 GMT)
Impact of Acoustic Noise on Alzheimer's Disease Detection from Speech:
Should You Let Baby Cry? [4.3] 音声処理と機械学習(ML)はアルツハイマー病(AD)を確実に検出するための有望な技術を提供する
5つのカテゴリーから15種類の雑音が3種類の音響表現を訓練した4種類のMLモデルの性能に及ぼす影響について検討した。
特定のノイズがAD検出モデルに有用であることを示し、精度を最大4.8%向上させる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:30:28 GMT)
Recovering models of open quantum systems from data via polynomial
optimization: Towards globally convergent quantum system identification [4.3] 現在の量子デバイスは、製造の結果として不完全性に悩まされ、即時環境とのカップリングの結果、ノイズや消散に悩まされる。
もう一つの方法は、その行動の時系列測定からそのようなモデルを抽出することである。
最適化の最近の進歩は、この種の問題に対して、世界中に収束した解法を提供してきた。
我々は、最先端のアルゴリズム、境界、収束率の概要と、オープン量子システムのモデリングにおけるこのアプローチの利用について説明する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:38:08 GMT)
A bilingual approach to specialised adjectives through word embeddings
in the karstology domain [3.9] 単語埋め込みを用いた特定の意味関係を表現する形容詞の抽出実験を行う。
実験の結果は徹底的に分析され、形式的または意味的な類似性を示す形容詞のグループに分類される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:27:15 GMT)
Diffraction of strongly interacting molecular Bose-Einstein condensate
from standing wave light pulses [3.8] 定常波のパルスによって生成される6Li$分子のボース・アインシュタイン凝縮体の回折に及ぼす粒子間相互作用の影響について検討した。
短パルスでは標準のKapitza-Dirac回折が観測され、非常に大きな相互作用に対して回折パターンのコントラストが強く低下する。
長いパルスの回折は、管の配列とコヒーレントチャネル輸送に衝突する物質波の特性を示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:38:25 GMT)
Mask Atari for Deep Reinforcement Learning as POMDP Benchmarks [3.5] Mask Atariは、部分的に観測可能なマルコフ決定プロセス(POMDP)問題を解決するための新しいベンチマークである。
観測エリアとして、コントロール可能、移動可能、学習可能なマスクを備えたアタリ2600ゲームを基に構築されている。
我々はベンチマークの課題と特徴を説明し、Mask Atariでいくつかのベースラインを評価した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:34:02 GMT)
A Peek into the Political Biases in Email Spam Filtering Algorithms
During US Election 2020 [3.4] 我々は、多数の大統領、上院、下院候補者にGmail、Outlook、Yahooの100以上のメールアカウントを使って、2020年アメリカ合衆国大統領選挙の選挙メールを大規模に調査した。
我々は,SFAの左右候補に対する偏見を分析し,メール受信者のインタラクション(メールをスパムとして読む,マーキングするなど)がこれらの偏見に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 01:49:31 GMT)
Data-augmented cross-lingual synthesis in a teacher-student framework [3.3] 言語間合成は、話者が他の言語で流動的な合成音声を生成させるタスクである。
これまでの研究では、多くのモデルでは一般化能力が不十分であることが示されている。
本稿では,教師/学生のパラダイムを言語間合成に適用することを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:01:32 GMT)
A survey of neural models for the automatic analysis of conversation:
Towards a better integration of the social sciences [3.2] 会話の分析のためのニューラルアーキテクチャに対する新しいアプローチが、ここ数年で導入されている。
これには、感情、対話行動、感情極性を検出する神経アーキテクチャが含まれる。
アーキテクチャ自体は非常に有望ですが、これまで適用されてきた現象は、会話を活発にする部分の一部に過ぎないのです。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:59:54 GMT)
SimPO: Simultaneous Prediction and Optimization [3.2] 本稿では,同時予測最適化(SimPO)フレームワークの定式化を提案する。
このフレームワークでは,決定駆動型予測MLモデルと最適化対象関数の重み付き損失を併用する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:01:36 GMT)
Leveraging pre-trained language models for conversational information
seeking from text [2.8] 本稿では,プロセス記述文書から情報抽出の問題に対処するために,文脈内学習と事前学習言語表現モデルの使用について検討する。
その結果、このアプローチの可能性と、コンテキスト内学習のカスタマイズの有用性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:00:46 GMT)
Real-Time and Robust 3D Object Detection Within Road-Side LiDARs Using
Domain Adaptation [2.7] 本研究は,インフラLiDARを用いた3次元オブジェクト検出の領域適応における課題を解決することを目的としている。
インフラベースLiDARの車両をリアルタイムで検出できるモデルDASE-ProPillarsを設計する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:54:49 GMT)
A Unifying Framework for Reinforcement Learning and Planning [2.6] 本稿では、強化学習計画(FRAP)のための統一的アルゴリズムフレームワークを提案する。
論文の最後には、これらの次元に沿って、よく知られたプランニング、モデルフリー、モデルベースRLアルゴリズムを比較した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:06:35 GMT)
1-D CNN based Acoustic Scene Classification via Reducing Layer-wise
Dimensionality [2.5] 本稿では、音響シーン分類(ASC)において一般的に使用される時間周波数表現と交互に表現する枠組みを提案する。
生音声信号は、各種中間層を用いて予め訓練された畳み込みニューラルネットワーク(CNN)を用いて表現される。
提案手法は時間周波数表現に基づく手法よりも優れている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 02:00:31 GMT)
First-principles theory of extending the spin qubit coherence time in
hexagonal boron nitride [2.4] 我々は、h-BN中の全てのホウ素原子を10B同位体に置換することで、VBスピンのコヒーレンスを3倍に向上させることを示した。
また、VB−の曲率を誘導することにより、VB−のT2時間を1.3倍にすることができる。
我々の結果は、h-BNの任意のスピン量子ビットに適用でき、高速量子センサ、量子スピンレジスタ、原子間量子マグネットを実現するための材料プラットフォームとしての可能性を高めることができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:24:32 GMT)
Scalable Whitebox Attacks on Tree-based Models [2.3] 本稿では,木アンサンブルモデルに対する新しいホワイトボックス対逆ロバスト性試験手法を提案する。
サンプリングとログデリバティブのトリックを活用することで、提案手法は以前管理不能だったタスクのテストまでスケールアップできる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:36:20 GMT)
A Survey of Robust 3D Object Detection Methods in Point Clouds [2.2] 本稿では,新しいデータ拡張手法,サンプリング戦略,アクティベーション機能,アテンション機構,正規化手法について述べる。
KITTI, nuScenes, およびデータセットを用いた新しい3Dオブジェクト検出器の評価を行った。
LiDARポイントクラウドにおける3Dオブジェクト検出の現在の課題について言及し、いくつかのオープンな問題をリストアップする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:41:32 GMT)
Bangla hate speech detection on social media using attention-based
recurrent neural network [2.1] この記事では、Facebookページ上のユーザのBengaliコメントを分類するために、NLPで人気のツールであるエンコーダデコーダベースの機械学習モデルを提案する。
7つの異なるカテゴリーのヘイトスピーチからなる7,425のBengaliコメントのデータセットを使用して、モデルをトレーニングし、評価した。
3つのエンコーダデコーダアルゴリズムのうち、アテンションベースのデコーダが最も精度が高い(77%)。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:31:53 GMT)
Measuring hand use in the home after cervical spinal cord injury using
egocentric video [2.1] エゴセントリックビデオは、コミュニティで四肢麻痺を患っている人の手機能モニタリングの潜在的な解決策として登場した。
四肢麻痺児の在宅における手指使用量を測定するウェアラブル・ビジョン・ベース・システムの開発と評価を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:43:23 GMT)
Using IPA-Based Tacotron for Data Efficient Cross-Lingual Speaker
Adaptation and Pronunciation Enhancement [1.8] 我々は、20分間のデータのみを用いて、同一または異なる言語から、新しい話者のための既存のTSモデルを転送可能であることを示す。
まず、言語に依存しない入力を持つ基本多言語タコトロンを導入し、話者適応の異なるシナリオに対してトランスファー学習がどのように行われるかを実証する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:49:56 GMT)
Clock synchronization with correlated photons [1.8] イベント同期はユビキタスなタスクであり、5G技術から産業自動化、スマートパワーグリッドまで幅広いアプリケーションがある。
ここでは、エネルギー時間絡み合った光子の時間相関が量子ネットワークにおける同期にどのように利用されるかを示す。
我々は,100msのデータパッケージあたりの44個の相関検出イベントで,68psの安定なジッタ同期を実現する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:11:31 GMT)
A Universal Formulation of Uncertainty Relation for Errors under Local
Representability [1.7] 量子測定における不確実性関係の普遍的定式化について述べる。
フレームワークの単純さと操作性のために、結果として得られる一般的な関係は、自然な操作的解釈と性格化を認めている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:55:19 GMT)
Longitudinal Fairness with Censorship [1.6] 我々は、適用可能な公正度対策を考案し、デバイアスアルゴリズムを提案し、検閲なしで公正度を橋渡しするために必要な理論的構造を提供する。
検閲された4つのデータセットに対する実験により、我々のアプローチの有効性が確認された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 01:13:09 GMT)
How Does Pre-trained Wav2Vec2.0 Perform on Domain Shifted ASR? An
Extensive Benchmark on Air Traffic Control Communications [1.4] 本研究は,事前学習と下流微調整の相違がデータに与える影響について検討する。
提案したモデルを4つの挑戦的なATCテストセットでベンチマークする。
また、微調整データサイズがWERに与える影響を5分(2時間)から15時間まで調べる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:10:42 GMT)
Synthesis of Stabilizing Recurrent Equilibrium Network Controllers [1.4] 本稿では、リカレントニューラルネットワークの一般化であるリカレント平衡ネットワークに基づく非線形動的コントローラのパラメータ化を提案する。
制御器がセクター有界非線形性を持つ部分観察された力学系の指数的安定性を保証するパラメータ化に関する制約を導出する。
本稿では,任意の構造を持つ報酬関数を最大化するために,予測ポリシ勾配法を用いてこの制御器を合成する手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:27:51 GMT)
Optimal supplier of single-error-type entanglement via coherent-state
transmission [1.3] 我々は、損失チャネル上のコヒーレント状態伝送を介して、遠隔キュービットに対する単一エラー型絡み合いを示すプロトコルを検討する。
このプロトコルは、Ebitsやpbitsのような最終的な出力を得るために、より大きなプロトコルの絡み合いを提供するサブルーチンと見なされている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:36:54 GMT)
MMER: Multimodal Multi-task learning for Emotion Recognition in Spoken
Utterances [1.2] 感情認識は、人間の発話を異なる感情カテゴリーに分類することを目的としている。
本稿では,ER を個別発話から分離したマルチモーダルなマルチタスク学習手法を提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:51:32 GMT)
A Discourse Aware Sequence Learning Approach for Emotion Recognition in
Conversations [1.2] 本稿では,本モデルが最先端技術に競争力を持たせることを示し,文献における他のグラフベースの手法よりも優れた性能を示す。
コードはすべてGitHubで公開しています。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:07:16 GMT)
WavThruVec: Latent speech representation as intermediate features for
neural speech synthesis [1.1] WavThruVecは、高次元のWav2Vec 2.0埋め込みを中間音声表現として使用することでボトルネックを解決する2段階アーキテクチャである。
提案モデルは,最先端のニューラルモデルの品質に適合するだけでなく,音声変換やゼロショット合成といったタスクを可能にする有用な特性も提示する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:21:08 GMT)
Analyzing the factors affecting usefulness of Self-Supervised
Pre-trained Representations for Speech Recognition [1.1] 高レベルの音声表現を学習するための自己教師付き学習(SSL)は、音声認識システムを構築するための一般的なアプローチである。
ドメイン、言語、データセットサイズ、および上流のトレーニング済みSSLデータに対するその他の側面が、最終性能の低リソースのASRタスクに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:48:24 GMT)
Quantum computing at the quantum advantage threshold: a down-to-business
review [1.0] 量子コンピューティング、有望な計算モデル、そして最も発達した物理プラットフォームにおける技術の現状についてレビューする。
また、これらの要件に対処するための潜在的な応用、これらの応用によって引き起こされる要件、技術的経路についても論じる。
このレビューは方程式のない単純な言語で書かれており、数学や物理学の先進的なバックグラウンドを持たない読者にアクセスできるべきである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:55:39 GMT)
On the Evaluation of NLP-based Models for Software Engineering [0.8] 我々は,NLPに基づくSE問題モデルがどのように評価されているのかを研究者らにより検討する。
この結果から,これらのモデルの評価には一貫性があり,広く受け入れられているプロトコルが存在しないことが示唆された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:42:19 GMT)
CatIss: An Intelligent Tool for Categorizing Issues Reports using
Transformers [0.8] CatIssはTransformerベースのトレーニング済みRoBERTaモデル上に構築されたISSueレポートの自動CATegorizerである。
CatIssは、イシューレポートを、バグレポート、強化/機能要求、質問の3つの主要なカテゴリに分類する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:20:58 GMT)
Deep Learning for Spectral Filling in Radio Frequency Applications [0.8] 本稿では、スペクトルフィリングにディープニューラルネットワークを適用する方法を提案する。
我々は、付加的なメッセージの形で、固定変調信号の「周辺」として、追加情報を送るための新しい変調スキームを学習する。
これにより、帯域幅を増大させることなく、チャネル容量を効果的に増やすことができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:31:54 GMT)
Distance bounds for generalized bicycle codes [0.8] 一般化自転車符号(英: Generalized bike codes, GB codes)は、二項循環行列からなる量子誤り訂正符号のクラスである。
我々は,行重4,6,8の2ビット符号化符号群において,ある素循環サイズのGB符号を網羅的に列挙した。
観測された距離スケーリングは、$A(w)n1/2+B(w)$と一致しており、$n$はコード長であり、$A(w)$は$w$で増加している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:43:34 GMT)
Digitizing Historical Balance Sheet Data: A Practitioner's Guide [0.3] 本稿では,光学式文字認識(OCR)エンジンを前処理および後処理で拡張することにより,大規模歴史的マイクロデータのデジタル化を成功させる方法について論じる。
2つの大きなバランスシートデータセットに対してそれらを適用し、これらのメソッドを含むPythonパッケージである"quipucamayoc"を統一フレームワークで導入する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 19:18:38 GMT)
Assessing the risk of re-identification arising from an attack on
anonymised data [0.2] 悪意のある攻撃から匿名化されたデータセットへの再識別のリスクを計算する。
そこで本研究では,k匿名化データセットにおける1人の患者の再同定の確率を推定する分析手法を提案する。
我々はこの解法を一般化し、複数の患者が再同定される確率を得る。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:47:05 GMT)
Quantum Networks for High Energy Physics [0.1] 量子オブジェクトの量子ネットワークは、独立に考慮されたオブジェクトよりも指数関数的に強力なことを約束する。
このようなネットワークは、ナノスケールからグローバルスケールの量子ネットワークまで、複数のスケールに存在する可能性がある。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:06:46 GMT)
Teaching for large-scale Reproducibility Verification [0.1] 様々なSTEMや社会科学の学部生は、データ証明と再現可能な手法で訓練されている。
採用、訓練、定期的な活動について詳述する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:36:14 GMT)
Formation of Two-Ion Crystals by Injection from a Paul-Trap Source into
a High-Magnetic-Field Penning Trap [0.1] 2イオン結晶は量子の性質を研究するための基盤となっている。
イオンは光イオン化によって内部で生成されるか、または(ポールトラップ)源で外部に生成される。
量子状態に到達するための強磁場下での2イオン結晶のレーザー冷却について述べる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:32:48 GMT)
Quantum Control of Spin Qubits Using Nanomagnets [0.1] ナノスケール磁気の電圧制御を用いたスピン量子ビットに対処する新しい手法を提案する。
ナノマグネットの電界駆動の周波数をナノスケールの体積に制限されたスピンのラーモア周波数に調整することにより、フォールトトレラント量子コンピューティングに近づく忠実度を持つ単一量子ビット量子ゲートを実現することができることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:01:02 GMT)
Multicopy metrology with many-particle quantum states [0.1] 無限個のコピーの極限において、距離論に最も有用となる絡み合った状態のクラスを同定する。
一方,ホワイトノイズの少ない純粋な絡み合った状態は,無限のコピー数に制限されても,最大限に役に立たないことを示す。
本稿では,提案手法と誤り訂正の関係について考察し,ノイズの多い環境下での量子情報処理の可能性について考察する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:05:38 GMT)
MBORE: Multi-objective Bayesian Optimisation by Density-Ratio Estimation [0.0] 最適化問題は、しばしば計算的に、あるいは金銭的にコストがかかる複数の矛盾する目標を持つ。
単代理ベイズ最適化(BO)は、そのようなブラックボックス関数を最適化するための一般的なモデルベースのアプローチである。
BOREによるBOの先行研究を多目的設定に拡張する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:27:59 GMT)
indic-punct: An automatic punctuation restoration and inverse text
normalization framework for Indic languages [0.0] IndicBERTモデルを用いたテキストの自動句読取手法を提案する。
逆テキスト正規化は手書き有限状態トランスデューサ(WFST)文法によって行われる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:18:43 GMT)
Wind Farm Layout Optimisation using Set Based Multi-objective Bayesian
Optimisation [0.0] 風力発電エネルギーの欠点の1つは、風力発電所を設置するのに必要な大きな空間である。
これは自然に最適化の問題につながるが、これは3つの特定の課題がある。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:33:50 GMT)
Wading through the void: Exploring quantum friction and nonequilibrium
fluctuations [0.0] 量子摩擦は、2つ以上の物体が真空中で互いに相対的に移動するときに起こる。
多くの調査が、仕事中のメカニズムの豊かさを明らかにしている。
量子摩擦を取り巻く物理学の概要と最近の発展の展望について述べる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:59:28 GMT)
Uniqueness in a Navier-Stokes-nonlinear-Schr\"odinger model of
superfluidity [0.0] ナヴィエ・ストークス方程式の弱解に対する弱強弱型一意性定理を証明した。
それらの正則性の性質のいくつかしか使われておらず、将来的な存在定理を改善する余地が与えられる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:20:45 GMT)
Two-step phantom relaxation of out-of-time-ordered correlations in
random circuits [0.0] 様々なランダム量子回路における時間外相関関数について検討する。
平均力学はマルコフプロパゲータによって支配されることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:59:04 GMT)
Tooth Instance Segmentation on Panoramic Dental Radiographs Using U-Nets
and Morphological Processing [0.0] 画像内のオブジェクトが分離されたセグメンテーションマップを得るための後処理ステージを提案する。
提案したポストプロセッシング段階により, 歯数の平均誤差は6.15%, ポストプロセッシングのない誤差は26.81%に減少した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:11:51 GMT)
There exist infinitely many kinds of partial separability/entanglement [0.0] 三部構成系には無限に多くの3つの量子ビット部分的絡み合いが存在することを示す。
格子内の凸集合の鎖の増大を考慮し、鎖内の凸集合を区別する3つの立方体グリーンベルガー・ホーネ・ザイリンガー対角状態を示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:39:54 GMT)
The ideal data compression and automatic discovery of hidden law using
neural network [0.0] 我々は、人間の脳がどのように出来事を認識し、記憶するかを考える。
我々は、新しいオートエンコーダニューラルネットワークを用いて、人間の脳のシステムを機械学習モデルで再現する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:55:24 GMT)
The holographic entropy cone from marginal independence [0.0] 我々は、ホログラフィックエントロピー円錐は、量子エントロピーの副付加性によってのみ決定されるより基本的なデータから再構成できると主張している。
幾何学的状態の曲がりくねった絡み合い構造を原始的な建物ブロックに再キャストすることはホログラフィーの本質を蒸留する方法を舗装する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:25:15 GMT)
Semantic Pose Verification for Outdoor Visual Localization with
Self-supervised Contrastive Learning [0.0] 我々は視覚的ローカライゼーションを改善するためにセマンティックコンテンツを利用する。
このシナリオでは、データベースはパノラマ画像から生成されたグノーモニックビューで構成されている。
我々は、セグメンテーションされた画像のデータセット上で、コントラスト学習を行い、自己教師型でCNNを訓練する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:09:38 GMT)
Rogue waves in discrete-time quantum walks [0.0] ローグ波(英: Rogue wave)は、海洋学や光学など、様々な分野で報告される異常振幅の急速かつ予測不可能な現象である。
ここでは、離散時間量子ウォークの全周の枠組みを用いて、ランダム位相変調によるこれらの事象の発端を研究する。
これらのローグ波は極値分布のガンベル族に属する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 19:55:53 GMT)
Robust Meta-Reinforcement Learning with Curriculum-Based Task Sampling [0.0] RMRL-GTS(Robost Meta Reinforcement Learning with Guided Task Sampling)は,スコアとエポックに基づいてタスクサンプリングを制限する効果的な手法であることを示す。
ロバストなメタRLを実現するためには、低得点のタスクを集中的にサンプリングするだけでなく、サンプリングすべきタスクのタスク領域の制限と拡張も必要である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 05:16:24 GMT)
Resurgent revivals in bosonic quantum gases: a striking signature of
many-body quantum interferences [0.0] 物質波の復活は、光学格子内の超低温ボゾン系の発達力学における構成的な多体量子干渉の微妙な相互作用に依存する。
弱サイト間トンネルと強オンサイト相互作用の相互作用は、平均場限界に存在しないいくつかの特徴を示す密度波の量子力学に繋がることが示されている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:56:46 GMT)
Rational indices for quantum ground state sectors [0.0] 我々は、ギャップのある基底状態部分空間と相互作用する多体システムに対する電荷輸送について検討する。
指数がユニタリの構成の下で加法であることを証明する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 22:41:22 GMT)
Ransomware Detection using Process Memory [0.0] 本研究はランサムウェアの内部動作と機能に焦点を当てる。
ランサムウェアファミリーの新しい署名と指紋を識別して、新しいランサムウェア攻撃を正しく分類することができる。
いくつかの有名な機械学習アルゴリズムが81.38から96.28パーセントの精度で探索された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:03:48 GMT)
Radial Autoencoders for Enhanced Anomaly Detection [0.0] 異常や不正検出のような二段階の分類タスクでは、教師なしの手法はさらに改善される可能性がある。
異常検出の直感的なアプローチは、2つのクラスの質量の中心からの距離に基づいている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:29:14 GMT)
Quantum interference in asymmetric superconducting nanowire loops [0.0] 超伝導電子機器は超伝導ループにおける超電流の変調に基づいている。
このような装置における非対称性の影響は、未調査であり、理解されていないままである。
ループ中の長さと電子断面の対称性を考慮したモデルは、観測の定量的な説明を提供する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:22:19 GMT)
Quantum entanglement and anthropology [0.0] 局所量子演算とマルチパーティ量子状態の古典的通信は、集団間のオンライン会議と類似していると考えられる。
共有系の量子状態の量子的および古典的相関の単調性は、集団のメンバー間の関係にも引き継がれる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:30:00 GMT)
Quantum algorithm for a chemical reaction path optimization by using a
variational quantum algorithm and a reaction path generation [0.0] 本稿では,化学反応経路最適化のための量子アルゴリズムを提案する。
我々のアルゴリズムでは、量子回路は変動量子固有解法(VQE)によるエネルギー評価だけでなく、化学反応経路生成にも利用できる。
提案アルゴリズムを$mathrmH + MathrmH rightarrow MathrmH + MathrmH$ reactionに適用し,VQEとVQEの両方の場合,$E_a$が精度良く得られたことを確認した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:21:55 GMT)
Quantum Chaos Control by Complex Trajectories [0.0] 近年、量子カオスの分析と制御がますます重要になっている。
この研究は、ニュートンの世界と量子世界とを複雑な力学で結びつけることを目的としている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:40:50 GMT)
Preventing Over-Smoothing for Hypergraph Neural Networks [0.0] 階層数の増加に伴い,ハイパーグラフニューラルネットワークの性能は向上しないことを示す。
我々はディープ・HGCNと呼ばれる新しいディープ・ハイパーグラフ・畳み込みネットワークを開発し、ディープ・レイヤにおけるノード表現を維持できる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:33:31 GMT)
Predicting extreme events from data using deep machine learning: when
and where [0.0] 我々は,極端事象の発生をモデル無しで予測するためのディープ畳み込みニューラルネットワーク(DCNN)ベースのフレームワークを開発する。
我々は,北大西洋の2次元複素ギンズバーグ・ランダウ方程式と経験的風速データから合成したデータを用いて,機械学習に基づく予測フレームワークの実証と検証を行った。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:28:01 GMT)
Practical parallel self-testing of Bell states via magic rectangles [0.0] 自己検査は、純粋に古典的な統計から特定の量子状態を持つことを検証する方法である。
3倍のマジック長方形ゲームを使って、シングルキュービットのパウリオブザーバブルを測るだけで、n$ Bell状態のセルフテストを得ることができます。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:14:18 GMT)
Permutational symmetry for identical multi-level systems: a second
quantized approach [0.0] 我々は、$N$同一の$d$レベルのシステムの力学を、$N$の粒子を持つボソニックモードの力学にマッピングできる単純なスキームを概説する。
特に、集合散逸項の作用の下で共通のサブシステムと相互作用する複数の同一のマルチレベルシステムのリンドブラッド力学を考える。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:53:17 GMT)
Optimisation-free Classification and Density Estimation with Quantum
Circuits [0.0] 量子回路を用いた確率密度推定と分類のための新しい機械学習フレームワークの実装を実証する。
このフレームワークは、トレーニングデータセットまたは単一のデータサンプルを、量子特徴写像を介して物理システムの量子状態にマッピングする。
我々は、我々のフレームワークに量子アドバンテージを活用できる変分量子回路のアプローチについて議論する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:50:30 GMT)
Optical frequency tweezers [0.0] 光周波数領域の光を高分解能でツイーズするための光周波数ツイーズの概念を示す。
非定型的な構成により、実験結果は周波数領域におけるツイーズ動作をうまく達成する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 23:40:02 GMT)
On the Only Fields interpretation of Quantum Mechanics [0.0] 量子場論(Quantum Field Theory)は、フィールド・パーティクル二重性(Field-Particle Duality)の全範囲を極端に包含する。
新しい実験は物語の粒子側を強化し、フィールド・パーティクルの二重性を確認する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:53:00 GMT)
On free fall of quantum matter [0.0] 自由落下は量子マターの性質に依存することを示す。
次に、地球表面に自由落下する一対の原子のE"otv"osパラメータを推定する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:02:11 GMT)
New Theory for Cooper Pair Formation and Superconductivity [0.0] クーパー対の形成と超伝導に関する新しい理論は、量子統計力学から導かれる。
ここで見つかる縮合クーパー対のサイズは、BCS理論で見られるものよりも桁違いに小さい。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 23:12:50 GMT)
Neural Q-learning for solving elliptic PDEs [0.0] 我々は,強化学習にQ-ラーニングアルゴリズムを適用し,楕円型PDEを解くための新しい数値法を開発した。
我々の「Q-PDE」アルゴリズムはメッシュフリーであり、従って次元の呪いを克服する可能性がある。
楕円型PDEに対するQ-PDEアルゴリズムの数値計算性能について検討した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:52:44 GMT)
Nanodiamond quantum sensors reveal temperature variation associated to
hippocampal neurons firing [0.0] ナノダイアモンドの磁気共鳴を光学的に検出したナノスケール温度計を用いて,ニューロンの発火の増強と枯渇に関連する温度変化(1degC)を検出する。
この結果は、局所的な温度勾配の生成に関する体系的な研究への道を開いた。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:39:57 GMT)
Mutual information estimation for graph convolutional neural networks [0.0] 本稿では,学習中にネットワークの内部表現を追跡するアーキテクチャに依存しない手法を提案する。
グラフベースアーキテクチャで導入された帰納バイアスが、完全に接続されたニューラルネットワークに対して相互情報平面をどのように変化させるかを比較する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 08:30:04 GMT)
Misogynistic Meme Detection using Early Fusion Model with Graph Network [0.0] 擬似的ミームの予測と同定のための早期融合モデルを提案する。
モデルは、そのテキストをターゲットベクトルで書き起こして入力ミーム画像として受信する。
我々のモデルは、他の競技チームとSubTask-AとSubTask-Bで競合する結果を得た。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 03:45:50 GMT)
ME-CapsNet: A Multi-Enhanced Capsule Networks with Routing Mechanism [0.0] 本研究は,各層の受容領域内の空間成分とチャネル成分の両面を高度に最適化する,新たなソリューションの実現に焦点をあてる。
我々は, カプセル層を戦略的に通過する前に重要な特徴を抽出するために, より深い畳み込み層を導入し, ME-CapsNetを提案する。
より深い畳み込み層にはSqueeze-Excitationネットワークのブロックが含まれており、重要な特徴情報を失うことなく、サンプリングアプローチを使用して相互依存関係を再構築する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:26:24 GMT)
Isogeometric Analysis of Bound States of a Quantum Three-Body Problem in
1D [0.0] B-スプライン基底関数の線形結合により波動関数を表現し,行列固有値問題として解く。
固有値は固有状態エネルギーを与えるが、固有ベクトルは固有状態に導くB-スプラインの係数を与える。
我々は、IGAが3体問題を解くための有望な技術を提供する、様々な数値実験を通して実証する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:50:39 GMT)
Interpretation of Black Box NLP Models: A Survey [0.0] 摂動に基づくポストホックの説明は、機械学習モデルの構築後に解釈するために広く使われているアプローチである。
本稿では,中心極限定理に基づく仮説テストフレームワークを用いて,解析結果の安定性を保証するのに必要な摂動点数を決定することを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:54:35 GMT)
Improvement of the Envelope Theory for Systems with Different Particles [0.0] エンベロープ理論は、量子$N$ボディハミルトニアンの近似固有解を計算する方法である。
エンベロープ理論を一般化と組み合わせ、支配的軌道状態法(英語版)の$N$-bodyにすることで固有値の精度を向上させることができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:08:52 GMT)
Improved Relation Networks for End-to-End Speaker Verification and
Identification [0.0] 話者識別システムは、少数のサンプルが与えられた一連の登録話者の中から話者を識別する。
話者検証と少数ショット話者識別のための改良された関係ネットワークを提案する。
話者検証におけるプロトタイプネットワークの利用に触発されて、トレーニングセットに存在するすべての話者のうち、現在のエピソードのサンプルを分類するようにモデルを訓練する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:44:04 GMT)
IITD-DBAI: Multi-Stage Retrieval with Pseudo-Relevance Feedback and
Query Reformulation [0.0] コンテキスト依存を解決することは、会話システムにおいて最も難しいタスクの1つです。
我々の提案は、中央値モデルよりも平均的なNDCG@3パフォーマンスを実現した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:07:47 GMT)
HiFi-VC: High Quality ASR-Based Voice Conversion [0.0] 音声変換パイプラインを新たに提案する。
提案手法では,音声認識機能,ピッチ追跡,最先端波形予測モデルを用いる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:45:32 GMT)
Ground state energy of dilute Bose gases in 1D [0.0] 密度$rho$の1Dボソンの気体の基底状態エネルギーを、散乱長$a$の一般の2体ポテンシャルを介して相互作用し、希薄な極限$rho |a|ll1$で研究する。
スピンレスフェルミオンと1D異方性対称性の拡張を含み、閉じ込められた3次元気体への応用について議論する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:58:24 GMT)
Geometrical picture of the electron-electron correlation at the large-D
limit [0.0] 電子構造計算では、相関エネルギーは平均場と非相対論的シュリンガー方程式の正確な解との差として定義される。
ここでは、電子が大次元のスケール空間に局在する次元スケーリング手法を用いて、電子相関の幾何学的図形を記述する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:19:52 GMT)
Fully tunable longitudinal spin-photon interactions in Si and Ge quantum
dots [0.0] 我々は、最先端のホールスピン量子ビットにおいて、大きな縦方向の相互作用が自然に現れることを示す。
本稿では,これらの相互作用を計測し,高速かつ高忠実な2ビットエンタングゲートを実装するための現実的なプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:36:53 GMT)
Flat-topped Probability Density Functions for Mixture Models [0.0] 本稿では, 分布モードにほぼ一様であり, 様々な分布形状に適応する確率密度関数 (PDF) について検討する。
計算的トラクタビリティの観点から、Fermi-Dirac あるいはロジスティック関数に基づくPDFは、その形状パラメータを推定する上で有利である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:45:02 GMT)
Extended Bose-Hubbard models with Rydberg macrodimer dressing [0.0] 我々は、リドベルク相互作用ポテンシャルにおける分子結合状態にdressしたボソニック量子ガスの使用を提案する。
主量子数と基底状態原子のトラップ周波数に関する分子Rabi結合について検討する。
生成した超流動体の分子Rabi結合を緩やかに傾斜させて超固相を求める。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 15:33:23 GMT)
Exchange energies with forces in density-functional theory [0.0] DFTのエネルギー関数を物理的に等価な正確な力表現で交換することを提案する。
交換ポテンシャルの明示的な表現は、従来の力に基づくアプローチの概念的な問題を克服する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:08:29 GMT)
Emerging (2+1)D massive graviton in graphene-like systems [0.0] 巨大な重力子のような重力の量子的側面は、分数量子ホール液体を用いた実験で現れる。
我々は(2+1)次元のディラックフェルミオンを用い、フェルミオンハニカム格子の連続的な極限に現れ、巨大な量子重力と結合する。
現在の光学格子構成に対する我々のアプローチの類似性は、量子重力モデルが近い将来実験室でシミュレートできることを示唆している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:39:05 GMT)
Effectiveness of text to speech pseudo labels for forced alignment and
cross lingual pretrained models for low resource speech recognition [0.0] 本稿では,Maithili,Bhojpuri,Dogriのラベル付きデータ作成手法を提案する。
すべてのデータとモデルはオープンドメインで利用可能である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 06:12:52 GMT)
Effect of quantum coherence on Landauer's principle [0.0] 量子ランダウアーの原理は、量子状態における情報消去に伴うエネルギー散逸の基本的な下限を提供する。
最近の試みは、散逸したエネルギー(熱力学的境界)の熱ゆらぎに関連する別の下界も提供している。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 00:17:42 GMT)
ESGBERT: Language Model to Help with Classification Tasks Related to
Companies Environmental, Social, and Governance Practices [0.0] 環境、社会、ガバナンス(ESG)といった非金融要因が投資家から注目を集めている。
ESGテキストの分類タスクには高度なNLP技術が必要である。
本研究では,ESG 固有のテキストを用いて事前学習した BERT の重み付けを微調整し,さらに分類タスクのためのモデルを微調整することによってこれを行う。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 04:22:44 GMT)
Dynamical quantum phase transitions in the one-dimensional extended
Fermi-Hubbard model [0.0] 半充填1次元格子における動的量子相転移(DQPT)の出現について検討する。
DQPTに繋がるいくつかの種類の突然の相互作用クエンチを同定する。
最先端のコールド原子量子シミュレータは、いくつかの報告されたDQPTを実験的に実装するための理想的なプラットフォームを構成する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:31:43 GMT)
Dynamical quantum phase transitions in a noisy lattice gauge theory [0.0] 本稿では、質量項の符号のクエンチに従って、(1+1)$D U$(1)$量子リンクモデルの雑音を受ける力学について研究する。
NISQ時代のデバイスではノイズをリアルに処理できるだけでなく、ノイズの効果を単純なモデルで理解することができる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:29:09 GMT)
Down-conversion of a single photon as a probe of many-body localization [0.0] 非線形媒質では、単一の光子でさえ、同じ全エネルギーの低周波光子へのダウンコンバージョン(スプリッティング)によって崩壊する。
この場合、光子の運命は多体局在(MBL)の長年の問題となる。
その結果、多くの原子や量子ビットを制御せずに、MBLの基礎を探索する新しいプラットフォームが導入された。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:11:12 GMT)
Does Audio Deepfake Detection Generalize? [0.0] 我々は、関連する作業からアーキテクチャを再実装し、一様に評価することで、音声スプーフィング検出をシステム化する。
有名人や政治家のオーディオ録音を37.9時間記録したデータセットを新たに公開し、そのうち17.2時間がディープフェイクである。
これは、コミュニティがASVSpoofベンチマークに近づきすぎており、ディープフェイクが以前考えられていたよりもラボ外で検出するのがずっと難しいことを示唆しているかもしれない。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:43:13 GMT)
Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0] セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:34:22 GMT)
Cyberbullying Indicator as a Precursor to a Cyber Construct Development [0.0] 本研究では,観測可能な行動指標の同定に基づくサイバーいじめの枠組みを提案する。
研究は、30人の記者による自己管理計測装置を用いて、サイバーバブル構築の確率を観察した。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 07:55:51 GMT)
Cria\c{c}\~ao e aplica\c{c}\~ao de ferramenta para auxiliar no ensino de
algoritmos e programa\c{c}\~ao de computadores [0.0] 本研究の目的は,フォータレーザ大学のアルゴリズム・プログラミング科目におけるモニタリングプログラムで開発された教育ツールの開発を報告することである。
このツールは、本で得られた知識と、生徒に近い言語、ビデオのレッスンとエクササイズ、そしてインターネット上のすべてのコンテンツを組み合わせたものだ。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:48:49 GMT)
Contributions to interframe coding [0.0] 画像の局所特性の関数として,異なるブロックサイズを用いて,ベクトル数を削減できる新しい手法を提案する。
第2のアルゴリズムは、フレーム間/イントラフレームコーダに対して提案される。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:36:25 GMT)
Contemporary Research Trends in Response Robotics [0.0] 本稿では,文献の技術的内容,統計,意味を文献学的観点から分析する。
本研究の目的は, 応答ロボット研究のグローバルな進展を調査し, 現代の傾向を明らかにすることである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 21:59:58 GMT)
Conditional Autoregressors are Interpretable Classifiers [0.0] MNIST-10で画像分類を行うために,クラス条件自動回帰(CA)モデルを用いて検討する。
自己回帰モデルは、個々の特徴から確率を組み合わせることで、入力全体に対する確率を割り当てる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 12:51:36 GMT)
Comment on Causal Networks and Freedom of Choice in Bell's Theorem [0.0] 隠された変数と設定された変数の独立は、選択の自由、自由意志、測定独立、陰謀などと呼ばれる。
ベル因果構造をより大きな因果ネットワークに埋め込むことで、超決定論を誘発することなく、測定独立性の違反を説明・定量化できることを著者らは正しく証明できる。
選択の自由が非コンテクスト性(noncontextuality)と呼ばれるべき理由と、ベルテストにおけるその違反が量子可観測体の文脈的特徴のみを裏付ける理由を説明する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:59:24 GMT)
Certified machine learning: A posteriori error estimation for
physics-informed neural networks [0.0] PINNは、より小さなトレーニングセットに対して堅牢であることが知られ、より優れた一般化問題を導出し、より高速にトレーニングすることができる。
純粋にデータ駆動型ニューラルネットワークと比較してPINNを使うことは、トレーニング性能に好都合であるだけでなく、近似されたソリューションの品質に関する重要な情報を抽出できることを示す。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:23:04 GMT)
Automatic Classification of Alzheimer's Disease using brain MRI data and
deep Convolutional Neural Networks [0.0] アルツハイマー病(英: Alzheimer's disease、AD)は、世界の公衆衛生問題の一つ。
本稿では,脳MRI画像とセグメント画像を用いたディープラーニングアーキテクチャの構築について検討する。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 20:15:51 GMT)
Applying PBL in the Development and Modeling of kinematics for Robotic
Manipulators with Interdisciplinarity between Computer-Assisted Project,
Robotics, and Microcontrollers [0.0] 本稿では,ロボットマニピュレータの設計,開発,数学的モデリングを通じて,プロジェクトベースラーニング(ABP)の応用を提案する。
フォータレーザ大学の制御・自動化工学の学生による産業ロボット、マイクロコントローラ、コンピュータ支援設計の分野の統合プロジェクトである。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 10:01:24 GMT)
Aplica\c{c}\~ao de ros como ferramenta de ensino a rob\'otica / using
ros as a robotics teaching tool [0.0] ロボットマニピュレータの研究は、インダストリアル・ロボティクス・クラスの主要な目標である。
本稿では,ロボットアーム開発のためのツールとして,ロボット操作システム(ROS)の利用を明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 09:48:21 GMT)
An energy-based deep splitting method for the nonlinear filtering
problem [0.0] 本研究の主な目的は,ディープラーニングによる非線形フィルタリング問題を概ね解決することである。
これは、(確率的な)偏微分方程式の近似解のために以前に開発されたディープスプリッティング法により、ザカイ方程式を解くことで達成される。
これは、ディープニューラルネットワークによる関数近似のためのエネルギーベースモデルと組み合わせられる。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 16:26:54 GMT)
An Illustrative Industry Architecture to Mitigate Potential
Fragmentation across Central Bank Digital Currency and Commercial Bank Money [0.0] CBDCと商業銀行の資金を同様の基盤に配置する実証的な産業建築について述べる。
私たちは、Open Bankingアプリケーションプログラミングインターフェース(API)を使用して商業銀行と対話する業界エコシステムを含む、英国(UK)のCBDCの可能性に焦点を当てています。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 13:20:47 GMT)
Alternative solution to a quantum-mechanical four-particle system in one
dimension [0.0] 本研究では,2次元と3次元の相互作用を持つ量子力学的四粒子系の代替解を提案する。
中心座標とヤコビ座標における固有値方程式の解は、最近提案された球面座標に基づく手順よりもかなり単純である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:45:28 GMT)
A readout-integrated time-bin qutrit analyzer for echo-based quantum
memories [0.0] 本稿では、連続したメモリの部分的な読み出しを用いて、エコーベースの量子メモリに格納された時間ビンキュートリットを投影する方法を提案する。
我々は、このスキームが相互に偏りのない基底の完全な集合への射影の実装にどのように使用できるかを示し、従って任意の量子状態のキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:53:47 GMT)
A multipair-free source of entangled photons in the solid state [0.0] 多光子放出は、通常、古典的でない光源によって生成される光子の絡み合いの程度を減少させる。
量子放出器はこのハードルを克服する可能性を持っているが、今のところ、多光子放射が絡み合いの質に与える影響は詳細には解決されていない。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 14:50:16 GMT)
A data-driven approach for the closure of RANS models by the divergence
of the Reynolds Stress Tensor [0.0] RANS方程式を閉じて精度を上げる新しいデータ駆動モデルを提案する。
この選択は RANS 方程式における RST の発散によって引き起こされる。
このデータ駆動アプローチが訓練されると、方程式を閉じるために乱流モデルを実行する必要はない。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 11:08:54 GMT)
A Few Almost Trivial Notes on the Symplectic Radon Transform and the
Tomographic Picture of Quantum Mechanics [0.0] 我々は、ラドン変換の理論とその応用は、メタプレクティック群の理論を用いて最もよく理解されていることを強調した。
これによって、これらのメモが、時間周波数分析の研究者を含む、より多くの聴衆にとって有用になることを願っている。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:36:21 GMT)
A Baseline Readability Model for Cebuano [0.0] セブアーノ語の最初のベースライン可読性モデルを開発した。
セブアーノ語はフィリピンで2番目に多く使われている母語であり、約27.5万人が話者である。
論文参考訳(メタデータ) (Thu, 31 Mar 2022 17:49:11 GMT)