A Roadmap for Big Model [390.6] BMの全般的な進歩を整理し、フォローアップ研究を導く研究成果の欠如がある。
本稿では,BM技術そのものだけでなく,BM訓練やBM応用の前提条件についても述べる。
データ,知識,コンピュータシステム,並列学習システム,言語モデル,ビジョンモデル,マルチモーダルモデル,理論と解釈可能性,常識推論,信頼性とセキュリティ,ガバナンス,評価,機械翻訳,テキスト生成,対話,タンパク質研究の4分野に16のBM関連トピックを紹介する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:12:42 GMT)
Counterfactual Cycle-Consistent Learning for Instruction Following and
Generation in Vision-Language Navigation [172.2] 本稿では,2つのタスクを同時に学習し,それぞれのトレーニングを促進するために本質的な相関性を利用するアプローチについて述べる。
提案手法は,様々な追従モデルの性能を改善し,正確なナビゲーション命令を生成する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:15:26 GMT)
Omni-DETR: Omni-Supervised Object Detection with Transformers [165.4] 我々は、ラベルなし、完全ラベル付き、弱ラベル付きアノテーションを使用できるOmni教師付きオブジェクト検出の問題を考察する。
この統一アーキテクチャの下では、異なる種類の弱いラベルを利用して正確な擬似ラベルを生成することができる。
弱いアノテーションは検出性能を向上させるのに役立ち、それらの混合はアノテーションのコストと精度のトレードオフを改善することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:36:09 GMT)
CoordGAN: Self-Supervised Dense Correspondences Emerge from GANs [129.5] 本稿では,各生成画像の高密度対応マップを学習する構造テクスチャ不整合GANであるCoordinate GAN(CoordGAN)を紹介する。
提案するジェネレータは,既存手法に比べて構造とテクスチャの絡み合いが良くなることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:55:09 GMT)
Large-Scale Pre-training for Person Re-identification with Noisy Labels [125.5] 雑音ラベル(PNL)を利用した大規模事前学習フレームワークを開発した。
原則として、これらの3つのモジュールの合同学習は、1つのプロトタイプに類似したクラスタの例だけでなく、プロトタイプの割り当てに基づいてノイズラベルを修正します。
このシンプルな事前学習タスクは、ベルやwhiを使わずに"LUPerson-NL"でSOTA Re-ID表現をスクラッチから学習するスケーラブルな方法を提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:59:58 GMT)
Towards Differential Relational Privacy and its use in Question
Answering [109.4] データセット内のエンティティ間の関係の記憶は、トレーニングされた質問応答モデルを使用する場合、プライバシの問題につながる可能性がある。
我々はこの現象を定量化し、微分プライバシー(DPRP)の定義を可能にする。
質問回答のための大規模モデルを用いた実験において,概念を解説する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 22:59:24 GMT)
HDSDF: Hybrid Directional and Signed Distance Functions for Fast Inverse
Rendering [103.8] 3D形状の暗黙的な神経表現は、シングルビューや複数ビューの3D再構成など、様々な用途に有用な強力な先行情報を形成する。
既存のニューラル表現の欠点は、レンダリングに複数のネットワーク評価が必要であることである。
我々は,方向距離関数(DDF)を付加した符号付き距離関数(SDF)に基づく新しいハイブリッド3次元オブジェクト表現を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:24:04 GMT)
Single-Stream Multi-Level Alignment for Vision-Language Pretraining [103.1] モーダルを複数のレベルで整列させる単一ストリームモデルを提案する。
対称的相互モダリティ再構築と擬似ラベル付きキーワード予測という2つの新しいタスクを用いてこれを実現する。
我々は、ゼロショット/ファインチューニングされた画像/テキスト検索、参照表現、VQAといった一連の視覚言語タスクにおいて、トップパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:54:27 GMT)
Learning Self-Modulating Attention in Continuous Time Space with
Applications to Sequential Recommendation [102.2] 本稿では,複雑で非線形に進化する動的ユーザの嗜好をモデル化する,自己変調型注意ネットワークを提案する。
提案手法がトップNシーケンシャルなレコメンデーションタスクに与える影響を実証的に示すとともに,3つの大規模実世界のデータセットによる結果から,我々のモデルが最先端のパフォーマンスを達成できることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:54:11 GMT)
FALCON: Fast Visual Concept Learning by Integrating Images, Linguistic
descriptions, and Conceptual Relations [99.5] 自然に発生する複数のデータストリームによってガイドされる新しい視覚概念を素早く学習するフレームワークを提案する。
学習された概念は、未知の画像について推論することで質問に答えるなど、下流のアプリケーションをサポートする。
合成と実世界の両方のデータセットにおけるモデルの有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:45:00 GMT)
End to End Lip Synchronization with a Temporal AutoEncoder [95.9] ビデオ中の唇の動きをオーディオストリームと同期させる問題について検討する。
両領域再帰型ニューラルネットワークを用いて最適アライメントを求める。
アプリケーションとして、既存のビデオストリームとテキストから音声までの音声を強力にアライメントする能力を実証する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:00:18 GMT)
Learning Local Displacements for Point Cloud Completion [93.5] 本稿では,3次元点雲として表現された部分的スキャンからオブジェクトとセマンティックシーンを補完する手法を提案する。
アーキテクチャはエンコーダ-デコーダ構造内で連続的に使用される3つの新しいレイヤに依存している。
オブジェクトと屋内の両方のシーン完了タスクにおけるアーキテクチャの評価を行い、最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:31:37 GMT)
TubeDETR: Spatio-Temporal Video Grounding with Transformers [89.7] 与えられたテキストクエリに対応するビデオにおいて、アテンポラルチューブをエンコーダでローカライズする問題について考察する。
この課題に対処するために,テキスト条件付きオブジェクト検出における近年の成功に触発された変換器アーキテクチャであるTubeDETRを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:31:49 GMT)
Lossless Speedup of Autoregressive Translation with Generalized
Aggressive Decoding [89.3] GAD(Generalized Aggressive Decoding)は、自動回帰翻訳を品質損失なく高速化するための新しいアプローチである。
GADはNATを通じて複数のトークンを並列に復号し、自己回帰的に検証する。
我々は、WMT14の英独翻訳タスクで実験を行い、バニラGADが、約3倍のスピードアップでグリーディ復号と全く同じ結果が得られることを確認した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:27:09 GMT)
SeqTR: A Simple yet Universal Network for Visual Grounding [88.0] 本稿では,視覚的接地作業のためのシンプルな汎用ネットワークSeqTRを提案する。
画像とテキストの入力を条件とした点予測問題として,視覚的グラウンドリングを行った。
このパラダイムの下では、視覚的なグラウンドタスクはタスク固有のブランチやヘッドなしでSeqTRネットワークに統合されます。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:52:46 GMT)
Deeply Interleaved Two-Stream Encoder for Referring Video Segmentation [87.5] まず,CNNに基づく視覚特徴とトランスフォーマーに基づく言語特徴を階層的に抽出する2ストリームエンコーダを設計する。
視覚言語相互誘導(VLMG)モジュールをエンコーダに複数回挿入し,多モード特徴の階層的および進行的融合を促進する。
フレーム間の時間的アライメントを促進するために,言語誘導型マルチスケール動的フィルタリング(LMDF)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:06:13 GMT)
Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data [80.1] 本稿では,自律運転データに適した3次元知覚モデルのための自己教師付き事前学習手法を提案する。
我々は、自動走行装置における同期・校正画像とLidarセンサーの可用性を活用している。
私たちのメソッドは、ポイントクラウドや画像アノテーションを一切必要としません。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:40:30 GMT)
How Does SimSiam Avoid Collapse Without Negative Samples? A Unified
Understanding with Self-supervised Contrastive Learning [79.9] 自己教師学習の崩壊を避けるために、コントラスト損失は広く使用されるが、多くの負のサンプルを必要とすることが多い。
最近の研究は、崩壊を避けるために最小限の単純なシムセ法(SimSiam)を提供することによって大きな注目を集めている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:46:31 GMT)
MAT: Mask-Aware Transformer for Large Hole Image Inpainting [79.7] 本稿では, 変圧器と畳み込みの利点を統一する, 大穴塗装の新しいモデルを提案する。
実験では、複数のベンチマークデータセット上で、新しいモデルの最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:38:16 GMT)
Learning Instance-Specific Adaptation for Cross-Domain Segmentation [79.6] クロスドメイン画像セグメンテーションのためのテスト時間適応法を提案する。
テスト時に新しい目に見えないインスタンスが与えられると、インスタンス固有のBatchNormキャリブレーションを実行することで、事前トレーニングされたモデルを適用します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:59:45 GMT)
STRPM: A Spatiotemporal Residual Predictive Model for High-Resolution
Video Prediction [78.1] 本稿では,高解像度映像予測のための時間残差予測モデル(STRPM)を提案する。
STRPMは、既存の様々な方法と比較して、より満足な結果を得ることができる。
実験の結果, STRPMは既存手法と比較して良好な結果が得られた。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:24:00 GMT)
Improved Quantum Algorithms for Fidelity Estimation [77.3] 証明可能な性能保証を伴う忠実度推定のための新しい,効率的な量子アルゴリズムを開発した。
我々のアルゴリズムは量子特異値変換のような高度な量子線型代数技術を用いる。
任意の非自明な定数加算精度に対する忠実度推定は一般に困難であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:02:16 GMT)
Explainable Artificial Intelligence in Process Mining: Assessing the
Explainability-Performance Trade-Off in Outcome-Oriented Predictive Process
Monitoring [77.3] 本稿では,説明可能性の解釈可能性と説明可能性モデルの忠実さについて述べる。
導入されたプロパティは、プロセスベースの分析の典型的なイベント、ケース、制御フローの観点に沿って分析されます。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:59:50 GMT)
Dual Temperature Helps Contrastive Learning Without Many Negative
Samples: Towards Understanding and Simplifying MoCo [75.4] 本稿では,MoCoファミリーにおけるコントラスト学習(CL)のためのモーメントベースのキュー辞書を提案する。
私たちのフレームワークであるSimMoCoとSimCoは、MoCo v2よりも目に見えるマージンで優れています。
私たちの作業は、CLと非CLフレームワークのギャップを埋め、SSLにおけるこれらの2つの主流フレームワークのより統一された理解に寄与します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:39:05 GMT)
Investigating Top-$k$ White-Box and Transferable Black-box Attack [75.1] 攻撃後の利子階級ランク (ICR) で示されるASRの上位100ドルに対して, より強い攻撃が実際より優れていることを示す。
そこで本稿では,ロジットの更新を暗黙的に最大化するために,新たな正規化CE損失を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:02:27 GMT)
Proofs of network quantum nonlocality aided by machine learning [68.8] 我々は[DOI40103/PhysRevLett.123.140]の量子三角形分布の族が、元の証明よりも広い範囲の三角形局所モデルを認めていないことを示した。
我々は、独立な利害関係を持つ二項結果を持つ三角形のシナリオに対して、ネットワークベルの不等式を大量に収集する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:00:00 GMT)
Escaping Data Scarcity for High-Resolution Heterogeneous Face
Hallucination [68.8] Heterogeneous Face Recognition (HFR) では、視覚や熱といった2つの異なる領域にまたがる顔のマッチングが目的である。
合成によるギャップを埋めようとする最近の手法は有望な結果を得たが、ペアトレーニングデータの不足により、その性能は依然として制限されている。
本稿では,HFRのための新しい顔幻覚パラダイムを提案する。これはデータ効率のよい合成を可能にするだけでなく,プライバシポリシーを破ることなくモデルトレーニングのスケールアップを可能にする。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:44:33 GMT)
Fooling the primate brain with minimal, targeted image manipulation [67.8] 本稿では、行動に反映される神経活動と知覚の両方の変化をもたらす、最小限の標的画像摂動を生成するための一連の手法を提案する。
我々の研究は、敵対的攻撃、すなわち最小限のターゲットノイズによる画像の操作で同じ目標を共有し、ANNモデルに画像の誤分類を誘導する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:36:53 GMT)
SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.6] 画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:24:36 GMT)
Incorporating Dynamic Semantics into Pre-Trained Language Model for
Aspect-based Sentiment Analysis [67.4] ABSAの動的アスペクト指向セマンティクスを学ぶために,DR-BERT(Dynamic Re-weighting BERT)を提案する。
具体的には、まずStack-BERT層を主エンコーダとして、文の全体的な意味を理解する。
次に、軽量な動的再重み付けアダプタ(DRA)を導入して微調整する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:48:46 GMT)
BARC: Learning to Regress 3D Dog Shape from Images by Exploiting Breed
Information [66.8] 私たちのゴールは、1枚の画像から犬の3D形状とポーズを復元することです。
近年の研究では、画像から手足のスケールパラメータを追加してSMAL動物モデルを直接回帰する研究が提案されている。
我々の手法はBARC(Breed-Augmented Regression using Classification)と呼ばれ、いくつかの重要な方法で先行作業を越えています。
この研究は、a-prioriの遺伝子類似性に関する情報が、3Dトレーニングデータの欠如を補うのに役立つことを示している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:32:59 GMT)
Acknowledging the Unknown for Multi-label Learning with Single Positive
Labels [65.6] 伝統的に、全ての無注釈ラベルは、単一正のマルチラベル学習(SPML)において負のラベルとして仮定される。
本研究では, 予測確率のエントロピーを最大化するエントロピー最大化(EM)損失を提案する。
非通知ラベルの正負ラベル不均衡を考慮し、非対称耐性戦略とより精密な監視を行うセルフペースト手順を備えた非対称擬似ラベル(APL)を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:43:59 GMT)
Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.3] 本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:44:56 GMT)
Automatic Facial Skin Feature Detection for Everyone [60.3] 本研究では,野生の自撮り自撮りのために,さまざまな肌のトーンと年齢群にまたがって機能する顔顔の特徴自動検出法を提案する。
具体的には,肌の色,重度度,照明条件の異なる自撮り画像に対して,アクネ,顔料,ニキビの位置を注釈する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:52:54 GMT)
Improving Distortion Robustness of Self-supervised Speech Processing
Tasks with Domain Adaptation [60.3] 音声歪みは、視覚的に訓練された音声処理モデルの性能を劣化させる長年の問題である。
音声処理モデルのロバスト性を向上して、音声歪みに遭遇する際の良好な性能を得るには、時間を要する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:25:52 GMT)
Tailored XZZX codes for biased noise [60.1] 我々は,XZX型安定化器発生器を有する符号群について検討した。
これらのXZZX符号は、バイアスノイズに合わせると、非常に量子効率が高いことを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:26:31 GMT)
Learning (Local) Surrogate Loss Functions for Predict-Then-Optimize
Problems [59.0] 決定焦点学習(Decision-Focused Learning, DFL)は、予測モデルを下流の最適化タスクに調整するためのパラダイムである。
本稿では,(a)最適化問題を解き,一般化可能なブラックボックスオラクルへのアクセスのみを必要とする忠実なタスク固有サロゲートを学習し,(b)勾配で凸し,容易に最適化できる手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:46:54 GMT)
AdaGrid: Adaptive Grid Search for Link Prediction Training Objective [58.8] トレーニングの目的は、モデルの性能と一般化能力に決定的に影響を及ぼす。
本稿では,訓練中にエッジメッセージの比率を動的に調整する適応グリッド探索(AdaGrid)を提案する。
AdaGridは、完全検索の9倍の時間効率を保ちながら、モデルの性能を1.9%まで向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:24:17 GMT)
Pay Attention to Hidden States for Video Deblurring: Ping-Pong Recurrent
Neural Networks and Selective Non-Local Attention [58.5] ビデオデブロアリングのためのRNNアーキテクチャを補完する2つのモジュールを提案する。
まず,隠蔽状態の更新を行うPing-Pong RNNの設計を行う。
次に、Selective Non-Local Attention(SNLA)モジュールを用いて、入力フレームの特徴からの位置情報と整列することで、隠れた状態をさらに洗練する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:21:05 GMT)
Bayesian Deep Learning and a Probabilistic Perspective of Generalization [56.7] ディープアンサンブルはベイズ辺化を近似する有効なメカニズムであることを示す。
また,アトラクションの流域内での辺縁化により,予測分布をさらに改善する関連手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:22:29 GMT)
Learning Deep Implicit Functions for 3D Shapes with Dynamic Code Clouds [56.4] Deep Implicit Function (DIF) は効率的な3次元形状表現として人気を集めている。
我々は、DCC-DIFという名前のDynamic Code CloudでDIFを学ぶことを提案する。
本手法は,局所符号と学習可能な位置ベクトルを明示的に関連付け,位置ベクトルは連続であり,動的に最適化できる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:15:32 GMT)
Quasi-orthogonality and intrinsic dimensions as measures of learning and
generalisation [55.8] ニューラルネットワークの特徴空間の次元性と準直交性は、ネットワークの性能差別と共同して機能する可能性があることを示す。
本研究は, ネットワークの最終的な性能と, ランダムに初期化された特徴空間の特性との関係を示唆する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:47:32 GMT)
Marginalized Operators for Off-policy Reinforcement Learning [53.4] 有理化作用素は、Retraceのような一般的な多段階作用素を特別な場合として厳密に一般化する。
余剰化演算子の推定値がスケーラブルな方法で計算可能であることを示し、また、余剰化重要度サンプリングの事前結果を特別な場合として一般化する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:59:59 GMT)
To Find Waldo You Need Contextual Cues: Debiasing Who's Waldo [53.4] 本稿では,Cuiらによって提案されたPerson-centric Visual Groundingタスクに対して,偏りのあるデータセットを提案する。
画像とキャプションが与えられた場合、PCVGはキャプションに記載されている人物の名前と、画像内の人物を指し示すバウンディングボックスをペアリングする必要がある。
オリジナルのWho's Waldoデータセットには、メソッドによって簡単に解ける多数のバイアスのあるサンプルが含まれていることが分かりました。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:35:53 GMT)
Streaming Speaker-Attributed ASR with Token-Level Speaker Embeddings [53.1] 本稿では,「誰が何を話したか」を認識可能な,ストリーミング話者対応自動音声認識(SA-ASR)モデルを提案する。
本モデルは,最近提案されたマルチトーカー音声をストリーミング形式で書き起こすためのトークンレベルシリアライズアウトプットトレーニング(t-SOT)に基づいている。
提案モデルでは,従来のストリーミングモデルよりも精度が大幅に向上し,最先端のオフラインSA-ASRモデルに匹敵する,あるいは時として優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:42:00 GMT)
Improved Convergence Rate of Stochastic Gradient Langevin Dynamics with
Variance Reduction and its Application to Optimization [50.8] 勾配ランゲヴィン・ダイナミクスは非エプス最適化問題を解くための最も基本的なアルゴリズムの1つである。
本稿では、このタイプの2つの変種、すなわち、分散還元ランジュバンダイナミクスと再帰勾配ランジュバンダイナミクスを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:39:00 GMT)
High-resolution Face Swapping via Latent Semantics Disentanglement [50.2] 本稿では,事前学習したGANモデルの事前知識を用いた,新しい高分解能幻覚顔交換法を提案する。
我々は、ジェネレータの進行的な性質を利用して、潜在意味論を明示的に解き放つ。
我々は,2時間制約を潜時空間と画像空間に課すことにより,映像面スワップに拡張する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:33:08 GMT)
Multi-Robot Active Mapping via Neural Bipartite Graph Matching [49.7] 本稿では,最小時間ステップにおけるシーンマップ構築の完全化を目的としたマルチロボットアクティブマッピングの問題点について検討する。
この問題の鍵は、より効率的なロボットの動きを可能にするゴール位置推定にある。
本稿では,ニューラルコマッピング(NeuralCoMapping)という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:03:17 GMT)
Few Could Be Better Than All: Feature Sampling and Grouping for Scene
Text Detection [47.8] 本稿では,シーンテキスト検出のためのトランスフォーマーアーキテクチャを提案する。
まず、フォアグラウンドテキストに非常に関係のある、あらゆるスケールでいくつかの代表的特徴を選択します。
各特徴群がテキストインスタンスに対応するため、そのバウンディングボックスは後処理操作なしで容易に得ることができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:28:07 GMT)
AxIoU: An Axiomatically Justified Measure for Video Moment Retrieval [47.7] ビデオモーメント検索(VMR)の代替手段を提案する。
AxIoU は VMR 評価において 2 つの重要な公理を満たすことを示す。
また、AxIoUがR@$K,theta$とどのように一致しているかを実証的に検証し、テストデータや人手による時間境界の変化に対する安定性についても検討する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:19:36 GMT)
PromptDet: Expand Your Detector Vocabulary with Uncurated Images [47.6] この作業の目的は、ゼロマニュアルアノテーションを使用して、新しい/見えないカテゴリに向けてオブジェクト検出器を拡張するスケーラブルなパイプラインを確立することである。
本稿では,事前学習された視覚言語モデルのテキストエンコーダから生成された分類器を用いて,各ボックスの提案を分類する2段階のオープン語彙オブジェクト検出器を提案する。
より広い範囲のオブジェクトを検出するための学習手順をスケールアップするために、利用可能なオンラインリソースを活用し、プロンプトを反復的に更新し、その後、ノイズの多い未修正画像の大規模なコーパス上に生成された擬似ラベルを用いて、提案した検出器を自己学習する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:50:21 GMT)
VL-InterpreT: An Interactive Visualization Tool for Interpreting
Vision-Language Transformers [47.6] 視覚とマルチモーダル変換器の内部機構はほとんど不透明である。
これらの変圧器の成功により、その内部動作を理解することがますます重要になっている。
マルチモーダルトランスにおける注目や隠された表現を解釈するための対話型可視化を提供するVL-InterpreTを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:25:35 GMT)
On Uncertainty, Tempering, and Data Augmentation in Bayesian
Classification [47.1] 本研究では,アレータティック不確実性の明示的説明がベイズニューラルネットワークの性能を著しく向上させることを示す。
寒冷な後部は一つ以上の力によって誘惑され、しばしばより率直に言って、誘惑を伴わないよりもエレタリックな不確実性についての私たちの信念を反映している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:17:50 GMT)
Forecasting from LiDAR via Future Object Detection [47.1] そこで本研究では,センサの生計測に基づく検出と動作予測のためのエンドツーエンドアプローチを提案する。
未来と現在の場所を多対一でリンクすることで、我々のアプローチは複数の未来を推論することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:40:28 GMT)
Span Classification with Structured Information for Disfluency Detection
in Spoken Utterances [47.1] 本稿では,音声音声からテキスト中の不一致を検出する新しいアーキテクチャを提案する。
提案手法は, 広範に使われているイングリッシュスイッチボードを用いて, ディフルエンシ検出の最先端化を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:22:29 GMT)
Generative Spoken Dialogue Language Modeling [46.6] 自然主義音声対話の音声サンプルを生成できる最初の「テキストレス」モデルであるdGSLMを紹介した。
これは、教師なし音声単位探索とデュアルトウワートランスアーキテクチャに関する最近の研究を利用している。
2つのチャンネルで音声、笑い、その他のパラ言語的な信号を同時に生成することができ、自然主義的なターンテイクを再現することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:39:45 GMT)
Meta-Sampler: Almost-Universal yet Task-Oriented Sampling for Point
Clouds [46.3] 複数のタスクにまたがって、ほぼ普遍的なメタサンプルをトレーニングする方法を示します。
このメタサンプルは、異なるデータセットやネットワーク、あるいは異なるタスクに適用した場合、迅速に微調整できる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:21:34 GMT)
CaDeX: Learning Canonical Deformation Coordinate Space for Dynamic
Surface Representation via Neural Homeomorphism [46.2] 形状と非剛性の両方の統一的な表現であるCaDeX(Caonical deformation Coordinate Space)を導入する。
我々の新しい変形表現とその実装は単純で効率的であり、サイクルの整合性を保証する。
幅広い変形可能なオブジェクトをモデル化する際の最先端性能を実証する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:59:23 GMT)
Transformer Language Models without Positional Encodings Still Learn
Positional Information [45.4] 明確な位置エンコーディングのないトランスフォーマー言語モデルは、標準モデルと競合する。
因果的注意により、各トークンが出席できる前任者の数を推測することができ、従って絶対的な位置を近似することができると推測する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:37:07 GMT)
Exploring Plain Vision Transformer Backbones for Object Detection [45.1] 我々は、物体検出のためのバックボーンネットワークとして、平らで非階層型視覚変換器(ViT)を探索する。
この設計により、オリジナルのViTアーキテクチャは、事前トレーニングのために階層的なバックボーンを再設計することなく、オブジェクト検出のために微調整できる。
微調整のための最小限の適応により、我々のプレーンバックボーン検出器は競争的な結果が得られる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:58:23 GMT)
System Identification via Nuclear Norm Regularization [45.0] 本稿では,ハンケル核ノルム正規化による低次線形系同定問題について検討する。
この正規化に関する新しい統計解析を提供し、非正規化常用最小二乗推定器(OLS)と慎重に対比する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:56:27 GMT)
PerfectDou: Dominating DouDizhu with Perfect Information Distillation [43.7] 本研究では,現在最先端のDouDizhuAIシステムであるPerfectDouを提案する。
実験では、PerfectDouが既存のAIプログラムをすべて破り、最先端のパフォーマンスを達成する方法と理由を示します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:37:57 GMT)
Foveation-based Deep Video Compression without Motion Search [43.7] VRで見るビデオのごく一部しか、ユーザーが特定の方向を見つめるときに見ることができないため、ファベーションプロトコルは望ましい。
我々は、ビットの割り当てを指示するフォベーションマスクを生成するFGU(Foveation Generator Unit)を導入することにより、フォベーションを実現する。
我々の新しい圧縮モデルは、Foveated Motionless VIdeo Codec (Foveated MOVI-Codec)と呼ばれ、モーションを計算せずに効率的に動画を圧縮することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:30:17 GMT)
VI-IKD: High-Speed Accurate Off-Road Navigation using Learned
Visual-Inertial Inverse Kinodynamics [42.9] Visual-Inertial Inverse Kinodynamics (VI-IKD) は、ロボットの前方の地形パッチからの視覚情報を基にした、新しい学習ベースのIKDモデルである。
我々は,VI-IKDにより,最大3.5m/sの速度で様々な地形において,より正確で堅牢なオフロードナビゲーションを可能にすることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:43:15 GMT)
PseCo: Pseudo Labeling and Consistency Training for Semi-Supervised
Object Detection [42.8] 予測誘導ラベル割り当て(PLA)と正の確率整合投票(PCV)を含むNPL(Noisy Pseudo box Learning)を提案する。
ベンチマークでは PSEudo labeling と Consistency training (PseCo) が SOTA (Soft Teacher) の2.0, 1.8, 2.0 を1%, 5%, 10% で上回っている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:59:22 GMT)
Fine-Grained Object Classification via Self-Supervised Pose Alignment [42.6] 我々は,クラス間の自己教師型ポーズアライメントのための局所部分のグローバルな構成を明らかにするために,新しいグラフベースのオブジェクト表現を学習する。
提案手法を3つの評価対象分類ベンチマークで評価し,最先端性能を継続的に達成した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:46:19 GMT)
TR-MOT: Multi-Object Tracking by Reference [42.5] 本稿では、変形可能なトランス構造に基づくより信頼性の高いアソシエーションを提供するための新しい参照探索(RS)モジュールを提案する。
提案手法は,MOT17およびMOT20データセット上での競合結果を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:07:26 GMT)
FlowFormer: A Transformer Architecture for Optical Flow [40.6] Optical Flow TransFormer (FlowFormer) は、オプティカルフローを学習するためのトランスフォーマーベースのニューラルネットワークアーキテクチャである。
FlowFormerはイメージペアから構築された4Dコストボリュームをトークン化し、コストトークンを代替グループトランスフォーマー層でコストメモリにエンコードする。
Sintelベンチマークのクリーンパスでは、FlowFormerが1.178の平均エンドポニートエラー(AEPE)を達成した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:33:09 GMT)
Decentralized Collaborative Learning Framework for Next POI
Recommendation [39.7] Next Point-of-Interest (POI)レコメンデーションは位置情報ベースのソーシャルネットワーク(LBSN)において必須の機能となっている。
正確なレコメンデーションには、膨大な量の履歴チェックインデータが必要であるため、位置情報に敏感なデータをクラウドサーバで処理する必要があるため、ユーザのプライバシを脅かすことになる。
本稿では,POIレコメンデーション(DCLR)のための分散協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:00:11 GMT)
Perfectly Accurate Membership Inference by a Dishonest Central Server in
Federated Learning [39.0] フェデレートラーニングは、強力なプライバシー保証を提供すると期待されている。
本手法では, 単純だが非常に効果的なメンバーシップ推論攻撃アルゴリズムを提案する。
本手法は, 何千ものサンプルを用いたトレーニングセットにおいて, 1つのサンプルを同定する上で, 完全な精度を提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:01:19 GMT)
Clozer: Adaptable Data Augmentation for Cloze-style Reading
Comprehension [37.8] Clozerは、TAPTで使用されるシーケンスタグに基づくクローゼ応答抽出法である。
TAPTの有効性を向上する上で,Crozerはオラクルや最先端技術と比較して性能が著しく向上していることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:21:35 GMT)
Using Active Speaker Faces for Diarization in TV shows [37.3] アクティブな話者面に顔クラスタリングを行い、最先端の音声ベースダイアリゼーション法と比較して優れた話者ダイアリゼーション性能を示す。
また、適度に高性能なアクティブスピーカーシステムが、オーディオベースのダイアリゼーションシステムより優れていることも観察した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:37:19 GMT)
Towards Spatio-Temporal Aware Traffic Time Series Forecasting--Full
Version [37.1] 同じ時系列パターンの複雑な時系列パターンが時間によって異なる可能性があるため、トラフィックシリーズの予測は困難である。
このような時間的モデルは、時間的位置と時間的期間に関わらず、共有パラメータ空間を使用し、時間的相関は場所間で類似しており、常に時間にわたって保持するわけではないと仮定する。
サブテンポラリモデルにICDを意識したモデルをエンコードするフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:24:10 GMT)
Balanced MSE for Imbalanced Visual Regression [37.0] データ不均衡は、現実世界の視覚的回帰においてユビキタスに存在する。
不均衡回帰は、境界のない高次元の連続ラベルに焦点を当てる。
不均衡なトレーニングラベル分布に対応するために,新たな損失関数であるBa balanced MSEを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:21:42 GMT)
OSOP: A Multi-Stage One Shot Object Pose Estimation Framework [35.9] 対象物検出のための新しいワンショット手法と,対象物に対する訓練を必要としない6DoFポーズ推定を提案する。
テスト時には、ターゲット画像とテクスチャ化された3Dクエリモデルを入力する。
The method on LineMOD, Occlusion, Homebrewed, YCB-V and TLESS datasets。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:31:14 GMT)
Weakly-supervised Temporal Path Representation Learning with Contrastive
Curriculum Learning -- Extended Version [35.9] 時間的情報、例えば出発時刻を含む時間的パス(TP)は、そのようなアプリケーションを可能にするために基本的なものである。
i) 教師付き手法ではトレーニング時に大量のタスク固有のラベルを必要とするため、既存の手法では目標達成に失敗し、得られたTPRを他のタスクに一般化することができない。
本稿では,時間的経路の空間的情報と時間的情報の両方をTPRにエンコードするWakly Supervised Contrastive (WSC)学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:36:20 GMT)
Investigating the Properties of Neural Network Representations in
Reinforcement Learning [35.0] 25万以上のエージェントタスク設定に対して、6つの表現特性を導入し、測定する。
そこで我々は,表現の振舞いをよりよく理解する手法を開発した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:14:26 GMT)
Controllable Augmentations for Video Representation Learning [34.8] 本稿では,ローカルクリップとグローバルビデオを併用して,詳細な地域レベルの対応から学習し,時間的関係を最小化する枠組みを提案する。
我々のフレームワークは、アクション認識とビデオ検索の3つのビデオベンチマークよりも優れており、より正確な時間的ダイナミクスを捉えることができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:34:32 GMT)
ITTR: Unpaired Image-to-Image Translation with Transformers [34.1] 変換器を用いた非ペア画像変換(ITTR)のための効率的かつ効率的なアーキテクチャを提案する。
ITTRは,1)グローバルセマンティクスを利用するための異なる分野からのトークン混合のためのハイブリッド認識ブロック(HPB),2)計算複雑性を著しく低減するデュアルプルド自己アテンション(DPSA)の2つの主要な設計を持つ。
当社のITTRは、6つのベンチマークデータセット上で、未ペア画像から画像への変換のための最先端技術よりも優れています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:46:12 GMT)
Progressively Generating Better Initial Guesses Towards Next Stages for
High-Quality Human Motion Prediction [33.5] 提案手法は,予測精度の向上に有効であることを示す。
そこで本研究では,2段階の予測フレームワークを提案し,推定値の計算のみを行うinit-predictionネットワークを提案する。
我々は、このアイデアをさらに拡張し、各ステージが次のステージの初期推定を予測するマルチステージ予測フレームワークを設計する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:35:53 GMT)
Towards Collaborative Intelligence: Routability Estimation based on
Decentralized Private Data [33.2] 本研究では,EDAにおける機械学習アプリケーションに対するフェデレートラーニングに基づくアプローチを提案する。
このアプローチでは、MLモデルを複数のクライアントのデータで協調的にトレーニングできるが、データのプライバシを尊重するためのデータへの明示的なアクセスは行わない。
包括的データセットの実験により、協調トレーニングは個々のローカルモデルと比較して精度を11%向上することが示された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:35:40 GMT)
Non-autoregressive Translation with Dependency-Aware Decoder [32.2] 非自己回帰翻訳(NAT)モデルは、入力からデコーダへの前のターゲットトークンへの依存を除去するため、翻訳品質が劣る。
本研究では,NATデコーダにおけるターゲット依存性を2つの視点から拡張するための,新しい汎用的アプローチを提案する。
実験により,提案手法は4つのWMT翻訳方向における高い競合性を持つNATモデルを一貫して改善することを示した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:53:20 GMT)
AdaMixer: A Fast-Converging Query-Based Object Detector [32.2] 本稿では,AdaMixerという高速収束型クエリベースオブジェクト検出器を提案する。
AdaMixerは、明示的なピラミッドネットワークを必要としない、アーキテクチャの単純さを持っている。
私たちの研究は、クエリベースのオブジェクト検出のためのシンプルで正確で高速な収束アーキテクチャに光を当てています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:45:02 GMT)
Learning Fair Models without Sensitive Attributes: A Generative Approach [31.7] 本研究では,関係する特徴を探索することにより,重要属性を含まないフェアモデル学習の新たな課題について検討する。
トレーニングデータから感度特性を効果的に推定する確率的生成フレームワークを提案する。
実世界のデータセットを用いた実験結果から,本フレームワークの有効性が示された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:54:30 GMT)
Learning of Global Objective for Network Flow in Multi-Object Tracking [31.4] 学習中にトレーニングと推論を結びつける新しい差別化可能なフレームワークを提案する。
微分可能な層による損失を勾配降下によりバックプロパゲートすることにより、グローバルパラメータ化コスト関数を明示的に学習し、規則化する。
我々は,一般的なマルチオブジェクト追跡ベンチマークの最先端手法と比較して,競争力のある性能を実現している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:20:38 GMT)
Neighbor Enhanced Graph Convolutional Networks for Node Classification
and Recommendation [30.2] 本稿では,GCNモデルの性能に対する隣接品質の影響を理論的に分析する。
本稿では,既存のGCNモデルの性能向上を目的としたNeighbor Enhanced Graph Convolutional Network (NEGCN) フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:54:28 GMT)
Towards Multimodal Depth Estimation from Light Fields [29.3] 現在の深さ推定法は、異なる深さの複数の物体が単一のピクセルの色に寄与したとしても、単一の「真の」深さしか考慮していない。
これは、異なる深さの複数の物体が1つのピクセルの色に寄与したとしても、単一の「真の」深さのみを考慮しているデュー・カレント手法であると主張する。
我々は,ピクセルの色に寄与するすべての物体の深さを含む,最初の「マルチモーダル光場深度データセット」をコントリビュートする。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:00:00 GMT)
Towards Few-shot Entity Recognition in Document Images: A Label-aware
Sequence-to-Sequence Framework [28.9] アノテーション付き文書画像のほんの数ショットしか必要としないエンティティ認識モデルを構築します。
ラベルを意識したSeq2seqフレームワーク LASER を開発した。
2つのベンチマークデータセットの実験は、数ショット設定下でのLASERの優位性を示している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:30:42 GMT)
InstaFormer: Instance-Aware Image-to-Image Translation with Transformer [28.5] InstaFormer という,画像から画像への変換を例に,Transformer ベースの新しいネットワークアーキテクチャを提案する。
我々のフレームワークはオブジェクトインスタンスとグローバルイメージのインタラクションを学習できるので、インスタンス認識が向上します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:30:22 GMT)
Hypergraphon Mean Field Games [27.6] 平均場ゲーム理論を用いて,大規模マルチエージェント力学系をモデル化する手法を提案する。
非線形で弱い相互作用を持つ動的エージェントの大規模システムに対する制限記述を得る。
理論面では、結果のハイパーグラフ平均場ゲーム(英語版)のしっかりとした基礎性を証明する。
適用面では、ハイパーグラフ平均場平衡を計算するために数値および学習アルゴリズムを拡張する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:57:16 GMT)
A Fast and Convergent Proximal Algorithm for Regularized Nonconvex and
Nonsmooth Bi-level Optimization [26.7] 既存のバイレベルアルゴリズムは、非滑らかまたは超滑らかな正規化器を扱えない。
本稿では,包括的機械学習アプリケーションを高速化するために,暗黙差分法(AID)が有効であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:53:04 GMT)
Semi-Supervised Learning of Semantic Correspondence with Pseudo-Labels [26.5] SemiMatchは意味論的に類似した画像間の密接な対応を確立するための半教師付きソリューションである。
筆者らのフレームワークは,ソースと弱増強ターゲット間のモデル予測自体を用いて擬似ラベルを生成し,擬似ラベルを用いてソースと強増強ターゲット間のモデルの再学習を行う。
実験では、SemiMatchは様々なベンチマーク、特にPF-Willowにおける最先端のパフォーマンスを大きなマージンで達成している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:52:50 GMT)
CycDA: Unsupervised Cycle Domain Adaptation from Image to Video [26.3] ドメイン・サイクル適応 (Domain Cycle Adaptation, CycDA) は、教師なし画像・ビデオ領域適応のためのサイクルベースのアプローチである。
我々は、画像からビデオまでのベンチマークデータセットと、混合ソース領域適応のためのベンチマークデータセットについて評価した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:22:26 GMT)
Learning Program Representations for Food Images and Cooking Recipes [26.1] 料理のレシピや料理のイメージを料理プログラムとして表現することを提案する。
モデルは、自己監督を通じてレシピと食品画像の結合埋め込みを学ぶために訓練される。
プログラムへのイメージ・レシピの埋め込みを投影すると、モーダル横断検索結果がより良くなることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:52:41 GMT)
Disentangling the Impacts of Language and Channel Variability on Speech
Separation Networks [25.7] 話者、コンテンツ、チャンネル、環境などの要因による訓練/テスト状況のドメインミスマッチは、音声分離にとって深刻な問題である。
本研究では,様々な実験のために複数のデータセットを作成し,異なる言語の影響は,異なるチャネルの影響と比較して無視できるほど小さいことを示した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:07:23 GMT)
On the Road to Online Adaptation for Semantic Image Segmentation [25.5] セマンティックイメージセグメンテーションのための教師なし領域適応の研究を進めるための新しい問題定式化を提案する。
全体的な目標は、常に変化する環境において、監督なしに継続的に学習する適応学習システムの開発を促進することである。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:34:55 GMT)
Fair Contrastive Learning for Facial Attribute Classification [25.4] 公正な視覚表現学習のためのFair Supervised Contrastive Loss (FSCL)を提案する。
本稿では,教師付きコントラスト学習による不公平性を初めて分析する。
提案手法はデータバイアスの強度に頑健であり,不完全な教師付き設定で効果的に機能する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:16:18 GMT)
RFNet-4D: Joint Object Reconstruction and Flow Estimation from 4D Point
Clouds [25.4] RFNet-4Dと呼ばれる新しいネットワークアーキテクチャを提案する。
提案するネットワークは教師なし学習と教師なし学習の両方を用いて訓練することができる。
本手法は,フロー推定とオブジェクト再構成の両方において最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:18:11 GMT)
An Iterative Co-Training Transductive Framework for Zero Shot Learning [24.4] 本稿では、2つの異なるベースZSLモデルと交換モジュールを含む反復的協調学習フレームワークを提案する。
各イテレーションにおいて、2つの異なるZSLモデルは、目に見えないクラスサンプルの擬似ラベルを別々に予測するために、共同訓練される。
我々のフレームワークは、2つのモデルの分類能力の潜在的な相補性をフル活用することで、ZSLの性能を徐々に向上させることができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:08:44 GMT)
ConceptEvo: Interpreting Concept Evolution in Deep Learning Training [24.4] ディープニューラルネットワーク(DNN)は意思決定に広く利用されている。
DNNの解釈に関する最近の文献は、既に訓練済みのモデルを中心に展開されている。
本研究では,検出された概念の創発と進化を明らかにするフレームワークであるConceptEvoについて述べる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:12:18 GMT)
Face Relighting with Geometrically Consistent Shadows [24.1] レイトレーシングに基づくハードシャドウを合成するための新しい微分可能アルゴリズムを提案する。
提案アルゴリズムは、推定顔形状を直接利用して、幾何的に一貫した硬い影を合成する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:31:24 GMT)
Fast Aquatic Swimmer Optimization with Differentiable Projective
Dynamics and Neural Network Hydrodynamic Models [23.5] 水面移動(Aquatic locomotion)は、生物学者や技術者が関心を持つ古典的な流体構造相互作用(FSI)問題である。
本研究では, 変形可能なスイマーの固体構造に対する2次元数値シミュレーションを組み合わせた, FSI に完全微分可能な新しいハイブリッド手法を提案する。
2次元キャランギフォームスイマーにおけるハイブリッドシミュレータの計算効率と微分性を示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:21:44 GMT)
Interactive Multi-scale Fusion of 2D and 3D Features for Multi-object
Tracking [23.1] 我々は、PointNet++を導入し、ポイントクラウドのマルチスケールのディープ表現を取得し、提案したInteractive Feature Fusionに適応させる。
提案手法は,KITTIベンチマークにおいて,マルチスケールな特徴融合を使わずに優れた性能を実現し,他の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:00:27 GMT)
Recommendation of Compatible Outfits Conditioned on Style [22.0] この作品は、実生活で身につけるようなスタイルやテーマを前提とした衣装を作り出すことを目的としている。
我々は、スムーズなラテント空間で衣装スタイルをレンダリングする新しいスタイルエンコーダネットワークを使用している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:23:32 GMT)
StyleFool: Fooling Video Classification Systems via Style Transfer [21.2] StyleFool(スタイルフール)は、ビデオ分類システムを騙すために、スタイル転送によるブラックボックスビデオの敵対攻撃である。
StyleFoolは、クエリの数や既存の防御に対する堅牢性の観点から、最先端の敵攻撃よりも優れています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:18:16 GMT)
OPD: Single-view 3D Openable Part Detection [20.2] オブジェクトのどの部分が開くのか、どのように動くのかを予測するタスクに対処する。
入力はオブジェクトの1つのイメージであり、出力として、オブジェクトのどの部分が開き得るか、そして各開き可能な部分の関節を記述する運動パラメータを検出する。
次に、オープンな部分を検出し、その動作パラメータを予測するニューラルネットワークであるPDRCNNを設計する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:02:19 GMT)
Automatic Detection of Expressed Emotion from Five-Minute Speech
Samples: Challenges and Opportunities [20.1] 表現的感情(EE)の自動認識に関する新しい可能性研究について述べる。
EEは、親戚や家族について自由に話す介護者に基づく家族環境の概念である。
本稿では,EE の重要な構成要素である暖かさのテクスチャ度を音響的特徴とテキスト的特徴から自動決定する手法について述べる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:26:31 GMT)
End-to-End Table Question Answering via Retrieval-Augmented Generation [19.9] 本稿では、T-RAGというテーブルQAモデルを紹介し、非パラメトリックな高密度ベクトルインデックスをパラメトリックシーケンス・ツー・シーケンスモデルであるBARTと組み合わせて微調整し、応答トークンを生成する。
自然言語の問題があれば、T-RAGは統合パイプラインを使用してテーブルコーパスを自動で検索し、テーブルセルから正しい回答を直接見つけ出す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 23:30:16 GMT)
Reproducibility Issues for BERT-based Evaluation Metrics [19.8] BERTをベースとした最近の4つのメトリクスの結果とクレームを再現できるかどうかを問う。
クレームと結果の再現は、文書化されていない大量の前処理のために失敗することが多い。
プリプロセッシングは特に高い屈折率を持つ言語に対して大きな効果があることがわかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:35:37 GMT)
A Fast Transformer-based General-Purpose Lossless Compressor [19.6] 深層学習圧縮機にトランスフォーマーを導入し,履歴依存度を並列に構築する。
既存の変換器は計算に重すぎるため、圧縮タスクと互換性がない。
単層変圧器の容量をフル活用するために, バイトグループ化と共有フィン方式を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:46:19 GMT)
Adaptive Private-K-Selection with Adaptive K and Application to
Multi-label PATE [19.3] 我々は、差分的にプライベートなトップ$k$選択のためのエンドツーエンドのRenyi DPベースのフレームワークを提供する。
提案手法は,従来のトップ$選択アルゴリズムと比較して,プライバシとユーティリティのトレードオフを改善していることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:11:01 GMT)
An Efficient Anchor-free Universal Lesion Detection in CT-scans [19.2] そこで本研究では, 種々の病変の規模にまたがって良好に機能する, 頑健な1段階のアンカーフリー病変検出ネットワークを提案する。
我々は最先端の手法に匹敵する結果を得、DeepLesionデータセットで全体の感度は86.05%に達する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:01:04 GMT)
TextPruner: A Model Pruning Toolkit for Pre-Trained Language Models [18.5] 我々は、事前訓練された言語モデルのためのオープンソースのモデルプルーニングツールキットであるTextPrunerを紹介する。
TextPrunerは、ボキャブラリプルーニングやトランスフォーマープルーニングなどの構造化後プルーニング方法を提供する。
いくつかのNLPタスクによる実験では、モデルを再トレーニングすることなく、TextPrunerがモデルサイズを縮小できることを示した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:10:33 GMT)
Fast Light-Weight Near-Field Photometric Stereo [18.4] 我々は、光源が興味の対象に近づいた近距離場フォトメトリックステレオ(PS)に、エンド・ツー・エンドの学習ベースの最初のソリューションを導入する。
提案手法は高速で,52512$times$384の解像度画像から,コモディティGPU上で約1秒でメッシュを生成する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:51:31 GMT)
Factored Adaptation for Non-Stationary Reinforcement Learning [18.0] 本研究では,非定常RL(FANS-RL)に対するFactered Adaptationを提案し,環境の非定常性に対処する。
FANS-RLは、遷移力学と報酬関数に影響を与える個々の潜伏変化因子を明示的に学習する。
FANS-RLは、報酬、潜伏状態表現のコンパクト性、ロバスト性などの点で既存のアプローチよりも優れることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:14:01 GMT)
Phase-Aware Deep Speech Enhancement: It's All About The Frame Length [17.9] 現代のディープニューラルネットワーク(DNN)ベースのアプローチは、非常に短いフレーム(2ms)において、大きさと位相の両方を暗黙的に変更する。
クリーン音声の再構成に関するこれまでの研究から,位相認識型DNNが活用できることが示唆された。
将来の位相対応深層音声強調法には,約4msのフレーム長を推奨する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:51:30 GMT)
APG: Adaptive Parameter Generation Network for Click-Through Rate
Prediction [17.8] 多くのWebアプリケーションでは、ディープラーニングベースのCTR予測モデルが広く採用されている。
従来の深いCTRモデルは、静的な方法でパターンを学習する。
適応生成ネットワーク(APG)を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:40:36 GMT)
Slow-varying Dynamics Assisted Temporal Capsule Network for Machinery
Remaining Useful Life Estimation [17.8] Capsule Network(CapsNet)は、典型的な畳み込みニューラルネットワークに代わる有望な代替手段として機能する。
CapsNetは、劣化した機械装置から測定されたラン・トゥ・フェイル・タイム・シリーズの長期的時間的相関を捉えられなかった。
本研究では,緩やかな変動のダイナミクスと時間的ダイナミクスを同時に学習するために,緩やかな変化のダイナミクス支援型テンポラルカプセルネット(SD-TemCapsNet)を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:52:07 GMT)
CMMD: Cross-Metric Multi-Dimensional Root Cause Analysis [17.8] 大規模オンラインサービスでは、重要な指標であるキーパフォーマンス指標(KPI)が定期的に監視され、実行状態をチェックする。
異常値が観測されると、異常の原因を特定するために根本原因分析(RCA)を適用することができる。
本稿では,2つの鍵成分からなる多次元根本原因解析手法CMMDを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:17:19 GMT)
Graph Refinement for Coreference Resolution [17.7] 本稿では,文書レベルでコア推論を学習し,世界的決定を下すモデリング手法を提案する。
我々のモデルは、非自己回帰的な方法でグラフを予測し、その後、以前の予測に基づいて反復的に洗練する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:03:54 GMT)
Online Continual Learning on a Contaminated Data Stream with Blurry Task
Boundaries [17.4] 大量の連続学習(CL)手法は、クリーンなラベルを持つデータストリームを前提としており、ノイズの多いデータストリームの下でのオンライン学習シナリオはまだ探索されていない。
我々は、既存のCLメソッドが苦労しているラベル付きぼやけたデータストリームからオンライン学習のより実践的なCLタスク設定について検討する。
本稿では,ラベルノイズを意識した多様なサンプリングと,半教師付き学習による頑健な学習の統一的アプローチにより,メモリの管理と利用を行う新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:51:20 GMT)
Hybrid Handcrafted and Learnable Audio Representation for Analysis of
Speech Under Cognitive and Physical Load [17.4] 音声におけるタスク負荷検出のための5つのデータセットを提案する。
音声記録は、ボランティアのコホートに認知的ストレスまたは身体的ストレスが引き起こされたとして収集された。
このデータセットを用いて、新たな自己教師型音声表現の設計と評価を行った。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:43:21 GMT)
Physics Community Needs, Tools, and Resources for Machine Learning [17.3] 機械学習(ML)は、最先端の物理学研究においてますます重要なコンポーネントになりつつある。
しかし、その計算要求は重大な課題を呈している。
この白書では、レイテンシとスループットの異なるMLに関する物理学コミュニティのニーズについて論じる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:38:12 GMT)
Unseen Classes at a Later Time? No Problem [17.3] より実用的でフレキシブルなオンラインCGZSL設定を提案する。
これらのCGZSL設定のいずれにおいても時間とともに現れる新しいクラスの追加に動的に適応するために、双方向インクリメンタルアライメントを活用する、CGZSL用の統合機能生成フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:52:16 GMT)
PIE-Net: Photometric Invariant Edge Guided Network for Intrinsic Image
Decomposition [17.0] 固有の画像分解は、画像から画像形成成分(反射および陰影)を回収する過程である。
本稿では,固有画像分解のためのエッジ駆動ハイブリッドCNN手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:46:15 GMT)
Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds [16.7] 弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:26:14 GMT)
Challenges in leveraging GANs for few-shot data augmentation [16.7] 本稿では,GANをベースとした小ショットデータ拡張を,小ショット分類性能を向上させる手法として活用することを検討する。
我々は、純粋に監督された体制の下で、このような生成モデルを訓練することの難しさに関連する問題を特定する。
これらの問題に対処するための,より実践的な方法として,半教師付き微調整手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:36:49 GMT)
Generation of Speaker Representations Using Heterogeneous Training Batch
Assembly [16.5] 本稿では,CNNに基づく話者モデリング手法を提案する。
トレーニングデータを一組のセグメントにランダムに合成的に拡張する。
各セグメントには、その話者占有率に基づいてソフトラベルが課される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:59:05 GMT)
Understanding 3D Object Articulation in Internet Videos [16.5] そこで本研究では,通常の映像から3次元平面音声の検出と特徴付けについて検討する。
人間にとって簡単なように思えるが、この問題はコンピュータに多くの課題をもたらす。
このシステムは,ビデオと3Dスキャンデータセットの組み合わせでトレーニング可能であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:59:46 GMT)
Example-based Explanations with Adversarial Attacks for Respiratory
Sound Analysis [16.0] 我々は、代表データ(プロトタイプ)と外れ値(批判)の両方を選択する統一的な例に基づく説明法を開発した。
特に、反復的高速勾配符号法を用いて、データインスタンスの説明スペクトルを生成するために、敵攻撃の新たな応用を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:28:48 GMT)
Fast, Accurate and Memory-Efficient Partial Permutation Synchronization [15.8] 観測された部分置換の劣化レベルを推定するための改良されたアルゴリズムCEMP-Partialを提案する。
敵対的腐敗の下では、付加的なノイズが無く、特定の仮定でCEMP-Partialは、破損した部分置換を正確に分類することができる。
提案手法の精度,高速化,メモリ効率を,合成データと実データの両方で実証する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:41:17 GMT)
One-Step Two-Critic Deep Reinforcement Learning for Inverter-based
Volt-Var Control in Active Distribution Networks [15.7] Inverter-based volt-var control (IB-VVC) のための1段階2段階深部強化学習法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:29:28 GMT)
Fine-tuning Image Transformers using Learnable Memory [14.5] 学習可能なメモリトークンを用いた視覚変換器モデルの拡張を提案する。
当社のアプローチでは,パラメータの少ないモデルで,新たなタスクに適応することが可能です。
層ごとのトークン数が少ないモデルの拡張は精度を著しく向上させることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:17:22 GMT)
Multi-scale Speaker Diarization with Dynamic Scale Weighting [14.5] マルチスケールダイアリゼーションデコーダに基づく,より高度なマルチスケールダイアリゼーションシステムを提案する。
提案システムでは,CALLHOMEデータセットとAMI MixHeadsetデータセットに対して,それぞれ3.92%,1.05%のダイアリゼーション誤差率で最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:26:31 GMT)
Self-Distillation from the Last Mini-Batch for Consistency
Regularization [14.4] 我々は、Last Mini-Batch (DLB) からの自己蒸留という、効率的で信頼性の高い自己蒸留フレームワークを提案する。
提案手法はトレーニングの安定性と一貫性を導出し,ノイズのラベル付けに堅牢性をもたらす。
3つの分類ベンチマークによる実験結果から、我々の手法は最先端の自己蒸留手法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:50:24 GMT)
Dynamic Model Tree for Interpretable Data Stream Learning [14.4] 本研究では、進化するデータストリームにおける機械学習のためのモデルツリーを再検討する。
我々の新しいフレームワークはDynamic Model Treeと呼ばれ、望ましい一貫性と最小限の性質を満たす。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:05:35 GMT)
Global Tracking via Ensemble of Local Trackers [14.0] 既存の長期追跡手法は2つの典型的な戦略に従う。
両戦略の利点は、時間的文脈を利用して、グローバルな視点でターゲットを追跡することである。
我々の手法は最先端のアルゴリズムに対して好適に機能する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:44:47 GMT)
Device-Directed Speech Detection: Regularization via Distillation for
Weakly-Supervised Models [13.5] 我々は、特定のウェイクワードを含まないデバイスに向けられた音声を検出する問題に対処する。
具体的には、タッチベースの呼び出しによるオーディオに焦点を当てます。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:27:39 GMT)
Remember to correct the bias when using deep learning for regression! [13.5] 最小二乗回帰のためにディープラーニングモデルをトレーニングする場合、一定のトレーニング時間後に選択された最終モデルのトレーニングエラー残差がゼロになると予想できない。
トレーニング後の機械学習モデルのバイアスを、デフォルトの後処理ステップとして調整し、効率よく解決することを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:09:03 GMT)
Knowledge-Spreader: Learning Facial Action Unit Dynamics with Extremely
Limited Labels [13.3] 我々は、深い半教師付きフレームワークKS(Knowledge-Spreader)を提案する。
KSは、アウト・オブ・ディストリビューションの一般化能力を強化するために、空間-テンポラルAU相関知識を学習する。
ラベル付きフレームからラベルなしデータへの空間的知識を拡散し、部分的にラベル付けされたビデオクリップの時間的情報を完成させる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:12:13 GMT)
Heuristic-based Inter-training to Improve Few-shot Multi-perspective
Dialog Summarization [13.1] サポートエージェントと顧客間のカスタマーケア会話の多面的要約について検討する。
提案手法は,アノテートデータの少ない多視点要約を生成するモデルをサポートすることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:40:39 GMT)
Monitored Distillation for Positive Congruent Depth Completion [13.1] 本研究では,1つの画像から深度マップ,キャリブレーション,およびそれに関連するスパース点雲を推定する手法を提案する。
そこで本研究では,提案手法を応用した適応的知識蒸留手法を提案する。
我々は、モデル選択やトレーニングのために、真実にアクセスすることができないブラインドアンサンブルのシナリオを考察する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:35:56 GMT)
Flexible and Efficient Contextual Bandits with Heterogeneous Treatment
Effect Oracle [12.9] 異種処理効果推定オラクルを用いた統計的に最適で計算効率の良いアルゴリズムを設計する。
本研究は, 汎用的不均一処理効果推定法に対して, 文脈的帯域幅を普遍的に低減した最初の方法である。
提案手法は,2乗誤差回帰オラクルに基づく報酬推定法よりも,誤特定をモデル化する方が堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:43:43 GMT)
Towards Interpretable Deep Reinforcement Learning Models via Inverse
Reinforcement Learning [12.7] 機械学習モデルのブラックボックスの性質はまだ未解決の問題だ。
本稿では,逆逆強化学習を利用した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:01:59 GMT)
Demonstrating shareability of multipartite Einstein-Podolsky-Rosen
steering [12.4] アインシュタイン=ポドルスキー=ローゼンステアリング(Einstein-Podolsky-Rosen steering、EPR)は、ある観測者が別の観測者の状態に影響を与える能力を記述する量子非局所相関のカテゴリである。
本稿では,3ビットシステムにおけるモノガミーの制約を伴わずに,EPRステアリングの共有性を実証する。
この研究は、マルチパーティ・エンタングルメント検出、量子暗号、量子ネットワークの構築など、多くの量子情報プロトコルに応用できる可能性がある。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:46:55 GMT)
DDNeRF: Depth Distribution Neural Radiance Fields [12.3] DDNeRF(Deep Distribution Neural Radiance Field)は、トレーニング中の放射線のサンプリング効率を大幅に向上させる新しい手法である。
粗いモデルを用いて、入力体積の透過性の内部分布を予測し、体積の総密度を推定する。
このより詳細な分布は、ファインモデルのサンプリング手順を導出する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:21:07 GMT)
Speech and the n-Back task as a lens into depression. How combining both
may allow us to isolate different core symptoms of depression [12.3] その結果,抑うつ症状のサブセットと音声変化が強く関連していることが示唆された。
我々はTymiaで収集された新しい大規模・横断的・多モードデータセットを提案する。
次に、PHQ-8項目レベルで異なる音声とn-Backマーカーの関係を明らかにする実験のセットを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:12:59 GMT)
SIT: A Bionic and Non-Linear Neuron for Spiking Neural Network [12.2] スパイキングニューラルネットワーク(SNN)は、時間的情報処理能力と消費電力の低さから、研究者の関心を喚起している。
現在の最先端の手法は、ニューロンが単純な Leaky-Integrate-and-Fire (LIF) モデルに基づいて構築されているため、生物学的な可視性と性能を制限している。
高レベルの動的複雑さのため、現代のニューロンモデルがSNNの実践で実装されることはめったにない。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:50:44 GMT)
Spatially Adaptive Online Prediction of Piecewise Regular Functions [12.2] オンライン環境における部分的正規関数推定の問題点を考察する。
我々は、最近開発された睡眠専門家集約アルゴリズムと呼ばれるオンライン学習アルゴリズムの修正版を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:15:56 GMT)
Optimization for Classical Machine Learning Problems on the GPU [12.2] 我々は、GPU上の制約付き最適化問題を解決するためにGENOフレームワークを拡張した。
このフレームワークは、ユーザが制約付き最適化問題を、読みやすいモデリング言語で指定できるようにする。
そして、この仕様からソルバが自動的に生成される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:15:54 GMT)
Federated Domain Adaptation for ASR with Full Self-Supervision [12.1] クロスデバイスフェデレーション学習(FL)は、ユーザデバイス上でモデルを協調的にトレーニングすることによって、ユーザのプライバシを保護する。
音声認識(ASR)におけるデバイス間FLの検討
本稿では, ASR の基幹書き起こしの欠如と,エッジデバイス上での計算資源やネットワーク帯域の不足に対処する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:50:16 GMT)
The Sound of Bounding-Boxes [12.0] 本研究では,画像中の物体を同時に検出し,音源を分離する手法を提案する。
本手法は完全に教師なしだが,分離精度は両立可能である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:58:52 GMT)
Automatic Identification of Chemical Moieties [11.5] 本稿では, メッセージパッシングニューラルネットワークを用いて, 原子表現から化学量を自動的に同定する手法を提案する。
本手法の汎用性は, 化学データベースにおける代表成分の選択を可能にすることによって実証される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:58:23 GMT)
Affine Medical Image Registration with Coarse-to-Fine Vision Transformer [11.4] 本稿では,3次元医用画像登録のための学習ベースアルゴリズムであるCoarse-to-Fine Vision Transformer (C2FViT)を提案する。
本手法は, 登録精度, 堅牢性, 一般化性の観点から, 既存のCNNベースのアフィン登録法よりも優れている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:19:16 GMT)
Context-aware Automatic Music Transcription [11.0] 本稿では,文脈関連情報を組み込んだ自動音楽書き起こしシステムを提案する。
最先端の心理学研究を動機として,ATTシステムの精度向上手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:36:17 GMT)
FLOAT: Factorized Learning of Object Attributes for Improved
Multi-object Multi-part Scene Parsing [10.9] スケーラブルな多目的多部分解析のための因子付きラベル空間フレームワークであるFLOATを提案する。
我々のフレームワークは、オブジェクトカテゴリと部分属性の独立に密集した予測を含む。
さらに,セグメンテーション品質を著しく向上させる推論時間「ゾム」改良手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:46:10 GMT)
AmsterTime: A Visual Place Recognition Benchmark Dataset for Severe
Domain Shift [10.9] AmsterTimeは、アムステルダム市の歴史的考古学的画像データと一致するストリートビューから、同じシーンと一致する2500の精巧な画像のコレクションを提供している。
既存のベンチマークデータセットとは異なり、AmsterTimeはGISナビゲーションプラットフォーム(Mapillary)で直接クラウドソースされる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:33:45 GMT)
Practical Learned Lossless JPEG Recompression with Multi-Level
Cross-Channel Entropy Model in the DCT Domain [10.7] 本稿では,DCT領域で動作するディープラーニングに基づくJPEG再圧縮手法を提案する。
実験により,従来のJPEG再圧縮手法と比較して最先端の性能が得られた。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:36:13 GMT)
Solving Disjunctive Temporal Networks with Uncertainty under Restricted
Time-Based Controllability using Tree Search and Graph Neural Networks [10.2] 木探索とグラフ機械学習に基づく新しい手法を提案し,不確実性のある時空間ネットワーク(DTNU)と呼ばれるスケジューリング問題を提案する。
本稿では、時間に基づく動的制御可能性(TDC)と、TDCの制限されたサブセットであるR-TDCを紹介する。
我々は、より複雑なDTNUのベンチマークにおいて、グラフニューラルネットワーク探索ガイダンスがかなりの性能向上をもたらすことを観察する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:41:56 GMT)
Understanding Graph Convolutional Networks for Text Classification [9.5] 本稿では,グラフにおけるノードとエッジの埋め込みの役割と,テキスト分類におけるGCN学習手法を包括的に分析する。
我々の分析はこの種の最初のものであり、各グラフノード/エッジ構築メカニズムの重要性についての有用な洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:14:31 GMT)
Deterministic distribution of orbital angular momentum multiplexed
continuous-variable entanglement and quantum steering [9.0] 軌道角運動量(OAM)多重化は、量子通信プロトコルにおけるデータ搬送能力を改善する効率的な方法を提供する。
我々はOAM多重化連続可変絡み合い状態を生成し、それらを損失チャネルやノイズチャネルに分散する。
高次OAM多重状態の絡み合いと量子ステアリングの突然の死は、余剰ノイズの存在下で観察される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:27:45 GMT)
Fringe visibility and correlation in Mach-Zehnder interferometer with an
asymmetric beam splitter [9.0] 非対称ビームスプリッタを用いた一般的なマッハ・ツェンダー干渉計における波動-粒子双対性について検討する。
粒子と経路検出器の相関は、純粋な状態または混合状態にあるときに導出される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:41:49 GMT)
Coarse-to-Fine Recursive Speech Separation for Unknown Number of
Speakers [8.4] 本稿では,マルチパス音源抽出問題として,未知話者数による音声分離を定式化する。
実験の結果,提案手法は話者数が異なるWSJ0データセット上で,最先端のパフォーマンスをアーカイブしていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:45:34 GMT)
COSMOS: Cross-Modality Unsupervised Domain Adaptation for 3D Medical
Image Segmentation based on Target-aware Domain Translation and Iterative
Self-Training [8.3] 我々は,COSMOSという3次元医用画像セグメント作成のための,自己学習に基づく教師なしドメイン適応フレームワークを提案する。
我々のターゲット認識コントラスト変換ネットワークは、ソース領域の注釈付きT1 MRIを擬似T2 MRIに変換し、ターゲット領域でのセグメンテーショントレーニングを可能にする。
COSMOSは、第24回医用画像コンピューティングおよびコンピュータ支援介入国際会議(MICCAI 2021)と共同で開催されたクロスモダリティドメイン適応(crossMoDA)チャレンジで1textsuperscriptationで優勝した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:00:07 GMT)
Surface Vision Transformers: Attention-Based Modelling applied to
Cortical Analysis [8.2] 球面多様体上に投影された任意の曲面データを研究するために、ドメインに依存しないアーキテクチャを導入する。
ビジョントランスモデルは、連続したマルチヘッド自己アテンション層を介してパッチのシーケンスを符号化する。
実験の結果、SiTは一般的に表面CNNよりも優れており、登録データと未登録データで比較可能であることがわかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:56:11 GMT)
Iterative Deep Homography Estimation [8.2] 我々はIHN(Iterative Homography Network, IHN)を提案する。
IHNは、挑戦的なシーンを含むいくつかのデータセットで最先端の精度を達成する。
シーケンシャルなイメージペアを処理する場合、IC-LKイテレータの約8倍の32.7 fpsを達成することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:43:02 GMT)
Enhancing Zero-Shot Many to Many Voice Conversion with Self-Attention
VAE [8.1] 変分自動エンコーダ(VAE)は、音声の発声を話者識別と言語内容の潜伏埋め込みに分解する有効なニューラルネットワークアーキテクチャである。
本研究では,VAEのデコーダの適切な位置から,変換音声を生成する際に,非局所情報を組み込む自己アテンション層を付加した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:52:42 GMT)
The impact of using voxel-level segmentation metrics on evaluating
multifocal prostate cancer localisation [8.0] Dice similarity coefficient (DSC) と Hausdorff distance (HD) は医用画像セグメンテーションの評価に広く用いられている。
本研究は、まず、前立腺がんの手術計画において、対象検出に使用されるものを適応する、新しい非対称検出指標を提案する。
今回我々は, DSCとHDの相互一致と相関について報告し, 2) ボクセルレベルDSCと病変レベルでのリコール制御精度について報告する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:57:20 GMT)
An analytic theory for the dynamics of wide quantum neural networks [7.6] 変分量子機械学習モデルの学習誤差に対する降下勾配のダイナミクスを解析する。
ランダムな量子回路では、残差トレーニング誤差の指数的減衰をシステムのパラメータの関数として予測し、特徴付ける。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 23:24:06 GMT)
Convergence of gradient descent for deep neural networks [7.4] 勾配降下は「深層学習革命」の主要な要因の1つである
本稿では、勾配降下の収束の新たな基準を、大域的最小値に提示する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:01:14 GMT)
Learning the Effect of Registration Hyperparameters with HyperMorph [7.3] 我々は,学習に基づく変形可能な画像登録において,効率的なハイパーパラメータチューニングを容易にするHyperMorphを紹介した。
本研究では,高速かつ高分解能なハイパーパラメータ探索を実現することで,従来の手法の非効率性を低減できることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:30:06 GMT)
Centralised multi link measurement compression with side information [7.2] 我々は、受信機にサイド情報を持つ量子機器の測定圧縮のための新しい1ショット達成可能性の結果を証明した。
我々の1ショット境界はほぼ最適であり、触媒的ランダム性を必要としない。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:58:48 GMT)
Monte Carlo Tree Search based Hybrid Optimization of Variational Quantum
Circuits [7.1] 我々はMCTS-QAOAと呼ばれる新しい変分量子アルゴリズムを提案する。
モンテカルロ木探索法と改良された自然ポリシー勾配解法を組み合わせて、量子回路内の離散変数と連続変数を最適化する。
MCTS-QAOAは耐雑音性に優れ、一般化QAOAの挑戦事例において先行アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 23:15:21 GMT)
Protein 3D structure-based neural networks highly improve the accuracy
in compound-protein binding affinity prediction [7.1] 我々は,タンパク質3D構造情報の複合タンパク質結合親和性(CPAs)予測への応用を容易にするために,高速進化的注意と粗いグラフニューラルネットワーク(FeatNN)を開発した。
FeatNNはCPA予測において様々な最先端のベースラインをかなり上回り、ピアソン値は約35.7%上昇した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:44:15 GMT)
Spatial-Temporal Parallel Transformer for Arm-Hand Dynamic Estimation [7.0] そこで本研究では,腕と手の関係を利用して,単眼ビデオから腕と手の動きを推定する手法を提案する。
2次元手ポーズ推定モデルと3次元人ポーズ推定モデルを統合することにより、単眼ビデオから可塑性アームと手動ダイナミクスを生成できる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:51:41 GMT)
Research topic trend prediction of scientific papers based on spatial
enhancement and dynamic graph convolution network [6.7] 近年,科学研究への社会投資の増加に伴い,様々な分野の研究成果が著しく増加している。
様々な研究テーマ間の相関関係がますます高まっているため、多数の研究テーマの間には一定の依存関係関係がある。
本稿では,ディープニューラルネットワークに基づくホットネス予測アルゴリズム,時間畳み込みネットワークモデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:38:52 GMT)
Theory on electron-phonon spin dehphasing in GaAs multi-electron double
quantum dots [6.2] GaAs多電子二重量子ドット系における電子フォノンの劣化について検討した。
電子フォノンの減圧速度は、偏りのないケースに閉じ込められた電子の数とともに増加するが、偏りのあるケースではこれが成り立たないことが判明した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:25:18 GMT)
On learning adaptive acquisition policies for undersampled multi-coil
MRI reconstruction [6.2] 本研究では,再建モデルと獲得方針を併用した共同学習の課題について考察する。
我々は、異なるデータポイントに対応可能な学習可能な取得ポリシーにより、エンド・ツー・エンド変分ネットワークを拡張します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:23:23 GMT)
An Improved Greedy Algorithm for Subset Selection in Linear Estimation [6.0] 有限個の予測位置において、観測値の最もよい推定値を与えるような k 個の位置の集合を求める空間場における部分選択問題を考える。
観測選択の1つのアプローチは、空間の格子離散化を行い、グリードアルゴリズムを用いて近似解を得ることである。
本稿では,予測位置と予測位置によって形成される傾斜角の遠心点のみからなる探索空間を考慮し,計算複雑性を低減する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:52:16 GMT)
Federated Learning for the Classification of Tumor Infiltrating
Lymphocytes [5.9] デジタル化組織断面解析のための深層学習モデルの開発において,フェデレートラーニング(FL)の性能を評価する。
スライド画像全体から抽出した50*50平方ミクロンパッチを用いてディープラーニング分類モデルを訓練した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:10:50 GMT)
Does Configuration Encoding Matter in Learning Software Performance? An
Empirical Study on Encoding Schemes [5.8] この研究は、5つのシステム、7つのモデル、3つの符号化スキームをカバーし、105件の調査に繋がった。
ソフトウェアのパフォーマンス学習において広く使われている符号化方式,すなわちラベル,スケールラベル,ワンホット符号化を実証的に比較した。
その結果,(1)ケースで最高の符号化方式を見つけるための試行錯誤は,いくつかのモデルやシステムで最大400時間以上の時間を要する場合が多いこと,(2)スケールされたラベル符号化が異なるモデルよりも精度が低い場合,(2)スケールされたラベル符号化は一般的に最も正確な結果をもたらすこと,(3)逆に,スケールされたラベル符号化は高い傾向にあることがわかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:46:27 GMT)
Sparse recovery by reduced variance stochastic approximation [5.7] 雑音観測によるスパース信号回復問題に対する反復2次最適化ルーチンの適用について論じる。
本稿では,Median-of-Meansのような手法を用いて,対応するソリューションの信頼性を向上する方法について述べる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:46:57 GMT)
Online Motion Style Transfer for Interactive Character Control [5.6] 本稿では,ユーザ制御下で異なるスタイルの動作を生成し,リアルタイムに動作スタイルを伝達するエンド・ツー・エンドニューラルネットワークを提案する。
本手法は手作りのフェーズ機能の使用を排除し,ゲームシステムに容易にトレーニングし,直接デプロイすることができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:23:37 GMT)
Recognition of polar lows in Sentinel-1 SAR images with deep learning [5.6] 本研究では, 海洋性メソサイクロン, 陰性, 正常な海の状態を表すSentinel-1画像からなる新しいデータセットについて紹介する。
データセットは、ラベル付きイメージを分類するためにディープラーニングモデルをトレーニングするために使用される。
このモデルではF-1スコアが0.95であり、SAR画像から極低を一貫して検出できることを示している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:32:39 GMT)
Entanglement swapping and quantum correlations via Elegant Joint
Measurements [5.3] 量子エレガントジョイント測定に基づく決定論的エンタングルメントスワップを実験的に実現するために,ハイパーエンタングルメントを用いる。
我々は9.7.4%以下の測定フィデリティを報告している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:09:20 GMT)
The Weak Supervision Landscape [5.2] 弱い監督設定を分類する枠組みを提案する。
我々は、弱い監督を特徴付ける重要な要素を特定し、既存のアプローチのほとんどを分類する一連の次元を考案する。
文献における一般的な設定がフレームワークにどのように適合するかを示し、実際に使用可能な使用法について議論する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:19:43 GMT)
CardioID: Mitigating the Effects of Irregular Cardiac Signals for
Biometric Identification [5.1] 我々は、より現実的な(制御されていない)シナリオで収集された心臓信号を解析する。
本フレームワークは,各ユーザに対してフィルタスペクトルを調整することにより,安定かつ異なる特徴を実現する。
評価の結果,SoAの平均平衡精度(BAC)は制御シナリオの90%以上から制御されていないシナリオの75%に低下した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:07:54 GMT)
End-to-end Document Recognition and Understanding with Dessurt [5.1] Dessurtは文書理解に加えてテキスト認識を行うエンドツーエンドアーキテクチャである。
このモデルは,9種類のデータセットとタスクの組み合わせで有効であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:02:53 GMT)
PP-YOLOE: An evolved version of YOLO [4.9] 工業用最先端物体検出器PP-YOLOEについて述べる。
我々は,従来の PP-YOLOv2 に基づいて,CSPRepResStage,ET-head および動的ラベル代入アルゴリズム TAL を備えたアンカーフリーパラダイム,より強力なバックボーン,ネックを最適化した。
その結果、PP-YOLOE-lはCOCOテストデブで51.4 mAP、Tesla V100で78.1 FPSを達成し(+1.9 AP、+13.35%のスピードアップ)、(+1.3 AP、+24.96%の大幅な改善を実現した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:31:39 GMT)
Exploring ML testing in practice -- Lessons learned from an interactive
rapid review with Axis Communications [4.9] 機械学習(ML)テストでは、業界や学界への関心が高まっている。
産業とアカデミックは、厳密で関連する知識を生み出すために共に学ぶ必要があると信じています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:01:43 GMT)
Distributed quantum error correction for chip-level catastrophic errors [4.8] 宇宙線はチップレベルの破滅的なエラーを引き起こすことによって量子コンピュータの動作に大きな影響を及ぼす。
本稿では,このような事象の破壊的影響に対処する分散誤り訂正手法を提案する。
我々は,チップレベルの破滅的エラーに対して,我々の計画がフォールトトレラントであることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:28:02 GMT)
TransductGAN: a Transductive Adversarial Model for Novelty Detection [4.6] ノベルティ検出の一般的な設定は、トレーニング期間中に負のクラスの例のみが利用可能となる誘導的である。
一方、トランスダクティブノベルティ検出は、最近の関心の高まりを目撃したばかりでなく、トレーニング中に負のクラスを利用するだけでなく、新しい例を検出するための(ラベルのない)テストセットも組み込んでいる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:10:46 GMT)
WSEBP: A Novel Width-depth Synchronous Extension-based Basis Pursuit
Algorithm for Multi-Layer Convolutional Sparse Coding [4.5] 多層畳み込みスパース符号化(ML-CSC)は畳み込みニューラルネットワーク(CNN)を解釈できる
現在の最先端(SOTA)探索アルゴリズムの多くはML-CSCの解を最適化するために複数の繰り返しを必要とする。
本稿では,ML-CSC問題を反復回数の制限なく解くWSEBPアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:22:24 GMT)
Entity-driven Fact-aware Abstractive Summarization of Biomedical
Literature [4.0] 本稿では, エンド・ツー・エンド・エンド・トランスフォーマーに基づくエンコーダ・デコーダ・モデルを用いて, バイオメディカル・アーティクルの抽象的な要約を学習するためのエンティティ駆動型ファクト・アウェア・フレームワークを提案する。
我々は5つの最先端変換器モデルを用いて実験を行う。
提案手法はICD-11-Summ-1000とPubMed-50kで評価される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 00:34:56 GMT)
IGRF-RFE: A Hybrid Feature Selection Method for MLP-based Network
Intrusion Detection on UNSW-NB15 Dataset [3.7] 本稿では,マルチクラスネットワークの異常を考慮したハイブリッド特徴選択手法IGRF-RFEを提案する。
提案手法では,情報ゲインとランダムフォレストを組み合わせたフィルタ特徴選択法を用いて,特徴部分探索空間を削減する。
UNSW-NB15データセットから得られた結果から,提案手法は特徴量を削減するとともに,異常検出の精度を向上させることができることを確認した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:44:31 GMT)
Exosoul: ethical profiling in the digital world [3.6] Exosoulプロジェクトは、ユーザの道徳的嗜好に応じてデジタル世界でアクションを仲介するパーソナライズされたソフトウェアエクソスケルトンを開発することを目的としている。
このアプローチはハイブリッドで、まずトップダウンの方法でプロファイルを識別し、次にパーソナライズされたデータ駆動のアプローチでプロファイルを洗練する。
我々は倫理的立場(イデオロギーと相対主義)の性格特性(正直・謙虚、良心、マキアベリア主義とナルシシズム)と世界観(ノルマティビズム)の相関を考察する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:54:00 GMT)
Direct parameter estimations from machine-learning enhanced quantum
state tomography [3.5] 機械学習による量子状態トモグラフィ(QST)は、量子状態に関する完全な情報を抽出する際の利点を実証している。
我々は,目標パラメータを直接生成することにより,高性能で軽量で容易に教師付き特性モデルを構築する。
このような特性モデルに基づく ML-QST は、ヒルベルト空間を扱う問題を回避することができるが、高い精度で特徴抽出を維持することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:16:02 GMT)
Neural Pipeline for Zero-Shot Data-to-Text Generation [3.4] 本稿では,汎用的なテキストベース操作に基づいて訓練された一連のモジュールを用いて,単一項目記述を変換してテキストを生成することを提案する。
WebNLGとE2Eという2つの主要な3重テキストデータセットに関する実験により、ゼロショット設定でのRDFトリプルからのD2T生成が可能になった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:14:35 GMT)
An Improved Lightweight YOLOv5 Model Based on Attention Mechanism for
Face Mask Detection [3.3] YOLOv5に基づく軽量マスク検出器を提案する。
平均精度は95.2%で、ベースラインよりも4.4%高く、既存のモデルよりも正確である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:41:21 GMT)
Quantum polarization mapping of nitrogen-vacancy centers in diamond [3.3] 本研究では, 1-および2-エミッタ系における偏光関数として, 光発光強度と量子相関測定を示す。
このアプローチは、量子センシング、通信、計算タスクに有用な少数のエミッタシステムを特徴づけるための貴重な新しいメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:12:43 GMT)
Efficient semiquantum key distribution based on single photons in both
polarization and spatial-mode degrees of freedom [3.3] 偏光度と空間モード自由度の両方における単一光子に基づく効率的な半量子鍵分配プロトコルを提案する。
このプロトコルは、古典的な通信者が量子メモリやユニタリ演算装置を使用する必要はない。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:09:21 GMT)
Polarized deep diffractive neural network for classification,
generation, multiplexing and de-multiplexing of orbital angular momentum
modes [3.0] 長方形マイクロ構造メタマテリアルの概念に基づいて設計した偏光深部拡散ニューラルネットワークを提案する。
提案する分極型光回折ニューラルネットワークは、多重多重化OAMビームの分類、生成、多重化、および非多重化を訓練する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:30:32 GMT)
Evolutionary Programmer: Autonomously Creating Path Planning Programs
based on Evolutionary Algorithms [2.9] 進化的プログラマ(Evolutionary Programmer)と呼ばれる一級機械学習手法を提案し,その課題を解決した。
新たな手法では,演算子を統合プランナーに再構成するので,変化する状況に適応するために最適な演算子を選択することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:22:14 GMT)
Region of Interest focused MRI to Synthetic CT Translation using
Regression and Classification Multi-task Network [2.8] 画像の構造的,定量的な精度を目的としたゼロエコタイム(ZTE)MRIからの合成CT(sCT)生成法を提案する。
画像中の空間的にスパースな領域を選好する損失関数を提案する。
本稿では,RoIに着目したマルチタスクネットワークが,ネットワークの他の構成よりも優れた性能を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:29:03 GMT)
Enhancing Cancer Prediction in Challenging Screen-Detected Incident Lung
Nodules Using Time-Series Deep Learning [2.7] 低用量CTによる肺がん検診(LCS)は肺がん死亡率を著しく低下させることが証明された。
肺結節の悪性度リスクの階層化を改善するには, マシン/ディープ学習アルゴリズムが有用である。
本稿では,時系列深層学習モデル(DeepCAD-NLM-L)の性能について述べる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:40:36 GMT)
Detecting Unassimilated Borrowings in Spanish: An Annotated Corpus and
Approaches to Modeling [2.7] 非同化語彙借入に富んだスペイン語ニュースワイヤの注釈付きコーパスを導入する。
我々は,CRF,BiLSTM-CRF,Transformer-basedモデルなど,複数のシーケンスラベリングモデルがどのように動作するかを評価する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:46:51 GMT)
Low-complexity Near-optimum Symbol Detection Based on Neural Enhancement
of Factor Graphs [2.0] 本稿では,シンボル検出のための因子グラフフレームワークの線形シンボル間干渉チャネルへの応用について考察する。
ニューラルエンハンスメントによる因子グラフに基づくシンボル検出の性能向上のための戦略を開発し,評価する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:58:53 GMT)
Tampered VAE for Improved Satellite Image Time Series Classification [1.9] ピラミッド時間系列変換器(PTST)は時間次元のみで動作する。
本稿では,クラスタリング機構を潜在空間に導入する分類フレンドリなVAEフレームワークを提案する。
提案するフレームワークが,SITSによる作物分類のベースラインとして機能し,モジュール性と簡易性を期待する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:48:06 GMT)
Can NMT Understand Me? Towards Perturbation-based Evaluation of NMT
Models for Code Generation [1.8] NMTモデルの堅牢性を検証するための重要なステップは、その性能を逆入力で評価することである。
本研究では,そのようなモデルのロバスト性評価に適した摂動と測定値のセットを同定する。
モデルにどのような摂動が最も影響を与えるかを示す予備実験を行った。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:58:40 GMT)
Symbolic music generation conditioned on continuous-valued emotions [1.7] 音楽的感情によって駆動される多構造シンボリック音楽の創出のための新しいアプローチを提案する。
われわれのアプローチの目新しいところは、最先端のトランスフォーマーの条件付けにある。
感情ラベルと組み合わせたシンボル音楽の大規模データセットを提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:38:09 GMT)
Identification of diffracted vortex beams at different propagation
distances using deep learning [1.6] 光の軌道角運動量(英語版)は量子技術において貴重な資源である。
本稿では、強化されたディープラーニングニューラルネットワークを用いて、複数の伝搬距離における異なるOAMモードの光を識別する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:30:51 GMT)
Longitudinal Fairness with Censorship [1.6] 我々は、適用可能な公正度対策を考案し、デバイアスアルゴリズムを提案し、検閲なしで公正度を橋渡しするために必要な理論的構造を提供する。
検閲された4つのデータセットに対する実験により、我々のアプローチの有効性が確認された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:08:40 GMT)
Observing dynamical currents in a non-Hermitian momentum lattice [1.4] 集合トンネルは、ホウ素-アインシュタイン凝縮体によって光子の空洞支援ラマン散乱によって実装される。
個々のトンネル現象は自然界において超放射性であり、格子内で局所的に解決する。
結果は、複数の格子サイト間の同時コヒーレンスと電流のカスケードを示す状態にまで拡張することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:11:05 GMT)
On the Connection Between Quantum Pseudorandomness and Quantum Hardware
Assumptions [1.4] 本稿では,量子擬似ランダム性と量子ハードウェアの仮定との関係について述べる。
我々は、効率的な擬似ランダム量子状態(PRS)は、普遍的に鍛えられないqPUFの挑戦セットを構築するのに十分であることを示す。
その結果,既存のqPUFベースのクライアントサーバ識別プロトコルの効率性は,セキュリティ要件を損なうことなく向上できることを示した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:01:37 GMT)
Scientometric Review of Artificial Intelligence for Operations &
Maintenance of Wind Turbines: The Past, Present and Future [1.4] コンディションベースモニタリング(CBM)とタービンの性能評価・分析は、効率的な運転・保守の確保に不可欠である。
データ駆動による意思決定技術は、過去10年間に風力産業におけるこのようなO&Mタスクの急速な進化を目撃してきた。
私たちは、データ可用性と品質における現在の重要な課題、ブラックボックスに飽和したAIモデルの透明性の欠如、そして、リアルタイムな意思決定サポートのためのモデルをデプロイする際の一般的な問題について、未来と現在の展望を提供しています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:42:21 GMT)
ReplaceBlock: An improved regularization method based on background
information [1.3] 本研究では,対象オブジェクトが部分的に背景と見なされるオブジェクトによって隠蔽されている場合の状況をシミュレートするReplaceBlockを提案する。
具体的には、ReplaceBlockはイメージ内のターゲットオブジェクトを消去し、モデルによって無関係なオブジェクトとバックグラウンドのみを持つフィーチャーマップを生成する。
これにより、ReplaceBlockは、隠された画像の特徴マップを効果的にシミュレートできる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:24:14 GMT)
Ball 3D localization from a single calibrated image [1.3] 本研究では,画素内の球径を推定し,実球径の知識をメートル単位で利用することにより,単一画像上の課題に対処することを提案する。
このアプローチは、ボールが(部分的にも)見えるようなあらゆるゲーム状況に適しています。
3つのバスケットボールデータセットの検証により,我々のモデルがボール3Dのローカライゼーションに顕著な予測を与えることが明らかとなった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:38:14 GMT)
Physics-constrained Unsupervised Learning of Partial Differential
Equations using Meshes [1.1] グラフニューラルネットワークは、不規則にメッシュ化されたオブジェクトを正確に表現し、それらのダイナミクスを学ぶことを約束する。
本研究では、メッシュをグラフとして自然に表現し、グラフネットワークを用いてそれらを処理し、物理に基づく損失を定式化し、偏微分方程式(PDE)の教師なし学習フレームワークを提供する。
本フレームワークは, ソフトボディ変形のモデルベース制御など, PDEソルバをインタラクティブな設定に適用する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:22:56 GMT)
Sensor Data Validation and Driving Safety in Autonomous Driving Systems [0.9] 先進的なセンサーとディープラーニングモデルは、最近発明された攻撃方法の傾向がある。
本稿では,車載センサの攻撃に対する検出方法と,攻撃されたディープラーニングモデルと自動運転車の運転安全性の関連性について検討する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:17:14 GMT)
An Offset-Free Nonlinear MPC scheme for systems learned by Neural NARX
models [0.8] 本稿では,オフセットフリーなセットポイントトラッキングを実現する非線形MPCコントローラの設計について述べる。
提案手法は, 植物に作用する乱れの存在下においても顕著な性能を発揮する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:30:07 GMT)
A quantum learning approach based on Hidden Markov Models for failure
scenarios generation [0.6] 生成モデルの作成にはHidden Quantum Markov Models(HQMM)を使用します。
量子的アプローチが古典的アプローチよりも優れた結果をもたらすことを示す。
システムの確率的かつ予測不可能な障害シナリオを特定するための戦略を提供します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:27:23 GMT)
Automatic generation of semantic corpora for improving intent estimation
of taxonomy-driven search engines [0.6] 本稿では,セマンティック拡張に基づく検索システムにおいて,どの意味関係が最も影響を与えるかを示す。
評価は、分類学駆動のドメインを問合せできる単純な自然言語処理システムを構築する。
いくつかのコーパスが、分類ラベルに対応する擬似クエリを推定するために、NLPインフラストラクチャにガゼターとして組み込まれている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:06:32 GMT)
Non-Hermitian Weyl semimetal and its Floquet engineering [0.6] 非ハーミティー性は、ワイル半金属をワイル例外環半金属に変換することができると一般に信じられている。
皮膚効果を有するシステムにおける非エルミートワイルセミメンタルとそのフロケット工学について検討した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:04:29 GMT)
INSPIRE: Distributed Bayesian Optimization for ImproviNg SPatIal REuse
in Dense WLANs [0.3] IEEE 802.11axは、無線伝送における2つの重要なパラメータの動的更新を可能にすることで、無線チャネルの再利用を高めることを目的としている。
本稿では,ベイズ過程に基づく局所最適化を行う分散ソリューションINSPIREを提案する。
わずか数秒で、INSPIREは、その公平性とスループットを改善して、運用空間のサービス品質を大幅に向上させることができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:48:26 GMT)
Equivalence principle and HBAR entropy of an atom falling into a quantum
corrected black hole [0.3] 本研究では、原子が量子補正されたシュワルツシルトブラックホールに落下する加速放射現象について検討する。
この量子修正ブラックホール幾何に対する地平面輝度加速放射エントロピーを計算する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 06:29:38 GMT)
Active Learning for Computationally Efficient Distribution of Binary
Evolution Simulations [0.2] 我々は,データ収集プロセスにおける機械学習を用いて,対象とするシミュレーションを適応的かつ反復的に選択する,新しい能動的学習アルゴリズムであるpsy-crisを提案する。
おもちゃの問題に対してpsy-crisを試験し、その結果のトレーニングセットが正規またはランダムにサンプリングされたグリッドよりも正確な分類と回帰のシミュレーションを少なくする必要があることを発見した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:36:32 GMT)
Theory of Acceleration of Decision Making by Correlated Times Sequences [0.2] フォトニック加速器は情報処理能力を高めるために集中的に研究されている。
レーザーカオスは、マルチアームバンディット(MAB)問題や意思決定問題をGHzオーダーで解決する機能を提供する。
相関時間列によって意思決定が加速される理由のメカニズムは不明である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:27:01 GMT)
RICON: A ML framework for real-time and proactive intervention to
prevent customer churn [0.1] RICONはフレキシブルで費用対効果が高く、堅牢な機械学習システムであり、リアルタイムで顧客のチャーン確率を予測する。
我々は、RICONが強いクラス不均衡の存在下で2.68の上昇を達成したことを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:56:14 GMT)
Rethinking Anticipation Tasks: Uncertainty-aware Anticipation of Sparse
Surgical Instrument Usage for Context-aware Assistance [0.0] 腹腔鏡映像における楽器使用予測のための新しい学習課題を提案する。
トレーニング中は、スパース・インスツルメンツのみが必要であり、推論は画像データのみに行われる。
本研究は,外科手術における機器の予測手法を初めて提案するものである。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:33:14 GMT)
Zero Shot Crosslingual Eye-Tracking Data Prediction using Multilingual
Transformer Models [0.0] 本稿では,多言語データセットの読解パターンを予測するCMCL 2022共有タスクについて述べる。
本モデルでは, 平均偏差と標準偏差の統計的測度を予測するために, 変圧器のテキスト表現と回帰層を用いた手作業による特徴量を用いる。
エンド・ツー・エンドのモデルをトレーニングし、異なる言語から意味のある情報を抽出し、2つの別々のデータセットでモデルをテストします。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:11:48 GMT)
Work extraction from coherently activated maps via quantum switch [0.0] 量子制御順序における2つの写像の適用は、ユニタリサイクルによる作業抽出のプロセスに依存することを示す。
この制御は、基礎となる因果構造と必ずしも互換性のない順序で写像を適用する量子スイッチモデルに基づいている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:03:06 GMT)
Vakyansh: ASR Toolkit for Low Resource Indic languages [0.0] Vakyanshは、Indic言語における音声認識のためのエンドツーエンドツールキットである。
私たちは23のIndic言語で14,000時間の音声データを作成し、wav2vec 2.0ベースの事前訓練モデルを訓練します。
これらの事前訓練されたモデルは、18のIndic言語のためのアート音声認識モデルの状態を作成するために微調整される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:50:18 GMT)
Universalizing Analog Quantum Simulators [0.0] 単元サンプリング期待値再構成は、アナログ量子シミュレータでは直接アクセスできない期待値を決定するために用いられる。
アナログ量子シミュレータでは直接アクセスできない期待値を決定するために用いられる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:11:32 GMT)
Understanding the role of single-board computers in engineering and
computer science education: A systematic literature review [0.0] シングルボードコンピュータ(Single-Board Computers, SBCs)は、工学と計算機科学において、技術と教育の両面において、より頻繁に採用されている。
この体系的な文献レビューは、SBCがエンジニアリングとコンピュータ科学にどのように使われているかについて考察する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:34:03 GMT)
UGR tests with atomic clocks and atom interferometers [0.0] 我々はUGR違反モデルを導入し、同じ足場上で原子時計と原子干渉計によって実行されるUGR試験について議論する。
本稿では,UGRの欠陥に敏感な原子-干渉測地を多数提示する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:57:36 GMT)
Thermal critical dynamics from equilibrium quantum fluctuations [0.0] 量子揺らぎは熱臨界点における特異点を示し、動的に$z$指数を持つことを示す。
量子系では、静的な性質と動的性質は有限温度遷移においても密接に結びついている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:05:35 GMT)
The Basics of Quantum Computing for Chemists [0.0] 本稿では,量子情報の基本的側面と量子コンピューティングとの関係について概説する。
量子コンピュータにおける量子化学シミュレーションと現在の状況について論じる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:20:28 GMT)
Statistical Representation of Spacetime [0.0] 時空は事象によって構成され、部分的に順序付けられた集合(因果集合)によって説明できると仮定される。
エントロピーの変化は常に定量化され、正であり、結果として世界は膨張している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:55:59 GMT)
Stability of many-body localization in Kicked Ising model [0.0] 混乱したKicked IsingモデルにおけるMBL遷移における有限サイズ効果は、広範囲に研究されているランダムフィールドXXZスピンチェーンよりも深刻ではないことを示す。
これにより、エルゴディディティ破壊の指標として、MBL相への移行の一貫性のあるシグネチャを観察することができる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:30:27 GMT)
Spreading of Correlations and Entanglement in the Long-Range Transverse
Ising Chain [0.0] 長距離相互作用は非相対論的量子モデルにおける因果関係の形式を可能にする。
非ユニバーサル力学指数を特徴とする因果関係の弱い形態が出現することを示す。
我々の結果は、長距離相互作用格子モデルにおける情報の伝播に光を当てた。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:16:36 GMT)
Spin-squeezed states for metrology [0.0] 本稿ではスピンスクイーズ分野におけるいくつかの重要な進歩について概説する。
第1部で提示された資料に基づいて、新しいアイデアといくつかの有望な展開が最終章で概説されている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:56:27 GMT)
Relativistic Orbital Optimized Density Functional Theory for Accurate
Core-Level Spectroscopy [0.0] Neより重い元素の1s電子のコアレベルスペクトルは、大きな相対論的効果を示す。
我々は、軌道最適化DFT(OO-DFT)の進歩と、スカラー相対論的効果のためのスピンフリー完全2成分モデル(X2C)を組み合わせる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 22:40:15 GMT)
Reinforcement Learning Guided by Provable Normative Compliance [0.0] 強化学習(Reinforcement Learning, RL)は、自律エージェントの安全、倫理、法的行動のためのツールとして約束されている。
我々は多目的RL(MORL)を用いて、侵害を避けるという倫理的目的と非倫理的目的とのバランスをとる。
提案手法は,MORL手法の多重性に有効であることを示すとともに,割り当てる刑罰の規模に関係なく有効であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:10:55 GMT)
Rabbit, toad, and the Moon: Can machine categorize them into one class? [0.0] 最近の機械学習アルゴリズムは、ビデオフレーム内のオブジェクトを高精度に分類することができる。
本稿では, ウサギ, ヒツジ, ムーンの関連性について, 基礎的動的パターンに基づく分類について論じる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 09:24:52 GMT)
Quillen-type bundle and geometric prequantization on moduli space of the
Seiberg-Witten equations on product of Riemann surfaces [0.0] セイベルグ・ウィッテン方程式のモジュライ空間上のシンプレクティック構造の存在を$Sigma times Sigma$で示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:12:00 GMT)
Prognosis of Rotor Parts Fly-off Based on Cascade Classification and
Online Prediction Ability Index [0.0] 潜在的な失敗の早期発見と予測は、壊滅的なプラントのダウンタイムと経済的な損失を防ぐ可能性がある。
本稿では, 回転機械の動作状態を, 故障時の時間に基づいて, 正常, 危険, リスクの高いものに分割する。
オンライン予測能力指数(OPAI)は、一貫したオンライン予測とより小さなオフライン予測誤差を持つ予測モデルを選択するために提案される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:28:59 GMT)
Preliminary experiments on thermal emissivity adjustment for face images [0.0] 適切な温度測定のための放射率調整の重要性を強調した。
異なる許容値で0.01のステップで取得した新しい顔画像も提示され、研究目的で無料で配布される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:28:27 GMT)
Predicting Winners of the Reality TV Dating Show $\textit{The Bachelor}$
Using Machine Learning Algorithms [0.0] 私たちは3つの機械学習モデルをトレーニングし、textitThe Bachelor$で、成功した競合者の理想的な特性を予測しました。
北西から26歳、白人はダンサーとして働き、週6で1-on-1を受け取り、第一印象のローズを受け取らなかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:00:31 GMT)
Position-based Prompting for Health Outcome Generation [0.0] そこで本研究では,各単語の位置情報をマスクに対するプロンプトで捕捉する位置認識機構について検討する。
我々のアプローチは、デフォルトのマスク言語モデル(MLM)表現がマスクトークンの予測に使用されるベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:44:04 GMT)
Optimal Learning [0.0] 本稿では、与えられたデータから未知の関数を$f$で学習する問題を考察する。
学習問題は、データから$f$の値を予測する近似$hat f$ to $f$を与えることである。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 02:05:27 GMT)
Noncontextual coloring of orthogonality hypergraphs [0.0] 古典的真理代入として解釈可能な2値状態の観点から、ハイパーグラフの表現と彩色について論じる。
完全に分離可能なハイパーグラフのクラスでは再構成が可能である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:26:36 GMT)
New hard benchmark functions for global optimization [0.0] 我々は,グローバル最適化アルゴリズムの性能を評価するために,新しい単調,マルチモーダル,ノイズテスト機能を提案する。
これらの関数の硬さを示すために、我々はいくつかの強力なアルゴリズムを用いて実験を行った。
その結果,提案関数の硬さが示唆された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:26:06 GMT)
Negative probabilities: What they are and what they are for [0.0] 観測空間 $mathcal S$ は確率分布の族で、$langle P_i: iin I rangle$ は共通のサンプル空間 $Omega$ を一貫した方法で共有する。
for $mathcal S$ は符号付き確率分布 $mathcal P$ on $Omega$ であり、すべての$i$に対して正しい辺分布 $P_i$ を得る。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:57:45 GMT)
Modelling Value-oriented Legal Reasoning in LogiKEy [0.0] LogiKEyは、対話的かつ自動化された定理証明技術を利用して、法的ドメイン固有言語や理論の開発と形式的検証を行うためのテストベッドを提供する。
我々は、知識表現における最新の研究と、非古典論理学における推論、自動定理証明、および法的推論における応用の間の新しい橋渡しを確立する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:27:47 GMT)
Mixed state representability of entropy-density pairs [0.0] 正準および大正準状態を持つ密度エントロピー対の表現可能性を示す。
我々は、代表状態の運動エネルギーのバウンダリを提供する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:43:58 GMT)
Mind the gap: Challenges of deep learning approaches to Theory of Mind [0.0] 心の理論は、人間が他人の精神状態を推測する重要な能力である。
ここでは、心の理論に対する深層学習アプローチの可能性、現在の進歩、課題について、一貫した概要を述べる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:48:05 GMT)
Memory Complexity of Quantum Processes [0.0] 一般のオープン量子力学は、2つの非常に異なるアプローチによって記述できる。
プロセステンソルフレームワークは、量子システム上で可能なすべての観測を記述している。
量子過程と古典過程の親密な関係は、最後に描かれる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:41:11 GMT)
Many-body systems with SU(1,1) dynamical symmetry: from dynamics to
thermodynamics based on the trace formula [0.0] ボソン実現の観点から、既約部分空間の1つに複素係数を持つ指数作用素のトレースについて検討する。
このアプローチは、平衡状態や非平衡過程における量子(多体)系の熱力学を研究するための強力なツールかもしれない。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:05:34 GMT)
Machine Learning Approaches for Non-Intrusive Home Absence Detection
Based on Appliance Electrical Use [0.0] 家庭の不在検出は、スマートホームインスタレーションにおける新たな分野である。
本研究では,住民の有無を検知する手段として,家電の電気利用について検討した。
エネルギー利用は、非侵入的/非侵入的な検知方法であるパワー・デアグリゲーションの結果である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:21:14 GMT)
ME-CapsNet: A Multi-Enhanced Capsule Networks with Routing Mechanism [0.0] 本研究は,各層の受容領域内の空間成分とチャネル成分の両面を高度に最適化する,新たなソリューションの実現に焦点をあてる。
我々は, カプセル層を戦略的に通過する前に重要な特徴を抽出するために, より深い畳み込み層を導入し, ME-CapsNetを提案する。
より深い畳み込み層にはSqueeze-Excitation Networkのブロックが含まれており、空間サイズを徐々に小さくするためにソフトプーリングアプローチを使用している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 04:52:04 GMT)
Local unitary classes of states invariant under permutation subgroups [0.0] 量子ビットの置換の下で不変な多重量子ビット状態の絡み合い特性の研究は、量子コンピューティング、量子通信、量子力学の潜在的な応用によって動機付けられている。
我々は、対称性、ディック状態、およびマヨアナ表現の概念を全置換群の交互群、巡回群、二面群に一般化する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:07:34 GMT)
L^3U-net: Low-Latency Lightweight U-net Based Image Segmentation Model
for Parallel CNN Processors [0.0] 本稿では,CNNアクセラレータの並列畳み込み層処理機能を活用することで,推論遅延を低減するデータ折り畳み手法を提案する。
また、提案したモデルをMAX78000にデプロイし、L3U-netが10fpsの2つの異なるセグメンテーションデータセットに対して90%以上の精度を達成することを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:58:51 GMT)
LEAD1.0: A Large-scale Annotated Dataset for Energy Anomaly Detection in
Commercial Buildings [0.0] 我々は,1年以上にわたる1,413個のスマート電気メーター時系列を含むASHRAE Great Energy Predictor IIIデータセットの注釈付きバージョンをリリースする。
我々は,8つの最先端異常検出手法の性能をベンチマークし,その性能を比較した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:30:59 GMT)
Knowledge-based Entity Prediction for Improved Machine Perception in
Autonomous Systems [0.0] 知識に基づくエンティティ予測(KEP)は、自律システムにおける機械認識を改善することを目的とした新しいタスクである。
3つの潜在的なソリューションが導入され、いくつかの機械学習とデータマイニング技術が採用されている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:56:52 GMT)
Is Word Error Rate a good evaluation metric for Speech Recognition in
Indic Languages? [0.0] 自動音声認識(ASR)における誤り率計算のための新しい手法を提案する。
この新しいメートル法は、半分の文字を持ち、同じ文字を異なる形式で書くことができる言語のためのものである。
私たちは、インディ・コンテクストの主要な言語の一つであるヒンディー語で方法論を実装しています。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:32:08 GMT)
Improving Speech Recognition for Indic Languages using Language Model [0.0] 本稿では,言語モデル(LM)の適用が,インデックス言語の自動音声認識(ASR)システムの出力に与える影響について検討する。
We fine-tune wav2vec $2.0$ models for 18$ Indic languages and adjust the formula with language model training on text from various sources。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:22:12 GMT)
Image Compression and Actionable Intelligence With Deep Neural Networks [0.0] 外部要因により、ユニットがソースからインテリジェンスを受けられない場合、不利なユーザは考慮する。
このケースでは、通常よりもインテリジェンス、特に衛星画像情報を提供するために、別のアプローチを使う必要があります。
本稿では,従来の画像圧縮,ニューラルネットワーク画像圧縮,物体検出画像カットアウト,キャプションへのイメージ・トゥ・キャプションの4つの手法について検討する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:10:12 GMT)
Identification for Accountability vs Privacy [0.0] 識別スキームを設計する際には、プライバシと説明責任要件、したがって適切な形態のアイデンティティが考慮されることが推奨される。
また,システムによって要求されるアイデンティティの形式がどのような意味を持つのかをユーザが意識し,それが許容できるかどうかを判断できるようにすべきである。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:09:34 GMT)
How Deep is Your Art: An Experimental Study on the Limits of Artistic
Understanding in a Single-Task, Single-Modality Neural Network [0.0] 本稿では,現代の2次元視覚芸術の分類において,単一タスク,単一モードのコンピュータビジョンモデルが果たす限界について検討する。
これは、Deep Neural Networksがアートを理解するメカニズムを明らかにするために、混乱行列から派生した既存の評価指標を使用する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 03:32:05 GMT)
Higher-Order Generalization Bounds: Learning Deep Probabilistic Programs
via PAC-Bayes Objectives [0.0] DPP法を用いてPAC-Bayes一般化境界をプログラムとして表現するためのフレームワークを提供する。
特に, DPP の手法は DPP 表現の構成性に基づく一般化境界の導出に有効であることを示す。
そこで本研究では,高次確率的プログラムに対する原則的学習目標について紹介する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:14:56 GMT)
Ground state separability and criticality in interacting many-particle
systems [0.0] 1点と2点の固有値方程式の形で、完全分離性のための一般的な必要十分条件を導出する。
パリティブレーキングGSの明示的分解条件が得られ、XYZ$スピン系に対してそれらを一般化する。
また,各階層の総占有数が保存されている場合に生じる,Nn-1$に比例して高い縮退率を有する多臨界因子化点を同定した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 05:25:49 GMT)
Global entanglement in a topological quantum phase transition [0.0] 非線形摂動を伴う北エフトーリック符号ハミルトニアンのトポロジカル量子相転移(TQPT)について検討する。
大域的絡み合いは、トポロジカル相の最大値から磁化相の0への連続的かつ鋭い遷移を示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:32:59 GMT)
Generative Adversarial Networks for the fast simulation of the Time
Projection Chamber responses at the MPD detector [0.0] このような高速シミュレーションモデルの基礎として,GAN(Generative Adversarial Networks)の適用性を示す。
我々のプロトタイプであるGANベースのTPCモデルは、詳細なシミュレーションに比べて桁違いに高速に動作します。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 14:31:50 GMT)
Generation of Photon Pairs by Stimulated Emission in Ring Resonators [0.0] 3階パラメトリックダウンコンバージョン(TOPDC)は、ポンプ光子が光子三重項に変換する非線形相互作用のクラスを指す。
我々は、StTOPDCを量子相関光子対の生成に利用できることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:23:32 GMT)
Generation of Maximally Entangled States by Lyapunov Control Based on
Entanglement Measure [0.0] 最大の絡み合いを持つ量子状態は、量子情報処理において最も高い値を持つ。
現在の方法は2つの大きな欠陥に悩まされている: 最大絡み合った状態の構造を事前に知る必要がある。
本稿では,リアプノフ関数の確立を量子エンタングルメントの尺度に基づく改良型量子リアプノフ制御法を提案する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:36:09 GMT)
Generation and Simulation of Synthetic Datasets with Copulas [0.0] 本稿では,数値変数あるいは分類変数からなる合成データセットを生成するための完全かつ信頼性の高いアルゴリズムを提案する。
我々の方法論を2つのデータセットに適用すると、SMOTEやオートエンコーダといった他の手法よりも優れたパフォーマンスが得られる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:22:44 GMT)
Generating Scientific Articles with Machine Learning [0.0] 本稿では,学術論文のデータセットに基づいて,機械学習を用いて科学論文を生成する手法を提案する。
この方法は、機械学習アルゴリズムを用いて、科学論文の構造と、科学論文からなるトレーニングデータの集合を学習する。
生成した記事と手書き記事の集合を比較することで,提案手法の性能を評価する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:01:04 GMT)
General properties of fidelity in non-Hermitian quantum systems with PT
symmetry [0.0] フィデリティ・サセプティビリティ(fidelity susceptibility)は、エルミート凝縮物質系の量子相転移を研究するためのツールである。
PT対称状態に対して、$mathcalF$は常に実数であることが示される。
また、PT対称状態とPT破壊状態の間の忠実度が$mathrmRemathcalF=frac12$であることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 16:45:11 GMT)
Gaussian states and operations -- a quick reference [0.0] このノートはガウス状態の位相空間計算を行うための簡潔な参照として機能する。
特に、よく用いられる光学演算に対するシンプレクティック変換を列挙する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 11:08:54 GMT)
First principles study of the T-center in Silicon [0.0] 励起状態は、電子が占有する局所的欠陥状態からなる欠陥束縛励起子によって形成される。
欠陥バウンドエキシトンに対する放射寿命は、$mu$sの順序で計算される。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 20:32:57 GMT)
Fermion-Parity-Based Computation and its Majorana-Zero-Mode
Implementation [0.0] マヨラナゼロモード(MZM)は、位相的に保護されたフェルミオン量子計算のプラットフォームを約束する。
FPBC(Fermion-parity-based calculation)は、効率のよい古典的処理を用いて、利用可能なMZMの数を事実上増加させる。
FPBCは全てのMZMパリティを計測する必要があるが、提案されたMZMハードウェアの制約と矛盾する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:19:49 GMT)
Experimental activation of strong local passive states with quantum
information [0.0] 強い局所性は多部量子系の性質であり、そこからエネルギーを局所的に抽出することは不可能である。
いわゆる「量子エネルギーテレポーテーション(quantum energy teleportation)」プロトコルを通じて、システムの異なるパーティション間の古典的な通信を追加することで、強い局所受動的状態の局所的なエネルギーを活性化することができる。
本稿では、強い局所受動的状態の活性化と、二部量子系における核磁気共鳴を用いた量子エネルギーテレポーテーションプロトコルの実証の両方を初めて実験的に実現したことを報告する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 13:00:31 GMT)
Electric Field Decay Without Pair Production: Lattice, Bosonization and
Novel Worldline Instantons [0.0] 我々は、大質量シュウィンガーモデルを用いて、電場が円周$Ld$のコンパクトな方向に向けられるときの電場の量子進化について研究する。
我々は、以前の全ての推定に反する新しい物理結果をもたらす新しい、以前は未知のインスタント粒子の集合を発見した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:59:20 GMT)
Dynamical Casimir effects with atoms: from the emission of photon pairs
to geometric phases [0.0] この新興分野の最近の進歩は、近代物理学の非自明な側面の間の前例のないつながりを明らかにしている。
運動する基底状態原子と量子電磁場との結合は、いくつかの興味深い現象の起源である。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:19:12 GMT)
Does Audio Deepfake Detection Generalize? [0.0] 我々は、関連する作業からアーキテクチャを再実装し、一様に評価することで、音声スプーフィング検出をシステム化する。
有名人や政治家のオーディオ録音を37.9時間記録したデータセットを新たに公開し、そのうち17.2時間がディープフェイクである。
これは、コミュニティがASVSpoofベンチマークに近づきすぎており、ディープフェイクが以前考えられていたよりもラボ外で検出するのがずっと難しいことを示唆しているかもしれない。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:48:22 GMT)
Data-driven Prediction of Relevant Scenarios for Robust Optimization [0.0] 離散的な不確実性集合を持つロバストな1段階と2段階の問題について検討する。
本稿では,一連の開始シナリオで反復解法をシード化するデータ駆動型計算を提案する。
実験の結果,提案手法によって少数の優れたスタートシナリオを予測しても,反復的手法の時間を大幅に短縮できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:52:29 GMT)
Contribution of the Temperature of the Objects to the Problem of Thermal
Imaging Focusing [0.0] 画像に焦点を合わせるとき、被写体から被写体までの距離、被写界深度、開口度、距離は、可視光スペクトルと赤外線スペクトルの両方を考慮に入れなければならない。
さらに, 熱スペクトルの集束問題は, 物体自体の温度(および/またはシーン)にもほとんど依存しないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 07:28:13 GMT)
Code Switched and Code Mixed Speech Recognition for Indic languages [0.0] 多言語自動音声認識(ASR)システムの訓練は、音響情報と語彙情報が典型的には言語固有のものであるため困難である。
言語識別(LID)に基づく一言語モデルとエンドツーエンドの多言語音声認識システムの性能を比較した。
また,Hindi- English と Bengali- English の相似解法を提案し,それぞれ 21.77 と 28.27 の WER を実現する。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:09:28 GMT)
Can in-home laboratories foster learning, self-efficacy, and motivation
during the COVID-19 pandemic? -- A case study in two engineering programs [0.0] 本研究では,工学における問題ベース学習(PBL)と家庭内研究室に基づく教育方法論を提案する。
この手法は, 電子工学科(n=44)の学生を対象に, 2020年中に2段階に分けて実施された。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 17:03:33 GMT)
Calibrating constitutive models with full-field data via physics
informed neural networks [0.0] 実フィールド変位データに基づくモデルパラメータ化の発見のための物理インフォームド深層学習フレームワークを提案する。
我々は、ニューラルネットワークの予測に物理的な制約を課すために、強い形式ではなく、支配方程式の弱い形式で作業する。
我々は、インフォメーション機械学習が実現可能な技術であり、モデルのキャリブレーションにフルフィールド実験データをどのように利用するかというパラダイムを変える可能性があることを実証した。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 18:07:44 GMT)
Biclustering Algorithms Based on Metaheuristics: A Review [0.0] Biclusteringは、データマトリックス内の行と列を同時にクラスタする、教師なしの機械学習技術である。
重要な双クラスターを見つけることは最適化問題として定式化できるNPハード問題である。
複雑な最適化問題を妥当な時間で解く探索能力のために、様々なメタヒューリスティックが双クラスタリング問題に適用されている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 12:16:32 GMT)
Automated Thermal Screening for COVID-19 using Machine Learning [0.0] 厳格なガイドラインと新型コロナウイルスのスクリーニングは、新型コロナウイルスの感染拡大の抑制に役立っている。
従来のアプローチでは、視覚カメラ画像から顔とマスクを識別し、熱画像カメラから温度値を取り出す。
本稿では、顔とマスクの検出とその後の温度スクリーニングを非侵襲的に行うための、サーマルビデオストリーム上での機械学習の利用について論じる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 10:23:06 GMT)
Artificial Intelligence: Framework of driving triggers to past, present
and future applications and influencers of industry sector adoption [0.0] この論文は、AIの最大の変化を強調し、これらの技術がいくつかの主要産業に適用されている例を示す。
研究は、コスト、スピード、正確性、多様性/包摂性、そしてAIを不可欠な変革技術へと推進する学際的な研究/コラボレーションといった、駆動的なトリガーを調査している。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 21:39:28 GMT)
An Overview of Indian Language Datasets used for Text Summarization [0.0] 低リソース言語 (LRL) であるインドランゲージ (IL) におけるテキスト要約 (TS) データセットを調査した。
インド言語テキスト要約(ILTS)データセットのプールは増加するのか、それとも深刻なリソース不足があるのか?
ILTSと英語のデータセットの調査では、2つの類似点と1つのコントラストが明らかになった。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 08:09:36 GMT)
A new parameterized monogamy relation between entanglement and equality [0.0] 通常の不等式よりもモノガミー等式はモノガミー重みに基づいて提示される。
非加法的絡み合いの度に複数の状態のコピーを考慮し、モノガミー関係を復元できることを示す。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 19:27:59 GMT)
A meta-probabilistic-programming language for bisimulation of
probabilistic and non-well-founded type systems [0.0] 本稿では,プログラムとプログラムが組み込まれている型システムの両方を表現可能な,確率的プログラミングのための形式メタ言語を提案する。
我々は、我々のアプローチを形式化するために、立方体型理論と依存型メタグラフの枠組みを描いている。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 01:07:37 GMT)
A Unified Cosmological Dark Sector from a Bose-Einstein Condensate [0.0] 光ボソンのボース・アインシュタイン凝縮体(BEC)から宇宙の暗黒面の統一的な画像を記述する可能性について検討する。
BECのエネルギー密度は、その量子ポテンシャルとともに、実際にそのような統一を説明できる。
論文参考訳(メタデータ) (Wed, 30 Mar 2022 15:34:20 GMT)