Being Comes from Not-being: Open-vocabulary Text-to-Motion Generation
with Wordless Training [178.1] 本稿では、ゼロショット学習方式でオフラインのオープン語彙テキスト・トゥ・モーション生成について検討する。
本手法では,入力テキストをマスクした動作に再構成することで,動作生成者の動作を再構築する。
テキスト・ツー・プレイス・ジェネレータの最適化を監督するために,テキストと3Dポーズのアライメントを測定するための最初のテキスト・プレイス・アライメント・モデルを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:36:45 GMT)
Computationally Budgeted Continual Learning: What Does Matter? [128.1] CL (Continuous Learning) は、新しいデータに適応しながら、以前の知識を保存し、分布の異なる入力データのストリーム上でモデルを逐次訓練することを目的としている。
現在のCL文献では、以前のデータへのアクセス制限に焦点が当てられているが、トレーニングの計算予算に制約は課されていない。
本稿では,この問題を大規模ベンチマークで再検討し,計算制約条件下での従来のCL手法の性能解析を行う。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:50:27 GMT)
Urban Regional Function Guided Traffic Flow Prediction [117.8] メタデータとして各領域の機能を利用するPOI-MetaBlockという新しいモジュールを提案する。
我々のモジュールはトラフィックフロー予測の性能を大幅に改善し、メタデータを使用する最先端の手法より優れています。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:52:57 GMT)
Tangent Bundle Convolutional Learning: from Manifolds to Cellular
Sheaves and Back [114.0] この畳み込み操作に基づいて,タンジェントバンドルフィルタとタンジェントバンドルニューラルネットワーク(TNN)を定義する。
タンジェントバンドルフィルタは、スカラー多様体フィルタ、グラフフィルタ、標準畳み込みフィルタを連続的に一般化するスペクトル表現を許容する。
提案したアーキテクチャが様々な学習課題に与える影響を数値的に評価する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:57:15 GMT)
Picture that Sketch: Photorealistic Image Generation from Abstract
Sketches [109.7] この論文は、あなたや私のような訓練を受けていないアマチュアの抽象的で変形した普通のスケッチから、それをフォトリアリスティックなイメージに変えます。
まず、エッジマップのようなスケッチを指示するのではなく、抽象的なフリーハンドな人間のスケッチで作業することを目指しています。
そうすることで、スケッチから写真までのパイプラインを民主化し、スケッチがどれだけよいかに関わらず、スケッチを"写真化"します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:49:03 GMT)
A Unified Framework of Policy Learning for Contextual Bandit with
Confounding Bias and Missing Observations [108.9] 本研究では,観測データを用いた最適ポリシの獲得を目的とした,オフラインのコンテキスト的帯域幅問題について検討する。
本稿では、積分方程式系の解として報酬関数を形成するCausal-Adjusted Pessimistic(CAP)ポリシー学習という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:17:31 GMT)
ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.5] まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:06:14 GMT)
Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings [100.0] 本研究では,スケッチを弱いラベルとして使用して,画像中の有能な物体を検出する方法について検討する。
これを実現するために,与えられた視覚写真に対応する逐次スケッチ座標を生成することを目的としたフォト・ツー・スケッチ生成モデルを提案する。
テストは、私たちの仮説を証明し、スケッチベースの唾液度検出モデルが、最先端技術と比較して、競争力のあるパフォーマンスを提供する方法を明確にします。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:46:46 GMT)
Semantic segmentation of surgical hyperspectral images under geometric
domain shifts [97.7] 本稿では、幾何学的アウト・オブ・ディストリビューション(OOD)データの存在下で、最先端のセマンティックセグメンテーションネットワークを初めて分析する。
有機移植(Organ transplantation)と呼ばれる専用の拡張技術により、一般化可能性にも対処する。
提案手法は,SOA DSCの最大67 % (RGB) と90% (HSI) を改善し,実際のOODテストデータ上での分配内性能と同等の性能を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:50:07 GMT)
MM-REACT: Prompting ChatGPT for Multimodal Reasoning and Action [96.3] MM-REACTは、マルチモーダル推論とアクションを達成するために、ChatGPTとビジョンエキスパートのプールを統合するシステムパラダイムである。
MM-REACTのプロンプト設計により、言語モデルはマルチモーダル情報を受け入れ、関連づけ、処理することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:31:47 GMT)
3D Concept Learning and Reasoning from Multi-View Images [96.3] 3次元多視点視覚質問応答のための大規模ベンチマーク(3DMV-VQA)を提案する。
このデータセットは、約5kのシーンと600kのイメージで構成され、50kの質問と組み合わせられている。
本稿では,ニューラルネットワーク,2次元事前学習型視覚言語モデル,ニューラル推論演算子をシームレスに組み合わせた新しい3次元概念学習・推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:49 GMT)
Large Selective Kernel Network for Remote Sensing Object Detection [96.3] 我々はLarge Selective Kernel Network (LSKNet)を提案する。
LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。
2022年、グレーターベイエリア国際アルゴリズムコンペティションで2位となった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:11:05 GMT)
Denoised MDPs: Learning World Models Better Than the World Itself [94.7] 本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:46:14 GMT)
Leaping Into Memories: Space-Time Deep Feature Synthesis [93.1] 時空モードで特徴を符号化するアーキテクチャに依存しない手法を提案する。
固定時空モデルを作成し、ランダムノイズを伴う刺激映像を反復的に最適化する。
我々は,Kineetics-400で訓練された多種多様な進化的アテンションに基づくアーキテクチャを反転させることにより,LEAPSの適用性を定量的に定性的に評価する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:07:49 GMT)
Open-World Pose Transfer via Sequential Test-Time Adaption [92.7] 典型的なポーズ転送フレームワークは、通常、識別モデルをトレーニングするために代表的データセットを使用する。
テスト時間適応(TTA)は、自己スーパービジョンで本質的な特徴を学習する事前学習モデルを使用することで、OODデータに対して実現可能なソリューションを提供する。
実験では、まず、Tiktokの再現や有名人による動き合成など、オープンワールドの応用に、ポーズ転送が適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:01:23 GMT)
Robustifying Token Attention for Vision Transformers [91.9] ビジョントランスフォーマー(ViT)は、一般的な汚職の存在下でも精度が著しく低下している。
本稿では,2つの一般的な手法を用いて,より注意を安定させる2つの手法を提案する。
まず,Token-Aware Average Pooling (TAP)モジュールは,各トークンの局所的近傍に注意機構に参加することを奨励する。
第二に、出力トークンは、ほんの少しだけに集中するのではなく、多様な入力トークンの集合から情報を集約するように強制する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:04:40 GMT)
TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.5] 本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:12:55 GMT)
Active Exploration for Inverse Reinforcement Learning [89.4] Inverse Reinforcement Learning (AceIRL) のための新しいIRLアルゴリズムを提案する。
AceIRLは、専門家の報酬関数を素早く学習し、良い政策を特定するために、未知の環境と専門家のポリシーを積極的に探求する。
我々はシミュレーションにおいてAceIRLを実証的に評価し、より単純な探索戦略よりも著しく優れていることを発見した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:38:19 GMT)
A Simple Framework for Open-Vocabulary Segmentation and Detection [85.2] 我々は,異なるセグメンテーションと検出データセットから共同で学習する,シンプルなオープン語彙検出フレームワークOpenSeeDを提案する。
まず、事前学習されたテキストエンコーダを導入し、視覚概念を2つのタスクにエンコードし、それらの共通意味空間を学習する。
プレトレーニング後,本モデルでは,セグメンテーションと検出の両方において,競争力あるいは強いゼロショット転送性を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:52:40 GMT)
EqMotion: Equivariant Multi-agent Motion Prediction with Invariant
Interaction Reasoning [83.1] 不変相互作用推論を用いた効率的な同変運動予測モデルであるEqMotionを提案する。
提案モデルに対して,粒子動力学,分子動力学,人体骨格運動予測,歩行者軌道予測の4つの異なるシナリオで実験を行った。
提案手法は4つのタスクすべてに対して最先端の予測性能を実現し,24.0/30.1/8.6/9.2%改善した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:23:46 GMT)
Graphics Capsule: Learning Hierarchical 3D Face Representations from 2D
Images [82.5] Inverse Graphics Capsule Network (IGC-Net) を提案する。
IGC-Netはまずオブジェクトをセマンティック一貫性のある部分レベルの記述の集合に分解し、それらをオブジェクトレベルの記述に組み立てて階層を構築する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:32:55 GMT)
Plug-and-Play VQA: Zero-shot VQA by Conjoining Large Pretrained Models
with Zero Training [82.3] ゼロショットVQAのためのモジュラーフレームワークであるPlug-and-Play VQA(PNP-VQA)を提案する。
まず質問誘導画像キャプションを生成し,そのキャプションを質問応答のコンテキストとしてPLMに渡す。
PNP-VQAはゼロショットVQAv2およびGQAの最先端結果を達成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:55:26 GMT)
Predictive Inference with Feature Conformal Prediction [80.8] 本稿では,特徴空間への共形予測の範囲を拡大する特徴共形予測を提案する。
理論的観点からは、特徴共形予測は軽度の仮定の下で正則共形予測よりも確実に優れていることを示す。
提案手法は,バニラ共形予測だけでなく,他の適応共形予測手法と組み合わせることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:44:46 GMT)
Attention Disturbance and Dual-Path Constraint Network for Occluded
Person Re-Identification [79.3] 本稿では,アテンションネットワークの一般化を促進するために,ADP(Attention disturbance and Dual-Path Constraint Network)を提案する。
実世界の障害物を模倣するため,攻撃音を発生させるアテンション外乱マスク(ADM)モジュールを導入する。
我々はまた、全体像から望ましい監視情報を得ることができるデュアルパス制約モジュール(DPC)を開発した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:56:35 GMT)
Inversion-Based Style Transfer with Diffusion Models [78.9] 以前の任意の例として誘導された芸術的画像生成法は、しばしば形状変化の制御や要素の伝達に失敗する。
画像のキー情報を効率よく正確に学習できるインバージョンベースのスタイル転送手法(InST)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:32:01 GMT)
VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking [78.3] 完全スパース3次元物体検出のためのVoxelNextを提案する。
私たちの中核となる洞察は、手作りのプロキシに頼ることなく、スパースボクセル機能に基づいてオブジェクトを直接予測することです。
私たちの強力なスパース畳み込みネットワークVoxelNeXtは、voxelの機能を通して3Dオブジェクトを検出し、追跡します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:40:44 GMT)
Contextual Bandits with Packing and Covering Constraints: A Modular
Lagrangian Approach via Regression [77.9] 本稿では,アルゴリズムが全消費の線形制約を受ける複数の資源を消費する,文脈的帯域幅の変形について考察する。
我々は, 単純で計算効率が良く, 後悔の欠如を認める新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:13:29 GMT)
Numerically assisted determination of local models in network scenarios [77.3] 統計的振る舞いを再現する明示的な局所モデルを見つけるための数値ツールを開発する。
グリーンベルガー・ホルン・ザイリンガー(GHZ)およびW分布の臨界振動性に関する予想を提供する。
開発されたコードとドキュメントは、281.com/mariofilho/localmodelsで公開されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:18:01 GMT)
Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9] 基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:19:36 GMT)
M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.1] 医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:26:49 GMT)
Imitating Graph-Based Planning with Goal-Conditioned Policies [72.6] 本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:51:10 GMT)
Open-vocabulary Panoptic Segmentation with Embedding Modulation [71.2] オープン語彙のイメージセグメンテーションは、現実世界における重要な応用のために注目を集めている。
従来のクローズド・ボキャブラリ・セグメンテーション法は、新しいオブジェクトを特徴づけることができないが、最近のいくつかのオープン・ボキャブラリ試みは、満足のいく結果を得る。
オープン語彙パノプトンのための全能的でデータ効率のよいフレームワークであるOPSNetを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:58:48 GMT)
Make Landscape Flatter in Differentially Private Federated Learning [69.8] 本稿では,DPの負の影響を軽減するために勾配摂動を利用するDP-FedSAMという新しいDPFLアルゴリズムを提案する。
具体的には、DP-FedSAMは、より優れた安定性と重みのある局所平坦度モデルを生成する。
提案アルゴリズムは,DPFLの既存のSOTAベースラインと比較して,最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:27:36 GMT)
GLEN: General-Purpose Event Detection for Thousands of Types [69.6] 我々は,3,465種類のイベントを対象とする汎用イベント検出データセットGLENを構築した。
GLENはDWD Overlayを利用して作成され、Wikidata QnodesとPropBankのロールセット間のマッピングを提供する。
また,GLENにおける大きなオントロジーサイズと部分ラベルを扱うために設計された,新しい多段階イベント検出モデルを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:40:15 GMT)
Learning to Generate 3D Representations of Building Roofs Using
Single-View Aerial Imagery [68.4] 本研究では,空撮画像から建物屋根メッシュの条件分布を学習するための新しいパイプラインを提案する。
同一物体の複数の画像を必要とする代替手法とは違って,本手法では,一つの画像のみを用いて予測を行う3次元屋根メッシュを推定できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:47:05 GMT)
CLIP goes 3D: Leveraging Prompt Tuning for Language Grounded 3D
Recognition [67.9] CG3D(CLIP Goes 3D)と呼ばれる新しいフレームワークを提案する。
我々は、事前学習したCG3Dフレームワークを広範囲にテストし、ゼロショット、オープンシーン理解、検索タスクにおいてその印象的な能力を実証した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:52:24 GMT)
Toward a realistic model of speech processing in the brain with
self-supervised learning [67.7] 生波形で訓練された自己教師型アルゴリズムは有望な候補である。
We show that Wav2Vec 2.0 learns brain-like representations with little as 600 hours of unlabelled speech。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:11:41 GMT)
Consistent 3D Hand Reconstruction in Video via self-supervised Learning [67.6] 本稿では,モノクロ映像から高精度で一貫した3Dハンドを再構築する手法を提案する。
検出された2次元手指キーポイントと画像テクスチャは、3次元手の形状とテクスチャに関する重要な手がかりを提供する。
自己監督型3Dハンド再構成モデルであるS2HAND$を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:28:10 GMT)
Decoupling Human and Camera Motion from Videos in the Wild [67.4] 本研究では,野生の映像から地球規模の人間の軌道を再構築する手法を提案する。
カメラと人間の動きを分離することで、人間を同じ世界座標系に配置することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:11:45 GMT)
DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.0] ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:22:09 GMT)
Sionna RT: Differentiable Ray Tracing for Radio Propagation Modeling [65.2] Sionnaは、リンクレベルのシミュレーションのためのGPUアクセラレーションされたオープンソースライブラリである。
電波伝搬シミュレーションのための微分可能なレイトレーサ(RT)を統合する。
本稿では,Sionna RTの主要なコンポーネントについて概説する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:40:11 GMT)
Sionna: An Open-Source Library for Next-Generation Physical Layer
Research [64.8] Sionnaは、レイカーネルに基づいたリンクレベルシミュレーションのためのGPUアクセラレーションされたオープンソースライブラリである。
Sionnaは、ベンチマークやエンドツーエンドのパフォーマンス評価に使用できる、注意深くテストされた最先端のアルゴリズムを幅広く実装している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:51:38 GMT)
Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.7] 我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:28:15 GMT)
PanGu-{\Sigma}: Towards Trillion Parameter Language Model with Sparse
Heterogeneous Computing [64.5] PanGu-SigmaはAscend 910 AIプロセッサとMindSporeフレームワークのクラスタでトレーニングされている。
さまざまな中国のNLPダウンストリームタスクのゼロショット学習において、最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:39:27 GMT)
Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.5] 本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:34:05 GMT)
MATE: Masked Autoencoders are Online 3D Test-Time Learners [63.4] MATEは3Dデータ用に設計された最初のTTT(Test-Time-Training)手法である。
テストデータで発生する分散シフトに対して、ポイントクラウド分類のためにトレーニングされたディープネットワークを堅牢にする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:44:58 GMT)
AugGPT: Leveraging ChatGPT for Text Data Augmentation [59.8] 本稿では,ChatGPT(AugGPT)に基づくテキストデータ拡張手法を提案する。
AugGPTはトレーニングサンプルの各文を、概念的には似ているが意味的に異なる複数のサンプルに言い換える。
数ショットの学習テキスト分類タスクの実験結果は、提案したAugGPTアプローチの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:39:47 GMT)
Efficient site-resolved imaging and spin-state detection in dynamic
two-dimensional ion crystals [58.7] 量子コンピューティング、シミュレーション、センシングにおいて、個々の捕捉されたイオンのスピン状態を高い忠実度で解き明かすことは、幅広い分野の応用にとって重要である。
トラップ領域に100個以上のイオンを閉じ込めた大型2次元(2次元)結晶において,新しいハードウェア検出器と人工ニューラルネットワークを組み合わせた高忠実度状態判別法について報告する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:30:18 GMT)
Contracting Skeletal Kinematic Embeddings for Anomaly Detection [58.7] 効率的なグラフ畳み込みネットワークにより骨格運動を符号化する新しいモデルであるCOSKADを提案する。
我々は、COSKADの3つの潜在空間設計を解析する: 一般的に付加されるユークリッドと、新しい球面半径と双曲体積である。
3つの変種はいずれも、シャンガイ技術センター、アベニュー、最新のUB正規データセットなど、ビデオベースの技術を含む最先端技術よりも優れている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:29:04 GMT)
Latent Video Diffusion Models for High-Fidelity Long Video Generation [58.3] 低次元ラテント空間を用いた軽量映像拡散モデルを提案する。
また,1000フレーム以上の長編動画を生成できるように,遅延空間における階層的拡散も提案する。
我々のフレームワークは、以前の強力なベースラインよりもリアルで長いビデオを生成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:29:45 GMT)
Code-Switching Text Generation and Injection in Mandarin-English ASR [57.6] 業界で広く使われているストリーミングモデルTransformer-Transducer(T-T)の性能向上のためのテキスト生成とインジェクションについて検討する。
まず、コードスイッチングテキストデータを生成し、テキスト-to-Speech(TTS)変換または暗黙的に音声とテキストの潜在空間を結び付けることによって、T-Tモデルに生成されたテキストを明示的に注入する戦略を提案する。
実際のマンダリン・イングリッシュ音声の1,800時間を含むデータセットを用いて訓練したT-Tモデルの実験結果から,生成したコードスイッチングテキストを注入する手法により,T-Tモデルの性能が著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:13:27 GMT)
DehazeNeRF: Multiple Image Haze Removal and 3D Shape Reconstruction
using Neural Radiance Fields [56.3] DehazeNeRFは,湿潤な環境下で頑健に動作するフレームワークとして紹介する。
提案手法は,複数視点のヘイズ除去,新しいビュー合成,既存手法が失敗する3次元形状再構成を成功させるものである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:03:32 GMT)
Towards an AI-enabled Connected Industry: AGV Communication and Sensor
Measurement Datasets [55.7] 産業用テストベッドにおける2つの無線計測キャンペーン:産業用車車間(iV2V)と産業用車間(iV2I+)について述べる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:41:37 GMT)
Explicit Visual Prompting for Low-Level Structure Segmentations [55.5] 我々はExplicit Visual Prompting(EVP)という新しいビジュアルプロンプトモデルを提案する。
EVPは、同じ量のチューナブルパラメータの下で、他のパラメータ効率のチューニングプロトコルを著しく上回る。
EVPはまた、様々な低レベル構造セグメンテーションタスクにおける最先端のパフォーマンスも達成している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:01:53 GMT)
Completely Positive Map for Noisy Driven Quantum Systems Derived by
Keldysh Expansion [55.4] ケルディシュ形式に基づくデコヒーレンスモデルを導入する。
また,本手法は数値的に単純であり,CPTPマップを生成する。
我々は、この戦略が量子ビット状態移動およびゲート演算における相関量子ノイズを緩和するパルスを生成することを示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:05:24 GMT)
Mitigating Covertly Unsafe Text within Natural Language Systems [55.3] 制御されていないシステムは、怪我や致命的な結果につながるレコメンデーションを生成する。
本稿では,身体的危害につながる可能性のあるテキストのタイプを識別し,特に未発見のカテゴリを確立する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:33:41 GMT)
Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.4] 本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:54:30 GMT)
Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.2] 提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:33:18 GMT)
A Meta-GNN approach to personalized seizure detection and classification [53.9] 本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:08:30 GMT)
The maximum refractive index of an atomic crystal $\unicode{x2013}$ from
quantum optics to quantum chemistry [52.8] 原子密度関数としての原子配列の順序付けの指数について検討する。
量子光学では、理想的な光-物質相互作用が単一モードの性質を持つことを示す。
量子化学の開始時に、2つの物理機構が非弾性または空間的多モード光散乱過程を開封する方法を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:29:12 GMT)
HiFace: High-Fidelity 3D Face Reconstruction by Learning Static and
Dynamic Details [52.4] HiFaceは、動的かつ静的なディテールで高忠実な3D顔再構成を目指している。
我々は、いくつかの損失関数を利用して、粗い形状と、合成データセットと実世界のデータセットの両方で詳細を共同で学習する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:07:02 GMT)
Model Barrier: A Compact Un-Transferable Isolation Domain for Model
Intellectual Property Protection [52.1] 我々は、CUTIドメイン(Compact Un-TransferableIsolateion Domain)と呼ばれる新しいアプローチを提案する。
CUTIドメインは、権限のないドメインから権限のないドメインへの違法な転送を阻止する障壁として機能する。
CUTIドメインは,異なるバックボーンを持つプラグイン・アンド・プレイモジュールとして容易に実装可能であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:07:11 GMT)
On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.9] セマンティックセグメンテーションキャリブレーションの問題について検討する。
モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。
我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:22:59 GMT)
Adversarial Robustness of Learning-based Static Malware Classifiers [51.4] マルウェア検出は長年、マルウェア作者とアンチウイルスシステムの間で進行中の武器競争の舞台だった。
我々は、ニューラルネットワークベースのマルウェア分類器であるMalConvの文脈において、この武器競争を両面から研究する。
我々は,マルウェアフィールドのバイトレベルのアブレーションを用いて,普遍的敵パッチ攻撃と認証された防御を開発する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:25:22 GMT)
EVA-02: A Visual Representation for Neon Genesis [49.9] EVA-02はトランスフォーマーをベースとした次世代の視覚表現で、頑丈で堅牢な言語対応の視覚機能を再構築するために事前訓練されている。
モデルサイズは6Mから304Mのパラメータで、4種類のEVA-02が提供されています。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:59 GMT)
Localizing Object-level Shape Variations with Text-to-Image Diffusion
Models [49.3] 本稿では,特定の物体の形状の変化を表現した画像の集合を生成する手法を提案する。
オブジェクトのバリエーションを生成する際の特に課題は、オブジェクトの形状に適用される操作を正確にローカライズすることである。
画像空間の操作をローカライズするために,自己注意層と交差注意層を併用する2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:45:08 GMT)
DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 [49.2] 我々は新しいGPT4対応脱識別フレームワーク(DeID-GPT)を開発した。
開発したDeID-GPTは,非構造化医用テキストからの個人情報のマスキングにおいて,高い精度と信頼性を示した。
本研究は,ChatGPTおよびGPT-4を医療用テキストデータ処理および非識別に利用した最初期の1つである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:34:37 GMT)
A Tiny Machine Learning Model for Point Cloud Object Classification [49.2] 我々は,ポイントクラウドオブジェクトのマルチスケール表現を,複雑性低減のための単一スケール表現に置き換える。
我々は、点雲オブジェクトのリッチな3次元幾何情報を利用して性能を向上する。
提案手法は計算量が少ないためGreen-PointHopと名付けられた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:35:46 GMT)
The Science of Detecting LLM-Generated Texts [47.5] 大型言語モデル(LLMs)の出現は、人間によって書かれたテキストとほとんど区別できないテキストの作成につながった。
このことが、誤報の拡散や教育制度の混乱など、このようなテキストの誤用の可能性への懸念を引き起こしている。
本研究の目的は,既存のLLM生成テキスト検出技術の概要を提供し,言語生成モデルの制御と制御を強化することである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:59:41 GMT)
Efficient Map Sparsification Based on 2D and 3D Discretized Grids [47.2] マップが大きくなると、より多くのメモリが必要になり、ローカライゼーションが非効率になる。
以前の地図スペーシフィケーション法は、選択されたランドマークの均一分布を強制するために混合整数計画において二次項を追加する。
本稿では,効率的な線形形式で地図スペーシフィケーションを定式化し,2次元離散格子に基づく一様分布ランドマークを選択する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:49:14 GMT)
Learning Optical Flow from Event Camera with Rendered Dataset [45.4] コンピュータグラフィックスモデルを用いて物理的に正しいイベントフローデータセットを描画する。
特に,Blenderによって室内および屋外の3Dシーンを,リッチなシーン内容のバリエーションで生成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:44:32 GMT)
Benchmarking Robustness of 3D Object Detection to Common Corruptions in
Autonomous Driving [44.8] 既存の3D検出器は、悪天候やセンサーノイズなどによって引き起こされる現実世界の腐敗に対して堅牢性に欠ける。
実世界の運転シナリオを考慮したLiDARとカメラ入力の27種類の共通汚職をベンチマークした。
本研究は,24種類の3次元物体検出モデルを用いた大規模実験を行い,ロバスト性の評価を行った。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:45:54 GMT)
Rotating without Seeing: Towards In-hand Dexterity through Touch [43.9] 本稿では,触覚のみを用いて手動で物体を回転させる手法を提案する。
ロボットハンドの片側をオーバーレイする高密度二分力センサ(タッチまたはタッチなし)を用いた新しいシステム設計を提案する。
シミュレーションにおいて,多種多様な物体に対する強化学習を用いて手動回転ポリシーを訓練する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:38:30 GMT)
Location-Free Scene Graph Generation [43.7] シーングラフ生成(SGG)は、困難な視覚的理解課題である。
シーンにおけるエンティティの検出と、それら間の関係を結合する。
ローカライズラベルの必要性は、アノテーションのコストを大幅に増加させ、より多くのシーングラフデータセットの作成を妨げます。
位置自由なシーングラフ生成を提案することにより,境界ボックスラベルへのシーングラフの依存を断ち切ることを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:57:45 GMT)
A perspective on the current state-of-the-art of quantum computing for
drug discovery applications [43.6] 量子コンピューティングは、現在不可能な計算に到達することで、化学研究の多くの分野における計算能力をシフトすることを約束する。
我々は、最先端量子アルゴリズムのスケーリング特性を簡潔に要約し、比較する。
医薬学的に相関するタンパク質-ドラッグ複合体の、徐々に大きな埋め込み領域をシミュレートする量子計算コストの新たな見積もりを提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:51:39 GMT)
Improved Sample Complexity for Reward-free Reinforcement Learning under
Low-rank MDPs [43.5] 本稿では,低ランクMDPモデルによる報酬なし強化学習に焦点を当てた。
我々はまず、低ランクのMDPの下での任意のアルゴリズムに対して、最初の既知のサンプル複雑性の低い境界を提供する。
次に、RAFFLEと呼ばれる新しいモデルベースアルゴリズムを提案し、$epsilon$-optimal Policyを見つけ、$epsilon$-accurate system IDを実現できることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:39:39 GMT)
Character, Word, or Both? Revisiting the Segmentation Granularity for
Chinese Pre-trained Language Models [42.8] 文字と単語の両方を考慮した混合粒度中国語 BERT (MigBERT) を提案する。
提案するMigBERTだけでなく,既存のPLMを評価するために,中国における様々なNLPタスクについて広範な実験を行った。
MigBERTは、これらすべてのタスクで新しいSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:20:03 GMT)
Revisiting Transformer for Point Cloud-based 3D Scene Graph Generation [41.9] 3次元シーングラフ生成タスクに対して意味グラフ変換器(SGT)を提案する。
我々のSGTはTransformerレイヤをベースビルディングブロックとして使用し、グローバルな情報転送を可能にしています。
我々は、確立された3DSSGベンチマークでSGTをベンチマークし、関係予測のR@50の35.9%の絶対的な改善を達成した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:59:23 GMT)
Contrastive Semi-supervised Learning for Underwater Image Restoration
via Reliable Bank [38.5] 本研究では,未ラベルのデータをネットワークトレーニングに組み込む半教師付き水中画像復元(Semi-UIR)フレームワークを提案する。
まず、信頼度の高い銀行を導入し、「最高の」アウトプットを疑似土台真理として保存する。
完全参照型および非参照型水中ベンチマークによる実験結果から,本アルゴリズムはSOTA法よりも明らかに改善されていることが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:47:14 GMT)
Revisiting Realistic Test-Time Training: Sequential Inference and
Adaptation by Anchored Clustering Regularized Self-Training [37.8] テスト時アンカークラスタリング(TTAC)アプローチを開発し,より強力なテスト時特徴学習を実現する。
自己学習(ST)はラベルのないデータから学ぶ上で大きな成功を収めた。
TTAC++は、5つのTTデータセットの最先端メソッドを一貫して上回る。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:30:18 GMT)
FAQ: Feature Aggregated Queries for Transformer-based Video Object
Detectors [37.4] 我々は,ビデオオブジェクトの検出について異なる視点を採り,より詳しくは,トランスフォーマーベースのモデルに対するクエリのアグリゲーションによる品質向上を図っている。
ImageNet VIDベンチマークでは、提案したモジュールと統合した場合、現在の最先端のTransformerベースのオブジェクト検出器は、mAPでは2.4%以上、AP50では4.2%以上改善できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:54:34 GMT)
Verifiable and Provably Secure Machine Unlearning [37.4] 機械学習は、トレーニング後の機械学習モデルのトレーニングデータセットからポイントを取り除くことを目的としている。
本稿では,機械のアンラーニングシステムの保証を捉えるための,検証可能なアンラーニングの最初の暗号的定義を示す。
我々は、線形回帰、ロジスティック回帰、ニューラルネットワークの実現可能性を検証するために、3つの異なるアンラーニング手法のプロトコルを実装した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:22:58 GMT)
Multitrack Music Transformer [36.9] 短いシーケンス長を維持しながら多様な楽器のセットを表現できる新しいマルチトラック音楽表現を提案する。
提案するMultitrack Music Transformer (MMT) は,最先端システムと同等の性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:01:49 GMT)
Boosting Weakly Supervised Object Detection using Fusion and Priors from
Hallucinated Depth [36.8] 弱教師付き物体検出(WSOD)の性能向上のための増幅器手法を提案する。
言語コンテキストと深さの関係を解析することにより、関心の対象を含む可能性のある境界ボックスの提案を識別するために、深さを計算します。
提案手法は,最新の2つのWSOD法上に実装することで,6つのデータセットに対して評価を行う。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:26:29 GMT)
Versatile Depth Estimator Based on Common Relative Depth Estimation and
Camera-Specific Relative-to-Metric Depth Conversion [36.4] 本稿では,共通相対深度推定器 (CRDE) と多重相対測度変換器 (R2MC) を組み合わせた多目的深度推定器 (VDE) を提案する。
提案されたVDEは、屋内シーンと屋外シーンの両方を含む多様なシーンに対応でき、カメラ当たりのパラメータの増加は1.12%に過ぎなかった。
実験により、VDEは複数のカメラを効果的かつ効率的にサポートし、従来の単一カメラシナリオで最先端の性能を達成できることを示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:19:50 GMT)
Context-faithful Prompting for Large Language Models [36.0] 大言語モデル(LLM)は世界事実に関するパラメトリック知識を符号化する。
パラメトリック知識への依存は、文脈的手がかりを見落とし、文脈に敏感なNLPタスクにおいて誤った予測をもたらす可能性がある。
LLMの忠実度は、慎重に設計したプロンプト戦略により大幅に改善できることを実証する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:54:58 GMT)
NeTO:Neural Reconstruction of Transparent Objects with Self-Occlusion
Aware Refraction-Tracing [35.9] ボリュームレンダリングによる2次元画像から固体透明物体の3次元形状を抽出する新手法NeTOを提案する。
提案手法は, 忠実な復元結果を達成し, 先行作業よりも大きなマージンで性能を向上する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:50:00 GMT)
Query-as-context Pre-training for Dense Passage Retrieval [35.7] 文脈教師付き事前学習を用いて,高密度経路探索の性能向上のための手法が開発されている。
本稿では,クエリ・アズ・コンテクスト事前学習手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:56:39 GMT)
eP-ALM: Efficient Perceptual Augmentation of Language Models [35.6] 本稿では,既存モデルの適応性を向上するための直接的な取り組みを提案し,認識を伴う言語モデルの拡張を提案する。
視覚言語タスクに事前訓練されたモデルを適用するための既存のアプローチは、その効率を妨げているいくつかの重要なコンポーネントに依存している。
総パラメータの99%以上を凍結し,1つの直線射影層のみをトレーニングし,1つのトレーニング可能なトークンのみを予測することにより,我々のアプローチ(eP-ALM)は,VQAとCaptioningの他のベースラインよりも有意に優れていることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:20:34 GMT)
Multi-task Transformer with Relation-attention and Type-attention for
Named Entity Recognition [35.4] 名前付きエンティティ認識(NER)は自然言語処理において重要な研究課題である。
本稿では,エンティティ境界検出タスクを名前付きエンティティ認識タスクに組み込むマルチタスク変換器を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:11:22 GMT)
HMC: Hierarchical Mesh Coarsening for Skeleton-free Motion Retargeting [35.0] 従来の方法では、メッシュ内の固有の局所的な動きを保存できず、高分解能メッシュ間で動きを伝達する。
本稿では,メッシュ表現を粗くすることで,より優れた動き伝達を実現するメッシュ粗大化モジュールを提案する。
提案手法をよく知られた3次元キャラクタデータセットを用いて評価し,点幅のメッシュユークリッド距離において平均25%の改善が得られた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:52:34 GMT)
Legs as Manipulator: Pushing Quadrupedal Agility Beyond Locomotion [34.3] 我々は四足歩行ロボットを訓練し、前脚を使って壁を登り、ボタンを押し、現実世界でオブジェクトインタラクションを行う。
これらのスキルはカリキュラムを用いてシミュレーションで訓練され,提案したsim2real 変種を用いて実世界へ移行する。
我々は,本手法をシミュレーションと実世界の双方で評価し,短距離および長距離のタスクの実行を成功させたことを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:58 GMT)
GraphCFC: A Directed Graph based Cross-modal Feature Complementation
Approach for Multimodal Conversational Emotion Recognition [34.3] Emotion Recognition in Conversation (ERC) は人間とコンピュータのインタラクション(HCI)システムにおいて重要な役割を果たす。
マルチモーダルERCでは、グラフニューラルネットワーク(GNN)は、長距離コンテキスト情報とモーダル間インタラクティブ情報の両方を抽出することができる。
我々は,文脈情報や対話的情報を効率的にモデル化できるグラフベースのクロスモーダル特徴補完(GraphCFC)モジュールを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:34:48 GMT)
MedLocker: A Transferable Adversarial Watermarking for Preventing
Unauthorized Analysis of Medical Image Dataset [34.0] そこで我々は,MedLockerと呼ばれる,医用画像著作権保護のための新しい可視的対角透かし手法を提案する。
提案手法では,透かしロゴの位置と透明度を連続的に最適化することで,目標モデルの性能を低下させる。
各種メインストリームのバックボーン上でのMedLockerの有効性を評価し,2つの糖尿病網膜症検出データセットにおける著作権保護のための敵対的透かしの有効性を検証した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:00:49 GMT)
SimGRACE: A Simple Framework for Graph Contrastive Learning without Data
Augmentation [33.7] 我々は、下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下線下
元のグラフを入力とし、摂動バージョンを持つGNNモデルを2つのエンコーダとして、コントラストに対する2つの相関ビューを得る。
SimGRACEは、一般化可能性、転送可能性、堅牢性の観点から、最先端の手法と比較して、競争力や性能が向上する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:51:38 GMT)
Discovering Interpretable Directions in the Semantic Latent Space of
Diffusion Models [33.3] DDM(Denoising Diffusion Models)は、GAN(Generative Adversarial Networks)の強力な競合相手として登場した。
本稿では,h-spaceの特性について検討し,その中に意味のある意味的方向を求めるための新しい手法を提案する。
私たちのアプローチは、アーキテクチャの変更、テキストベースのガイダンス、CLIPベースの最適化、モデル微調整を必要とせずに適用できます。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:59:32 GMT)
Evaluating Language Models for Knowledge Base Completion [32.9] 教師なし知識ベース補完(KBC)のための言語モデル(LM)が最近提案されている。
我々は,LMのKBCポテンシャルを現実的に評価するための,新しい,より挑戦的なベンチマークデータセットと方法論を導入する。
LMトレーニングにおいて,ほとんどの事実が直接観察されなかった関係においても,LMは驚くほど強い一般化能力を有することがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:14:59 GMT)
Positional Diffusion: Ordering Unordered Sets with Diffusion
Probabilistic Models [32.6] 拡散確率モデルを用いたプラグ・アンド・プレイグラフの定式化を行う。
前方プロセスを用いて、集合内の要素の位置を連続空間内のランダムな位置にマッピングする。
位置拡散は、ノイズ発生過程を逆転させ、アテンションベースのグラフニューラルネットワークを通じて元の位置を復元する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:01:01 GMT)
Diffusion probabilistic modeling of protein backbones in 3D for the
motif-scaffolding problem [32.4] 現在の足場設計のための機械学習技術は、非現実的に小さな足場に限られるか、複数の多様な足場を作り出すのに苦労している。
本稿では,E(3)-同変グラフニューラルネットワークを用いて,多様で長いタンパク質のバックボーン構造の分布を学習することを提案する。
所与のモチーフに条件付き分布からスキャフォールドを効率よくサンプリングするSMCDiffを開発した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:22:03 GMT)
Leapfrog Diffusion Model for Stochastic Trajectory Prediction [32.4] 本稿では,新しい拡散に基づく軌道予測モデルであるLeapfrog Diffusion Model(LED)を提案する。
LEDはリアルタイムで正確で多様な予測を提供する。
LEDは一貫して性能を改善し、NFLでは23.7%/21.9%のADE/FDE改善を達成した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:32:48 GMT)
Text2Tex: Text-driven Texture Synthesis via Diffusion Models [31.8] テキストプロンプトから3Dメッシュの質の高いテクスチャを生成する新しい方法であるText2Texを提案する。
多視点から高分解能な部分的テクスチャを段階的に合成するために,事前に学習した深度認識画像拡散モデルに塗料を塗布する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:02:13 GMT)
SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel
Storage [31.4] 大規模データセットに対する視覚分類器の記憶効率向上のための学習手法を提案する。
私たちのトークンストレージは、JPEG圧縮されたオリジナルの生ピクセルの1%しか必要としない。
ImageNet-1kによる実験結果から,本手法は,他のストレージ効率のトレーニング手法よりも大幅に優れており,大きなギャップがあることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:55:35 GMT)
GeCoNeRF: Few-shot Neural Radiance Fields via Geometric Consistency [31.2] 我々は、幾何認識整合性正規化を伴う数ショット設定でニューラルラジアンス場(NeRF)を正則化する新しいフレームワークを提案する。
本研究では,最新の数発のNeRFモデルと比較して,競争力のある結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:57:52 GMT)
What Makes Sentences Semantically Related: A Textual Relatedness Dataset
and Empirical Study [31.1] 本稿では,5500の英文対を手動で注釈付けしたセマンティックテキスト関連性データセットSTR-2022を紹介する。
文対の関連性に関する人間の直感は信頼性が高く, 繰り返しアノテーションの相関は0.84である。
また, STR-2022は, 文章表現の自動手法や, 下流の様々なNLPタスクに対して有効であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:34:47 GMT)
PASS: Peer-Agreement based Sample Selection for training with Noisy
Labels [30.9] モデルが過度に適合する傾向にあるため、ノイズラベルはディープラーニングにおいて大きな課題となる。
ピアアグリメントに基づく新しいサンプル選択(PASS)を提案する。
次に、合意スコアに自動しきい値付け手法を適用し、クリーンでノイズの多いラベルサンプルを選択する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:35:33 GMT)
I2Edit: Towards Multi-turn Interactive Image Editing via Dialogue [30.8] 本稿では、対話による顔画像編集に焦点を当て、新しいベンチマークデータセットであるMulti-turn Interactive Image Editing (I2Edit)を導入する。
データセットはCelebA-HQデータセット上に構築され、ユーザ編集要求に対応するマルチターンダイアログでアノテートされたイメージを持つ。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:45:58 GMT)
Long-Term Indoor Localization with Metric-Semantic Mapping using a Floor
Plan Prior [30.6] 本稿では,長期オブジェクトベースローカライゼーションを目的としたメートル法セマンティックマップ構築の課題に対処する。
モノラルなRGBフレームからの3次元物体検出,オブジェクトベースのマップ構築,および構築されたマップのグローバルなローカライズに活用する。
オフィスビルにおける地図構築を評価し,同じ環境下で9ヶ月にわたって記録された課題列に対する長期的局所化アプローチを検証した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:33:05 GMT)
Towards Better 3D Knowledge Transfer via Masked Image Modeling for
Multi-view 3D Understanding [30.5] マルチビューカメラによる3D検出は、コンピュータビジョンにおいて難しい問題である。
最近の研究は、事前訓練されたLiDAR検出モデルを利用して、知識をカメラベースの学生ネットワークに転送する。
我々は,LiDARモデルの知識を事前学習のパラダイムに伝達するための拡張幾何マスク画像モデリング(GeoMIM)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:03 GMT)
Greedy Pruning with Group Lasso Provably Generalizes for Matrix Sensing
and Neural Networks with Quadratic Activations [30.5] プルーニングスキームは、大量のパラメータを持つ訓練されたモデルの複雑さを減らすために、実際に広く用いられている。
ラッソ正則化器のスムーズなバージョンで拡張した経験的平均二乗誤差の近似局所最小値について検討した。
二次活性化関数を持つ2層ニューラルネットワークのトレーニングおよびプルーニングの結果を拡張した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:05:44 GMT)
Zero-1-to-3: Zero-shot One Image to 3D Object [30.5] 単一のRGB画像のみを与えられたオブジェクトのカメラ視点を変更するためのフレームワークであるZero-1-to-3を紹介する。
条件拡散モデルは、合成データセットを用いて、相対カメラ視点の制御を学習する。
提案手法は,インターネット規模の事前学習を活用して,最先端の1次元3次元再構成と新しいビュー合成モデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:50 GMT)
T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for
Text-to-Image Diffusion Models [29.3] 我々は、T2Iモデルの内部知識を外部制御信号と整合させるため、シンプルで軽量なT2I-Adapterを学習する。
私たちのT2I-Adapterは、将来性のある生成品質と幅広いアプリケーションを持っています。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:52:26 GMT)
Fcaformer: Forward Cross Attention in Hybrid Vision Transformer [29.1] ハイブリッド・ビジョン・トランス(FcaFormer)のための前方クロスアテンションを提案する。
私たちのFcaFormerは1630万のパラメータと約36億のMACでImagenetの83.1%のトップ-1の精度を実現しています。
これにより、ほぼ半分のパラメータといくつかの計算コストを節約し、蒸留されたEfficientFormerよりも0.7%高い精度を達成できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:43:27 GMT)
Watch or Listen: Robust Audio-Visual Speech Recognition with Visual
Corruption Modeling and Reliability Scoring [29.1] 本稿では,マルチモーダル入力汚職状況下でのAVSR(Audio-Visual Speech Recognition)について述べる。
実生活では、クリーンな視覚入力は必ずしもアクセス可能ではなく、口唇領域やノイズによっても破壊される。
本稿では, 劣化したマルチモーダル入力に対して堅牢な新しいAVSRフレームワークであるAudio-Visual ReliabilityScoreモジュール(AV-RelScore)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:01:45 GMT)
MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation [28.9] MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:04:53 GMT)
Decomposed Prototype Learning for Few-Shot Scene Graph Generation [28.8] 我々は、シーングラフ生成の新しい有望なタスク(SGG: few-shot SGG (FSSGG))に焦点を当てる。
FSSGGは、モデルが以前の知識を素早く伝達し、いくつかの例で新しい述語を認識することを奨励している。
本稿では,新しいDPL(Decomposed Prototype Learning)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:54:26 GMT)
A Survey on Oversmoothing in Graph Neural Networks [27.9] グラフニューラルネットワーク(GNN)のノード機能は、ネットワーク深さの増加とよく似ている。
我々は,ノード特徴に対する適切な類似度尺度の指数収束を公理的に定義する。
我々は、異なるグラフ上のいくつかのオーバースムーシング測度に対して、この振舞いを実証的に示す。
我々は超平滑化の定義を、急速に発展する連続時間GNNの分野に拡張する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:21:29 GMT)
Uncertainty-informed Mutual Learning for Joint Medical Image
Classification and Segmentation [27.7] 本稿では,医療画像解析の信頼性と解釈が可能な新しいUML(Uncertainty-informed Mutual Learning)フレームワークを提案する。
本フレームワークは, 相互学習を不確実性に活用し, 性能向上を図ることを目的として, 共同分類とセグメンテーションタスクに信頼性を導入している。
我々は,より信頼性が高く説明可能な医用画像解析モデルの開発を探求する可能性を持っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:52:12 GMT)
LFACon: Introducing Anglewise Attention to No-Reference Quality
Assessment in Light Field Space [27.2] 本稿では,LFIの角領域に多頭部自己注意機構を導入することにより,「角度注意」という新しい概念を提案する。
これらの注目カーネルは、角的自己アテンションを実現し、グローバルまたは選択的に多角的特徴を抽出し、特徴抽出の計算コストを削減できる。
実験の結果,提案したLFACon測定値は,最先端LFIQA測定値よりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:37:41 GMT)
Bridging Imitation and Online Reinforcement Learning: An Optimistic Tale [27.0] 不完全な専門家によるオフラインのデモンストレーションデータセットを前提として、MDPのオンライン学習パフォーマンスをブートストラップする上で、それを活用するための最善の方法は何か?
Informed Posterior Sampling-based RL (iPSRL)アルゴリズムを最初に提案する。
このアルゴリズムは非現実的であるため、オンラインRLのためのRSVIアルゴリズムと模倣学習を組み合わせたiRLSVIアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:16:25 GMT)
Less is More: Reducing Task and Model Complexity for 3D Point Cloud
Semantic Segmentation [26.9] 新しいパイプラインは、より優れたセグメンテーション精度を達成するために、より少ない地平線アノテーションを必要とする。
Sparse Depthwise Separable Convolutionモジュールは、ネットワークパラメータ数を著しく削減する。
新しいspatio-Temporal Redundant Frame Downsampling (ST-RFD) 法は、トレーニングデータフレームのより多様なサブセットを抽出する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:36:10 GMT)
FedML-HE: An Efficient Homomorphic-Encryption-Based Privacy-Preserving
Federated Learning System [26.8] Federated Learning (FL)は、ローカルデータではなく、ローカルモデルのアップデートを集約することで、分散型エッジデバイス上での機械学習モデルトレーニングを可能にする。
FLサーバがローカルモデルのアップデートにアクセスすると、機密性の高い個人情報が明らかになる可能性があるため、プライバシー上の懸念が生じる。
FedML-HEは,HedML-HEをベースとしたセキュアなアグリゲーションのための最初の実用システムである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:44:35 GMT)
Zero-Shot Noise2Noise: Efficient Image Denoising without any Data [26.8] トレーニングデータやノイズ分布の知識のない単純な2層ネットワークは,低計算コストで高品質な画像のデノーミングを実現することができることを示す。
我々のアプローチはNoss2NoiseとNeighbor2Neighborによって動機付けられ、画素単位の独立ノイズを分解するのにうまく機能する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:40:37 GMT)
A closer look at the training dynamics of knowledge distillation [26.5] 機能マッチングとメートル法学習問題としての知識蒸留の有効性を再考する。
我々は3つの重要な設計決定、すなわち正規化、ソフト最大関数、投影層を検証する。
ImageNetのDeiT-Tiで、77.2%のトップ1の精度を実現しました。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:33:31 GMT)
Self-Correctable and Adaptable Inference for Generalizable Human Pose
Estimation [25.1] 本稿では,ネットワーク予測の一般化問題に対処するために,自己修正可能適応型推論(SCAI)手法を提案する。
提案手法は,人間のポーズ推定の一般化能力と性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:05:24 GMT)
AnimeDiffusion: Anime Face Line Drawing Colorization via Diffusion
Models [24.9] 本稿では,アニメの顔線描画色を自動生成する拡散モデルを用いたAnimeDiffusionという新しい手法を提案する。
我々は31696のトレーニングデータと579のテストデータを含むアニメの顔線描画カラー化ベンチマークデータセットを実行する。
アニメフェース描画のカラー化において,AnimeDiffusionは最先端のGANモデルよりも優れることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:15:23 GMT)
Video Test-Time Adaptation for Action Recognition [24.6] アクション認識システムは、テストデータの予期しない分散シフトに対して脆弱である。
本稿では,ビデオ行動認識モデルの共通分布シフトに対するテスト時間適応を提案する。
提案手法は,既存のテスト時間適応手法よりもかなりの性能向上を示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:48:02 GMT)
Ref-NeuS: Ambiguity-Reduced Neural Implicit Surface Learning for
Multi-View Reconstruction with Reflection [24.2] Ref-NeuSは反射面の重要性を減らして曖昧さを減らすことを目的としている。
本研究では,反射面上での高品質な表面再構成を実現し,その精度を高いマージンで向上することを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:08:22 GMT)
Learning to Explore Informative Trajectories and Samples for Embodied
Perception [24.0] 未知の実施課題に対する知覚モデルの一般化は不十分である。
探索政策を自己管理する3次元意味分布マップを構築した。
そこで本研究では, 意味的分布の不確実性に基づいて, トラジェクトリのハードサンプルを選択することを提案する。
実験により,本手法で微調整した知覚モデルは,他の探索政策で訓練したベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:20:04 GMT)
EvoX: A Distributed GPU-accelerated Library towards Scalable
Evolutionary Computation [23.8] 進化計算(EC)は、比較的小さなスケールで様々な複雑な最適化問題を解く上で有望な可能性を示している。
問題スケールが大きくなるにつれて、ECアルゴリズムは正しく機能するために関数評価の数を増やす必要があることが多い。
分散GPU高速化アルゴリズムライブラリであるEvoXを開発した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:20:22 GMT)
Beyond mAP: Towards better evaluation of instance segmentation [23.6] 平均精度は、ハイリコール範囲における重複予測をペナルティ化しない。
本研究では,空間的およびカテゴリー的両方の重複予測の量を明示的に測定する2つの新しい手法を提案する。
当社のセマンティックソーティングとNMSは,ヘッジド予測を緩和し,APを保存するためのプラグイン・アンド・プレイモジュールとして追加することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:51:09 GMT)
Capabilities of GPT-4 on Medical Challenge Problems [23.4] GPT-4は、訓練や臨床課題の解決を通じて医療上の問題に特化しない汎用モデルである。
本稿では,GPT-4の総合的な評価を医学的能力試験とベンチマーク・データセットで行う。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:18:38 GMT)
Sparse Recovery with Shuffled Labels: Statistical Limits and Practical
Estimators [23.3] 置換行列 $bPitrue$ とスパース信号 $bbetatrue$ をシャッフルラベルから再構成する。
提案した推定器は, 穏やかな条件下で, 基本トラス$(bPitrue, supp(bbetatrue))$が得られることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:14:58 GMT)
DocRED-FE: A Document-Level Fine-Grained Entity And Relation Extraction
Dataset [22.5] 文書レベルのきめ細かいJEREデータセットDocRED-FEを構築した。
具体的には、11の粗粒度型と119の細粒度型を含む階層的なエンティティ型スキーマを使用して、DocREDを手動で再アノテーションします。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:19:58 GMT)
Muscles in Action [22.5] 筋活動を人間の動作表現に組み込むための新しいデータセットである筋行動データセット(MIA)を提示する。
我々は、ビデオから筋の活性化を予測する双方向表現を学び、逆に、筋の活性化から動きを再構築する。
筋肉をコンピュータービジョンシステムに組み込むことで、スポーツ、フィットネス、AR/VRといった仮想人間のよりリッチなモデルが可能になる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:10:22 GMT)
Tubelet-Contrastive Self-Supervision for Video-Efficient Generalization [22.0] 動きに着目した映像表現を学習するための自己教師付き手法を提案する。
我々は、同じローカルモーションダイナミクスを持つビデオ間の類似性を学ぶが、それ以外は異なる外観を持つ。
トレーニング済みビデオの25%しか使用していない場合,本手法では性能が維持される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:31:35 GMT)
Not All Voxels Are Equal: Semantic Scene Completion from the Point-Voxel
Perspective [21.9] セマンティック・シーン・コンプリート(SSC)を再考し,3次元シーンのセマンティック・シーン・コンプリート表現の予測に有用であることを示す。
本稿では,この課題に対する新しいポイント・ボクセル・アグリゲーション・ネットワークを提案する。
我々のモデルは2つのベンチマークにおける最先端の計算を大きなマージンで上回り、入力は深度画像のみである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:30:36 GMT)
Towards Teachable Autotelic Agents [21.7] Teachable Autotelic Agent (TAA) は、内部および教示信号の両方から学習するエージェントである。
本稿では,教育可能な自律エージェントの設計に向けてのロードマップを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:24:01 GMT)
Boosting Semi-Supervised Learning by Exploiting All Unlabeled Data [21.6] 半教師付き学習(SSL)は、大きなラベル付きデータセットへの依存を緩和する大きな可能性を秘めているため、大きな注目を集めている。
エントロピー平均損失(EML)と適応負学習(ANL)の2つの新しい手法を提案する。
これらのテクニックをFixMatchと統合し、シンプルながら強力なフレームワークであるFullMatchを開発します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:44:11 GMT)
Tracker Meets Night: A Transformer Enhancer for UAV Tracking [20.7] 空間チャネルトランスを用いた低照度エンハンサが提案され, 追従手法に先立って接続される。
高レベルタスクを対象としたセマンティックレベルの低照度化を実現するために,新しい空間チャネルアテンションモジュールを提案する。
エンハンスメント工程では、SCTは夜間画像を同時にデノイズし、照明する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:18:52 GMT)
Dyna-DepthFormer: Multi-frame Transformer for Self-Supervised Depth
Estimation in Dynamic Scenes [19.8] シーン深度と3次元運動場を協調的に予測する新しいDyna-Depthformerフレームワークを提案する。
まず,多視点の相関を一連の自己・横断的層を通じて活用し,深度特徴表現の強化を図る。
第2に,動的物体の運動場をセマンティック・プレセプションを使わずに推定するワーピングに基づく運動ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:12:21 GMT)
Cocktail HuBERT: Generalized Self-Supervised Pre-training for Mixture
and Single-Source Speech [19.8] Cocktail HuBERTは、マスク付き擬似音源分離目的を用いて混合音声を一般化する自己教師型学習フレームワークである。
ASRでは69%がWERで、ダイアリゼーションでは31%がDERで、SUPERBでは単一および複数話者タスクで競合する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:07:13 GMT)
Unsupervised Cumulative Domain Adaptation for Foggy Scene Optical Flow [19.6] クリーン・ツー・フォッギー領域のギャップを埋めるために、既存の手法は通常、運動知識をクリーン・フォッジー領域から合成フォッジー領域に転送するためにドメイン適応を採用する。
本稿では,非教師付き累積領域適応光フローフレームワークを提案する。
この統合された枠組みの下で、提案された累積的適応は、クリーンなシーンから実際の霧のシーンへの知識の移行を徐々に進める。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:28:36 GMT)
Imagic: Text-Based Real Image Editing with Diffusion Models [19.1] 我々は、複雑なテキストガイド付きセマンティック編集を1つの実画像に適用できることを実証する。
提案手法は1つの入力画像と1つのターゲットテキストのみを必要とする。
実際のイメージで動作し、追加の入力を必要としない。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:58:50 GMT)
Seven open problems in applied combinatorics [19.0] 応用組合せ論における7つの異なる開問題について論じる。
このコンパイルに関連する応用分野は、量子コンピューティング、アルゴリズム微分、トポロジカルデータ分析、反復法、ハイパーグラフカットアルゴリズム、電力システムである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:45:30 GMT)
Quantum Discord Witness with Uncharacterized Devices [18.8] 任意次元系における未知の双極子状態の量子不協和を観測するために,不特性測定を用いた新しい手法を提案する。
損失耐性やエラー耐性などのデバイス不完全性に対する高いロバスト性の特徴は,本手法が実験的に実現可能であることを示している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:51:53 GMT)
Controllable Ancient Chinese Lyrics Generation Based on Phrase Prototype
Retrieving [18.6] 古代中国語の歌詞を生成する新しい方法(ソンチ)を提案する。
フレーズレトリバーとフレーズコネクタとを備える。
実験結果から,提案手法は高品質な中国語の歌詞を生成できることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:33:06 GMT)
A Self-Distillation Embedded Supervised Affinity Attention Model for
Few-Shot Segmentation [18.4] そこで本研究では,少数ショットセグメンテーションタスクの性能向上のために,自己拡張型教師付きアフィニティアフィニティアテンションモデルを提案する。
我々のモデルは既存の手法と比較して性能を著しく改善する。
COCO-20iデータセットでは、新しい最先端結果が得られる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:53:07 GMT)
Symmetric (Optimistic) Natural Policy Gradient for Multi-agent Learning
with Parameter Convergence [18.4] マルチエージェント学習における自然政策勾配近似のグローバル収束について検討する。
本稿では,複数の標準的なマルチエージェント学習シナリオに対するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:56:49 GMT)
EmoTalk: Speech-driven emotional disentanglement for 3D face animation [18.2] 音声駆動型3D顔アニメーションは、音声の内容と感情にマッチする現実的な表情を生成することを目的としている。
本稿では,3次元表情を豊かに表現するために,音声のさまざまな感情をアンタングルするエンド・ツー・エンドニューラルネットワークを提案する。
我々のアプローチは最先端の手法より優れ、より多様な顔の動きを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:22:04 GMT)
Approximate Newton policy gradient algorithms [18.0] 本稿では, エントロピー正則化を用いたポリシ勾配アルゴリズムに対して, 近似ニュートン法を提案する。
これらのアルゴリズムがニュートン型二次収束を楽しみ、対応する勾配流が最適解に大域的に収束することを証明する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:15:14 GMT)
Learning Detailed Radiance Manifolds for High-Fidelity and 3D-Consistent
Portrait Synthesis from Monocular Image [17.7] 単眼のポートレート画像の新規なビュー合成における重要な課題は、連続的なポーズ変動の下での3次元の一貫性である。
提案する3D-Aware GANに基づく単眼画像に対する3D一貫性のある新規ビュー合成手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:07:21 GMT)
Real-time Semantic Scene Completion Via Feature Aggregation and
Conditioned Prediction [17.5] 本稿では,特徴集約戦略と条件付き予測モジュールを用いたリアルタイムなセマンティックシーン補完手法を提案する。
提案手法は,GTX 1080 Tiの1つのGPU上で110FPSの速度で競合性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:41:50 GMT)
Towards Reliable Neural Machine Translation with Consistency-Aware
Meta-Learning [17.4] 現在のニューラル機械翻訳(NMT)システムは信頼性の欠如に悩まされている。
本稿では,モデルに依存しないメタラーニング(MAML)アルゴリズムをベースとした,一貫性を考慮したメタラーニング(CAML)フレームワークを提案する。
我々は、NIST中国語から英語へのタスク、3つのWMT翻訳タスク、TED M2Oタスクについて実験を行った。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:41:28 GMT)
VIMI: Vehicle-Infrastructure Multi-view Intermediate Fusion for
Camera-based 3D Object Detection [17.2] VIC3Dは、車両と交通インフラの両方から多視点カメラを利用する。
我々は、新しい3Dオブジェクト検出フレームワーク、Vines-Infrastructure Multi-view Intermediate fusion (VIMI)を提案する。
VIMIは15.61%のAP_3Dと21.44%のAP_BEVを新しいVIC3DデータセットであるDAIR-V2X-Cで達成している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:56:17 GMT)
Spatial Attention-based Implicit Neural Representation for Arbitrary
Reduction of MRI Slice Spacing [17.2] 本稿では,MR間隔を任意に削減するための空間注意に基づくインプシットニューラル表現(SA-INR)ネットワークを提案する。
SA-INRは、座標を連続的に3次元空間にサンプリングすることにより、任意のスライス間隔でMR画像を再構成することができる。
HCP-1200データセットと臨床膝関節MRデータセットを用いて本手法の評価を行い,他の方法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:59:51 GMT)
Agent-based Simulation for Online Mental Health Matching [17.0] 我々は、エージェントベースのシミュレーションフレームワークを開発するために、世界最大のオンラインメンタルヘルスコミュニティの1つと協力します。
提案手法は,1対1のチャットにおいて,遅延受容アルゴリズムを用いることで,サポート検索者の体験を著しく改善できることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:04:59 GMT)
Inversion by Direct Iteration: An Alternative to Denoising Diffusion for
Image Restoration [16.5] Inversion by Direct Iteration (InDI)は、教師付き画像復元のための新しい定式化である。
既存の回帰ベースの手法よりもリアルで詳細な画像を生成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:28:17 GMT)
DIME-Net: Neural Network-Based Dynamic Intrinsic Parameter Rectification
for Cameras with Optical Image Stabilization System [16.4] 本稿では,ポーズ推定や3次元再構成をリアルタイムで行うニューラルネットワークによる新しい手法を提案する。
提案する動的内在性ポーズ推定ネットワークをDIME-Netと名付け,3つのモバイルデバイス上で実装およびテストを行った。
いずれの場合も、DIME-Netはリジェクションエラーを少なくとも6,4$%削減できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:45:12 GMT)
TKN: Transformer-based Keypoint Prediction Network For Real-time Video
Prediction [16.3] ビデオ予測のためのトランスフォーマーベースキーポイント予測ニューラルネットワーク(TKN)を提案する。
TKNは、制約付き情報抽出と並列予測スキームによる予測プロセスを向上する教師なし学習手法である。
KTHとHuman3.6データセットに関する大規模な実験は、TKNが既存の方法よりも11倍高速であることを示している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:57:45 GMT)
Efficient Estimation for Longitudinal Network via Adaptive Merging [16.0] 本稿では, 適応型ネットワークマージ, テンソル分解, 点過程の強みを利用した長手ネットワークの効率的な推定手法を提案する。
近隣のスパースネットワークをマージし、観測されたエッジの数を拡大し、推定分散を低減する。
提案手法は,各イテレーションにおける推定誤差の上限を設定することにより,推定を容易にする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:43:44 GMT)
Unsupervised Intrinsic Image Decomposition with LiDAR Intensity [15.7] 固有画像分解(IID)は、自然な画像をアルベドとシェードに分解するタスクである。
本稿では,LiDAR強度(IID-LI)を用いた教師なし固有画像分解法を提案する。
その結果,従来の教師なし学習法より優れている推定精度が得られた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:26:16 GMT)
Conversation Modeling to Predict Derailment [15.5] 進行中の会話が脱線する可能性があるかどうかを予測する能力は、インターロケータやモデレーターに貴重なリアルタイム洞察を提供する可能性がある。
会話が発達するにつれて動的予測を試みようとする研究もあるが、会話構造や脱線距離といった多元的情報を組み込むことは困難である。
本稿では,発話レベルと会話レベルの情報を組み合わせた階層型トランスフォーマーベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:10:45 GMT)
Highly Efficient Real-Time Streaming and Fully On-Device Speaker
Diarization with Multi-Stage Clustering [15.3] 異なる長さの入力に異なるクラスタリングアルゴリズムを使用するマルチステージクラスタリング戦略は、話者ダイアリゼーションアプリケーションの多面的課題に対処することができる。
この戦略は、CPU、メモリ、バッテリの予算が厳しいオンデバイススピーカーダイアリゼーションシステムのストリーミングに不可欠である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:57:50 GMT)
EMC2-Net: Joint Equalization and Modulation Classification based on
Constellation Network [15.2] コンステレーションネットワーク(EMC2-Net)に基づく共同等化・変調分類と呼ばれる新しいMC手法を提案する。
コンステレーション点を画像とみなす以前の研究とは異なり、提案されたEMC2-Netは直接2Dのコンステレーション点を用いてMCを実行する。
異なるチャネルモデル下での線形変調型を用いた数値計算の結果,提案したEMC2-Netは,複雑性を著しく低減した最先端MC技術の性能を実現する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:17:05 GMT)
PartNeRF: Generating Part-Aware Editable 3D Shapes without 3D
Supervision [15.1] PartNeRFは、編集可能な3D形状合成のための部分認識生成モデルであり、明示的な3D監督を必要としない。
我々のモデルは、アフィン変換で拡張された局所的に定義されたNeRFの集合としてオブジェクトを生成する。
これにより、パーツへの変換の適用、異なるオブジェクトからのパーツの混合など、いくつかの編集操作が可能になる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:02:38 GMT)
Self-Supervised Learning for Multimodal Non-Rigid 3D Shape Matching [15.1] 我々は、メッシュベースの関数マップ正規化と、メッシュとポイントクラウドデータを結合する対照的な損失を組み合わせた、自己教師型マルチモーダル学習戦略を導入する。
我々の形状マッチングアプローチは、三角形メッシュ、完全点雲、部分的に観察された点雲のモード内対応を得ることを可能にする。
提案手法は,いくつかの挑戦的なベンチマークデータセットに対して,最先端の結果を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:47:02 GMT)
Reliability in Semantic Segmentation: Are We on the Right Track? [15.0] 我々は、古いResNetベースのアーキテクチャから新しいトランスフォーマーまで、さまざまなモデルを分析します。
近年のモデルでは, 信頼性は著しく高いが, 不確実性評価の点では, 全体として信頼性は高くない。
これは、ロバストネスと不確実性推定の両方に焦点を当てた現代のセグメンテーションモデルに関する最初の研究である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:38:24 GMT)
Deep Nonparametric Estimation of Intrinsic Data Structures by Chart
Autoencoders: Generalization Error and Robustness [14.9] グラフの集合上の低次元の潜在特徴にデータをエンコードするために、チャートオートエンコーダを用いる。
オートエンコーダを訓練することにより、チャートオートエンコーダは入力データを正常な雑音で効果的に識別できることを示す。
特別な場合として、データ多様体が大域的パラメトリゼーションを持つ限り、我々の理論は古典的自己エンコーダにも当てはまる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:30:30 GMT)
Divide and Conquer: 3D Point Cloud Instance Segmentation With Point-Wise
Binarization [14.7] ポイントクラウド上のインスタンスのクラスタリングは、3Dシーン理解にとって重要である。
ほとんどのSOTAは距離クラスタリングを採用しており、通常は有効であるが、隣接するオブジェクトのセグメンテーションではうまく機能しない。
PBNetは各点をバイナライズし,セグメントインスタンスに個別にクラスタ化する。
我々のバイナリクラスタリングでは、オフセットインスタンスポイントを高密度と低密度の2つのカテゴリに分けています。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:05:08 GMT)
Who Is the Strongest Enemy? Towards Optimal and Efficient Evasion
Attacks in Deep RL [14.7] 本稿では,「アクター」と呼ばれる設計関数と「ディレクタ」と呼ばれるRLベースの学習者との協調により,最適な攻撃を見つけるための新たな攻撃手法を提案する。
提案アルゴリズムであるPA-ADは理論上最適であり,大きな状態空間を持つ環境下での従来のRLに基づく作業よりもはるかに効率的である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:43:45 GMT)
Machine Learning Automated Approach for Enormous Synchrotron X-Ray
Diffraction Data Interpretation [14.5] 液体相を含むその場実験において、合成XRDモデルがu-XRDマッピングデータを解くことができるかどうかは不明である。
本研究では,LaCl3-calcite熱水流体系からu-XRDマッピングデータを収集し,実験的なXRDパターンを解くために2つのモデルカテゴリーを訓練した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:47:35 GMT)
Multiscale Structure Guided Diffusion for Image Deblurring [14.5] 拡散確率モデル (DPM) は画像の劣化に用いられている。
暗黙のバイアスとして、単純だが効果的なマルチスケール構造ガイダンスを導入する。
目に見えないデータのアーティファクトが少ないほど、より堅牢なデブロアリング結果を示します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:34:51 GMT)
MXM-CLR: A Unified Framework for Contrastive Learning of Multifold
Cross-Modal Representations [14.4] マルチフォールド・クロスモーダル表現のコントラスト学習のための統合フレームワークMXM-CLRを提案する。
XM-CLRは、異なるモードからインスタンスの多重折りたたみ観測の関係を明示的にモデル化し、学習する。
その結果,マルチフォールドデータの表現性を向上させる上で,MXM-CLRの優位性が示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:51:53 GMT)
Offline-Online Class-incremental Continual Learning via Dual-prototype
Self-augment and Refinement [14.3] 本稿では,オフライン・オンライン・クラス増分継続学習(O$2$CL)という新しい,実用的だが困難な問題について検討する。
これは、データ例をバッファリングすることなく事前訓練された(オフライン)ベースクラスの識別性を維持し、シングルパス(オンライン)データストリームで新しいクラスを継続的に学習することを目的としている。
本稿では,O$2$CL問題に対するDSR(Dual-prototype Self-augment and Refinement Method)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:16:22 GMT)
Memorization Capacity of Neural Networks with Conditional Computation [14.0] 我々は,$O(sqrtn)$ニューロンを用いたニューラルネットワークを用いて,$n$の入力出力関係の集合を記憶できることを実証した。
条件付きReLUネットワークを用いて,入力あたりのO(log n)$演算のみを用いて同じタスクを実現できることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:33:17 GMT)
Sound Localization from Motion: Jointly Learning Sound Direction and
Camera Rotation [14.0] 我々は、頭部を回転させると微妙だが幾何的に一貫した変化を起こす画像と音を使って、カメラの回転と音源の定位を推定する。
視覚モデルは、一対の画像からカメラの回転を予測し、音声モデルは、音源の方向を音から予測する。
これらのモデルをトレーニングして、互いに一致する予測を生成します。
本モデルでは, 実シーンと合成シーンの両方で回転を推定し, 最先端の自己監督手法と競合する精度で音源のローカライズを行う。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:55 GMT)
IMF: Interactive Multimodal Fusion Model for Link Prediction [13.8] 異なるモダリティからの知識を統合するために,インタラクティブ・マルチモーダル・フュージョン(IMF)モデルを導入する。
提案手法は,実世界の複数のデータセットに対する経験的評価によって有効であることが実証された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:20:02 GMT)
An Error-Guided Correction Model for Chinese Spelling Error Correction [13.6] 中国語の綴り訂正を改善するための誤り誘導補正モデル(EGCM)を提案する。
我々のモデルは、最先端のアプローチに対する優れた性能を顕著なマージンで達成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:37:45 GMT)
Towards End-to-End Generative Modeling of Long Videos with
Memory-Efficient Bidirectional Transformers [13.4] 本稿では,ビデオのエンド・ツー・エンド・エンド・ラーニングの長期依存性を考慮に入れたメモリ指向の双方向変換器を提案する。
本手法は,部分的に観察されたパッチからビデオの全時間容積を並列に復号する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:35:38 GMT)
What Makes Data Suitable for a Locally Connected Neural Network? A
Necessary and Sufficient Condition Based on Quantum Entanglement [13.2] 特定の局所的に接続されたニューラルネットワークは、データ分布が低い量子エンタングルメントを許容している場合に限り、データ分布を正確に予測できることを示す。
我々は、局所的に接続されたニューラルネットワークに対するデータ分布の適合性を高めるための前処理手法を導出する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:34:39 GMT)
A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images [13.0] 自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:57:28 GMT)
Graph Neural Rough Differential Equations for Traffic Forecasting [12.9] トラフィック予測は、機械学習の分野で最も人気のある時間的タスクの1つである。
本稿では,グラフニューラル微分方程式(STG-NRDE)の粗解法について述べる。
NRDEは時系列データを処理するための画期的な概念である。その主な概念は、ログ署名変換を使用して時系列サンプルを比較的短い特徴ベクトルに変換することである。
我々は6つのベンチマークデータセットと21のベースラインで実験を行い、STG-NRDEはすべてのケースで最高の精度を示し、21のベースラインを非自明なマージンで上回っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:57:10 GMT)
Deep Digging into the Generalization of Self-Supervised Monocular Depth
Estimation [12.3] 近年,自己監督型単分子深度推定法が広く研究されている。
単眼深度推定の一般化に向けたバックボーンネットワーク(CNN, Transformer, CNN-Transformerハイブリッドモデルなど)について検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:52:42 GMT)
Sandwiched Video Compression: Efficiently Extending the Reach of
Standard Codecs with Neural Wrappers [12.0] 我々は、標準的なビデオにニューラルネットワークをラップするビデオ圧縮システムである、サンドイッチ付きビデオ圧縮を提案する。
フレームワークはニューラルプレプロセッサとポストプロセッサで構成され、その間に標準的なビデオがある。
低解像度HEVCで高解像度映像を転送する場合、サンドイッチシステムは標準HEVCよりも6.5dB改善されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:03:44 GMT)
Exploring Representation Learning for Small-Footprint Keyword Spotting [11.6] KWSの主な課題は、ラベル付きデータと限られたデバイスリソースである。
これらの課題に対処するために、自己指導型コントラスト学習と事前学習モデルによる自己学習によるKWSの表現学習について検討する。
音声コマンドデータセットの実験では、自己学習型WVCモジュールと自己教師型LGCSiamモジュールが精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:09:26 GMT)
DETRs with Collaborative Hybrid Assignments Training [11.6] 我々は、より効率的で効果的なDETRベースの検出器を学習するために、Co-DETRという新しい協調型ハイブリット割り当てトレーニングスキームを提案する。
提案手法の有効性を評価するため, 広範囲な実験を行った。
我々はMS COCOテストデブで64.5%のmAPを実現し、余分なデータサイズをはるかに少なくして優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:11:57 GMT)
Vision Transformer for Action Units Detection [11.5] 本稿では,行動単位検出(AU)の課題に対処するためのビジョントランスフォーマーに基づくアプローチを提案する。
我々はビデオビジョン変換器(ViViT)ネットワークを用いて、映像の時間的顔の変化を捉える。
我々のモデルはABAW 2023チャレンジのベースラインモデルよりも優れており、結果として顕著な14%の違いがある。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:39:32 GMT)
TenCirChem: An Efficient Quantum Computational Chemistry Package for the
NISQ Era [11.2] TenCirChemは、変分量子アルゴリズムをシミュレートするオープンソースのPythonライブラリである。
ユーザーは分子エネルギーを最適化したり、数行のコードで量子力学を研究できる。
TenCirChemはノイズレスとノイズの多い量子回路の両方で高い性能を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:47:45 GMT)
Facial Affect Recognition based on Transformer Encoder and Audiovisual
Fusion for the ABAW5 Challenge [10.9] 本稿では,Valence-Arousal Estimation (VA) Estimation, Expression (Expr) Classification, Action Unit (AU) Detection and Emotional Reaction Intensity (ERI) Estimationの4つのサブチャンジに対する解を提案する。
第5回ABAWコンペティションは、さまざまなモダリティとデータセットを使用した顔認識に焦点を当てている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:17:53 GMT)
Coreset Sampling from Open-Set for Fine-Grained Self-Supervised Learning [10.6] 本稿では,大規模未ラベルのオープンセットが利用可能であるという前提の下で,オープンセットの自己改善型学習問題を新たに導入する。
問題設定では、オープンセットとターゲットデータセットの分布ミスマッチを考慮することが重要である。
実験により,SimCoreは表現学習性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:38:29 GMT)
Privately Fine-Tuning Large Language Models with Differential Privacy [10.5] 事前訓練された大規模言語モデル(LLM)は、複雑なAIタスクにおいてブレークスルーパフォーマンスをもたらす現代のAIの不可欠な部分である。
差分プライバシー(DP)は、トレーニングや微調整 LLM のプロセスにノイズを加えることができる厳格なフレームワークを提供する。
We present ewtune, a DP framework for fine-tuning LLMs based on Edgeworth accountant with finite-sample privacy guarantees。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:33:23 GMT)
Sparse Distributed Memory is a Continual Learner [10.0] 連続学習は、生物学的に解けない人工知能ニューラルネットワークの課題である。
我々は,強力な連続学習者であるMLP(Multi-Layered Perceptron)を改良した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:54:10 GMT)
Relate auditory speech to EEG by shallow-deep attention-based network [10.0] 本稿では,脳波信号を誘発する正しい聴覚刺激を分類するために,SDANet(Shallow-Deep Attention-based Network)を提案する。
アテンションベースの相関モジュール(ACM)を用いて、グローバルな側面から聴覚音声と脳波の関連を見出す。
モデルの堅牢性を高めるために、さまざまなトレーニング戦略とデータ拡張が使用される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:34:22 GMT)
A cavity quantum electrodynamics implementation of the
Sachdev--Ye--Kitaev model [10.0] 本稿では,空洞量子力学プラットフォームにおけるSYKモデルの実現の可能性を提案する。
マルチモード光キャビティに閉じ込められたフェルミオン原子の雲を駆動すると、SYKモデルの物理が得られることを示す。
我々の研究は、スケーラブルなシステムでSYKモデルを実現するための青写真を提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:00:00 GMT)
RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards
Precise Expressions [9.5] 本研究では,生成した画像の正確な表現に向けて,テキストプロンプトを洗練するためのRePromptを開発する。
クラウドソースによる編集戦略に触発されて,名詞の数や具体性などの直感的なテキスト機能をキュレートした。
プロキシモデルのモデル説明を用いて,テキストプロンプトを調整し,正確な感情表現のための画像生成を最適化した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:34:00 GMT)
SRPCN: Structure Retrieval based Point Completion Network [9.5] 構造検索に基づくポイントコンプリートネットワーク(SRPCN)を提案する。
最初はk平均クラスタリングを使用して構造点を抽出し、それを分布に分散し、その後、完全な構造点雲を見つけるための計量としてKLディバージェンス(英語版)が用いられる。
実験により,本手法はより正確な結果が得られ,より強力な一般化能力を有することが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:19:37 GMT)
Hardware-Aware Graph Neural Network Automated Design for Edge Computing
Platforms [9.3] HGNASは、リソース制約エッジデバイスをターゲットにした最初のハードウェア対応グラフニューラルネットワーク検索フレームワークとして提案されている。
その結果、HGNASは、様々なエッジデバイス上でのDGCNNと比較して、無視できる精度の損失で、約10.6倍のスピードアップと8.2%のピークメモリ削減を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:18:31 GMT)
DeepSense 6G: A Large-Scale Real-World Multi-Modal Sensing and
Communication Dataset [9.3] DeepSense 6Gデータセットは、既存のマルチモーダルセンシングと通信データの実際の測定に基づく大規模なデータセットである。
この記事では、DeepSenseデータセット構造、テストベッドの採用、データ収集と処理方法論、デプロイメントシナリオ、サンプルアプリケーションの概要を説明します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:47:14 GMT)
On-the-fly Text Retrieval for End-to-End ASR Adaptation [9.3] 本稿では,部分的ASR仮説に対して,外部テキストコーパスから可算完了を抽出する検索言語モデルを用いてトランスデューサベースのASRモデルを強化することを提案する。
実験の結果,提案モデルにより,一対の質問応答データセット上でのトランスデューサベースラインの性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:54:40 GMT)
Retrieving Multimodal Information for Augmented Generation: A Survey [9.0] このグループは、画像、コード、テーブル、グラフ、オーディオを含む外部ソースから接地コンテキストを取得することに焦点を当てている。
本稿では,様々なモダリティによる検索拡張生成の詳細なレビューを行い,今後の方向性について論じる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:07:41 GMT)
Supercomputing tensor networks for U(1) symmetric quantum many-body
systems [8.9] テンソルネットワークアルゴリズムは 基礎となる量子システムの 固有の対称性を活用できる
我々は、テンソルネットワークアルゴリズムの最先端、グラフィカル処理ユニットアクセラレーション、高並列スーパーコンピュータ実装を提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:33:13 GMT)
Complexity of Gaussian boson sampling with tensor networks [8.9] 我々は、最先端ハードウェアアクセラレーターによる計算時間を著しく短縮するカスタム構築アルゴリズムを開発した。
N_textoutproptosqrtN$は、効率と非効率の古典的シミュレーションの境界を示す入力光子の数において、生き残った光子の数をスケーリングする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:38:59 GMT)
CBA: Contextual Background Attack against Optical Aerial Detection in
the Physical World [8.8] パッチベースの物理的攻撃はますます懸念を喚起している。
既存の手法のほとんどは地上で捕獲された標的を隠蔽することに焦点を当てており、これらの手法のいくつかは単に空中探知機を欺くように拡張されている。
本研究では,空中検出に対する新たな物理的攻撃フレームワークであるコンテキスト背景攻撃(CBA)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:37:57 GMT)
EPiC: Ensemble of Partial Point Clouds for Robust Classification [8.5] 本稿では,部分点クラウドサンプリングに基づく一般的なアンサンブルフレームワークを提案する。
本研究の枠組みは,上位分類網の頑健性を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:56:14 GMT)
Induced-photorefractive attack against Quantum Key Distribution [8.4] ニオブ酸リチウム(LiNbO3, LN)は、量子情報処理において重要な役割を果たす。
はじめに,LNの光屈折効果は,盗聴者による悪意ある攻撃を行うための潜在的な抜け穴として利用できることが明らかとなった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:05:39 GMT)
Improved Benthic Classification using Resolution Scaling and SymmNet
Unsupervised Domain Adaptation [8.4] 空間分解能の正規化のために,SymmNetの最先端Unsupervised Domain Adaptation法を,効率的な双線形プール層と画像スケーリングにより適用する。
その結果, トレーニング画像と異なるAUVサーベイから, 画像の精度を大幅に向上させるため, 汎用領域適応を向上できることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:33:47 GMT)
Feature Alignment and Uniformity for Test Time Adaptation [8.2] テスト時間適応は、分散テストドメインサンプルの受信時にディープニューラルネットワークを適用することを目的としている。
この設定では、モデルはトレーニングドメイン上のオンラインのラベルなしテストサンプルと事前トレーニングされたモデルにのみアクセスすることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:44:49 GMT)
Deep trip generation with graph neural networks for bike sharing system
expansion [7.7] マルチソース都市構築環境データに基づく駅レベルの需要予測のためのグラフニューラルネットワーク(GNN)手法を提案する。
提案手法は空間回帰モデルとして,空間回帰とGNNの共通性を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:43:41 GMT)
Adversarial Attacks against Binary Similarity Systems [7.7] 二項類似モデルの逆例に対するレジリエンスについて検討する。
我々は2つのブラックボックスの欲求攻撃に対して2つの類似性に対する最先端の3つのソリューションを広範囲に検証した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:22:04 GMT)
Clustering disease trajectories in contrastive feature space for
biomarker discovery in age-related macular degeneration [7.3] 加齢に伴う黄斑変性は、高齢者の視覚障害の主要な原因である。
画像バイオマーカーに基づく現在のグレーディングシステムは、粗いグループ病段階のみ広範囲に分類されている。
本稿では,病の進行の時間的ダイナミクスを捉えるバイオマーカーを自動的に検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:18:28 GMT)
Interactive configurator with FO(.) and IDP-Z3 [7.2] 命令型プログラミングアプローチは、そのようなシステムの実装と保守を困難にする。
KR FO() の新しい推論エンジン IDP-Z3 を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:53:12 GMT)
Deep Learning for Inertial Positioning: A Survey [7.2] 慣性センサーによる位置決めは、パーソナルナビゲーション、ロケーションベースのセキュリティ、ヒューマンデバイスインタラクションなど、さまざまなアプリケーションにおいて不可欠である。
深層学習技術が開発され、慣性位置決めの問題に対処するための重要な研究が進められている。
本稿は,深層学習技術が慣性的位置決め問題を解決する可能性に関心を持つ研究者や実践者を含む,さまざまなバックグラウンドから読者を引きつけることを目的としている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:05:27 GMT)
Internal Structure Attention Network for Fingerprint Presentation Attack
Detection from Optical Coherence Tomography [7.2] 本稿では,ネットワークトレーニングの指導に事前知識を適用した,教師付き学習に基づく新しいPAD手法ISAPADを提案する。
提案したデュアルブランチアーキテクチャは,OCT画像からグローバルな特徴を学習するだけでなく,階層構造にも注目する。
単純で効果的なISAMにより、提案ネットワークは、ノイズの多いOCTボリュームデータから、ボナフィドに属する層状セグメンテーション特徴を得ることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:36:09 GMT)
Self-supervised Contrastive Learning for Audio-Visual Action Recognition [7.2] オーディオとヴィジュアルモダリティの相関関係を利用して、ラベルなしビデオの教師付き情報を学ぶことができる。
本稿では,行動認識のための識別的視覚的表現を学習するための,聴覚・視覚コントラスト学習(A)というエンドツーエンドの自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:33:09 GMT)
Facial Affective Analysis based on MAE and Multi-modal Information for
5th ABAW Competition [7.2] 本稿では,AU検出,表現分類,VA推定,感情反応強度(ERI)推定のためのCVPR 2023: ABAW5を提案する。
まず,大規模顔画像データセット上で事前学習を行ったMAEモデルからの視覚情報を紹介する。
また、ビデオからのマルチモーダル情報や時間情報を利用して、マルチモーダル機能を融合するトランスフォーマーベースのフレームワークを設計する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:58:03 GMT)
Random Inverse Problems Over Graphs: Decentralized Online Learning [7.1] グラフ上の実時間観測によるランダムな逆問題の枠組みを確立する。
非次元および非独立なオンラインデータストリームに基づく分散オンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:37:08 GMT)
Cooperative quantum information erasure [6.9] 一度に$N$ qubitsをリセットする情報消去プロトコルを実証する。
この方法は、エネルギーコストの観点からは例外的な性能を示す。
このような協調的量子消去プロトコルは、次世代のハイブリッドゲートベース/量子アニーリング量子コンピュータに容易に適用できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:56:47 GMT)
Weakly-Supervised Text Instance Segmentation [6.8] テキスト認識とテキストセグメンテーションをブリッジすることで、弱教師付きテキストインスタンスセグメンテーションを初めて実施する。
提案手法は, ICDAR13-FST(18.95$%$改善)ベンチマークとTextSeg (17.80$%$改善)ベンチマークにおいて, 弱教師付きインスタンスセグメンテーション法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:56:47 GMT)
k-SALSA: k-anonymous synthetic averaging of retinal images via local
style alignment [6.4] 我々は,網膜基底像を合成するためのGANベースのフレームワークであるk-SALSAを紹介する。
k-SALSAは、網膜画像の実用的なパフォーマンスを達成するために、GANのトレーニングと反転のための最先端技術を組み合わせている。
我々の研究は、科学的コラボレーションのための網膜画像のより広範な共有に向けた一歩である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:47:04 GMT)
Electron Wave Spin in Excited States [6.4] 電子の波動スピンは、ディラック方程式の正確な4スピナー溶液から計算された電流密度によって完全に特徴づけられる。
電流と磁気ポテンシャルの相互作用は、異常ゼーマン分裂のより微細な構造を生み出す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:27:23 GMT)
A Global Model Approach to Robust Few-Shot SAR Automatic Target
Recognition [6.3] ディープラーニングベースのSAR自動ターゲット認識(ATR)モデルをトレーニングするために、クラス毎に数百のラベル付きサンプルを収集できるとは限らない。
この研究は特に数発のSAR ATR問題に対処しており、興味のあるタスクをサポートするためにラベル付きサンプルがわずかである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:24:05 GMT)
A Case Study on Designing Evaluations of ML Explanations with Simulated
User Studies [6.3] 我々は、実世界のユースケースでSimEvalsを初めて実施し、eコマース不正検出においてMLによる意思決定を支援することができるかどうかを評価する。
SimEvalsは、すべての考慮された説明者は同等にパフォーマンスがあり、説明なしではベースラインに勝てないことを示唆している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:36:48 GMT)
A generalization gap estimation for overparameterized models via the
Langevin functional variance [6.2] 関数分散は過パラメータ設定においても一般化ギャップを特徴付けることを示す。
本稿では,関数分散の効率的な近似,関数分散のランゲヴィン近似(Langevin FV)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:22:11 GMT)
Convergence Rates of Stochastic Zeroth-order Gradient Descent for \L
ojasiewicz Functions [6.1] Lojasiewicz関数に対するゼロ階勾配 Descent (SZGD) アルゴリズムの収束率を証明する。
その結果, mathbbN $ における f (mathbfx_t) - f (mathbfx_infty) _t は $ | mathbfx_infty よりも早く収束できることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:18:13 GMT)
Self-Improving-Leaderboard(SIL): A Call for Real-World Centric Natural
Language Processing Leaderboards [5.9] 与えられたテストデータセットの評価は、モデルの多くのパフォーマンス指標の1つにすぎない、と我々は主張する。
本稿では,現在のリーダーボードシステムにおけるこれらの課題に対処する,新しいリーダーボードシステムパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:13:03 GMT)
Generative Adversarial Network for Personalized Art Therapy in Melanoma
Disease Management [5.9] メラノーマは最も致命的な皮膚がんである。
治療を受けながら患者のメンタルヘルスを維持することが重要である。
現在の治療法は個人的ではなく、患者特有のものである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:25:38 GMT)
EmotionIC: Emotional Inertia and Contagion-driven Dependency Modelling
for Emotion Recognition in Conversation [5.6] 本稿では,感情認識のための感情慣性・伝染(Emotional Inertia and Contagion, EmotionIC)によって駆動される依存性モデリングへの新たなアプローチを提案する。
提案手法は,4つのベンチマークデータセットにおいて,最先端モデルよりも大幅に優れる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:58:35 GMT)
Ground state preparation with shallow variational warm-start [5.5] この研究は、現在のアルゴリズムのボトルネックに取り組むために、浅い変分温開始を伴う量子基底状態の準備スキームを提供する。
本研究では,スピン-1/2$ハイゼンベルクモデル上での広範な数値シミュレーションにより提案手法の有効性を実証する。
本研究では,ハバードモデルの研究を拡張し,有意な変動量子アルゴリズムと比較して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:36:23 GMT)
High Probability Bounds for Stochastic Continuous Submodular
Maximization [5.4] 単調連続部分モジュラ函数の戻り特性の低下を考える。
最悪の場合においても、PGAは$OPT/2$に収束し、PGA、SCG、SCG++は$(1 - 1/e)OPT$に収束するが、期待するソリューションよりも遅い速度で収束する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:20:39 GMT)
Neighborhood Gradient Clustering: An Efficient Decentralized Learning
Method for Non-IID Data Distributions [5.3] 現在の最先端の分散アルゴリズムは、主にデータ分散が独立的で、明確に分散していると仮定している。
textitNeighborhood Gradient Clustering (NGC) は,各エージェントの局所勾配を自己および横断的情報を用いて修正する,分散学習アルゴリズムである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:05:33 GMT)
Few-shot human motion prediction for heterogeneous sensors [5.2] 空間グラフを明示的に組み込んだ最初の数発のモーションアプローチを導入する。
固定出力空間でタスクを評価する場合、これまでのベストアプローチと同等に動作できることが示される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:05:48 GMT)
Learning Foresightful Dense Visual Affordance for Deformable Object
Manipulation [5.2] 本研究では,多種多様な状態への一般化をめざして,高密度な視覚能力を用いた変形可能な物体の操作について検討する。
本稿では,この表現を学習するためのフレームワークを提案し,多段階安定学習や,専門家のいない効率的な自己教師型データ収集などの新しい設計を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:14:13 GMT)
Resource-Dependent Complexity of Quantum Channels [5.0] 量子複雑性は、量子システムや量子演算を構築するのに必要な基本的な量子資源の量に関係している。
本稿では,一般的な量子チャネルのテキストソースに依存した複雑性測定のための統一的なフレームワークを提案する。
一般に,リプシッツの複雑性は時間内に線形に増大し,最大値で飽和することを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:44:57 GMT)
A Multi-Task Deep Learning Approach for Sensor-based Human Activity
Recognition and Segmentation [5.0] 本稿では,この2つの課題を同時に解くために,新しいディープニューラルネットワークを提案する。
提案するネットワークは,選択的畳み込みを採用し,長時間ないし短時間の動作を分割するマルチスケールウィンドウを備えている。
提案手法は,アクティビティ認識とセグメンテーションの両方において,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:34:28 GMT)
Fully packed quantum loop model on the square lattice: phase diagram and
application for Rydberg atoms [4.9] 正方格子上の完全充填量子ループモデルの基底状態位相図を示す。
強い二量体アトラクションを持つ格子ネマティック (LN) 相と強い二量体反発を持つスタガード相 (SP) の間には共鳴プラケット (RP) 相が出現する。
我々の再正規化群解析はモンテカルロシミュレーションの順序パラメータヒストグラムと完全に一致した異なる流れ方向を明らかにする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:17:02 GMT)
Recursive Euclidean Distance Based Robust Aggregation Technique For
Federated Learning [4.8] フェデレーション学習は、機械学習におけるデータ可用性とプライバシの課題に対するソリューションである。
悪意のあるユーザは、ローカルモデルを悪意のあるデータでトレーニングすることで、協調学習プロセスを妨害することを目指している。
ユークリッド距離計算に基づく新しいロバストアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:48:43 GMT)
Data-Driven Constitutive Relation Reveals Scaling Law for Hydrodynamic
Transport Coefficients [4.7] 線形システム上で理論的にデータ駆動モデルについて検討する。
これらのモデルは輸送係数の非線形長スケール法則と等価であると主張する。
また、スケーリング法則のモデル化は、データ駆動モデルにおける実践的な困難を回避できると指摘する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:48:12 GMT)
Strong photon-magnon interaction beyond the near field [4.6] 室温でのメカニカル・ストロング光子-マグノンカップリングを実験的に実現した。
キャビティマグノニクスにおける1メートル範囲の強い相互作用を実現する手法は、他の物理要素に対して一般的なアイデアを与えるかもしれない。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:52:55 GMT)
Model Stitching: Looking For Functional Similarity Between
Representations [4.6] 我々は、モデルステッチを使用して、異なるシードおよび/または同じアーキテクチャのトレーニングされたニューラルネットワークによって学習された同じ形状の表現を比較する、以前の研究を拡張した。
モデル縫合の予期せぬ挙動を明らかにする。つまり、小さなResNetに対して畳み込みに基づく縫合は、第1(sender)ネットワークにおいて第2(receiver)よりも第2(receiver)ネットワークで後になっても高い精度に達する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:12:42 GMT)
Inverse problem regularization with hierarchical variational
autoencoders [4.6] HVAE (hierarchical variational autoencoder) は不規則な逆問題に対して正規化するために提案される。
HVAEはどんな大きさの自然画像でも画像復元の問題を解決することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:49:18 GMT)
FlexVDW: A machine learning approach to account for protein flexibility
in ligand docking [4.5] 深層学習モデルは、ファンデルワールスエネルギーを予測する際に、受容体の柔軟性を暗黙的に考慮するよう訓練された。
この機械学習エネルギー項を最先端の物理に基づくスコアリング関数に組み込むことで、小さな分子リガンドが予測結果を改善できることが示される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:19:05 GMT)
Deceptive Reinforcement Learning in Model-Free Domains [4.5] 敵のシナリオでは、エージェントは報酬を最大化し、報酬関数をオブザーバーからプライベートにしておく必要がある。
近年の研究では、報酬関数の集合に対して曖昧な行動を選択するあいまいさモデル(AM)が提案されている。
本稿では,認知的探索あいまいさモデル (DEAM) を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:47:40 GMT)
Constructing Bayesian Pseudo-Coresets using Contrastive Divergence [4.3] 本稿では,原データと合成データに関連付けられた後部部分の最小化を課題とする。
我々は、合成集合を学習し、この損失を推定する単純かつ効率的な方法を示すために、対照的な発散様損失関数を導出する。
複数のデータセットに対する実験により,提案手法は従来のBPC手法よりも優れるだけでなく,データセットの凝縮に匹敵する性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:13:50 GMT)
D3G: Learning Multi-robot Coordination from Demonstrations [4.3] 本稿では、デモからマルチロボット協調学習を可能にする分散微分可能動的ゲーム(D3G)フレームワークを開発する。
我々は,ロボットの動作が,他者の行動にも依存する自身のダイナミクスと目的によって決定されるダイナミックゲームとしてマルチロボットコーディネートを表現している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:04:06 GMT)
Learning Behavior Recognition in Smart Classroom with Multiple Students
Based on YOLOv5 [4.2] 学生の教室行動の認識と分析を行うために, YOLOアルゴリズムを1回のみ用いたYOLOv5sネットワーク構造を提案する。
YOLOv4と比較すると,提案手法はmAPの性能を11%向上させることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:16:58 GMT)
Hospitalization Length of Stay Prediction using Patient Event Sequences [4.2] 本稿では,患者情報をイベントのシーケンスとしてモデル化し,入院期間(LOS)を予測するための新しいアプローチを提案する。
本稿では,患者の医療イベントシーケンスを記述したユニークな特徴を用いたLOS予測のためのトランスフォーマーベースモデルMedic-BERT(M-BERT)を提案する。
実験結果から,M-BERTは様々なLOS問題に対して高い精度を達成でき,従来の非シーケンスベース機械学習手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:48:36 GMT)
Bimodal SegNet: Instance Segmentation Fusing Events and RGB Frames for
Robotic Grasping [4.2] 本稿では,イベントベースデータとRGBフレームデータという2種類の視覚信号を融合したディープラーニングネットワークを提案する。
Bimodal SegNetネットワークには、2つの異なるエンコーダがある。
評価結果から,コンバウンドと画素精度の平均交叉点において,最先端手法よりも6~10%向上したことが示された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:09:25 GMT)
Semi-Automated Segmentation of Geoscientific Data Using Superpixels [4.0] 地質学的プロセスは、臨界鉱物、水、地熱エネルギーなどの資源の分布を決定する。
スーパーピクセルの概念に触発されて,類似した特徴を持つ領域に分割したサーベイデータに対する深層学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:21:46 GMT)
Opportunities and Challenges to Integrate Artificial Intelligence into
Manufacturing Systems: Thoughts from a Panel Discussion [4.0] 人工知能(AI)の急速な進歩は、将来の製造システムにおける生産性、品質、収益性を著しく向上させる可能性がある。
成功させるためには、AIはシームレスに、そして人間と統合された方法で働く必要がある(その逆も)。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:16:39 GMT)
Observation of dynamical degeneracy splitting for the non-Hermitian skin
effect [3.9] 非エルミート皮膚効果は非エルミート系において顕著な現象である。
2次元音響結晶における両現象の実験的観察を報告する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:49:49 GMT)
GANs as Gradient Flows that Converge [3.9] 分布依存常微分方程式によって誘導される勾配流に沿って、未知のデータ分布が長時間の極限として現れることを示す。
ODEのシミュレーションは、生成ネットワーク(GAN)のトレーニングと等価である。
この等価性は、GANの新たな「協力的」見解を提供し、さらに重要なのは、GANの多様化に新たな光を放つことである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:49:13 GMT)
Training Invertible Neural Networks as Autoencoders [3.9] Invertible Neural Networks (INNs) を INN (variational) autoencoders と呼ぶ (variational) autoencoders として訓練する方法を提案する。
MNIST, CIFAR, CelebAを用いた実験により, 低ボトルネックサイズでは, INNオートエンコーダは古典的オートエンコーダと同様の結果が得られた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:24:06 GMT)
Domain generalization of 3D semantic segmentation in autonomous driving [3.8] 本稿では,3次元自律走行セマンティックセグメンテーションのための最初のベンチマークを示す。
本稿では,レーザーイメージング検出とラングング(LiDAR)ドメインシフトに対処することの難しさについて論じる。
本稿では3DLabelPropと呼ぶこの領域の一般化に対処するために設計された最初の手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:41:47 GMT)
GNN-Ensemble: Towards Random Decision Graph Neural Networks [3.8] グラフニューラルネットワーク(GNN)は、グラフ構造化データに広く応用されている。
GNNは、大量のテストデータに基づいて推論を行うために、限られた量のトレーニングデータから潜伏パターンを学習する必要がある。
本稿では、GNNのアンサンブル学習を一歩前進させ、精度、堅牢性、敵攻撃を改善した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:24:01 GMT)
Reward Reports for Reinforcement Learning [3.8] デプロイおよび反復的に更新された学習システムの文書化のためのフレームワークをスケッチし、それをReward Reportsと呼ぶ。
強化学習に関する技術文献への様々な貢献からインスピレーションを得て、リワードレポートを、特定の自動化システムが最適化しているものの背後にある設計選択や仮定の更新を追跡する、生きたドキュメントとして概説する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:39:51 GMT)
Holistic Deep Learning [3.7] 本稿では、入力摂動、過度なパラメータ化、性能不安定といった脆弱性の課題に対処する、新しい総合的なディープラーニングフレームワークを提案する。
提案したフレームワークは、標準的なディープラーニングモデルよりも正確性、堅牢性、疎性、安定性を全面的に改善する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:39:56 GMT)
Deep Composite Face Image Attacks: Generation, Vulnerability and
Detection [3.7] 顔認証システム(FRS)の脆弱性により、顔操作攻撃は生体認証研究者の注意を引き付けている。
本稿では,GAN(Geneversarative Adrial Networks)を用いた顔属性に基づく複合顔画像攻撃(CFIA)生成手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:06:42 GMT)
Dual-stream Time-Delay Neural Network with Dynamic Global Filter for
Speaker Verification [3.6] 時間遅延ニューラルネットワーク(TDNN)は、テキスト非依存話者検証のための最先端モデルの1つである。
本稿では、対数線形複雑性FFT/IFFTと周波数領域の異なるフィルタの集合を適用したTDNNのGlobal Filterを提案する。
我々は,複雑性低減のための基本チャネルを分割し,認識性能を向上させるためにグローバルフィルタを利用する,二重ストリームTDNN(DS-TDNN)を構築した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:58:12 GMT)
Targeted Analysis of High-Risk States Using an Oriented Variational
Autoencoder [3.5] 可変オートエンコーダ(VAE)ニューラルネットワークは、電力系統状態を生成するために訓練することができる。
VAEの潜在空間符号の座標は、データの概念的特徴と相関することが示されている。
本稿では、遅延空間コードと生成されたデータとのリンクを制限するために、指向性変動オートエンコーダ(OVAE)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:34:21 GMT)
Dynamical properties of quasiparticles in a tunable Kekul\'{e} graphene
superlattice [3.5] グラフェン超格子中のケクル準粒子の可視化進化過程を数値的に示す。
我々は、準粒子の遠心軌道を解析的に取得し、両者は互いによく一致している。
本論文の予測は,近い将来に実験的に検証されることが期待される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:42:00 GMT)
AirTrack: Onboard Deep Learning Framework for Long-Range Aircraft
Detection and Tracking [3.4] AirTrackは、sUASシステムのサイズ、重量、電力制約を尊重するリアルタイムの視覚のみの検出および追跡フレームワークである。
AirTrackは、Amazon Airborne Object Tracking(AOT)で最先端のアートベースラインを上回ります。
実験による評価から,本システムでは,最大で700mまでの95%以上をトラックできる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:25:23 GMT)
Cross-Modality Sub-Image Retrieval using Contrastive Multimodal Image
Representations [3.4] 異なるモダリティによってキャプチャされた類似(または同じ)コンテンツのイメージは、共通の構造をほとんど共有しないため、モダリティ間の画像検索は困難である。
本稿では,モダリティ間の逆(サブ)画像検索のためのアプリケーション非依存のコンテンツベース画像検索システムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:58:19 GMT)
Empirical Assessment of End-to-End Iris Recognition System Capacity [3.4] 本研究では,6つのシステムパラメータが虹彩認識システムの制約容量に与える影響について検討した。
我々は、24の異なるシステム構成ごとに5158のユニークなIDから132万の比較を分析した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:49:10 GMT)
AI-assisted Protective Action: Study of ChatGPT as an Information Source
for a Population Facing Climate Hazards [3.3] ChatGPTは新たな情報ソースとして登場している。
本研究の目的は,ChatGPTが生成した応答の精度と完全性を評価することである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:27:28 GMT)
Variational Gibbs State Preparation on NISQ devices [3.3] 本稿では,量子多体系のギブス状態を作成するための変分量子アルゴリズム(VQA)を提案する。
我々のVQAの新規性は、2つの異なる接続された量子レジスタに作用するパラメータ化量子回路を実装することである。
逆場イジングモデルのギブズ状態を作成してVQAをベンチマークし、幅広い温度で極めて高い忠実度を達成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:09:34 GMT)
A fuzzy adaptive evolutionary-based feature selection and machine
learning framework for single and multi-objective body fat prediction [3.3] 体脂肪の予測は、医療従事者や利用者に心臓疾患の予防および診断に不可欠な情報を提供する。
現在の機械学習メソッドは、ローカルオプティマで立ち往生する可能性がある。
ファジィ適応グローバルラーニング ローカル検索 普遍的多様性に基づく特徴選択は、この単目的特徴選択マシンラーニングフレームワークに適用される。
このモデルは、他のハイブリッドおよび最先端の機械学習モデルよりも正確で安定した体脂肪推定を実現した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:38:57 GMT)
NASDM: Nuclei-Aware Semantic Histopathology Image Generation Using
Diffusion Models [3.3] 第一種核認識意味組織生成フレームワーク(NASDM)
NASDMは、最大6種類の核型のセマンティック・インスタンス・マスクを与えられた現実的な組織サンプルを合成することができる。
これらの合成画像は、病理学、モデルの検証、既存の核セグメンテーションデータセットの補充に有用である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:16:03 GMT)
Data Might be Enough: Bridge Real-World Traffic Signal Control Using
Offline Reinforcement Learning [3.3] 交通信号制御(TSC)への強化学習が有望なソリューションとなっている。
環境との相互作用を必要とするオンラインRLベースの手法は、実環境との相互作用に制限される。
これらの課題に対処するために,(1)一般的な実世界のシナリオに基づいて設計された循環型オフラインデータセット(COD),(2)CODから満足度の高い制御戦略を学習可能なDataLightと呼ばれるオフラインRLモデル,(3)ほとんどのRLベースの手法を循環型信号制御に変換するArbitrary To Cyclical(ATC)を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:02:50 GMT)
Towards Domain Generalization for ECG and EEG Classification: Algorithms
and Benchmarks [3.1] 生体信号の領域一般化問題は心電図(ECG)と脳電図(EEG)に焦点をあてる
本稿では、心電図(ECG)と脳波(EEG)に焦点を当てた生体信号の領域一般化問題について述べる。
オープンソースのバイオシグナリDG評価ベンチマークを提案し,実装する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:19:05 GMT)
Scene Graph Based Fusion Network For Image-Text Retrieval [3.0] 画像テキスト検索における重要な課題は、画像とテキストの正確な対応を学習する方法である。
そこで我々は,Scene GraphベースのFusion Network(SGFN)を提案する。
我々のSGFNは、非常に少数のSOTA画像テキスト検索方法よりも優れている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:22:56 GMT)
GNN-Assisted Phase Space Integration with Application to Atomistics [2.9] グラフニューラルネットワークは、一般的に使用される数値的二次規則の代替として機能することを示す。
これは、銅の熱膨張、鉄のマルテンサイト相転移、粒界エネルギーの3つのベンチマークによって示される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:45:45 GMT)
Lipschitz-bounded 1D convolutional neural networks using the Cayley
transform and the controllability Gramian [2.9] 我々は、1次元畳み込みニューラルネットワーク(CNN)の階層的パラメータ化を確立し、エンドツーエンドの堅牢性を保証する。
我々は、行列をパラメータ化するケイリー変換と畳み込み層の状態空間表現のための可制御性グラミアンに基づいてパラメータ化を行う。
我々はリプシッツに結合した1D CNNを心拍数分類のために訓練し、その堅牢性の向上を示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:25:43 GMT)
Optimized preprocessing and Tiny ML for Attention State Classification [2.8] 信号処理技術と機械学習アルゴリズムを組み合わせた脳波信号から精神状態の分類手法を提案する。
認知負荷作業中に収集した脳波記録のデータセット上で,提案手法の性能を評価する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:17:35 GMT)
From Sparse to Precise: A Practical Editing Approach for Intracardiac
Echocardiography Segmentation [2.7] 本研究では,2次元フレーム上にスクリブルを描画することでセグメンテーション出力を編集できるインタラクティブな編集フレームワークを提案する。
我々のフレームワークは、以前の編集を損なうことなく、逐次的にセグメント化出力に複数の編集を適用できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:47:02 GMT)
DR.CPO: Diversified and Realistic 3D Augmentation via Iterative
Construction, Random Placement, and HPR Occlusion [2.5] 自律運転では、データ拡張は一般的に3Dオブジェクトの検出を改善するために使用される。
我々は,全身オブジェクトを柔軟に構築できる,多種多様で現実的な拡張法を開発した。
DR.CPOは、KITTIデータセットで知られている最高の3D検出結果と比較して、mAP性能を2.08%向上させることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:42:48 GMT)
Automatic Measures for Evaluating Generative Design Methods for
Architects [2.5] アーキテクトが概念的スケッチから設計提案を期待していることについて説明する。
これらの基準に対処できる画像から画像への生成手法をいくつか評価する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:34:57 GMT)
Anomalous second-order skin modes in Floquet non-Hermitian systems [2.3] 開境界条件下での非エルミート皮膚効果は、周期境界条件下での固有のスペクトルトポロジーに由来すると広く信じられている。
Floquet Hamiltonianは開放境界条件下での摂動や障害に対して頑健な2次皮膚効果を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:44:33 GMT)
PRedItOR: Text Guided Image Editing with Diffusion Prior [2.3] テキストガイド画像編集は、テキスト埋め込みの計算集約的な最適化や、テキストガイド画像編集のモデル重みの微調整を必要とする。
我々のアーキテクチャは、テキストプロンプト上に条件付きCLIP画像埋め込みを生成する拡散先行モデルと、CLIP画像埋め込みに条件付き画像を生成するために訓練されたカスタムラテント拡散モデルで構成されている。
我々はこれを、逆DDIMなどの既存のアプローチを用いて、画像デコーダの編集を保存し、テキストガイド画像編集を行う構造と組み合わせる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:00:42 GMT)
Fluctuation-based deconvolution in fluorescence microscopy using
plug-and-play denoisers [2.2] 蛍光顕微鏡で得られた生きた試料の画像の空間分解能は、可視光の回折により物理的に制限される。
この制限を克服するために、いくつかのデコンボリューションと超解像技術が提案されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:43:52 GMT)
Fault Detection via Occupation Kernel Principal Component Analysis [2.2] 作業カーネルを用いた新しい主成分分析(PCA)手法を提案する。
作業カーネルは, 測定データに合わせた特徴マップを作成し, 統合利用による固有のノイズ・ロバスト性を持ち, 可変長の不規則サンプリングシステムトラジェクトリを利用することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:15:52 GMT)
Language Model Behavior: A Comprehensive Survey [2.2] 本稿では,タスク固有の微調整前における英語モデル行動に関する最近の250以上の研究について論じる。
モデルが数十億のパラメータにスケールするにつれて、生成テキストの品質は劇的に向上するが、モデルはまだ、非現実的な応答、常識的エラー、暗記されたテキスト、社会的偏見の傾向にある。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:54:26 GMT)
Quadratic reduction of approximation error of pure quantum states by
optimal probabilistic state synthesis [2.1] 最適確率合成は, トレース距離に対する近似誤差を低減することができることを示す。
我々は、絡み合った状態と分離可能な状態の集合の間の最小トレース距離に関する予想の証明を提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:43:21 GMT)
How (Implicit) Regularization of ReLU Neural Networks Characterizes the
Learned Function -- Part II: the Multi-D Case of Two Layers with Random First
Layer [2.1] 本稿では,ReLUアクティベーションを伴うランダム化した浅層NNの一般化挙動を,正確なマクロ解析により解析する。
RSNは、無限に多くの方向が考慮される一般化加法モデル(GAM)型回帰に対応することを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:05:47 GMT)
MAQA: A Quantum Framework for Supervised Learning [2.1] 本研究は,古典的教師付き機械学習アルゴリズムの多元的出力を再現可能な,普遍的で効率的なフレームワークを提案する。
提案するフレームワークは,多機能および多機能の組み合わせにより,Multiple Aggregator Quantum Algorithm (MAQA) と名付けられた。
2つ目の重要な追加として、提案フレームワークをハイブリッド量子古典およびフォールトトレラント量子アルゴリズムとして採用することについて議論する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:18:22 GMT)
What does it take to catch a Chinchilla? Verifying Rules on Large-Scale
Neural Network Training via Compute Monitoring [2.0] この研究は、大規模NNトレーニングに使用されるコンピューティングハードウェアを監視することによって、これを実現するための1つのメカニズムを分析する。
このフレームワークの主な目標は、合意されたルールに違反したトレーニングを実行するために、アクターが大量の特殊なMLチップを使用していないことを、政府に高い信頼を提供することである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:50:05 GMT)
Dynamic Object Removal for Effective Slam [1.9] 本稿では,この課題に対処する2段階のプロセスを提案する。フローベース手法を用いてシーン内の動的オブジェクトを抽出し,ディープビデオ塗装アルゴリズムを用いて除去する。
本研究の目的は,2つの最先端SLAMアルゴリズム,ORB-SLAM2 と LSD を用いてベースライン結果と比較し,動的オブジェクトとそれに対応するトレードオフの影響を理解することである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:47:36 GMT)
Improving Human-Robot Collaboration via Computational Design [1.9] 提案手法は,キッチン設計規則の要件を満たすカウンタの配置を最適に計算する。
我々は,マルチエージェント・モーション・プランニングを効率的に解ける分散型モーション・プランナーを用いている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:09:48 GMT)
Unit Scaling: Out-of-the-Box Low-Precision Training [1.7] 単位スケーリングは、低精度の数値形式の使用を単純化するディープラーニングモデルを設計するためのパラダイムである。
FP16や最近提案されたFP8フォーマットでのトレーニングは、大幅な効率向上をもたらすが、アウト・オブ・ザ・ボックスのトレーニングには十分な範囲を欠く可能性がある。
単位スケーリングは、全てのウェイト、アクティベーション、および初期化時の勾配の単位分散を求める、数値をモデル化するための原則化されたアプローチを導入することで、この問題に対処する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:42:25 GMT)
Asymptotically-deterministic robust preparation of maximally entangled
bosonic states [1.7] 任意の局所雑音の作用下で頑健な方法で、2つのボゾン量子ビットの純粋ベル一重項状態を作成する理論的スキームを導入する。
我々は、繰り返しの回数を決定的に達成する反復過程において、偏光に敏感で非吸収性なパリティチェック検出器を用いている。
提案プロトコルは,内部自由度(ベル状態)と空間モード(NOON状態)のいずれにおいても最大に絡み合った2つのボソンの純状態を作成するために利用できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:40:57 GMT)
Accurate Detection of Mediastinal Lesions with nnDetection [1.7] 縦断損傷解析(MELA)チャレンジ2022に自己構成法nnDetectionの修正版を適用した。
IoU0.10では0.9922、IoU0.3では0.9880の優れたFROCスコアを得た。
提出されたアンサンブルは、MELAチャレンジリーダーボードでFROCスコア0.9897で3位にランクインした。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:46:49 GMT)
Cascading Hierarchical Networks with Multi-task Balanced Loss for
Fine-grained hashing [1.6] きめ細かいハッシュは従来のハッシュ問題よりも難しい。
本稿では,コンパクトでセマンティックなハッシュコードを学習するためのカスケードネットワークを提案する。
また,マルチタスク学習の損失を協調的にバランスさせる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:08:48 GMT)
Convergence Guarantees of Overparametrized Wide Deep Inverse Prior [1.5] 逆優先法(Inverse Priors)は、ランダムな入力をフォワードモデルの下で画像が観察に一致するオブジェクトに変換する、教師なしのアプローチである。
本研究では, 連続時間勾配勾配勾配からトレーニングしたネットワークが, 高確率で指数関数的に高速に収束するオーバーパラメトリゼーション境界を提供する。
この研究は、過度にパラメータ化されたDIPネットワークの理論的理解への第一歩であり、より広い範囲で、逆問題設定におけるニューラルネットワークの理論的理解に関与している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:49:40 GMT)
Exploring the Relevance of Data Privacy-Enhancing Technologies for AI
Governance Use Cases [1.5] 異なるAIガバナンスの目的を情報フローのシステムとして見ることは有用である。
これらの異なるAIガバナンスソリューション間の相互運用性の重要性は明確になる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:39:09 GMT)
Cross-domain Microscopy Cell Counting by Disentangled Transfer Learning [1.5] 弱い人間のアノテーションのみを必要とするクロスドメイン細胞カウント手法を提案する。
我々は、ソースドメインとして合成細胞からなる公開データセットを使用する。
実際の細胞画像の新しいターゲット領域にドメインに依存しない知識のみを転送する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 03:08:09 GMT)
N-Gram in Swin Transformers for Efficient Lightweight Image
Super-Resolution [1.5] トランスフォーマーを用いた低レベルビジョンにN-Gramコンテキストを初めて導入する。
N-GramはスライドWSAによって相互に相互作用し、劣化したピクセルを復元する領域を広げる。
また、N-Gramコンテキストで他のSwinベースのSR手法を改善し、SwinIR-NGという拡張モデルを構築する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:48:37 GMT)
Cascaded Latent Diffusion Models for High-Resolution Chest X-ray
Synthesis [1.4] Cheffは1メガピクセルスケールで高現実性胸部X線写真を生成する基礎的カスケード潜在拡散モデルである。
MaCheXは、公開胸部データセットの統一インターフェースであり、これまでで最大の胸部X線のオープンコレクションを形成している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:00:20 GMT)
Concentration inequalities and optimal number of layers for stochastic
deep neural networks [1.3] 深層ニューラルネットワーク(SDNN)の隠れ層の出力に対する状態濃度不等式
また, SDNN の最適レイヤ数を最適停止手順により記述する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:16:33 GMT)
Resource Saving via Ensemble Techniques for Quantum Neural Networks [1.3] 本稿では,複数の量子ニューラルネットワークのインスタンスに基づいて,単一の機械学習モデルを構築することを含むアンサンブル手法を提案する。
特に,データロード構成の異なるバッグングとAdaBoostの手法を実装し,その性能を実世界の分類と回帰の両方で評価する。
これらの手法により,比較的小さな量子デバイス上でも,大規模で強力なモデルの構築が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:19:45 GMT)
Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action
Segmentation in Videos [1.2] 本稿では,Semantic2Graphというグラフベースの手法を用いて,映像動作のセグメンテーションと認識問題をグラフのノード分類に変換する。
フレームレベルでビデオのグラフ構造を構築し,時間的,意味的,自己ループの3種類のエッジを設計する。
本稿では,Semantic2GraphがGTEAと50Saladsの改善を実現していることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:53:24 GMT)
Large Language Models and Simple, Stupid Bugs [1.2] Copilotは大きな言語モデル(LLM)であるCodexを使用して、前の"prompt"で条件付きコードを完成させる。
しかし、Codexは、バグや脆弱性を含む可能性のあるコードで、公開GitHubリポジトリ、viz.でトレーニングされている。
Codex と類似の LLM はいくつかの SStuB を避けるのに役立ちますが、既知の SStuB を既知の SStuB の 2 倍の確率で生成します。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:14:06 GMT)
Safe Exploration Method for Reinforcement Learning under Existence of
Disturbance [1.1] 我々は、障害の存在下での強化学習における安全な探索問題に対処する。
制御対象と外乱の部分的事前知識を用いた安全な探索手法を提案する。
逆振り子と4バー並列リンクロボットマニピュレータの数値シミュレーションにより,提案手法の有効性と有効性について述べる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:46:22 GMT)
Taming Dyson-Schwinger equations with null states [0.9] 場の量子論において、ダイソン=シュウィンガー方程式(ダイソン=シュウィンガーしき、英: Dyson-Schwinger equations)は、n$ポイントグリーンの関数を自己整合的に関連する無限の方程式の集合である。
主要な問題の1つは、無限系の有限個の切り離しが過小評価されていることである。
本稿では,ヌルブートストラップを考慮した別の経路を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:04:43 GMT)
Here comes the $\mathrm{SU}(N)$: multivariate quantum gates and
gradients [0.9] 変分量子アルゴリズムは非可換最適化法を用いてパラメタライズド量子回路の最適パラメータを求める。
ここでは、特殊ユニタリ群 $mathrm(N) ゲートを完全にパラメータ化するゲートを提案する。
提案したゲートとその最適化がユニタリ群の量子極限を満たすことを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:00:04 GMT)
Interpretable histopathology-based prediction of disease relevant
features in Inflammatory Bowel Disease biopsies using weakly-supervised deep
learning [0.9] Crohn's Disease(CD)とUlcerative Colitis(UC)は2種類の炎症性腸疾患である。
深層学習モデルを構築し,CDおよびUCの組織学的特徴を内視鏡的ラベルのみを用いて同定した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:59:29 GMT)
Acoustic frequency atomic spin oscillator in the quantum regime [0.8] スピン測定の量子バックアクションと光の入射的スキーズは、スピン振動によって6kHzまで低下する。
その結果,音響領域における量子ノイズ低減とエンタングルメント・エンハンスドセンシングへの重要な一歩となった。
重力波検出器のブロードバンド雑音低減効果について検討した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:20:50 GMT)
Convergence analysis and acceleration of the smoothing methods for
solving extensive-form games [0.7] 2人のプレイヤーとゼロサムを持つ拡張形式のゲームを考える。
このようなゲームでは、最適戦略を求める問題は双線型サドルポイント問題として定式化することができる。
このような大規模双線形サドルポイント問題を解決するために, 平滑化法である過剰ギャップ法 (EGT) が研究されている。
我々のゴールは、大規模なゲームに適用できるように、広範囲なゲームを解決するための平滑化法を改善することである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:57:13 GMT)
An Abstract View on Optimizations in Propositional Frameworks [0.7] 本稿では,パラダイム間の統語的区別を排除した,いわゆる重みシステムの統一フレームワークを提案する。
このフレームワークは、自動推論と知識表現における最適化とモジュラリティの研究において、大幅な単純化と説明力を持っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:23:20 GMT)
Minding rights: Mapping ethical and legal foundations of 'neurorights' [0.7] 神経技術学の興隆は、精神的なプライバシー、精神的な完全性、認知の自由の保護に関する懸念を引き起こしている。
いくつかの州は現在、憲法の枠組みに「神経権利」を含めることを検討中である。
この研究は、概念的、倫理的、法的基盤を提供し、精神的なプライバシー、精神的な完全性、認知の自由に関する共通の最小主義的な概念的理解を可能にする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:52:39 GMT)
Learning Semantic Text Similarity to rank Hypernyms of Financial Terms [0.6] 本稿では,財務用語のハイパニムを抽出・ランク付けできるシステムを提案する。
このシステムは、DBpediaのような様々な情報源から得られた財務的なテキストコーパスで訓練されている。
負のサンプルでトレーニングセットを増強するために、新しいアプローチが使用されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:53:36 GMT)
Evidential Transactions with Cyberlogic [0.6] Cyberlogicは、デジタルトランザクションの構築と分析のための論理的基盤である。
1)公開鍵は認証に対応し,(2)トランザクションは分散論理プログラムとして指定され,(3)検証された証拠は分散証明探索によって収集される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:18:43 GMT)
Bilevel Imaging Learning Problems as Mathematical Programs with
Complementarity Constraints: Reformulation and Theory [0.6] 本稿では,低レベルのインスタンスが凸変動モデルに対応する二段階画像学習問題の家系について検討する。
相補性制約を持つ数学的プログラム(MPCC)として、元の二段階問題を再構築することができる。
提案された再構成は関数空間の問題にまで拡張され、状態の勾配に制約があるMPCCに繋がる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:18:27 GMT)
Revocation and Reconstruction of Shared Quantum Secrets [0.6] 既存のプロトコルでは、ディーラーが株式保有者がすべて半正直であることを知ったら、秘密を取り戻せる手段はない。
この作業では、半正直で不正ではない株主を明示的に扱います。
我々のプロトコルは、最悪の状況で秘密を取り戻そうという戦略を設計することで、この問題の解決に大きな進歩をもたらします。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:08:06 GMT)
Investigating Topological Order using Recurrent Neural Networks [0.5] トポロジカル秩序を示す2つの原型量子多体ハミルトニアンを2次元RNNを用いて検討する。
具体的には, RNN波動関数が, かごめ格子上のトーリック符号とボース・ハッバードスピン液体のトポロジ的順序を効果的に捉えることができることを示した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:40:28 GMT)
GPTs are GPTs: An Early Look at the Labor Market Impact Potential of
Large Language Models [0.4] ジェネレーティブ・プレトレーニング・トランスフォーマー(GPT)は、経済的、社会的、政策的な意味を持つ可能性がある。
アメリカの労働力の約80%は、GPTの導入によって影響を受ける仕事の少なくとも10%を担っていた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:29:47 GMT)
Quantum Computation of Hydrogen Bond Dynamics and Vibrational Spectra [0.4] 本稿では,水素結合系と,量子論理を用いたより一般的な化学力学問題を解くための枠組みを紹介する。
本稿では,QSCOUT ion-trap 量子コンピュータを用いて本手法の実証実験を行った。
分子の量子化学力学と振動スペクトルを研究するための新しいパラダイムを導入する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:46:22 GMT)
Solving High-Dimensional Inverse Problems with Auxiliary Uncertainty via
Operator Learning with Limited Data [0.4] システム状態の観測からの情報源の同定は、帰属と予測に不可欠である。
データ課題は、状態とソースの高次元性、サロゲートモデルをトレーニングするためのコストのかかるモデルシミュレーションの限定的なアンサンブル、インバージョンのためのほとんど、潜在的にノイズの多い状態観察から生じる。
本研究では,(1)シミュレーションのアンサンブルによって提供されるフローマップに,ディープニューラルネットワークのサロゲートを校正するフレームワークを導入し,(2)ベイジアンフレームワークにおけるこれらのサロゲートを用いて,最適化による観測からのソースの特定を行う。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:29:23 GMT)
PediCXR: An open, large-scale chest radiograph dataset for
interpretation of common thoracic diseases in children [0.3] 私たちは、2020年から2021年にかけて、ベトナムの大手小児病院から遡及的に収集された9,125の小児CXRデータセットであるPediCXRをリリースしました。
このデータセットは、36の重大な発見と15の疾患の存在のためにラベル付けされた。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:33:15 GMT)
A Deep Learning-based Global and Segmentation-based Semantic Feature
Fusion Approach for Indoor Scene Classification [0.3] セマンティックセグメンテーションマスクを用いてシーン横断のオブジェクトカテゴリの2次元空間レイアウトを求める手法を提案する。
2分岐ネットワークであるGS2F2Appは、RGB画像から抽出したCNNベースのグローバル機能と、提案したSSFから抽出したセグメンテーションベースの機能を利用する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:06:16 GMT)
Privacy-preserving Pedestrian Tracking using Distributed 3D LiDARs [0.3] 重複しないビューの分散LiDARを用いたスマート環境における歩行者追跡のための新しいプライバシ保護システムを提案する。
このシステムは、LiDARデバイスを利用して、部分的に覆われたエリアの歩行者を追跡するように設計されている。
システムの堅牢性を高めるために、個人の動的モビリティパターンをモデル化し、適応するために確率論的アプローチを利用する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:45:48 GMT)
Contextuality degree of quadrics in multi-qubit symplectic polar spaces [0.2] 我々は、線形系に対する解が存在しないとして、文脈性特性を定式化する。
二進シンプレクティック極空間の部分幾何学が文脈性証明の候補である理由を説明する。
シンプレクティック極空間の次数は、$W_n$ が$n-3,4,5$ の文脈的であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:48:49 GMT)
VieCap4H-VLSP 2021: ObjectAoA-Enhancing performance of Object Relation
Transformer with Attention on Attention for Vietnamese image captioning [0.0] 本研究では,対象関係変換器アーキテクチャを拡張し,注意機構を付加することで,変換器を用いた画像理解能力を向上させる方法を提案する。
VieCap4Hデータセットの実験により,提案手法は,VLSPが保持する画像キャプション共有タスクの公開テストとプライベートテストの両方において,元の構造を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:29:29 GMT)
Unsupervised Cross-Domain Rumor Detection with Contrastive Learning and
Cross-Attention [0.0] 大量の噂は、ニュースやトレンドの話題と共に現れ、真相を著しく妨げている。
既存の噂検出手法は、ほとんど同じドメインに焦点を合わせているので、クロスドメインのシナリオでは性能が劣る。
本稿では,クロスドメインなうわさ検出のためのクロスアテンション機構を備えた,エンドツーエンドのインスタンス・ワイドおよびプロトタイプ・コントラスト学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 06:19:49 GMT)
Uncertainty-aware deep learning for digital twin-driven monitoring:
Application to fault detection in power lines [0.0] ディープニューラルネットワーク(DNN)はしばしば物理ベースのモデルやデータ駆動サロゲートモデルと結合され、低データ状態のシステムの障害検出と健康モニタリングを行う。
これらのモデルは、生成されたデータに伝播するパラメトリック不確実性を示すことができる。
本稿では,これら2つの不確実性源がDNNの性能に与える影響を定量化する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:27:58 GMT)
Two coupled qubits under the influence of a minimal, phase-sensitive
environment [0.0] 2つの結合量子ビット系に対する最小位相感受性環境の影響について検討する。
本稿では, モデルに対する解析解を提案し, 環境の作用によるシステムの量子的特徴の劣化について検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:15:38 GMT)
Translate your gibberish: black-box adversarial attack on machine
translation systems [0.0] 我々は、ロシア語から英語への翻訳作業において、最先端の機械翻訳ツールを騙すための簡単なアプローチを提示する。
Google、DeepL、Yandexなど多くのオンライン翻訳ツールが、非意味な逆入力クエリに対して間違ったあるいは攻撃的な翻訳を生成する可能性があることを示す。
この脆弱性は、新しい言語を理解することを妨げ、単に機械翻訳システムを使用する際のユーザエクスペリエンスを悪化させる可能性がある。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:52:52 GMT)
Towards Mixed Quantum-Classical Dynamics on Quantum Computers [0.0] 混合量子古典力学は、完全に量子力学的に扱うには複雑すぎるシステムを理解するためにしばしば用いられる。
量子サブシステムと古典的サブシステムとを結合した一般混合量子古典力学のモジュラーアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:23:15 GMT)
Towards Goldilocks Zone in Child-centered AI [0.0] 我々は、子供のAIとのインタラクションプロセスを理解する必要性を論じる。
児童中心AIにおける価値駆動インタラクションを実現するための設計勧告をいくつか提示する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:52:33 GMT)
Time-optimal control of two-level quantum systems by piecewise constant
pulses [0.0] 2レベル量子系の時間-最適制御を1つの定数パルスを用いて導出する。
1と2の制御を持つ場合の状態-状態間の移動に対して、大域的最適解が得られる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:08:23 GMT)
The condensation of ideal Bose gas in a gravitational field in the
framework of Dunkl-statistic [0.0] 1次元重力場に閉じ込められた2次元および3次元ダンクルボソンガスの凝縮について検討した。
本研究では,Dunkl臨界温度$T_cD$,基底状態人口$fracN_0DN$,Dunkl平均エネルギーおよびDunkl固有熱関数の式を計算する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:52:49 GMT)
The Multimodal And Modular Ai Chef: Complex Recipe Generation From
Imagery [0.0] 本稿では、モノリシックなアプローチと、画像モデルを用いてオブジェクトをラベル付けする軽量で特殊な手法を比較する。
モジュール型の代替手段としてAPIを実証するため,冷凍機で利用可能な材料をユーザが写真を撮って,複雑な制約に合わせた新しいレシピカードを生成するという課題を解決した。
初めて、AIのシェフや料理人は、できるだけでなく、人間のレシピライブラリを実用的に拡張する能力も提供する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 01:57:52 GMT)
TaDaa: real time Ticket Assignment Deep learning Auto Advisor for
customer support, help desk, and issue ticketing systems [0.0] プロジェクトには,1) 問題を適切なグループに割り当てる,2) 問題をベストリゾルバに割り当てる,3) 関連性の高いチケットをリゾルバに割り当てる,といった機能がある。
我々は3k以上のグループと10k以上のリゾルバを持つチケットシステムサンプルデータセットを1つ利用し、グループ提案で95.2%、リゾルバ提案で79.0%、トップ3で9.0%の精度を得る。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:15:04 GMT)
Spin- and momentum-correlated atom pairs mediated by photon exchange [0.0] 本研究では, スピンと運動量モードで一対の原子を生成する機構を実験的に実証した。
この機構は、光学キャビティの真空モードによって媒介される超放射光子交換プロセスを介してボースガスから原子を結合する。
我々は、対の集合的に強化された生成を観察し、その統計を特徴づけ、運動量空間におけるスピン間相関を測る。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:59:03 GMT)
Spin Squeezing by Rydberg Dressing in an Array of Atomic Ensembles [0.0] 本稿では,Rydbergドレッシングによるセシウム原子のスピンスクイーズ配列の作成について報告する。
超ポアソン損失を抑制するストロボスコピックドレッシングシーケンスによる相互作用のコヒーレンスを最適化する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:28:19 GMT)
Spatially heterogeneous learning by a deep student machine [0.0] 深度$N$と深度$L$の深度ニューラルネットワークによる教師あり学習について検討した。
我々は、$M$の次元インプット/アウトプット関係を正確に再現する学生マシンの集合を考える。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:00:11 GMT)
SeaTurtleID: A novel long-span dataset highlighting the importance of
timestamps in wildlife re-identification [0.0] 本稿では,野生で捕獲されたウミガメの写真を収めた最初の大規模長大データセットであるSeaTurtleIDを紹介する。
このデータセットは、1081年の衝突で12年以内に収集された400個の個人からなる7774枚の高解像度写真で構成されている。
データセットの12年間の長さは、タイムスタンプを備えた最長の野生動物データセットである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:30:49 GMT)
Scalable Multi-Agent Lab Framework for Lab Optimization [0.0] auTonomous fAcilitiesと呼ばれるマルチエージェントラボコントロールフレームワーク。
システムはエージェント・インストラメンテーションやエージェント・エージェント・インタラクションを含む、施設全体のシミュレーションを可能にする。
我々は,MultiTASKが大規模自律・半自律的な研究キャンペーンと施設で新たな研究領域を開くことを願っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:24:38 GMT)
Rethinking the backbone architecture for tiny object detection [0.0] 既存の小さなオブジェクト検出方法は、標準的なディープニューラルネットワークをバックボーンアーキテクチャとして使用しています。
このようなバックボーンは、大きなオブジェクトの分類のために設計されたため、小さなオブジェクトを検出するには不適切であり、小さなターゲットを特定するための空間分解能を持っていない、と我々は主張する。
我々は、全体的な計算負荷を伴わずに、高解像度の機能を処理するためにより多くのリソースを割り当てる「ボトムヘビー」バージョンのバックボーンを設計する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:50:29 GMT)
Rethinking SO(3)-equivariance with Bilinear Tensor Networks [0.0] 我々は、偏差対称性の破れにより、SO$(2)$のベクトルおよび順序2テンソル表現のみに作用するネットワークの表現性を向上させることができることを示す。
本稿では, b-中間子崩壊から生じる粒子ジェットを, 圧倒的なQCD背景から識別しなくてはならない, テクスタイブタグと呼ばれる高エネルギー物理の重要な問題に対して, 本手法を実証する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:23:15 GMT)
ResDTA: Predicting Drug-Target Binding Affinity Using Residual Skip
Connections [0.0] 本稿では,DT結合親和性を予測するための深層学習手法を提案する。
提案したモデルでは,最大のベンチマークデータセットの1つにおいて,最高のコンコーダンス指標(CI)性能を達成している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:27:11 GMT)
Reflexion: an autonomous agent with dynamic memory and self-reflection [0.0] 本稿では,動的メモリと自己回帰機能を備えたエージェントを実現する手法であるReflexionを提案する。
我々は,AlfWorld環境における意思決定タスクを完了させるエージェントの能力と,HotPotQAにおける知識集約型質問応答タスクを評価する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:08:50 GMT)
Quantum Signal Processing, Phase Extraction, and Proportional Sampling [0.0] 量子信号処理(QSP)は、単位の$U$の固有値に適用された変換$P(x)$を実装するために使用できる技法である。
QSPは位相抽出と呼ばれる新しい問題に対処するために利用することができ、比例サンプリングのための量子スピードアップを提供するために使用できることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:05:29 GMT)
Quantile and moment neural networks for learning functionals of
distributions [0.0] 確率空間における分布関数の近似関数について,ニューズニューラルネットワークについて検討する。
量子化とモーメント近似に基づくニューラルネットワークの2つのクラスを提案し,これらの関数を学習した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:23:31 GMT)
Polynomial Implicit Neural Representations For Large Diverse Datasets [0.0] Inlicit Neural representations (INR) は信号と画像の表現において大きな人気を得ている。
多くのINRアーキテクチャは正弦波位置符号化に依存しており、これはデータの高周波情報の原因となっている。
提案手法は,画像を関数で表現することでこのギャップに対処し,位置エンコーディングの必要性を解消する。
提案するPoly-INRモデルは, 畳み込み, 正規化, 自己アテンションを伴わずに, 最先端の生成モデルと同等に機能する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:09:46 GMT)
Partition GHZ SLOCC class of three qubits into ten families under LU [0.0] 3 つのキュービットの GHZ SLOCC クラスに対して LU 不変量とエンタングルメント測度を示す。
GHZ SLOCCクラスに対する一般化シュミット分解の特異性に対する必要十分条件を与える。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:52:13 GMT)
Parent Hamiltonian reconstruction via inverse quantum annealing [0.0] 局所ハミルトニアンが与えられた多体波動関数を基底状態とする。
状態のゆっくりとした変形は、対応するハミルトニアンの断熱進化を生成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:32:51 GMT)
Opto-UNet: Optimized UNet for Segmentation of Varicose Veins in Optical
Coherence Tomography [0.0] 本研究は静脈壁構造のセグメンテーションのためのセグメンテーションモデルであるOpto-UNetを提案する。
Opto-UNetモデルは、新しいブロックをアーキテクチャに統合するU-Netアーキテクチャに基づいている。
このモデルは精度0.9830、感度0.8425、特異度0.9980、パラメータ8.54万である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:39:45 GMT)
On the exact quantum query complexity of $\text{MOD}_m^n$ and
$\text{EXACT}_{k,l}^n$ [0.0] 我々は、$Mod_mn$を計算するための最適量子アルゴリズムを提案する。
我々は、Bn$ を集合 $X$ に写す対称関数の幅広いクラスの正確な量子クエリ複雑性を示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:17:32 GMT)
On the Educational Impact of ChatGPT: Is Artificial Intelligence Ready
to Obtain a University Degree? [0.0] 大学教育におけるChatGPTの効果を評価する。
コンピュータサイエンスの高等教育は、ChatGPTのようなツールにどのように適応すべきかについて議論する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:27:37 GMT)
On lower bounds for the bias-variance trade-off [0.0] 高次元統計モデルでは、速度-最適推定器は二乗バイアスと分散のバランスをとるのが一般的である。
本稿では, 既定境界よりも小さい偏差を持つ任意の推定器の分散に関する下限を求める一般戦略を提案する。
これは、バイアス分散トレードオフがどの程度避けられないかを示し、従わないメソッドのパフォーマンスの損失を定量化することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:04:47 GMT)
Nonclassical features in higher-dimensional systems through logical
qudits [0.0] 単一論理量子ビットにおける量子コヒーレンスを持つマルチキュービット系における異なる非古典的相関の相互関係を示す。
これにより、非恒等次元のヒルベルト空間に属する状態の異なる非古典的特徴の相互関係を反映する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:23:44 GMT)
Non-Hermitian description of sharp quantum resetting [0.0] 我々は、1次元格子上で動く非相互作用量子粒子の研究を行い、繰り返し測定を行う。
量子リセット問題(quantum resetting problem)と呼ばれる同じ初期構成から、そのような動きを中断し、再起動した場合の結果について検討する。
このような系は時間依存の非エルミート・ハミルトニアンの下で時間進化によって記述できることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:39:51 GMT)
Neural Co-Processors for Restoring Brain Function: Results from a
Cortical Model of Grasping [0.0] ニューラルネットワークとディープラーニングを用いて最適なクローズドループ刺激ポリシーを学習する「ニューラルコプロセッサ」を提案する。
コプロセッサは、生体回路自体が刺激に適応するにつれて刺激ポリシーに適応し、脳-デバイス共適応の一形態を達成する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:25:33 GMT)
Near-term $n$ to $k$ distillation protocols using graph codes [0.0] 我々は,n$から$k$のペアを蒸留するための,短期的に実装可能な蒸留プロトコルのセットを検討する。
この対応を利用して、いくつかのタスクに対して証明可能な最適なプロトコルを見つける。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 21:46:17 GMT)
NASA Science Mission Directorate Knowledge Graph Discovery [0.0] 本稿では,NASAの異なる領域を表す知識グラフ(KG)を生成するパイプラインを提案する。
これらのKGは、データセット検索エンジンの基礎として使用でき、研究者の時間を節約し、新しいコネクションを見つけるのをサポートする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:12:43 GMT)
Multimodal Shannon Game with Images [0.0] 我々は、画像情報としてオプションの余分なモダリティを導入することで、シャノンゲームを拡張する。
画像情報の追加により、人間とLMの両方の自己報告された信頼度と精度が向上することを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:22:11 GMT)
Multi-armed Bandit Learning on a Graph [0.0] そこで,エージェントがグラフの上を移動して,異なるノードから収集した報酬を最大化するグラフバンドイットと呼ばれるMABの拡張について検討する。
我々は,楽観主義の原理を用いて長期探査・探索のバランスをとる学習アルゴリズムG-UCBを設計する。
提案アルゴリズムは,ノード数として$O(sqrt|S|Tlog(T)+D|S|log T)$学習後悔を実現する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:06:12 GMT)
Molecular Electronic Structure Calculation via a Quantum Computer [0.0] 本研究では,H3+,OH-,HF,BH3などの分子の基底状態エネルギーを計算するために,変分量子固有解法(VQE)アルゴリズムを実装した。
我々の研究におけるVQEから得られる基底状態エネルギーの精度は、以前報告した値よりも高い。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 07:43:59 GMT)
Mind meets machine: Unravelling GPT-4's cognitive psychology [0.0] GPT-4は,常識的質問に対する回答において高い精度を示すことを示す。
本研究は,CommonSenseQAにおけるGPT-4の精度が83 %であり,同一データに対するヒトの精度が89 %であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:28:26 GMT)
Magnetoreception in cryptochrome enabled by one-dimensional radical
motion [0.0] 一般的な仮説は、タンパク質のクリプトクロム中の一対のラジカルの磁気感受性再結合反応に対する磁気受容を仮定している。
そこで我々は、内部運動を許容するラジカル対が磁気感度を高めることができるかどうかを解明した。
以上の結果から, 強いEED結合下では, ラジカル対に絡み合う動的環境の重要性が強調された。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:25:23 GMT)
Machine Learning Aided Dimensionality Reduction towards a Resource
Efficient Projective Quantum Eigensolver [0.0] 近年,分子系の基底状態エネルギーを計算するためのエレガントな手法として,PQE (Projective Quantum Eigensolver) が提案されている。
我々は、この2つのパラメータの集合的相互作用を機械学習技術を用いて利用し、相乗的相互関係を導出した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:49:56 GMT)
MT-SNN: Enhance Spiking Neural Network with Multiple Thresholds [0.0] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)に代わる有望なエネルギー効率の代替品である
本稿では,バイナライズされたアクティベーションによる精度損失を軽減するために,Multiple Threshold(MT)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:04:50 GMT)
Longitudinal thermal imaging for scalable non-residential HVAC and
occupant behaviour characterization [0.0] 本研究では, 都市規模の赤外観測所から収集した熱画像から, 非住宅の空調(AC)利用パターンを解析した。
運用パターンの予測精度は午後8時から午前10時までが最も高く,日射や高温のため日中は低下することがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:24:20 GMT)
Leveraging Foundation Models for Clinical Text Analysis [0.0] 感染症は世界中の公衆衛生上重要な問題である。
利用可能な膨大な臨床データから情報抽出の課題が浮かび上がっている。
本研究では,タスク固有データに微調整された事前学習型トランスフォーマーモデルを用いた自然言語処理(NLP)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:05:13 GMT)
Lensing of Vacuum Entanglement near Schwarzschild Black Holes [0.0] シュワルツシルト時空の重要な特徴は、公転するヌル測地学と因果関係の存在である。
ここでは、量子場の真空にレンズが現れるかどうか、すなわち真空絡みの分布をレンズ化することによって疑問を提起する。
3+1次元シュワルツシルト時空におけるブールウェア、ハートル・ホーキング、ウンルー・ヴァクアの場合、真空の絡み合いの収穫は実際、因果近くで大きく増幅されている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:22:11 GMT)
Late Meta-learning Fusion Using Representation Learning for Time Series
Forecasting [0.0] 本研究は,これらの話題を包含する統合分類法を提案する。
この研究は、いくつかのモデル融合アプローチと、Deep-learning Forecast Model Averaging (DeFORMA)と呼ばれるハイブリッドおよび特徴積み重ねアルゴリズムの新たな組み合わせを実証的に評価した。
提案したモデルであるDeFORMAは、M4データセットで最先端の結果を得ることができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:29:42 GMT)
Large-scale End-of-Life Prediction of Hard Disks in Distributed
Datacenters [0.0] 高度に歪んだ健康統計データを用いて大規模予測分析を行う。
本稿では、健康統計系列の理解から得られたコンテキストが、ディスクが失敗する可能性のある数日の出力シーケンスを予測するのに役立つエンコーダ・デコーダLSTMモデルを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 22:35:49 GMT)
Lamarr: LHCb ultra-fast simulation based on machine learning models
deployed within Gauss [0.0] 改良されたLHCb検出器は、より大きなデータサンプルを収集することができる。
LHCb実験で利用可能なコンピューティングリソースの約90%は、シミュレーションデータサンプルの作成に費やされている。
シミュレーション生産を高速化するGaudiベースのフレームワークであるLamarrについて論じる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:18:04 GMT)
Irreversibility in an optical parametric driven optomechanical system [0.0] 微調整のための不可逆性と量子的相互情報に劇的な偏りがある。
本研究では, 自己誘起非線形性の適切な位相を選択することにより, システムの可逆性を低減できることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:31:37 GMT)
Intrinsic quantum dynamics of particles in brane gravity [0.0] ブレーン上の粒子軌道の安定性はボーア-ソマーフェルト量子化条件を与えることを示す。
余剰次元に沿った粒子の動きは、不確実性原理の幾何学的なバージョンを定式化することができる。
余剰次元に沿った粒子の運動は、境界状態に対する量子化されたエネルギースペクトルをもたらすことを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:41:07 GMT)
Integration of Radiomics and Tumor Biomarkers in Interpretable Machine
Learning Models [0.0] 本稿では,専門家由来の放射能とDNN予測バイオマーカーを解釈可能な分類器に統合することを提案する。
評価と実用化において,ConRadへの入力は分割CTスキャンのみである。
提案したConRadモデルでは,CBM由来のバイオマーカーと放射能の特徴を解釈可能なMLモデルで組み合わせ,肺悪性度分類に優れる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:00:52 GMT)
Induced Feature Selection by Structured Pruning [0.0] 重みと入力データに間隔を共同で付与することで、さらに一歩前進する。
入力データに対してプルーニングを行うことで、合計パラメータやFLOPのさらなるゲインを達成することができる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:29:35 GMT)
Image comparison and scaling via nonlinear elasticity [0.0] 画像領域間の相同性の適切なクラスにおける最小化子の存在は、自然仮説の下で確立される。
線形関連画像に対して,最小化アルゴリズムが線形変換を一意の最小化器として提供するか否かを検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 16:21:34 GMT)
Hybrid divide-and-conquer approach for tree search algorithms [0.0] 本稿では,木探索アルゴリズムの文脈におけるハイブリッド分割・コンカレント手法について検討する。
DPLLのアルゴリズムの高速化条件について述べる。
本稿では,大規模問題に対する高速化におけるハイブリッド手法の限界について概説する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:56:22 GMT)
Heterogeneity of AI-Induced Societal Harms and the Failure of Omnibus AI
Laws [0.0] リスクの高い、あるいは重要なAIに対して、安全性、公正性、説明責任、プライバシ規則をすべて遵守させることは、不合理である。
議会は、彼らが引き起こす社会的な害の種類に応じてAIシステムを分類することで、既存の規制を徐々に順応すべきである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:23:40 GMT)
Grover's Algorithm Offers No Quantum Advantage [0.0] グロバーのアルゴリズムは、量子コンピュータが古典的コンピュータよりも有利であることを示す証拠として提供される主要なアルゴリズムの1つである。
我々は、古典的なコンピュータ上で実行可能な量子インスパイアされたアルゴリズムを構築し、Groverのタスクをオラクルへの線形呼び出し数で実行する。
本研究は, 量子回路の性質に依存した, 実用的な高速化の可能性について批判的に検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 17:56:20 GMT)
Geometrical aspects of lattice gauge equivariant convolutional neural
networks [0.0] 格子ゲージ同変畳み込みニューラルネットワーク(L-CNN)は、非アベリア格子ゲージ理論に適用可能な畳み込みニューラルネットワークの枠組みである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:49:08 GMT)
Generative AI and the Digital Commons [0.0] GFMは、公開データに基づいてトレーニングされ、パブリックインフラストラクチャを使用する。
GFMがもたらすリスクと、なぜデジタルコモンズに関係があるのかを概説する。
ガバナンスベースのソリューションを多数提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:01:48 GMT)
Generalized possibilistic Theories: the multipartite experiments problem [0.0] 本論文では、一般化確率論の完全公理を一般化し、解明する。
両部実験の問題点は,本論文の主な技術として扱われる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 09:47:50 GMT)
General pseudo self-adjoint boundary conditions for a 1D KFG particle in
a box [0.0] 1次元クライン・フォック・ゴードン粒子を有限間隔で考える。
我々は、ハミルトニアン作用素に対して最も一般的な擬自己随伴境界条件を記述する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:04:43 GMT)
Dyson Maps and Unitary Evolution for Maxwell Equations in Tensor
Dielectric Media [0.0] 不均一、異方性、受動的、非分散媒体に対するマクスウェル方程式の再構成は、ユニタリ時間進化を許容する量子ライクなディラック方程式をもたらす。
複雑な媒体における電磁波伝搬シミュレーションのための量子コンピューティング(QC)の実装が可能である。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 11:05:37 GMT)
Dynamic Documentation for AI Systems [0.0] 本稿では,AIシステムにおける現在のドキュメンテーションプロトコルの限界を示す。
我々は、AIシステムを理解し評価するための新しいパラダイムとして、動的ドキュメンテーションを議論する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 04:23:07 GMT)
Differentially Private Algorithms for Synthetic Power System Datasets [0.0] 電力システムの研究は、現実世界のネットワークデータセットの可用性に依存している。
データ所有者は、セキュリティとプライバシーのリスクのためにデータを共有することをためらっている。
我々は、最適化と機械学習データセットの合成生成のためのプライバシー保護アルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:38:58 GMT)
Development of Real-time Rendering Technology for High-Precision Models
in Autonomous Driving [0.0] 我々の研究室は駐車場をシミュレーションする高精度な3Dモデルを作成している。
現在のモデルは、いくつかの面でまだレンダリング品質が劣っている。
本研究では,モデルのレンダリングを改善し,レンダリングされたモデルの品質を評価するシステムを開発する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:28:36 GMT)
Determining probability density functions with adiabatic quantum
computing [0.0] データサンプルからの確率密度関数の信頼性の高い決定は、科学的応用において依然として重要なトピックである。
サンプルの累積分布関数を時間依存ハミルトニアンにマッピングする古典的量子データ埋め込み手法を定義する。
得られたハミルトニアンは時間発展作用素を用いて量子回路に投影される。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:00:00 GMT)
Delay Mitigation in Air Traffic Flow Management [0.0] 本研究では,最適なバッファ時間を生成するために,遅延コストとフライトバッファモデルを提案する。
目的は、ATFMの遅延を軽減し、利害関係者の福祉を増大させる最適な公平かつ効率的なバッファ選択を得ることである。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 13:05:41 GMT)
Deep learning automated quantification of lung disease in pulmonary
hypertension on CT pulmonary angiography: A preliminary clinical study with
external validation [0.0] 本研究は,CTPA(CTPA)における肺テクスチャ分類のための人工知能(AI)深層学習モデルの開発を目的とする。
The Fleishner Society glossary of terms were classified as the "Normal", "Ground glass, "Ground glass with reticulation", "Honeycombing", and "Emphysema" were classified as the Fleishner Society glossary of terms。
各テクスチャに対する肺容積の分布は、肺全容のパッチを分類して算出し、肺小葉全体にわたって粗いテクスチャ分類を作成した。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:06:32 GMT)
Correlation constraints and the Bloch geometry of two qubits [0.0] 局所的ブロッホベクトル長の差にのみ依存するバイパルタイト状態の純度に関する新しい不等式を示す。
2つのキュービットに対して、この不等式はすべての辺状態に対して厳密であり、2-キュービットの辺問題に対する既知解を拡張している。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 19:11:59 GMT)
Convolutions, Transformers, and their Ensembles for the Segmentation of
Organs at Risk in Radiation Treatment of Cervical Cancer [0.0] 子宮頸癌の放射線治療におけるOAR(Organs At Risk)のセグメンテーションの課題に答える。
我々は、異なるアーキテクチャに属するいくつかの最先端モデルと、いくつかの最先端モデルの側面を組み合わせたいくつかの新しいモデルを比較した。
モデル予測を可視化し、その出力確率を平均化し、モデル予測間のDice Coefficientを計算する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 23:44:35 GMT)
Computing the Mass Shift of Wilson and Staggered Fermions in the Lattice
Schwinger Model with Matrix Product States [0.0] 行列積状態を用いて、ハミルトニアン定式化におけるウィルソンフェルミオンを研究する。
本稿では,付加質量再正規化を決定する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 10:50:14 GMT)
Complexity growth for one-dimensional lattice models [0.0] この複雑さは量子コンピューティングとシミュレーションにおいて非常に重要な役割を担い、ユニタリ回路を実装するのに必要なゲートの最小数の尺度として機能する。
非相互作用フェルミオンの1次元格子モデルのユニタリダイナミクスに対する複雑性の低い境界について検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 12:48:21 GMT)
Combining Deep Metric Learning Approaches for Aerial Scene
Classification [0.0] リモートセンシング領域では、CNNアーキテクチャを代替ソリューションとして使用することもシーン分類タスクの現実である。
本研究は,6つのDML手法を空撮シーン分類タスクに適用し,その動作を4種類の事前学習CNNを用いて解析することを提案する。
実験では、従来の訓練済みCNNと比較して、DMLアプローチよりも優れた分類結果が得られる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:49:39 GMT)
Building a Resilient Cybersecurity Posture: A Framework for Leveraging
Prevent, Detect and Respond Functions and Law Enforcement Collaboration [0.0] 本稿では,CyRLECフレームワークとNISTサイバーセキュリティフレームワークを比較し,比較する。
CyRLEC Frameworkは、積極的な予防、早期発見、サイバー攻撃に対する迅速な対応、法執行機関との密接な協力など、サイバーセキュリティに関する幅広い見解を採っている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 05:16:54 GMT)
Bridging Deliberative Democracy and Deployment of Societal-Scale
Technology [0.0] 大規模言語モデル(LLM)の安全性を確保するための既存のプロセスは不十分であり、民主主義的な正当性を提供していないと私は主張する。
このAI安全研究と実践のシフトは、熟考の実施方法を決定する企業および公共政策の設計を必要とする。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:27:52 GMT)
Bias mitigation techniques in image classification: fair machine
learning in human heritage collections [0.0] 我々は,2つの最先端ニューラルネットワークであるXceptionとEfficientNetを用いて,性別分類のためのバイアス緩和手法を評価する。
また、トレーニングデータの不足を克服するために、公平なデータセットを使用したトランスファーラーニングの利用についても検討する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 20:49:57 GMT)
Bell's theorem is an exercise in the statistical theory of causality [0.0] 私は、現在の統計因果論の結果として、グラフィカルモデルやベイズネットに基づくベル-CHSHの不等式を導出する。
状況に依存した隠れ変数のケースは、ベルの結論はこのような方法で回避できるという最近の主張にもかかわらず、カバーされている。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:13:57 GMT)
Approaching an unknown communication system by latent space exploration
and causal inference [0.0] 本研究では、教師なし深層生成モデルの潜在空間を探索し、データ中の有意義な特性を発見する手法を提案する。
本手法を用いて,クジラのコミュニケーションシステムにおいて意味のあるものを検証する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:09:13 GMT)
An entropic uncertainty principle for mixed states [0.0] エントロピーの不確実性原理の一般化の族を提供する。
結果は、信頼できる当事者間の絡み合いを認証したり、信頼できない環境とシステムの絡み合いを結びつけるために使われる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 18:31:53 GMT)
An Optical XNOR-Bitcount Based Accelerator for Efficient Inference of
Binary Neural Networks [0.0] 単一MRRを用いた光XNORゲート(OXG)を発明する
我々は光電荷蓄積器(PCA)と呼ばれるビットカウント回路の新規設計を提案する。
最新の4つのBNNを推定すると、OXBNNはFPS(F frames-per-second)とFPS/W(エネルギー効率)において最大62倍と7.6倍の改善を実現していることがわかる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 02:34:18 GMT)
An ADMM approach for multi-response regression with overlapping groups
and interaction effects [0.0] 我々は新しい正規化回帰法であるMADMMplassoを提案する。
パラメータ推定のために,重なり合うグループを簡単な方法で実装できるADMMアルゴリズムを開発した。
薬理ゲノミクス・スクリーン・データセットのシミュレーションと解析の結果,提案手法は相関応答と相互作用効果の処理に有利であることがわかった。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 14:43:22 GMT)
Accounting for carbon emissions caused by cryptocurrency and token
systems [0.0] この白書では、暗号通貨やトークンによって引き起こされる排出を割り当てる方法について、さまざまなアプローチを探求する。
潜在的なアプローチの長所と短所を分析した結果,本研究では,Proof of WorkとProof of Stakeネットワークのエミッション要因を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 08:06:31 GMT)
A set of semantic data flow diagrams and its security analysis based on
ontologies and knowledge graphs [0.0] 本研究では、実際のクラウドベースのアプリケーションを表すマシン可読データフロー図の作成と、そのようなアプリケーションのセキュリティ面を自動解析するための利用領域固有の知識の2つの課題について検討する。
180のセマンティックダイアグラム(オントロジーとナレッジグラフ)のセットは、クラウド構成(Docker Compose)に基づいて作成されます。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:26:07 GMT)
A Survey of Demonstration Learning [0.0] 実証学習(Demonstration Learning)は、エージェントがデモンストレーションで示された専門家の行動を模倣してタスクを実行することを学習するパラダイムである。
デモから複雑な振る舞いを学ぶ大きな可能性を秘めているため、大きな注目を集めている。
環境と対話することなく学習することで、デモ学習はロボット工学や医療といった幅広い現実世界の応用を自動化できる。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 15:22:10 GMT)
A Catch-22 of Reservoir Computing [0.0] Reservoir Computingは、データから非線形力学系の挙動を予測するための、シンプルで効率的なフレームワークである。
我々は,システムの初期状態からどのアトラクタが収束するかを決定する,流域予測の問題に焦点をあてる。
本研究では,NGRC(Next-Generation Reservoir Computing)が複雑で高次元的なアトラクションの流域を正確に再構築可能であることを示す。
論文参考訳(メタデータ) (Mon, 20 Mar 2023 00:37:10 GMT)