Focus on Your Target: A Dual Teacher-Student Framework for
Domain-adaptive Semantic Segmentation [210.5] 意味的セグメンテーションのための教師なしドメイン適応(UDA)について検討する。
対象領域からのトレーニングサンプルの割合を減少・増加させることで,「学習能力」が強化・弱まることがわかった。
本稿では,DTS(Double teacher-student)フレームワークを提案し,双方向学習戦略を取り入れた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:04:10 GMT)
HIVE: Harnessing Human Feedback for Instructional Visual Editing [137.9] 本稿では,ヒューマンフィードバックを利用した指導視覚編集(HIVE)のための新しいフレームワークを提案する。
具体的には、編集された画像に対する人間のフィードバックを収集し、報酬関数を学習して、基礎となるユーザの好みをキャプチャする。
次に、推定報酬に基づいて人間の好みを組み込むスケーラブルな拡散モデル微調整手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:47:41 GMT)
DIRE for Diffusion-Generated Image Detection [129.0] 拡散再構成誤り(DIRE)という新しい表現を提案する。
DIREは、予め訓練された拡散モデルにより、入力画像とその再構成画像間の誤差を測定する。
DIREは生成されたイメージと実際のイメージを区別するためのブリッジとして機能する、というヒントを提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:15:03 GMT)
Global Knowledge Calibration for Fast Open-Vocabulary Segmentation [124.7] 本稿では,各学習カテゴリの同義語群を生成するテキスト多様化戦略を提案する。
また,CLIPの汎用的な知識を維持するために,テキスト誘導型知識蒸留法を用いている。
提案手法は, 各種データセットに対して頑健な一般化性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:51:41 GMT)
SoftZoo: A Soft Robot Co-design Benchmark For Locomotion In Diverse
Environments [111.9] 我々は,多様な環境下での移動を支援するソフトロボットの共同設計プラットフォームであるSoftZooを紹介する。
SoftZooは、平らな地面、砂漠、湿地、粘土、氷、雪、浅い水、海などの環境をシミュレートする機能など、自然にヒントを得た幅広い素材セットをサポートしている。
それは、高速な移動、アジャイルな回転、パスフォローなど、ソフトロボティクスに関連するさまざまなタスクを提供し、形態学と制御のための微分可能な設計表現を提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:50 GMT)
Visual-Linguistic Causal Intervention for Radiology Report Generation [107.3] 自動ラジオグラフィーレポート生成(RRG)のためのクロスモーダルデータバイアスを明示的に排除することは困難である。
本稿では,視覚分解モジュール(VDM)と言語分解モジュール(LDM)からなるRRGのための新しい視覚言語因果干渉(VLCI)フレームワークを提案する。
我々のVLCIは最先端のRRG法よりも優れています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:23:55 GMT)
ART: Automatic multi-step reasoning and tool-use for large language
models [105.6] 大規模言語モデル(LLM)は、数秒とゼロショットの設定で複雑な推論を行うことができる。
各推論ステップは、コアLLM機能を超えて計算をサポートする外部ツールに依存することができる。
プログラムとして中間推論ステップを自動生成するために凍結LDMを使用するフレームワークであるART(Automatic Reasoning and Tool-use)を導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 01:04:45 GMT)
Unified Visual Relationship Detection with Vision and Language Models [96.7] この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデル(VLM)を利用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
私たちのボトムアップ設計は、オブジェクト検出と視覚的関係データセットの両方でトレーニングを楽しむことができます。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:06:28 GMT)
Large Selective Kernel Network for Remote Sensing Object Detection [96.3] 我々はLarge Selective Kernel Network (LSKNet)を提案する。
LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。
2022年、グレーターベイエリア国際アルゴリズムコンペティションで2位となった。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:00:37 GMT)
Investigating Failures to Generalize for Coreference Resolution Models [94.0] 本稿では,現在のコア参照解決モデルの誤差が,データセット間での運用方法の相違にどの程度関連しているかを検討する。
具体的には、モデル性能をいくつかのタイプのコア参照に対応するカテゴリに分け、分解する。
このブレークダウンは、異なるコア参照タイプをまたいだ一般化能力において、最先端モデルがどのように異なるかを調べるのに役立ちます。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:32:02 GMT)
SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving [93.9] 3Dシーン理解は、視覚に基づく自動運転において重要な役割を果たす。
マルチカメラ画像を用いたSurroundOcc法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:08 GMT)
DiffIR: Efficient Diffusion Model for Image Restoration [90.3] 拡散モデル(DM)は、画像合成過程をデノナイジングネットワークのシーケンシャルな応用にモデル化することで、SOTA性能を達成した。
本稿では,小型IR先行抽出ネットワーク(CPEN),動的IR変換器(DIRformer),デノナイジングネットワーク(denoising network)からなるIR(DiffIR)のための効率的なDMを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:47:14 GMT)
VideoFusion: Decomposed Diffusion Models for High-Quality Video
Generation [85.6] 本研究は, フレームごとのノイズを, 全フレーム間で共有されるベースノイズ, 時間軸に沿って変化する残雑音に分解することで, 拡散過程を分解する。
様々なデータセットの実験により,ビデオフュージョンと呼ばれる我々の手法が,高品質なビデオ生成において,GANベースと拡散ベースの両方の選択肢を上回ることが確認された。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:12:31 GMT)
TriDet: Temporal Action Detection with Relative Boundary Modeling [85.5] 既存の手法はビデオのあいまいな動作境界による不正確な境界予測に悩まされることが多い。
本稿では,その境界付近の相対確率分布を推定して,行動境界をモデル化する新しいトライデントヘッドを提案する。
TriDetは3つの挑戦的なベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:26:39 GMT)
MixCycle: Mixup Assisted Semi-Supervised 3D Single Object Tracking with
Cycle Consistency [79.3] 3Dシングルオブジェクトトラッキング(SOT)は、自動走行の必要不可欠な部分である。
教師なし2次元SOTにおけるサイクルトラッキングの大成功に触発されて,我々は最初の半教師付きアプローチを3次元SOTに導入した。
具体的には,1) 学習の初期段階においてモデルをよりよく収束させるためにラベルを利用する自己追跡サイクル,2) 運動変動に対するトラッカーの頑健さとテンプレート更新戦略によるテンプレートノイズを補強する前向きサイクル,という2つのサイクル整合性戦略を導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:48:59 GMT)
Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [77.9] 超解像のためのネットワークプルーニングの可能性について検討し、既製のネットワーク設計を活用し、基礎となる計算オーバーヘッドを低減する。
本稿では,各イテレーションにおけるランダム勾配ネットワークのスパース構造を最適化し,新しい反復型軟収縮率(ISS-P)法を提案する。
提案したISS-Pは、最適化プロセスに適応したスパース構造を動的に学習し、より規則化されたスループットを得ることでスパースモデルのトレーニング性を維持することができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:06:13 GMT)
On the Interplay Between Misspecification and Sub-optimality Gap in
Linear Contextual Bandits [76.2] 本研究では,線形関数クラスによって期待される報酬関数を近似できるような,不特定条件下での線形文脈帯域について検討する。
このアルゴリズムは, 対数的因子に比例した設定において, ギャップ依存の残差が$tilde O (d2/Delta)$と同じであることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:24:29 GMT)
Jump to Conclusions: Short-Cutting Transformers With Linear
Transformations [76.0] トランスフォーマーベースの言語モデル(LM)は、各層で入力の隠れ表現を生成するが、予測には最終層表現のみを使用する。
線形変換を用いた簡単な鋳造法を提案する。
提案手法は,隠れ表現を検査する一般的な手法よりも正確な近似を導出することを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:10:16 GMT)
StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized
Tokenizer of a Large-Scale Generative Model [74.3] 本論文では,自然言語を用いて抽象芸術スタイルを記述するスタイル転送手法であるStylerDALLEを提案する。
具体的には、非自己回帰的なトークンシーケンス変換として、言語誘導型転送タスクを定式化する。
スタイル情報を組み込むために,CLIPに基づく言語指導による強化学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:44:44 GMT)
Identifiability Results for Multimodal Contrastive Learning [72.2] 本研究では,以前研究したマルチビュー設定よりも,より一般的な設定で共有要因を復元可能であることを示す。
本研究は,マルチモーダル表現学習の理論的基盤を提供し,マルチモーダルコントラスト学習を実践的に効果的に設定する方法を説明する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:14:26 GMT)
PSVT: End-to-End Multi-person 3D Pose and Shape Estimation with
Progressive Video Transformers [71.7] 本稿では,プログレッシブ・ビデオ・トランスフォーマーを用いたエンドツーエンドのマルチパーソン3D・形状推定フレームワークを提案する。
PSVTでは、時空間エンコーダ(PGA)は空間オブジェクト間のグローバルな特徴依存性をキャプチャする。
時間の経過とともにオブジェクトの分散を処理するために、プログレッシブデコーディングの新しいスキームが使用される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:55:43 GMT)
Learning Logic Specifications for Soft Policy Guidance in POMCP [71.7] 部分観測可能なモンテカルロ計画(POMCP)は部分観測可能なマルコフ決定過程(POMDP)の効率的な解法である
POMCPはスパース報酬機能、すなわち最終ゴールに達するときのみ得られる報酬に悩まされる。
本稿では,POMCP実行のトレースから論理仕様を学習するために帰納的論理プログラミングを用いる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:37:10 GMT)
SpectralCLIP: Preventing Artifacts in Text-Guided Style Transfer from a
Spectral Perspective [70.9] 対照的に、CLIP(Contrastive Language- Image Pre-Training)は、幅広い視覚言語横断タスクのために、最先端の技術を更新した。
CLIPを直接使用してスタイルの転送をガイドすると、望ましくないアーティファクトがイメージ上に広がります。
本稿では,CLIPビジョンエンコーダ上にスペクトルフィルタリング層を実装したSpectralCLIPを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:53:07 GMT)
GLEN: General-Purpose Event Detection for Thousands of Types [69.6] 我々は,3,465種類のイベントを対象とする汎用イベント検出データセットGLENを構築した。
GLENはDWD Overlayを利用して作成され、Wikidata QnodesとPropBankのロールセット間のマッピングを提供する。
また,GLENにおける大きなオントロジーサイズと部分ラベルを扱うために設計された,新しい多段階イベント検出モデルを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:36:38 GMT)
MATIS: Masked-Attention Transformers for Surgical Instrument
Segmentation [65.7] Masked-Attention Transformer for surgery Instrument (MATIS)
本手法は,映像変換器による長期映像レベル情報を取り入れ,時間的整合性の向上とマスク分類の強化を図る。
我々の実験は、MATISのフレーム単位のベースラインが従来の最先端手法よりも優れており、時間的一貫性モジュールを含めることで、モデルの性能をさらに向上させることを示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:31:40 GMT)
FateZero: Fusing Attentions for Zero-shot Text-based Video Editing [65.3] 本研究では,FateZeroを提案する。FateZeroは,実世界のビデオに対して,プロンプトごとのトレーニングや使用専用のマスクを使わずに,ゼロショットのテキストベースの編集手法である。
本手法は、ゼロショットテキスト駆動型ビデオスタイルと、訓練されたテキスト・ツー・イメージモデルからローカル属性を編集する機能を示す最初の方法である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:51:13 GMT)
Unified Multi-Modal Latent Diffusion for Joint Subject and Text
Conditional Image Generation [63.1] 本稿では, 特定対象を含む画像と共同テキストを入力シーケンスとして用いた, Unified Multi-Modal Latent Diffusion (UMM-Diffusion) を提案する。
より具体的には、入力テキストと画像の両方を1つの統一マルチモーダル潜在空間に符号化する。
入力テキストと画像の両面から複雑な意味を持つ高品質な画像を生成することができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:50:20 GMT)
Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.9] リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:52:45 GMT)
ShabbyPages: A Reproducible Document Denoising and Binarization Dataset [59.5] ShabbyPagesは新しいドキュメントイメージデータセットである。
本稿では,ShabbyPagesの作成プロセスについて議論し,人間の知覚力の高い実雑音の特徴を除去する畳み込みデノイザの訓練によるShabbyPagesの有用性を実証する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:19:50 GMT)
Steering Prototype with Prompt-tuning for Rehearsal-free Continual
Learning [58.6] プロトタイプベースの手法は, セマンティックドリフトとプロトタイプ干渉による急激な性能劣化に悩まされている。
本研究では,Contrastive Prototypeal Prompt (CPP)を提案し,対照的な学習目的に最適化されたタスク固有のプロンプトチューニングが,両方の障害に効果的に対処可能であることを示す。
実験の結果、CPPは4つの挑戦的なクラス増分学習ベンチマークに優れており、その結果、最先端の手法よりも4%から6%の絶対的な改善が得られた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:23:13 GMT)
Efficient Learning of High Level Plans from Play [57.3] 本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:09:47 GMT)
You Can Ground Earlier than See: An Effective and Efficient Pipeline for
Temporal Sentence Grounding in Compressed Videos [56.7] ビデオがトリミングされていない場合、時間的文のグラウンド化は、文問合せに従って目的のモーメントを意味的に見つけることを目的としている。
それまでの優れた作品は、かなり成功したが、それらはデコードされたフレームから抽出されたハイレベルな視覚的特徴にのみ焦点を当てている。
本稿では,圧縮された映像を直接視覚入力として利用する,圧縮された領域のTSGを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:34:27 GMT)
Efficient Diffusion Training via Min-SNR Weighting Strategy [56.3] 拡散学習をマルチタスク学習問題として扱い,Min-SNR-$gamma$と呼ばれるシンプルなアプローチを導入する。
本結果は,従来の重み付け手法よりも3.4$times$高速で収束速度が大幅に向上したことを示す。
さらに効果的で、ImageNetの256times256$ベンチマークで2.06の新たなFIDスコアを達成した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:56 GMT)
NeRFMeshing: Distilling Neural Radiance Fields into
Geometrically-Accurate 3D Meshes [56.3] 我々は、NeRF駆動のアプローチで容易に3次元表面を再構成できるコンパクトで柔軟なアーキテクチャを提案する。
最後の3Dメッシュは物理的に正確で、デバイスアレイ上でリアルタイムでレンダリングできます。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:06:03 GMT)
GridCLIP: One-Stage Object Detection by Grid-Level CLIP Representation
Learning [55.8] 一段階検出器GridCLIPはグリッドレベルの表現を学習し、一段階検出学習の本質的な原理に適応する。
実験により、学習したCLIPベースのグリッドレベル表現は、アンダーサンプリングされた(稀で新しい)カテゴリのパフォーマンスを高めることが示された。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:06:02 GMT)
Factoring the Matrix of Domination: A Critical Review and Reimagination
of Intersectionality in AI Fairness [55.0] 間欠性は、社会的不平等の持続性を調べるための重要な枠組みである。
我々は、公平性を効果的に運用するために、交差性を分析的枠組みとして採用することが重要であると論じる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:02:09 GMT)
A Picture is Worth a Thousand Words: Language Models Plan from Pixels [53.9] 計画は, 実環境下で長時間の作業を行う人工エージェントの重要な機能である。
本研究では,事前学習型言語モデル(PLM)を用いて,具体的視覚環境におけるテキスト命令からのプランシーケンスを推論する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:02:18 GMT)
TemporalMaxer: Maximize Temporal Context with only Max Pooling for
Temporal Action Localization [52.2] 我々は,抽出したビデオクリップの特徴から情報を最大化しながら,長期の時間的文脈モデリングを最小化するTemporalMaxerを紹介する。
我々は、TemporalMaxerが、長期時間文脈モデリングを利用した他の最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:11:26 GMT)
TypeT5: Seq2seq Type Inference using Static Analysis [51.2] 本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 23:48:00 GMT)
$P+$: Extended Textual Conditioning in Text-to-Image Generation [50.8] テキスト・ツー・イメージ・モデルでは$P+$と呼ばれる拡張テキスト・コンディショニング・スペースを導入します。
拡張空間は画像合成に対してより密接な制御と制御を提供することを示す。
さらに、拡張テキスト変換(XTI)を導入し、画像は$P+$に変換され、層単位のトークンで表現される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:38:15 GMT)
Towards a Smaller Student: Capacity Dynamic Distillation for Efficient
Image Retrieval [49.0] 従来の知識蒸留に基づく効率的な画像検索手法は,高速推論のための学生モデルとして軽量なネットワークを用いる。
本稿では,編集可能な表現能力を持つ学生モデルを構築するための容量動的蒸留フレームワークを提案する。
提案手法は,教師としてのResNet101を前提として,VeRi-776データセットなどの推論速度と精度が優れている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:09:22 GMT)
Patch-Token Aligned Bayesian Prompt Learning for Vision-Language Models [48.4] ラベル固有のプロンプトを階層的に生成する。
我々は視覚知識と画像とそれに対応するプロンプトを最適輸送下でパッチやトークンセットとして意味的に正規化する。
提案手法は,インスタンス条件付きプロンプトを生成して一般化性を向上させる条件付きケースに容易に拡張できる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:09:15 GMT)
Grab What You Need: Rethinking Complex Table Structure Recognition with
Flexible Components Deliberation [47.5] 新たに提案したコンポーネント・ディリベレータを備えた,GrabTabと呼ばれるセミナル手法を提案する。
本手法は,特に難易度の高い場面において,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:37:38 GMT)
Multimodal Feature Extraction and Fusion for Emotional Reaction
Intensity Estimation and Expression Classification in Videos with
Transformers [47.0] 我々は,野生(ABAW)2023における2つの影響行動分析のサブチャレンジに対して,その解決策を提示する。
The Emotional Reaction Intensity (ERI) Estimation Challenge, our method showed excellent results with a Pearson coefficient on the validation dataset, compare the baseline method by 84%。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:03:17 GMT)
Learning a Room with the Occ-SDF Hybrid: Signed Distance Function
Mingled with Occupancy Aids Scene Representation [46.6] 符号付き距離関数表現と幾何学的先行表現を用いた暗黙的ニューラルレンダリングは、大規模シーンの表面再構成において顕著な進歩をもたらした。
我々は,原色レンダリング損失と先行組込みSDFシーン表現の限界を識別する実験を行った。
非ゼロな特徴値を用いて最適化信号を返却する特徴ベースの色レンダリング損失を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:34:02 GMT)
A Survey of Deep Visual Cross-Domain Few-Shot Learning [46.1] ラベル付きデータしか持たない新しいクラスを認識できるため、手書き転送学習は研究の中心となっている。
CDFS(Cross-Domain Few-Shot)の研究はこの問題に対処するために現れ、より困難で現実的な設定を形成している。
問題設定と対応ソリューションの観点から,CDFSの詳細な分類法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:06:59 GMT)
DeepMIM: Deep Supervision for Masked Image Modeling [46.0] 深層学習の初期の画像分類において、深層管理が広く用いられた。
正規化技術と残差接続が出現すると、画像分類の深い監督は徐々に段階的に消えていった。
マスク・アンド・予測方式を用いてビジョン・トランスフォーマー(ViT)を事前訓練するマスクド・イメージ・モデリング(MIM)の深い監督について検討する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:05:46 GMT)
AU-aware graph convolutional network for Macro- and Micro-expression
spotting [44.5] 我々はAUW-GCN(Action-Unit-aWare Graph Convolutional Network)と呼ばれるグラフ畳み込み型ネットワークを提案する。
先行情報を注入し、小さなデータセットの問題に対処するために、AU関連統計データをネットワークにエンコードする。
その結果, 2つのベンチマークデータセットにおいて, ベースライン手法を一貫して向上させ, 新たなSOTA性能を実現することができた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:00:36 GMT)
Predicting Human Attention using Computational Attention [44.1] 本研究では,注意制御の両形態を予測する単一モデルであるヒューマン・アテンション・トランスフォーマー(HAT)を提案する。
HATは、目標現在および目標存在時における固定のスキャンパスを予測し、タスクレス自由視聴固定のスキャンパスの予測においてSOTAと一致または超過する新しい最先端(SOTA)である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:13:09 GMT)
GLASU: A Communication-Efficient Algorithm for Federated Learning with
Vertically Distributed Graph Data [44.0] 本稿では,クライアントとサーバ間でバックボーンGNNを分割するモデル分割手法と通信効率のよいGLASUを提案する。
提案アルゴリズムは,実世界のデータセットに対する理論的解析と広範な数値実験を行い,中央集権的な学習を行うと,バックボーンのGNNと性能が一致するGNNモデルを効果的に訓練することを示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:47:55 GMT)
LOCATE: Localize and Transfer Object Parts for Weakly Supervised
Affordance Grounding [43.2] 人間は観察を通して知識を得るのが得意です。
このスキルを得るための重要なステップは、オブジェクトのどの部分がそれぞれのアクションに余裕があるかを特定することです。
画像間のマッチング対象を識別できるLOCATEというフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:47:49 GMT)
Learning Physical-Spatio-Temporal Features for Video Shadow Removal [43.0] データ駆動型ビデオシャドウ除去モデルであるedNetを提案する。
具体的には、複雑な照明テクスチャを持つシーンに適用可能な局所照明推定を行うために、専用の物理的ブランチが設けられた。
シャドウビデオと組み合わせたデータセットの欠如に対処するため、シャドウのスイッチを制御することで、人気のあるゲームGTAVの助けを借りてデータセットを合成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:55:31 GMT)
FactReranker: Fact-guided Reranker for Faithful Radiology Report
Summarization [42.8] 本稿では,FactRerankerを提案する。FactRerankerは,予測された事実整合性スコアに基づいて,すべての候補から最適な要約を選択する。
ファクトガイドによるリランカを,ファクト知識グラフ生成とファクトスコアアに分解する。
2つのベンチマークデータセットによる実験結果から,結果の整合性が高い要約を生成する上で,本手法が優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:09:09 GMT)
A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2] コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:03:52 GMT)
Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation [41.3] DiffGesture (DiffGesture) という,拡散に基づく新しいフレームワークを提案する。
DiffGestureは、より優れたモードカバレッジとより強力なオーディオ相関を備えたコヒーレントなジェスチャーをレンダリングする、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:32:31 GMT)
Rethinking Model Ensemble in Transfer-based Adversarial Attacks [40.9] 敵対的攻撃は、深層学習モデルの弱点をブラックボックス方式で識別することができる。
我々は、より移動可能な敵の例を生成するために、CWA(Common Weakness Attack)を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:37:16 GMT)
MultiModal Bias: Introducing a Framework for Stereotypical Bias
Assessment beyond Gender and Race in Vision Language Models [40.1] MMBiasと呼ばれる視覚的およびテキスト的バイアスベンチマークを提供し、約3,800の画像と14のサブグループをカバーするフレーズからなる。
このデータセットを用いて、CLIP、ALBEF、VLTを含むいくつかの著名な自己監督型マルチモーダルモデルにおけるバイアスを評価する。
バイアスを緩和するための後処理ステップとして適用可能な,大規模な事前学習モデルに特化して設計されたデバイアス処理手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:36:37 GMT)
DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot
Object Detection [39.9] 汎用的な少ショットオブジェクト検出は、豊富なアノテーションと限られたトレーニングデータを持つ新しいクラスで、両方のベースクラス上で正確な検出を実現することを目的としている。
既存のアプローチは、ベースクラスのパフォーマンスを犠牲にして、数ショットの一般化を促進する。
クラス間分離とクラス内コンパクト性の幾何学的特徴を学習するための新しいトレーニングフレームワークDiGeoを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:37:09 GMT)
Depth Super-Resolution from Explicit and Implicit High-Frequency
Features [38.5] 本稿では,多段深度超解像ネットワークを提案する。
高分解能深度マップを明示的かつ暗黙的な高周波特徴から徐々に再構成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:33:24 GMT)
Contrastive Semi-supervised Learning for Underwater Image Restoration
via Reliable Bank [38.5] 平均教師付きtextbfSemi-supervised textbfUnderwater textbfImage textbfRestoration (textbfSemi-UIR) フレームワークを提案する。
提案アルゴリズムは,SOTA法よりも定量的に,質的に明らかに改善されていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:14:18 GMT)
Cross-head Supervision for Crowd Counting with Noisy Annotations [37.5] ノイズの多いアノテーションはモデルのトレーニング、特に密度マップベースのメソッドに大きく影響します。
本研究では, 1つの畳み込み頭部と1つの変圧器頭部を有する群集カウントモデルを提案する。
結果のモデルであるCHS-Netは、様々な種類の帰納バイアスを相乗化して、より良いカウントを行うことができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:45:52 GMT)
VEIL: Vetting Extracted Image Labels from In-the-Wild Captions for
Weakly-Supervised Object Detection [36.8] ノイズキャプションから抽出したラベルを「拒否」する手法を提案する。
本手法は,抽出されたラベルが実際に画像に存在するか否かを予測する分類器を訓練する。
提案手法はデータセットの境界を越えて一般化し,カテゴリ間での一般化を約束する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:28:37 GMT)
Aerial-Ground Person Re-ID [36.7] 我々は,航空カメラと地上カメラをまたいで,人による再IDマッチングを行う新しいベンチマークデータセット AG-ReID を提案する。
データは、高度15~45mのUAVと、大学のキャンパスで地上のCCTVカメラによって収集されました。
我々のデータセットは、カメラ間で人物の外観が著しく異なるため、人物のリIDに対する新たな視点課題を提示している。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:32:42 GMT)
Highly Accurate Quantum Chemical Property Prediction with Uni-Mol+ [36.6] 量子化学(QC)特性の予測に取り組み,Uni-Mol+と呼ばれる新しい手法を提案する。
コンフォーメーションを効果的に最適化するために、Uni-Mol+で2トラックトランスフォーマーモデルバックボーンを導入し、QC特性予測タスクと共にトレーニングする。
提案したUni-Mol+がQC特性予測の精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:51:34 GMT)
LERF: Language Embedded Radiance Fields [35.9] Language Embedded Radiance Fields (LERF) は、CLIPのような市販のモデルからNeRFへの言語埋め込みを基盤とする手法である。
LERFは、トレーニング線に沿ってCLIP埋め込みをボリュームレンダリングすることで、NeRF内の密集したマルチスケール言語フィールドを学習する。
最適化後、LERFは広範囲の言語プロンプトに対してリアルタイムに3D関連性マップを抽出できる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:20 GMT)
SemDeDup: Data-efficient learning at web-scale through semantic
deduplication [34.4] 本稿では,事前学習したモデルの埋め込みを利用して意味的重複を識別・除去するSemDeDupを紹介する。
SemDeDupは、パフォーマンス損失を最小限に抑え、トレーニング時間の半減を効果的に行うことができることを示す。
また、部分的にキュレートされたデータセットであるC4でトレーニングされた言語モデルの解析により、SemDeDupは、効率の向上を提供しながら、以前のアプローチよりも改善されていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:53:24 GMT)
Among Us: Adversarially Robust Collaborative Perception by Consensus [34.4] 複数のロボットは、シーン(例えば物体)を個人よりも協調的に知覚することができる。
本稿では,未知の攻撃者に対して一般化可能な新しいサンプリングベース防衛戦略であるROBOSACを提案する。
自律運転シナリオにおける協調3次元物体検出の課題に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:15:25 GMT)
Narrator: Towards Natural Control of Human-Scene Interaction Generation
via Relationship Reasoning [34.0] テキスト記述から現実的で多様なHSIを自然かつ制御的に生成することに焦点を当てる。
本研究では,新たな関係推論に基づく生成手法であるNarratorを提案する。
我々の実験と知覚学的研究は、Narratorが様々な相互作用を制御可能であり、既存の作品よりもはるかに優れていることを示している。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:44:15 GMT)
Adaptive Modeling of Uncertainties for Traffic Forecasting [33.8] QuanTrafficは、不確実性モデリングのための任意のDNNモデルの能力を高めるための一般的なフレームワークである。
DNNモデルトレーニング中に標準量子関数を自動的に学習し、単一点予測の予測間隔を生成する。
テスト入力の位置と予測ウィンドウに基づいて予測間隔を動的に調整する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:56:13 GMT)
Only Pay for What Is Uncertain: Variance-Adaptive Thompson Sampling [31.0] ほとんどのバンディットアルゴリズムは、報酬の分散または上限が知られていると仮定する。
分散過大評価は通常安全かつ健全であるが、後悔を増す。
このことは、分散対応の頻繁なアルゴリズムに関する先行研究を動機付けている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:07:29 GMT)
Rehearsal-Free Domain Continual Face Anti-Spoofing: Generalize More and
Forget Less [30.7] Face Anti-Spoofing (FAS) は、最近、継続的な学習環境下で研究されている。
既存のメソッドでは、リハーサルのために前のデータを格納するために余分なリプレイバッファが必要です。
ドメイン継続学習のための最初のリハーサルのない手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:22:53 GMT)
Mimic3D: Thriving 3D-Aware GANs via 3D-to-2D Imitation [30.0] 本稿では,3D-to-2Dの模倣という新たな学習手法を提案する。
また、3D表現学習を改善するために、ジェネレータに3D対応の畳み込みを導入する。
その結果,FFHQとAFHQ-v2のFIDスコアは512×512でそれぞれ5.4点,AFHQ-v2 Catsでは4.3点に達した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:18:41 GMT)
Instance-Conditioned GAN Data Augmentation for Representation Learning [29.4] DA_IC-GANは、学習可能なデータ拡張モジュールで、ほとんどの最先端のトレーニングレシピと組み合わせて、棚外で使用することができる。
DA_IC-GAN は最大容量モデルで 1%p から 2%p の精度を向上できることを示す。
また,DA_IC-GANを自己指導型トレーニングレシピと組み合わせることで,いくつかの設定で1%pの精度向上が達成できることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:45:43 GMT)
Let 2D Diffusion Model Know 3D-Consistency for Robust Text-to-3D
Generation [29.2] 3DFuseは、事前訓練された2D拡散モデルに3D認識を組み込む新しいフレームワークである。
本研究では,2次元拡散モデルを用いて,粗い3次元構造内の誤差や空間の分散を学習し,ロバストな生成を可能にするトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:03:42 GMT)
InCrowdFormer: On-Ground Pedestrian World Model From Egocentric Views [28.5] 我々は,地上の歩行者が地上の観衆のまわりを移動する様子を予測できる,地上の歩行者世界モデルを紹介した。
InCrowdFormerは、歩行者のインタラクションをモデル化してTransformerアーキテクチャを完全に活用し、注目を集めてトップダウンのビュー変換に重点を置いている。
我々は、歩行者の位置の後方分布を予測するために、未知の歩行者の高さから生じる不確実性を潜時符号で符号化する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:51:02 GMT)
Unsupervised Facial Expression Representation Learning with Contrastive
Local Warping [28.1] 我々は, 顔表情解析において, 顔表情表現の非教師的表現表現(UFER)は, 探索に相応しいものであり, 重要な課題に対処する可能性があると考えている。
コントラスト局所ワープ(ContraWarping)を用いたUFER法を提案する。
1)グローバルトランスフォーメーションの正のペアは、一般的な自己教師型学習(例えばBYOL)によって活用され、すでにいくつかの情報的特徴を持ち、2)局所的なワーピングの負のペアは、表現関連の変化を明示的に導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:09:47 GMT)
Psychotherapy AI Companion with Reinforcement Learning Recommendations
and Interpretable Policy Dynamics [27.8] 本稿では、患者反応に基づくセラピストのためのトピックレコメンデーションを生成する強化学習心理療法AIコンパニオンを紹介する。
このシステムは、Deep Reinforcement Learning (DRL)を使用して、4つの異なる精神状態に対する多目的ポリシーを生成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:01:29 GMT)
Self-Consistent Learning: Cooperation between Generators and
Discriminators [27.4] GAN(Generative Adversarial Network)は,共同トレーニングを実現するために,識別モデルを用いて生成モデルを訓練する。
本稿では,識別器とジェネレータをクローズドループ形式で協調的に学習するフレームワークであるtextitself-consistent Learning$フレームワークを提案する。
このフレームワークは、トレーニングが容易で、モード崩壊や非収束といった不安定性がないことを証明しています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:21:19 GMT)
How well do Large Language Models perform in Arithmetic tasks? [25.6] 数学の単語問題に段階的に答えるチェーンオブ思考を含む、大きな言語モデルが出現した。
我々の知る限りでは、大規模言語モデルの算術能力を評価することに注力する作業はない。
本研究では,最新の大規模言語モデルをテストするための算術データセットMATH 401を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:28:15 GMT)
Effectively Modeling Time Series with Simple Discrete State Spaces [25.0] 時系列モデリングのための新しい状態空間時系列アーキテクチャであるSpaceTimeを紹介する。
表現性を示すために,共役行列に基づく新しいSSMパラメータ化を提案する。
長期の地平線予測のために、同伴SSMの「閉ループ」変動を導入する。
効率的なトレーニングと推論のために,前列行列による前列パスのメモリと計算を削減できるアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:08:21 GMT)
Emotional Reaction Intensity Estimation Based on Multimodal Data [24.4] 本稿では,感情反応強度(ERI)推定法について紹介する。
発声器が提供するマルチモーダルデータに基づいて,事前学習した異なるモデルを用いて,音響的特徴と視覚的特徴を抽出する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:14:47 GMT)
A Comprehensive Study on Post-Training Quantization for Large Language
Models [24.3] 後学習量子化(ptq)は、近年、大規模言語モデルのメモリ消費と/または計算コストを削減するための妥協手法として示されている。
数万のゼロショット実験に対して、これらの成分について広範な研究を行っている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:34:52 GMT)
A High-Performance Accelerator for Super-Resolution Processing on
Embedded GPU [24.1] 組み込みデバイス上でのフルスタックSRアクセラレーションフレームワークを実装した。
ディープ辞書学習ベースのSRモデルにおける通信と計算のボトルネックは、完全に取り組まれている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:09:09 GMT)
Conditionally Optimistic Exploration for Cooperative Deep Multi-Agent
Reinforcement Learning [24.1] 協調型マルチエージェント強化学習(MARL)における効率的な探索の重要性
理論的に正当化された木探索アルゴリズムUCTのアイデアに基づいて協調探索を効果的に促進する探索手法を提案する。
様々な共同MARLベンチマークによる実験により、ハード探索タスクにおける現在の最先端探査手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:05:16 GMT)
Achieving a Better Stability-Plasticity Trade-off via Auxiliary Networks
in Continual Learning [23.2] 本稿では、ニューラルネットワークに現在の課題を学習する能力を持たせるために、補助的ネットワーク継続学習(ANCL)を提案する。
ANCLは、主に安定性に焦点を当てた継続的な学習モデルに可塑性を促進する補助ネットワークを付加する。
より具体的には、提案するフレームワークは、可塑性と安定性を自然に補間する正規化器として実現されている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:00:42 GMT)
SVDE: Scalable Value-Decomposition Exploration for Cooperative
Multi-Agent Reinforcement Learning [22.4] 本稿では、スケーラブルなトレーニング機構、本質的な報酬設計、爆発的体験再生を含む、スケーラブルな価値分解探索(SVDE)手法を提案する。
提案手法は,StarCraft IIマイクロマネジメントゲームにおいて,他の一般的なアルゴリズムと比較して,ほぼすべてのマップ上で最高の性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:17:20 GMT)
Visual Analytics of Multivariate Networks with Representation Learning
and Composite Variable Construction [22.3] 本稿では,多変量ネットワーク研究のための視覚解析ワークフローを提案する。
それは、データを分類するニューラルネットワークベースの学習フェーズ、次元の削減と最適化フェーズ、ユーザが実行する解釈フェーズで構成される。
ニューラルネットワークから得られる非線形特徴を直感的に解釈できる線形特徴にモデル化する複合変数構築ステップが,我々の設計の鍵となる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:31:18 GMT)
MixTeacher: Mining Promising Labels with Mixed Scale Teacher for
Semi-Supervised Object Detection [22.0] オブジェクトインスタンス間のスケールの変動は、オブジェクト検出タスクにおいて依然として重要な課題である。
そこで本研究では,混成型教師を導入することで,尺度変動問題に対処する新しい枠組みを提案する。
各種半教師付き環境下でのMS COCOおよびPASCAL VOCベンチマーク実験により,本手法が新たな最先端性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:37:54 GMT)
Exploring Distributional Shifts in Large Language Models for Code
Analysis [21.3] コードのための2つの大きな言語モデル(CodeT5とCodex)の能力を研究し、ドメイン外のデータに一般化する。
私たちはデータを、その自然な境界に沿って、組織、プロジェクト、そしてソフトウェアプロジェクト内のモジュールによって、ドメインに分割しました。
複数のドメインに適応したモデルが、各ドメインに適応したモデルと同時に動作していることが分かりました。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:45:46 GMT)
CoLo-CAM: Class Activation Mapping for Object Co-Localization in
Weakly-Labeled Unconstrained Videos [21.2] 弱教師付きビデオオブジェクトのローカライゼーション手法は、しばしば視覚的およびモーション的キューのみに依存し、不正確なローカライゼーションの影響を受ける。
本稿では,オブジェクトの移動に関する仮定を伴わずに,アクティベーションマップの時間情報を活用するために,オブジェクトの局所化のための新しい手法を提案する。
共同学習は、すべての画像位置、およびすべてのフレーム間のピクセル間の直接通信を生成し、学習されたローカライゼーションの転送、集約、修正を可能にする。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:29:53 GMT)
Gate Recurrent Unit Network based on Hilbert-Schmidt Independence
Criterion for State-of-Health Estimation [20.9] State-of-Health (SOH) 推定は、バッテリーの安全性と信頼性を確保するための重要なステップである。
既存の方法の多くは、時間と労力がかかる健康的特徴抽出技術を必要とする。
Hilbert-Schmidt Independence Criterion(GRU-HSIC)に基づく新しいGRUネットワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:16:21 GMT)
Improving Perceptual Quality, Intelligibility, and Acoustics on VoIP
Platforms [20.8] 本稿では,Deep Noise Suppression (DNS) 2020 Challengeでトレーニングされた微調整モデルを用いて,VoIP(VoIP)アプリケーション上での性能を向上させる手法を提案する。
我々のアプローチは、VoIP通信の特定の音響特性にDNS 2020モデルを適用することである。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:36:02 GMT)
Facial Affective Behavior Analysis Method for 5th ABAW Competition [20.5] 第5回ABAWコンペティションには、Aff-Wild2データベースからの3つの課題が含まれている。
結果を改善するために,3つの異なるモデルを構築した。
3つの課題の実験では、提供されたトレーニングデータに基づいてモデルをトレーニングし、検証データ上でモデルを検証する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:21:10 GMT)
Event-based Human Pose Tracking by Spiking Spatiotemporal Transformer [20.0] 本稿では、イベントベースのポーズトラッキングのためのエンドツーエンドのテクスチャパース深層学習手法を提案する。
これにより、入力の一部として任意のフレームベースの画像にアクセスする必要がなくなる。
提案手法はFLOPSの20%削減を実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:56:12 GMT)
SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning [19.8] 自己教師付き学習(SSL)は、データ表現の学習と符号化に一般的に用いられるアプローチである。
本稿では,SSLエンコーダのバックドア攻撃の検出と軽減を目的としたSSL-Cleanseと呼ばれる革新的な手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:45:06 GMT)
Maximum Margin Learning of t-SPNs for Cell Classification with Filtering [19.7] t-SPNアーキテクチャはマージンを最大化することで学習される。
L2-regularization (REG) は学習過程における最大限界(MM)基準とともに検討される。
HEp-2 と Feulgen のベンチマークデータセットでは,正則化による最大マルジン基準に基づいて t-SPN アーキテクチャを学習した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:45:46 GMT)
SUD$^2$: Supervision by Denoising Diffusion Models for Image
Reconstruction [19.0] 多くの逆画像問題$suchnox2014$は、パラメータが未知あるいは未知であるため困難である。
このような問題はデータと組み合わせて解決できるが、そのようなデータは利用できないことが多い。
本稿では,画像ネットワークをデノベートするためのフレームワークを訓練するためのトレーニングを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:42:24 GMT)
Wiki-based Communities of Interest: Demographics and Outliers [19.0] Wikiの情報源によると、このデータはホワイトハウスコロナウイルスタスクフォースのメンバーなど7.5万のコミュニティをカバーしている。
主観的およびグループ中心のデータセットをフォーマットで、またブラウジングインターフェースとしてリリースします。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:58:11 GMT)
SmartBERT: A Promotion of Dynamic Early Exiting Mechanism for
Accelerating BERT Inference [18.5] 本稿では,SmartBERT と呼ばれる BERT 推論のための動的早期退避と層スキップを併用した新しい動的早期退避法を提案する。
SmartBERTは、いくつかのレイヤを適応的にスキップし、終了するかどうかを適応的に選択できる。
GLUEベンチマークの8つの分類データセットについて実験を行った。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:44:16 GMT)
NEF: Neural Edge Fields for 3D Parametric Curve Reconstruction from
Multi-view Images [18.3] キャリブレーションされた多視点画像から物体の3次元特徴曲線を再構成する問題について検討する。
ニューラルエッジ場(NEF)と呼ばれる3次元エッジの密度分布を表すニューラル暗黙フィールドを学習する。
NEFは、所定のビューで2次元エッジマップを描画するビューベースのレンダリングロスで最適化され、そのビューの画像から抽出された接地トラスエッジマップと比較される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:22:50 GMT)
GDDS: Pulmonary Bronchioles Segmentation with Group Deep Dense
Supervision [17.9] グループ深度スーパービジョン(GDDS)に基づく気管支分別法を提案する。
GDDSは局所的な密集トポロジを巧みに構築し、特定の浅い特徴層に密集トポロジ学習を実装することで提案される。
BASベンチマークデータセットを用いた実験により,本手法はネットワークを微細な枝の捕捉に高い感度で促進することを示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:35:32 GMT)
Neural Architecture Search for Effective Teacher-Student Knowledge
Transfer in Language Models [17.3] 本稿では,教師からの蒸留に最適な学生モデルを見つけるために,ニューラルネットワーク探索(NAS)を用いたKD-NASを提案する。
NASは知識蒸留プロセスによって指導され、教師から蒸留のための最適な学生モデルを見つける。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:39:44 GMT)
Dataflow graphs as complete causal graphs [17.2] 我々は、フローベースプログラミング(FBP)というソフトウェア設計の代替手法を考える。
ソフトウェアプロジェクトの日々のタスクを改善するために、この接続をどのように活用できるかを示します。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:13 GMT)
Reliable Image Dehazing by NeRF [16.7] 本稿では,高品質で広いアプリケーション,データトレーニングや事前の必要のない画像復調アルゴリズムを提案する。
そこで本研究では,光散乱モデルとコンピュータグラフィックスライティングレンダリングモデルの組み合わせにより,従来のデハージングモデルの欠陥を分析し,新しい信頼性の高いデハージング再構成およびデハージングモデルを提案する。
新しいヘイズモデルとカメラが取得した画像に基づいて、三次元空間を再構築し、空間内の物体やヘイズを正確に計算し、ヘイズの透明な関係を利用して正確なヘイズ除去を行う。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:34:03 GMT)
Variational Principles for Mirror Descent and Mirror Langevin Dynamics [16.5] ミラー降下(Mirror descend)は1970年代にネミロフスキーとユディンによって導入された原始二重凸最適化法である。
本稿では、ミラー降下の変分定式化と、その変分であるミラーランゲヴィンダイナミクスを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:48:39 GMT)
LCS-TF: Multi-Agent Deep Reinforcement Learning-Based Intelligent
Lane-Change System for Improving Traffic Flow [16.3] 既存のインテリジェントレーン変更ソリューションは主に、エゴ車の性能を最適化することに焦点を当てている。
近年、マルチエージェント強化学習(MARL)に基づくアプローチへの関心が高まっている。
本稿では,エゴ車両の局部性能を両立させるために設計したAV用ハイブリッドMARLを用いたインテリジェントレーン交換システムを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:03:17 GMT)
3D Masked Autoencoding and Pseudo-labeling for Domain Adaptive
Segmentation of Heterogeneous Infant Brain MRI [16.3] 本稿では,MAPSeg(Masked Autoencoding and Pseudo-labelling)と呼ばれる新しいフレームワークを紹介し,クロスエイジ,クロスモーダリティ,クロスサイトセグメンテーションの課題に対処する。
異なる年齢やサイトから取得したエキスパートアノテートデータセットについて,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:01:50 GMT)
Orthogonal Directions Constrained Gradient Method: from non-linear
equality constraints to Stiefel manifold [16.1] 直交方向制約法(ODCGM)という新しいアルゴリズムを提案する。
ODCGMはベクトル空間へのプロジェクションのみを必要とする。
以上より, ODCGMは, ほぼ最適のオラクル複合体を呈することを示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:25:53 GMT)
Mobiprox: Supporting Dynamic Approximate Computing on Mobiles [16.0] デバイス上での深層学習において,フレキシブルな精度を実現するフレームワークMobiproxを提案する。
Mobiproxはテンソル演算の調整可能な近似を実装し、個々のネットワーク層の実行時適応を可能にする。
推定精度に最小限の影響を及ぼすことなく、最大15%のシステムワイドエネルギーを節約できることを実証した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:40:23 GMT)
Image Classifiers Leak Sensitive Attributes About Their Classes [16.0] 第1級属性推論攻撃(Caia)について紹介する。
Caiaはブラックボックスの設定で個々のクラスの機密属性を推論する。
カイアは、髪の色、性別、人種的外観など、未公表の繊細な属性を正確に推測できることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:10:58 GMT)
Gradient flow on extensive-rank positive semi-definite matrix denoising [15.7] 本研究では,広範かつ高次元の条件下での正半定値行列デノナイジング問題に対する勾配流の解析を行うための新しい手法を提案する。
問題の行列平均二乗誤差の完全時間進化を追跡する固定点方程式を導出する。
得られた定点方程式の予測は数値実験により検証される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:50:46 GMT)
Diffusion-HPC: Generating Synthetic Images with Realistic Humans [15.5] 拡散HPCは、人体構造に関する事前の知識を注入することにより、可視なポーズを持つ写真リアリスティック画像を生成する。
拡散HPCは,人間の世代におけるリアリズムを効果的に改善することを示す。
世代には地上の真実として機能する3Dメッシュが伴うため、Diffusion HPCの生成したイメージ-メッシュペアは、下流のヒューマンメッシュリカバリタスクに適している。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:53:44 GMT)
Data Roaming and Early Fusion for Composed Image Retrieval [15.4] コンポジション画像検索 (CoIR) について検討し, クエリは画像とテキストの2つのモダリティから構成され, ユーザの表現能力を拡張している。
従来の手法では、通常、各クエリのモダリティを個別に符号化し、次に抽出した特徴を遅く融合させることで、このタスクに対処する。
本稿では,CASE(Cross-Attention driven Shift)という手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:02:24 GMT)
PartNeRF: Generating Part-Aware Editable 3D Shapes without 3D
Supervision [15.1] PartNeRFは、編集可能な3D形状合成のための部分認識生成モデルであり、明示的な3D監督を必要としない。
我々のモデルは、アフィン変換で拡張された局所的に定義されたNeRFの集合としてオブジェクトを生成する。
これにより、パーツへの変換の適用、異なるオブジェクトからのパーツの混合など、いくつかの編集操作が可能になる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:59:22 GMT)
A Multimodal Data-driven Framework for Anxiety Screening [15.0] 我々は,MMD-ASというデータ駆動型不安スクリーニングフレームワークを提案し,スマートフォンによる200人以上の船員の健康データ収集実験を行った。
モデルの性能向上のために,提案フレームワークの特徴抽出,次元縮小,特徴選択,不安推定を共同で訓練した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:25:05 GMT)
Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.8] 本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:49:05 GMT)
Spectral CUSUM for Online Network Structure Change Detection [14.5] 本稿では、未知のネットワーク構造変化を検出するために、Spectral-CUSUMと呼ばれるオンライン変更検出アルゴリズムを提案する。
スペクトルCUSUM法の平均走行距離(ARL)と予測検出遅延(EDD)を特徴付け,その最適性を示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:54:32 GMT)
Hubs and Hyperspheres: Reducing Hubness and Improving Transductive
Few-shot Learning with Hyperspherical Embeddings [14.2] いくつかの点(ハーブ)は、他の点の複数の最も近い近傍リストで頻繁に発生する。
ハブネスは、あるクラスからのハブが他のクラスからの最も近いポイントの隣人の中にしばしば現れるとき、距離ベースの分類に悪影響を及ぼす。
我々は超球面上に表現を埋め込むための2つの新しいアプローチを提案し、均一性と局所類似性保存とのトレードオフを最適化することを証明した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:32:22 GMT)
ESCAPE: Countering Systematic Errors from Machine's Blind Spots via
Interactive Visual Analysis [14.0] 本稿では,系統的エラーに対応するためのヒューマン・イン・ザ・ループ・ワークフローを促進する視覚解析システムであるESCAPEを提案する。
このシステムでは, 利用者が素早い関連を検査しやすくすることで, 利用者が自然に関連付けられた誤分類を認識できるようにする。
また、概念と事例の関連をより正確に定量化するための相対的概念関連法と、急激な関連を緩和するためのデバイアス法という2つの統計的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:29:50 GMT)
WebSHAP: Towards Explaining Any Machine Learning Models Anywhere [13.9] 我々は,最新のモデルに依存しない説明可能性技術 SHAP を Web 環境に適用する最初のブラウザ内ツールである WebSHAP を提案する。
我々のオープンソースツールは、クライアントサイドのハードウェア機能を利用するWebGLのようなモダンなWeb技術で開発されています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:56:02 GMT)
Graph Neural Network Surrogates of Fair Graph Filtering [13.9] 後続目的に対するフィルタ対応ユニバーサル近似フレームワークを提案する。
これにより、実行時にトレーニングされた適切なグラフニューラルネットワークが、フィルタと同じようなものになる。
私たちは、パリティ制約を満たす際の代替手段よりも、我々のアプローチが等しく良いか、あるいは優れていることを示しています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:56:37 GMT)
Enhancing COVID-19 Severity Analysis through Ensemble Methods [13.8] 本稿では、新型コロナウイルス患者の感染症領域を抽出するためのドメイン知識に基づくパイプラインを提案する。
感染の重症度は、3つの機械学習モデルのアンサンブルを使用して異なるカテゴリに分類される。
提案システムは,AI-Enabled Medical Image Analysis WorkshopとCOVID-19診断コンペティションの検証データセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:59:24 GMT)
Image Enhancement for Remote Photoplethysmography in a Low-Light
Environment [13.7] 遠隔心拍モニタリング技術の精度は大幅に向上した。
アルゴリズムの大幅な進歩にもかかわらず、rアルゴリズムの性能は長期的に低下する可能性がある。
ビデオ撮影における照明不足は生理的信号の品質を損なう。
提案手法は, パルス信号の信号対雑音比と精度の向上に有効である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:18:48 GMT)
Knowledge Transfer for Pseudo-code Generation from Low Resource
Programming Language [13.7] 我々は、並列コード-擬似コードデータを用いて、高リソースPL(C++)で訓練されたコード-擬似コードニューラルモデルによって得られた知識の伝達に焦点をあてる。
後方翻訳により生成されたC符号の成功率を23.27%向上させる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:38:08 GMT)
Tribe or Not? Critical Inspection of Group Differences Using TribalGram [13.7] グループプロファイリングやグループレベルの分析は、政策作成や直接マーケティングなど、多くの領域で採用されている。
本研究では,グループ分化の必要性を解明し,集団の過度な一般化を防止するために,説明可能なグループ分析設計ガイドラインの集合を同定する。
設計ガイドラインに従って,解釈可能な機械学習アルゴリズムと可視化を活用するビジュアル分析スイートであるTribalGramを開発した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:47:48 GMT)
A Dual Branch Network for Emotional Reaction Intensity Estimation [12.7] 両分岐型マルチアウトプット回帰モデルであるABAW(Affective Behavior Analysis in-wild)のERI問題に対する解法を提案する。
空間的注意は視覚的特徴をよりよく抽出するために使用され、Mel-Frequency Cepstral Coefficients技術は音響的特徴を抽出する。
本手法は,公式な検証セットにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:31:40 GMT)
The Scope of In-Context Learning for the Extraction of Medical Temporal
Constraints [11.8] 医学的時間的制約 (MTC) は、患者の教育材料と臨床テキストの両方において薬物使用ガイドライン (DUG) に見出される。
我々は, DUG に含まれる MTC の新たな分類法を開発し,非構造化 DUG から MTC を表す新しい文脈自由文法(CFG) モデルを開発した。
我々は、DUGsで見つかったMCCを自動的に抽出し、正規化するインコンテキスト学習(ICL)ソリューションを開発し、すべてのデータセットの平均F1スコアが0.62に達する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:51:44 GMT)
Exploring Weakly Supervised Semantic Segmentation Ensembles for Medical
Imaging Systems [11.7] 画像中の医療条件の信頼性の高い分類と検出のための枠組みを提案する。
我々のフレームワークは、まず低しきい値CAMを用いてターゲットオブジェクトを高い確実性でカバーする。
我々は,BRATSでは最大8%,DECATHLONデータセットでは6%の改善ダイススコアを実証した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:09:58 GMT)
Vision Transformer for Action Units Detection [11.5] 本稿では,行動単位検出(AU)の課題に対処するためのビジョントランスフォーマーに基づくアプローチを提案する。
我々はビデオビジョン変換器(ViViT)ネットワークを用いて、映像の時間的顔の変化を捉える。
我々のモデルはABAW 2023チャレンジのベースラインモデルよりも優れており、結果として顕著な14%の違いがある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:43:02 GMT)
Decentralized Riemannian natural gradient methods with Kronecker-product
approximations [11.3] 本稿では,分散化多様体最適化問題の解法として,効率的な分散化自然勾配降下法(DRNGD)を提案する。
クロネッカー因子を介して通信を行うことにより、RFIMの高品質な近似を低コストで得ることができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:36:31 GMT)
Authority without Care: Moral Values behind the Mask Mandate Response [10.8] マスクは、新型コロナウイルス(COVID-19)などの航空病に対して、最も安価で効果的な非医薬的介入の1つである。
本研究では,マスク委任統治に対する反応の根底にある潜在的道徳的価値観を明らかにするとともに,それを国家の政治的背景に当てはめる。
われわれはTwitter上でのマスクに関する議論をモニターしている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:08:16 GMT)
DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion [10.8] 1つ以上の文字フォントをスタイリングすることで,芸術的タイポグラフィーを自動的に生成する新しい手法を提案する。
提案手法では,大規模言語モデルを用いてテキストや視覚画像をブリッジしてスタイリングし,教師なし生成モデルを構築する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:12:52 GMT)
NAISR: A 3D Neural Additive Model for Interpretable Shape Representation [10.4] 解釈可能な形状表現のための3次元ニューラル付加モデルを提案する。
本手法は, 形状人口の傾向を把握し, 形状移動による患者固有の予測を可能にする。
小児上気道の形状再構成, 形状異方性, 形状変化, 形状移動について, NAISRを評価した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:18:04 GMT)
Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection [10.1] 本稿では,コモンセンスの知識を活用し,粗粒度物体検出器の高精度検出を支援する手法を提案する。
実験の結果,提案手法は,精度,モデルサイズ,処理遅延の点で,ベンチマーク検出器よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 01:39:11 GMT)
Tackling Clutter in Radar Data -- Label Generation and Detection Using
PointNet++ [10.1] クラッタを識別するための2つの新しいニューラルネットワーク構成を提案する。
入力データ、ネットワークアーキテクチャ、トレーニング設定は、このタスクのために特別に調整される。
オブジェクトアノテーションで既存のデータに適用し、そのコードをリリースすることで、我々は、初めて利用可能なレーダークラッタデータセットを効果的に作成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:46:32 GMT)
Sequential Gaussian Processes for Online Learning of Nonstationary
Functions [10.0] 連続モンテカルロアルゴリズムは,オンラインの分散推論を可能としながら,非定常挙動を捉えたGPの無限混合に適合する。
提案手法は,時系列データにおける非定常性の存在下でのオンラインGP推定における最先端手法の性能を実証的に改善する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:10:40 GMT)
Block-wise Bit-Compression of Transformer-based Models [9.8] 再学習を伴わない変圧器のブロックワイドビット圧縮法であるBBCTを提案する。
GLUE(General Language Understanding Evaluation)のベンチマークテストの結果,ほとんどのタスクにおいて,BBCTは1%未満の精度低下を達成できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:53:57 GMT)
Hybrid Spectral Denoising Transformer with Learnable Query [9.7] ハイブリットスペクトルデノナイジング用ハイブリットスペクトルデノナイジングトランス(HSDT)を提案する。
我々のHSDTは、計算オーバーヘッドを低く保ちながら、既存の最先端手法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:24:31 GMT)
From MNIST to ImageNet and Back: Benchmarking Continual Curriculum
Learning [9.1] 継続学習(CL)は、機械学習研究で最も有望なトレンドの1つである。
6つの画像データセットから複数の異種タスクを含む2つの新しいCLベンチマークを導入する。
さらに、タスクが複雑化と減少の順序で表されるように、ベンチマークを構造化します。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:11:19 GMT)
Goal-conditioned Offline Reinforcement Learning through State Space
Partitioning [9.0] オフライン強化学習(RL)は、オフラインデータセットのみを使用してシーケンシャルな決定ポリシーを推論することを目的としている。
我々は,その利点にもかかわらず,分散シフトやマルチモダリティ問題を完全に解決するには,このアプローチは依然として不十分である,と論じる。
本稿では,帰納的バイアスの新たな源となる相補的優位性に基づく重み付け手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:52:53 GMT)
PyVBMC: Efficient Bayesian inference in Python [8.9] PyVBMCは、後方およびモデル推論のための変分ベイズモンテカルロ (VBMC) アルゴリズムのPython実装である。
VBMCは、モデル評価が軽度から極端に高価である場合に、効率的なパラメータ推定とモデル評価のために設計されている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:37:22 GMT)
Preoperative Prognosis Assessment of Lumbar Spinal Surgery for Low Back
Pain and Sciatica Patients based on Multimodalities and Multimodal Learning [8.8] 低腰痛 (LBP) と坐骨神経痛 (sciatica) は、重度の痛みに症状がある場合に外科的治療を必要とすることがある。
前もって手術成績を評価する効果的な手段はない。
この研究は、東方医学と機械学習の要素を組み合わせて、術前評価ツールを開発した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:06:06 GMT)
Model Based Explanations of Concept Drift [8.7] 概念ドリフト(concept drift)とは、観測データを生成する分布が時間とともに変化する現象を指す。
ドリフトが存在する場合、機械学習モデルは不正確になり、調整が必要である。
本稿では,空間的特徴の特徴的な変化の観点から,概念の漂流を特徴付ける新しい技術を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:03:56 GMT)
Shifted-Windows Transformers for the Detection of Cerebral Aneurysms in
Microsurgery [8.5] 本稿では,フレームレベルの専門家アノテーションを用いた16の手術ビデオを含むMACSデータセットについて紹介する。
手術用顕微鏡の視野に存在する大動脈瘤とビデオフレームを識別する手術シーン理解のための学習手法を提案する。
提案手法は, 独立した集合を用いた多次元クロスバリデーション実験と, 人間の10名に対する15枚の画像集合を用いて評価した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:58:48 GMT)
Transformer-based Planning for Symbolic Regression [8.1] シンボリック回帰のためのトランスフォーマーに基づく計画戦略を提案する。
この戦略は、モンテカルロ木探索をトランスフォーマーデコーディングプロセスに組み込む。
我々の手法は最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:19:01 GMT)
IRIS: Interpretable Rubric-Informed Segmentation for Action Quality
Assessment [7.9] スポーツビデオのアクションクオリティアセスメント(AQA)は、オリンピックの審査員を模倣して、2つ目の意見として、あるいはトレーニングのためにパフォーマンスを評価するのに役立つ。
これらのAIメソッドは解釈不能であり、アルゴリズムのアカウンタビリティにとって重要なスコアを正当化しない。
Informed on action sequences for AQA。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:01:21 GMT)
Efficient Computation Sharing for Multi-Task Visual Scene Understanding [7.9] マルチタスク学習は、異なるタスク間で知識を共有することでリソースを保存できる。
複数の視覚的タスクを実行するための効率と精度のバランスをとる新しいパラメータ共有フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:47:40 GMT)
Trustera: A Live Conversation Redaction System [7.9] Trusteraは、個人識別可能な情報(PII)をリアルタイムで会話する最初のシステムである。
コール後のリアクションとは対照的に、音声マスキングは、顧客がPIIエンティティに話しかけ始めるとすぐに開始される。
Trusteraは現在、何千ものエージェントが顧客の機密情報を保護するために使用しています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:13:36 GMT)
All4One: Symbiotic Neighbour Contrastive Learning via Self-Attention and
Redundancy Reduction [7.8] 我々は、All4Oneと呼ばれる新しい対照的なSSLアプローチを提案する。
我々は、Centroid Contrastingの目標と、1つのNeighbour ContrastingとFeature Contrastingの目標を使用する。
この組み合わせにより、All4Oneは、線形分類評価において、人気のあるインスタンス識別アプローチを1%以上上回ることができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:51:59 GMT)
Prompting Large Language Models With the Socratic Method [7.7] 本稿では,GPT-3と相互作用するプロンプトテンプレートの開発において,ソクラティック手法を用いた体系的アプローチを提案する。
様々な方法が検討され、創造性や想像力を育みながら、正確な答えと正当化をもたらすものが特定される。
対話開始前にタスクの目標とユーザ意図がChatGPTを介してGPT-3に伝達されると、大きな言語モデルがインテントで表現された外部コンテキストに接続し、より効果的に実行する、という興味深い観察がなされた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 01:19:06 GMT)
CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script
Handwritten Text Recognition [7.4] 我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:27:45 GMT)
Visual Information Matters for ASR Error Correction [7.3] キャプションをプロンプトとして使用することで、視覚情報を効果的に利用し、ワードエラー率(WER)の最大1.2%で最先端の手法を超えることができる。
本論文は,1) 視覚情報を組み込んでECを支援するための方法として, ゲート融合とイメージキャプションを併用する簡易かつ効果的な手法,2) 大規模ベンチマークデータセット,すなわち Visual-ASR-EC を提供する。
実験結果から,字幕をプロンプトとして使用すれば,単語誤り率(WER)が最大1.2%向上し,視覚情報を効果的に活用できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:33:53 GMT)
Explaining Groups of Instances Counterfactually for XAI: A Use Case,
Algorithm and User Study for Group-Counterfactuals [7.2] 類似事例群を包括的に説明する新たなユースケースについて検討する。
集団のカウンターファクトは、複数の事象や事件を網羅する、一貫性のある幅広い説明を人間の好みに適合させる。
結果から,AIシステムに対する理解は軽微だが,明確な改善が見られた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:16:50 GMT)
Security of discrete-modulated continuous-variable quantum key
distribution [7.1] エントロピー累積定理を適用し、コヒーレント攻撃に対する有限サイズのセキュリティを証明する。
すべての情報を識別するプロトコルを考える。
我々の分析は、$n=1012$ラウンドの非自明な鍵レートを提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:14:07 GMT)
EmotiEffNet Facial Features in Uni-task Emotion Recognition in Video at
ABAW-5 competition [7.1] 第5回ABAW(Affective Behavior Analysis in-the-Wild)コンペティションの結果を報告する。
The use of the pre-trained convolutional network from the EmotiEffNet family for frame-level feature extract。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:57:33 GMT)
Unsupervised domain adaptation by learning using privileged information [6.7] 教師なしドメイン適応(UDA)は、強い前提の下でのみ保証される。
ソースとターゲットドメインからサンプルのサイド情報にアクセスすることは、これらの仮定を緩和するのに役立ちます。
本稿では,解析にインスパイアされた単純な2段階学習アルゴリズムと,マルチラベル画像分類のための実用的エンドツーエンドアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:31:50 GMT)
Learning Rewards to Optimize Global Performance Metrics in Deep
Reinforcement Learning [6.7] 我々は,グローバルな性能指標を最適化できる新しいRL法LR4GPMを提案する。
いくつかの領域におけるLR4GPMの効率を実証する。
特に、LR4GPMは最近の自動運転コンペで優勝者を上回っている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 01:43:18 GMT)
ELFIS: Expert Learning for Fine-grained Image Recognition Using Subsets [6.6] ファイングラインド・ビジュアル・認識のためのエキスパート・ラーニング・フレームワークであるELFISを提案する。
ニューラルネットワークベースのエキスパートのセットは、メタカテゴリに焦点を当ててトレーニングされ、マルチタスクフレームワークに統合される。
実験では、CNNとトランスフォーマーベースのネットワークを使用して、最大+1.3%の精度でSoTA FGVRベンチマークが改善された。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:45:19 GMT)
Self-Supervised Visual Representation Learning on Food Images [6.6] 既存の深層学習手法は、食品画像の人間のアノテーションに基づいて、下流タスクの視覚的表現を学習する。
実生活のほとんどの食品画像はラベルなしで取得され、データアノテーションには多くの時間と人的労力が必要です。
本稿では,食品画像における自己指導型学習手法の実装と分析に焦点をあてる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:31:51 GMT)
Embedding Theory of Reservoir Computing and Reducing Reservoir Network
Using Time Delays [6.5] 貯留層計算(Reservoir Computing, RC)は、複雑な物理系の再構築や予測において、その異常な有効性と高い性能のために爆発的な発展を遂げている。
ここでは、RCがもともと入力された非線形力学系の高次元埋め込みであることを厳密に証明する。
我々は、いくつかの代表的な物理系を再構成し予測するためにRCのネットワークサイズを著しく削減し、より驚くべきことに、時間遅延のある単一ニューロン貯水池のみを用いることで、これらのタスクを達成するのに十分な場合がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:25:51 GMT)
Translating Radiology Reports into Plain Language using ChatGPT and
GPT-4 with Prompt Learning: Promising Results, Limitations, and Potential [6.4] ChatGPTは5点系において平均4.1のスコアでラジオロジーレポートを平易な言語に変換することに成功した。
ChatGPTは、時折単純化された情報や無視された情報によって、応答のランダム性を示す。
その結果, GPT-4は報告の質を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:21:39 GMT)
Energy Management of Multi-mode Plug-in Hybrid Electric Vehicle using
Multi-agent Deep Reinforcement Learning [6.4] 多モードプラグインハイブリッド電気自動車(PHEV)技術は、脱炭に寄与する経路の1つである。
本稿では,多モードPHEVのエネルギー管理のためのマルチエージェント深部強化学習(MADRL)法について検討する。
統合DDPG設定と0.2の妥当性比を用いて,MADRL法は単一エージェント法と比較して最大4%の省エネが可能となる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:31:55 GMT)
Rethinking Certification for Higher Trust and Ethical Safeguarding of
Autonomous Systems [6.2] 自律運転システムの現在の認定プロセスを変更する必要性について論じる。
提案した認証戦略に関するいくつかの問題を特定し,システムに大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:19:25 GMT)
DSDP: A Blind Docking Strategy Accelerated by GPUs [6.2] 我々は,従来の学習手法と機械学習手法の両方の利点を生かし,ブラインドドッキングの性能を向上させるために,Deep Site and Docking Pose (DSDP) を提案する。
DSDPは、2つのトップ1成功率 (RMSD 2 AA) に達する。
DUD-EデータセットとEquiBind, TankBind, DiffDockで使用される時間分割PDBBindデータセットのパフォーマンスも有効である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:00:21 GMT)
Can Generative Pre-trained Transformers (GPT) Pass Assessments in Higher
Education Programming Courses? [6.2] 我々は,Pythonプログラミングコースにおける後続レベルでの評価をパスするために,GPT(Generative Pre-trained Transformer)の有効性を評価した。
GPTモデルがオートグレーダのフィードバックをいかに活用するかを検討した。
これらの容易なモデルを簡単に適用することで、学習者が利用可能な総合的なスコアの非自明な部分を得ることができることは明らかである。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:58:45 GMT)
MetaRegNet: Metamorphic Image Registration Using Flow-Driven Residual
Networks [5.8] 本稿では,時間変動流を用いた深部メタモルフィック画像登録ネットワーク(MetaRegNet)を提案する。
そこで我々はMetaRegNetを脳腫瘍のBraTS 2021と肝腫瘍の3D-IRCADb-01の2つのデータセットで評価した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:24:13 GMT)
Network-based Control of Epidemic via Flattening the Infection Curve:
High-Clustered vs. Low-Clustered Social Networks [5.8] クラスタネットワークは一般的に、感染曲線をフラットにするのが簡単である。
距離に基づく集中度対策は、隔離/ワクチン接種のために個人を標的にするためのより良い選択である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:37:21 GMT)
Measuring Improvement of F$_1$-Scores in Detection of Self-Admitted
Technical Debt [5.8] 変換器(BERT)アーキテクチャからの双方向表現を利用した新しいアプローチによりSATDの検出を改善する。
トレーニングされたBERTモデルは、プロジェクト横断シナリオにおいて、20プロジェクト中19プロジェクトにおいて、以前のすべてのメソッドの最高のパフォーマンスよりも改善されていることが分かりました。
今後の研究では、SATDデータセットを多様化して、大きなBERTモデルの潜伏電力を最大化する方法について検討する予定である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:47:38 GMT)
NeRFtrinsic Four: An End-To-End Trainable NeRF Jointly Optimizing
Diverse Intrinsic and Extrinsic Camera Parameters [5.7] ニューラル放射場(NeRF)を用いた新しいビュー合成は、新しい視点から高品質な画像を生成する最先端技術である。
カメラパラメータとNeRFの結合最適化に関する最近の研究は、ノイズ外在カメラパラメータの精製に重点を置いている。
我々はこれらの制限に対処するために、NeRFtrinsic Fourと呼ばれる新しいエンドツーエンドトレーニング可能なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:44:31 GMT)
The Intel Neuromorphic DNS Challenge [5.6] Intelのニューロモルフィックディープノイズ抑制チャレンジ(Intel N-DNS Challenge)は、ユビキタスで商業的なタスクであるリアルタイムオーディオデノイングに取り組みます。
我々は、Intel N-DNS Challengeデータセットのスクリプトと評価コードを自由にアクセス可能にし、コミュニティが金銭的賞品に参加することを奨励し、ニューロモルフィックなベースラインソリューションをリリースする。
この課題の勝者たちは、オーディオのノイズ化、電力とリソースの大幅な増加といった問題に対して、ニューロモルフィックデバイス上で実現可能であることを実証するだろう。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:22:41 GMT)
NLUT: Neuarl-based 3D Lookup Tables for Video Photorealistic Style
Transfer [5.4] ビデオスタイルの転送は、時間的一貫性を維持しつつ、スタイルイメージに類似したフォトリアリスティックなスタイルで生成することが望まれる。
既存の方法はフレーム単位のフォトリアリスティックなスタイル転送を行うことで、非効率で、タイマライズされたビデオの時間的一貫性が保証されない、スタイリングされたビデオシーケンスを得る。
まず、大規模なデータセット上でスタイリングされた3D LUTを生成するニューラルネットワークをトレーニングし、次に、特定のビデオに対してフォトリアリスティックなスタイル転送を行う際に、ビデオ内のビデオとスタイルイメージをデータソースとして選択し、ニューラルネットワークを微調整する。
最後に、ファインによって生成される3D LUTを問い合わせる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:27:40 GMT)
Magnetic Electrides: High-Throughput Material Screening, Intriguing
Properties, and Applications [5.4] 51個の磁性電解質を同定し, それぞれ独自のトポロジカル状態とN2固定性に優れた触媒特性を示した。
磁性電解質の新規な性質は、スピントロニクス、トポロジカルエレクトロニクス、電子放出および高性能触媒としての可能性を示している。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:05:23 GMT)
Proof Number Based Monte-Carlo Tree Search [5.3] 本稿では,モンテカルロ木探索(MCTS)とProof-Number Search(PNS)を組み合わせた新しいゲーム検索アルゴリズムであるPN-MCTSを提案する。
本研究は,MCTS木に蓄積された証明値と防腐数によって得られる付加的な知識を,最終移動選択,部分木の解法,UTT式という3つの領域で定義する。
実験の結果、PN-MCTSは6つのゲームドメインのうち5つ(すべてゴモクを除く)でMCTSを確実に上回り、ライン・オブ・アクションでは96.2%の勝利率を記録した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:27:07 GMT)
Joint Multi-Scale Tone Mapping and Denoising for HDR Image Enhancement [5.3] 本稿では,HDR画像のマルチスケールデノジングとトーンマッピングを併用するフレームワークを提案する。
本モデルでは,既存のHDR復調演算子やトーンマッピング演算子よりも定量的,定性的に優れる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:04:32 GMT)
A transformer-based approach to video frame-level prediction in
Affective Behaviour Analysis In-the-wild [5.2] 第5回感情行動分析コンテストにおける感情分類タスクを扱うためのトランスフォーマーモデルを提案する。
注意モデルと合成データセットを利用して、Aff-Wild2の検証セットで0.4775のスコアを得る。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:13:13 GMT)
Nitrogen-vacancy magnetometry of individual Fe-triazole spin crossover
nanorods [5.0] [Fe(Htrz)(trz)](BF4)(Fe-トリアゾール)スピンクロスオーバー分子は、高スピン(HS)と低スピン(LS)状態の間の熱的、電気的、光学的スイッチングを示す。
ナノ粒子のFe-トリアゾールLS状態の磁気特性を調べるために、窒素空孔(NV)ベースの磁気メトリーが用いられる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:32:27 GMT)
Online to Offline Crossover of White Supremacist Propaganda [5.0] オンラインおよびオフライン環境における白人至上主義プロパガンダの持続性と到達性について検討する。
米国ではオフラインのプロパガンダが地理的に広く普及しており、北東部の州ではわずかに傾向がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:22:34 GMT)
Knowledge Distillation for Adaptive MRI Prostate Segmentation Based on
Limit-Trained Multi-Teacher Models [4.7] 圧縮法と加速技術として知識蒸留(KD)が提案されている。
KDは、負担の多いモデルから軽量モデルに知識を移行できる効率的な学習戦略である。
本研究では,KDに基づく前立腺MRIセグメンテーションの深部モデルを構築し,Kellback-Leiblerの発散,Lovasz,Diceの損失と特徴量に基づく蒸留を組み合わせる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:15:08 GMT)
Style Feature Extraction Using Contrastive Conditioned Variational
Autoencoders with Mutual Information Constraints [4.7] 条件付きVAE(CVAE)は、クラスラベルを使ってスタイルを分離することができるが、ラベルのないデータを使ってスタイルだけを抽出する方法は確立されていない。
ラベルなしデータのみを用いてスタイル特徴を抽出するCVAE方式を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:59:44 GMT)
ODIN: On-demand Data Formulation to Mitigate Dataset Lock-in [4.7] ODINは、生成AIモデルを統合することでデータセット制約の問題に対処する革新的なアプローチである。
プロンプトジェネレータ、テキスト・ツー・イメージジェネレータ、イメージ・ポストプロセッサの3つの主要モジュールで構成されている。
モデル精度とデータ多様性の観点から様々なデータセット上でODINを評価し,その可能性を実証した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:44:50 GMT)
Explainable GeoAI: Can saliency maps help interpret artificial
intelligence's learning process? An empirical study on natural feature
detection [4.5] 本稿では,GeoAIと深層学習モデルの推論行動の解釈において,一般的なサリエンシマップ生成手法とその長所と短所を比較した。
実験では、2つのGeoAI対応データセットを使用して、研究結果の一般化性を実証した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:37:29 GMT)
Symbolic Perception Risk in Autonomous Driving [4.4] 交通標識分類タスクにおける誤認識のリスクを評価するための新しい枠組みを開発する。
視覚的入力品質が徐々に向上する自律運転環境での問題を考える。
条件付き値-at-risk(CVaR)の誤認識のクローズドな表現を示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:49:24 GMT)
State-independent robust heat-bath algorithmic cooling of nuclear spins [4.3] NMR量子プロセッサ上でのロバストで非定常な熱バス・アルゴリズム冷却(HBAC)法の実装を実験的に実証した。
新しいロバストなHBAC法は, 先行状態情報や単一固定操作を使わずに最適なHBACが可能であることを証明した。
最適なHBACが15Nスピンで実験的に実証されたのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:12:42 GMT)
LLMSecEval: A Dataset of Natural Language Prompts for Security
Evaluations [4.3] Codexのような大規模言語モデル(LLM)は、コード補完とコード生成タスクを実行する強力なツールである。
これらのモデルは、パブリックGitHubリポジトリから言語やプログラミングプラクティスを学ぶことによって、自然言語(NL)記述からコードスニペットを生成することができる。
LLMはNL駆動によるソフトウェアアプリケーションのデプロイを約束するが、それらが生成するコードのセキュリティは広く調査されておらず、文書化されていない。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:13:58 GMT)
Rt-Track: Robust Tricks for Multi-Pedestrian Tracking [4.3] 動き情報のモデリングを改善するために,スムーズな軌道予測(STP-DC)のための新しい方向整合性手法を提案する。
また、外観モデルのモデリングを強化するために、HG-FEN(Hyper-grain Feature Embedding Network)を提案する。
そこで我々は,MOTにおける最先端性能を実現するため,Rtトラックと呼ばれるロバストトラッカーを提案し,様々なトリックとテクニックを取り入れた。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:08:29 GMT)
Depth-Aware Image Compositing Model for Parallax Camera Motion Blur [4.2] カメラの動きは、3D世界の奥行きの変化によって空間的に異なるぼやけをもたらす。
深度依存性の異なるぼかしに対して, 単純かつ高精度な画像呈示ブラ (ICB) モデルを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:15:32 GMT)
LDMVFI: Video Frame Interpolation with Latent Diffusion Models [4.2] 既存のビデオフレーム(VFI)の研究は主に、出力と接地木フレームの間のL1またはL2距離を最小化するために訓練されたディープニューラルネットワークを使用している。
本稿では, 遅延拡散モデルに基づくVFI, LDMVFIを提案する。
LDMVFIは,高解像度のシステムであっても,映像コンテンツを高い知覚品質で補間できることを示す実験とユーザスタディを行った。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:24:41 GMT)
Full-Body Cardiovascular Sensing with Remote Photoplethysmography [4.1] リモート光胸腺撮影(r)では、反射光の小さなゆらぎを検出して、カメラからの血流の変化を非接触でモニタリングすることができる。
腕,足,手などの非顔の身体領域からrの実現可能性について検討した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:37:07 GMT)
Improving Automated Hemorrhage Detection in Sparse-view Computed
Tomography via Deep Convolutional Neural Network based Artifact Reduction [4.1] 頭蓋内出血は急速かつ頻繁な治療を必要とする深刻な健康上の問題を引き起こす。
本研究では, スパースビューCCTからのアーティファクトの削減にU-Netアーキテクチャを用い, スパースビューからの完全サンプル再構成を予測した。
我々は, 出血分類畳み込みニューラルネットワークを用いて, 予測されたCCTの出血検出能を評価し, 出血のサブタイプを同定し分類するために, 完全サンプルCCTを用いて訓練を行った。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:21:45 GMT)
On the uncertainty analysis of the data-enabled physics-informed neural
network for solving neutron diffusion eigenvalue problem [4.0] いくつかの観点から中性子拡散固有値問題の計算におけるDEPINNの性能について検討する。
ノイズの影響を低減し,ノイズ先行データの利用を改善するために,革新的な区間損失関数を提案する。
本稿では, 原子炉物理の実用化に向けた改良型DEPINNの実現可能性を確認する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:13:33 GMT)
FindView: Precise Target View Localization Task for Look Around Agents [3.8] 本研究では、FinderViewタスクと呼ばれるエージェントを探索するターゲットビューの正確なローカライゼーションの新規かつ簡単なタスクを提案する。
このタスクは360度メディアのカメラやユーザインタフェースの動きを模倣し、オブザーバーはターゲットと正確に一致するビューを見つけるために「周りを見回す」必要がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:00:20 GMT)
Online Reinforcement Learning in Periodic MDP [3.8] PUCRLBの後悔は、$N$と$mathcalO(sqrtTlog T)$の期間で直線的に変化し、水平長は$T$であることを示す。
本稿では,その期間が未知だが,候補期間の集合が知られている環境における不確実性を拡張するための他の2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:16:45 GMT)
Characterizing Manipulation from AI Systems [3.6] 我々は、他の分野からの操作に関する文献の上に構築し、操作の可能な概念の空間を特徴づける。
本稿では,特徴量に基づく操作の定義を提案する。
第3に,不正や強制など,操作と関連する概念の関連性について論じる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:19:21 GMT)
Team SheffieldVeraAI at SemEval-2023 Task 3: Mono and multilingual
approaches for news genre, topic and persuasion technique classification [3.5] 本稿では,SemEval-2023 Task 3: Finding the category, the framing, and the Persuasion Technique in online news in a multi-lingual setup。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:54:23 GMT)
ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution [3.5] ResDiffは単一画像超解法のための残差構造に基づく新しい拡散確率モデルである。
ResDiffは,より短いモデル収束時間,優れた生成品質,より多様なサンプルで,従来の拡散法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:49:27 GMT)
Revealing Weaknesses of Vietnamese Language Models Through Unanswerable
Questions in Machine Reading Comprehension [2.8] 本稿では,現在のベトナム語モノリンガルモデルの言語弱さと強みを包括的に分析する。
またベトナムのMachine Readingベンチマークにおけるアーティファクトの存在を明らかにした。
提案した修正は,解決不可能な質問の品質向上に役立つ。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:32:58 GMT)
Combining Distance to Class Centroids and Outlier Discounting for
Improved Learning with Noisy Labels [2.7] 本稿では,ノイズラベルの存在下で機械学習モデルを訓練する上での課題に対処する新しいアプローチを提案する。
商品の潜在空間におけるクラスセントロイド間の距離の巧妙な利用と割引戦略を組み合わせることで,ノイズラベルの問題に効果的に対処する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:43:24 GMT)
Human Reaction Intensity Estimation with Ensemble of Multi-task Networks [2.6] 感情反応強度(ERI)は,表情認識タスクにおいて重要な話題である。
本研究では,第5回感情行動分析(ABAW)コンペティションで導入されたERI課題に対して,マルチ感情型タスク学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:35:59 GMT)
Challenges and Opportunities in Quantum Machine Learning [2.6] 量子機械学習(QML)は、特に量子データに対して、データ分析を加速する可能性がある。
ここでは、QMLの現在の方法と応用について概観する。
量子ニューラルネットワークと量子ディープラーニングに焦点をあてて、量子と古典的な機械学習の違いを強調します。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:10:39 GMT)
Recommending the optimal policy by learning to act from temporal data [2.6] 本稿では,Reinforcement (RL) を用いて学習するAIベースのアプローチを提案する。
このアプローチは、実データと合成データセットに基づいて検証され、非政治的なDeep RLアプローチと比較される。
我々のアプローチがDeep RLアプローチと比較し、しばしば克服する能力は、時間的実行データしか利用できないシナリオにおいて、ホワイトボックスのRLテクニックの活用に寄与する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:30:36 GMT)
Distributionally Robust Optimization using Cost-Aware Ambiguity Sets [2.6] 本稿では,分散ロバスト最適化(DRO)のためのあいまい性の新たなクラスを提案する。
得られたDRO法は,高信頼な上限と,サンプル外予測コストの一貫した推定値の両方を提供することを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:41:06 GMT)
Fine-Grained and High-Faithfulness Explanations for Convolutional Neural
Networks [2.4] 本稿では,CAM法を拡張したFG-CAMを提案する。
提案手法は, CAM法の特徴を変化させることなく, CAM法の欠点を解消するだけでなく, LRPとその変種よりも忠実である詳細な説明も生成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:29:05 GMT)
Reclaiming the Digital Commons: A Public Data Trust for Training Data [2.4] 本稿では,基礎モデルのトレーニングデータに対する公的な信頼度制御を提案する。
この信頼は、インターネットをデジタルコモンズとして取り除き、商用モデル開発者に対して、デプロイメントからの収益のパーセンテージをライセンスするべきだ。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:12:43 GMT)
GLH-Water: A Large-Scale Dataset for Global Surface Water Detection in
Large-Size Very-High-Resolution Satellite Imagery [2.3] 本稿では,250個の衛星画像と手動による表層水アノテーションからなるGLH-waterデータセットを提案する。
それぞれの画像サイズは12,800ドル(約12,800円)で、空間解像度0.3mの12,800ピクセル。
GLH-waterのベンチマークを構築するために,代表表面水検出モデル,一般的なセマンティックセグメンテーションモデル,超高分解能セグメンテーションモデルを用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:35:56 GMT)
Robust Evaluation of Diffusion-Based Adversarial Purification [2.2] 拡散法に基づく浄化法は,試験時間における入力データ点からの逆効果を除去することを目的としている。
白箱攻撃はしばしば浄化の堅牢性を測定するために使用される。
本稿では,最先端の対人訓練アプローチに対する競争結果を示す新しい浄化戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:47:59 GMT)
A Quantum SMT Solver for Bit-Vector Theory [2.1] 我々はビットベクトル理論のための量子SMTソルバを開発する。
量子系における重ね合わせの特性により、解法は全ての入力を同時に考えることができる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:32:50 GMT)
Towards correlation self-testing of quantum theory in the adaptive
Clauser-Horne-Shimony-Holt game [2.0] 理論の相関自己テストは、特定の情報処理タスクのパフォーマンスから理論で実現可能な相関の集合を特定できるかどうかという問題に対処する。
これは、現実的な相関の集合が量子集合と一致しないすべての理論を除外できる一般解への第一歩である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:38:26 GMT)
Self-testing of physical theories, or, is quantum theory optimal with
respect to some information-processing task? [2.0] あらゆるシナリオにおいて、量子力学と同じ相関を持つ理論でしか実行できないタスクがあるかどうかを問う。
このような相関自己テストの候補課題を提示し、一般化確率論的理論の範囲で分析する。
いずれも量子論に勝るものはない。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:35:39 GMT)
Logical Implications for Visual Question Answering Consistency [2.0] 本稿では,VQAモデルに広く適用可能な新しい整合損失項を提案する。
本稿では,これらの論理的関係を専用言語モデルを用いて推論し,一貫性損失関数として用いることを提案する。
我々は、VQAイントロスペクションとDMEデータセットに関する広範な実験を行い、我々の手法が最先端のVQAモデルに改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:00:18 GMT)
Learning for Amalgamation: A Multi-Source Transfer Learning Framework
For Sentiment Classification [1.9] 本研究は,1つの事前学習モデルを用いたトランスファーラーニングの一般的な実践を超越した研究である。
いくつかの事前学習モデルから統合埋め込みを学ぶためのフレームワークLIFAを提案する。
ベトナム初の大規模感情分類データベースを構築した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:02:03 GMT)
Short: Basal-Adjust: Trend Prediction Alerts and Adjusted Basal Rates
for Hyperglycemia Prevention [1.9] 現在、安全でない血糖値のタイムリーな治療には、経過が存在している。
予測的BGシナリオ分類のための機械学習(ML)手法を提案する。
予測低血糖と高血糖の標準通知に加えて,BGシナリオ固有の警告メッセージも導入した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:04:05 GMT)
Reinforcement Learning for Omega-Regular Specifications on
Continuous-Time MDP [1.8] 連続時間マルコフ決定過程 (Continuous-time Markov decision process, CTMDP) は、密度時間環境下でのシーケンシャルな意思決定を表現する標準モデルである。
本稿では,CTMDPに対するスカラー報酬信号への正しい翻訳を可能にするアプローチを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:45:38 GMT)
Towards the Scalable Evaluation of Cooperativeness in Language Models [1.8] 我々は, PLMのマルチエージェント行動を理解し, 形成することを目的としている。
クラウドワーカーと言語モデルの両方で、特定の構造でシナリオを生成します。
インストラクションをチューニングしたモデルは、スケールアップ時に協調的と見なされるような振る舞いをする傾向にある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:34:23 GMT)
Fast 3D Volumetric Image Reconstruction from 2D MRI Slices by Parallel
Processing [1.8] ヒト脊髄と脳のMR画像の2次元スライス(2次元)の単一配列からの仮想3次元再構成法を提案する。
われわれのアプローチは、捕獲された物体の内部組織だけでなく、エッジ、形状、大きさの保存に役立ちます。
我々の知る限り、これは2次元スライスからの3次元再構成のためのクリグとマルチプロセッシングに基づく、この種のアプローチの1つである。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:39:11 GMT)
A Framework for Real-time Object Detection and Image Restoration [1.7] 物体検出と画像復元のための2段階フレームワークを提案する。
第1ステージでは、YOLOシリーズアルゴリズムを使用してオブジェクト検出を完了し、画像トリミングを行う。
第二段階では、この研究はSwin Transformerを改善し、新しいアルゴリズムを使ってSwin Transformer層を接続し、新しいニューラルネットワークアーキテクチャを設計する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:01:12 GMT)
Arbitrary Order Meta-Learning with Simple Population-Based Evolution [1.6] 単純個体群に基づく進化は、任意に高次メタ-パラメータを暗黙的に最適化することを示す。
次に、任意順序メタ学習を可能にする最小の自己参照パラメータ化を導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:55:26 GMT)
A Novel Autoencoders-LSTM Model for Stroke Outcome Prediction using
Multimodal MRI Data [1.4] 多モード磁気共鳴画像(MRI)を用いた脳卒中予後予測のための機械学習モデルの提案
提案モデルは,2つのシリアルレベルのオートエンコーダ(AE)から構成される。
次に、LSTMネットワークによって、患者のマルチモーダルな特徴のシーケンスを使用して、結果のスコアを予測する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:00:45 GMT)
Finding Minimum-Cost Explanations for Predictions made by Tree Ensembles [1.3] 木アンサンブルによる予測は,最小限であるだけでなく,コスト関数に対しても最小限である。
まず,現在最先端の代替手段のランタイム性能を超越して,説明の正しさを判断できる高効率なオラクルを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:53:45 GMT)
Zero Curvature Condition for Quantum Criticality [1.3] 本稿では,新しい幾何学的アプローチに基づく量子臨界性の新しいパラダイムを提案する。
量子相転移がこの境界のゼロ曲率点で正確に起こることを実証する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:35:19 GMT)
Extracting the Brain-like Representation by an Improved Self-Organizing
Map for Image Classification [1.3] Hebbian Learning Rule (HLR) は広く注目を集めている。
自己組織化マップ(SOM)は、ニューロン間の接続を確立するために競合するHLRを使用し、教師なしの方法で視覚的特徴を取得する。
本稿では,mlSOMと命名されたマルチワード,マルチコード,ローカルな受容場を備えた改良型SOMを提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:13:12 GMT)
Facial Affect Recognition based on Transformer Encoder and Audiovisual
Fusion for the ABAW5 Challenge [1.2] 本稿では,Valence-Arousal Estimation (VA) Estimation, Expression (Expr) Classification, Action Unit (AU) Detection and Emotional Reaction Intensity (ERI) Estimationの4つのサブチャンジに対する解を提案する。
第5回ABAWコンペティションは、さまざまなモダリティとデータセットを使用した顔認識に焦点を当てている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:47:36 GMT)
Hyper-Reduced Autoencoders for Efficient and Accurate Nonlinear Model
Reductions [1.0] 射影に基づくモデル順序の減少は、ゆっくりと減衰するコルモゴロフ n-幅の問題に対して最近提案されている。
これまで提案された手法の欠点は、高忠実度ソリューションスナップショット上でネットワークをトレーニングする際の潜在的に高い計算コストである。
我々は、高忠実度ソリューションスナップショットのサブサンプルバージョンのみにニューラルネットワークをトレーニングすることで、この欠点を克服する新しい手法を提案し、分析する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:18:33 GMT)
DINAR: Diffusion Inpainting of Neural Textures for One-Shot Human
Avatars [1.0] 本稿では,1枚のRGB画像からリアルなフルボディアバターを作成するためのアプローチを提案する。
本手法は, SMPL-Xボディーモデルと組み合わせた神経テクスチャを用いて, アバターのフォトリアリスティックな品質を実現する。
実験では、最新のレンダリング品質と、新しいポーズや視点への優れた一般化を実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:04:10 GMT)
The fastest generation of multipartite entanglement with natural
interactions [0.9] 2体相互作用を持つハミルトニアンによって生成される量子状態のユニタリ進化を研究する。
我々の主な焦点は、最大7キュービットのGHZ、W、Dicke、そして絶対最大エンタングルド(AME)状態のマルチパート・エンタングルド・グリーンバーガー・ホーネ・ザイリンガー(GHZ)の最速世代である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:26:54 GMT)
Cross-Dimensional Refined Learning for Real-Time 3D Visual Perception
from Monocular Video [0.9] 本稿では3次元シーンの幾何学的構造と意味的ラベルを協調的に知覚する新しいリアルタイム能動的学習法を提案する。
本稿では,3次元メッシュと3次元セマンティックラベリングの両方をリアルタイムに抽出する,エンドツーエンドのクロスディメンテーションニューラルネットワーク(CDRNet)を提案する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:53:29 GMT)
Probabilistic relations for modelling epistemic and aleatoric
uncertainty: its semantics and automated reasoning with theorem proving [0.7] 確率的プログラミング(Probabilistic programming)は、一般的なコンピュータプログラミング、統計的推論、形式的意味論を組み合わせたプログラミングパラダイムである。
私たちの仕事は、Hehner氏の予測確率的プログラミングに基づいていますが、彼の仕事が広く採用されるにはいくつかの障害があります。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 23:36:57 GMT)
Predicting discrete-time bifurcations with deep learning [0.6] 深層学習分類器を訓練し、コディメンジョン-1の5つの局所離散時間分岐に対してEWSを提供する。
これは、広範囲のノイズ強度と分岐へのアプローチ率において、一般的に使用されるEWSよりも優れています。
また、ほとんどの場合において正しい分岐を予測し、特に周期分岐、ニーマルク・サッカー、折りたたみ分岐の精度が高い。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:08:41 GMT)
VFP: Converting Tabular Data for IIoT into Images Considering
Correlations of Attributes for Convolutional Neural Networks [0.5] 本稿では,VFP(Vortex Feature Positioning)という新しい変換手法を提案する。
特徴は画像の中心から渦状に位置決めされ、属性の数によって画像サイズが決定される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 04:02:17 GMT)
Bayesian Generalization Error in Linear Neural Networks with Concept
Bottleneck Structure and Multitask Formulation [0.5] 概念ボトルネックモデル (CBM) は、概念を用いてニューラルネットワークを解釈できるユビキタスな手法である。
CBMでは、出力層と最後の中間層の間に観測可能な値として概念を挿入する。
本研究では,CBMの3層線形ニューラルネットワークにおけるベイズ一般化誤差と自由エネルギーを数学的に明らかにする。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:34:56 GMT)
Segmentation of Retinal Blood Vessels Using Deep Learning [0.3] 網膜血管の形態は、人体の様々な病気を示すことができる。
このプロジェクトは、網膜画像のセグメント化における4つのニューラルネットワークアーキテクチャの性能を比較する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:47:48 GMT)
Multi-modal Variational Autoencoders for normative modelling across
multiple imaging modalities [0.3] 本稿では,T1およびDTIデータ間の主観レベルずれを検出するための2つのマルチモーダルVAE規範モデルを提案する。
提案モデルでは, 疾患を検知し, 重症度を把握し, 患者の認知と相関する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:14:48 GMT)
The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology [0.2] 再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実践に翻訳するために重要である。
NCI Imaging Data Commons (IDC) は >120 のがん画像コレクションの公開リポジトリである。
本稿では,コンパス研究を促進するためのIDCの可能性を探る。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:32:50 GMT)
A full-stack view of probabilistic computing with p-bits: devices,
architectures and algorithms [0.0] pビットを用いた確率計算のフルスタックレビューを提供する。
pビットはエネルギー効率のよい確率システムを構築するのに使用できると我々は主張する。
我々は、機械学習からAIまで、確率的コンピュータの主な応用について概説する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:26:46 GMT)
cito: An R package for training neural networks using torch [0.0] ディープラーニングのためのユーザフレンドリーなRパッケージであるcitoを提示する。
citoは、RユーザーがRのほとんどのモデリング関数で使われるよく知られた公式でディープニューラルネットワークを指定することを可能にする。
citoには、予測のための多くのユーザフレンドリな機能と、適合したモデルのための説明可能な人工知能(xAI)パイプラインが含まれている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:54:20 GMT)
Web and Mobile Platforms for Managing Elections based on IoT And Machine
Learning Algorithms [0.0] 本研究では,E投票システムの4つの側面に着目した。
E投票における世界で最も頻繁に発生する問題は、システムのセキュリティ、正確性、信頼性である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 02:31:02 GMT)
Um banco de dados de empregos formais georreferenciados em cidades
brasileiras [0.0] この研究は、ブラジルの都市で正式な仕事の場所を示すデータベースを作成することを提案する。
この方法は、RAISジョブデータベースとCNEFEストリートフェイスデータベースを使用して、都市部におけるジョブの位置を推測する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:08:07 GMT)
Towards Robust Bangla Complex Named Entity Recognition [0.0] 本稿では,Bangla Complex Named Entity Recognition Challengeの勝利解を提案する。
データセットはトレーニング用15300文と検証用800文で構成されている。
また,バングラ語におけるNERに対するBanglaBERTなどのディープラーニングモデルの有効性を示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:31:31 GMT)
Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics [0.0] Spotifyから収集したTeluguの歌詞を手動で注釈付けしたデータセットを提示する。
2つの分類手法を用いて2つの音楽感情認識モデルを作成する。
データセットを、歌詞、アノテーション、Spotify IDで公開しています。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:47:52 GMT)
The Wave-Particle Duality in a Quantum Heat Engine [0.0] 波動粒子双対性(WPD)によると、量子系は粒子のような挙動と波動のような振舞いを示す。
我々は、ボソニックな量子熱エンジンを、波動に基づくものと粒子に基づくものとの2つの古典的な熱機関と比較する。
どちらの古典モデルも量子エンジンの平均出力パワーを再現するが、どちらも変動を再現しない。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:42:18 GMT)
The Geometry of Causality [0.0] 我々は因果関係、非局所性、文脈性の研究のための統一的な枠組みを提供する。
我々は、入力履歴の任意の空間と入力コンテキストの任意の選択について、因果関係を定義する。
任意の因果制約に対して因果分離性の概念を導入する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 01:11:47 GMT)
Temporality and Causality in Abstract Argumentation [0.0] 本稿では,非循環的抽象的議論フレームワークの概念をアクション言語に書き換える形式的手法を提案する。
我々は、直接的・間接的に、議論と結果の間の因果関係を確立する。
解答セットプログラミングの実装も提案されている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:13:47 GMT)
Taking advantage of a very simple property to efficiently infer NFAs [0.0] 文法推論は、形式文法を有限状態機械または書き直し規則の集合として学習することで構成される。
我々は、ある単語を受け入れなければならない非決定論的有限オートマタ(NFA)を推測し、与えられたサンプルから他の単語を拒絶することに関心がある。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 13:36:55 GMT)
SwinVFTR: A Novel Volumetric Feature-learning Transformer for 3D OCT
Fluid Segmentation [0.0] 3DボリュームCT画像の精密な流体分割のためのトランスフォーマーベースアーキテクチャであるSwinVFTRを提案する。
まず、チャネルワイドボリュームサンプリングを用いて、深さの異なるOCTボリュームのトレーニングを行う(Bスキャン)。
次に、エンコーダ内の新しいシフトウインドウトランスフォーマーブロックを使用して、流体領域のより優れたローカライゼーションとセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:16:02 GMT)
Self-assembly of atomic-scale photonic cavities [0.0] ナノスコープをマクロ次元にブリッジする合成自己組立法は、生体自己組立法に劣らず、拡張不可能なままである。
ここでは、カシミール・ヴァン・デル・ワールス相互作用を含む表面力を用いて、決定論的に自己集合および自己配向シリコンナノ構造を用いる。
これらの概念は、他の既知の方法では実現不可能なナノ構造を創り出すことによって、その可能性を説明する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:32:03 GMT)
Self-Inspection Method of Unmanned Aerial Vehicles in Power Plants Using
Deep Q-Network Reinforcement Learning [0.0] 本研究は,UAV自律ナビゲーションとDQN強化学習を取り入れた発電所検査システムを提案する。
訓練されたモデルは、UAVが困難な環境で単独で移動できるようにすることで、検査戦略が実際に適用される可能性が高い。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:58:50 GMT)
Secret-Keeping in Question Answering [0.0] 我々は、特定の事実を秘密にしておくために質問応答システムを教えることができるかどうかを判断する。
概念実証アーキテクチャを設計,実装し,その評価を通じて,将来的なシステム・パラノイアの低減に向けた様々な研究の方向性が決定される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:56:17 GMT)
SLOPER4D: A Scene-Aware Dataset for Global 4D Human Pose Estimation in
Urban Environments [0.0] SLOPER4Dは,大都市環境下で収集された新たなシーン認識データセットである。
我々は,エゴセントリックな視点から,10の多様な都市シーンにおける12人の被験者の活動を記録している。
SLOPER4Dは15個の人間の動きで構成され、それぞれが200メートル以上の軌道長を持つ。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 05:54:15 GMT)
Reduction of rain-induced errors for wind speed estimation on SAR
observations using convolutional neural networks [0.0] 降雨時の誤差を低減した風速推定器を訓練する。
その結果,SAR製品における降雨関連誤差を補正する深層学習モデルの能力が示された。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:19:14 GMT)
Real-time elastic partial shape matching using a neural network-based
adjoint method [0.0] 非線形変形体の部分的な表面マッチングは、構造変形を管理するためにエンジニアリングにおいて不可欠である。
本稿では,ニューラルネットワークを用いた最適制御問題として登録問題を定式化することを提案する。
本プロセスは,複数桁の桁数で計算速度を向上するとともに,許容範囲の登録誤差を提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:23:34 GMT)
Quantum coherence and interference in Young's experiments [0.0] ヤング多光子多重パス実験におけるコヒーレンスの l1 ノルムと量子干渉の関係について検討する。
それぞれの光子の局所的なコヒーレンスのみが量子干渉を起こすことが分かる。
干渉縞の可視性は、通常、対応する入力状態のコヒーレンス l1norm よりも小さい。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:34:45 GMT)
Quantum Monte Carlo simulations for financial risk analytics: scenario
generation for equity, rate, and credit risk factors [0.0] モンテカルロ(MC)シミュレーションは金融リスク管理に広く使われている。
収束に必要なシナリオの数のため、計算コストがかなり高い。
QMCアルゴリズムは有望な代替手段であり、古典的なアルゴリズムに比べて2次的なスピードアップを提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:57:15 GMT)
Quantum Brownian Motion in the Caldeira-Leggett Model with a Damped
Environment [0.0] 我々は、興味を持つ量子系のマスター方程式(一般ポテンシャルの粒子)を導出する。
二重井戸電位における粒子の場合を数値解析し, 短時間での脱コヒーレンス率とより長い時間での移動確率の両方を変化させることを見出した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:32:24 GMT)
Protecting Society from AI Misuse: When are Restrictions on Capabilities
Warranted? [0.0] 特定の能力に対する標的的介入は、AIの誤用を防ぐために保証される、と我々は主張する。
これらの制限には、特定のタイプのAIモデルにアクセス可能なコントロール、使用可能なもの、アウトプットがフィルタリングされているか、あるいはユーザへのトレースが可能なものが含まれる。
この推論は、新規毒素の予測、有害な画像の作成、槍のフィッシングキャンペーンの自動化の3つの例に適用する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:05:59 GMT)
Predicting nonlinear reshaping of periodic signals in optical fibre with
a neural network [0.0] ニューラルネットワークに基づく教師付き機械学習モデルを構築し,周波数領域にコム構造を持つパルス列に単純な正弦波変調の時間的およびスペクトル的再構成を予測する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:56:44 GMT)
Plant Disease Detection using Region-Based Convolutional Neural Network [0.0] 農業はバングラデシュの食料と経済において重要な役割を担っている。
低作物生産の主な原因の1つは、多くの細菌、ウイルス、真菌の植物病である。
本稿では,トマトの葉病予測のための軽量深層学習モデルの構築を目的とする。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:43:10 GMT)
On the stability of dissipatively-prepared Mott insulators of photons [0.0] 本稿では,光子のモット絶縁体を実現するパラダイム的散逸モデルについて検討する。
一部の状態では、定常状態はモット絶縁基底状態に近似するが、この相は非平衡遷移によって不安定となる。
この非平衡不安定性は、ドバイロン励起の拡散によって起こり、コヒーレントで非常に非古典的な光状態をもたらす。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 22:33:51 GMT)
On the absence of shock waves and vacuum birefringence in Born-Infeld
electrodynamics [0.0] ボルン=インフェルド電気力学における真空中における2つの反伝搬電磁波の相互作用について検討する。
本研究では, 自己相似解を用いて非線形場方程式を分離し, 衝撃波の形成について検討する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 09:46:48 GMT)
On the Existence of a Complexity in Fixed Budget Bandit Identification [0.0] 固定予算帯域識別では、アルゴリズムは複数の分布から与えられた最終時点までのサンプルを逐次観察する。
我々は,ベルヌーイの腕を2つの腕で識別するなど,いくつかの固定予算識別タスクにおいて,そのような複雑さは存在しないことを示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:39:00 GMT)
On Topology of the Moduli Space of Gapped Hamiltonians for Topological
Phases [0.0] ギャップ付きハミルトニアンの同位相におけるモジュライ空間について検討する。
位相的順序が同じであるギャップ付き系の非自明な族は、孤立した相転移を保護できることを示す。
ギャップ付き系の族は、バルク境界対応の形式に従うと論じる。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:24:53 GMT)
No eigenstate of the critical transverse-field Ising chain satisfies the
area law [0.0] 3つの異なる1サイトシフト不変な非相互作用モデルが存在することを示す。
前者のクラスは、地域法則を満たす2つの局所的な1サイトシフト不変励起状態を持つ。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:43:35 GMT)
Machine learning based biomedical image processing for echocardiographic
images [0.0] 提案手法では,K-Nearest Neighbor (KNN) アルゴリズムを用いて医用画像のセグメンテーションを行う。
トレーニングされたニューラルネットワークは、エコー画像のグループで正常にテストされている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:23:43 GMT)
Machine Learning for Flow Cytometry Data Analysis [0.0] フローサイトメーターは、同時に数万の細胞を迅速に分析し、同時に単一の細胞から複数のパラメータを測定できる。
何百万もの細胞から収集された多次元データの中で、興味深い細胞集団を手動で識別できる必要がある。
3つの代表的な自動クラスタリングアルゴリズムが選択され、完全にかつ部分的に自動ゲーティングによって適用され、比較され、評価される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:43:46 GMT)
Leggett-Garg-like Inequalities from a Correlation Matrix Construction [0.0] 我々は、Leggett-Garg不等式(LGI)を分析し、類似しているがより精巧な不等式を提案する。
提案されたすべての境界は、元の境界よりも追加の相関を含み、また特定の相補性をもたらす。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:44:05 GMT)
Identifying primes from entanglement dynamics [0.0] 本稿では,線形エンタングルメントエントロピーの進化解析に基づいて,自然数の原始性を決定する方法を提案する。
具体的には、このエントロピーのフーリエ級数の振幅の特異な振る舞いが素数と関連していることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:51:35 GMT)
Human-AI Collaboration: The Effect of AI Delegation on Human Task
Performance and Task Satisfaction [0.0] タスク性能とタスク満足度はAIデリゲートによって向上することを示す。
我々は、これらの改善の基盤となるメカニズムとして、人間による自己効力の増大を見いだした。
我々の発見は、AIモデルがより多くの管理責任を引き継ぐことが、人間とAIのコラボレーションの効果的な形態であることを示す最初の証拠を提供する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:02:46 GMT)
High-Dimensional Penalized Bernstein Support Vector Machines [0.0] SVMヒンジ損失関数の非微分性は、高次元設定において計算困難を引き起こす可能性がある。
本稿では,Pentalized BernSVMの解を求めるための2つの効率的なアルゴリズムを提案する。
我々の境界は高い確率を持ち、位数 $sqrtslog(p)/n$ を達成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:48:29 GMT)
Global optimization of MPS in quantum-inspired numerical analysis [0.0] この研究は、ハミルトン方程式の最も低い固有状態の探索に焦点を当てている。
5つのアルゴリズムが導入された: 想像時間進化、最も急勾配降下、改良された降下、暗黙的に再起動されたアルノルニ法、密度行列再正規化群 (DMRG) 最適化。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:03:51 GMT)
Generative Adversarial Network for Personalized Art Therapy in Melanoma
Disease Management [0.0] メラノーマは最も致命的な皮膚がんである。
治療を受けながら患者のメンタルヘルスを維持することが重要である。
現在の治療法は個人的ではなく、患者特有のものである。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 11:15:55 GMT)
Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations [0.0] 合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
このタイプの合成データを生成する統計的およびデータ中心の機械学習手段の欠如は、要因の組み合わせによるものである。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、仲介者・バイオマーカーに基づくAI予測システムの開発に欠かせない能力である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:13:53 GMT)
Exploring the Power of Generative Deep Learning for Image-to-Image
Translation and MRI Reconstruction: A Cross-Domain Review [0.0] 本研究は,自然画像領域と医用画像領域における画像から画像への変換と再構成に使用される深層学習手法について分析する。
自然コンピュータビジョンの分野では、様々なディープラーニング生成モデルの開発と拡張について検討する。
本稿では, 医用画像翻訳, MRI再構成, マルチコントラストMRI合成などの医療画像生成問題に対する深層学習の可能性について検討する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 00:56:30 GMT)
ExoplANNET: A deep learning algorithm to detect and identify planetary
signals in radial velocity data [0.0] 放射速度法で検出された信号の意義の計算に代えて,ニューラルネットワークを提案する。
このアルゴリズムは、惑星の伴星を伴わないシステムの合成データを用いて訓練される。
偽陽性は28パーセント減少し、実行時間は従来の方法よりも5桁高速である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:16:19 GMT)
Evaluation of distance-based approaches for forensic comparison:
Application to hand odor evidence [0.0] 我々は、高次元の証拠を扱うための頑健さ、特にその能力が極めて異なる距離ベースのアプローチに焦点を当てる。
直接的および間接的手法は、感度、特異性、ロバスト性の観点から比較される。
534名の被験者の大規模パネルと1690名の匂い跡の実験的評価は,間接的手法の有意な優位性を示した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:41:53 GMT)
Enhanced detection of the presence and severity of COVID-19 from CT
scans using lung segmentation [0.0] 本稿では,2022年大会に提出されたディープラーニングモデルであるCov3dのバージョン2を示す。
その結果、CTスキャンにおける新型コロナウイルスの存在を92.2%で予測するための検証マクロF1スコアが得られた。
タスク2の検証セットにおいて、新型コロナウイルスの重症度を予測するマクロF1スコアを67%に設定する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 16:15:42 GMT)
Dynamic generation of photonic spatial quantum states with an all-fiber
platform [0.0] フォトニック空間量子状態は、量子通信への応用に大きな関心を持つ。
重要な課題の1つは、光ファイバー部品のみを用いてこれらの状態を生成する方法である。
本研究では,任意の一般的な横空間量子ビット状態間の動的切替が可能な全ファイバーシステムを提案し,実験的に実証する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 18:40:45 GMT)
Distorted stability pattern and chaotic features for quantized
prey-predator-like dynamics [0.0] ワイル・ウィグナー量子力学の枠組みにおいて、捕食者様系の非平衡および不安定性特性について検討した。
関連するウィグナー電流によって駆動される非リウィリアパターンから、双曲平衡と安定性パラメータは量子歪みに影響されることが示されている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 19:55:36 GMT)
Denoising Diffusion Post-Processing for Low-Light Image Enhancement [0.0] 低照度画像強調(LLIE)技術は、低照度シナリオで撮影された画像の可視性を高める。
LLIE技術はノイズやカラーバイアスといった様々な画像劣化を導入している。
後処理のデノイザは広く使われており、細部が不明瞭な結果になることが多い。
低照度後処理拡散モデル(LPDM)を導入し,低露光画像と通常露光画像の条件分布をモデル化する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 20:06:55 GMT)
Decentralized Multi-Agent Reinforcement Learning for Continuous-Space
Stochastic Games [0.0] 汎用状態空間を分散化したゲームにおけるマルチエージェント学習と,エージェントが互いの行動を観察しない情報構造について検討する。
我々は,MARLアルゴリズムを提案し,そのポリシー更新のほぼ最適性を証明した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 14:25:16 GMT)
Controlled Descent Training [0.0] 最適制御理論により,新しいモデルベースニューラルネットワーク(ANN)トレーニング手法を開発した。
この方法は、トレーニング損失収束を確実に保証し、トレーニング収束率を向上させるために、トレーニングラベルを増強する。
本手法の適用性は, 標準回帰問題と分類問題において実証される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:45:24 GMT)
Comparing bipartite entropy growth in open-system matrix product
simulation methods [0.0] 開系シミュレーションにおける行列積表現の複雑さに関連するエントロピー成長を比較する。
我々は,MPDO記述におけるエントロピーが,一般にQT+MPSのエントロピーよりも時間とともに拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:59:59 GMT)
Closed systems refuting quantum speed limit hypotheses [0.0] マルゴラス・レヴィチン量子速度制限は、明らかな方法で閉系に拡張されないことを示す。
また、孤立系では、マンデルスタム・タム量子速度制限と、バティア・ダビエス量子速度制限と呼ばれるこの制限のわずかに弱められたバージョンが常に同時に飽和していることが示される。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:55:13 GMT)
Certifying multi-mode light-matter interaction in lossy resonators [0.0] 損失共振器におけるマルチモード効果の認定基準を開発する。
観察可能な証人に基づいており、適合手順もマルコフ近似も必要としない。
このようなマルチモード効果は、M"オスバウアー核を用いたX線キャビティQEDにおける以前の実験を理解する上で重要であることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:37:27 GMT)
Automatic Geo-alignment of Artwork in Children's Story Books [0.0] このプロジェクトは、機械学習アルゴリズムの一般化とスケーラビリティを活用することで、同社のビジョンと一致している。
提案手法は,デジタルウェブブックにおける新しいイラストレーションのためのビデオおよび3D彫刻生成にも適用可能である。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 06:23:06 GMT)
Analyzing and Unifying Robustness Measures for Excitation Transfer
Control in Spin Networks [0.0] スピン鎖と環における単一励起伝達の忠実度を評価するためのログ感度とRIMの相関について検討した。
予測される誤差の差分感度は, RIMの差分感度と一致し, 予測値が誤差確率分布上にあることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:34:54 GMT)
An invitation to quantum mean-field filtering and control [0.0] 量子フレームワークにおける平均場制御理論の拡張について述べる。
平均場設定におけるベラブキン量子フィルタリングと制御理論について考察する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 21:52:59 GMT)
Algebraic Compression of Free Fermionic Quantum Circuits: Particle
Creation, Arbitrary Lattices and Controlled Evolution [0.0] 我々はハミルトンの下でトロッター化進化を圧縮するアルゴリズムを開発した。
我々は、長い範囲のスピン相互作用とフェルミオンホッピングで進化をシミュレートする回路を圧縮するためにアルゴリズムを拡張した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 17:52:59 GMT)
Aesthetic Motivation in Quantum Physics: Past and Present [0.0] このエッセイは、主に量子物理学における美学とモチベーションの関係に焦点を当て、遊び、美、洞察の喜びの概念に焦点を当てている。
これらの概念のモチベーションの役割は、コペンハーゲンのニールス・ボーア研究所 (Niels Bohr Institute) に関連する物理学者の間での一連のインタビューに基づいて、歴史的に量子パイオニアの間でも現代的にも検討されている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 15:45:33 GMT)
A robot's sense-making of fallacies and rhetorical tropes. Creating
ontologies of what humans try to say [0.0] ユーザフレンドリーなロボットの設計においては、人間のコミュニケーションは単なる論理と文字通りの意味を超えたシステムで理解されるべきである。
本稿では,Fregeの参照と意味の区別を利用したフェールセーフプロトコルを開発した。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 12:39:00 GMT)
A novel dual skip connection mechanism in U-Nets for building footprint
extraction [0.0] U-Net用デュアルスキップ接続機構(DSCM)とU-Net3+用デュアルフルスケールスキップ接続機構(DFSCM)を提案する。
提案機構は,メルボルン市向けに開発したベンチマークWHU構築データセットとマルチレゾリューションデータセットで評価される,いくつかの新しいネットワークを生成する。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 03:44:33 GMT)
A new development status of single-center two-electron integration
algorithm [0.0] 単一中心2電子結合は、原子と分子構造の計算において重要な核となる技術である。
本稿では,Zhaoらの手法をレビュー・最適化し,結論を導いた: この手法はトランケーション誤差のない正確な計算であるため,Slater-Condon積分法よりも優れている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 07:33:50 GMT)
A Short Survey of Viewing Large Language Models in Legal Aspect [0.0] 大規模言語モデル(LLM)は、自然言語処理、コンピュータビジョン、強化学習など、多くの分野に変化をもたらした。
LLMの法的分野への統合は、プライバシーの懸念、偏見、説明可能性など、いくつかの法的問題を引き起こしている。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 08:01:22 GMT)
A Generative Model for Digital Camera Noise Synthesis [0.0] クリーンな特徴をガイダンスとして利用し,続いてネットワークにノイズ注入を行う効果的な生成モデルを提案する。
具体的には、ジェネレータはスキップ接続を持つUNetのような構造を踏襲するが、ダウンサンプリングやアップサンプリングは行わない。
提案手法は,カメラノイズを合成するための既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Mar 2023 10:17:33 GMT)