Robust Mixture-of-Expert Training for Convolutional Neural Networks [141.4] スパースゲート型Mixture of Expert (MoE) は高精度で超効率的なモデル推論を実現するための大きな可能性を実証している。
本稿では、AdvMoEと呼ばれるMoEのための新しいルータ-エキスパート交互学習フレームワークを提案する。
その結果,AdvMoEは従来の高密度CNNに比べて1%の対向ロバスト性向上を実現し,親和性に富むMoEの有効性を享受できることがわかった。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:58:21 GMT)
Black-box Adversarial Attacks against Dense Retrieval Models: A
Multi-view Contrastive Learning Method [115.3] 本稿では,敵探索攻撃(AREA)タスクを紹介する。
DRモデルは、DRモデルによって取得された候補文書の初期セットの外側にあるターゲット文書を取得するように、DRモデルを騙すことを目的としている。
NRM攻撃で報告された有望な結果は、DRモデルに一般化されない。
マルチビュー表現空間における対照的な学習問題として,DRモデルに対する攻撃を形式化する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:24:59 GMT)
NeuS2: Fast Learning of Neural Implicit Surfaces for Multi-view
Reconstruction [95.4] 我々はNeuS2と呼ばれる高速な神経表面再構成手法を提案する。
NeuS2は、再構成品質を損なうことなく、加速度の2桁の精度向上を実現している。
本研究では,動的シーンの高速トレーニングのための手法を拡張し,インクリメンタルトレーニング戦略と新たなグローバルトランスフォーメーション予測コンポーネントを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:09:23 GMT)
UniDoc: A Universal Large Multimodal Model for Simultaneous Text
Detection, Recognition, Spotting and Understanding [93.9] テキスト検出と認識機能を備えた新しいマルチモーダルモデルUniDocを紹介する。
我々の知る限りでは、これはテキストの検出、認識、スポッティング、理解を同時に行うことができる最初の大規模マルチモーダルモデルである。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:32:34 GMT)
GameEval: Evaluating LLMs on Conversational Games [93.4] 大規模言語モデル(LLM)を評価する新しいアプローチであるGameEvalを提案する。
GameEvalはLSMをゲームプレイヤーとして扱い、様々な形式の会話を起動することで達成した特定の目標にそれぞれ異なる役割を割り当てる。
我々は,GameEvalが様々なLLMの能力を効果的に差別化することができ,複雑な問題を解決するための統合能力を総合的に評価できることを示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:33:40 GMT)
A Theory of Topological Derivatives for Inverse Rendering of Geometry [87.5] 我々は、位相微分を用いて離散的な位相変化を可能にする微分可能な曲面進化の理論的枠組みを導入する。
2次元の閉曲線と3次元の曲面を最適化して提案理論を検証し、現在の手法の限界について考察する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:55:55 GMT)
RAIN: RegulArization on Input and Network for Black-Box Domain
Adaptation [80.0] ソースのないドメイン適応は、ソースデータを公開することなく、ソース訓練されたモデルをターゲットドメインに転送する。
このパラダイムは、ソースモデルに対する敵対的な攻撃のため、データ漏洩のリスクがある。
そこで我々は,入力レベルとネットワークレベルの両方の正規化からブラックボックスドメインを適応させる新しい手法であるRAIN(RegulArization on Input and Network)を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:04:11 GMT)
Bayes Risk Transducer: Transducer with Controllable Alignment Prediction [79.4] ベイズリスクトランスデューサ(BRT)は、望ましい経路を強制し、制御可能なアライメント予測を実現することを提案した。
BRTは、非ストリーミングASRの推論コストを最大46%削減し、ストリーミングASRのシステム全体のレイテンシを41%削減する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:48:16 GMT)
Delicate Textured Mesh Recovery from NeRF via Adaptive Surface
Refinement [78.5] 画像からテクスチャ化された表面メッシュを生成する新しいフレームワークを提案する。
我々のアプローチは、NeRFを用いて幾何学とビュー依存の外観を効率的に初期化することから始まります。
ジオメトリと共同で外観を洗練し、テクスチャ画像に変換してリアルタイムレンダリングします。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:42:39 GMT)
Learning by Sorting: Self-supervised Learning with Group Ordering
Constraints [75.9] 本稿では,対照学習目標である群順序制約(GroCo)の新たなバリエーションを提案する。
正の対と負の対の距離をソートし、正の対が負の対よりも多くの距離を持つかに基づいてそれぞれの損失を計算するという考え方を利用しており、したがって正しく順序付けされていない。
各種自己教師付き学習ベンチマークの定式化について検討し、バニラのコントラスト学習と比較して結果が向上するだけでなく、k-NNの性能において、線形探索や性能向上において同等の手法と競合する性能を示すことを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 01:07:11 GMT)
Semantics Meets Temporal Correspondence: Self-supervised Object-centric
Learning in Videos [69.9] 自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:12:13 GMT)
Reinforce Data, Multiply Impact: Improved Model Accuracy and Robustness
with Dataset Reinforcement [68.4] 本研究では、強化データセット上でトレーニングされたモデルアーキテクチャの精度が、ユーザにとって追加のトレーニングコストなしで向上するように、データセットを改善する戦略を提案する。
ImageNet+と呼ばれるImageNetトレーニングデータセットの強化バージョンと、強化されたデータセットCIFAR-100+、Flowers-102+、Food-101+を作成します。
ImageNet+でトレーニングされたモデルは、より正確で、堅牢で、校正され、下流タスクにうまく転送されます。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 12:44:20 GMT)
EgoVLPv2: Egocentric Video-Language Pre-training with Fusion in the
Backbone [67.1] ビデオ言語事前学習は、様々なビジョンや言語タスクに一般化することができる。
ビデオ言語事前学習フレームワークは、個別のビデオエンコーダと言語エンコーダを使用し、微調整時にのみタスク固有のクロスモーダル情報を学ぶ。
新たな世代のエゴセントリックなビデオ言語事前訓練は、ビデオと言語のバックボーンに直接クロスモーダル融合を組み込む。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:38:55 GMT)
Visually-Prompted Language Model for Fine-Grained Scene Graph Generation
in an Open World [67.0] SGG(Scene Graph Generation)は、視覚理解のための画像中の主観的、述語的、対象的な関係を抽出することを目的としている。
既存の再バランス戦略は、以前のルールを通じてそれを処理しようとするが、まだ事前に定義された条件に制限されている。
そこで我々は,多種多様な粒度の述語を生成するために,視覚的にプロンプトされた言語モデルを学習するクロスモーダルプレディケイトブースティング(CaCao)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:41:36 GMT)
Minimum Description Length Clustering to Measure Meaningful Image
Complexity [65.3] 本稿では,階層的なパッチクラスタリングによる画像複雑性の指標を提案する。
最小記述長の原理を用いて、クラスタ数を決定し、特定の点を外れ値として指定し、ホワイトノイズを低いスコアに正しく割り当てる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:48:41 GMT)
Pushing the Limits of 3D Shape Generation at Scale [65.2] 我々は、前例のない次元に拡大することで、3次元形状生成において画期的なブレークスルーを示す。
現在までに最大の3次元形状生成モデルとしてArgus-3Dが確立されている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 12:01:19 GMT)
Story Visualization by Online Text Augmentation with Context Memory [64.9] オンラインテキスト拡張による双方向トランスフォーマーフレームワークのための新しいメモリアーキテクチャを提案する。
提案手法は, FID, キャラクタF1, フレーム精度, BLEU-2/3, R精度など, 様々な指標において, 芸術の状態を著しく上回っている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:30:52 GMT)
SINC: Self-Supervised In-Context Learning for Vision-Language Tasks [64.4] 大規模言語モデルにおけるコンテキスト内学習を実現するためのフレームワークを提案する。
メタモデルは、カスタマイズされたデモからなる自己教師型プロンプトで学ぶことができる。
実験の結果、SINCは様々な視覚言語タスクにおいて勾配に基づく手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:27:16 GMT)
Understanding Self-attention Mechanism via Dynamical System Perspective [58.0] SAM(Self-attention mechanism)は、人工知能の様々な分野で広く使われている。
常微分方程式(ODE)の高精度解における固有剛性現象(SP)は,高性能ニューラルネットワーク(NN)にも広く存在することを示す。
SAMは、本質的なSPを測定するためのモデルの表現能力を高めることができる剛性対応のステップサイズ適応器でもあることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:17:41 GMT)
DiffusionDet: Diffusion Model for Object Detection [56.5] DiffusionDetは、オブジェクト検出をノイズボックスからオブジェクトボックスへの遅延拡散プロセスとして定式化する新しいフレームワークである。
本研究は,ボックスの動的数と反復的評価を可能にする柔軟性の魅力的な特性を有する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:03:29 GMT)
A Unified Continual Learning Framework with General Parameter-Efficient
Tuning [56.3] 「事前学習$rightarrow$ダウンストリーム適応」は、継続学習の新しい機会と課題を提示する。
我々は,PETの1つのインスタンス化としてプロンプトを位置づけ,ラーニング・アキュミュレーション・アンサンブル(LAE)と呼ばれる統一的なCLフレームワークを提案する。
PET(Adapter、LoRA、Prefixなど)は、トレーニング済みのモデルをより少ないパラメータとリソースで下流のタスクに適応させることができる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:51:01 GMT)
SINC: Spatial Composition of 3D Human Motions for Simultaneous Action
Generation [56.2] 我々のゴールは、同時動作を記述するテキスト入力を与えられた3次元人間の動作を合成することである。
我々は「空間構成」というような同時的な動きを生み出すことを指す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:34:13 GMT)
DiffusionRet: Generative Text-Video Retrieval with Diffusion Model [56.0] 既存のテキストビデオ検索ソリューションは、条件付き可能性、すなわちp(candidates|query)の最大化に焦点を当てている。
我々は、このタスクを生成的視点から創造的に取り組み、テキストとビデオの相関関係を共同確率p(candidates,query)としてモデル化する。
これは拡散に基づくテキストビデオ検索フレームワーク(DiffusionRet)によって実現され、ノイズから徐々に関節分布を生成するプロセスとして検索タスクをモデル化する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:31:57 GMT)
VI-Net: Boosting Category-level 6D Object Pose Estimation via Learning
Decoupled Rotations on the Spherical Representations [55.3] 作業を容易にするために,VI-Netと呼ばれる新しい回転推定ネットワークを提案する。
球面信号を処理するために、SPAtial Spherical Convolutionの新たな設計に基づいて、球面特徴ピラミッドネットワークを構築する。
ベンチマークデータセットの実験により,提案手法の有効性が確認された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:47:53 GMT)
Eva-KELLM: A New Benchmark for Evaluating Knowledge Editing of LLMs [54.2] Eva-KELLMは、大規模言語モデルの知識編集を評価するための新しいベンチマークである。
実験結果から, 生文書を用いた知識編集手法は, 良好な結果を得るには有効ではないことが示唆された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:17:19 GMT)
ILCAS: Imitation Learning-Based Configuration-Adaptive Streaming for
Live Video Analytics with Cross-Camera Collaboration [53.3] 本稿では,最初の模倣学習 (IL) に基づく構成適応型ライブビデオ分析 (VA) ストリーミングシステムを提案する。
ILCASは、オフラインの最適ポリシーとして設計された専門家から収集されたデモでエージェントを訓練する。
ILCASは最先端のソリューションに比べて優れており、平均精度は2-20.9%改善し、チャンクアップロードラグは19.9-85.3%削減された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 16:20:59 GMT)
ControlRetriever: Harnessing the Power of Instructions for Controllable
Retrieval [53.1] 本稿では,多種多様な検索タスクを直接実行する高密度検索モデルを制御する制御レトリバーについて紹介する。
ControlRetrieverは、タスク固有の命令でガイドされている間、新しい制御可能な検索能力で異なる検索モデルに報いる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:17:57 GMT)
Large Language Models as Zero-Shot Conversational Recommenders [52.6] ゼロショット設定における代表的大言語モデルを用いた会話推薦タスクに関する実証的研究を行った。
我々は、人気のあるディスカッションサイトをスクラップして、レコメンデーション関連の会話のデータセットを構築した。
我々は、微調整なしでも、大規模な言語モデルは既存の微調整された会話レコメンデーションモデルより優れていることを観察する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:29:45 GMT)
Intriguing Properties of Text-guided Diffusion Models [52.5] テキスト誘導拡散モデル(TDM)は広く応用されているが、予期せず失敗することがある。
本研究は,TDMの障害モードについて,より詳細に研究し,理解することを目的としている。
本稿では、画像分類器を代理損失関数として用いるTDMに対する逆攻撃であるSAGEを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 21:38:53 GMT)
An Empirical Study of CLIP for Text-based Person Search [51.9] テキストベースPerson Search (TBPS) は、自然言語による人物画像の検索を目的としている。
Contrastive Language Image Pretraining (CLIP)は、多種多様なモダル下流タスクにおいて、多種多様なモダル横断視覚言語事前訓練モデルである。
本稿では,TBPSタスクに対するCLIPの総合的研究を初めて行おうとする。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:08:10 GMT)
Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [50.5] 本稿では,EMボリュームにおけるボクセルレベルの一貫性と特徴レベルの整合性を両立させる新しい事前学習フレームワークを提案する。
具体的には、再構成関数により、シームズネットワークの出力間のボクセルレベルの一貫性を強制する。
本手法は4つの大規模EMデータセットに対して広範囲に事前訓練を行い,ニューロンとミトコンドリアのインスタンスセグメンテーションの代表的タスクにおいて有望な性能向上を実現した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:49:13 GMT)
Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.1] 本稿では,雑音対応においても頑健な視覚関係を学習できる新しいロバスト二重埋め込み法(RDE)を提案する。
RDEは2つの主要なコンポーネントから構成される: 1) 信頼合意部(CCD)モジュールは、二重埋め込みモジュールの二重きめ細かい決定を利用して、クリーンなトレーニングデータのコンセンサスセットを得る。
我々は、CUHK-PEDES、ICFG-PEDES、RSTPReIDの3つの公開ベンチマークにおいて、RDEの性能と堅牢性を評価するために広範な実験を行った。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:34:13 GMT)
PiClick: Picking the desired mask in click-based interactive
segmentation [48.5] 対話型セグメンテーションネットワークPiClickを提案する。
PiClickは、相互に対話的なマスククエリによって、潜在的なすべてのマスクを生成する。
Target ReasoningモジュールはPiClickで設計されており、すべての候補からユーザーが望むマスクを自動的に提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:30:56 GMT)
Multipoint-BAX: A New Approach for Efficiently Tuning Particle
Accelerator Emittance via Virtual Objectives [47.5] 本研究では,ベイジアン実行法(Bayesian Execution,BAX)を用いて,個々のビームサイズの測定をクエリし,モデル化する。
BAXは、$textitvirtual objective$、すなわち$textitvirtual objective$を通じてポイントを取得することで、アクセラレータ上の遅いマルチポイントクエリを避ける。
シミュレーションでは、BAXは既存の手法に比べて20$times$高速で、ノイズに対してより堅牢である。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:01:07 GMT)
Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video
Anomaly Detection [46.9] ビデオ異常検出(VAD)のための新しい生成モデルを提案する。
我々は、骨格表現を考察し、最先端拡散確率モデルを用いて、多モーダルな未来の人間のポーズを生成する。
4つの確立されたベンチマークでモデルを検証します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 16:22:39 GMT)
On the Robustness of Open-World Test-Time Training: Self-Training with
Dynamic Prototype Expansion [46.3] ディープラーニングモデルを低レイテンシで未知のターゲット領域分布に一般化することは、テスト時間トレーニング/適応(TTT/TTA)の研究を動機付けている。
多くの最先端手法は、ターゲットドメインが強いアウト・オブ・ディストリビューション(OOD)データで汚染されると性能を維持することができない。
我々は,自己学習型TTT法の有効性を向上させる適応型強力なOODプルーニングを開発した。
我々は,分散アライメントによる自己学習を正規化し,その組み合わせにより,OWTTTベンチマークの最先端性能が得られる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:27:48 GMT)
ControlCom: Controllable Image Composition using Diffusion Model [45.5] 1つの拡散モデルにおいて4つのタスクを統一する制御可能な画像合成法を提案する。
また,拡散モデルにおける前景の詳細を強化するために,局所的な拡張モジュールを提案する。
提案手法は,公開ベンチマークと実世界のデータの両方を用いて評価する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:56:44 GMT)
ASPIRE: Language-Guided Augmentation for Robust Image Classification [45.2] ASPIRE(Language-guided Data Augmentation for SPurious correlation Removal)は,合成画像によるトレーニングデータセットの拡張において,素早い特徴を伴わずに有効な方法である。
まず、画像のテキスト記述から前景や背景の特徴を抽出し、その後、高度な言語誘導画像編集を行い、クラスラベルと突発的に相関する特徴を発見する。
最後に,テキスト・ツー・イメージ生成モデルをパーソナライズして,刺激的な特徴を伴わない多様なドメイン内画像を生成する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:18:15 GMT)
OmniZoomer: Learning to Move and Zoom in on Sphere at High-Resolution [43.3] 我々は,ODIの移動とズームのために,M"obius変換をネットワークに組み込む,新たなディープラーニングベースのアプローチを提案する。
異なる条件下で様々な変換された特徴写像を学習することにより、ネットワークは増大するエッジ曲率を扱うように拡張される。
実験により,本手法は,興味の対象物への移動・ズームインの柔軟性を活かした,高品質なODIを生成可能であることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:12:43 GMT)
DPL: Decoupled Prompt Learning for Vision-Language Models [41.9] 本稿では,この問題を緩和するために,学習者の注意を再構築する新しい手法,Decoupled Prompt Learningを提案する。
我々のアプローチは、視覚的・テキスト的モダリティの両方に柔軟であり、マルチモーダル・プロンプト・ラーニングに容易に拡張できる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:48:38 GMT)
Root Pose Decomposition Towards Generic Non-rigid 3D Reconstruction with
Monocular Videos [40.8] 本研究は,モノクロRGB映像系列に基づく非剛体物体の3次元再構成に焦点を当てる。
我々は、オブジェクトの既知のルートポーズを仮定せず、カテゴリ固有のテンプレートや、より密なポーズ前も利用しない。
我々は,DAVIS,OVIS,AMAデータセットの最先端手法を,ルートポーズ分解(RPD)が超越していることを実験的に示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:48:09 GMT)
Never Explore Repeatedly in Multi-Agent Reinforcement Learning [40.4] 我々は「リビジョン」と戦うための動的報酬スケーリング手法を提案する。
Google Research FootballやStarCraft IIのマイクロマネジメントタスクのような需要のある環境におけるパフォーマンスの向上を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:27:48 GMT)
Learning to Distill Global Representation for Sparse-View CT [40.2] スパースビューCTのためのグローバル表現フレームワークGloReDiを提案する。
GloReの蒸留の成功は、GloReの方向を整列する表現方向蒸留と、臨床的に重要な詳細を得るためのバンドパス特異的コントラスト蒸留の2つの重要な要素に起因している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:30:10 GMT)
The Snowflake Hypothesis: Training Deep GNN with One Node One Receptive
field [39.7] 一つのノード、一つの受容場の概念を支える新しいパラダイムである「雪の結晶仮説」を紹介します。
最も単純な勾配とノードレベルの余弦距離を、各ノードの集約深さを調節する指針として採用する。
観測結果は,我々の仮説がタスクの普遍演算子として機能できることを実証した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:21:12 GMT)
Artificial Intelligence across Europe: A Study on Awareness, Attitude
and Trust [39.4] この研究の目的は、ヨーロッパの文脈における人々の見解や認識をよりよく理解することである。
我々は,人々の意識,態度,信頼の3つの側面から構築された新しいアンケート(PAICE)を設計し,検証した。
暗黙の矛盾を強調し、信頼のエコシステムの形成を妨げる可能性のあるトレンドを特定します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:00:32 GMT)
The Euclidean Space is Evil: Hyperbolic Attribute Editing for Few-shot
Image Generation [39.3] 本稿ではハイパーボリック属性編集(HAE)を提案する。
ユークリッド空間で機能する他の方法とは異なり、HAEは双曲空間で見られるカテゴリのデータを用いて画像の階層をキャプチャする。
実験と可視化により、HAEは、限られたデータを使用して、有望な品質と多様性を持つ画像を生成するだけでなく、高度に制御可能で解釈可能な編集プロセスを実現することができることを示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:20:04 GMT)
ClothesNet: An Information-Rich 3D Garment Model Repository with
Simulated Clothes Environment [38.5] ClothesNetは情報豊富なアノテーションを備えた3D衣料品オブジェクトの大規模なデータセットである。
我々のデータセットは、衣服の特徴、境界線、キーポイントを含む11のカテゴリをカバーする約4400のモデルで構成されています。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:34:40 GMT)
Prototypical Cross-domain Knowledge Transfer for Cervical Dysplasia
Visual Inspection [37.7] そこで本研究では,異なるが関連する臨床研究で収集されたクロスドメイン頚部画像を利用して,モデルの性能を向上させることを提案する。
データセット間で伝達可能な情報を堅牢に学習するために,新しいプロトタイプベースの知識フィルタリング手法を提案する。
提案法は,最先端の頚椎椎間板形成検査において,Top-1の精度が4.7%向上した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:25:09 GMT)
Zero-Shot In-Distribution Detection in Multi-Object Settings Using
Vision-Language Foundation Models [37.4] 本稿では,ゼロショット・イン・ディストリビューション(ID)検出と呼ばれる新しい問題設定を提案する。
我々は、IDオブジェクトを含むイメージを(OODオブジェクトを含む場合でも)IDイメージとして識別し、IDオブジェクトを持たないイメージをOODイメージとしてトレーニングせずに識別する。
本稿では,CLIP機能のグローバルおよびローカルな視覚テキストアライメントに基づく,シンプルで効果的な概念マッチング手法であるGlobal-Local Concept Matchingを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:28:12 GMT)
Skill Transformer: A Monolithic Policy for Mobile Manipulation [36.2] Skill Transformerは,条件付きシーケンスモデリングとスキルモジュール性を組み合わせた長軸ロボットタスクの解法である。
Skill Transformerは、ロボットの自我中心的・自我受容的な観察に基づいて、エンドツーエンドで訓練され、高いレベルのスキルと全体の低レベルのアクションの両方を予測する。
具体的ベンチマークでSkill Transformerをテストし、新しいシナリオで堅牢なタスク計画と低レベル制御を実行し、ハードリアレンジ問題におけるベースラインよりも2.5倍高い成功率を達成する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 01:37:41 GMT)
TeCH: Text-guided Reconstruction of Lifelike Clothed Humans [35.7] 既存の方法は、ぼやけたテクスチャで非常に滑らかな裏面を生成することが多い。
基礎モデルの力に触発されて、TeCHは記述的テキストプロンプトを利用して3D人間を再構築する。
そこで本研究では,DMTetをベースとした3次元ハイブリッド表現を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:08:54 GMT)
Physics-Guided Human Motion Capture with Pose Probability Modeling [35.2] 既存の解は常にキネマティックな結果を参照運動として採用し、物理は後処理モジュールとして扱われる。
本研究では,逆拡散過程における物理法則を用いて,モデル化されたポーズ確率分布から人間の動きを再構成する。
数回の反復で、物理に基づく追跡とキネマティック・デノゲーションは互いに促進し、物理的に妥当な人間の動きを生成する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:28:03 GMT)
Recap: Detecting Deepfake Video with Unpredictable Tampered Traces via
Recovering Faces and Mapping Recovered Faces [35.0] 本稿では,顔の復元による非特異な顔部分の不整合を露呈する新しいディープフェイク検出モデルRecapを提案する。
回復段階において、モデルは興味のある領域をランダムにマスキングし、予測不能な痕跡を残さずに実際の顔を再構築することに焦点を当てる。
マッピング段階では、リカバリフェーズの出力が顔マッピングプロセスの指針となる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:18:11 GMT)
Natural Language is All a Graph Needs [34.0] InstructGLM (Instruction-finetuned Graph Language Model) を提案する。
我々の手法は、ogbn-arxiv, Cora, PubMedデータセット上の競合するGNNベースラインを全て越えている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 01:38:31 GMT)
PACE: Improving Prompt with Actor-Critic Editing for Large Language
Model [33.4] 本稿では,大規模言語モデル(LLM)のためのPACE(Prompt with Actor-Critic Editing)を提案する。
PACEはプロンプトを洗練させ、プロンプトを行う俳優と批評家の両方からのフィードバックを考慮に入れ、反応を批判している。
実験の結果,PACEは中・低品質な人書きプロンプトの相対性能を最大98%向上させることがわかった。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:47:44 GMT)
Disposable Transfer Learning for Selective Source Task Unlearning [31.0] 転送学習は、強力な表現を構築するためのディープニューラルネットワーク(DNN)のトレーニングに広く使用されている。
Disposable Transfer Learning (DTL)は、ターゲットタスクのパフォーマンスを低下させることなく、ソースタスクのみを処分する。
我々は,GC損失がDTL問題に対する効果的なアプローチであることを示し,GC損失をトレーニングしたモデルが,PL精度を著しく低減した目標タスクの性能を維持することを示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:13:17 GMT)
A Two-Stage Active Learning Algorithm for $k$-Nearest Neighbors [30.5] そこで本研究では,$k$-nearest 近所の分類器を訓練するための,シンプルで直感的な能動学習アルゴリズムを提案する。
提案手法により得られたサンプルに基づいてトレーニングした$k$-nearest 隣人分類器の整合性を保証する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:58:43 GMT)
RAH! RecSys-Assistant-Human: A Human-Central Recommendation Framework
with Large Language Models [30.3] 我々は、RAHというより人中心的な推薦フレームワークを提案する。
RAHはRecommenderシステム、Assistant、Humanで構成されている。
RAHフレームワークは、異なるレコメンデータシステムやユーザグループに適応することができる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:46:01 GMT)
Practical Anomaly Detection over Multivariate Monitoring Metrics for
Online Services [29.4] CMAnomalyは、協調マシンに基づく多変量モニタリングメトリクスの異常検出フレームワークである。
提案するフレームワークは,Huawei Cloudの大規模オンラインサービスシステムから収集した公開データと産業データの両方で広く評価されている。
最先端のベースラインモデルと比較して、CMAnomalyは平均F1スコア0.9494を達成し、ベースラインの6.77%から10.68%を上回り、10倍から20倍速く走る。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:08:05 GMT)
Inverse Approximation Theory for Nonlinear Recurrent Neural Networks [28.8] RNNを用いた非線形列列列関係の近似に対する逆近似定理を証明した。
ハードタン/タンアクティベーションを持つRNNによって安定に近似できる非線形シーケンス関係は、指数関数的に減衰するメモリ構造を持つ必要があることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:51:17 GMT)
3D-Aware Neural Body Fitting for Occlusion Robust 3D Human Pose
Estimation [28.2] 本研究では,3次元ポーズ推定のための3次元認識型ニューラルボディフィッティング(3DNBF)を提案する。
特に,3次元ポーズ依存特徴ベクトルを出力するガウス楕円体カーネルを用いた人間の体積表現に基づく深部特徴の生成モデルを提案する。
ニューラル特徴は、対照的な学習で訓練され、3D認識となり、2D-3D曖昧さを克服する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 22:41:00 GMT)
H4VDM: H.264 Video Device Matching [26.4] 与えられた2つのビデオシーケンスが同じデバイスによってキャプチャされるかどうかを判断できる方法は、多くの法医学的タスクで使用できる。
オープンセットビデオ法医学のシナリオでは、特定のデバイスを特定するよりも、2つのビデオシーケンスが同じデバイスでキャプチャされたかどうかを判断するのが簡単である。
本稿では,オープンセットビデオデバイスマッチング手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:17:00 GMT)
Generalisation Through Negation and Predicate Invention [25.9] 我々は、否定と述語的発明を組み合わせた帰納論理プログラミング(ILP)アプローチを導入する。
我々は,通常の論理プログラムを述語的発明で学習できるNOPIで実装する。
複数の領域に対する実験結果から,本手法は予測精度と学習時間を向上できることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:15:48 GMT)
RSFNet: A White-Box Image Retouching Approach using Region-Specific
Color Filters [25.7] RSFNetと呼ばれる並列領域固有のフィルタを用いた写真修正のためのホワイトボックスフレームワークを開発した。
本モデルでは,各フィルタの領域のフィルタ引数とアテンションマップを同時に生成する。
この実験により,RCFNetは審美的魅力とユーザ利便性を向上し,編集可能なホワイトボックスのリタッチを実現することができた。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:31:30 GMT)
AltNeRF: Learning Robust Neural Radiance Field via Alternating
Depth-Pose Optimization [25.4] 単眼ビデオからの自己教師付き単眼深度推定(SMDE)を用いて、回復力のあるNeRF表現を作成するための新しいフレームワークAltNeRFを提案する。
我々は,NeRF出力をコンデンス駆動機構によりSMDEに調和的に溶接する交互アルゴリズムを導入し,深度事前の整合性を高める。
大規模な実験では、AltNeRFが現実によく似た高忠実で堅牢な新奇な視点を創出する能力を示している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 12:41:35 GMT)
FinEval: A Chinese Financial Domain Knowledge Evaluation Benchmark for
Large Language Models [25.1] FinEvalは、大規模言語モデル(LLM)における金融ドメイン知識のベンチマークである。
FinEvalには、ゼロショットプロンプトや少数ショットプロンプトなど、さまざまなプロンプトタイプが採用されている。
その結果, GPT-4の精度は, 異なるプロンプト設定で70%に近かった。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:38:00 GMT)
Code Difference Guided Adversarial Example Generation for Deep Code
Models [25.0] ディープコードモデルの堅牢性をテストし、強化する上で、敵対的な例は重要です。
深層コードモデルをテストするための新しい逆例生成手法(CODA)を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:45:49 GMT)
Phase-Matching Quantum Key Distribution without Intensity Modulation [25.0] 強度変調のない位相整合量子鍵分布プロトコルを提案する。
シミュレーションの結果,プロトコルの伝送距離は通信ファイバーで305kmに達する可能性が示唆された。
我々のプロトコルは量子ネットワーク構築に有望なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:06:44 GMT)
Q-HyViT: Post-Training Quantization for Hybrid Vision Transformer with
Bridge Block Reconstruction [24.6] 視覚変換器(ViT)は、分類、検出、セグメンテーションを含む多くのアプリケーションで畳み込みニューラルネットワークに取って代わられている。
本稿では,効率的なハイブリッドViTの量子化を初めて行うポストトレーニング量子化手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:47:45 GMT)
Cross-view Semantic Alignment for Livestreaming Product Recognition [24.4] LPR4Mは34のカテゴリをカバーする大規模マルチモーダルデータセットである。
LPR4Mは様々なビデオとノイズモードのペアを含み、長い尾の分布を示す。
クロスビューパッチ間のセマンティックなミスアライメントをペナルティ化するために、新しいパッチ特徴再構成損失を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:00:16 GMT)
UniAP: Towards Universal Animal Perception in Vision via Few-shot
Learning [24.2] 様々な視覚的タスクにおいて種間認識を可能にする新しいユニバーサル・アニマル・パーセプション・モデルであるUniAPを紹介した。
異なる動物やタスク間で共有される視覚的特徴を活かすことで、UniAPは、よく研究された種から限られたラベル付きデータや未知の種への知識の伝達を可能にしている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:13:46 GMT)
Partition-and-Debias: Agnostic Biases Mitigation via A Mixture of
Biases-Specific Experts [24.1] 本稿では,偏差空間を複数の部分空間に暗黙的に分割するために,偏差特異的な専門家の混合を用いた分割・偏差法(PnD)を提案する。
公開および構築されたベンチマークの実験は、PnDの有効性を実証した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:11:40 GMT)
BiFF: Bi-level Future Fusion with Polyline-based Coordinate for
Interactive Trajectory Prediction [23.9] 対話エージェント間の相互作用を捉えるために,Bi-level Future Fusion (BiFF)を提案する。
具体的には、BiFFは高レベルの将来の意図と低レベルの将来の行動とを融合させる。
BiFFはOpen Motionデータセットのインタラクティブな予測ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:55:10 GMT)
Imputing Brain Measurements Across Data Sets via Graph Neural Networks [23.6] 公開されている構造MRIのデータセットには、機械学習モデルのトレーニングに重要な脳の領域(ROI)の具体的な測定が含まれていない可能性がある。
本稿では,不足した測定値を含む他の(パブリックな)データセット上での予測タスクとして,計算問題を再設定することを提案する。
ディープラーニングモデルは、共有されたデータから欠落した測定値を予測するために訓練され、その後、他のデータセットに適用される。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:03:35 GMT)
DPMAC: Differentially Private Communication for Cooperative Multi-Agent
Reinforcement Learning [22.0] コミュニケーションは、人間社会とマルチエージェント強化学習(MARL)における協力の基礎となる。
本稿では,各エージェントに厳密な$(epsilon, delta)$-differential privacy guaranteeを付与したローカルメッセージ送信装置を装備することにより,個々のエージェントのセンシティブな情報を保護できる,テキスト・ディペンデンシャル・プライベート・マルチエージェント・コミュニケーション(DPMAC)アルゴリズムを提案する。
我々は、プライバシ保護通信と協調的なMARLにおけるナッシュ均衡の存在を証明し、この問題がゲーム理論的に学習可能であることを示唆する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:26:23 GMT)
LEGO: Learning and Graph-Optimized Modular Tracker for Online
Multi-Object Tracking with Point Clouds [22.0] 本稿では,データアソシエーション性能を向上させるための学習とグラフ最適化(LEGO)モジュールトラッカーを提案する。
提案するLEGOトラッカーは,グラフ最適化と自己認識機構を統合し,アソシエーションスコアマップを効率的に定式化する。
提案手法は,他のオンライントラッキング手法と比較して,優れた性能を示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:15:02 GMT)
GraphFC: Customs Fraud Detection with Label Scarcity [21.7] 人員が限られているため、税関は限られた数の宣言を手動で検査することしかできない。
現在の税関詐欺検出のアプローチは、この現実世界の設定にはあまり適していない。
本研究では,モデルに依存しない,ドメイン固有の,半教師付きグラフニューラルネットワークに基づく税関不正検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:30:48 GMT)
Robust Fraud Detection via Supervised Contrastive Learning [21.4] 多くの実世界のシナリオでは、少数のラベル付き悪意のあるセッションと大量の通常のセッションしか利用できない。
これらの少数のラベル付き悪意のあるセッションは、通常、可能なすべての悪意のあるセッションの多様性をカバーしない。
本稿では,このオープンセットの不正検出問題に対処するため,ConRoと呼ばれる頑健な教師付きコントラスト学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:33:53 GMT)
Scalable Video Object Segmentation with Simplified Framework [21.4] 本稿では,機能抽出とマッチングを行うスケーラブルなVOS(SimVOS)フレームワークを提案する。
SimVOSは拡張性のあるViTバックボーンを使用して、クエリと参照の同時抽出とマッチングを行う。
実験により,我々のSimVOSは,人気ビデオオブジェクトセグメンテーションベンチマークの最先端結果を得た。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:30:48 GMT)
Scalable Neural Contextual Bandit for Recommender Systems [20.5] エピステマティック・ニューラルレコメンデーション(英: Epistemic Neural Recommendation)は、リコメンダシステムのためのスケーラブルなサンプル効率なニューラルコンテクチュアル・バンディットアルゴリズムである。
ENRはクリックスルー率とユーザレーティングをそれぞれ少なくとも9%と6%向上させる。
最良性能のベースラインアルゴリズムと比較して、少なくとも29%のユーザインタラクションで同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:32:53 GMT)
A Graph Reconstruction by Dynamic Signal Coefficient for Fault
Classification [20.3] 本稿では,エンドツーエンドの故障診断モデルにおいて重要な役割を担う動的特徴再構成信号グラフ法を提案する。
軸受の公開データプラットフォームとロボット研削実験用プラットフォームの実験結果から, 本手法は, ノイズ強度の異なる既存手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:10:50 GMT)
Intelligent Communication Planning for Constrained Environmental IoT
Sensing with Reinforcement Learning [19.7] モノのインターネット(IoT)デバイスは、しばしば電力制限を受け、帯域幅が限られている無線通信方式を利用する。
環境状態を追跡するIoTセンサの通信計画問題を定式化する。
本稿では,センサごとの最適な通信ポリシーを見つけるために,マルチエージェント強化学習(MARL)手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 22:59:09 GMT)
Weakly-Supervised Action Localization by Hierarchically-structured
Latent Attention Modeling [19.7] 弱教師付きアクションローカライゼーションは、ビデオレベルのラベルのみを持つ未トリミングビデオにおけるアクションインスタンスを認識およびローカライズすることを目的としている。
既存のモデルのほとんどはマルチインスタンス学習(MIL)に依存しており、ラベル付きバッグを分類することでラベル付きインスタンスの予測を監督している。
本稿では,特徴セマンティクスの時間的変動を学習するために,新しい注意に基づく階層構造潜在モデルを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:45:49 GMT)
DESOBAv2: Towards Large-scale Real-world Dataset for Shadow Generation [19.4] 本研究では,合成画像をよりリアルにするために,挿入された前景オブジェクトに対する可塑性影の生成に焦点をあてる。
既存の小規模なデータセットであるDESOBAを補完するために、DESOBAv2と呼ばれる大規模なデータセットを作成します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:21:23 GMT)
Efficient Multi-View Inverse Rendering Using a Hybrid Differentiable
Rendering Method [19.3] シーンの3次元形状と反射率を効率的に再構成する,新しいハイブリッド微分可能レンダリング手法を提案する。
本手法は, 最先端の手法と同等あるいは高い品質で再現が可能であり, 効率がよい。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 12:48:10 GMT)
Flamingo: Multi-Round Single-Server Secure Aggregation with Applications
to Private Federated Learning [17.7] Flamingoは、大規模なクライアント間でデータをセキュアに集約するシステムである。
Flamingoを実装し評価し、(拡張)MNISTとCIFAR-100データセット上でニューラルネットワークをセキュアにトレーニングできることを示します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:28:57 GMT)
G-Mix: A Generalized Mixup Learning Framework Towards Flat Minima [17.5] 我々は、DNNモデルのトレーニングにMixupとSAMの強みを組み合わせた、Generalized-Mixupと呼ばれる新しい学習フレームワークを提案する。
本稿では2つの新しいアルゴリズムを提案する: バイナリG-Mixと分解G-Mixは、各サンプルのシャープネス感度に基づいてトレーニングデータを2つのサブセットに分割する。
理論的説明と実験結果の両方により、提案したBG-MixアルゴリズムとDG-Mixアルゴリズムは、複数のデータセットやモデルにわたるモデルの一般化をさらに強化することが明らかとなった。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 16:14:18 GMT)
AdaER: An Adaptive Experience Replay Approach for Continual Lifelong
Learning [16.5] 持続的生涯学習の課題に対処するために,適応的経験リプレイ(AdaER)を提案する。
AdaERはメモリリプレイとメモリ更新という2つのステージで構成されている。
結果: AdaERは、既存の持続的生涯学習ベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 16:23:09 GMT)
Scalable Dynamic Mixture Model with Full Covariance for Probabilistic
Traffic Forecasting [16.0] 時間変化誤差過程に対するゼロ平均ガウス分布の動的混合を提案する。
提案手法は,学習すべきパラメータを数つ追加するだけで,既存のディープラーニングフレームワークにシームレスに統合することができる。
提案手法を交通速度予測タスク上で評価し,提案手法がモデル水平線を改良するだけでなく,解釈可能な時間相関構造も提供することを発見した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 23:12:05 GMT)
Context-Aware Planning and Environment-Aware Memory for Instruction
Following Embodied Agents [15.9] 本研究では, CPEM (Context-aware Planner and Environment-aware Memory) を提案し, 従来の行動のコンテキスト情報を取り入れた計画手法を提案する。
CEMは、挑戦的な対話的命令を用いて、様々なメトリクスで最先端のタスク成功性能を達成する。
ECLAIRという名前のテンプレートアクションを持つCEMは、CVPR'23のEmbodied AI Workshopで第1回ジェネラリスト言語接地エージェント賞を受賞した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:42:11 GMT)
HICL: Hashtag-Driven In-Context Learning for Social Media Natural
Language Understanding [15.7] 本稿では,ソーシャルメディア上での自然言語理解のための新しいハッシュタグ駆動型インコンテキスト学習フレームワークを提案する。
我々の目標は、モデル#Encoderがトピック関連セマンティック情報を組み込むことで、トピック関連投稿を検索できるようにすることである。
In-context NLUベンチマークを作成するために4500万のつぶやきを収集し、7つの下流タスクの実験結果から、HICLは過去の最先端の成果を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:31:45 GMT)
Distributionally Robust Cross Subject EEG Decoding [15.2] 本稿では,デコードロバスト性を改善するために,データ上で動的に進化する原理的手法を提案する。
We derived a general data evolution framework based on Wasserstein gradient flow (WGF) and provide two different form of evolution within the framework。
提案手法は、さらなる改善のために、他のデータ拡張手法と容易に統合できる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:31:33 GMT)
On-the-fly Improving Performance of Deep Code Models via Input Denoising [15.2] 深層コードモデルのための最初の入力記述手法(CodeDenoise)を提案する。
CodeDenoiseは(おそらく)誤予測された入力にノイズのある識別子をローカライズする。
モデルの再トレーニングや再構築は必要ありませんが、パフォーマンスを改善するためには、オンザフライでインプットをクリーン化すればよいのです。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:55:19 GMT)
Calibrating Uncertainty for Semi-Supervised Crowd Counting [15.1] 半監督的な群集カウントは重要な課題だが、難しい課題である。
鍵となるのは、信頼性の高い擬似ラベルを選択するために不確実性を使用することである。
群集カウントのためのモデル不確実性を校正する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:44:25 GMT)
DiffusionTrack: Diffusion Model For Multi-Object Tracking [15.0] マルチオブジェクトトラッキング(MOT)は、単一のフレーム内の個々のオブジェクトを検出し、それらを複数のフレーム間で関連付けることを目的とした、難しい視覚タスクである。
近年のMOT法は,2段階追跡検出法(TBD)と1段階関節検出追跡法(JDT)に分類できる。
本稿では,オブジェクト検出と結合を一貫した認知拡散過程として定式化する,単純だが堅牢なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:48:41 GMT)
MDCS: More Diverse Experts with Consistency Self-distillation for
Long-tailed Recognition [15.0] 本稿では,従来手法が残っていたギャップを埋めるために,MDCS (Consistency Self-distillation) を用いた多種多様な専門家を提案する。
MDCSのアプローチは,2つの中核的コンポーネント – 多様性損失(DL)と一貫性自己蒸留(CS) – から構成される。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:21:22 GMT)
Single Image Reflection Separation via Component Synergy [14.6] 反射重畳現象は複雑で、現実世界に広く分布している。
学習可能な残余項を導入することにより、重ね合わせモデルのより一般的な形式を提案する。
その利点をフルに活用するために,ネットワーク構造をさらに精巧に設計する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:25:27 GMT)
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual
Question Localized-Answering in Robotic Surgery [14.5] 手術用視覚質問定位回答システム(VQLA)は、医療学生やジュニア外科医が記録された手術ビデオから学び、理解するのに役立ちます。
手術シナリオにおけるVQLAに対するCAT-ViL(Co-Attention gaTed Vision-Language)を組み込んだエンドツーエンドトランスフォーマを提案する。
提案手法は,外科的シーン理解のための有望なソリューションを提供し,外科的訓練のための人工知能(AI)ベースのVQLAシステムにおける第一歩を開拓する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 22:23:36 GMT)
Pseudo Flow Consistency for Self-Supervised 6D Object Pose Estimation [14.5] 補助情報なしで純粋なRGB画像で訓練できる6次元オブジェクトポーズ推定法を提案する。
提案手法を3つの挑戦的データセット上で評価し,最先端の自己管理手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:52:18 GMT)
Semantic-Human: Neural Rendering of Humans from Monocular Video with
Human Parsing [14.3] 本稿では,人間のニューラルレンダリングのためのフォトリアリスティックな詳細と視点一貫性を持った人間のパーシングを実現する新しい方法であるSemantic-Humanを紹介する。
具体的には、ニューラルレイディアンス場(NeRF)を拡張して、セマンティクス、外観、形状を共同で符号化し、正確な2次元セマンティクスラベルを実現する。
また,ラベルの復調,ラベルの合成,画像編集など,魅力的な応用も紹介する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:18:19 GMT)
Feasibility of Universal Anomaly Detection without Knowing the
Abnormality in Medical Images [14.2] 以前の異常検出方法は、特定の「既知の」異常に最適化された。
本研究では,4つの医学データセットの異常検出手法を比較した。
本稿では,異常を知らずに,様々な種類の異常検出の利点を活用するための簡易な判定レベルアンサンブル手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:25:24 GMT)
YATO: Yet Another deep learning based Text analysis Open toolkit [14.1] 本稿では,ディープラーニングを用いたテキスト解析のためのオープンソースで使いやすいツールキットYATOを紹介する。
YATOは軽量で、学際的な分野の研究者に親しみやすい。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:24:28 GMT)
Characterizing Usability Issue Discussions in OSS Projects [13.9] ユーザビリティは、オープンソースソフトウェア(OSS)で最も無視されている懸念の1つです。
OSSコミュニティメンバがユーザビリティに関する議論に参加する程度についてはほとんど知識がない。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 01:47:08 GMT)
What Do Code Models Memorize? An Empirical Study on Large Language
Models of Code [13.9] コードモデルは、脆弱性や機密情報、厳格なライセンスを持つコードを含む可能性のあるソースコードの冗長性を記憶し、生成する。
本稿では,学習データをどの程度記憶するコードモデルについて検討する。
3つのカテゴリと14のサブカテゴリで記憶されたコンテンツの分類を構築します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:25:39 GMT)
HopFIR: Hop-wise GraphFormer with Intragroup Joint Refinement for 3D
Human Pose Estimation [13.7] 本稿では,3次元ポーズ推定問題に対処するために,グループ内結合精細化(HopFIR)アーキテクチャを用いたホップワイズグラフフォーマーを提案する。
HopFIRは主に、新しいホップワイドグラフフォーマー(HGF)モジュールとグループ内共同改良(IJR)モジュールで構成されている。
HopFIRはHuman3.6Mデータセットの32.67mmに対して,平均結合位置誤差(MPJPE)でSOTA法よりも高い性能を示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:02:46 GMT)
Learning Latent Representations to Co-Adapt to Humans [12.7] 非定常的な人間はロボット学習者に挑戦しています。
本稿では,ロボットが動的人間と協調して適応できるアルゴリズム形式について紹介する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 23:47:28 GMT)
Breast Lesion Diagnosis Using Static Images and Dynamic Video [12.7] 放射線技師の診断過程を模倣するマルチモーダル乳腺腫瘍診断モデルを提案する。
本研究は,897枚の超音波画像とビデオからなる乳房超音波データセットを用いて検証した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:09:58 GMT)
Explicit Time Embedding Based Cascade Attention Network for Information
Popularity Prediction [12.6] 本稿では,大規模情報ネットワークのための新しい人気予測アーキテクチャとして,時間埋め込みに基づくカスケード注意ネットワーク(TCAN)を提案する。
TCANは、時間属性を一般的な時間埋め込みアプローチ(TE)を介してノード機能に統合し、カスケードグラフアテンションエンコーダ(CGAT)とカスケードシーケンスアテンションエンコーダ(CSAT)を使用して、カスケードグラフとカスケードシーケンスの表現を完全に学習する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:43:11 GMT)
Whether you can locate or not? Interactive Referring Expression
Generation [12.1] 本稿では,実際のRECモデルと対話可能な対話型REG(IREG)モデルを提案する。
IREGは、一般的な評価指標において、過去の最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:53:32 GMT)
MPCViT: Searching for Accurate and Efficient MPC-Friendly Vision
Transformer with Heterogeneous Attention [12.0] 我々は,MPCにおける高精度かつ効率的なViT推論を実現するために,MPCViTと呼ばれるMPCフレンドリーなViTを提案する。
広範な実験により、MPCViTは6.2倍、2.9倍、および1.9倍の遅延低減で1.9%、1.3%、および3.6%の精度を達成した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:00:55 GMT)
Repeated Builds During Code Review: An Empirical Study of the OpenStack
Community [11.3] コミュニティから66,932のコードレビューの実証的研究を行った。
i)コードレビューの55%はビルド失敗後にリチェックコマンドを起動し、(ii)リチェックコマンドの呼び出しはビルド失敗の結果を42%のケースでのみ変更し、(iii)リチェックコマンドの呼び出しは平均2200%のレビュー待ち時間を増大させる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:45:03 GMT)
NegVSR: Augmenting Negatives for Generalized Noise Modeling in
Real-World Video Super-Resolution [11.3] ビデオ超解像(VSR)は、理想的なデータセットから高解像度(HR)ビデオを合成することができる。
VSRモデルを未知の複雑な劣化を伴う実世界のビデオに適用することは、依然として難しい課題である。
ビデオ超解法(NegVSR)課題における一般化ノイズモデリングのための負の強化戦略を提案する。
我々の手法は、特に視覚的品質において、鮮明なマージンを持つ最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:30:23 GMT)
Evaluating Transfer Learning for Simplifying GitHub READMEs [11.2] 本研究は,GitHubファイルを自動的に単純化する,ソフトウェア工学領域におけるテキスト簡略化手法の可能性を探るものである。
14,588のエントリで構成された、ソフトウェア関連のGitHubファイルのペアを収集し、単純化された文と整列させ、難しいバージョンを自動的に単純化するためにTransformerベースのモデルをトレーニングしました。
自動BLEUスコアと人的評価を用いて,トランスファー学習方式とベースラインモデルの性能を比較した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:20:41 GMT)
Tackling Vision Language Tasks Through Learning Inner Monologues [10.8] 本稿では,複雑な視覚言語問題を解くために,内部モノローグ多モード最適化(IMMO)を提案する。
IMMOは内的モノローグ過程をシミュレートする。
その結果、IMMOは推論能力と説明能力を高め、視覚モデルと言語モデルのより効果的な融合に寄与することが示唆された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 10:10:49 GMT)
GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined
Model Parallelism [10.7] 現在の分散フルグラフGNNトレーニング手法は、データ並列性の変種、すなわちグラフ並列性を採用している。
そこで本研究では,モデル並列性を用いたGNNPipeという新たなトレーニング手法を提案する。
提案手法は, 平均2.45倍(平均2.03倍)の訓練時間を短縮し, 通信量とオーバーヘッドを最大22.51倍, 27.21倍に短縮する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:44:14 GMT)
Implicit Neural Representation for Cooperative Low-light Image
Enhancement [10.5] 我々は,NeRCoと呼ばれる,協調的低照度画像強調のための暗黙的ニューラル表現法を提案する。
NeRCoは、現実世界のシーンの多様な劣化要因を制御可能なフィッティング機能と統合し、より堅牢性をもたらす。
結果として,事前学習した視覚言語モデルから,事前学習によるセマンティック・オリエント・インテリジェンスを導入する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:28:39 GMT)
MeDM: Mediating Image Diffusion Models for Video-to-Video Translation
with Temporal Correspondence Guidance [10.5] 本研究では,一貫した時間的流れを伴うビデオ間翻訳に事前学習した画像拡散モデルを利用するMeDMを紹介する。
我々は、生成したフレームの物理的制約を強制し、独立したフレーム単位のスコアを仲介する実用的な符号化を構築するために、明示的な光学フローを用いる。
MeDMは拡散モデルの微調整やテストタイムの最適化を必要としない。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:59:12 GMT)
Open, Closed, or Small Language Models for Text Classification? [10.2] 我々は,3つの異なるNLPタスクにまたがる8つのデータセットを用いて,モデルの3つのクラスを評価する。
オープンソースモデルは、微調整によってクローズドソースモデルに匹敵する可能性がある。
本研究は,タスク要求に基づくモデル選択の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:58:32 GMT)
SwinLSTM:Improving Spatiotemporal Prediction Accuracy using Swin
Transformer and LSTM [10.1] 本研究では,SwinブロックとLSTMを統合した新たなリカレントセルConvwinLSTMを提案する。
我々の競争実験の結果は、Swinwinの依存関係を捕捉するモデルにおいて、グローバルな空間依存の学習がより有利であることを示している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:08:28 GMT)
Task Agnostic Restoration of Natural Video Dynamics [10.1] 多くのビデオ復元・翻訳タスクでは、各フレームを独立して処理することにより、画像処理操作を映像領域に「ナビ」拡張する。
本稿では,不整合ビデオから一貫した動きのダイナミクスを推論し,活用して時間的フリックを緩和する,このタスクのための一般的なフレームワークを提案する。
提案フレームワークは、多数の画像処理アプリケーションによって処理される2つのベンチマークデータセット、DAVISとvidevo.net上でSOTA結果を生成する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:51:11 GMT)
Interpretation on Multi-modal Visual Fusion [10.0] マルチモーダル・ビジョン・コミュニティの解釈に光を当てるための分析的枠組みと新しい指標を提案する。
モダリティ間の表現の一貫性と特殊性、各モダリティ内の進化規則、マルチモダリティモデルの最適化に使用される協調論理について検討する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:01:04 GMT)
Semi-Implicit Variational Inference via Score Matching [9.7] 半単純変分推論(SIVI)は、変分家族の表現性を大いに豊かにする。
現在のSIVIアプローチでは、サロゲートエビデンスローバウンド(ELBO)を使用したり、高価なインナーループMCMCをトレーニングに使用する場合が多い。
スコアマッチングによる代替学習目標に基づくSIVI-SMを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:32:54 GMT)
Modeling Random Networks with Heterogeneous Reciprocity [9.6] 成長するソーシャルネットワークにおける多様な相互行動のモデル化手法を開発する。
本稿では,人気ユーザに対するアトラクションを模倣した異種相互性を持つ優先アタッチメントモデルを提案する。
提案手法を,不均一な相互行動パターンを持つFacebookのウォールポストネットワークの解析に適用する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 21:21:25 GMT)
Contrastive Learning-based Imputation-Prediction Networks for
In-hospital Mortality Risk Modeling using EHRs [9.6] 本稿では, EHRデータを用いた病院内死亡リスク予測のための, 対照的な学習ベース予測ネットワークを提案する。
本研究は, グラフ解析に基づく患者層形成モデルを用いて, 似通った患者をグループ化する手法を提案する。
2つの実世界のEHRデータセットの実験により、我々のアプローチは、計算タスクと予測タスクの両方において最先端のアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:24:34 GMT)
East: Efficient and Accurate Secure Transformer Framework for Inference [7.9] 本稿では,効率的なセキュアトランスフォーマー推論を実現するためのフレームワークemphEastを提案する。
Ironと比較して、1.2$times$ローランタイム内で、約1.8$times$ロー通信を実現しています。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:26:14 GMT)
NeutrEx: A 3D Quality Component Measure on Facial Expression Neutrality [7.7] 中性表現アンカーへの3次元顔再構成の蓄積距離に基づく品質指標を提案する。
提案手法がベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:38:39 GMT)
Prototypical Kernel Learning and Open-set Foreground Perception for
Generalized Few-shot Semantic Segmentation [7.7] Generalized Few-shot Semantic (GFSS)は、Few-shot Semanticアグリゲーションを拡張して、未確認のクラスと評価中のクラスを分割する。
上記の問題に対して,原型的カーネル学習とオープンセット認識を融合させることで対処する。
さらに、条件バイアスに基づく推論と協調する前景文脈知覚モジュールを採用し、クラス非依存およびオープンセット前景検出を行う。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:22:52 GMT)
Towards Practical Few-shot Federated NLP [7.3] 下流タスクのための微調整済みの事前訓練モデルは、しばしばかなりの量のラベル付きプライベートデータを必要とする。
AUG-FedPromptは,データ拡張のために,豊富なラベルのないデータを活用するプロンプトベースの学習システムである。
実験の結果,AUG-FedPromptはラベル付きデータに制限のあるフルセットの微調整と同等に動作できることが示唆された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:28:53 GMT)
Forecast-MAE: Self-supervised Pre-training for Motion Forecasting with
Masked Autoencoders [7.1] 本研究では,自己教師型学習の動作予測への応用について検討する。
Forecast-MAEは、モーション予測タスクの自己教師型学習用に特別に設計されたマスクオートエンコーダフレームワークの拡張である。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:27:51 GMT)
TSAR-MVS: Textureless-aware Segmentation and Correlative Refinement
Guided Multi-View Stereo [6.9] テクスチャレス・アンド・コリレーティブ・リファインメント・ガイド付きマルチビューステレオ(TSAR-MVS)を提案する。
フィルター、精細化、セグメンテーションによる3次元再構成におけるテクスチャレス領域による課題に対処する。
本手法は,非学習手法よりも優れ,細部を保存しながらテクスチャのない領域に頑健性を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:40:57 GMT)
An Online Multiple Kernel Parallelizable Learning Scheme [6.4] 本稿では,カーネル選択バイアスを低減するために,複数の単一カーネルベースのオンライン手法を巧みに組み合わせた学習手法を提案する。
提案手法は、正規化された経験的リスク最小化凸問題として定式化されたタスクに適用される。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:15:02 GMT)
HollowNeRF: Pruning Hashgrid-Based NeRFs with Trainable Collision
Mitigation [6.3] ハッシュグリッド型ニューラル放射場(NeRF)に対する新しい圧縮解を提案する。
HollowNeRFは、トレーニングフェーズ中に自動的にフィーチャーグリッドを分散する。
提案手法は,パラメータの31%しか利用せず,Instant-NGPに匹敵するレンダリング品質を提供する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 22:28:17 GMT)
Differentiable Inductive Logic Programming in High-Dimensional Space [6.2] 大規模述語によるインダクティブ合成へのデルタILPアプローチの拡張を提案する。
大規模述語発明は,勾配降下による誘導的合成の微分に有効であることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:36:45 GMT)
TTPOINT: A Tensorized Point Cloud Network for Lightweight Action
Recognition with Event Cameras [5.9] イベントカメラは、従来のフレームベースの手法と互換性のないスパースおよび非同期データを生成する。
我々は,動作認識タスクにおけるSOTA(State-of-the-art)フレームベースの手法と比較しても,結果が得られるTTPOINTというポイントクラウドネットワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:58:31 GMT)
On Estimating the Gradient of the Expected Information Gain in Bayesian
Experimental Design [5.9] 我々は,勾配降下アルゴリズムと組み合わせてEIGの勾配を推定する手法を開発し,EIGの効率的な最適化を実現する。
そこで本研究では,EIG勾配を推定するための2つの手法,EIG勾配を推定するために後方サンプルを利用するUEEG-MCMC,パラメータサンプルを繰り返し使用して高いシミュレーション効率を実現するBEEG-APを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:48:44 GMT)
Data-to-text Generation for Severely Under-Resourced Languages with
GPT-3.5: A Bit of Help Needed from Google Translate [5.6] 言語学習システムは、トレーニングデータに過小評価されている言語に関わるタスクにどのように対処するかを検討する。
これには、アイルランド語、マルタ語、ウェールズ語、ブルトン語のデータ・テキスト生成が含まれる。
ごくわずかのプロンプトは、リソース不足の言語への直接生成に効果があるが、英語でピボットすると違いは消えてしまう。
我々は、最先端のLLMを用いて、アウト・オブ・ザ・ボックスで、アン・リソース言語での優れた性能を達成できると結論付けた。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:19:34 GMT)
Towards Probabilistic Causal Discovery, Inference & Explanations for
Autonomous Drones in Mine Surveying Tasks [5.6] 因果モデリングは、自律的なエージェントによる意思決定や結果の説明を支援することができる。
ここでは,塩鉱で稼働するドローンシステムにおける因果関係に関する課題を特定する。
本稿では、因果的インフォームドPOMDP計画、オンラインSCM適応、およびポストホックな反事実的説明からなる確率的因果関係の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:12:55 GMT)
Efficient Representation Learning for Healthcare with
Cross-Architectural Self-Supervision [5.4] この課題に対応するために、クロスアーキテクチャー・セルフスーパービジョン(CASS)を紹介します。
そこで,CASSで訓練されたCNNとTransformerは,4つの多様な医療データセットにおいて,既存の自己教師型学習方法よりも優れていることを示す。
また、CASSはバッチサイズの変化やエポックの事前訓練にかなり堅牢であることを示し、医療アプリケーションにおける機械学習の候補として適している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:57:19 GMT)
OCTAL: Graph Representation Learning for LTL Model Checking [5.2] GRLベースの新しいフレームワークモデルは、グラフ構造化システムと仕様の表現を学習するために設計されている。
実験により、モデルが有望な精度を達成し、標準SOTAモデルチェッカーに対する全体的なスピードアップが最大で11倍になることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:11:18 GMT)
Spatial-Temporal Alignment Network for Action Recognition [5.2] 本稿では,既存の行動認識アーキテクチャにおける視点不変特徴表現の導入について述べる。
本稿では,行動認識のための幾何学的不変表現を明示的に学習する空間時間アライメントネットワーク(STAN)を提案する。
我々は、UCF101やHMDB51のような広く使われているデータセット上でSTANモデルをテストする。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:31:57 GMT)
Federated Few-Shot Learning for Mobile NLP [5.1] 本研究は,FedFSL(FedFSL)におけるフェデレーションNLPについて検討する。
まず、トレーニングデータの0.05%(100パーセント以下)しかラベル付けされていない場合に、競争精度を提供するトレーニングパイプラインを構築します。
次に、新しい設計で高い実行コストに対処するシステムFeSを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:31:01 GMT)
Characterizing and Tuning Exceptional Points Using Newton Polygons [4.9] 例外点の特徴付けとチューニングのためのフレームワークとして,ニュートン多角形法を紹介した。
私たちの研究は、例外的な物理学を理解し、チューニングするための分析的なレシピを提供します。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:46:07 GMT)
DatasetEquity: Are All Samples Created Equal? In The Quest For Equity
Within Datasets [4.8] 本稿では,機械学習におけるデータ不均衡に対処する新しい手法を提案する。
本手法は, 深い知覚埋め込みとクラスタリングを用いて, 画像の外観に基づくサンプル確率を算出する。
実験では、KITTIやnuScenesを含む自律走行視覚データセット間で、この手法の有効性を検証する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:11:49 GMT)
An Empirical Study of AI-based Smart Contract Creation [4.8] スマートコントラクト生成のためのChatGPTやGoogle Palm2のような大規模言語モデル(LLM)は、AIペアプログラマとして初めて確立されたインスタンスであるようだ。
本研究の目的は,LLMがスマートコントラクトに対して提供する生成コードの品質を評価することである。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 19:29:42 GMT)
Utilizing Semantic Textual Similarity for Clinical Survey Data Feature
Selection [4.6] 調査データから結果を予測する機械学習モデルは、過度に適合し、結果として一般化性が低下する可能性がある。
この機能の選択は、学習する機能の最適なサブセットを選択しようとするものだ。
特徴名と対象名の関係を言語モデル(LM)を用いて評価し,意味的テキスト類似度(STS)スコアを生成する。
STSを用いて最小冗長-最大関連性(mRMR)アルゴリズムで特徴を直接選択する性能について検討する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:10:51 GMT)
Sensitivity analysis of AI-based algorithms for autonomous driving on
optical wavefront aberrations induced by the windshield [4.5] 本稿では,異なるフロントガラス構成に対する2つの知覚モデルの感度を評価することにより,領域シフト問題について検討する。
以上の結果から,ウィンドシールドが導入した性能差は十分でなく,既存の光学的計測値が十分でない可能性が示唆された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:01:23 GMT)
AltDiffusion: A Multilingual Text-to-Image Diffusion Model [4.5] 本稿では18言語をサポートする新しい多言語T2I拡散モデルAltDiffusionを提案する。
具体的には、まず知識蒸留に基づいて多言語テキストエンコーダを訓練し、次に事前学習した英語のみの拡散モデルに接続し、2段階のスキーマでモデルを訓練し、多言語能力を高める。
本稿では,多言語一般18(MG-18)および多言語文化18(MC-18)データセットを含む新しいベンチマークを導入し,高品質な画像を生成し,異なる言語で文化固有の概念を捉えるためのT2I拡散モデルの有効性を評価する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 11:52:12 GMT)
Anomaly-Aware Semantic Segmentation via Style-Aligned OoD Augmentation [4.5] 我々は、OoDデータと運転シーン間の領域ギャップを減らし、OoD合成プロセスを進める。
本稿では,事前学習したセマンティックセグメンテーションモデルを効果的に誘導し,任意のクラスを生成できないような単純な微調整損失を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:45:39 GMT)
A Tropical Geometric Approach To Exceptional Points [4.4] 非エルミート系の異なる面を特徴付ける統一的な熱帯幾何学的枠組みを導入・開発する。
我々の研究は、非エルミート物理学の研究のための新しい枠組みを示し、この分野への熱帯幾何学の新たな結びつきを明らかにしている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:40:11 GMT)
A Transformer-based Framework For Multi-variate Time Series: A Remaining
Useful Life Prediction Use Case [4.0] 本研究は,時系列予測のためのエンコーダ変換アーキテクチャに基づくフレームワークを提案する。
C-MAPPSベンチマークデータセットの4セットすべてに対して,提案手法の有効性を検証した。
機械寿命の初期段階と劣化経路のモデル認識を可能にするため, 新たな拡張窓手法が提案された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:30:35 GMT)
Towards Certification of Machine Learning-Based Distributed Systems
Behavior [3.9] マシンラーニング(ML)は、クラウドエッジ連続体にデプロイされる複雑な分散システムの運用を促進するために、ますます使われています。
既存の認証スキームは、MLモデル上に非決定論的振る舞いが構築されているシステムには、すぐには適用されない。
本稿では、現状の認定制度の課題と欠陥を分析し、オープンな研究課題について論じ、MLベースの分散システムの振る舞いに関する最初の認定制度を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 19:37:57 GMT)
Tunneling time and Faraday/Kerr effects in $\mathcal{PT}$-symmetric
systems [3.5] 2つの現象の類似性について論じ、どちらもある種のモデルパラメータにおいて相転移のような異常な挙動を示す。
$mathcalPmathcalT$-symmetric系におけるトンネル時間とファラデー/ケラー角の異常な挙動は、エネルギー/周波数複素平面における散乱振幅の極の運動によって引き起こされる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:25:28 GMT)
Deep Generative Modeling-based Data Augmentation with Demonstration
using the BFBT Benchmark Void Fraction Datasets [3.3] 本稿では、画像データ生成に広く用いられている深部生成モデル(DGM)の科学的データ拡張への応用について検討する。
トレーニングが完了すると、DGMはトレーニングデータに類似した合成データを生成し、データセットのサイズを大幅に拡大するために使用することができる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 22:19:41 GMT)
Knowledge Transfer from High-Resource to Low-Resource Programming
Languages for Code LLMs [3.2] 本稿では,半合成データを用いた低リソース言語上でのコードLLMの性能向上に有効な手法を提案する。
我々は、PythonからRacket、OCaml、Luaの新しい数万のトレーニングアイテムを生成するために、我々のアプローチを適用します。
また,MultiPL-T生成データを用いて,ベンチマーク問題に対するRacket,OCaml,Luaの最先端性能を実現するStarCoderBaseの微調整版を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:19:01 GMT)
Global Features are All You Need for Image Retrieval and Reranking [2.6] SuperGlobalは、両方のステージにグローバル機能のみを取り入れ、精度を犠牲にすることなく効率を向上する、新しいアプローチである。
我々の実験は、標準ベンチマークの最先端技術と比較して大幅に改善されている。
我々の2段階システムは、現在の単一ステージの状態を16.3%超え、高性能画像検索システムに対するスケーラブルで正確な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 06:15:43 GMT)
Dynamic Bilevel Learning with Inexact Line Search [2.5] イメージングとデータサイエンスにおいて、手動で正規化パラメータを設定することは、非常に難しい課題である。
本稿では,不正確な関数評価と過次性を含む,既知収束不正確なバックトラックライン探索を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 19:58:05 GMT)
Dual Branch Deep Learning Network for Detection and Stage Grading of
Diabetic Retinopathy [2.4] 本稿では,糖尿病網膜症の診断とステージグレーディングのためのディープラーニング手法を提案する。
我々のモデルは2つの最先端の事前訓練モデルを用いて特徴抽出を行い、それらを新しいデータセットで微調整する。
糖尿病網膜症の検出とステージ分類において顕著な性能を発揮する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:41:41 GMT)
PDL: Regularizing Multiple Instance Learning with Progressive Dropout
Layers [2.3] 多重インスタンス学習(MIL)は、バッグとして知られるインスタンスのコレクションにバイナリクラスラベルを割り当てようとする、弱い教師付き学習アプローチである。
本稿では,複雑な特徴表現の発見において,MILモデルの過度な適合と強化を図るために,プログレッシブ・ドロップアウト・レイヤ(PDL)という手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 21:20:30 GMT)
Effects of Convolutional Autoencoder Bottleneck Width on StarGAN-based
Singing Technique Conversion [2.2] 歌唱技法変換(Singing Technique conversion、STC)とは、ある音声技術から別の音声技術へ変換する作業を指す。
以前のSTC研究や歌唱音声変換の研究は、畳み込みオートエンコーダ(CAE)を変換に用いている。
我々は WORLD vocoder 表現と CAE アーキテクチャを利用した GAN ベースのマルチドメイン STC システムを構築した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:13:28 GMT)
Finding emergence in data: causal emergence inspired dynamics learning [2.2] 本稿では,創発的な潜在空間内でのマクロ力学の学習を目的とした機械学習フレームワークを提案する。
シミュレーションおよび実データによる実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:12:47 GMT)
DyFFPAD: Dynamic Fusion of Convolutional and Handcrafted Features for
Fingerprint Presentation Attack Detection [2.1] ユーザの偽の指紋を被写体の意図の有無で作成することにより、提示攻撃を行うことができる。
本稿では,既知および未知の物質プロトコルにおける提示攻撃を検出するための,深層学習と手工芸の特徴の動的アンサンブルを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:46:49 GMT)
To prune or not to prune : A chaos-causality approach to principled
pruning of dense neural networks [1.9] 本稿では,誤分類の原因となる因果的重みを特定するために,重み更新と因果性を利用した学習におけるカオス(リャプノフ指数)の概念を紹介する。
このような切断されたネットワークは、元の性能を維持し、機能説明可能性を維持する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:17:33 GMT)
Physics-guided training of GAN to improve accuracy in airfoil design
synthesis [1.8] GAN(Generative Adversarial Network)は、最近、機械形状の設計合成に使われている。
本稿では,GANモデルの物理誘導学習を指導し,物理的妥当性を学習する手法を提案する。
数値実験により,提案手法は精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:52:30 GMT)
Deep Reinforcement Learning for Active High Frequency Trading [1.7] 我々は、株式市場におけるアクティブな高周波取引のための、最初のエンドツーエンドのDeep Reinforcement Learning(DRL)ベースのフレームワークを紹介する。
我々はDRLエージェントを訓練し、Pximal Policy Optimizationアルゴリズムを用いてIntel Corporation株の1ユニットを取引する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:10:38 GMT)
Vortex structure and spectrum of atomic Fermi superfluid in a spherical
bubble trap [1.7] 等人口原子フェルミ超流体の多重量子化渦(MQVs)の構造を解析した。
エネルギースペクトルは渦の渦度に対応するギャップ内状態分岐の数を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 16:03:44 GMT)
Minimizing Turns in Watchman Robot Navigation: Strategies and Solutions [1.7] 本稿では,直交ウォッチマン経路問題(OWRP)を解くための効率的な線形時間アルゴリズムを提案する。
本研究は,より合理化されたパトロールロボットの設計を可能にすることにより,ロボットシステムの進歩に寄与する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:53:53 GMT)
VariabilityTrack:Multi-Object Tracking with Variable Speed Object
Movement [1.6] マルチオブジェクトトラッキング(MOT)は、ビデオ内のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
環境フィードバックに基づく可変速度カルマンフィルタアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 04:22:32 GMT)
Contrastive Learning for Non-Local Graphs with Multi-Resolution
Structural Views [1.4] 本稿では,グラフ上の拡散フィルタを統合する新しい多視点コントラスト学習手法を提案する。
複数のグラフビューを拡張として組み込むことで、異種グラフの構造的等価性を捉える。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:42:02 GMT)
Securing Pathways with Orthogonal Robots [1.3] 経路用ロボットの最小数を線形時間で決定できることが示されている。
ロボットをポリゴンのどこにでも配置する柔軟性に重点を置いている。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 19:05:13 GMT)
Accelerating Exact Combinatorial Optimization via RL-based
Initialization -- A Case Study in Scheduling [1.3] 本研究の目的は、最適化問題に対処する機械学習(ML)を用いた革新的なアプローチを開発することである。
1) 粗粒スケジューラとしての解法, 2) 解緩和, 3) ILPによる正確な解法の3つのステップを含む新しい2段階のRL-to-ILPスケジューリングフレームワークを導入する。
提案フレームワークは, 正確なスケジューリング手法と比較して, 最大128ドルの高速化を実現しつつ, 同一のスケジューリング性能を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:52:43 GMT)
A Comparison of Adversarial Learning Techniques for Malware Detection [1.2] 我々は、勾配に基づく、進化的アルゴリズムに基づく、強化に基づく手法を用いて、敵対的なサンプルを生成する。
実験により,強化学習手法を用いたGymマルウェア生成装置が最も実用性が高いことが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:22:32 GMT)
Towards Self-Adaptive Machine Learning-Enabled Systems Through QoS-Aware
Model Switching [1.2] 本稿では,機械学習モデルバランサの概念を提案し,複数のモデルを用いてMLモデルに関連する不確実性を管理する。
AdaMLSは、この概念を活用し、従来のMAPE-Kループを拡張した新しい自己適応手法である。
予備的な結果は、AdaMLSが保証において、単純で単一の最先端モデルを上回ることを示唆している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 09:33:51 GMT)
Critical phase and spin sharpening in SU(2)-symmetric monitored quantum
circuits [1.2] Su(2)-symmetric monitored quantum circuits について検討する。
ボリューム法則の絡み合った位相と臨界位相の遷移を見いだす。
我々は「スピン・シャーピング遷移」を数値的に同定する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:04:22 GMT)
MLOps: A Review [1.2] 本研究では,機械学習操作(MLOps)の意義について検討した。
簡単に使えるソフトウェアの開発を支援するために、著者らはMLOpsメソッドを研究している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 19:24:57 GMT)
Causal Intersectionality and Dual Form of Gradient Descent for
Multimodal Analysis: a Case Study on Hateful Memes [1.1] 機械学習(ML)の使用が爆発的に増加する中で、その内部作業に根ざした意味的意義を理解することが重要である。
本研究は, ヘイトフルミーム検出問題を平均処理効果(ATE)として定式化できることを示す。
最新のLLM LLaMA2は、コンテキスト内学習環境において、ミーム検出の交わる性質を解き放つことができることを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:14:15 GMT)
Breaking Language Barriers: A Question Answering Dataset for Hindi and
Marathi [1.0] 本稿では,ヒンディー語とマラティー語という2つの言語を対象とした質問回答データセットの開発に焦点をあてる。
ヒンディー語は世界第3位の言語であり、マラシ語は世界第11位の言語であるにもかかわらず、両方の言語は効率的な質問回答システムを構築するための限られた資源に直面している。
これらの言語で利用可能な最大の質問回答データセットをリリースし、各データセットには28,000のサンプルが含まれています。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:39:21 GMT)
A Control Theoretic Framework for Adaptive Gradient Optimizers in
Machine Learning [0.7] 適応勾配法はディープニューラルネットワークの最適化に人気がある。
最近の例にはAdaGradとAdamがある。
我々は適応的勾配法のための汎用的なフレームワークを開発する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:42:29 GMT)
Single-Sentence Reader: A Novel Approach for Addressing Answer Position
Bias [0.4] 我々は,機械読解(MRC)における解答位置バイアスに対処する新しいアプローチとして,単文読影器を提案する。
注目すべきは、従来のトレーニングセットでトレーニングされたモデルとほぼ一致した結果が得られることだ。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:20:42 GMT)
Efficient Guided Generation for Large Language Models [0.2] 本稿では, 有限状態マシンの状態間の遷移の観点から, ニューラルテキスト生成の問題を構成的に再構成する方法を示す。
このフレームワークは、正規表現と文脈自由文法でテキスト生成を導くための効率的なアプローチをもたらす。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 21:27:51 GMT)
Towards a High-Performance Object Detector: Insights from Drone
Detection Using ViT and CNN-based Deep Learning Models [0.1] 我々は,CNN と ViT をベースとした各種モデルを構築し,単流体検出において,基本型 ViT が最高の CNN ベース転送学習モデルより4.6 倍堅牢であることを示す。
最先端のCNN検出器の能力を全面的に超えるためには、ViTはCNNよりも優れていますが、トレーニングデータ、計算能力、高度でパフォーマンス指向な設計も必要です。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:57:52 GMT)
Why We Don't Have AGI Yet [0.0] 元々のAIのビジョンは、2002年に"Artificial General Intelligence" (AGI) という用語で再認識された。
このビジョンは、人間と同じように学習し、推論し、問題を解決することができるコンピュータシステムである「シンキングマシン」を構築することである。
いくつかの大規模取り組みが名目上AGIに取り組んできたが、純粋に焦点を絞ったAGI開発分野は、十分な資金提供や推進がなされていない。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:49:24 GMT)
The E.U.'s Artificial Intelligence Act: An Ordoliberal Assessment [0.0] E.U.'s Artificial Intelligence Act(AIA)は、AI技術の潜在的なネガティブな影響に対処し緩和する世界初の主要な試みである。
この記事では、AIAを経済倫理的視点、すなわちオードリベラリズム2.0から批判的に分析する。
また、AIAを強化するための改革措置も提案している。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:28:16 GMT)
Study on the effectiveness of AutoML in detecting cardiovascular disease [0.0] 本稿では、機械学習(ML)が心血管疾患の予測を可能にする有望な技術である患者指向システムの開発と応用との関連について述べる。
心血管疾患を検出するためのAutoMLモデルの構造は、使用する基本モデルの効率と精度だけでなく、初期データを前処理するシナリオにも依存する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:46:27 GMT)
Semi-Supervised Anomaly Detection for the Determination of Vehicle
Hijacking Tweets [0.0] 南アフリカでは、自動車のハイジャックが絶え間なく増えている。
この研究は、ツイートを使ってハイジャック事件を特定するための、新しい半教師付きアプローチを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:46:29 GMT)
Redefining Computer Science Education: Code-Centric to Natural Language
Programming with AI-Based No-Code Platforms [0.0] 本稿では,プログラミングの領域における人間とコンピュータの進化的関係について述べる。
AIベースのノーコードプラットフォームの出現は、このダイナミクスに革命をもたらしている。
教育者として、この新しいダイナミクスをカリキュラムに統合することは必須です。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 02:44:35 GMT)
Recurrent generation of maximally entangled single particle states via
quantum walks on cyclic graphs [0.0] 最大絡み合った単一粒子状態(MESPS)は量子技術の新たな可能性を開く。
1つのコインが4ドルおよび8ドルのサイト巡回グラフ上で離散時間量子ウォークによって(周期的に)繰り返し時間ステップでMESPSを生成できることがわかった。
本稿では,生成されたMESPSの量子暗号プロトコルへの応用を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 17:43:22 GMT)
R-C-P Method: An Autonomous Volume Calculation Method Using Image
Processing and Machine Vision [0.0] 2台のカメラを用いて、矩形物体の寸法をリアルタイムで測定した。
画像処理とエッジ検出を用いてR-C-P法を開発した。
表面積に加えて、R-C-P法は不連続エッジや体積も検出する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:39:27 GMT)
Quantum dynamics as a pseudo-density matrix [0.0] 量子チャネルの有限列に従って進化する量子系と擬密度行列を関連付ける方法を示す。
また、与えられた擬密度行列から量子力学を明示的に抽出する方法を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 05:26:23 GMT)
Quantum clocks driven by measurement [0.0] エントロピー低減により駆動される量子クロックを計測により記述する。
この機構は、オープンコプラナー共振器に結合された超伝導トランスモンキュービットで構成されている。
測定自体が条件モーメントの変動周期とともにコヒーレント振動を誘導することを示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:18:58 GMT)
Optimizing Multi-Class Text Classification: A Diverse Stacking Ensemble
Framework Utilizing Transformers [0.0] 本研究では,トランスモデルを利用したマルチテキスト分類手法を提案する。
BERT、ELECTRA、DistilBERTを含む複数の単一トランスを組み合わせることにより、最適な予測モデルを生成する。
実世界の顧客レビューデータセットを用いて実験評価を行い,提案手法の有効性と優位性を示した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 13:29:15 GMT)
Nano1D: An accurate Computer Vision model for segmentation and analysis
of low-dimensional objects [0.0] モデルはAgナノワイヤ上でテストされ、セグメント化に成功し、それらの幾何学的特性を解析する。
モデルの主な強みは、重なり合うオブジェクトを99%以上の精度で分割して解析できることである。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:06:31 GMT)
Modeling biological face recognition with deep convolutional neural
networks [0.0] ディープ畳み込みニューラルネットワーク(DCNN)は、生物物体認識の最先端の計算モデルとなっている。
近年,この成果を生体顔認証研究に移管する試みが始まっている。
本稿では,生物認識のモデル化にDCNNを用いた最初の研究について概説する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:07:10 GMT)
Inductive-bias Learning: Generating Code Models with Large Language
Model [0.0] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)と呼ばれる能力によって注目を集めている。
Inductive-Bias Learning (IBL)'と呼ばれる新しい学習手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 03:01:45 GMT)
Improving the proof of the Born rule using a physical requirement on the
dynamics of quantum particles [0.0] 我々は [1] で与えられる結果を改善することにより、Born 規則を明示的な形で生成する。
提案された仮定は依然として量子力学の仮定には含まれていないが、全ての実験はそれに従っており、量子力学の標準的な仮定では導出できない。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:39:27 GMT)
High Performance Computing Applied to Logistic Regression: A CPU and GPU
Implementation Comparison [0.0] 汎用GPUによるロジスティック回帰(LR)の並列バージョンを提案する。
我々の実装は、X. Zouらによって提案された並列なグラディエントDescent Logistic Regressionアルゴリズムの直接変換である。
本手法は,画像認識,スパム検出,不正検出などのリアルタイム予測に特に有用である。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:49:37 GMT)
Handwritten and Printed Text Segmentation: A Signature Case Study [0.0] 我々は手書きテキストセグメンテーションの課題に対処するための新しいアプローチを開発する。
我々の目的は、クラス全体からテキストを復元することであり、特に重なり合う部分のセグメンテーション性能を向上させることである。
私たちの最高の設定は、以前の2つの異なるデータセットで17.9%、IoUスコアで7.3%のパフォーマンスを上回っています。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 15:12:37 GMT)
Geometric instability of graph neural networks on large graphs [0.0] グラフニューラルネットワーク(GNN)による埋め込みの幾何学的不安定性の解析
このような不安定性を測定するために,グラフネイティブグラフグラフグラム(GGI)を提案する。
これにより、ノード分類とリンク予測の両方のために、GNN埋め込みの様々な不安定な振る舞いを大きなグラフ上で研究することができる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 20:10:54 GMT)
Finite temperature quantum noise correlations as a probe for topological
helical edge modes [0.0] キラル、自明ヘリカル、トポロジカルヘリカルエッジモードの区別は、有限温度での量子ノイズ測定によって効果的に行うことができる。
また, 有限温度量子ノイズ相関は有限周波数でも有効であることを確認した。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 18:57:37 GMT)
Exploring the Power of Topic Modeling Techniques in Analyzing Customer
Reviews: A Comparative Analysis [0.0] 大量のテキストデータをオンラインで分析するために、機械学習と自然言語処理アルゴリズムがデプロイされている。
本研究では,顧客レビューに特化して用いられる5つのトピックモデリング手法について検討・比較する。
以上の結果から,BERTopicはより意味のあるトピックを抽出し,良好な結果を得ることができた。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 08:18:04 GMT)
Encoding trade-offs and design toolkits in quantum algorithms for
discrete optimization: coloring, routing, scheduling, and other problems [0.0] 離散最適化問題(整数型最適化問題)を直感的に合成・解析する手法を提案する。
この方法は、符号化に依存しない離散量子中間表現(DQIR)を用いて表現される。
第二に、複数のランタイムエンコーディングを比較した数値的研究を行う。
第3に、我々は16レベルの量子変数までの低深度グラフ由来部分ミキサー(GDPM)を設計する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:25:03 GMT)
Demonstration of a quantum SWITCH in a Sagnac configuration [0.0] 量子SWITCHは、不定因果構造を持つ過程の例である。
本稿では,新しい相互および普遍的な$mathrmSU(2)$偏光ガジェットによって促進される共通パス幾何を利用して,本質的に安定な量子SWITCHを実証する。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:56:02 GMT)
Computing the Vapnik Chervonenkis Dimension for Non-Discrete Settings [0.0] 本稿では,概念クラスやドメインセットに制約を加えることなく,VC次元を近似的に計算する手法を開発した。
提案手法は,経験的リスク最小化(Empirical Risk Minimization,ERM)学習パラダイムが,概念クラスの破砕特性を特徴付ける新しいツールとして利用できることを示すものである。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:57:24 GMT)
Comment on Hess et al. Phys. Rev. Lett. {\bf 130}, 207001 (2023) [0.0] We show that the model introduced in Hess et al. Phys. Rev. bf 130, 207001 (2023) fails the topological gap protocol (TGP)。
さらに、このモデルを、TGPがどのようにベンチマークされたかというより広い文脈で論じる。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 00:31:59 GMT)
BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual
Questions [0.0] 視覚言語モデル(VLM)は、テキストで注入された画像を正確に解釈することはできない。
本稿では,Visual Assistantを用いたInstructBLIPの拡張版であるBLIVAを紹介する。
BLIVAは、テキストの有無に関わらず、現実世界の画像をデコードする重要な能力を示す。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:53:43 GMT)
Asymptotically Optimal prepare-measure Quantum Key Distribution Protocol [0.0] 約40年の間、実質的なQKDプロトコルが開発されたが、BB84プロトコルとその変種は依然として最も研究されているプロトコルである。
本稿では,QKDプロトコルを抽象化し,同一の状態でコーディングされるすべてのプロトコルで最適である2つの特別なケースについて検討する。
解析により、量子ビットによる最適なQBER境界符号化は、メモリC-NOT攻撃とメモリレスC-NOT攻撃の両方に対して約27.28$%であることが示された。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 14:03:05 GMT)
Analyzing Quantization in TVM [0.0] TVMは重量を定量化し、低ビット計算をサポートする。
8ビットの量子化は通常、全精度推論時間の約50%を達成することが期待されている。
本研究の目的は,TVMにおける8ビット量子化の互換性と最適化の機会を評価することにある。
論文参考訳(メタデータ) (Sat, 19 Aug 2023 07:39:46 GMT)