How to Handle Sketch-Abstraction in Sketch-Based Image Retrieval? [127.7] スケッチの抽象化を様々なレベルで処理できるスケッチベース画像フレームワークを提案する。
粒度レベルの抽象理解のために、検索モデルはすべての抽象レベルを等しく扱ってはならないと規定する。
私たちのAcc.@qの損失は、評価がいかに厳格であるかという点で、スケッチが焦点を絞りたり壊したりできます。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:08:29 GMT)
Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.5] そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:30:31 GMT)
Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.4] 我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:35:38 GMT)
Adaptive Federated Learning Over the Air [108.6] オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:10:37 GMT)
Data-Independent Operator: A Training-Free Artifact Representation
Extractor for Generalizable Deepfake Detection [106.0] 本研究では,より一般的な人工物表現を捉えるのに,小型かつトレーニング不要なフィルタが十分であることを示す。
トレーニングソースとテストソースの両方に不偏があるため、未確認ソースに対して魅力的な改善を実現するために、Data-Independent Operator (DIO)と定義する。
我々の検出器は13.3%の大幅な改善を実現し、新しい最先端の性能を確立した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:22:28 GMT)
PhAST: Physics-Aware, Scalable, and Task-specific GNNs for Accelerated
Catalyst Design [103.0] 触媒材料は産業プロセスに関わる電気化学反応において重要な役割を担っている。
機械学習は、大量のデータから材料特性を効率的にモデル化する可能性を秘めている。
本稿では,ほとんどのアーキテクチャに適用可能なタスク固有のイノベーションを提案し,計算効率と精度の両立を図っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:50:55 GMT)
Stealing Part of a Production Language Model [101.6] 生産言語モデルから正確な非自明な情報を抽出する最初のモデルステーリング攻撃を導入する。
20ドル以下で、我々の攻撃はOpenAIのAdaおよびBabage言語モデル全体のプロジェクションマトリックスを抽出する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:46:12 GMT)
Comparison of No-Reference Image Quality Models via MAP Estimation in
Diffusion Latents [99.2] NR-IQAモデルは、画像強調のための最大後部推定(MAP)フレームワークにプラグイン可能であることを示す。
異なるNR-IQAモデルは異なる拡張イメージを誘導し、最終的には精神物理学的なテストを受ける。
これにより, NR-IQAモデルの比較を行う新たな計算手法が提案される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:35:41 GMT)
Parameter Efficient Multi-task Model Fusion with Partial Linearization [97.2] パラメータ効率のよい微調整技術において,マルチタスク融合を改善する新しい手法を提案する。
提案手法は, アダプタモジュールのみを部分的に線形化し, 線形化アダプタにタスク演算を適用する。
我々の部分線形化手法は、複数のタスクをより効果的に1つのモデルに融合させることを可能にしている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:07:08 GMT)
Learning with Noisy Foundation Models [95.5] 本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:22:41 GMT)
FocusCLIP: Multimodal Subject-Level Guidance for Zero-Shot Transfer in
Human-Centric Tasks [94.5] FocusCLIPは、人中心タスクにおけるゼロショット転送を改善するために、主題レベルのガイダンスをCLIPフレームワークに統合する。
人間中心のタスクでは、FocusCLIPはMPII Human Poseデータセットの画像でトレーニングされる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:56:37 GMT)
Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.2] 本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:59:28 GMT)
Safe and Robust Watermark Injection with a Single OoD Image [90.7] 高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。
安全で堅牢なバックドア型透かし注入法を提案する。
我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:33:12 GMT)
Improving and generalizing flow-based generative models with minibatch
optimal transport [90.0] 連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:27:48 GMT)
Simulation-free Schr\"odinger bridges via score and flow matching [89.4] シミュレーションフリースコアとフローマッチング([SF]$2$M)を提案する。
本手法は,拡散モデルのトレーニングに使用するスコアマッチング損失と,連続流のトレーニングに使用されるフローマッチング損失の両方を一般化する。
特に、[SF]$2$Mは、高次元の細胞動態を正確にモデル化し、既知の遺伝子制御ネットワークをシミュレートする最初の方法である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:42:58 GMT)
Eliminating Warping Shakes for Unsupervised Online Video Stitching [86.8] 我々は、ビデオ縫合まで画像縫合を延ばす際に、ワープシェイクと呼ばれる新しい問題にビデオ縫合を向けた。
統合された教師なし学習フレームワークにおいて,ビデオステッチとビデオ安定化を同時に実現するためのStabStitchを提案する。
既存の縫合法と比較して、StabStitchは縫合性能と安定化性能に加えて、シーンの堅牢性と推論速度に大きな優位性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:05:31 GMT)
Query-guided Prototype Evolution Network for Few-Shot Segmentation [85.8] 本稿では,前景と背景のプロトタイプの生成プロセスにクエリ機能を統合する新しい手法を提案する。
PASCAL-$5i$とミラーリング-$20i$データセットの実験結果は、QPENetが達成した実質的な拡張を示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:50:40 GMT)
Large Language Models as Tool Makers [85.0] 我々はLLM A s Tool Makers (LATM) と呼ばれるクローズドループフレームワークを導入する。
ツール作成: 1 つのツール作成: LLM がタスクセットのためのツールを作成するツールメーカとして機能する 2 つのツール使用: 別の LLM がツールユーザとして機能し、ツールメーカが問題解決のために構築したツールを適用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:15:09 GMT)
InfiAgent-DABench: Evaluating Agents on Data Analysis Tasks [84.8] 本稿では,データ解析タスクにおけるLSMに基づくエージェントの評価に特化して設計された最初のベンチマークであるInfiAgent-DABenchを紹介する。
このベンチマークには52のCSVファイルから得られた257のデータ分析質問からなるデータセットであるDAEvalが含まれている。
エージェントフレームワーク上に構築し,DABench 上で GPT-3.5 を3.9% 上回る特殊エージェント DAAgent を開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:57:59 GMT)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale
SAR Object Detection [83.2] 我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:20:40 GMT)
A Comparative Study of Perceptual Quality Metrics for Audio-driven
Talking Head Videos [81.5] 4つの生成手法から生成した音声ヘッドビデオを収集する。
視覚的品質、口唇音の同期、頭部運動の自然性に関する制御された心理物理実験を行った。
実験では,モデル予測と人間のアノテーションの整合性を検証し,広く使用されている指標よりも人的意見に整合した指標を同定した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:13:38 GMT)
DoLa: Decoding by Contrasting Layers Improves Factuality in Large
Language Models [79.0] 大型言語モデル(LLM)は幻覚を起こす傾向があり、事前訓練中に見られる事実から逸脱した内容を生成する。
事前学習したLLMによる幻覚を低減するための簡単な復号法を提案する。
コントラスティング・レイヤ(DoLa)アプローチによるこのデコーディングは,事実知識をよりよく提示し,誤った事実の生成を減らすことができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:01:09 GMT)
Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.7] 細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:44:49 GMT)
Efficient Diffusion Training via Min-SNR Weighting Strategy [78.6] 拡散学習をマルチタスク学習問題として扱い,Min-SNR-$gamma$と呼ばれるシンプルなアプローチを導入する。
本結果は,従来の重み付け手法よりも3.4$times$高速で収束速度が大幅に向上したことを示す。
さらに効果的で、ImageNetの256times256$ベンチマークで2.06の新たなFIDスコアを達成した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:01:34 GMT)
FSViewFusion: Few-Shots View Generation of Novel Objects [75.8] 本研究では,3次元前処理を伴わないビュー合成のための事前訓練された安定拡散モデルを提案する。
具体的には,Dreamboothという画像モデルを用いたパーソナライズされたテキストに基づく手法を提案する。
ビューの概念は、ビューが学習された元のオブジェクトの識別に関係なく、アンタングル化され、新しいオブジェクトに転送可能であることを確認します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:59:30 GMT)
Real-Time Simulated Avatar from Head-Mounted Sensors [75.0] 我々はAR/VRヘッドセットから得られた情報(ヘッドセットポーズとカメラ)からシミュレーションアバターを制御するSimXRを提案する。
カメラでヘッドセットのポーズを合成するために、人型ロボットを制御してヘッドセットの動きをトラッキングし、入力画像を分析して身体の動きを決定する。
体の一部が見えると、手足の動きは画像によって案内され、見えない場合は物理法則が制御器を誘導して可塑性運動を発生させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:15:51 GMT)
SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with
Auto-Generated Data [73.2] SELMAは、自動生成されたマルチスキル画像テキストデータセット上での微調整モデルにより、T2Iモデルの忠実度を向上させる。
SELMAは、複数のベンチマーク上での最先端T2I拡散モデルのセマンティックアライメントとテキスト忠実性を大幅に改善することを示す。
また、SELMAを介して自動コンパイルされた画像テキストペアによる微調整は、地上の真理データによる微調整に匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:35:33 GMT)
Ant Colony Sampling with GFlowNets for Combinatorial Optimization [73.0] Generative Flow Ant Colony Sampler (GFACS) はニューラル誘導型メタヒューリスティックアルゴリズムである。
GFACSは生成フローネットワーク(GFlowNets)とアリコロニー最適化(ACO)手法を統合している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:26:06 GMT)
Strength Lies in Differences! Towards Effective Non-collaborative
Dialogues via Tailored Strategy Planning [72.6] 我々は,多様なユーザを対象とした適切な戦略計画に携わる非協力的対話エージェントについて検討する。
これは、ユーザ固有の特徴を戦略的計画に統合できないことと、多様なユーザに一般化可能な戦略的プランナーを作成できないことによる、既存の対話エージェントの課題を提起する。
本稿では、ユーザ対応戦略計画モジュールと人口ベーストレーニングパラダイムを取り入れた、戦略計画の調整能力を高めるため、TRIPを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:38:16 GMT)
FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization [72.4] 周波数空間における過度再構成問題に対処するために, 進行周波数正規化手法を開発した。
FreGSは優れた斬新なビュー合成を実現し、最先端の技術を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:00:27 GMT)
Quantifying the Sensitivity of Inverse Reinforcement Learning to
Misspecification [72.1] 逆強化学習は、エージェントの行動からエージェントの好みを推測することを目的としている。
これを行うには、$pi$が$R$とどのように関係しているかの振る舞いモデルが必要です。
我々は、IRL問題が行動モデルの不特定性にどれほど敏感であるかを分析する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:09:39 GMT)
Memory-based Adapters for Online 3D Scene Perception [71.7] 従来の3Dシーン認識手法はオフラインである。
本稿では,3次元シーン認識モデルのバックボーンのためのアダプタベースのプラグアンドプレイモジュールを提案する。
私たちのアダプタは、さまざまなタスクのメインストリームのオフラインアーキテクチャに簡単に挿入でき、オンラインタスクのパフォーマンスを大幅に向上できます。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:57:41 GMT)
Can LLMs Separate Instructions From Data? And What Do We Even Mean By
That? [70.9] 命令調整型大規模言語モデル(LLM)はブレークスルーを達成し、多くの実用的なアプリケーションに数え切れないほど新しい可能性を秘めている。
LLMには、命令とデータの分離など、コンピュータ科学の他の領域で確立されている基本的な安全機能がない。
本稿では,命令データ分離の現象を定量化するための公式測度と,その経験的変量を導入する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:48:56 GMT)
Fast Text-to-3D-Aware Face Generation and Manipulation via Direct
Cross-modal Mapping and Geometric Regularization [70.6] テキストから3D対応顔(T3D Face)の生成と操作は、機械学習における新たなホットスポットである。
E3$-FaceNetと呼ばれる高速かつ高精度なT3D顔生成と操作のためのエンド・ツー・エンド・エンド・エフェクト・ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:17:55 GMT)
A Knowledge-Injected Curriculum Pretraining Framework for Question Answering [70.1] 本稿では,知識に基づく質問応答タスクの総合的なKG学習と活用を実現するための一般知識注入型カリキュラム事前学習フレームワーク(KICP)を提案する。
KIモジュールはまずKG中心の事前学習コーパスを生成してLMに知識を注入し、プロセスを3つの重要なステップに一般化する。
KAモジュールは、アダプタを備えたLMで生成されたコーパスから知識を学習し、元の自然言語理解能力を維持できる。
CRモジュールは人間の推論パターンに従って3つのコーパスを構築する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:42:03 GMT)
NeuPAN: Direct Point Robot Navigation with End-to-End Model-based
Learning [69.5] 本稿では,リアルタイム,高精度,ロボットに依存しない,環境に適応しないロボットナビゲーションソリューションであるNeuPANについて述べる。
NeuPANは密結合の知覚移動フレームワークを活用し、既存のアプローチと比較して2つの重要なイノベーションを持っている。
我々は,車載ロボット,車輪脚ロボット,乗用車において,実環境と実環境の両方でNeuPANを評価した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:44:38 GMT)
UniPT: Universal Parallel Tuning for Transfer Learning with Efficient
Parameter and Memory [69.3] PETLは、トレーニング済みモデルを下流ドメインに適応するための効果的な戦略である。
最近のPETLは、より価値の高いメモリ効率特性に焦点を当てている。
メモリ効率の良い新しいPETL戦略Universal Parallel Tuning (UniPT)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:28:41 GMT)
Language Generation from Brain Recordings [69.0] 本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:05:21 GMT)
MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.7] 本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:36:22 GMT)
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference
Acceleration for Large Vision-Language Models [68.7] 視覚的トークンに対する注意計算は,LVLMの深い層において極めて非効率であることがわかった。
本稿では,計算効率の最適化を目的とした多用途プラグアンドプレイ方式であるFastVを紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:35:32 GMT)
Finer: Investigating and Enhancing Fine-Grained Visual Concept
Recognition in Large Vision Language Models [68.5] 詳細な分析では、命令調整されたLVLMはモダリティギャップを示し、同じ概念に対応するテキスト入力と視覚入力の相違を示す。
我々は,LVLMの細粒度視覚理解能力を評価するために,複数の属性中心評価ベンチマークであるFinerを提案し,説明可能性を大幅に改善した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:49:40 GMT)
An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.9] 我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:17:42 GMT)
Alleviating Hallucinations of Large Language Models through Induced
Hallucinations [67.4] 大規模言語モデル(LLM)は、不正確な情報や製造された情報を含む応答を生成するために観察されている。
幻覚を緩和するための単純なtextitInduce-then-Contrast Decoding (ICD) 戦略を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:50:05 GMT)
Put Myself in Your Shoes: Lifting the Egocentric Perspective from
Exocentric Videos [66.5] Exocentric-to-egocentric cross-view translationは、第三者(exocentric)の観点からアクターをキャプチャするビデオ録画に基づいて、アクターの1人(egocentric)ビューを生成することを目的としている。
そこで我々は,Exo2Egoという,翻訳過程を高次構造変換と画素レベルの幻覚の2段階に分解する生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:00:00 GMT)
A Deep Instance Generative Framework for MILP Solvers Under Limited Data
Availability [66.4] 我々は、MILPインスタンスのための最初の深層生成フレームワークであるG2MILPを提案する。
G2MILPはMILPインスタンスを二部グラフとして表現し、マスク付き変分オートエンコーダを元のグラフの一部を反復的に破損させ、置き換えて新しいグラフを生成する。
生成されたMILPインスタンスの品質を評価するためのベンチマークスイートを設計する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:51:14 GMT)
One-Dimensional Adapter to Rule Them All: Concepts, Diffusion Models and
Erasing Applications [65.7] 既存の学界における概念消去手法はすべて、完全なパラメータや仕様ベースの微調整に基づいている。
それまでのモデル固有の消去は、概念の柔軟な組み合わせと、他のモデルへのトレーニング不要な移行を妨げる。
我々は,一次元アダプタをベースとした消去フレームワークを構築し,多くのDMから複数の概念を一度に消去する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:13:54 GMT)
DEADiff: An Efficient Stylization Diffusion Model with Disentangled
Representations [64.4] 現在のエンコーダベースのアプローチは、スタイルの転送中にテキスト・ツー・イメージモデルのテキスト制御性を著しく損なう。
この問題に対処するために、以下の2つの戦略を用いてtextitDEADiffを導入します。
そこで,DADiff はテキスト・ツー・イメージ・モデルに固有のテキスト制御性と,参照画像とスタイルの類似性との間に最適な視覚的スタイリング結果と最適なバランスを得られることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:35:23 GMT)
LLM Inference Unveiled: Survey and Roofline Model Insights [64.3] 大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:46:49 GMT)
Acquiring Diverse Skills using Curriculum Reinforcement Learning with
Mixture of Experts [63.6] 強化学習(Reinforcement Learning, RL)は, 優れた政策獲得のための強力なアプローチである。
多様なスキルを学習するためのRL手法としてtextbfDiverse textbfSkill textbfLearning (Di-SkilL) を提案する。
本稿では,Di-SkilLが多種多様なパフォーマンススキルを学習できるロボットシミュレーションタスクについて述べる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:49:18 GMT)
A Zero Trust Framework for Realization and Defense Against Generative AI
Attacks in Power Grid [62.9] 本稿では電力グリッドサプライチェーン(PGSC)のための新しいゼロ信頼フレームワークを提案する。
潜在的なGenAIによる攻撃ベクターの早期発見、テールリスクに基づく安定性の評価、そしてそのような脅威の緩和を容易にする。
実験の結果,ゼロ信頼フレームワークは攻撃ベクトル生成に95.7%の精度,95%安定PGSCに9.61%のリスク尺度,GenAIによる攻撃に対する防御に99%の信頼性が得られた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:47:21 GMT)
BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.9] BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:59:31 GMT)
Xiezhi: An Ever-Updating Benchmark for Holistic Domain Knowledge
Evaluation [61.6] 我々は、総合的なドメイン知識を評価するために設計された最も包括的な評価スイートであるXiezhiを紹介する。
Xiezhiは、13の被験者から249,587の質問、Xiezhi- SpecialtyとXiezhi-Interdisciplineを伴い、15kの質問を含む516の多様な分野にわたる複数の選択の質問で構成されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:49:04 GMT)
OMH: Structured Sparsity via Optimally Matched Hierarchy for
Unsupervised Semantic Segmentation [59.2] Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。
上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。
我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:46:41 GMT)
Boosting Image Restoration via Priors from Pre-trained Models [58.8] 我々は、OSFによるターゲット復元ネットワークの復元結果を改善するために、Pre-Train-Guided Refinement Module (PTG-RM)と呼ばれる軽量モジュールを学習する。
PTG-RMは、低照度強化、デラリニング、デブロアリング、デノナイジングなど、様々なタスクにおける様々なモデルの復元性能を効果的に向上させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:11:57 GMT)
COCA: Classifier-Oriented Calibration via Textual Prototype for
Source-Free Universal Domain Adaptation [58.5] ユニバーサルドメイン適応(UniDA)は、データソース間のドメインとカテゴリのシフトに対処することを目的としている。
SF-UniDAメソッドは、ターゲットドメインへの適応を実行する際に、ソースサンプルに直接アクセスする必要がなくなる。
既存のSF-UniDAメソッドは、ソースモデルをトレーニングするために大量のラベル付きソースサンプルを必要とする。
本稿では,この問題に対処するための新しいCOCA法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:45:29 GMT)
Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.7] 分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:21:11 GMT)
Bayesian Diffusion Models for 3D Shape Reconstruction [57.4] 本稿では,トップダウン(優先)情報をボトムアップ(データ駆動)手順と密結合することにより,効果的なベイズ推定を行う予測アルゴリズムを提案する。
3次元形状復元作業におけるBDMの有効性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:55:53 GMT)
InfiCoder-Eval: Systematically Evaluating the Question-Answering Capabilities of Code Large Language Models [56.7] InfiCoder-Evalは、コードのQAベンチマークである。
慎重に選択された234の高品質なStack Overflow質問で構成されており、15のプログラミング言語にまたがっている。
InfiCoder-Eval 上で 80 以上のコード LLM に対して,系統的な評価を行い,一連の知見を得た。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:06:30 GMT)
Academically intelligent LLMs are not necessarily socially intelligent [56.5] 大規模言語モデル(LLM)の学術的インテリジェンス(英語版)は近年顕著な進歩を遂げているが、その社会的インテリジェンスのパフォーマンスは未だ不明である。
人間の社会知能フレームワークの確立に触発されて,現実の社会的シナリオに基づいた標準化された社会知能テストを開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:35:53 GMT)
Doubly Robust Proximal Causal Learning for Continuous Treatments [56.1] 本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。
オラクル形式は影響関数の一貫した近似であることを示す。
次に、平均二乗誤差の観点から総合収束解析を行う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:09:55 GMT)
Towards the Uncharted: Density-Descending Feature Perturbation for
Semi-supervised Semantic Segmentation [55.4] 本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:59:05 GMT)
STARC: A General Framework For Quantifying Differences Between Reward
Functions [55.3] 我々は、STARCメトリックと呼ばれるすべての報酬関数の空間上の擬計量のクラスを提供する。
以上の結果から,STARCは最悪の後悔に対して上界と下界の両方を誘導することがわかった。
また、以前の研究によって提案された報酬指標に関するいくつかの問題も特定します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:29:17 GMT)
Adiabatic versus instantaneous transitions from a harmonic oscillator to
an inverted oscillator [55.2] 平均エネルギーとその分散に関する明確な解析式を得た。
エネルギーの振舞いは、2つのケースで大きく異なることが判明した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:03:19 GMT)
What Makes Quantization for Large Language Models Hard? An Empirical
Study from the Lens of Perturbation [55.2] 量子化は、大規模言語モデル(LLM)のメモリと計算効率を改善する技術である。
本稿では,LLMの重みと活性化に付加される摂動として,量子化の新しい視点を提案する。
各種人工摂動実験を行い,LLMの性能への影響について検討する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:42:51 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via
Foundation Models [53.5] 我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する、新しいトレーニングフリーパラダイムであるPointSegを提案する。
PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。
このアプローチは,ScanNet,ScanNet++,KITTI-360データセット上の13.4$%,11.3$%,12$%のmAPで最先端のスペシャリストモデルを大幅に上回る。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:28:20 GMT)
A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.4] 交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:42:29 GMT)
LLMGA: Multimodal Large Language Model based Generation Assistant [53.2] 画像生成と編集を支援するマルチモーダル大規模言語モデルベース生成アシスタント(LLMGA)を提案する。
我々はMLLMを訓練し、画像生成と編集の特性を把握し、詳細なプロンプトを生成する。
広範な結果から、LLMGAは将来的な生成と編集機能を備えており、より柔軟で拡張性の高いアプリケーションを可能にすることが示されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:48:19 GMT)
On the Generalization Ability of Unsupervised Pretraining [53.1] 教師なし学習の最近の進歩は、教師なし事前学習、および微調整がモデル一般化を改善することを示している。
本稿では、教師なし事前学習中に得られた知識の伝達可能性に影響を及ぼす重要な要因をその後の微調整フェーズに照らす新しい理論的枠組みを提案する。
この結果は教師なし事前学習と微調整のパラダイムの理解を深め、より効果的な事前学習アルゴリズムの設計に光を当てることができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:23:42 GMT)
Monitoring AI-Modified Content at Scale: A Case Study on the Impact of
ChatGPT on AI Conference Peer Reviews [52.6] 本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:51:39 GMT)
FaceChain-SuDe: Building Derived Class to Inherit Category Attributes
for One-shot Subject-Driven Generation [52.5] 本稿では,プラグイン・アンド・プレイ方式,主観的正規化(SuDe)を提案する。
被写体が生成した画像が意味論的に被写体カテゴリーに属することを制約することにより、ベースから派生したクラスモデリングを構築する。
実験の結果,SuDeは主観的忠実さを維持しつつ,想像上の属性関連世代を可能にすることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:43:40 GMT)
TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models [52.5] 拡散モデルは非常に時間ステップ$t$に大きく依存し、良好なマルチラウンドデノジングを実現している。
本稿では,時間情報ブロック上に構築した時間的特徴保守量子化(TFMQ)フレームワークを提案する。
先駆的なブロック設計により、時間情報認識再構成(TIAR)と有限集合キャリブレーション(FSC)を考案し、完全な時間的特徴を整列させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:40:40 GMT)
Ensemble Quadratic Assignment Network for Graph Matching [52.2] グラフマッチングはコンピュータビジョンやパターン認識において一般的に用いられる技法である。
最近のデータ駆動型アプローチは、グラフマッチングの精度を著しく改善した。
データ駆動手法と従来の手法の利点を組み合わせたグラフニューラルネットワーク(GNN)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:34:05 GMT)
Garment Recovery with Shape and Deformation Priors [51.4] 本研究では,実際の画像からリアルな衣料品の形状や変形に関わらず,リアルな衣料品のモデルを提供する手法を提案する。
提案手法は, 形状を正確に復元するだけでなく, アニメーションやシミュレーションなどの下流アプリケーションで直接使用可能なモデルも生成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:27:35 GMT)
Scalable Online Exploration via Coverability [51.3] 探索は、特に関数近似を必要とする高次元領域において、強化学習において大きな課題である。
従来の探索手法を一般化し,3つの基本デシラタをサポートする新しい目的である$L_Coverageを導入する。
$L_Coverageは、カバー可能性の低いMDPにおけるオンライン(リワードフリーまたは報酬駆動)強化学習のための、最初の計算効率のよいモデルベースおよびモデルフリーのアルゴリズムを可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:14:06 GMT)
Editable Scene Simulation for Autonomous Driving via Collaborative
LLM-Agents [51.2] ChatSimは、編集可能な3Dドライビングシーンシミュレーションを、外部デジタル資産を持つ自然言語コマンドで実現した最初のシステムである。
ChatSimは、フォトリアリスティックな結果を生成するために、新しいマルチカメラニューラルフィールド法を採用している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:45:48 GMT)
On the Global Convergence of Policy Gradient in Average Reward Markov
Decision Processes [50.7] 我々は、平均報酬マルコフ決定過程(MDP)の文脈における政策勾配の最初の有限時間大域収束解析を示す。
我々の分析によると、ポリシー勾配は、$Oleft(frac1Tright)$のサブリニアレートで最適ポリシーに収束し、$Oleft(log(T)right)$ regretに変換され、$T$は反復数を表す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:25:03 GMT)
Confidence-Aware RGB-D Face Recognition via Virtual Depth Synthesis [50.7] 2D顔認証は、照明、閉塞、ポーズの変化により、制約のない環境において課題に遭遇する。
近年の研究では、深度情報を組み込んだRGB-D顔認証に焦点が当てられている。
本研究では,まず,深度モデル事前学習のための3次元Morphable Modelsによって生成された多様な深度データセットを構築する。
そこで本研究では,手軽に利用できるRGBと深度モデルを利用したドメイン非依存の事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:12:24 GMT)
$\mathbf{(N,K)}$-Puzzle: A Cost-Efficient Testbed for Benchmarking
Reinforcement Learning Algorithms in Generative Language Model [50.6] 我々は24-Puzzleの一般化版を提示する:$(N,K)$-Puzzle。
我々は、アイデンティティポリシー最適化(IPO)やダイレクトポリシー最適化(DPO)といった新しいアプローチとともに、PPO(Proximal Policy Optimization)のような確立されたRLアルゴリズムの有効性を評価する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:24:14 GMT)
Uncertainty in Graph Neural Networks: A Survey [50.6] グラフニューラルネットワーク(GNN)は、様々な現実世界のアプリケーションで広く使われている。
しかし、多様な情報源から生じるGNNの予測的不確実性は、不安定で誤った予測につながる可能性がある。
本調査は,不確実性の観点からGNNの概要を概観することを目的としている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:54:52 GMT)
Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.6] 本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:09:50 GMT)
Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.6] 直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:48:56 GMT)
Unmasked Teacher: Towards Training-Efficient Video Foundation Models [50.2] ビデオファウンデーションモデル(VFM)は、高い計算コストとデータ不足のため、限られた探索を受けている。
本稿では,既存の手法の利点を生かした時間感応型VFMの訓練効率向上手法を提案する。
我々のモデルは、シーン関連、時間関連、複雑なビデオ言語理解を含む様々なタスクを処理できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:21:50 GMT)
Active Generation for Image Classification [50.2] 本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:45:31 GMT)
Aligners: Decoupling LLMs and Alignment [49.8] 大きな言語モデル(LLM)は、ほとんどのアプリケーションで安全性と実用性を確保するために、人間の期待に沿う必要がある。
そこで本稿では,LLM とアライメントを,任意の基準をアライメントするためのアライメントモデルのトレーニングによって分離することを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:04:42 GMT)
Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning [49.3] シミュレーションデータに基づいてトレーニングされたDeep Neural Networks(DNN)、Product(TP)ベースのエラー修正コード(ECC)、安全マージンを1つのコヒーレントパイプラインに組み合わせたモジュラーで総合的なアプローチを示す。
我々の研究は, 最大で x3200 の速度向上, 40%の精度向上により, 現在の指導的ソリューションの改善を実現し, 高雑音下では1ベースあたり1.6ビットのコードレートを提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:11:50 GMT)
Action Reimagined: Text-to-Pose Video Editing for Dynamic Human Actions [49.1] ReimaginedActはビデオ理解、推論、編集モジュールを含む。
提案手法は, 直接指示文のプロンプトだけでなく, 行動変化を予測するための質問も受けられる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:46:46 GMT)
The Power of Noise: Toward a Unified Multi-modal Knowledge Graph
Representation Framework [49.0] マルチモーダルな知識グラフ(MMKG)表現学習フレームワークは,構造化された知識を大規模に多モーダルな言語モデル(LLM)に統合するために重要である。
モードレベルのノイズマスキングを備えたトランスフォーマーアーキテクチャを用いた新しいSNAG手法を提案する。
提案手法は,その堅牢性と汎用性を実証し,合計10データセットにわたるSOTA性能を実現する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:48:43 GMT)
MedKP: Medical Dialogue with Knowledge Enhancement and Clinical Pathway
Encoding [48.3] 本稿では,知識向上と臨床パスウェイ符号化フレームワークを用いた医療対話について紹介する。
このフレームワークは、医療知識グラフを介して外部知識増強モジュールと、医療機関および医師の行動を介して、内部臨床経路をコードする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:57:45 GMT)
Learning the Unlearned: Mitigating Feature Suppression in Contrastive
Learning [48.0] 自己監督型コントラスト学習は、ラベルのないデータから高品質な表現を導き出すのに有効であることが証明されている。
単目的学習とマルチモーダル学習の両方を妨げる大きな課題は、特徴抑制である。
本稿では,新しいモデルに依存しないマルチステージコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:46:22 GMT)
ShapeMatcher: Self-Supervised Joint Shape Canonicalization,
Segmentation, Retrieval and Deformation [47.9] 本稿では,関節形状の正準化,分節化,検索,変形を行うための自己教師型学習フレームワークであるShapeMatcherを提案する。
ShapeMakerの重要な洞察は、標準化、セグメンテーション、検索、変形という4つの高関連プロセスの同時トレーニングである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:06:29 GMT)
BEV2PR: BEV-Enhanced Visual Place Recognition with Structural Cues [47.6] 本稿では,鳥眼ビュー(BEV)における構造的手がかりを1台のカメラから活用して,画像に基づく視覚的位置認識(VPR)フレームワークを提案する。
我々のBEV2PRフレームワークは、いくつかの人気のあるカメラベースのVPRアグリゲーションモジュールに対して、一貫したパフォーマンス改善を可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:46:43 GMT)
Grid Monitoring and Protection with Continuous Point-on-Wave
Measurements and Generative AI [47.2] 本稿では,汎用人工知能(AI)と機械学習の最近の進歩を活用する次世代グリッド監視制御システムについて述べる。
AIを用いたデータ圧縮と故障検出による連続点波計測(CPOW)のストリーミングに基づくモニタリングと制御のフレームワークについて論じる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:28:46 GMT)
Evolving Knowledge Distillation with Large Language Models and Active
Learning [46.9] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる顕著な機能を示している。
従来の研究は、注釈付きデータを生成してLPMの知識をより小さなモデルに抽出しようと試みてきた。
EvoKD: Evolving Knowledge Distillationを提案する。これは、アクティブラーニングの概念を利用して、大規模言語モデルを用いたデータ生成のプロセスをインタラクティブに強化する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:55:24 GMT)
DNNShield: Embedding Identifiers for Deep Neural Network Ownership Verification [46.5] 本稿では、ディープニューラルネットワーク(DNN)の保護のための新しいアプローチであるDNNShieldを紹介する。
DNNShieldは、特別な保護レイヤを使用して、モデルアーキテクチャにユニークな識別子を埋め込む。
3つのデータセットと4つのモデルアーキテクチャにわたる広範囲な評価を通じて、DNNShieldの有効性と効率を検証した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:27:36 GMT)
VideoMamba: State Space Model for Efficient Video Understanding [46.2] VideoMambaは既存の3D畳み込みニューラルネットワークとビデオトランスフォーマーの限界を克服する。
線形複雑度演算子は、効率的な長期モデリングを可能にする。
VideoMambaはビデオ理解のための新しいベンチマークを設定している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:59:34 GMT)
Effective Large Language Model Adaptation for Improved Grounding and
Citation Generation [46.2] 本稿では,検索した文の応答を基底にして,引用を提供することにより,大規模言語モデル(LLM)の改善に焦点を当てる。
我々は、全体論的観点から基盤を改善する新しいフレームワーク AGREE を提案する。
我々のフレームワークは, LLMを調整し, その要求を自己評価し, 検索した文書に正確な引用を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:36:36 GMT)
The quantum Hall effect under the influence of gravity and inertia: A
unified approach [45.0] 整数と分数量子ホール効果の両方が、重力と慣性の組み合わせの影響の下でどのように振る舞うかを検討する。
ホール試料の電子に対する重力、回転、慣性の組合せ効果を記述するための一般ハミルトニアンが構築され、固有状態が得られる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:01:55 GMT)
Dimension matters: precision and incompatibility in multi-parameter
quantum estimation models [45.0] 量子推定問題における精度境界の決定におけるプローブ次元の役割について検討する。
また,Holevo-Cram'er-Rao境界とSLD(Symmetric Logarithmic Derivative)との差を特徴付けるいわゆる不整合性(AI)の性能についても批判的に検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:59:56 GMT)
NetInfoF Framework: Measuring and Exploiting Network Usable Information [44.8] 我々はNetInfoF_ProbeとNetInfoF_Actを含むNetInfoFを提案する。
慎重に設計された合成データセットにおいて、NetInfoFはNUIの基礎的真実を正しく識別し、全てのグラフシナリオに対して堅牢である唯一の方法である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:32:41 GMT)
ALaRM: Align Language Models via Hierarchical Rewards Modeling [44.8] ALaRMは、人間からのフィードバックから強化学習において、階層的な報酬をモデル化する最初のフレームワークである。
このフレームワークは、全体的な報酬とアスペクト固有の報酬を統合することで、現在のアライメントアプローチの限界に対処する。
我々は、長文質問応答および機械翻訳タスクの応用を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:28:40 GMT)
Theoretical Hardness and Tractability of POMDPs in RL with Partial
Online State Information [44.7] トラクタビリティを実現するのにどの程度のオンライン状態情報(OSI)が十分かを検討する。
部分 OSI のみであっても,POMDP の重要な抽出可能なサブクラスを同定する。
部分OSIを持つ2種類のPOMDPに対して新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:13:04 GMT)
Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.7] 我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。
本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:33:13 GMT)
Dual-path Frequency Discriminators for Few-shot Anomaly Detection [44.6] 工業生産にはFSAD(Few-shot Anomaly Detection)が不可欠である。
本稿では、これらの問題に対処するために、周波数観点からDual-Path Frequency Discriminatorsネットワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:40:09 GMT)
AS-FIBA: Adaptive Selective Frequency-Injection for Backdoor Attack on
Deep Face Restoration [44.0] ディープラーニングベースの顔復元モデルは、高度なバックドア攻撃のターゲットとなっている。
復元モデルに対する攻撃に適した,ユニークな劣化目標を提案する。
本稿では,適応選択周波数注入バックドアアタック(AS-FIBA)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:44:26 GMT)
Unbalancedness in Neural Monge Maps Improves Unpaired Domain Translation [43.7] 最適な輸送(OT)では、Mongeマップはソース分布を最もコスト効率のよい方法でターゲット分布に転送するマッピングとして知られている。
Mongeマップのための複数のニューラル推定器が開発され、多様なドメイン翻訳タスクに応用されている。
我々は,任意のMongeマップ推定器に不均衡を組み込む理論的基礎付け手法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:23:24 GMT)
Unraveling the Mystery of Scaling Laws: Part I [43.7] 法則のスケーリングは、モデルサイズ、データセットサイズ、トレーニングで使用される計算リソースなどの損失と変数の間のパワー-ルールの相関を示す。
OpenAIのオリジナルのスケーリング法論文は、正確なスケーリング法則を導出するのに必要な詳細を公表していない。
1M60Mのパラメータしか持たないモデルでトレーニングすることで、スケーリング法則式における全ての定数項をステップバイステップで推定する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:05:29 GMT)
Which LLM to Play? Convergence-Aware Online Model Selection with
Time-Increasing Bandits [43.7] 本稿では,モデルの性能向上を効果的に予測する帯域幅増加アルゴリズムTI-UCBを提案する。
本研究は,より効率的かつ経済的なモデル選択のために,増大する収束パターンを活用することの重要性を強調した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:52:46 GMT)
CodeApex: A Bilingual Programming Evaluation Benchmark for Large
Language Models [43.7] 我々は,LLMのプログラミング理解,コード生成,コード修正能力に着目したベンチマークデータセットであるCodeApexを提案する。
汎用モデルと特化モデルの両方を含む,広く使用されているLLMを12種類評価した。
GPT-4は最高のプログラミング能力を示し、それぞれ69%、54%、66%の精度を達成している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:07:28 GMT)
Comparison of Static Analysis Architecture Recovery Tools for
Microservice Applications [43.4] マイクロサービスアプリケーションのための静的解析アーキテクチャ回復ツールを,マルチボーカルな文献レビューを通じて同定する。
次に、共通データセット上でそれらを実行し、アーキテクチャ回復における測定された有効性を比較する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:26:51 GMT)
Efficient LoFTR: Semi-Dense Local Feature Matching with Sparse-Like
Speed [42.9] 従来は検出不要であったLoFTRは、大きな視点の変化とテクスチャ・ポーアのシナリオを扱う際、顕著な整合性を示した。
設計上の選択を再検討し、効率と精度の両面で複数の改善を導出する。
提案手法は,競争力のあるセミセンス・マーカと比較して高い精度を実現することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:42:14 GMT)
SiGNN: A Spike-induced Graph Neural Network for Dynamic Graph Representation Learning [42.7] 本研究では,動的グラフ上での時空間表現の強化を学習するための,スパイク誘発グラフニューラルネットワーク(SiGNN)という新しいフレームワークを提案する。
TA機構を利用して、SiGNNはSNNの時間的ダイナミクスを効果的に活用するだけでなく、スパイクのバイナリの性質によって課される表現的制約を積極的に回避する。
実世界の動的グラフデータセットに対する大規模な実験は、ノード分類タスクにおけるSiGNNの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:19:43 GMT)
Towards Robust Out-of-Distribution Generalization Bounds via Sharpness [41.7] モデルがドメインシフトにおけるデータ変化を許容する方法にシャープさが及ぼす影響について検討する。
強靭性を考慮したシャープネスに基づくOOD一般化を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:57:27 GMT)
OpenXAI: Towards a Transparent Evaluation of Model Explanations [41.4] 我々は,ポストホックな説明手法の評価とベンチマークを行う,包括的でオープンソースなフレームワークであるOpenXAIを紹介する。
柔軟性のある合成データジェネレータと多様な実世界のデータセットのコレクション、事前訓練されたモデル、最先端の機能属性メソッド、および(ii)忠実性、安定性(ロバスト性)、説明方法の公正性を評価するための11の定量的メトリクスのオープンソース実装。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:31:58 GMT)
A SysML Profile for the Standardized Description of Processes during
System Development [40.5] 形式化されたプロセス記述(FPD)のためのVDI/VDE 3682標準は、プロセスのシンプルで理解しやすい表現を提供する。
この貢献は、システムモデリング言語(SysML)へのVDI/VDE 3682の統合を促進するドメイン特化モデリング言語(D)の開発に焦点を当てている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:44:38 GMT)
Technical Debt Management: The Road Ahead for Successful Software
Delivery [40.5] 技術的負債(Technical Debt)は、多くの人がソフトウェアプロジェクトの'サイレントキラー'と見なしているが、間違いなくソフトウェアエンジニアの日常的な語彙の一部になっている。
本稿では,技術負債管理における産業と研究の両コミュニティにおける技術の現状について検討する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:48:35 GMT)
Thought Graph: Generating Thought Process for Biological Reasoning [40.2] 我々は、複雑な推論をサポートするための新しいフレームワークとして、Thought Graphを提示する。
我々は、生物学的プロセス間の意味的関係を明らかにするために、遺伝子セット分析を例に挙げる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:28:27 GMT)
Ada-Tracker: Soft Tissue Tracking via Inter-Frame and Adaptive-Template
Matching [40.2] 我々は光学的流れを利用して自然に画素単位の組織変形を捉え、追跡されたテンプレートを適応的に補正する。
Ada-Trackerはより優れた精度を実現し、以前の作業に対してより堅牢に機能する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:42:40 GMT)
Combating Data Imbalances in Federated Semi-supervised Learning with
Dual Regulators [40.1] フェデレートされた半教師付き学習(FSSL)は、少数のラベル付きデータからモデルをトレーニングするために現れる。
デュアルレギュレータであるFedDureを用いた新しいFSSLフレームワークを提案する。
FedDureは、さまざまな設定で既存のメソッドよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:48:08 GMT)
GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless
Generative Inference of LLM [39.8] キーバリュー(KV)キャッシングは,大規模言語モデル(LLM)推論における生成速度を高速化するデファクトとなっている。
既存の方法は、重要でないトークンをドロップしたり、全てのエントリを均一に定量化することに依存している。
本稿では,高速なKVキャッシュ圧縮フレームワークであるGEARを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:55:40 GMT)
Shape Non-rigid Kinematics (SNK): A Zero-Shot Method for Non-Rigid Shape
Matching via Unsupervised Functional Map Regularized Reconstruction [39.5] 非剛体形状マッチングの新しいゼロショット法であるShape Non-rigid Kinematics (SNK)を提案する。
SNKはエンコーダ・デコーダアーキテクチャを用いて再構成ベースの戦略を採用しており、ソース形状を変形させてターゲット形状と密に一致させる。
SNKは従来のベンチマークで競合する結果を示し、精度を損なうことなく形状マッチングプロセスを単純化する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:23:11 GMT)
InstructDET: Diversifying Referring Object Detection with Generalized
Instructions [39.4] 本稿では,ユーザ指示に基づいて対象オブジェクトをローカライズするオブジェクト検出(ROD)をデータ中心で参照する手法を提案する。
1つの画像に対して、各オブジェクトと複数のオブジェクトの異なる組み合わせを参照する素晴らしい命令を生成します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:32:31 GMT)
ACT-MNMT Auto-Constriction Turning for Multilingual Neural Machine
Translation [38.3] この課題はtextbfunderlineAuto-textbfunderlineConstriction textbfunderlineTurning mechanism for textbfunderlineMultilingual textbfunderlineNeural textbfunderlineMachine textbfunderlineTranslation (model)を導入している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:10:57 GMT)
Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for
Text-Guided QR Code Generation [38.3] デジタル時代には、QRコードは仮想空間と物理領域を繋ぐリンチピンとして機能する。
一般的な方法は、カスタマイズとスキャナビリティのバランスをとるという、本質的な課題に対処します。
本稿では,安定拡散モデルを利用した先駆的アプローチであるText2QRを紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:03:31 GMT)
Medical Image Synthesis via Fine-Grained Image-Text Alignment and
Anatomy-Pathology Prompting [38.1] データ不足とプライバシーの懸念により、公共利用のための高品質な医療画像の入手が制限される。
本稿では,微細な画像テキストアライメントと解剖学・病理学のプロンプトを活用する新しい医用画像合成モデルを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:56:17 GMT)
RecAI: Leveraging Large Language Models for Next-Generation Recommender
Systems [38.0] RecAIは、Large Language Models (LLMs)でレコメンデーションシステムを拡張するツールキットである
RecAIのソースコードはurlhttps://github.com/RecAIで入手できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:07:02 GMT)
IndicLLMSuite: A Blueprint for Creating Pre-training and Fine-Tuning
Datasets for Indian Languages [37.8] 本研究は、Indic LLMの開発に特化して設計された、拡張性のあるリソーススイートを紹介する。
このアプローチでは、高度にキュレートされた手作業による検証データ、検証されていないが価値のあるデータ、合成データを組み合わせています。
命令ファインチューニングでは、既存のIndicデータセットをアマルガメートし、英語データセットをインド語に翻訳・翻訳し、LLaMa2とMixtralモデルを利用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:46:56 GMT)
A Bayesian framework for measuring association and its application to
emotional dynamics in Web discourse [37.7] 本稿では,分類的確率変数の関連度を測定するためのベイズ的枠組みを提案する。
ポルトガル語で書かれた4,613のツイートにおいて,アノテータが特定した非排他感情にこの手法を適用した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:29:10 GMT)
BLO-SAM: Bi-level Optimization Based Overfitting-Preventing Finetuning
of SAM [37.1] BLO-SAMを導入し、二段階最適化(BLO)に基づいてSAM(Segment Anything Model)を微調整する。
BLO-SAMは、モデルの重みパラメータのトレーニングと、トレーニングデータセットの2つの別々のサブセットへの迅速な埋め込みによって、過適合のリスクを低減する。
その結果、BLO-SAMは様々な最先端画像セマンティックセグメンテーション法よりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:40:27 GMT)
True Knowledge Comes from Practice: Aligning LLMs with Embodied
Environments via Reinforcement Learning [37.1] 大規模言語モデル(LLM)は、環境とのLLMにおける知識のミスアライメントにより、単純な意思決定タスクの解決に失敗することが多い。
本稿では,LSMを意思決定エージェントとして展開する新しいフレームワークであるTWOSOMEを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:15:58 GMT)
Guiding Clinical Reasoning with Large Language Models via Knowledge
Seeds [37.1] 臨床推論(英: Clinical reasoning)とは、医師が患者の評価と管理に用いている認知過程のことである。
本研究では,医学的知識によるLCMの強化を目的とした新しい枠組みであるICP(In-Context Padding)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:53:20 GMT)
Me LLaMA: Foundation Large Language Models for Medical Applications [36.8] 本研究は,基礎モデルであるMe LLaMA 13/70Bとチャット強化バージョンであるMe LLaMA 13/70B-chatを含む医療用LLMファミリーであるMe LLaMAを紹介する。
トレーニングと評価のためのドメイン固有のデータスイートには、129Bトークンを備えた大規模で連続的な事前トレーニングデータセットが含まれています。
Me LLaMAモデルは、ゼロショット、少数ショット、教師あり学習能力において、既存のオープンソース医療用LLMよりも全体的なパフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:04:59 GMT)
Exploring Cluster Analysis in Nelore Cattle Visual Score Attribution [36.4] 本稿では,ヒトのネロア牛用スコアと,画像や他の機器から得られるさまざまな測定値との相関分析結果について述べる。
また、k-meansアルゴリズムを用いて、家畜の体重や視力とほぼ相関する測定値を用いて、牛の群れをクラスタリングする新しい方法を生成する研究も発表した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:07:05 GMT)
SemPLeS: Semantic Prompt Learning for Weakly-Supervised Semantic
Segmentation [36.4] Weakly-Supervised Semantic (WSSS) は、画像レベルの監督のみで画像データを用いてセグメンテーションモデルを訓練することを目的としている。
本稿では,CLIP潜伏空間を効果的に促進するためのWSSS(Semantic Prompt Learning for WSSS)フレームワークを提案する。
SemPLeSはオブジェクト領域と関連するクラスラベル間のセマンティックアライメントを改善することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:01:50 GMT)
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning [35.5] 我々は,最初のマルチモーダル・エンターメント・ツリー・ジェネレータであるTV-TREESを提案する。
TV-TREESは、解釈可能な共同モダリティ推論を促進するビデオ理解のアプローチとして機能する。
そこで我々は,このような手法の推論品質を評価するために,マルチモーダル・エンテーメント・ツリー生成の課題を導入する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:31:58 GMT)
Universality of Linear Recurrences Followed by Non-linear Projections:
Finite-Width Guarantees and Benefits of Complex Eigenvalues [35.2] 線形複素数値RNNと線形対角線再帰を組み合わせれば、逐次列列マップの任意の精度で近似できることを示す。
我々は、単位ディスクの近くに複雑な固有値(すなわち、SSMにおいて最も成功した戦略)を採用することが、情報を保存する上で、RNNに大いに役立つことを証明した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:30:54 GMT)
Neuron Activation Coverage: Rethinking Out-of-distribution Detection and
Generalization [34.9] InDデータに基づくニューロン行動の簡易な測定法として,テクスチトニューロンアクティベーションカバレッジ(NAC)を導入する。
InDとOODの入力はニューロンの挙動に基づいて大きく分離することができ、OOD検出問題を著しく緩和できることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:56:58 GMT)
AuG-KD: Anchor-Based Mixup Generation for Out-of-Domain Knowledge
Distillation [34.9] データフリー知識蒸留法(DFKD)が直接解法として登場した。
しかし、DFKDから派生したモデルを現実のアプリケーションに適用するだけで、性能が著しく低下する。
本研究では,教師の適切な知識を選択的に伝達する簡易かつ効果的なAuG-KDを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:34:14 GMT)
See Through Their Minds: Learning Transferable Neural Representation
from Cross-Subject fMRI [34.8] 機能的磁気共鳴イメージング(fMRI)からの視覚内容の解読は、人間の視覚系を照らすのに役立つ。
従来のアプローチは主に、トレーニングサンプルサイズに敏感な、主題固有のモデルを採用していた。
本稿では,fMRIデータを統合表現にマッピングするための,サブジェクト固有の浅層アダプタを提案する。
トレーニング中,マルチモーダル脳復号における視覚的・テキスト的監督の両面を活用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:18:49 GMT)
CEAT: Continual Expansion and Absorption Transformer for Non-Exemplar
Class-Incremental Learnin [34.6] 現実のアプリケーションでは、動的シナリオは、古い知識を忘れずに新しいタスクを継続的に学習する能力を持つ必要がある。
連続膨張吸収変圧器(CEAT)という新しいアーキテクチャを提案する。
このモデルは、凍結した前のパラメータと平行に拡散層を拡張することで、新しい知識を学ぶことができる。
モデルの学習能力を向上させるために,特徴空間における古クラスと新クラスの重複を低減するために,新しいプロトタイプを設計した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:40:12 GMT)
CoRAL: Collaborative Retrieval-Augmented Large Language Models Improve
Long-tail Recommendation [34.3] 我々は,協調的な証拠を直接プロンプトに組み込む共同検索強化型LLM,CoRALを紹介した。
LLMは、ユーザ間の共有や個別の好みを分析し、特定のアイテムにどのタイプのユーザが惹かれるかを示すパターンを要約することができる。
実験の結果,コラルは特定のレコメンデーションタスクにおけるLLMの推論能力を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:49:34 GMT)
How to Understand Named Entities: Using Common Sense for News Captioning [34.1] ニュースキャプションは、記事本体を入力としてイメージを記述することを目的としている。
本稿では,ニュースキャプションのための名前付きエンティティを理解するために,コモンセンス知識を活用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:52:52 GMT)
DriveDreamer-2: LLM-Enhanced World Models for Diverse Driving Video
Generation [33.9] 本稿では,DriveDreamerをベースとしたDriveDreamer-2を提案する。
最終的に、生成した駆動ビデオの時間的・空間的コヒーレンスを高めるための統一多視点モデルを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:03:35 GMT)
Ultrafast and highly collimated radially polarized photons from a
colloidal quantum dot in a hybrid nanoantenna at room-temperature [33.9] 室温装置は、非常に高い速度で高方向性の放射偏光光子を生成する。
放出された光子は、定量値に基づいて非常に高い放射偏光(>93%)を持つことができる。
本研究は, ナノ構造デバイスにおける放射偏光の基本的な理解に寄与し, 実用化への道を開いた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:58:17 GMT)
Attention Prompt Tuning: Parameter-efficient Adaptation of Pre-trained
Models for Spatiotemporal Modeling [32.6] 本稿では,アクション認識などのビデオベースアプリケーションに対して,Attention Prompt Tuning(APT)を導入する。
APTは、バックボーンを凍結させながら微調整中にデータトークンとともに学習可能なプロンプトのセットを注入する。
提案手法は,FLOPとレイテンシを著しく低減するとともに,大幅な性能向上を実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:59:41 GMT)
Large Convolutional Model Tuning via Filter Subspace [31.7] 本稿では,空間のみの畳み込みの原因となるフィルタ原子のみを調整し,事前学習モデルの微調整を提案する。
このような単純なスキームは、識別的タスクと生成的タスクの両方において、以前のチューニングベースラインを超えていることが示される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:58:55 GMT)
Distribution-Aware Data Expansion with Diffusion Models [31.5] 分散認識拡散モデルに基づく効果的なデータ拡張フレームワークであるDistDiffを提案する。
分散一貫性のあるサンプルを生成する能力を示し,データ拡張タスクの大幅な改善を実現した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:07:53 GMT)
All in One: Multi-Task Prompting for Graph Neural Networks (Extended
Abstract) [30.5] 本論文は,KDD23で発表された論文の要約であり,研究論文賞を受賞した。
これは、事前訓練されたグラフモデルと適用されるさまざまなタスクの間のギャップを埋める新しいアプローチを導入します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:04:58 GMT)
Simulating Meson Scattering on Spin Quantum Simulators [30.4] 我々は,イジングスピンハミルトニアンのアナログ量子シミュレータにおいて,複合粒子の波束に対応する絡み合ったスピン状態を生成する2つの方法を開発した。
トラップイオンシミュレータに焦点をあて,両手法を数値的にベンチマークし,短期実験において高忠実度波動パケットが実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:00:07 GMT)
Advancing Generalizable Remote Physiological Measurement through the
Integration of Explicit and Implicit Prior Knowledge [30.3] リモート光胸腺撮影(remote photoplethysmography、r)は、顔ビデオから生理的信号をキャプチャする有望な技術である。
既存の方法の多くは r の事前の知識を見落としており、結果として一般化能力は劣る。
本稿では,rタスクにおける暗黙的,暗黙的な事前知識手法を同時に活用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:33:25 GMT)
Toward Generalist Anomaly Detection via In-context Residual Learning
with Few-shot Sample Prompts [30.3] Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、異なるアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
クエリ画像と数発のサンプルプロンプト間の残差の全体的評価に基づいて、通常のサンプルから異常を識別する補助データセットを用いて訓練する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:07:46 GMT)
Towards Scalable and Robust Model Versioning [30.2] ディープラーニングモデルへのアクセスを目的とした悪意ある侵入が増えている。
異なる攻撃特性を持つモデルの複数バージョンを生成する方法を示す。
モデル学習データにパラメータ化された隠れ分布を組み込むことでこれを実現できることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:50:45 GMT)
Guiding Large Language Models with Divide-and-Conquer Program for
Discerning Problem Solving [30.2] 本稿では,優れた表現力を確保し,タスクの分解,サブタスクの解決,分解処理を解消するDivide-and-Conquerプログラムを提案する。
実験結果から,提案手法は中間誤りや誤認内容に悩まされるタスクにおいて,通常の手順よりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:15:10 GMT)
A Mixed-Integer Conic Program for the Moving-Target Traveling Salesman
Problem based on a Graph of Convex Sets [30.2] 本稿では,移動目標トラベリングセールスマン問題(MT-TSP)の最適解を求める新しい定式化を提案する。
問題は、補給所から始まるエージェントの最も短い経路を見つけ、割り当てられた時間ウィンドウ内で1度だけ移動対象のセットを訪れ、補給所に戻ることである。
MT-TSPのためのMICP(Mixed Conic Program)の定式化について検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:47:04 GMT)
Graph Neural Network with Two Uplift Estimators for Label-Scarcity
Individual Uplift Modeling [30.2] 本稿では,ソーシャルグラフから高揚度推定法を学ぶために,Mと呼ばれる2つの高揚度推定器を備えたグラフニューラルネットワークベースのフレームワークを提案する。
提案アルゴリズムは,実世界のアップリフト推定シナリオを提供するために,オンラインで展開されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:51:27 GMT)
Conditional Score-Based Diffusion Model for Cortical Thickness
Trajectory Prediction [29.4] アルツハイマー病(英: Alzheimer's Disease、AD)は、個人間での進行率の多様性を特徴とする神経変性疾患である。
与えられたベースライン情報を用いてCThトラジェクトリを生成する条件付きスコアベース拡散モデルを提案する。
本モデルでは6~36ヶ月のCThに比べて95%間隔が狭いほぼゼロバイアスを有する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:26:18 GMT)
When should we prefer Decision Transformers for Offline Reinforcement
Learning? [29.1] オフラインRLのための3つの一般的なアルゴリズムは、保守的Q-Learning(CQL)、振舞いクローン(BC)、決定変換器(DT)である。
本稿では,これらのアルゴリズムの性能を,一般的なD4RLとロブミミシティのベンチマークで検証することによって実証的に検討する。
DTのデータ量を5倍にすることで,Atariの平均スコアが2.5倍向上することがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:22:22 GMT)
ConspEmoLLM: Conspiracy Theory Detection Using an Emotion-Based Large
Language Model [28.9] 本研究では,情緒情報を統合し,陰謀論に関する多様なタスクを遂行できる初のオープンソースLCMであるConspEmoLLMを提案する。
ConspEmoLLMは、我々の新しいConDIDデータセットを用いて感情指向LLMに基づいて微調整される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:35:45 GMT)
Knowledge-aware Alert Aggregation in Large-scale Cloud Systems: a Hybrid
Approach [28.7] COLAは、相関マイニングとLLM(Large Language Model)に基づく、オンラインアラートアグリゲーションのための新しいハイブリッドアプローチである。
大規模クラウドプラットフォームの生産環境から収集した3つのデータセットに対してCOLAを評価する。
その結果, COLA は 0.901 から 0.930 までの F1 スコアを達成し, 最先端の手法より優れ, 同等の効率を実現した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:48:35 GMT)
Explanation-based Training with Differentiable Insertion/Deletion
Metric-aware Regularizers [28.3] 挿入/削除メトリック認識による説明に基づく最適化(ID-ExpO)を提案する。
挿入と削除のメトリクスを拡張して、それらを微分可能とし、挿入と削除のメトリクスベースの正規化器を形式化する。
その結果、ID-ExpOにより、一般的なポストホックの説明者が予測精度を維持しつつ、より忠実で理解しやすい説明を作成できることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:14:33 GMT)
UPS: Towards Foundation Models for PDE Solving via Cross-Modal
Adaptation [28.2] UPSは、様々な領域、次元、解像度で定義された多様なPDEを効果的かつデータ効率で解決するアプローチである。
異なるPDEを一貫した表現空間に統一し、統一ネットワークアーキテクチャを用いて様々なPDEデータのコレクションを処理する。
数発で異なるPDEファミリ、係数、解像度に転送できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:00:39 GMT)
Fast and Stable Diffusion Inverse Solver with History Gradient Update [28.1] ヒストリーグラディエント・アップデート(HGU)と呼ばれるこの最適化プロセスにヒストリーグラディエント・グラデーションの組み入れを導入する。
実験により,従来のサンプリングアルゴリズムと比較して,HGUを用いたサンプリングアルゴリズムは医用画像再構成における最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:11:44 GMT)
GraphControl: Adding Conditional Control to Universal Graph Pre-trained
Models for Graph Domain Transfer Learning [28.0] グラフ自己教師型アルゴリズムは、豊富なラベルのないグラフデータから一般的な知識を取得することに成功している。
類似しているように見える領域の異なるグラフは、属性のセマンティクスの点で大きく異なる。
我々は、より優れたグラフドメイン転送学習を実現するために、ComputerNetによってモチベーションを得たGraphControlと呼ばれる革新的なデプロイモジュールを導入する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:33:51 GMT)
Fusing Neural and Physical: Augment Protein Conformation Sampling with
Tractable Simulations [28.0] 生成モデルは サロゲートサンプルとして利用され コンフォメーションアンサンブルを 桁違いに速く得る
本研究では,MDシミュレーションを抽出可能な方法で組み込んだ,事前学習型ジェネレーティブ・サンプリング器の少数ショット設定について検討する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:20:16 GMT)
Learning from Sparse Offline Datasets via Conservative Density
Estimation [27.9] 保守密度推定(CDE)と呼ばれる新しいトレーニングアルゴリズムを提案する。
CDEはこの課題に対処し、州が占有する定常分布に明示的に制約を課す。
本手法はD4RLベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:43:52 GMT)
From Posterior Sampling to Meaningful Diversity in Image Restoration [27.7] 画像復元問題は、通常、各劣化した画像を無限に多くの有効な方法で復元できるという意味で、不明確である。
多くの研究は、自然画像の後部分布からランダムにサンプリングしようとすることで、多様な出力を生成する。
ここでは、この戦略は後部分布の重みのため、一般に限定的な実用的価値を持つ。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:14:51 GMT)
FontCLIP: A Semantic Typography Visual-Language Model for Multilingual
Font Applications [27.6] FontCLIPは、大きな視覚言語モデルの意味的理解とタイポグラフィー的知識を結びつけるモデルである。
タイポグラフィー固有の知識を事前学習したCLIPモデルの包括的視覚言語知識に統合する。
FontCLIPの双対モダリティと一般化能力は多言語・多言語フォントの検索と文字形状の最適化を可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:08:16 GMT)
Deep Classifier Mimicry without Data Access [27.5] 本稿では,モデルに依存しない知識蒸留法であるContrastive Abductive Knowledge extract (CAKE)を提案する。
CAKEは、ノイズの多い合成サンプルのペアを生成し、モデルを決定境界に向けて対照的に拡散させる。
我々は、いくつかのベンチマークデータセットとさまざまなアーキテクチャ選択を使用して、CAKEの有効性を実証的に裏付ける。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:48:34 GMT)
Improving Low-Resource Knowledge Tracing Tasks by Supervised
Pre-training and Importance Mechanism Fine-tuning [27.1] 上記の課題に対処するため,低リソースのKTフレームワークであるLoReKTを提案する。
一般的な"事前学習と微調整"パラダイムにインスパイアされた我々は、リッチリソースのKTデータセットから転送可能なパラメータと表現を学習することを目指している。
複数のKTデータソースからの学生のインタラクションを組み込むエンコーディング機構を設計する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:44:43 GMT)
LLIC: Large Receptive Field Transform Coding with Adaptive Weights for
Learned Image Compression [27.0] 学習画像圧縮(LLIC)のための適応重み付き大規模受容場変換符号化を提案する。
学習した画像圧縮コミュニティではじめて、控えめな複雑さを維持しながら冗長性を高めるために、カーネルベースの奥行きに関する大規模な畳み込みを導入しました。
また,大規模カーネルの潜在能力を十分に活用するために,改良されたトレーニング手法についても検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:05:10 GMT)
Multilingual Turn-taking Prediction Using Voice Activity Projection [26.9] 本稿では,音声対話における音声活動予測モデルである音声活動予測(VAP)の多言語データへの適用について検討する。
その結果, ある言語で訓練された単言語VAPモデルでは, 他の言語に適用してもよい予測が得られないことが示唆された。
3つの言語すべてでトレーニングされた多言語モデルは、すべての言語にわたるモノリンガルモデルと同等の予測性能を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:50:29 GMT)
Continuous Memory Representation for Anomaly Detection [26.4] CRADは「連続的」メモリ内の正常な特徴を表現するための新しい異常検出手法である。
MVTec ADデータセットを用いた評価では、CRADは、マルチクラス統一異常検出におけるエラーの65.0%を削減し、従来の最先端手法よりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:16:24 GMT)
Bridging Domains with Approximately Shared Features [26.1] マルチソースドメイン適応は、未知のドメインに機械学習モデルを適用する際のパフォーマンス劣化を低減することを目的としている。
ソースドメインから不変の機能を学ぶことを支持する者もいれば、より多様な機能を好む者もいる。
本稿では,それらの相関関係のばらつきに基づいて特徴の効用を識別し,ドメイン間で$y$のラベルを付ける統計フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:25:41 GMT)
Breaking the Entanglement of Homophily and Heterophily in
Semi-supervised Node Classification [25.8] 統計的観点から,ノードプロファイルとトポロジの関係を定量化するAMUDを提案する。
また、AMUDのための新しい有向グラフ学習パラダイムとしてADPAを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:25:39 GMT)
A representation-learning game for classes of prediction tasks [25.7] 特徴ベクトルの次元還元表現を学習するためのゲームベースの定式化を提案する。
一般表現と損失関数に対して,ランダム化表現を最適化する効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:54:42 GMT)
Topology Learning for Heterogeneous Decentralized Federated Learning
over Unreliable D2D Networks [25.7] 分散統合学習(DFL)は、無線デバイス間通信(D2D)ネットワークにおいて大きな関心を集めている。
我々はDFLの理論収束解析を行い、収束境界を導出する。
本研究では,DFLにおける表現不一致と信頼できないリンクを考慮した新しいトポロジー学習手法ToLRDULを開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:27:57 GMT)
Split to Merge: Unifying Separated Modalities for Unsupervised Domain
Adaptation [25.5] 教師なしドメイン適応のための統一モダリティ分離(UniMoS)フレームワークを導入する。
私たちは,CLIPの機能を言語関連コンポーネントと視覚関連コンポーネントに明確に分離する,スウィンブルなモダリティ分離ネットワークを構築した。
モダリティ・アンサンブル・トレーニング(MET)法は,モダリティ・アンサンブル情報の交換を促進する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:33:12 GMT)
LISO: Lidar-only Self-Supervised 3D Object Detection [25.4] 本稿では,SOTAライダーオブジェクト検出ネットワークを学習するための新しい自己教師手法を提案する。
これはライダー点雲のラベルなし列にのみ作用する。
ボンネット下のSOTA自監督ライダーシーンフローネットワークを利用して、疑似地上真実を生成し、追跡し、反復的に洗練する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:02:52 GMT)
Real-time Transformer-based Open-Vocabulary Detection with Efficient
Fusion Head [25.2] 新しいトランスフォーマーベースのリアルタイムOVDモデルは、OmDetやGrounding-DINOで観測されるボトルネックを軽減するために設計された、革新的なEfficient Fusion Head (EFH)モジュールを備えている。
OmDet-Turboは、現在の最先端の教師付きモデルとほぼ同等のパフォーマンスレベルを達成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:48:25 GMT)
Unlink to Unlearn: Simplifying Edge Unlearning in GNNs [25.0] グラフニューラルネットワーク(GNN)におけるアンラーニングは、アカデミックにおける顕著な研究フロンティアとして現れている。
我々の研究は、エッジ・アンラーニング(エッジ・アンラーニング)に焦点を当てている。
グラフ構造から左端を解き放つことによって、未学習を容易にする新しい方法であるtextbfUnlink to Unlearn を開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:08:36 GMT)
SPAWNing Structural Priming Predictions from a Cognitively Motivated
Parser [24.6] 文処理時に人間が構築する構造表現を特徴付ける理論を構築するために,経験的プライミングパターンを用いたフレームワークを提案する。
我々はSPAWNを用いて、相対的節の構造について異なる仮定を行う2つの理論的な説明からプライミング予測を生成する。
これらの理論のうちの1つのみからの予測が経験的プライミングパターンと一致していることが判明した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:58:58 GMT)
HDRTransDC: High Dynamic Range Image Reconstruction with Transformer
Deformation Convolution [24.6] 高ダイナミックレンジ(CAM)画像は、多露光低ダイナミックレンジ(LDR)画像を融合させることで、現実的な細部を持つ人工物のないHDR画像を生成することを目的としている。
融合歪みの除去を目的としたDWFBを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:48:17 GMT)
DeepSeek-VL: Towards Real-World Vision-Language Understanding [24.6] 本稿では、実世界のビジョンと言語理解アプリケーションのためのオープンソースのVision-Language(VL)モデルであるDeepSeek-VLを紹介する。
当社のアプローチは,3つの重要な側面に基づいて構成されています。
実際のユーザシナリオからユースケース分類を作成し、インストラクションチューニングデータセットを構築します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:47:41 GMT)
Answering Diverse Questions via Text Attached with Key Audio-Visual
Clues [24.3] 本稿では,相互相関蒸留(MCD)を行うための枠組みを提案する。
提案手法は,複数の問合せ対を含む2つの公開データセットに対して評価する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:51:37 GMT)
Cosine Scoring with Uncertainty for Neural Speaker Embedding [24.2] 本稿では, フロントエンドを埋め込んだ話者の不確かさを推定し, コーシンスコアリングバックエンドに伝播する手法を提案する。
従来のコサイン類似性と比較して、EERとminDCFの平均減少率は8.5%と9.8%で改善された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:31:35 GMT)
Explainable Learning with Gaussian Processes [23.8] 我々は、モデル不確実性の下で属性を定義するために原則化されたアプローチをとっており、既存の文献を拡張している。
GPRは非常に柔軟で非パラメトリックなアプローチであるが、特徴属性に対する解釈可能でクローズドな表現を導出できることを示す。
また、適用すれば、GPR属性の正確な式は、現在使われている近似よりも正確で計算コストが低いことも示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:03:02 GMT)
Enhancing Semantic Fidelity in Text-to-Image Synthesis: Attention
Regulation in Diffusion Models [23.8] 拡散モデルにおけるクロスアテンション層は、生成プロセス中に特定のトークンに不均等に集中する傾向がある。
本研究では,アテンションマップと入力テキストプロンプトを一致させるために,アテンション・レギュレーション(アテンション・レギュレーション)という,オン・ザ・フライの最適化手法を導入する。
実験結果から,本手法が他のベースラインより一貫して優れていることが示された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:18:27 GMT)
Str2Str: A Score-based Framework for Zero-shot Protein Conformation
Sampling [23.7] タンパク質の動的性質は、その生物学的機能や性質を決定するために重要である。
既存の学習ベースのアプローチでは、直接サンプリングを行うが、トレーニングにはターゲット固有のシミュレーションデータに大きく依存する。
ゼロショットコンフォーメーションサンプリングが可能な新しい構造間翻訳フレームワークStr2Strを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:54:30 GMT)
A Logical Pattern Memory Pre-trained Model for Entailment Tree
Generation [23.4] コヒーレントで信頼できる説明を生成することは、AI分野における重要な課題である。
論理パターンメモリ事前学習モデル(LMPM)を提案する。
我々のモデルは、基礎となる前提と密接に一致したより一貫性があり合理的な結論を生み出す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:45:09 GMT)
Semantic Residual Prompts for Continual Learning [23.1] 提案手法は,最先端CLアプローチとゼロショットCLIPテストの両方で有意に優れていた。
我々の発見は、バックボーンモデルの事前学習知識に相当な領域ギャップを持つデータセットにも当てはまる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:23:38 GMT)
Zero-Shot Image Harmonization with Generative Model Prior [23.0] 画像調和のためのゼロショットアプローチを提案し, 大量の合成合成画像への依存を克服することを目的とした。
人間の振る舞いにインスパイアされた、完全にモジュール化されたフレームワークを導入します。
さまざまなシーンやオブジェクトにまたがる説得力のある視覚的結果と、アプローチを検証するユーザスタディを提示します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:08:04 GMT)
DNGaussian: Optimizing Sparse-View 3D Gaussian Radiance Fields with
Global-Local Depth Normalization [22.6] 放射場は、スパース入力ビューから新しいビューを合成する際、顕著な性能を示してきたが、一般的な方法は、高いトレーニングコストと遅い推論速度に悩まされている。
本稿では,DNGaussianについて紹介する。DNGaussianは3次元ガウス放射場に基づく奥行き規則化フレームワークで,低コストでリアルタイムかつ高品質なノベルショットビュー合成を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:02:11 GMT)
One Category One Prompt: Dataset Distillation using Diffusion Models [22.5] 本稿では,D3M(Diffusion Models)をデータセット蒸留の新たなパラダイムとして導入し,生成的テキスト・画像基盤モデルの最近の進歩を活用する。
提案手法では,テキストから画像への合成モデルを微調整する手法であるテキストインバージョンを用いて,大規模データセットの簡潔かつ情報的な表現を生成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:23:59 GMT)
EarthLoc: Astronaut Photography Localization by Indexing Earth from
Space [22.4] 宇宙飛行士の写真は、科学研究と災害対応の両方に非常に価値のある、ユニークな地球観測データセットを提示する。
現在の手動のローカライゼーションの取り組みは時間がかかり、自動化されたソリューションの必要性を動機付けている。
本稿では,この課題を効果的に解決するために,画像検索を活用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:30:51 GMT)
3D Diffuser Actor: Policy Diffusion with 3D Scene Representations [22.4] 拡散ポリシは、条件付き拡散モデルを用いて、ロボットに条件付された行動分布と環境状態を学ぶ。
3Dロボットポリシーでは、感覚深度を用いて1つまたは複数のカメラビューから集約された3Dシーンの特徴表現を使用する。
本稿では,ロボットのエンドエフェクタの3次元回転と翻訳を反復的に認知するために,視覚シーンと環境の3次元表現を構築するニューラルポリシーアーキテクチャである3Dディフューザアクタを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:05:00 GMT)
Pre-Trained Model Recommendation for Downstream Fine-tuning [22.3] モデル選択は、市販の事前訓練されたモデルをランク付けし、新しいターゲットタスクに最も適したモデルを選択することを目的としている。
既存のモデル選択テクニックはスコープ内で制約されることが多く、モデルとタスク間の微妙な関係を見落としてしまう傾向があります。
我々は,多種多様な大規模モデルリポジトリを探索する実用的フレームワーク textbfFennec を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:24:32 GMT)
An alternative approach to train neural networks using monotone
variational inequality [22.3] 本稿では,モノトーンベクトル場を用いたニューラルネットワークトレーニングの代替手法を提案する。
我々のアプローチは、事前訓練されたニューラルネットワークのより効率的な微調整に利用できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:38:23 GMT)
The pitfalls of next-token prediction [22.1] 自己回帰的推論と教師強制訓練の2つの相が明確に扱われなければならないと我々は論じている。
本稿では,教師の強制力の失敗に関する一般的なメカニズムを説明し,最小限の計画課題を設計する。
複数のトークンを事前に予測するトレーニングにおいて,この障害が解決可能であることを示す予備的証拠を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:47:30 GMT)
Elephants Never Forget: Testing Language Models for Memorization of
Tabular Data [21.9] 大規模言語モデル (LLM) は様々なタスクに適用できるが、データ汚染と記憶の重大な問題はしばしば誇張される。
本稿では, 条件分布モデリングの統計的テストや, 暗記を識別する4つのテストなど, 汚染度を評価するための様々な手法を紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:07:13 GMT)
Better Understandings and Configurations in MaxSAT Local Search Solvers
via Anytime Performance Analysis [21.8] 本稿では,MaxSATの局所探索性能を常に比較するために,経験的累積分布関数を用いることを実証する。
この評価は,解解器の性能の差異を明らかにし,解器の長所が異なる実行時間に沿って調整されていることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:10:35 GMT)
SMART: Automatically Scaling Down Language Models with Accuracy Guarantees for Reduced Processing Fees [21.8] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクの性能を大幅に向上させた。
高性能LLMの配備は、主にモデル性能の向上を目的としたパラメータの増大により、かなりのコストがかかる。
SMARTは,NLPタスクの推論コストを最小限に抑えつつ,十分な結果品質を確保するために設計された新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:45:47 GMT)
iKUN: Speak to Trackers without Retraining [21.6] 市販トラッカーとの通信を実現するため,iKUNと呼ばれる挿入可能な知識統一ネットワークを提案する。
局所化精度を向上させるために,プロセスノイズを動的に調整するKalman filter (NKF) のニューラルバージョンを提案する。
また、パブリックなDanceTrackデータセットをモーションとドレッシング記述で拡張することで、より困難なデータセットであるRefer-Danceにもコントリビュートしています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:52:22 GMT)
ERA-CoT: Improving Chain-of-Thought through Entity Relationship Analysis [21.5] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて、賞賛できる成果を達成している。
これらの課題は、多段階の推論を必要とする暗黙の関係の存在から生じる。
本稿では,エンティティ間の関係を捉えることで,LLMのコンテキスト理解を支援する新しいアプローチであるERA-CoTを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:18:53 GMT)
3M-Diffusion: Latent Multi-Modal Diffusion for Text-Guided Generation of
Molecular Graphs [20.8] 本稿では,新しい分子グラフ生成法である3M-Diffusionを提案する。
本稿では,3M-Diffusionが提供したテキスト記述にセマンティックに適合する高品質で斬新で多様な分子グラフを生成できることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:44:54 GMT)
UFORecon: Generalizable Sparse-View Surface Reconstruction from
Arbitrary and UnFavOrable Sets [20.8] 入力ビューの組み合わせの有効性を示すために、ビュー合成スコアを導入し、検証する。
これを実現するために、ソース画像間の相互作用とビルド相関フラストラムのモデル化にクロスビューマッチングトランスフォーマを適用した。
提案手法は,ビュー・コンビネーション・ジェネリゼーション・ジェネリザビリティにおいて,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:03:56 GMT)
DiPrompT: Disentangled Prompt Tuning for Multiple Latent Domain
Generalization in Federated Learning [20.5] フェデレートラーニング(FL)は、分散データから学ぶための強力なパラダイムとして登場した。
既存のFLメソッドの多くは、トレーニング中にドメインラベルが提供されると仮定し、その評価はドメインの数に明確な制約を課している。
本稿では,ドメイン一般化のための適応的なプロンプトを分散的に学習することで,上記の制約に対処するDistangled Prompt Tuning(DiPrompT)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:58:15 GMT)
TopicDiff: A Topic-enriched Diffusion Approach for Multimodal
Conversational Emotion Detection [20.4] MCEタスクにおけるマルチモーダルトピック情報を取得するために,モデルに依存しないトピック強化拡散(TopicDiff)手法を提案する。
詳細な評価は、最先端のMCEベースラインに対するTopicDiffの大幅な改善を示している。
音声と視覚の話題情報は,言語に比べて識別性が高く,頑健である,という興味深い発見を観察する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:04:28 GMT)
RA-ISF: Learning to Answer and Understand from Retrieval Augmentation
via Iterative Self-Feedback [20.2] 大規模言語モデル(LLM)は多くのタスクにおいて例外的な性能を示すが、それでもパラメータに格納された知識に大きく依存している。
Retrieval-augmented Generation (RAG)メソッドは、外部知識を統合することでこの問題に対処する。
本稿では、反復的にタスクを分解し、3つのサブモジュールで処理し、モデルの問題解決能力を向上するフレームワークであるRetrieval Augmented Iterative Self-Feedback (RA-ISF)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:01:05 GMT)
Unveiling Project-Specific Bias in Neural Code Models [20.1] 大規模言語モデル(LLM)ベースのニューラルネットワークモデルは、実際のプロジェクト間アウトオブディストリビューション(OOD)データに効果的に一般化するのに苦労することが多い。
この現象は, 地中真実の証拠ではなく, プロジェクト固有のショートカットによる予測に大きく依存していることが示唆された。
サンプル間の潜在論理関係を利用してモデルの学習行動を規則化する新しいバイアス緩和機構を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:52:47 GMT)
Beyond Finite Data: Towards Data-free Out-of-distribution Generalization
via Extrapolation [19.9] ニューラルネットワークが人間のように外挿し、OODの一般化を実現するにはどうすればよいのか?
本稿では,大言語モデル(LLM)にカプセル化されている推論能力と広範な知識を活用して,完全に新しいドメインを合成する領域外挿手法を提案する。
提案手法は, VLCSなどのデータセットにおいて, 教師付き設定を約1~2%超え, 評価可能な性能を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:58:52 GMT)
Simplicity Bias of Transformers to Learn Low Sensitivity Functions [19.9] トランスフォーマーは多くのタスクで最先端の精度と堅牢性を達成する。
彼らが持っている誘導バイアスと、それらのバイアスが他のニューラルネットワークアーキテクチャとどのように異なるかを理解することは、まだ解明されていない。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:12:09 GMT)
DiaLoc: An Iterative Approach to Embodied Dialog Localization [19.7] そこで我々は,実際の人間の動作に合わせたダイアログベースの新たなローカライゼーションフレームワークであるDiaLocを提案する。
DiaLocはマルチモーダルデータをマルチショットローカライズに効果的に利用し、融合エンコーダは視覚と対話情報を反復的に融合する。
Acc5@valUnseenでは+7.08%) とマルチショット設定(Acc5@valUnseenでは+10.85%) で、エンボディダイアログベースのローカライゼーションタスクの最先端結果を得る。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:03:43 GMT)
CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in
Korean [19.6] 韓国における1,995対のQAペアからなる文化・言語知能のベンチマークについて紹介する。
CLIcKは、公式の韓国の試験と教科書からデータを入手し、質問を言語と文化の2つの主要なカテゴリで11のカテゴリに分けている。
CLIcKを用いて、13の言語モデルを用いて、パフォーマンスを評価する。評価では、カテゴリ間でのパフォーマンスに関する洞察と、その理解に影響を与えるさまざまな要因を明らかにする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:54:33 GMT)
V3D: Video Diffusion Models are Effective 3D Generators [19.3] 本稿では、事前学習したビデオ拡散モデルの世界シミュレーション能力を活用して、3D生成を容易にするV3Dを紹介する。
これを利用して、最先端のビデオ拡散モデルを微調整して、1つの画像が与えられた物体を囲む360度軌道フレームを生成することができる。
提案手法はシーンレベルの新規ビュー合成に拡張可能であり,スパース・インプット・ビューによるカメラ・パスの正確な制御を実現する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:03:36 GMT)
PRIOR: Prototype Representation Joint Learning from Medical Images and
Reports [19.3] 医用画像とレポートのグローバルなアライメントとローカルなアライメントを組み合わせた表現学習フレームワークを提案する。
標準的なグローバルな多モードアライメント手法とは対照的に、細粒度表現に局所アライメントモジュールを用いる。
低レベルのローカライズされた視覚的および高レベルの臨床言語的特徴に焦点を合わせることができる文量プロトタイプメモリバンクを構築する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:25:58 GMT)
Local Feature Matching Using Deep Learning: A Survey [19.3] 局所的な特徴マッチングは、画像検索、3D再構成、オブジェクト認識といった領域を含むコンピュータビジョンの領域において幅広い応用を享受する。
近年,深層学習モデルの導入により,局所的特徴マッチング手法の探究が盛んに行われている。
また,移動構造,リモートセンシング画像登録,医用画像登録などの多様な領域における局所的特徴マッチングの実践的応用についても検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:32:03 GMT)
HiFA: High-fidelity Text-to-3D Generation with Advanced Diffusion
Guidance [19.3] 本研究は,高品質なテキスト・ツー・3D生成を実現するための全体的サンプリングと平滑化手法を提案する。
テキスト・画像拡散モデルの潜時空間と画像空間における復調スコアを計算する。
単一段最適化において高品質なレンダリングを生成するため,我々はNeRF線に沿ったz座標の分散の正則化を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:14:31 GMT)
Breaking Speaker Recognition with PaddingBack [18.2] 近年の研究では、音声バックドアは画像バックドアと同様に、変換をトリガーとして利用できることが示されている。
パディングバック(PaddingBack)は悪質な操作を利用して有毒なサンプルを生成する無音バックドアアタックである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:16:03 GMT)
RLingua: Improving Reinforcement Learning Sample Efficiency in Robotic
Manipulations With Large Language Models [18.2] 強化学習(Reinforcement Learning, RL)は、様々なタスクを解く能力を示したが、サンプル効率が低いことで悪名高い。
RLinguaは大規模言語モデル(LLM)の内部知識を活用でき、ロボット操作におけるRLの複雑さを軽減できるフレームワークである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:13:26 GMT)
'One size doesn't fit all': Learning how many Examples to use for
In-Context Learning for Improved Text Classification [18.2] In-context Learning (ICL) は、少数のラベル付きデータインスタンスをプロンプトの例として使用する。
本稿では,データに代表されるサンプル数を動的に適応させる手法を提案する。
実験の結果,AICL法はいくつかの標準データセットにおけるテキスト分類タスクの改善をもたらすことがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:28:13 GMT)
Joint-Embedding Masked Autoencoder for Self-supervised Learning of
Dynamic Functional Connectivity from the Human Brain [18.2] グラフニューラルネットワーク(GNN)は、人間の脳ネットワークと表現型を区別するための動的機能接続の学習において、有望であることを示している。
本稿では,計算機ビジョンにおけるJEPA(Joint Embedding Predictive Architecture)からインスピレーションを得た,時空間連成型自動エンコーダ(ST-JEMA)について紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:49:41 GMT)
Group Distributionally Robust Dataset Distillation with Risk
Minimization [18.1] 本稿では,クラスタリングとリスク尺度の最小化を組み合わせ,DDを遂行する損失を最小化するアルゴリズムを提案する。
数値実験により,その有効一般化と部分群間のロバスト性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:56:54 GMT)
ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss
via Meta-Learning [17.9] メタラーニングに基づく統合画像融合フレームワークReFusionを導入する。
ReFusionはパラメータ化された損失関数を採用し、特定のシナリオとタスクに応じてトレーニングフレームワークによって動的に調整される。
赤外線可視、医療、マルチフォーカス、マルチ露光画像融合など、様々なタスクに適応することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:25:26 GMT)
Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for
Mobile Robots [17.9] セマンティックセグメンテーションと境界検出を同時に行う軽量なフレームワークであるMobile-Seedを紹介する。
我々のフレームワークは、2ストリームエンコーダ、アクティブフュージョンデコーダ(AFD)、デュアルタスク正規化アプローチを備えている。
Cityscapesデータセットの実験によると、Mobile-Seedは最先端(SOTA)ベースラインよりも顕著に改善されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:12:45 GMT)
Unveiling the Significance of Toddler-Inspired Reward Transition in
Goal-Oriented Reinforcement Learning [17.7] このToddler-Inspired Reward Transitionからインスピレーションを得た私たちは,Reinforcement Learning (RL)タスクに組み込まれた場合の,さまざまな報酬遷移の影響について検討した。
エゴセントリックなナビゲーションやロボットアーム操作タスクなど、さまざまな実験を通じて、適切な報酬遷移がサンプル効率と成功率に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:34:23 GMT)
FALCON: FLOP-Aware Combinatorial Optimization for Neural Network Pruning [17.6] ネットワークプルーニングは、性能を維持しながら、モデルサイズと計算コストを削減するソリューションを提供する。
現在のプルーニング法のほとんどは、非ゼロパラメータの数を減らし、空間性を改善することに重点を置いている。
本稿では,FALCONを提案する。FALCONは,モデル精度(忠実度),FLOP,スペーサ性制約を考慮に入れた,ネットワークプルーニングを最適化した新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:40:47 GMT)
Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy
Evaluation [17.3] Off-Policy Evaluation (OPE) は、オフラインログデータのみを使用して、反ファクトポリシーの有効性を評価することを目的としている。
OPE推定器の既存の評価指標は、主にOPEの「正確性」や下流政策の選択に焦点を当てている。
我々は、OPE推定器によって形成される政策ポートフォリオのリスク・リターントレードオフを測定するSharpeRatio@kと呼ばれる新しい指標を開発する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:29:24 GMT)
SCOPE-RL: A Python Library for Offline Reinforcement Learning and
Off-Policy Evaluation [17.3] SCOPE-RLは、オフライン強化学習(オフラインRL)、オフポリシー評価(OPE)、選択(OPS)のために設計されたPythonソフトウェアである。
SCOPE-RLはOPEモジュールに特に重点を置いており、様々なOPE推定器と堅牢なOPEプロトコルを提供している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:38:57 GMT)
Average Calibration Error: A Differentiable Loss for Improved
Reliability in Image Segmentation [17.3] 本稿では,L1平均キャリブレーション誤差(mL1-ACE)を新たな補助損失関数として用いて,セグメンテーション品質を損なうことなく画素ワイドキャリブレーションを改善することを提案する。
この損失は、ハード・ビンニングを用いても直接微分可能であり、近似的ではあるが微分可能なサロゲートやソフト・ビンニングのアプローチを回避できることが示される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:31:03 GMT)
Online Bilevel Optimization: Regret Analysis of Online Alternating
Gradient Methods [17.1] 我々は、シングルレベルオンラインアルゴリズムに対する既知の後悔の限界を、バイレベル設定にまで広げる。
本研究では,スムーズさを生かしたオンライン時間平均勾配法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:25:29 GMT)
Code-Based English Models Surprising Performance on Chinese QA Pair
Extraction Task [17.1] コードベースのモデルは推論集約シナリオにおいて、テキストベースのモデルよりも一貫してパフォーマンスが良い。
一定の量の中国語データを含むコードベースのモデルは、パフォーマンスをさらに向上させる。
特定の中国語タスクにおけるコードベース英語モデルの能力は、哲学的な「中国語室」思考実験において、明確な視点を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:23:47 GMT)
Large Model driven Radiology Report Generation with Clinical Quality
Reinforcement Learning [16.8] 放射線学報告生成 (RRG) は, 放射線技師の作業量削減の可能性から注目されている。
本稿では,新しいRRG法である textbfLM-RRG について紹介する。
MIMIC-CXRおよびIU-Xrayデータセットを用いた実験により,本手法が技術状況よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:47:11 GMT)
The Case for Globalizing Fairness: A Mixed Methods Study on Colonialism,
AI, and Health in Africa [16.8] 我々は,アフリカにおける公平性を考慮した不均質の軸を提案するために,スコーピングレビューを実施している。
次に,一般人口調査参加者672名と,ML,健康,政策の専門家28名と質的研究を行った。
我々の分析は、関心の属性として植民地主義に焦点を当て、人工知能(AI)、健康、植民地主義の相互作用を調べる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:16:22 GMT)
QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven
Fine Tuning [16.5] この研究は、これらの精度低下の原因を明らかにし、量子化フレンドリな微調整法である textbfQuantTune を提案している。
提案手法は, ViT, Bert-base, OPT など,トランスフォーマーベースモデルにおけるポストトレーニング量子化の大幅な改善を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:09:30 GMT)
Tracking Dynamic Gaussian Density with a Theoretically Optimal Sliding
Window Approach [16.5] 我々は「すべり窓」カーネル密度推定器の正確な平均2乗誤差(MISE)について検討した。
合成データセットを用いて実験的なエビデンスを提示し、重み付け方式がトラッキング性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:21:26 GMT)
Point Mamba: A Novel Point Cloud Backbone Based on State Space Model
with Octree-Based Ordering Strategy [15.8] 我々は、因果性を考慮した注文機構を備えた、新しいSSMベースのポイントクラウド処理バックボーン、Point Mambaを提案する。
本手法は, 変圧器をベースとした変圧器と比較して, 93.4%の精度と75.7mIOUの精度を実現している。
提案手法は,SSMが点雲理解において一般的なバックボーンとして機能する可能性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:07:39 GMT)
AC-EVAL: Evaluating Ancient Chinese Language Understanding in Large
Language Models [15.5] AC-EVALは、大規模言語モデル(LLM)の高度な知識と推論能力を評価するために設計されたベンチマークである。
このベンチマークは歴史的事実、地理、社会慣習、芸術、哲学、古典詩、散文を含む13のタスクで構成されている。
英語と中国語の両方に合わせた最高性能LLMの評価は、古代のテキスト理解を向上する大きな可能性を示唆している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:24:37 GMT)
Can LLMs' Tuning Methods Work in Medical Multimodal Domain? [15.4] 大言語モデル(LLM)は世界知識の理解に優れ、特定のサブフィールドに適応するには正確な調整が必要である。
LLM(Large Vision-Language Models)とLVLM(Large Vision-Language Models)の両方において,PEFT法が出現し,大きな成功を収めている。
転帰学習効率を高めるため,大規模モデルの微調整法を医療分野に移行することは可能か?
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:38:48 GMT)
{\epsilon}-Neural Thompson Sampling of Deep Brain Stimulation for
Parkinson Disease Treatment [15.3] 本稿では,Deep Brain Stimulation (DBS) デバイスのためのコンテキスト型マルチアームバンディット (CMAB) ソリューションを提案する。
本研究は,基底神経節(BG)領域における不規則ニューロンの発射活動を捉える信号としてコンテキストを定義した。
エプシロン探索戦略は、古典的なトンプソンサンプリング法の上に導入され、エプシロンニューラルツと呼ばれるアルゴリズムが導かれる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:33:40 GMT)
Evaluating Emerging AI/ML Accelerators: IPU, RDU, and NVIDIA/AMD GPUs [15.3] Graphcore Intelligence Processing Unit (IPU)、Sambanova Reconfigurable Dataflow Unit (RDU)、拡張GPUプラットフォームについてレビューする。
この研究は、これらの商用AI/MLアクセラレータの予備評価と比較を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:52:30 GMT)
A Differential Geometric View and Explainability of GNN on Evolving
Graphs [15.2] グラフはソーシャルネットワークや生化学においてユビキタスであり、グラフニューラルネットワーク(GNN)は予測のための最先端のモデルである。
本稿では,公理的属性を用いたGNN予測分布のスムーズなパラメータ化を提案する。
グラフの進化によるノード分類,リンク予測,グラフ分類に関する実験により,提案手法の空間性,忠実性,直感性が向上した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:26:18 GMT)
Topologically Regularized Multiple Instance Learning to Harness Data
Scarcity [15.1] 複数のインスタンス学習モデルは、患者の顕微鏡サンプルを分類するための強力なツールとして登場した。
我々は、この課題を緩和するために、MILにトポロジカル正規化用語を導入します。
MILベンチマークは平均2.8%、合成MILデータセットは15.3%、現実世界のバイオメディカルデータセットは5.5%である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:14:15 GMT)
MambaMorph: a Mamba-based Framework for Medical MR-CT Deformable
Registration [15.0] 我々は,新しい多モード変形可能な登録フレームワークであるMambaMorphを紹介する。
MambaMorphは、Mambaベースの登録モジュールと、きめ細かい、しかし単純な機能抽出器を使用している。
MambaMorphは,登録精度の観点から,現在最先端の学習ベース登録法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:46:23 GMT)
Financial Default Prediction via Motif-preserving Graph Neural Network
with Curriculum Learning [14.6] 本稿では,カリキュラム学習(MotifGNN)を用いたモチーフ保存型グラフニューラルネットワークを提案する。
元のグラフから得られた情報と良好な接続性を利用して、高階構造の学習を強化する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:44:56 GMT)
Exploiting Multimodal Synthetic Data for Egocentric Human-Object
Interaction Detection in an Industrial Scenario [14.2] EgoISM-HOIは,手や物体のアノテーションが豊富な産業環境下で合成されたEHOI画像からなる,新しいマルチモーダルデータセットである。
本研究は,提案手法を事前学習するために合成データを活用することにより,実世界のデータでテストした場合の性能が著しく向上することを示す。
この分野での研究を支援するため、私たちはデータセット、ソースコード、事前トレーニングされたモデルをhttps://iplab.dmi.unict.it/egoism-hoi.comで公開しています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:37:00 GMT)
MRL Parsing Without Tears: The Case of Hebrew [14.1] 形態的にリッチな言語(MRL)では、トークンごとに複数の語彙単位を識別する必要があるが、既存のシステムはレイテンシとセットアップの複雑さに悩まされている。
決定は、専門家の分類器によって、各ユニットが1つの特定のタスクに特化して行われる。
この信じられないほど高速なアプローチは、HebrewのPOSタグ付けと依存性解析に新しいSOTAを設定し、他のHebrewタスクではほぼSOTAのパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:54:33 GMT)
Learning Group Activity Features Through Person Attribute Prediction [14.0] グループ活動特徴(GAF)学習を提案する。
ネットワーク全体をエンドツーエンドで学習することにより、グループ内の人々の特性をトレーニングする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:15:48 GMT)
Sliced-Wasserstein Distances and Flows on Cartan-Hadamard Manifolds [13.9] カルティマタン・アダマール多様体上のスライス・ワッサーシュタイン距離の一般構成を導出する。
また、ワッサーシュタイン勾配流を近似することにより、これらの新しい距離を最小化する非パラメトリックスキームを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:01:21 GMT)
MatchXML: An Efficient Text-label Matching Framework for Extreme
Multi-label Text Classification [13.8] eXtreme Multi-label text Classification (XMC) は、大規模なラベルセットから関連するラベルにテキストサンプルを割り当てる分類器の訓練を指す。
XMCのための効率的なテキストラベルマッチングフレームワークであるMatchXMLを提案する。
実験の結果、MatchXMLは6つのデータセットのうち5つで最先端の精度を実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:50:03 GMT)
Secure Decentralized Learning with Blockchain [13.8] Federated Learning(FL)は、モバイルとIoTデバイスにおける分散機械学習のパラダイムとしてよく知られている。
FLにおける単一障害点問題を回避するため、分散学習(DFL)がモデル集約にピアツーピア通信を使用することが提案されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:52:12 GMT)
Harvard Glaucoma Fairness: A Retinal Nerve Disease Dataset for Fairness
Learning and Fair Identity Normalization [13.8] 緑内障検出のための2次元および3次元データイメージングと人種的バランスの取れたデータセットであるHarvard-GF(Harvard Glaucoma Fairness)を紹介する。
我々のFINアプローチは、人種、性別、フェアネスタスクにおいて優れたパフォーマンスを持つ最先端のフェアネス学習手法と比較される。
フェアネスの文脈で、あらゆる種類のパフォーマンス指標を比較するのに柔軟に使用できる、エクイティスケールのパフォーマンス指標を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:54:57 GMT)
LVC-LGMC: Joint Local and Global Motion Compensation for Learned Video
Compression [13.8] 本稿では,映像符号化のための共同ローカル・グローバル・モーション補償モジュール(LGMC)を提案する。
グローバルなコンテキストを捉えるために,機能領域におけるクロスアテンションを用いて動き補償を行う。
LVC-LGMCは,ベースラインDCVC-TCMよりも高い速度歪み性能を有する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:41:20 GMT)
A Segmentation Foundation Model for Diverse-type Tumors [13.7] 多くの医用画像データセットは十分な量のデータを持っていないため、医用画像の大規模なモデルはほとんどない。
本稿では,Resblock-backbone と Transformer-bottleneck を用いた大規模腫瘍基盤モデル (TSFM) を提案する。
TSFMは腫瘍のセグメンテーションにおいて良好な性能を示すため,医用画像における腫瘍と臓器の空間的相関を十分に活用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:05:05 GMT)
MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual
Grounding [13.6] 3Dビジュアルグラウンドティングでは、自然言語記述と対応するオブジェクトを3D空間でマッチングする。
既存の手法は、オブジェクト認識の正確さや複雑な言語クエリの解釈に苦慮している場合が多い。
我々は,自己注意に基づくシーン認識オブジェクトエンコーダと,元来のマルチキーアンカー技術を統合したMiKASA変換器を提案する。
我々のモデルは、Sr3DとNr3Dの両方のデータセットに対するReferit3Dチャレンジにおいて、最も高い総合的精度を達成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:02:20 GMT)
Segment Anything Model is a Good Teacher for Local Feature Learning [13.5] 局所的な特徴の検出と記述は多くのコンピュータビジョンタスクにおいて重要な役割を果たす。
データ駆動型局所特徴学習法は、訓練にピクセルレベルの対応に頼る必要がある。
1100万の画像に基づいて訓練されたモデルSAMeatを,局所的な特徴学習を指導する教師として提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:38:01 GMT)
From Pixel to Cancer: Cellular Automata in Computed Tomography [13.4] 腫瘍合成は、医療画像に人工腫瘍を作ろうとする。
本稿では腫瘍発生をシミュレートする汎用ルールのセットを確立する。
次に,腫瘍状態をCT画像に統合し,異なる臓器にまたがる合成腫瘍を作製する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:46:31 GMT)
Anatomically-Controllable Medical Image Generation with
Segmentation-Guided Diffusion Models [12.9] 解剖学的に制御可能な医用画像生成を支援する拡散モデルに基づく手法を提案する。
また, ランダムマスクアブレーショントレーニングアルゴリズムを導入し, 解剖学的制約の組合せの条件付けを可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:50:31 GMT)
Unsupervised Real-Time Hallucination Detection based on the Internal
States of Large Language Models [12.9] 大型言語モデル(LLM)における幻覚は、一貫性はあるが事実的に不正確な応答を生成する。
我々は、リアルタイム幻覚検出にLLMの内部状態を活用する教師なしのトレーニングフレームワークであるMINDを提案する。
また,複数のLLMを対象とした幻覚検出のための新しいベンチマークであるHELMを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:51:03 GMT)
A Model for Assessing Network Asset Vulnerability Using QPSO-LightGBM [12.8] 本稿では,量子粒子群アルゴリズムに基づくネットワークアセット脆弱性の多重分類予測モデルを提案する。
その結果,様々な予測性能指標において,提案モデルの方が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:23:52 GMT)
Last Iterate Convergence of Incremental Methods and Applications in
Continual Learning [12.8] 連続学習における応用により、漸進的勾配法と漸進的近位法の両方の最後の繰り返しに対する収束保証を得る。
以上の結果から, 段階的手法の繰り返し保証を, 最先端技術と比較して一般化した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:24:26 GMT)
Benign overfitting in leaky ReLU networks with moderate input dimension [12.7] 二元分類タスクにおけるヒンジ損失を訓練した2層ReLUネットワークにおける良性オーバーフィッティングについて検討した。
モデルパラメータの信号対雑音比(SNR)の条件を特徴付ける。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:56:01 GMT)
TAP: The Attention Patch for Cross-Modal Knowledge Transfer from
Unlabeled Modality [12.7] そこで本論文では,教師あり学習の性能向上を主目的とするクロスモーダル学習の枠組みについて論じる。
二次モードに含まれる余分な情報をNadaraya-Watson(NW)カーネルレグレッションによって推定できることを示す。
我々は、ラベルのないモダリティからデータレベルの知識を転送できるシンプルなニューラルネットワークアドオンであるThe Attention Patch (TAP)を紹介した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:32:07 GMT)
Causal Multi-Label Feature Selection in Federated Setting [12.6] 3つの新しいサブルーチンを持つフェデレート因果多ラベル特徴選択(FedCMFS)アルゴリズムを提案する。
FedCMFSはまずFedCFLサブルーチンを使用し、ラベルラベル、ラベル機能、機能機能間の相関を考慮し、関連する特徴を学習する。
第二に、FedCMFSはFedCFRサブルーチンを使用して、紛失した真の関連する機能を選択的に回収する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:11:48 GMT)
XB-MAML: Learning Expandable Basis Parameters for Effective
Meta-Learning with Wide Task Coverage [12.4] 本稿では,拡張可能な基底パラメータを学習するXB-MAMLを紹介する。
XB-MAMLは、基底によって広がるベクトル空間と微調整されたパラメータとの相違を観察し、基底を拡張するかどうかを決定する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:37:57 GMT)
A multi-cohort study on prediction of acute brain dysfunction states
using selective state space models [12.0] 急性脳機能障害(ABD)は、その流行と患者の予後に深刻な影響があるため、重要な課題である。
本研究はElectronic Health Records(EHR)データを利用してこれらの問題を解決する。
既存のモデルでは1つの状態(例えば、デリリウムまたはコマ)だけを予測するには少なくとも24時間の観測データが必要である。
ICU滞在中12時間間隔でデリリウム、コマ、死亡、変動を動的に予測することで、既存の文献におけるこれらのギャップを埋める。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:58:11 GMT)
Multi-modal Semantic Understanding with Contrastive Cross-modal Feature
Alignment [11.9] マルチモーダルな特徴アライメントを実現するためのCLIP誘導型コントラスト学習型アーキテクチャを提案する。
我々のモデルはタスク固有の外部知識を使わずに実装が簡単であり、そのため、他のマルチモーダルタスクに容易に移行できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:07:36 GMT)
Car Damage Detection and Patch-to-Patch Self-supervised Image Alignment [11.9] 我々は、カスタム画像上の自動車の損傷を検出するために、Mask R-CNNモデルを実装した。
また,自動制御型Patch-to-Patch SimCLRに基づくアライメント手法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:46:53 GMT)
On Representation Complexity of Model-based and Model-free Reinforcement
Learning [11.8] 回路複雑性の文脈におけるモデルベースおよびモデルフリー強化学習(RL)の表現複雑性について検討した。
理論的には、その基底となる遷移関数と報酬関数が、大きさの一定深さの回路で表現できるような、幅広い種類のMDPが存在することを証明している。
近似誤差に注意を向け、複雑性理論への接続を構築することによって、モデルベースのアルゴリズムが、新しい表現複雑性の観点からモデルフリーアルゴリズムよりも、なぜサンプルの複雑さを楽しむのかというユニークな洞察を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:31:52 GMT)
The CTU Prague Relational Learning Repository [11.8] Prague Repositoryの目的は、マルチリレーショナルデータによる機械学習研究を支援することである。
サーバは、機械学習コミュニティをサポートするために、getMLによって提供される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:09:24 GMT)
Fine-Grained Pillar Feature Encoding Via Spatio-Temporal Virtual Grid
for 3D Object Detection [11.8] Fine-Grained Pillar Feature (FG-PFE)は、LiDARベースの3Dオブジェクト検出器のための新しい符号化アーキテクチャである。
FG-PFEはPointPillar、CenterPoint-Pillar、PillarNetといったベースラインモデルよりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:58:36 GMT)
PMET: Precise Model Editing in a Transformer [11.7] PMETはTransformer Component (TC) の隠蔽状態を同時に最適化するが、FFNの最適化されたTC隠蔽状態のみを用いてFFN重みを正確に更新する。
実験の結果,PMET は COUNTERFACT と zsRE の両方のデータセット上で最先端の性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:35:48 GMT)
DeepSafeMPC: Deep Learning-Based Model Predictive Control for Safe
Multi-Agent Reinforcement Learning [11.4] 安全なマルチエージェント強化学習(DeepSafeMPC)のためのDeep Learning-based Model Predictive Controlと呼ばれる新しい手法を提案する。
DeepSafeMPCの重要な洞察は、環境力学を正確に予測するために、エンタライズされたディープラーニングモデルを活用することである。
Safe Multi-agent MuJoCo 環境を用いて,本手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:17:33 GMT)
Stochastic Extragradient with Random Reshuffling: Improved Convergence
for Variational Inequalities [11.3] 本稿では,3種類のVIPに対してランダムリシャッフル(SEG-RR)を用いたSEGの収束解析を行う。
我々は,SEG-RRが均一な置換サンプリングSEGよりも高速に収束する条件を導出する。
単調な設定では,SEG-RRの解析により,大きなバッチサイズを伴わずに任意の精度で収束が保証される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:35:52 GMT)
Restoring Ancient Ideograph: A Multimodal Multitask Neural Network
Approach [11.3] 本稿では,古文書を復元する新しいマルチモーダルマルチタスク復元モデル(MMRM)を提案する。
文脈理解と、損傷した古代の遺物からの残余の視覚情報を組み合わせることで、損傷した文字を予測し、同時に復元された画像を生成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:57:28 GMT)
DT-DDNN: A Physical Layer Security Attack Detector in 5G RF Domain for
CAVs [11.2] 妨害攻撃は5Gネットワークに重大なリスクをもたらす。
本研究は, CAVネットワークにおけるジャマー検出のための, 深層学習に基づく新しい手法を提案する。
提案手法は, 余剰低妨害電力の96.4%検出率を実現する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:25:14 GMT)
Zero-Shot ECG Classification with Multimodal Learning and Test-time
Clinical Knowledge Enhancement [11.1] マルチモーダルECG表現学習(MERL)は、テキストプロンプトでゼロショットECG分類を行うことができる。
CKEPEアプローチは、外部の専門家が検証した臨床知識データベースを利用するために、LLM(Large Language Models)を使用する。
MERLは、ゼロショット分類における平均75.2%のAUCスコアを(トレーニングデータなしで)達成し、10%の注釈付きトレーニングデータを持つ線形プローブeSSLメソッドよりも3.2%高い。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:28:55 GMT)
Prompt-Driven Building Footprint Extraction in Aerial Images with
Offset-Building Model [11.1] 屋上・オフセット抽出のための高速化可能なフレームワークを提案する。
本フレームワークでは,新しいオフセット構築モデル(OBM)を提案する。
我々のモデルはオフセット誤差を16.6%削減し、他のモデルに比べて10.8%改善した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:54:38 GMT)
On the Consideration of AI Openness: Can Good Intent Be Abused? [11.1] 我々は,200件の韓国の事例に基づいて,200件の質問とそれに対応する犯罪行為の回答からなるデータセットを構築した。
広く受け入れられているオープンソースLLMは、EVEと簡単に調整でき、犯罪活動に関する倫理的かつ情報的回答を提供することができる。
これは、オープンソース技術が科学的進歩に寄与するが、悪意のあるユースケースを緩和するためには注意が必要であることを意味する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:24:06 GMT)
MambaMIL: Enhancing Long Sequence Modeling with Sequence Reordering in
Computational Pathology [10.9] MIL(Multiple Instance Learning)は、WSI(Whole Slide Images)内の識別的特徴表現を計算病理学で抽出する主要なパラダイムとして登場した。
本稿では,線形複雑度を持つ長周期モデリングのために,Selective Scan Space State Sequential Model(Mamba)をMIL(Multiple Instance Learning)に組み込む。
提案するフレームワークは,最先端のMIL手法に対して良好に機能する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:17:25 GMT)
AmodalSynthDrive: A Synthetic Amodal Perception Dataset for Autonomous
Driving [10.9] マルチタスク・マルチモーダル・アモーダル認識データセットであるAmodal SynthDriveを紹介する。
このデータセットは、150のドライブシーケンスに対して、マルチビューカメライメージ、3Dバウンディングボックス、LiDARデータ、およびオドメトリーを提供する。
Amodal SynthDriveは、導入されたアモーダル深度推定を含む複数のアモーダルシーン理解タスクをサポートする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:36:37 GMT)
FAX: Scalable and Differentiable Federated Primitives in JAX [10.8] FAX は JAX ベースのライブラリで,大規模分散処理とフェデレーション処理をサポートするように設計されている。
FAXは、データセンターにおけるフェデレーション計算のための、プログラムが容易で、パフォーマンスが高く、スケーラブルなフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:51:01 GMT)
Efficient Compression of Overparameterized Deep Models through
Low-Dimensional Learning Dynamics [10.7] 本稿ではパラメータ化モデルを用いた新しい圧縮手法を提案する。
本アルゴリズムは, 一般化を損なうことなく, トレーニング効率を2倍以上に向上させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:55:33 GMT)
Quantum Control Machine: The Limits of Control Flow in Quantum
Programming [10.7] 本稿では、量子コンピュータ上で正しく実現可能な制御フローの抽象化特性の完全な評価を行う。
この設計により、開発者は論理ゲートの代わりにプログラムカウンタを使用して量子アルゴリズムの制御フローを正しく表現できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:00:32 GMT)
RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud [10.6] レーダベースのトラッキングに適した革新的なソリューションであるRaTrackを紹介します。
本手法は,動き推定モジュールによって強化された動き分割とクラスタリングに焦点を当てる。
RaTrackは移動物体の追跡精度が優れており、最先端の技術をはるかに上回っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:59:25 GMT)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image
Segmentation [10.6] 本稿では,軽量なフレームワークとして,Mamba と UNet を統合した Lightweight Mamba UNet (LightM-UNet) を紹介する。
特に、LightM-UNetはResidual Vision Mamba Layerを純粋なMamba方式で利用し、深い意味的特徴を抽出し、長距離空間依存をモデル化する。
2つの実世界の2D/3Dデータセットで実施された実験は、LightM-UNetが既存の最先端の文献を上回っていることを示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:14:36 GMT)
Worst-Case Optimal Multi-Armed Gaussian Best Arm Identification with a
Fixed Budget [10.5] 本研究は、腕を最も期待できる結果に識別する実験的な設計問題について検討する。
分散が知られているという仮定のもと、一般化ネマン割当(GNA)-経験的ベストアーム(EBA)戦略を提案する。
GNA-EBA戦略は、誤同定の確率が下界と一致するという意味で無限に最適であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:56:02 GMT)
Hybrid Human-LLM Corpus Construction and LLM Evaluation for Rare
Linguistic Phenomena [10.5] 我々は,NLPによる注釈付きテキストの新しいパイプラインを開発した。
アノテーションのコストを大幅に削減するために,依存性解析と GPT-3.5 をどのように利用できるかを示す。
GPT, Gemini, Llama2 および Mistral のモデルを用いて, 起因運動構成の理解について検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:47:47 GMT)
Deep adaptative spectral zoom for improved remote heart rate estimation [10.2] Chirp-Z Transform (CZT) は、心拍数に対する狭帯域の利息の範囲までスペクトルを洗練させ、頻繁な分解能を改善し、その結果より正確な推定を可能にする。
本稿では、リモートHR推定にCZTを用いる利点を示し、新しいデータ駆動適応型CZT推定器を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:55:19 GMT)
ACFIX: Guiding LLMs with Mined Common RBAC Practices for Context-Aware
Repair of Access Control Vulnerabilities in Smart Contracts [10.1] ACFIXは、スマートコントラクトにおけるAC脆弱性の自動的かつ適切な修復のための新しいアプローチである。
私たちは、コード機能の主要なカテゴリで一般的なACプラクティスを抽出し、同様の機能でコードを修正するのにLLMをガイドするためにそれを使用します。
ACFIXを評価するために、118個の実世界のAC脆弱性のベンチマークデータセットを構築し、ACFIXが94.92%の修正に成功したことを明らかにした。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:59:59 GMT)
Which Models have Perceptually-Aligned Gradients? An Explanation via
Off-Manifold Robustness [9.9] 知覚的に整列した勾配(PAG)は、堅牢なコンピュータビジョンモデルに初歩的な生成能力をもたらす。
このことは、モデルがオンマンフォールドであるよりも、データ多様体よりもロバストでなければならないことを述べています。
我々は、知覚的アライメントとモデル精度の両方に影響を与える3つの異なるロバスト性(弱ロバスト性、ベイズ整合ロバスト性、過剰ロバスト性)を識別する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:48:37 GMT)
KELLMRec: Knowledge-Enhanced Large Language Models for Recommendation [9.9] セマンティック情報の利用はレコメンデーターシステム分野における重要な研究課題である。
LLMの台頭に伴い、知識基盤として機能する能力と推論能力は、この研究領域に新たな可能性をもたらしている。
これに対応するための有望な方法は、外部知識を使用して、真実で使用可能なテキストを生成するLLMを支援することである。
提案手法は,プロンプトにおける外部知識の使用に加えて,学習のための知識に基づくコントラスト学習スキームも含んでいる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:04:20 GMT)
Bayesian Differentiable Physics for Cloth Digitalization [9.8] 布のデジタル化のための新しい手法を提案する。
まず,布の正確な測定を行う新しいデータセットを提案する。
小型データから学習するために,新しいベイズ微分可能な布モデルを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:55:34 GMT)
Refining Segmentation On-the-Fly: An Interactive Framework for Point
Cloud Semantic Segmentation [9.8] ポイントクラウドセマンティックセマンティックセグメンテーションのための最初の対話型フレームワークであるInterPCSegを提示する。
本研究では,対話型ポイントクラウドセマンティックセマンティックセグメンテーションタスクに適したインタラクションシミュレーション手法を開発した。
市販セグメンテーションネットワークを用いたS3DISおよびScanNetデータセットのフレームワークの評価を行った。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:24:58 GMT)
Overcoming the Paradox of Certified Training with Gaussian Smoothing [9.6] 敵の例に対して高い精度でニューラルネットワークを訓練することは、未解決の問題である。
本研究では,滑らかな損失の勾配を計算するアルゴリズムPGPEと,凸緩和を併用した認定トレーニング手法を提案する。
このトレーニング手法を使用すると、より厳密な境界が、同じネットワーク上で最先端の手法を上回り得る、厳密なネットワークにつながることが分かる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:44:36 GMT)
Real is not True: Backdoor Attacks Against Deepfake Detection [9.6] 本稿では,Bad-Deepfake(Bad-Deepfake)と命名された先駆的パラダイムを導入する。
我々のアプローチはトレーニングデータのサブセットを戦略的に操作することで、トレーニングされたモデルの運用特性に対する不均等な影響を軽減します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:57:14 GMT)
Don't Forget What I did?: Assessing Client Contributions in Federated
Learning [9.6] Federated Learning(FL)は、複数のクライアントがプライベートデータを公開せずにMLモデルをトレーニングする、コラボレーティブ機械学習(ML)アプローチである。
本研究では,FLContrib と呼ばれる歴史を意識したゲーム理論フレームワークを提案し,クライアントのサブセットがFLトレーニングの各時期に参加する際にクライアントのコントリビューションを評価する。
FLContribを用いて、FLトレーニングにおいてデータ中毒を行う不適切なクライアントを検出する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:39:32 GMT)
Say Anything with Any Style [9.5] Anything withAny Styleは、学習したスタイルのコードブックで生成モデルを介して、個別のスタイル表現をクエリします。
提案手法は, リップ同期とスタイル表現の両方の観点から, 最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:20:03 GMT)
Analyzing Fairness in Deepfake Detection With Massively Annotated
Databases [9.4] パブリックなDeepfakeデータセットにおいてバイアス検出を引き起こす要因について検討する。
一般的な5つのDeepfakeデータセットに対して、47の異なる属性を持つ大規模な人口統計学的および非デコグラフィ的アノテーションを作成します。
我々は、これらのデータセット上の3つの最先端のDeepfake検出バックボーンモデルのAIバイアスの原因となる属性を分析する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:17:36 GMT)
RSBA: Robust Statistical Backdoor Attack under Privilege-Constrained
Scenarios [9.4] 学習ベースのシステムは、バックドア攻撃に弱いことが示されている。
本稿では,RSBA(Robust Statistical Backdoor Attack under Privilege-Constrained scenarios)を紹介する。
RSBAの画像増倍とモデル蒸留に対するロバスト性を実験的に理論的に実証した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:14:40 GMT)
RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for
Program Repair [9.4] 本稿では,APRのコード表現と,LoRAと呼ばれるパラメータ効率の高いLLM微調整技術を組み合わせたプログラム修復手法を提案する。
この結果、LLaMAは言語モデルでバグを修正するのに非常に効果的なプログラム修復アダプタを作成した。
全体として、Re repairLLaMAは125のDefects4J v2と82のHumanEval-Javaバグを正しく修正し、すべてのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:31:19 GMT)
Is the effective potential, effective for dynamics? [9.3] エネルギーの保存は、動的進化から非常に励起され、絡み合った定常状態が出現する。
その結果, 次数パラメータとエネルギー密度の平衡状態の新たな評価法が示唆された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:19:06 GMT)
MEND: Meta dEmonstratioN Distillation for Efficient and Effective
In-Context Learning [9.3] 大規模言語モデル(LLM)は、与えられたテスト入力と少数のインプット・アウトプットペア(デモ)を同時に予測する。
既存の解は、長い実演をコンパクトなベクトルに蒸留しようとする。
本稿では,メタdEmonstratioN蒸留(MEND)について述べる。そこでは,言語モデルが,新しい下流タスクを再学習することなく,任意の長い実演をベクトルに蒸留することを学ぶ。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:03:04 GMT)
FFAD: A Novel Metric for Assessing Generated Time Series Data Utilizing
Fourier Transform and Auto-encoder [9.1] Fr'echet Inception Distance (FID) は画像合成における生成モデルを評価する標準的な指標である。
本研究は,Fr'echet Fourier-transform Auto-Encoder Distance (FFAD) と呼ばれるフーリエ変換とオートエンコーダを利用した新しい解を提案する。
実験結果から,異なるクラスから標本を効果的に識別するFFADの可能性を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:26:04 GMT)
A Bayesian Learning Algorithm for Unknown Zero-sum Stochastic Games with
an Arbitrary Opponent [9.1] ゼロサムゲームのための後サンプリング強化学習(PSRL-ZSG)
ゼロサムゲームのための後サンプリング強化学習(PSRL-ZSG)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:06:17 GMT)
Dynamic Perturbation-Adaptive Adversarial Training on Medical Image
Classification [9.0] 敵の例(AE)は生データと知覚不可能な類似性を示し、ネットワークの堅牢性に対する深刻な懸念を提起した。
本稿では,ATを動的学習環境に配置し,適応型データレベルの摂動を生成する動的摂動適応対向訓練(DPAAT)手法を提案する。
HAM10000データセットの総合的な試験により、DPAATはより堅牢性の向上と一般化保存を達成できただけでなく、平均精度と解釈可能性を大幅に向上した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:16:20 GMT)
Fast Minimization of Expected Logarithmic Loss via Stochastic Dual
Averaging [9.0] 本稿では,対数障壁を用いたB$-sample双対平均化法を提案する。
Poisson逆問題に対して、我々のアルゴリズムは$smashtildeO(d3/varepsilon2)$ timeで$varepsilon$解を得る。
量子状態トモグラフィーの最大線量推定を計算するとき、我々のアルゴリズムは $smashtildeO(d3/varepsilon2)$ time で $varepsilon$-optimal Solution を得る。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:44:54 GMT)
SPLADE-v3: New baselines for SPLADE [9.0] SPLADE-v3はBM25やSPLADE++よりも統計的にはるかに効果的である。
MS MARCO 開発セットでは 40 MRR@10 を超え、BEIR ベンチマークでは 2% 改善されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:04:55 GMT)
Transformer-based Fusion of 2D-pose and Spatio-temporal Embeddings for
Distracted Driver Action Recognition [8.8] 運転行動の時間的局所化は、先進的な運転支援システムと自然主義運転研究にとって重要である。
本研究では,映像行動認識と2次元人文推定ネットワークを1つのモデルに適用することにより,時間的局所化と分類精度の向上を目指す。
このモデルは、2023年のNVIDIA AI City ChallengeというA2テストセットで、自然な運転行動認識のためにうまく機能する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:26:38 GMT)
Detection of Object Throwing Behavior in Surveillance Videos [8.8] 本稿では,ディープラーニングを用いた監視ビデオにおける投球行動検出手法を提案する。
Smart Cityプロジェクトのユースケースに対処するために、私たちはまず、新しいパブリックな"Throwing Action"データセットを生成します。
UCF-CrimeおよびThrowing-Actionデータセットにおける異常検出のための特徴抽出器の性能の比較を行った。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:53:19 GMT)
Density-Guided Label Smoothing for Temporal Localization of Driving
Actions [8.8] 我々は,映像行動認識ネットワークを効率的に活用することで,全体的な性能向上に重点を置いている。
映像セグメントからの情報と複数のカメラビューをシーンレベルの予測に効率的に融合する処理後ステップを設計する。
提案手法は,2022年のNVIDIA AI City Challengeにおける自然主義駆動行動認識トラックのA2テストセットにおいて,F1スコア0.271の競合性能を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:06:41 GMT)
Cost-Sensitive Learning to Defer to Multiple Experts with Workload
Constraints [8.7] 遅延の学習は人間とAIのコラボレーションシステムを改善することを目的としている。
L2Dの既存の研究は、実際の導入を妨げる現実世界のシステムの主要な側面を見落としている。
コストとキャパシティ制約の枠組み(DeCCaF)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:57:20 GMT)
DeepSec: Deciding Equivalence Properties for Security Protocols -- Improved theory and practice [8.7] 我々はこの検証問題の理論と実践に貢献する。
静的同値、トレース同値およびラベル付き二相性のための新しい複雑性結果を確立する。
我々の手順は、多種多様な暗号プリミティブに対して、トレース同値とラベル付き二相性を決定する最初の方法である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:06:10 GMT)
oneDNN Graph Compiler: A Hybrid Approach for High-Performance Deep
Learning Compilation [8.6] oneDNN Graph Compilerは、コンパイラ最適化とエキスパートチューニングされたカーネルの両方のテクニックをハイパフォーマンスコード生成に使用するためのハイブリッドアプローチを採用している。
実験結果から,既存のテンソルコンパイラやプリミティブライブラリよりも高い性能を示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:10:17 GMT)
Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How [8.3] 本稿では,第52条の開示義務に基づく重要な質問を導出するための参加的アプローチを提案する。
参加者が第52条の関連する条項を5W1Hフレームワークを用いて分解するワークショップを2回実施する。
我々は5つのテーマと18のサブテーマにまとめられた149の質問をコントリビュートする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:40:36 GMT)
Asset-driven Threat Modeling for AI-based Systems [7.8] 本研究の目的は、医療領域で設計されたAIシステムの脅威モデルを作成することである。
ソリューションのユーザビリティは良好に評価され,脅威識別に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:40:01 GMT)
Hypothesis Spaces for Deep Learning [7.7] 本稿では,ディープニューラルネットワーク(DNN)を用いた深層学習のための仮説空間を提案する。
DNNを2つの変数の関数として扱うことにより、DNNの所定の深さと幅によって決定される重み行列とバイアスのセットに位置するパラメータ変数に対するDNNの原始集合を考える。
このように構成されたバナッハ空間は、バナッハ空間(RKBS)を再現したカーネルであり、その再現されたカーネルを構築することを証明する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:37:42 GMT)
Explainable Transformer Prototypes for Medical Diagnoses [7.7] 変圧器の自己注意機能は、分類過程において重要な領域を特定することに寄与する。
我々の研究は、「ピクセル」ではなく「領域」間の相関を裏付けるユニークな注意ブロックを革新する試みである。
大規模なNIH胸部X線データセットにおいて, 定量的, 定性的手法を併用し, 提案手法の有効性を実証した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:46:21 GMT)
Smart-Infinity: Fast Large Language Model Training using Near-Storage
Processing on a Real System [7.6] Smart-Infinityは、実際のシステム上でPyTorchに完全に統合された、使いやすいアプローチである。
本稿では,スマートインフィニティのスケーラビリティを高めるために,加速器による勾配圧縮/圧縮を提案する。
注目すべきなのは、Smart-Infinityは、実際のシステム上でPyTorchに完全に統合された、使いやすいアプローチであることだ。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:32:14 GMT)
Faithful and Efficient Explanations for Neural Networks via Neural
Tangent Kernel Surrogate Models [7.6] 我々は、データ属性の近似的経験的ニューラルネットワークカーネル(eNTK)を解析する。
そこで本研究では,時間とメモリの複雑さを調整可能な,近似eNTKの2つの新しいランダムプロジェクションモデルを提案する。
ニューラルネットワークカーネルをカーネル関数として用いたカーネルマシンは,効率的なサロゲートモデルである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:45:30 GMT)
A Survey of Learned Indexes for the Multi-dimensional Space [7.6] 本調査は学習した多次元インデックス構造に焦点を当てる。
本稿では,各学習した多次元指標を分類・分類する分類法を提案する。
我々は、この新興かつ活発な分野における、いくつかのオープンな課題と今後の研究方向性を強調します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:32:32 GMT)
Sj$\ddot{\text{o}}$qvist quantum geometric tensor of finite-temperature
mixed states [7.5] 量子幾何テンソル(QGT)は、量子状態の局所的な幾何学的性質と関連する位相情報を明らかにする。
我々は、Sj$ddottexto$qvist距離に基づいて、QGTを有限温度で混合量子状態に一般化する。
ピタゴラスのような関係は距離とゲージ変換を結び、平行輸送条件の役割を明らかにする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:31:49 GMT)
Generalising Multi-Agent Cooperation through Task-Agnostic Communication [7.4] 協調型マルチロボット問題におけるMARL(Multi-agent reinforcement learning)の既存のコミュニケーション手法はほとんどタスク固有であり、各タスクごとに新しいコミュニケーション戦略を訓練する。
与えられた環境内の任意のタスクに適用可能な通信戦略を導入することで、この非効率性に対処する。
我々の目的は、可変数のエージェント観測から固定サイズの潜在マルコフ状態を学ぶことである。
本手法は,コミュニケーション戦略を微調整することなく,新しいタスクへのシームレスな適応が可能であり,トレーニング中よりも多くのエージェントへのスケーリングを優雅にサポートし,環境におけるアウト・オブ・ディストリビューションイベントを検出する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:20:13 GMT)
BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.4] DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:49:06 GMT)
Early Exploration of a Flexible Framework for Efficient Quantum Linear
Solvers in Power Systems [7.3] 我々は,電力システムアプリケーションとQiskitで利用可能な量子線形解器のギャップを埋める,NWQSimを利用した多用途フレームワークを提案する。
革新的なゲート融合戦略,回路深度低減,GPUアクセラレーションにより,シミュレータは資源効率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:00:36 GMT)
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization [7.3] ポストトレーニング量子化(PTQ)は、大規模なニューラルネットワークを圧縮するための実践的なアプローチとして登場した。
本稿では,階層的再構成誤りの座標最小化を逐次行う,COMQと呼ばれる革新的なPTQアルゴリズムを提案する。
COMQは、4ビットビジョン変換器を量子化し、Top-1の精度で1%未満の損失を負う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:04:03 GMT)
Robustness, Efficiency, or Privacy: Pick Two in Machine Learning [7.3] 本稿では,分散機械学習アーキテクチャにおけるプライバシとロバスト性の実現に伴うコストについて検討する。
従来のノイズ注入は、汚染された入力を隠蔽することで精度を損なうが、暗号手法は、非直線性のため、防毒と衝突する。
我々は、より弱い脅威モデルを考慮して、この妥協を効率よく解決することを目的とした今後の研究の方向性を概説する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:06:37 GMT)
Optimizing Latent Graph Representations of Surgical Scenes for Zero-Shot
Domain Transfer [6.9] ドメイン一般化のための4つのオブジェクト中心のアプローチを評価し、ベースライン性能を確立する。
本稿では, 領域一般化のための最適化手法LG-DGを開発した。
最適化されたLG-DGは、最高のベースラインアプローチよりも9.28%向上した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:36:11 GMT)
Navigating Text-To-Image Customization: From LyCORIS Fine-Tuning to
Model Evaluation [6.7] 本稿では,安定拡散のための微調整手法を幅広く選択したオープンソースライブラリLyCORISを紹介する。
また,各種微調整技術の体系的評価のための枠組みも提示する。
我々の研究は、最先端の研究と実践的応用のギャップを埋める、微調整パラメータのニュアンスド効果に関する重要な洞察を提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:39:33 GMT)
Koopman Ensembles for Probabilistic Time Series Forecasting [6.7] 独立に訓練されたモデルのアンサンブルは極めて過信であり、メンバーに高いモデル間分散による予測を明示的に促す訓練基準を用いることで、アンサンブルの不確実性を大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:29:56 GMT)
PeerAiD: Improving Adversarial Distillation from a Specialized Peer
Tutor [6.7] ニューラルネットワークの敵対的堅牢性は、セキュリティクリティカルなドメインに適用される際の重要な関心事である。
従来の研究は教師ネットワークを事前訓練し、それ自身が目指す敵の例に頑丈にしている。
本稿では,PierAiDを提案することで,ピアネットワークが学生ネットワークの対角的な例を学習できるようにする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:36:14 GMT)
Forest Inspection Dataset for Aerial Semantic Segmentation and Depth
Estimation [6.6] 森林調査のための大規模航空データセットを新たに導入する。
現実世界と仮想的な自然環境の記録も含んでいる。
地域の森林破壊度を評価するための枠組みを開発する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:26:44 GMT)
Evaluating the Energy Efficiency of Few-Shot Learning for Object
Detection in Industrial Settings [6.6] 本稿では、下流タスクに標準オブジェクト検出モデルを適用するための微調整手法を提案する。
開発モデルにおけるエネルギー需要のケーススタディと評価について述べる。
最後に、このトレードオフを、カスタマイズされた効率係数測定によって定量化する新しい方法を紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:41:30 GMT)
QLABGrad: a Hyperparameter-Free and Convergence-Guaranteed Scheme for
Deep Learning [6.6] QLABGradと呼ばれる新しい学習率適応方式を提案する。
QLABGradは、所定の勾配降下方向に対して、Quadratic Loss Approximation-Based (QLAB)関数を最適化することにより、学習率を自動的に決定する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:11:40 GMT)
Navigating the Post-API Dilemma Search Engine Results Pages Present a
Biased View of Social Media Data [6.5] ソーシャルメディアAPIへのアクセスを中止するという最近の決定は、インターネット研究に有害な影響を及ぼしている。
このデータへのアクセスの欠如は、インターネット研究のポストAPI時代と呼ばれる。
幸いなことに、人気のある検索エンジンは、適切な検索クエリを提供すると、検索結果ページ(SERP)でソーシャルメディアデータをクロール、キャプチャ、サーフェスする手段を持っている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:37:36 GMT)
3D-aware Image Generation and Editing with Multi-modal Conditions [6.4] 1つの2Dセマンティックラベルから3D一貫性のある画像を生成することは、コンピュータグラフィックスとコンピュータビジョンにおいて重要かつ困難な研究トピックである。
複数種類の条件入力を組み込んだ新しい3D画像生成・編集モデルを提案する。
提案手法は,異なるノイズを持つ多様な画像を生成し,テキスト記述を通じて属性を編集し,参照RGB画像を与えることでスタイル転送を行う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:10:37 GMT)
Shortcut Learning in Medical Image Segmentation [6.4] ショートカット学習(英: Shortcut learning)とは、機械学習モデルが、トレーニングセットを超えて一般化されていないデータから、単純な、潜在的に誤解を招く可能性のある学習キューを優先する現象である。
キャリパーやゼロパッドド・コンボリューションとセンタークロッピード・トレーニング・セットの組み合わせは必然的にショートカットとして機能することを示した。
2つの異なる医用画像分割作業において,ショートカット学習を識別し,評価する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:14:52 GMT)
On the Limited Representational Power of Value Functions and its Links
to Statistical (In)Efficiency [6.4] 遷移力学に関する情報は、値関数の空間で表現することは不可能かもしれない。
より深い調査は、表現力の限界が非効率性のドライバであることを示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:05:48 GMT)
Vosh: Voxel-Mesh Hybrid Representation for Real-Time View Synthesis [6.2] 本稿では、ビュー合成のためのハイブリッドレンダリングにおいて、ボクセルとメッシュの両方のコンポーネントをシームレスに組み合わせたVoshというハイブリッド表現を提案する。
Voshはメッシュコンポーネントを通じて単純な幾何学とテクスチャを備えた高速なレンダリングシーンに優れており、同時にvoxelコンポーネントを活用することで複雑な領域における高品質なレンダリングを可能にしている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:28:51 GMT)
STARFlow: Spatial Temporal Feature Re-embedding with Attentive Learning
for Real-world Scene Flow [6.2] 両ユークリッド空間における全点対に一致する大域的注意流埋め込みを提案する。
我々は、新しいドメイン適応損失を利用して、合成から実世界への動き推論のギャップを埋める。
提案手法は,実世界のLiDARスキャンデータセットにおいて特に顕著な結果を得て,各種データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:56:10 GMT)
In-context Exploration-Exploitation for Reinforcement Learning [6.1] In-context Exploration-Exploitation (ICEE)アルゴリズムを導入する。
ICEEは、明確なベイズ推論を必要とせず、Transformerモデル内で推論時に探索・探索のトレードオフを実行する。
ICEEは数十エピソードのみを用いて新しいRL課題の解法を学習できることを示し、従来の文脈内学習法で必要とされる数百エピソードよりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:43:14 GMT)
Naming, Describing, and Quantifying Visual Objects in Humans and LLMs [6.1] 視覚・言語大言語モデル(VLLM)を3つのカテゴリ(名詞・属性・量化子)で評価する。
以上の結果から,VLLMsがヒトの命名嗜好を捉える能力を示す証拠が混在していることが判明した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:20:12 GMT)
LIBR+: Improving Intraoperative Liver Registration by Learning the
Residual of Biomechanics-Based Deformable Registration [6.0] 線形弾性バイオメカニクスに基づく線形化反復境界再構成(LIBR)手法を利用した新しいテクスタイブリッド登録手法を提案する。
また,二分岐スプライン残差グラフ畳み込みニューラルネットワーク(SR-GCN)を定式化し,スパースおよび可変術中測定からの情報の同化を行う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:54:44 GMT)
Gravitational back-reaction is the Holographic Dual of Magic [6.0] 量子多体系における魔法と絡み合いの相互作用を研究する。
量子相関によって支えられる非局所魔法は、絡み合いスペクトルの平坦さによって下界される。
非局所魔法は、バルク内の宇宙ブレーンの張力の変化に応じて、最小表面積の変化率とほぼ等しいことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:00:03 GMT)
Active learning with biased non-response to label requests [5.9] ラベル要求に対する非応答は、実世界の文脈におけるアクティブラーニングの有効性に影響を与える可能性がある。
データに含まれる非応答の種類を考慮し、この分解を概念化する。
本稿では, 偏りのない応答の影響を軽減するため, サンプリング戦略に対するコストベースの補正を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:43:47 GMT)
Leveraging graph neural networks for supporting Automatic Triage of
Patients [5.9] 本稿では,救急部門における緊急コード割り当てを管理するためのAIベースのモジュールを提案する。
バイタルサイン、症状、医療史などの関連する患者情報を含むデータは、患者をトリアージカテゴリーに正確に分類するために使用される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:54:35 GMT)
Temporal-Mapping Photography for Event Cameras [5.8] イベントカメラは、従来の強度フレームではなく、連続したイベントストリームとして明るさの変化をキャプチャする。
我々は静的な場面で静止イベントカメラを用いて高密度画像変換を行う。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:29:46 GMT)
SCENEREPLICA: Benchmarking Real-World Robot Manipulation by Creating
Replicable Scenes [5.8] 実世界におけるロボット操作の評価のための再現可能な新しいベンチマークを提案し,特にピック・アンド・プレイスに着目した。
我々のベンチマークでは、ロボットコミュニティでよく使われているデータセットであるYCBオブジェクトを使用して、結果が他の研究と比較されるようにしています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:20:07 GMT)
Analyzing domain shift when using additional data for the MICCAI KiTS23
Challenge [5.7] トレーニング中のドメインシフトを改善する手法について検討し、前処理やトレーニングに利用できる追加データを元のデータと併用する方法について検討する。
以上の結果から,ヒストグラムマッチングによる追加データの変換は,単純な正規化よりも良好な結果が得られた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:31:09 GMT)
What makes an image realistic? [5.7] 非現実的なデータから現実的なデータを確実に検出できる関数を設計する、リアリズムの定量化の問題について議論する。
この問題がなぜ難しいのか、なぜ優れた生成モデルだけで解決できないのか、そして良い解決策がどのようなものかについて議論する。
我々は、敵の批判者と異なり、敵の訓練を必要としない普遍的な批判の概念を導入する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:01:43 GMT)
FedCompass: Efficient Cross-Silo Federated Learning on Heterogeneous
Client Devices using a Computing Power Aware Scheduler [5.6] クロスサイロフェデレーション学習は、ローカルデータセットのプライバシを損なうことなく、AIモデルを協調的にトレーニングする、有望なソリューションを提供する。
本稿では,サーバ側で計算パワースケジューラを組み込んだ,半同期型フェデレーション学習アルゴリズムを提案する。
上位クライアントでフェデレート学習を行う場合,Fedは他のアルゴリズムよりも高速な収束と精度を実現することを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:28:15 GMT)
Reconstructing Visual Stimulus Images from EEG Signals Based on Deep
Visual Representation Model [5.5] 本稿では,脳波信号に基づく新しい画像再構成手法を提案する。
高速スイッチング方式で視覚刺激画像の高認識性を実現するため,視覚刺激画像データセットを構築した。
主エンコーダと従属デコーダからなる深部視覚表現モデル(DVRM)を提案し,視覚刺激を再構成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:19:09 GMT)
Advancing Text-Driven Chest X-Ray Generation with Policy-Based
Reinforcement Learning [5.5] 我々は、強化学習(RL)の可能性に動機付けられたフレームワークであるCXRLを提案する。
我々のフレームワークは、学習可能な適応条件埋め込み(ACE)と画像生成器を併用して最適化する。
我々のCXRLは、病理学的に現実的なCXRを生成し、CXRを生成するための新しい標準を確立する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:43:57 GMT)
Distributional Reinforcement Learning with Online Risk-awareness
Adaption [5.4] オンラインリスク適応型分散RL(DRL-ORA)を新たに導入する。
DRL-ORAは、オンラインの総変動最小化問題を解くことにより、てんかんのリスクレベルを動的に選択する。
DRL-ORAは、固定リスクレベルまたは手動で決められたリスクレベルに依存する既存の手法よりも優れている、複数のタスクのクラスを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:36:19 GMT)
Bigraph Matching Weighted with Learnt Incentive Function for Multi-Robot
Task Allocation [5.2] 本稿では,マルチロボットタスクアロケーションに対する二部グラフマッチング手法の堅牢性やインセンティブを学習するためのグラフ強化学習フレームワークを開発する。
GRL誘導インセンティブを付加したこの新しい複グラフマッチング手法の性能は,元の複グラフマッチング手法と同等であることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:55:08 GMT)
Finite-Time Error Analysis of Soft Q-Learning: Switching System Approach [5.2] ソフトQラーニングは、エントロピー正規化マルコフ決定問題を解くために設計されたQラーニングのバリエーションである。
本稿では,ソフトQ-ラーニングアルゴリズムの有限時間制御理論解析を新規かつ統一的に提供することを目的とする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:36:37 GMT)
Machine learning reveals features of spinon Fermi surface [5.1] サンプリングされた射影スナップショットの量子-古典ハイブリッドアプローチ(QuCl)が、一見特徴のない量子状態のシグネチャを提示できることを示す。
我々は、ラベル付き射影スナップショットに基づいて訓練された相関子畳み込みニューラルネットワークを用いて、位相のシグネチャを識別する正規化パス解析を行う。
また、場の方向と直交するスピンチャネルにおけるIGPのシグネチャを同定し、このシグネチャをフェルミ面を形成する無隙間スピノンのフリーデル振動のシグネチャと解釈した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:46:57 GMT)
Advancing Graph Neural Networks with HL-HGAT: A Hodge-Laplacian and
Attention Mechanism Approach for Heterogeneous Graph-Structured Data [5.0] 本研究は, ノード, エッジ, 三角形, および$k$-simplicesを包含する, グラフを単体複体として考えることによって, 新たな視点を導入する。
我々の貢献はHodge-Laplacian heterogeneous graph attention network (HL-HGAT) であり、$k$-simplicesで不均一な信号表現を学習するために設計されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:04:21 GMT)
Style2Talker: High-Resolution Talking Head Generation with Emotion Style
and Art Style [5.0] 本稿では,Style2Talkerという,革新的な音声駆動音声生成手法を提案する。
Style-EとStyle-Aという2つのスタイル化ステージがあり、テキストコントロールされた感情スタイルと絵コントロールされたアートスタイルを最終出力に統合する。
本手法は、感情スタイルと芸術スタイルの両方のオーディオ-リップ同期とパフォーマンスの観点から、既存の最先端手法よりも優れています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:32:29 GMT)
FlowVQTalker: High-Quality Emotional Talking Face Generation through
Normalizing Flow and Quantization [5.0] 本稿では,正規化フローとベクトル量子化モデルを用いて感情的な発話顔を生成することを提案する。
具体的には、顔の感情のダイナミクスを多感情階級の潜在空間にエンコードするフローベース係数生成器を開発する。
設計したベクトル量子化画像生成器は、コードクエリータスクとして表現力のある顔画像を作成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:58:04 GMT)
Simulation-Based Segmentation of Blood Vessels in Cerebral 3D OCTA
Images [4.9] 本稿では,セグメンテーションアルゴリズムの監督に合成データを活用することを提案する。
血管グラフから合成脳3D OCTA画像へのパッチの変換を行った。
大規模な実験では,本手法が競争結果の達成を実証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:14:51 GMT)
Directional Optimism for Safe Linear Bandits [4.8] 安全線形バンドイット問題は、学習者の行動が全てのラウンドにおいて不確実な制約を満たす必要がある古典線形バンドイット問題のバージョンである。
我々は、よく分離された問題インスタンスと有限の星凸集合であるアクションセットの両方に対して、改善された後悔の保証を達成することができることを発見した。
最後に、制約が凸である安全な線形帯域設定の一般化を導入し、新しい凸解析に基づくアプローチを用いてアルゴリズムと解析をこの設定に適応させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:32:33 GMT)
Improving generalisation via anchor multivariate analysis [4.8] そこで我々は,ORD(out-of-distribution)一般化を改善するために,因果正則化拡張をアンカー回帰(AR)に導入した。
分散シフトに対してロバスト性を確保するために、アンカーフレームワークと整合して、アンカー互換の損失を提示する。
単純な正規化はOOD設定の堅牢性を高めることを観察する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:11:51 GMT)
Out-of-Distribution Detection by Leveraging Between-Layer Transformation
Smoothness [4.7] 本稿では,ネットワークの中間層間の変換スムーズ性に基づくトランスフォーマー内のOODデータ検出手法を提案する。
トランスフォーマーネットワークを用いた複数のテキスト分類タスクにおけるBLOODの評価を行い、これと同等のリソース要求でメソッドを性能良くすることを示した。
我々の分析は、単純なタスクを学習するとき、OODデータ変換は元のシャープネスを維持し、一方、より複雑なタスクではシャープネスが増加することを示唆している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:18:41 GMT)
NLP4RE Tools: Classification, Overview, and Management [4.7] ツールは、要求工学(NLP4RE)研究のための自然言語処理に不可欠な貢献である。
まず、NLP4REツールの体系的な分類を導入し、それらのタイプや特性の理解を改善する。
既存のツールの再利用と進化を容易にするため、2019年4月から2023年6月までに発行された126のNLP4REツールを体系的にまとめて、既存の概要を拡張した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:01:57 GMT)
DistALANER: Distantly Supervised Active Learning Augmented Named Entity
Recognition in the Open Source Software Ecosystem [4.7] 本稿では,オープンソースソフトウェアシステムに適したエンティティ認識(NER)技術を提案する。
提案手法は,2段階の遠隔教師付きアノテーションプロセスを用いて,注釈付きソフトウェアデータの不足に対処することを目的としている。
我々のモデルは最先端のLLMよりもかなり優れています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:11:08 GMT)
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.7] 本稿では,新しいインスタンス識別手法と適応型損失関数を用いたフレームワークであるLeOCLRを紹介する。
我々のアプローチは、ベースラインモデルと比較して、異なるデータセット間の表現学習を一貫して改善します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:33:32 GMT)
Real-Time Multimodal Cognitive Assistant for Emergency Medical Services [4.7] 本稿では,エンド・ツー・エンドのウェアラブル認知アシスタントシステムであるCognitiveEMSを提案する。
緊急現場からのマルチモーダルデータのリアルタイム取得と分析に協力的な仮想パートナーとして機能する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:56:57 GMT)
SiLVR: Scalable Lidar-Visual Reconstruction with Neural Radiance Fields
for Robotic Inspection [4.6] 本稿では,ライダーと視覚データを融合して高品質な再構築を行う,ニューラルネットワークに基づく大規模再構築システムを提案する。
実時間ライダーSLAMシステムからの軌道を利用してStructure-from-Motion (SfM) 手順をブートストラップする。
サブマッピングを用いて、長い軌道上で捕獲された大規模環境にシステムをスケールする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:31:25 GMT)
Streamlining in the Riemannian Realm: Efficient Riemannian Optimization
with Loopless Variance Reduction [4.6] 本研究はユークリッドとリーマンの設定の両方で用いられる決定的な還元機構に焦点を当てる。
ユークリッド法により動機付け, コインフリップによって引き起こされる計算で外ループを置換するR法を導入する。
フレームワークとしてR-を用いることで、様々な重要な設定に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:49:37 GMT)
Visual CPG-RL: Learning Central Pattern Generators for Visually-Guided
Quadruped Locomotion [4.6] 視覚的に誘導された四足歩行を学習するための枠組みを提案する。
奥深い強化学習フレームワークに、外感知覚と中央パターン生成装置を統合する。
以上の結果から, CPG, 明示的インターオシレータ結合, メモリ対応ポリシ表現はエネルギー効率に有益であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:49:16 GMT)
Mitigating Biases in Collective Decision-Making: Enhancing Performance in the Face of Fake News [4.4] これらのバイアスが偽ニュースの広範的問題に与える影響を、偽ニュースの見出しを識別する人間の能力を評価することによって検討する。
センシティブな特徴を含む見出しに焦点を合わせることで、人間の反応がバイアスによってどのように形作られるかを探るため、包括的なデータセットを集めます。
人口統計学的要因,見出しカテゴリー,情報の提示方法が人的判断の誤りに大きく影響していることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:08:08 GMT)
Tactical Decision Making for Autonomous Trucks by Deep Reinforcement
Learning with Total Cost of Operation Based Reward [4.4] 自律トラックにおける戦術的意思決定のための深層強化学習フレームワークを開発した。
以上の結果から,ハイレベル意思決定プロセスと低レベル制御動作の分離が有用であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:58:42 GMT)
A Hybrid Intelligence Method for Argument Mining [4.3] 我々は、意見テキストから議論を抽出するハイブリッド(人間+AI)手法であるHyEnAを提案する。
市民フィードバックコーパスを用いたHyEnAの評価を行った。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:15:27 GMT)
Unprotected 4G/5G Control Procedures at Low Layers Considered Dangerous [4.2] セルラー標準の複雑さと高い層間操作の複雑さについて検討する。
現在の細胞系は情報漏洩による新たな受動的攻撃の影響を受けやすいことが判明した。
UEでRFフロントエンドを無効にすることで、ユーザのスループットを低下させるアクティブアタックを識別する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:42:05 GMT)
Transferring Relative Monocular Depth to Surgical Vision with Temporal
Consistency [4.2] 相対的な単分子深度は、1つの画像からシフトとスケールの深さを推定するものであり、活発な研究トピックである。
大規模で多様なメタデータセットに基づいて訓練された最近のディープラーニングモデルは、自然画像の領域で優れたパフォーマンスを提供する。
内視鏡画像に真実の深さを与えるデータセットはほとんど存在せず、そのようなモデルをスクラッチからトレーニングすることは不可能である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:57:51 GMT)
A Converting Autoencoder Toward Low-latency and Energy-efficient DNN
Inference at the Edge [4.1] エッジデバイスに適した低レイテンシかつエネルギー効率のDeep Neural Network (DNN) 推論フレームワークであるCBNetを提案する。
変換」オートエンコーダを使用して、ハードイメージを簡単なものに効率よく変換する。
CBNetは推論遅延の4.8倍のスピードアップと79%のエネルギー消費の削減を実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:13:42 GMT)
FeatAug: Automatic Feature Augmentation From One-to-Many Relationship Tables [4.1] 1対多の関係テーブルの機能強化は、MLモデル開発において重要な問題であるが、難しい問題である。
本稿では,1対多の関係テーブルから述語クエリを自動的に抽出する機能拡張フレームワークFEATAUGを提案する。
FeatAugがFeattoolsよりも効果的な特徴を抽出できることを実世界の4つのデータセットで実証した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:44:14 GMT)
A Geospatial Approach to Predicting Desert Locust Breeding Grounds in
Africa [4.0] ロカスト群れは農業と食料安全保障に 大きな脅威を与えます
本研究は,ロカスト繁殖場予測のための操作可能なモデルを開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:13:58 GMT)
Task-Aware Machine Unlearning and Its Application in Load Forecasting [4.0] 本稿では、すでに訓練済みの予測器に対するデータセットの一部の影響を除去するために特別に設計された機械学習の概念を紹介する。
局所モデルパラメータ変化の感度を影響関数とサンプル再重み付けを用いて評価することにより,性能認識アルゴリズムを提案する。
リアルな負荷データセットを用いて,線形,CNN,Mixerベースの負荷予測器上で,未学習アルゴリズムを検証した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:19:32 GMT)
A Survey on the Robustness of Computer Vision Models against Common
Corruptions [4.0] 本稿では,コンピュータビジョンモデルの汎用汚職に対する堅牢性を改善する手法について概観する。
いくつかのデータセットでロバスト性のパフォーマンスを比較するために、統一ベンチマークフレームワークをリリースしました。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:51:03 GMT)
Interpreting What Typical Fault Signals Look Like via Prototype-matching [3.8] プロトタイプマッチングとオートエンコーダを組み合わせたプロトタイプマッチングネットワーク(PMN)を提案する。
分類ロジック、障害プロトタイプ、マッチングコントリビューションに関する3つの解釈パスがある。
この能力は人間の理解を広げ、解釈可能性の研究から科学のためのAIまで有望なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:47:07 GMT)
Comparative analysis of diverse methodologies for portfolio optimization
leveraging quantum annealing techniques [3.7] 関連する資産や制約の数が増えるにつれて、ポートフォリオ最適化問題はますます解決が困難になる。
量子アニールアルゴリズムは、NISQ時代の複雑なポートフォリオ最適化問題の解決を約束する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:27:53 GMT)
Provable Mutual Benefits from Federated Learning in Privacy-Sensitive
Domains [3.7] クロスサイロフェデレーション学習により、データ所有者は、互いにプライベートデータセットから利益を得て、正確な機械学習モデルをトレーニングできる。
プライバシーに敏感なドメインへのクライアントの参加を促進するために、FLプロトコルはプライバシー保証とエンドモデル精度の微妙なバランスをとる必要がある。
我々は、サーバがFLプロトコルを設計できる時期と方法について、すべての参加者にとって有益であるかどうかを調査する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:43:44 GMT)
Counterfactual Reasoning with Knowledge Graph Embeddings [3.6] 知識グラフ埋め込み (KGEs) は、本来は事実を推測するために開発されたが、未完成の知識リポジトリに欠けている事実を推測するために開発された。
本稿では,知識グラフの補完と,新たなタスクCFKGRによる反実的推論をリンクする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:21:39 GMT)
Toward Robust Canine Cardiac Diagnosis: Deep Prototype Alignment
Network-Based Few-Shot Segmentation in Veterinary Medicine [3.6] 本研究は, 犬胸部X線写真における心房および左心房拡張の正確なセグメンテーションについて, 提案したディーププロトタイプアライメントネットワーク(DPANet)を用いて検討した。
実験の結果,提案したDPANetが最も高い性能を示した。
以上の結果から,FSSによる心房拡張および左心房拡張のための後発性ソリューションとして,我々のモデルが持つ異常な機能を強調した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:19:29 GMT)
Application of Quantum Tensor Networks for Protein Classification [3.5] タンパク質配列は自然言語処理における文として考えることができることを示す。
我々は、その細胞内位置に基づいてタンパク質を分類する。
量子ネットワーク(QTN)がタンパク質配列の複雑さと多様性を効果的に処理できることを実証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:47:09 GMT)
A Scalable Formal Verification Methodology for Data-Oblivious Hardware [3.5] 本稿では,標準プロパティチェック手法を用いて,ハードウェアにおけるデータ公開動作を正式に検証する手法を提案する。
この帰納的特性の証明は,マイクロアーキテクチャレベルでのデータ公開性を徹底的に検証するのに十分であることを示す。
あるケーススタディでは、広範囲に検証され、高度にセキュアなIBEX RISC-Vコアにおいて、データ依存のタイミング違反を発見した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:47:15 GMT)
DID:RING: Ring Signatures using Decentralised Identifiers For Privacy-Aware Identity [3.5] 本稿では,リングシグネチャを代替検証手法として統合することにより,分散型識別子におけるセキュリティとプライバシの強化について検討する。
そこで本研究では,分散識別子に基づくアーキテクチャフレームワークで実証された分散ID手法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:20:37 GMT)
On the Diminishing Returns of Width for Continual Learning [3.5] フィードフォワードネットワーク(FFN)において、幅が直接記憶に関連があることを証明するために連続学習理論を解析する。
具体的には, ネットワーク幅の増大と, ネットワーク幅の増大が収率の低下を実証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:19:45 GMT)
Quantum Principle of Relativity and The Renormalizable Quantum Gravity [3.4] 我々は、相対性理論という新しい相対性理論に基づいて純粋に量子論を発展させた。
我々は、相対性理論の本質が量子領域に自然に拡張され、活性変換と受動変換の同一構造が維持されることを示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:16:39 GMT)
Rebuilding ROME : Resolving Model Collapse during Sequential Model
Editing [3.4] Rank-One Model Editing (ROME)によるモデル崩壊は、CounterFactデータセットを使用して編集を行う場合にのみ発生することを示す。
無効な編集はROMEのオリジナルの実装の成果物であることがわかった。
より安定した実装 ROME を提供し、ROME で大規模な逐次編集を行う際には、r-ROME と呼び、モデル崩壊を観測しなくなったことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:33:05 GMT)
Recent Developments in Machine Learning Methods for Stochastic Control
and Games [3.4] 近年,制御問題やゲームを解決するため,機械学習に基づく計算手法が開発されている。
我々は,高次元や構造が非常に複雑である場合においても,そのような問題を解く可能性を解き明かした深層学習手法に焦点をあてる。
本稿では,これらの手法について紹介し,機械学習と制御とゲームのクロスロードにおける最先端の成果を要約する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:59:57 GMT)
Ground-state chiral current via periodic modulation [3.4] 我々は、量子場と古典場によって駆動される3レベル原子に基づく基底状態キラル電流をエミュレートするために、光子を介するジアロシンスキー-モリヤ相互作用を設計する。
我々は、2レベル系の効果的なジアロシンスキー-モリヤ相互作用ハミルトニアンを導出するために断熱除去技術を用いる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:04:36 GMT)
Retail Central Bank Digital Currency: Motivations, Opportunities, and
Mistakes [3.3] 世界中の各国が中央銀行デジタル通貨(CBDC)の設計について調査を行っている
CBDCは、現金と中央銀行の予備金と共に中央銀行によって発行される。
CBDCは個人や企業によって通常の商業に適した金として使われる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:02:06 GMT)
Trainable and Explainable Simplicial Map Neural Networks [3.3] 単純なマップニューラルネットワーク(SMNN)は、興味深い特性を持つトポロジベースのニューラルネットワークである。
SMNNは高次元データセットに適用可能なボトルネックをいくつか提示する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:10:15 GMT)
Monotone Individual Fairness [3.2] オンライン学習者が予測精度を最大化し、類似した個人が同じように扱われることを保証することを目的として、オンライン学習の問題を個別の公正さで再考する。
監査者からのフィードバックを集約できる監査方式を検討する。
ここでは, 後悔, フェアネス違反の数に対して$(mathcalO(T2/3+2b),mathcalO(T5/6-b))$を0leq b leq$で上限とするオラクル効率アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:32:56 GMT)
Multiple Population Alternate Evolution Neural Architecture Search [3.2] ニューラルネットワークアーキテクチャを探索する新しいパラダイムを提案し,MPAE(Multiple Population Alternate Evolution Neural Architecture Search)を設計する。
MPAEは、探索空間をL相互接続単位に変換し、連続的にユニットを探索し、上記のネットワーク全体の探索を数回繰り返して、その後のユニットへの影響を減らす。
提案手法は、CIFARデータセット上でニューラルネットワークを探索し、最先端の結果を得るのに、わずか0.3GPU日しかかからない。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:05:01 GMT)
The negation of permutation mass function [3.2] 既存の否定法は主に確率論、エビデンス理論、複雑なエビデンス理論に適用される。
ランダムな置換集合論に否定の概念を適用する方法はまだ研究されていない。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:44:59 GMT)
An interpretable neural network-based non-proportional odds model for
ordinal regression [3.0] 本研究では,直交回帰のための解釈可能なニューラルネットワークに基づく非局所奇数モデル(N$3$POM)を提案する。
N$3$POMは、正規回帰に対する従来のアプローチとはいくつかの点で異なる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:28:13 GMT)
SPA: Towards A Computational Friendly Cloud-Base and On-Devices
Collaboration Seq2seq Personalized Generation [2.9] 大規模言語モデル(LLM)は、様々なタスクや質問応答において優れた性能を示している。
LLMは、トレーニングや予測手順に機密情報が含まれている場合、プライバシーの漏洩を引き起こす可能性がある。
デバイス上での高速な推論のための軽量アーキテクチャであるSPA(Side Adaption)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:26:02 GMT)
Combinatorial NLTS From the Overlap Gap Property [2.9] Anshu, Breuckmann, and Nirkhe [ABN22] は、フリードマンとヘイスティングスによるいわゆる "No Low-Energy Trivial State conjecture" を肯定的に解決した。
この予想は、基底状態が浅い(対数深度)回路で生成できないn量子ビット系上の線形サイズの局所ハミルトニアンの存在を仮定した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:04:15 GMT)
MAP-Elites with Transverse Assessment for Multimodal Problems in
Creative Domains [2.8] 品質多様性の進化を用いたマルチモーダルな創造的タスクを扱う新しい手法を提案する。
我々の貢献は、MAP-Elitesアルゴリズム、MAP-Elites with Transverse Assessment (MEliTA)のバリエーションである。
MeliTAは、アーティファクトのモダリティを分離し、エリート間のクロスポーリングを促進する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:50:22 GMT)
Distinguishing Neighborhood Representations Through Reverse Process of GNNs for Heterophilic Graphs [2.7] グラフニューラルネットワーク(GNN)は拡散過程に似ており、多くの層を積み重ねる際の学習表現の過度な平滑化につながる。
本稿では, 逆過程の設計原理をGNNの3つの変種に適用する。
逆処理によって予測性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:48:54 GMT)
CAM Back Again: Large Kernel CNNs from a Weakly Supervised Object
Localization Perspective [2.7] 大規模なカーネルCNNは、下流の視覚タスクや分類性能でよく機能することが報告されている。
ダウンストリームタスクにおける大規模カーネルCNNの性能を再考し、弱教師付きオブジェクトローカライゼーションタスクに着目した。
本研究では,現在のカーネルCNNであるConvNeXt,RepLKNet,SLaKを比較し,ERFサイズがダウンストリームタスクの性能向上に重要であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:48:22 GMT)
Nested Nonparametric Instrumental Variable Regression: Long Term,
Mediated, and Time Varying Treatment Effects [2.7] ネストした非パラメトリックインスツルメンタル変数回帰(ネステッドNPIV)の逆推定器の解析
本研究は,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,</i>3</i>,<i>3</i>3</i>,<i>3</i>,<i>3</i>3</i>,<i>3</i>,<i>3</i>,<i>3</i>3</i>,<
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:12:52 GMT)
Are Targeted Messages More Effective? [2.7] グラフニューラルネットワーク(GNN)は、グラフのためのディープラーニングアーキテクチャである。
GNNの表現性は、カウントを伴う一階述語論理の特定の断片によって特徴づけられる。
2つのGNNバージョンが一様でない場合、同じ表現性を持つことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:34:57 GMT)
Lander.AI: Adaptive Landing Behavior Agent for Expertise in 3D Dynamic
Platform Landings [2.5] 本研究では,風環境下でプラットフォーム上での移動と着陸を目的とした高度深層強化学習(DRL)エージェントであるLander.AIを紹介する。
Lander.AIは、風の乱流を含む現実世界の複雑さを反映するジム・ピブル・ドーンシミュレーションで厳格に訓練されている。
実験の結果は、ランダー.AIの高精度着陸と、風による乱れでも移動プラットフォームに適応する能力を示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:20:44 GMT)
Guiding Masked Representation Learning to Capture Spatio-Temporal
Relationship of Electrocardiogram [2.5] 本稿では,ST-MEM(S-Temporal Masked Electrocardiogram Modeling)を提案する。
ST-MEMは、不整脈に対する様々な実験的設定において、他のSSLベースラインメソッドよりも優れている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:16:33 GMT)
Multi-Scale Implicit Transformer with Re-parameterize for
Arbitrary-Scale Super-Resolution [2.5] マルチスケールインプリシットトランス(MSIT)
MSITは、MSNO(Multi-scale Neural Operator)とMSSA(Multi-scale Self-Attention)から構成される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:23:20 GMT)
TikTokActions: A TikTok-Derived Video Dataset for Human Action
Recognition [2.5] 現代の人間の行動に関する386のハッシュタグの下に分類された283,582のユニークなビデオクリップのデータセットをリリースする。
Tik-Tokデータセットを使用して事前トレーニングされたモデルのパフォーマンスは、より大きなアクション認識データセットでトレーニングされたモデルに匹敵する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:42:13 GMT)
GenerateCT: Text-Conditional Generation of 3D Chest CT Volumes [2.5] GenerateCTは、フリーフォームの医療用テキストプロンプトに条件付けされた3D医療用画像を生成するための最初のアプローチである。
マルチ異常分類タスクにおいてGenerateCTの有用性を評価する。
GenerateCTは、任意のサイズの合成トレーニングデータセットのスケーリングを可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:37:26 GMT)
Adaptive variational Bayes: Optimality, computation and applications [2.4] 本稿では,モデル集合上で動作可能な適応型変分ベイズフレームワークを提案する。
適応変分ベイズは非常に一般的な条件下で最適な収縮率が得られることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:29:15 GMT)
Experimental realization of universal quantum gates and six-qubit state
using photonic quantum walk [2.3] フォトニックな量子ウォークを用いた普遍的な量子ゲートの実現について報告する。
光子の偏光と経路自由度を用いて複数の量子ビットを符号化し、100%の成功確率で普遍的なゲートセットの実現を実証する。
この研究は、量子コンピューティングにおけるフォトニック量子ウォークの利用に向けた大きな進歩を示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:32:22 GMT)
New Perspectives in Online Contract Design: Heterogeneous, Homogeneous,
Non-myopic Agents and Team Production [2.3] オンライン学習の観点から,反復する主エージェント問題について検討する。
各設定で学習アルゴリズムを設計するための様々なアプローチとテクニックを提示します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:28:23 GMT)
Generative AI in EU Law: Liability, Privacy, Intellectual Property, and
Cybersecurity [2.1] 本稿では、欧州連合の文脈におけるジェネレーティブAIと大規模言語モデル(LLM)の法的および規制的意味について述べる。
責任、プライバシー、知的財産権、サイバーセキュリティの側面を分析する。
生成モデルの安全性とコンプライアンスを保証するためのレコメンデーションを提案している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:35:22 GMT)
Structure Your Data: Towards Semantic Graph Counterfactuals [2.0] 概念に基づく対実的説明(CE)は、モデル予測にどの高レベルな意味的特徴が寄与するかを理解するための代替シナリオを考える説明である。
本研究では,入力データに付随する意味グラフに基づくCEを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:40:37 GMT)
Efficient near-optimal decoding of the surface code through ensembling [1.9] MWPMベースのデコーダの調和したアンサンブルは、個々のアンサンブルよりも低い論理誤差率を達成する。
我々は、調和は高度に正確なリアルタイム復号化への有効な道筋を提供すると結論づける。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:59:16 GMT)
HiRA-Pro: High resolution alignment of multimodal spatio-temporal data:
a process physics driven approach [1.9] HiRA-Proは、データをミリ秒以下のタイムスタンプに合わせるという課題に対処する。
スマートな製造環境では、13以上のチャネルから取得したデータを3Dプリンティングとミリング操作で整列させる。
HiRA-Proの優位性はさらに、追加製造におけるケーススタディを通じて示され、機械学習による予測性能の向上が示されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:45:19 GMT)
The $\phi^n$ trajectory bootstrap [1.9] グリーン関数 $G_n=langlephinrangle$ は複素$n$に対する解析的継続を認める。
ブートストラップ問題は極小特異性の原理によって解決できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:48:24 GMT)
Linguistic Structure Induction from Language Models [1.8] この論文は、教師なし環境で言語モデル(LM)から選挙区構造と依存関係構造を生成することに焦点を当てている。
本稿では,エンコーダネットワークにトランスフォーマーアーキテクチャを組み込んだStructFormer(SF)について詳細に検討し,その構成と依存性について述べる。
この分野の課題を分析し、対処するための6つの実験を提示します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:54:49 GMT)
P-NOC: adversarial training of CAM generating networks for robust weakly
supervised semantic segmentation priors [1.8] Wakly Supervised Semantic (WSSS)技術は、クラス活性化マップ(CAM)を洗練するための個別の正規化戦略を探索する
P-NOCとCCAM-Hの2つの新しい手法を考案した。
まず,2つの対向CAM生成ネットワークのコンジョイントトレーニングを推進した。
後者では、P-NOCが生み出した高品質な擬似セグメンテーションの先駆的手法を用いて、弱教師付き方式で学習をサラリティー情報に導く。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:26:10 GMT)
Human-Inspired Framework to Accelerate Reinforcement Learning [1.6] 強化学習(Reinforcement Learning, RL)は、データサイエンスの意思決定において重要であるが、サンプルの不効率に悩まされている。
本稿では,RLアルゴリズムのサンプル効率を向上させるための,人間に触発された新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:08:41 GMT)
Exploring the Impact of ChatGPT on Student Interactions in
Computer-Supported Collaborative Learning [1.6] 本稿では,コンピュータ支援型協調学習環境におけるChatGPTの適用性について検討する。
統計的分析を用いて,非同期グループブレインストーミングセッションにおける学生のインタラクションの変化を,ChatGPTを即時質問応答エージェントとして導入することで検証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:18:18 GMT)
Detection of Unobserved Common Causes based on NML Code in Discrete,
Mixed, and Continuous Variables [1.5] 2つの確率変数間の因果関係を次の4つのカテゴリに分類する。
我々は,CLOUDが,合成データと実世界のデータの両方に関する広範な実験により因果関係を推定する既存手法よりも有効であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:11:52 GMT)
Video Generation with Consistency Tuning [1.5] 4つのモジュールからなる新しいフレームワークを提案する。
その後、新たに提案したモジュールを適用することで、各ビデオフレームにおける背景と前景の整合性が最適化される。
また,本手法により生成されたビデオは,最先端の手法と比較して高品質であることを示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:11:28 GMT)
Narrating Causal Graphs with Large Language Models [1.4] 本研究では、因果グラフからテキストを生成するための、大規模事前学習言語モデルの能力について検討する。
これらのグラフにエンコードされた因果推論は、医療やマーケティングのような多様なアプリケーションをサポートすることができる。
結果として、生成AIのユーザは、いくつかの例だけでモデルをトレーニングするときに、同様のパフォーマンスが得られるため、将来のアプリケーションをより早くデプロイできる可能性が示唆されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:19:59 GMT)
Activation of entanglement in generalized entanglement swapping [1.4] 本研究では,2つのベル対を含む一般化エンタングルメントスワッピングプロセスにおけるエンタングルメントの活性化と,一般化された測定値について検討する。
本研究では,最大エンタングルド2ビット初期状態と一般化された測定値に着目し,エンタングルド測定演算子の必要性と充足条件について検討する。
本研究は, 量子ネットワークの絡み合い分布に新たな光を流すことにより, 遠方部同士の絡み合いの発生の可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:48:55 GMT)
Applicability of oculomics for individual risk prediction: Repeatability
and robustness of retinal Fractal Dimension using DART and AutoMorph [1.3] フラクタル次元(FD)に基づくオキュロミクスは、個々のリスク予測に使用できる。
私たちは2つのデータセットを使用しました。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:34:51 GMT)
Towards more accurate and useful data anonymity vulnerability measures [1.3] 本報告では,攻撃論文を多数検討し,いくつかの問題点を指摘し,リスクの過大評価に繋がる。
第一に、いくつかの論文は正しい統計的推測基準(または全く)を確立することができず、誤った測定結果をもたらす。
第二に、いくつかの論文では、現実的な会員ベースレートを使用せず、正確さが報告された場合、誤った精度の計測に繋がる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:40:08 GMT)
Operator size growth in Lindbladian SYK [1.3] 演算子のサイズと分布を有限の$q$で計算し、解析的に大きめの$q$で計算する。
演算子サイズ成長の不確実性関係は、大きな$q$で飽和しており、散逸を伴う演算子サイズ成長の古典力学に繋がる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:12:50 GMT)
DeepTextMark: A Deep Learning-Driven Text Watermarking Approach for
Identifying Large Language Model Generated Text [1.2] テキストが人間によって書かれたものなのか、あるいはLarge Language Modelsによって生成されたものなのかを識別することの重要性が最重要になっている。
DeepTextMarkは、テキスト生成フレームワークに対して実行可能な"アドオン"ソリューションを提供する。
実験による評価は,DeepTextMarkの非知覚性,検出精度の向上,堅牢性の向上,信頼性の向上,迅速な実行を裏付けるものである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:27:26 GMT)
Re-Simulation-based Self-Supervised Learning for Pre-Training Foundation
Models [1.2] 自己監視学習(SSL)は、現代の大規模機械学習モデルのトレーニングの中核にある。
本稿では,データ拡張のための再シミュレーション手法を用いた新しいシミュレーションベースのSSL戦略であるRS3Lを提案する。
結果に加えて、SSL戦略を改善するためのさらなる研究のために、RS3Lデータセットを公開しています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:00:47 GMT)
Development of a Reliable and Accessible Caregiving Language Model
(CaLM) [1.1] 本研究の目的は、FMと介護知識ベースを用いて、信頼できる介護言語モデル(CaLM)を開発することである。
FMファインチューニングと組み合わせて, FM応答の質を向上させるために, Retrieval Augmented Generation (RAG) フレームワークを用いた CaLM を開発した。
本研究は,介護領域に特有の知識ベースを持つ小型FMを用いて,信頼性の高いCaLMを開発可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:12:34 GMT)
Online Reinforcement Learning in Markov Decision Process Using Linear
Programming [1.1] マルコフ決定過程(MDP)におけるオンライン強化学習について検討した。
我々は,高い確率で$widetildeO(LXsqrtTA)$ regretを実現する,シンプルで効率的なモデルベースアルゴリズムを考案した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:38:26 GMT)
Genetic Learning for Designing Sim-to-Real Data Augmentations [1.0] データ拡張は、合成データのトレーニングにおいて、sim-to-realドメインギャップを閉じるのに有用である。
多くの画像増強技術があり、強度や確率などの異なる設定でパラメータ化されている。
本稿では、特定のsim-to-real設定に対して、ある拡張ポリシーがどの程度うまく機能するかを予測するために、組み合わせられる2つの異なる解釈可能な指標を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:00:56 GMT)
A slice classification neural network for automated classification of
axial PET/CT slices from a multi-centric lymphoma dataset [1.0] 我々は、リンパ腫/CT画像の軸スライスを分類するためにResNet-18ネットワークを訓練する。
受信機動作特性曲線(AUROC)の領域と高精度リコール曲線(AUPRC)の領域を用いてモデル性能を比較した。
我々は,スライスレベルスプリット訓練と比較して,スライスレベルスプリット訓練におけるパフォーマンス過大評価を観察し,記述した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:57:45 GMT)
Time Series Analysis of Key Societal Events as Reflected in Complex
Social Media Data Streams [1.0] 本研究では,ニッチなソーシャルメディアプラットフォームであるGABと,確立されたメッセージングサービスであるTelegramの物語進化について検討する。
我々のアプローチは、複数のソーシャルメディアドメインを調査し、他の方法では見えない重要な情報を排除するための新しいモードである。
主な知見は,(1) 時間線をデコンストラクトして, 解釈を改善するための有用なデータ機能を提供すること,(2) 一般化の基盤を提供する方法論を適用すること,である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:33:56 GMT)
Poisoning Programs by Un-Repairing Code: Security Concerns of
AI-generated Code [1.0] 脆弱性コードの生成につながる新たなデータ中毒攻撃を特定します。
次に、これらの攻撃がコード生成の最先端モデルにどのように影響するかを広範囲に評価する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:47:04 GMT)
3D Semantic Segmentation-Driven Representations for 3D Object Detection [1.0] 自動運転において、3D検出は、経路計画や動き推定など、下流のタスクにより正確な情報を提供する。
提案したマルチモーダル3Dオブジェクト検出は,画像から得られる意味的特徴と点雲から得られる幾何学的特徴を組み合わせたものである。
我々は,既存のLiDARのみに基づく3D検出の十分な意味情報を確保するためのプレゼンテーションとして,ポイントワイズ・セマンティック機能であるSeSameを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:17:56 GMT)
Data-driven architecture to encode information in the kinematics of
robots and artificial avatars [1.0] ロボットと人工アバターのキネマティクスを変更するためのデータ駆動制御アーキテクチャを提案する。
我々は、人間の操作者によって駆動されるアバターの動きにおける感情の有無などの特定の情報を符号化する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:00:26 GMT)
Suppressing Correlated Noise in Quantum Computers via Context-Aware
Compiling [1.0] ノイズの相関は、量子プロセッサ上で実行される命令の空間的および時間的構成の結果生じる。
回路の他の部分への動的デカップリングやエラー補償を用いて,これらのエラーを抑えるコンパイラ戦略を考案する。
提案実験では,10量子回路層の層密度が18.5%上昇することを示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:08:52 GMT)
Textual analysis of End User License Agreement for red-flagging potentially malicious software [0.9] EULAには、法的反感を避けるための情報が含まれている。
エンドユーザは、ドキュメントの長さのため、これらのEULAを読まない。
アンサンブル学習を用いて、EULAを5つの異なるテキスト要約手法を用いて、良心または悪意として分類する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:45:27 GMT)
Spatial features of CO2 for occupancy detection in a naturally
ventilated school building [0.9] 自然に換気された建物では、複雑な換気挙動と窓を通しての実際の空気交換を測定するのが難しいため、CO2による占有率検出の精度が低いのが一般的である。
本研究では,CO2濃度の空間分布に基づく2つの新しい占有検知機能について述べる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:04:28 GMT)
The Cram Method for Efficient Simultaneous Learning and Evaluation [0.9] 同時に学習と評価を行うための汎用的で効率的な手法である「クラム」手法を導入する。
サンプル全体を学習と評価の両方に利用するため、クラミングはサンプル分割よりもはるかにデータ効率が高い。
広範囲にわたるシミュレーション研究により, 試料分離と比較すると, クラミングは標準誤差を40%以上低減することがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:19:05 GMT)
On the Robustness of Lexicase Selection to Contradictory Objectives [0.9] 矛盾する目的について,レキシケースとエプシロン-レキシケース選択の性能について検討した。
辞書とepsilon-lexicase選択は、それぞれパラメータ空間の領域を持ち、矛盾する目的を最適化することができない。
パラメータ選択のための理論的支援されたガイドラインを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:23:35 GMT)
Analyzing the Differentially Private Theil-Sen Estimator for Simple Linear Regression [0.9] DPTheilSenのプライバシーと精度特性を厳密に有限サンプル解析する。
我々は、その点推定に付随するために、差分プライベートな信頼区間を生成する方法を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:28:06 GMT)
epsilon-Mesh Attack: A Surface-based Adversarial Point Cloud Attack for
Facial Expression Recognition [0.8] 一般的な方法は、勾配方向を追従して入力をわずかに変化させる敵攻撃を用いることである。
本稿では,メッシュ表面上の摂動を制限することで,点クラウドデータを操作する「$epsilon$-Mesh Attack」という逆攻撃を提案する。
我々の手法は、訓練済みのDGCNNとPointNetモデルに99.72%$と9.06%$を混乱させ、顔の変形を区別できないものにした。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:29:55 GMT)
PCLD: Point Cloud Layerwise Diffusion for Adversarial Purification [0.8] ポイントクラウドは、ロボット工学、自律運転、拡張現実など、さまざまな現実世界のアプリケーションに広く利用されている。
モデルの堅牢性を評価する典型的な方法は、敵攻撃によるものである。
本稿では, 層状拡散に基づく3次元ポイントクラウド防衛戦略であるポイントクラウド層拡散(PCLD)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:13:10 GMT)
Deep Learning Approaches for Human Action Recognition in Video Data [0.8] 本研究は、この課題に対処するために、様々なディープラーニングモデルの詳細な分析を行う。
我々は、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、Two-Stream ConvNetsに焦点を当てる。
本研究の結果は,頑健な人間の行動認識を実現するための複合モデルの可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:31:25 GMT)
Towards Zero-Shot Interpretable Human Recognition: A 2D-3D Registration
Framework [0.8] 法学・法学の目的(裁判所など)に使える証拠を提供することが重要である。
本稿では,3つの弱点を同時に解決することを目的とした,最初の認識フレームワークと戦略について述べる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:27:20 GMT)
From Fitting Participation to Forging Relationships: The Art of
Participatory ML [0.8] 参加型機械学習 (Participatory Machine Learning, ML) は、設計および開発プロセスにおいて、エンドユーザーとMLシステムに影響された人々の参加を促進する。
参加者の労働力の成果をMLアーティファクトやシステムへのインプットに変換する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:44:34 GMT)
Understanding and Avoiding AI Failures: A Practical Guide [0.7] AIアプリケーションに関連するリスクを理解するためのフレームワークを作成します。
また、AIの安全性原則を使用して、AIにおけるインテリジェンスと人間のような品質のユニークなリスクを定量化しています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:58:33 GMT)
Exploring Large Language Models and Hierarchical Frameworks for
Classification of Large Unstructured Legal Documents [0.6] 我々は,大規模法律文書の分類と,深層学習に基づく階層的枠組みによる構造情報の欠如について検討する。
具体的には、文書を分割して、カスタムの微調整された大規模言語モデルの最後の4層から埋め込みを抽出する。
提案手法は,従来の最先端手法に比べて平均2ポイント程度の性能向上を実現している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:24:08 GMT)
Self-Sovereign Identity for Electric Vehicle Charging [0.6] 本稿では,EV充電認証と認可のための認証資格として,SSI(Self-Sovereign Identities)を利用する手法を提案する。
提案手法のセキュリティとプライバシは,玉林証明器を用いて形式解析を行った。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:43:40 GMT)
QUASAR: QUality and Aesthetics Scoring with Advanced Representations [0.6] 本稿では,画像品質と美学評価のための新しいデータ駆動非パラメトリック手法を提案する。
データに効率的な画像アンカーを提案することで、表現力のあるテキスト埋め込みの必要性を解消する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:21:50 GMT)
Wise-SrNet: A Novel Architecture for Enhancing Image Classification by
Learning Spatial Resolution of Feature Maps [0.6] 畳み込みニューラルネットワークの進歩による大きな課題の1つは、抽出した特徴マップを最終分類層に接続する方法である。
本稿では,GAP層をWise-SrNetと呼ばれる新しいアーキテクチャに置き換えることで,この問題に対処する。
奥行きの畳み込みのアイデアにインスパイアされ、計算コストを増大させることなく空間分解能を処理するように設計されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:38:54 GMT)
Class Imbalance in Object Detection: An Experimental Diagnosis and Study
of Mitigation Strategies [0.5] 本研究は, YOLOv5単段検出器を用いて, 前地上クラス不均衡問題に対処するベンチマークフレームワークを提案する。
我々は,サンプリング,損失重み付け,データ強化という3つの確立した手法を精査した。
比較分析の結果,2段階検出法では有効であるが,YOLOv5の性能向上には有効ではないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:06:04 GMT)
Ricci flow-based brain surface covariance descriptors for Alzheimer
disease [0.5] 我々は、リッチエネルギー最適化を用いて、皮質表面から新しい共分散に基づく記述子を抽出するパイプラインを提案する。
異常な皮質脳形態計測の分析にこの新たなサインを適用することで、アルツハイマー病の診断が可能になる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:07:33 GMT)
Human and Automatic Interpretation of Romanian Noun Compounds [0.5] そこで我々は,人間アノテータとニューラルネット分類器を用いて,新しい関係セットを提案し,検証する。
結果は、人間の合意率が低い場合でも、ネットワークの予測と人間の判断が一致していることを示している。
最も頻繁に選択された関係は16のラベル付きセマンティック・リレーションのうちの1つであり、より良い関係のインベントリの必要性を示している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:18:00 GMT)
Assessment of few-hits machine learning classification algorithms for
low energy physics in liquid argon detectors [0.5] 本稿では,従来の(決定論的)アルゴリズムに対する機械学習手法の評価を行う。
畳み込みニューラルネットワーク(CNN)とトランスフォーマーエンコーダ(Transformer-Encoder)は、低エネルギー物理の最も難しい分類問題の一つとして、決定論的アルゴリズムよりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:09:44 GMT)
Towards Incident Response Orchestration and Automation for the Advanced Metering Infrastructure [0.5] 工業インフラの脅威の状況は、ここ数年で指数関数的に拡大してきた。
このようなインフラストラクチャには、リアルタイムの可用性を必要とするスマートメーターデータ交換のようなサービスが含まれる。
提案手法は、最も顕著なサイバー攻撃をエミュレートしたAdvanced Metering Infrastructureテストベッドを通じて検証される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:58:13 GMT)
Digital Twin Evolution for Sustainable Smart Ecosystems [0.5] デジタル双生児の進化的関心事を理解し管理するための、具体的な手がかりをソフトウェア実践者に提供します。
これによって、ソフトウェアエンジニアリングのプラクティスを活用して堅牢なスマートエコシステムを開発する上で、大きなギャップを埋めることを目指しています。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:06:13 GMT)
CSC-Unet: A Novel Convolutional Sparse Coding Strategy Based Neural
Network for Semantic Segmentation [0.4] 本稿では,一般的な畳み込み操作を多層畳み込み符号化ブロックに書き換える新しい戦略を提案する。
多層畳み込みスパース符号化ブロックは,セマンティックセグメンテーションモデルをより高速に収束させ,画像のより微細なセマンティックおよび外観情報を抽出し,空間的詳細情報を復元する能力を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:20:07 GMT)
Incorporating Improved Sinusoidal Threshold-based Semi-supervised Method
and Diffusion Models for Osteoporosis Diagnosis [0.4] 骨粗しょう症は、患者の生活の質に深刻な影響を及ぼす一般的な骨格疾患である。
従来の骨粗しょう症診断法は高価で複雑である。
本論文は, 有用性, 正確性, 低コストの利点を有する患者の画像データに基づいて, 骨粗しょう症を自動的に診断することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:11:46 GMT)
Defaults: a double-edged sword in governing common resources [0.4] 本研究では,有限資源からの既定抽出を操作できる行動実験の結果を示す。
その結果、自己サービス的デフォルトは、現在における平均抽出量を増大させる一方、社会的なデフォルトは、最初の2ラウンドでのみ抽出量を減少させることがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:14:04 GMT)
People Attribute Purpose to Autonomous Vehicles When Explaining Their Behavior [0.4] 我々は、特にテレロジーに関して、認知的説明科学から関連する文献をレビューする。
自動運転車の動作に関する説明を人々がどのように生成するかに関する実証データを報告する。
我々は,Human Explanations for Autonomous Driving Decisions (HEADD)と呼ばれる,注釈付きビデオ状況のデータセットを公開している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:48:50 GMT)
A cascaded deep network for automated tumor detection and segmentation
in clinical PET imaging of diffuse large B-cell lymphoma [0.4] PET画像からのDLBCL腫瘍の自動検出と分画のための高速で効率的な3段階の深層学習モデルの開発と検証を行った。
本モデルは,全身PET画像における腫瘍の分節化において,単一のエンドツーエンドネットワークよりも有効である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:36:55 GMT)
Self-Supervision in Time for Satellite Images(S3-TSS): A novel method of
SSL technique in Satellite images [0.4] S3-TSSは,時間次元で発生する自然増進を生かした自己教師型学習手法である。
提案手法は,4つの下流データセットにおいて,ベースラインのSeCoよりも優れた性能を示すことができた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:32:20 GMT)
A New Machine Learning Dataset of Bulldog Nostril Images for Stenosis
Degree Classification [0.4] ブルドッグの鼻孔の190枚の画像からなる新しい注釈付きデータセットを提示する。
結節画像を用いて自動的に狭窄度を推定する手法として深層学習について検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:02:17 GMT)
GlossLM: Multilingual Pretraining for Low-Resource Interlinear Glossing [0.3] 言語文書の重要な側面は、インターリニアグロステキスト(IGT)のようなフォーマットで注釈付きテキストを作成することである。
我々は、さまざまなソースからIGTデータの最大コーパスを構築し、1.8k言語で450万以上のサンプルをカバーしています。
そして、このコーパスの一部に大規模な多言語モデルを事前訓練し、さらに特定の言語に微調整する。我々のモデルは、セグメント化されたデータと巨大な単言語データセットのための最先端の手法と競合する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:21:15 GMT)
ContextGPT: Infusing LLMs Knowledge into Neuro-Symbolic Activity
Recognition Models [0.3] 本研究では,人間活動に関する常識知識から抽出する新しいプロンプトエンジニアリング手法であるContextGPTを提案する。
2つの公開データセットで行った評価は、ContextGPTから常識知識を注入することで得られるNeSyモデルがデータ不足のシナリオにどのように有効であるかを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:32:23 GMT)
Better than classical? The subtle art of benchmarking quantum machine
learning models [0.3] 古典的なシミュレーションによるベンチマークモデルは、ノイズフリーハードウェアが利用可能になる前に量子機械学習におけるアイデアを判断する主要な方法の1つである。
我々はPennyLaneのソフトウェアフレームワークをベースとしたオープンソースパッケージを開発し、大規模な研究を行っている。
我々は、160個の個別データセットを作成するために使用される6つのバイナリ分類タスクに対して、12の一般的な量子機械学習モデルを体系的にテストした。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:00:06 GMT)
Towards an educational tool for supporting neonatologists in the
delivery room [0.3] 本稿では,リスク要因と実際のデータから発生イベントに与える影響を識別する機械学習手法を提案する。
我々の最終目標は、高リスク患者に対する適切な介入の認識率と計画を改善することができる、ユーザフレンドリーなモバイルアプリを設計することです。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:03:21 GMT)
CT2Rep: Automated Radiology Report Generation for 3D Medical Imaging [0.2] 胸部CTを対象とする3次元医用画像のラジオグラフィーレポート作成法について紹介する。
比較手法が存在しないことから,医用画像における高度な3次元視覚エンコーダを用いたベースラインを構築し,本手法の有効性を実証する。
我々は,CT2Repをクロスアテンションベースのマルチモーダル融合モジュールと階層メモリで拡張し,縦型マルチモーダルデータの取り込みを可能にした。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:17:45 GMT)
From English to ASIC: Hardware Implementation with Large Language Model [0.2] 本稿では,最先端の自然言語モデルの微調整とHDLコードデータセットの再シャッフルについて述べる。
この微調整は、正確で効率的なASIC設計を生成するモデルの習熟度を高めることを目的としている。
データセットのリシャッフルは、トレーニング材料の範囲を広げ、品質を向上させることを意図している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:57:16 GMT)
Leveraging Foundation Models for Content-Based Medical Image Retrieval
in Radiology [0.2] コンテンツに基づく画像検索は、放射線学における診断支援と医学研究を大幅に改善する可能性がある。
現在のCBIRシステムは、特定の病態の専門化による限界に直面しており、実用性は制限されている。
本稿では,コンテンツに基づく医用画像検索のための特徴抽出器として視覚基盤モデルを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:06:45 GMT)
The Contextual Fraction as a Measure of Entanglement [0.2] まず、測定シナリオに関係なく、分離可能な状態は必ずしもコンテキストではないことを示す。
バイパルタイト状態に対しては、区別された経験的モデルを関連付け、対応する文脈分画が状態の絡み合いエントロピーと正に相関していることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:50:08 GMT)
Redefining Event Types and Group Evolution in Temporal Data [0.2] 時間的データにおいて、集団進化を特徴づける主要なアプローチは、出来事の特定を通じてである」。
我々は事象をアーチェタイプとして考える」とは、我々がファセット・エクセレミティ(facet extremities)と呼ぶ定量的次元のユニークな組み合わせによって特徴づけられる。
本フレームワークは,複数の対面インタラクションデータセットからグループを進化させ,よりリッチで信頼性の高いグループダイナミクスのキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:39:24 GMT)
Heterogeneous Image-based Classification Using Distributional Data
Analysis [0.1] 画素レベルの特徴の確率(量子)分布を組み込んだ新しい画像ベース分布データ解析(DDA)手法を開発した。
提案手法の特徴として, (i) 画像内の不均一性を考慮し, (ii) 分布全体にわたる粒度の情報を取り込み, (iii) がん応用における未登録画像に対する画像サイズの変化に対処する能力がある。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:41:40 GMT)
Leveraging Internal Representations of Model for Magnetic Image
Classification [0.1] 本稿では、1つの磁気画像とそれに対応するラベル画像しか持たないシナリオに特化して設計された機械学習モデルトレーニングのための、潜在的に画期的なパラダイムを提案する。
私たちはDeep Learningの能力を活用して、データの不足を克服することを目的として、簡潔で情報に富んだサンプルを生成します。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:15:50 GMT)
ReStainGAN: Leveraging IHC to IF Stain Domain Translation for in-silico
Data Generation [0.1] In-silicoデータセットは、計算病理学において異なる染色パターンを持つ新しいドメインに既存のアノテーションの有用性を拡張することができる。
免疫蛍光 (IF) 画像において, 形態特異的なIHC染色を別の画像チャネルに切り離し, シリカ化学(IHC) 画像を生成するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:45:34 GMT)
Automatic Generation of Python Programs Using Context-Free Grammars [0.1] TinyPy Generatorは、文脈自由文法を使ってランダムなPythonプログラムを生成するツールである。
私たちのシステムは、さまざまなレベルの複雑さを持つコードを生成するために、カスタムプロダクションルールを使用します。
TinyPy Generatorは機械学習の分野で有用であり、Python言語モデルをトレーニングするための大量のPythonコードを生成することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:25:52 GMT)
Process-Aware Analysis of Treatment Paths in Heart Failure Patients: A Case Study [0.1] スパース心不全データにプロセスマイニング手法を適用した。
患者は糖尿病や慢性腎臓病などの共病性に基づいて、異なるコホートに分けられる。
我々は,患者が循環器疾患を発症するかどうか,患者が死亡するかどうかを判断するために決定マイニングを適用した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:33:21 GMT)
Subpopulation-Specific Synthetic EHR for Better Mortality Prediction [0.1] 生成モデルを利用した新しいアンサンブルフレームワークを提案する。
我々は、各SPに対してGANベースの合成データ生成装置を訓練し、各SPトレーニングセットに合成サンプルを組み込む。
提案手法は,表現不足のSPに対するモデル性能の向上を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:18:30 GMT)
CuentosIE: can a chatbot about "tales with a message" help to teach
emotional intelligence? [0.1] CuentosIEは、CuentosIEが収集した指標とデータを通じて、学生や患者を監視するツールである。
CuentosIEの主な貢献は、一連の特殊物語の選択、収集、分類である。
ツールの予備評価は奨励的な結果を得た。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:27:16 GMT)
XXAI: Explicitly Explainable AI provides transparency in automatic
decision-making by overcoming the limitations of symbolic AI [0.0] サブシンボリックニューラルネットワークAIの信頼性と安全性には懸念がある。
我々は,決定論的論理セルオートマトンに基づく完全透明なホワイトボックスAIであるExplicitly Explainable AI (XXAI)を提案する。
XXAIは、ファイナルフェーズとトレーニングフェーズの両方で、サブシンボリックニューラルネットワークAI決定の信頼性、安全性、倫理性を自動的に検証することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:57:32 GMT)
What is the Q of a Blackbody? A small contribution to Gustav Robert
Kirchhoff's bicentennial [0.0] この演習はキルヒホフの関心の2つを融合させ、しばしば相互排他的な工学と科学の規律を橋渡しするので、独自のやり方で指導されている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:19:58 GMT)
Using Hallucinations to Bypass GPT4's Filter [0.0] 本稿では,RLHF前の動作に逆転するように微調整したバージョンを操作する新しい手法を提案する。
このエクスプロイトは現在、GPT4、Claude Sonnet、および(ある程度は)Inflection-2.5で動作する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:21:32 GMT)
Unconventional topological mixed-state transition and critical phase
induced by self-dual coherent errors [0.0] 電磁双対性と部分転移対称性の存在下では、位相相からの脱コヒーレンス誘起相転移は、かなり不規則でなければならないことを示す。
トポロジカル位相は、二重ヒルベルト空間における純状態として密度行列を見るとき、最大誤差率まで安定である。
次に、自己双対チャネルに従属する摂動的トーリックコードを考察し、臨界誤差率を超えて位相位相が破壊されるという数値的な証拠を見出す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:54:15 GMT)
Two novel pure-state coherence measures in quantifying coherence [0.0] 純粋状態コヒーレンス対策(PSCM)にのみ依存するコヒーレンス・モノトーン類は少ない。
さらに、純粋状態コヒーレンスの観点からコヒーレンスを定量化するイノベーティブなアイデアに基づいて、直近のコヒーレンス・モノトン類を探索する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:31:27 GMT)
Towards verifications of Krylov complexity [0.0] クリロフ複雑性は、ハミルトン力学の下で進化する作用素の成長の尺度であると考えられている。
私は16の量子力学系のモーメントの完全かつ明示的な表現をSchr"odinger と Heisenberg の両方で正確に解けるように提示する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:57:08 GMT)
Toward Neuromic Computing: Neurons as Autoencoders [0.0] 本稿では、神経バックプロパゲーションが樹状突起処理を用いて、個々のニューロンが自己エンコーディングを行うことを可能にするという考えを述べる。
非常に単純な接続重み探索と人工ニューラルネットワークモデルを用いて、フィードフォワードネットワークの隠蔽層における各ニューロンに対する自己エンコーディングのインターリーブ効果について検討した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:55:33 GMT)
Topological transport of a classical droplet in a lattice of time [0.0] 我々は,Thoulessチャージポンプを時間格子内で液体の液滴を前後に輸送することにより,時間固体に対して実現可能であることを示す。
この結果は空間ではなく時間を通してトポロジカルポンピングを確立し、時間結晶の応用の道を開いた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:14:58 GMT)
Thermalization in Krylov Basis [0.0] クリャロフ基底における閉じた非可積分量子系の熱化について研究する。
複雑性の無限時間平均の挙動と初期状態の逆参加比の振舞いには直接的な関係があることが分かる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:19:49 GMT)
The evaluation of a code-switched Sepedi-English automatic speech
recognition system [0.0] 本稿では,セペディ・イングリッシュ方式の自動音声認識システムの評価について述べる。
このエンドツーエンドシステムは、Sepedi Prompted Code Switching corpus と CTC アプローチを用いて開発された。
しかし、このモデルは41.9%という最低のWERを生み出したが、セペディ文字のみを認識するという課題に直面した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:11:28 GMT)
The energy spectrum of a quantum vortex loop moving in a long pipe [0.0] 閉渦フィラメントは長さ$L のパイプから infty$ に移動する。
本研究では,L から infty へのケースに焦点をあてる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 05:20:59 GMT)
Tests of the envelope theory for three-body forces [0.0] エンベロープ理論は、多体系の近似的だが信頼性の高い解を計算するための非常に効率的な手法である。
この技術の品質は、3つの同一粒子からなる非相対論的系を持つ様々な3体力に対して検証される。
エネルギー、固有関数、いくつかの観測可能関数を、数値的変動法で計算された対応する正確な結果と比較する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:04:33 GMT)
Tell me the truth: A system to measure the trustworthiness of Large
Language Models [0.0] 大型言語モデル (LLM) は2022年11月にChatGPTが導入されて以来、ほとんどのニュースでトップに立った。
企業が採用に抵抗している主な理由の1つは、これらのシステムの信頼性に対する信頼性の制限である。
ドメインの知識グラフとして表現された前提真理に基づいて信頼度を測定するための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:41:29 GMT)
Survey in Characterization of Semantic Change [0.0] 言葉の意味を理解することは、異なる文化からの文章を解釈するのに不可欠である。
意味的変化は、計算言語学アルゴリズムの結果の品質に影響を与える可能性がある。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:21:57 GMT)
Supercomputer model of finite-dimensional quantum electrodynamics
applications [0.0] 量子過程のスーパーコンピュータシミュレーションのための一般的なスキームは、有限次元空洞量子力学モデルの様々な修正によって記述される。
2つの例は水素結合の近似モデルと2次元平面上の光子運動のモデルである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:51:12 GMT)
Strict hierarchy of optimal strategies for global estimations: Mapping
global estimations into local ones [0.0] 我々は,グローバルな推定をローカルにマッピングできる仮想想像時間進化法を開発した。
我々は、並列、シーケンシャル、不確定な因果順序戦略を含む、異なる大域的推定戦略に対する達成可能な精度の厳密な階層を公表する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:31:20 GMT)
Stabilization of Hubbard-Thouless pumps through nonlocal fermionic
repulsion [0.0] チューレスポンピングは量子系における量子化された位相不変量を探索する強力な概念である。
十分に大きなサイト間相互作用は、Thoulessポンプの相互作用によって引き起こされるリカバリを可能にすることを示す。
この結果から,相互作用量子系におけるThoulessポンプの安定化機構が得られた。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:36:52 GMT)
Spin-orbit coupling in symmetric and mixed spin-symmetry [0.0] 2つの擬スピン次数の系では、2つの粒子は対称状態と反対称状態を構成するが、スピン対称性はより多くの粒子に対して混合することができる。
スピン軌道カップリングの存在下での混合スピン対称性の役割について検討し、調和ポテンシャルに閉じ込められた2つの超微細状態を持つ3つのボソン系を考える。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:02:19 GMT)
Spectral invariance and maximality properties of the frequency spectrum
of quantum neural networks [0.0] 最大周波数スペクトルは、$A = RL$にのみ依存し、$R$と$L$には依存しないことを示す。
また、生成器のスペクトルの関数として、任意に多くの層を持つQNNの最大周波数スペクトルを規定する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:40:18 GMT)
Solving Distributed Flexible Job Shop Scheduling Problems in the Wool
Textile Industry with Quantum Annealing [0.0] 我々は分散フレキシブルジョブショップスケジューリング問題(DFJSP)を解決するために量子アニーリング(QA)を使用します。
この要件は、ウール織物メーカーの実際のユースケースに基づいている。
特に注目されるのは、準拘束的二項最適化(QUBO)モデルのラグランジュパラメータの決定である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:15:53 GMT)
SmartML: Towards a Modeling Language for Smart Contracts [0.0] 本稿では,プラットフォームに依存しない,理解しやすいスマートコントラクトのモデリング言語であるSmartMLを提案する。
フォーマルなセマンティクスと型システムについて詳述し、セキュリティの脆弱性や攻撃に対処する上での役割に焦点を当てる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:27:53 GMT)
Simulating Quantum Circuits by Model Counting [0.0] 重み付きモデル計数により、普遍量子回路の強いシミュレーションを効率的に行うことができることを示す。
我々の研究は、量子回路の効率的なコンパイルを実現するために、既存の強力な古典的推論ツールを応用する方法を開拓する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:40:15 GMT)
Sentiment analysis with adaptive multi-head attention in Transformer [0.0] 本稿では,映画レビュー資料の感情を識別するためのアテンション機構に基づく新しいフレームワークを提案する。
本稿では,文の長さに基づいてアテンションヘッド数を変化させる適応型マルチヘッドアテンションアーキテクチャ(AdaptAttn)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:13:50 GMT)
Scalable High-Dimensional Multivariate Linear Regression for
Feature-Distributed Data [0.0] 本稿では,多変量線形回帰を特徴分散データに適用するための2段階緩和グリードアルゴリズムを提案する。
TSRGAの主な利点は、通信の複雑さが特徴次元に依存しないので、非常に大きなデータセットに高いスケーラビリティをもたらすことである。
提案したTSRGAを10-Kレポートから非構造化データを活用する金融アプリケーションに適用する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:56:13 GMT)
Retail-786k: a Large-Scale Dataset for Visual Entity Matching [0.0] 本稿では,視覚的実体マッチングのための大規模データセットについて紹介する。
合計で786kの注釈付き高解像度の製品イメージを3kのエンティティにグループ分けした18kの個別小売製品を含む。
提案した「視覚的実体マッチング」は,標準画像に基づく分類と検索アルゴリズムでは十分解決できない新しい学習問題を構成する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:11:11 GMT)
Responsible Artificial Intelligence: A Structured Literature Review [0.0] EUは最近、AIへの信頼の必要性を強調するいくつかの出版物を公表した。
これは国際規制の緊急の必要性を浮き彫りにする。
本稿は、私たちの知る限り、責任あるAIの最初の統一された定義を包括的かつ包括的に紹介する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:01:13 GMT)
RL-MSA: a Reinforcement Learning-based Multi-line bus Scheduling
Approach [0.0] 既存のアプローチは、通常、オフラインでバススケジューリングスキームを生成し、そのスキームに従ってバスをスケジュールする。
本稿では,MLBSPをマルコフ決定過程(MDP)としてモデル化する。
RL-MSA(Reinforcement Learning-based Multi-line bus Scheduling Approach)は,オフラインとオンラインの両フェーズでバススケジューリングを行うための手法である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 07:07:05 GMT)
Quantum thermodynamics of driven-dissipative condensates [0.0] ポラリトン凝縮は、熱と粒子が貯水池と継続的に交換される開放系において熱平衡から離れて起こる。
偏光子の基底状態の個体群の形成に関わる主要な過程を捉えるための数段階のモデルを構築した。
これにより凝縮は熱エンジンの出力として理解でき、その発生に関する熱力学的制約を露呈する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:13:58 GMT)
Quantum optics in MATLAB [0.0] 我々は、理論量子光学と関連分野の研究キャリアを始める学生を支援するために、初心者レベルで数値ガイドを提供する。
これらのリソースは、大学院生や大学院生が同様の分野のプロジェクトに取り組む上でも有用である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:33:49 GMT)
Quantum Entanglement in a Diluted Magnetic Semiconductor Quantum Dot [0.0] 量子技術にとって重要な希薄磁性半導体量子ドットの絡み合いについて検討する。
我々の分析は波動関数の定義、密度行列演算子の利用、絡み合いのエントロピーの測定を含む。
数値的な評価では、大きな絡み合いを示す様々な量子ドットの組み合わせのうち、いくつかの有望なペアが示される。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:57:10 GMT)
Quantum Computation by Cooling [0.0] 本稿では,断熱進化に基づく量子計算のための特定のハミルトンモデルを提案する。
この冷却法に基づく量子計算は、その計算能力において量子回路に基づく計算と等価であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:34:19 GMT)
Quantifying Marketing Performance at Channel-Partner Level by Using
Marketing Mix Modeling (MMM) and Shapley Value Regression [0.0] 本稿では、チャネルパートナーレベルでのマーケティングパフォーマンスの判別におけるShapley Value Regressionの適用について検討する。
我々は、個々のパートナーのコントリビューションを評価する上で、共有価値回帰の実践性を実証する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:55:01 GMT)
QRAM architectures using superconducting cavities [0.0] 高コヒーレンス超伝導共振器を用いた2つのバケットブリガドQRAMアーキテクチャを提案する。
ボソニック量子ビットのシングルレールとデュアルレールの実装を解析する。
利害関係のパラメータについて、二重レールアーキテクチャにおけるQRAMクエリのポストセレクト不完全性は、単一レールアーキテクチャにおける対応するクエリの桁違いである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:15:09 GMT)
Pulling back symmetric Riemannian geometry for data analysis [0.0] データセットの理想的なデータ解析ツールは、非線形幾何学を考慮すべきである。
非線型幾何学を考慮に入れたリッチな数学的構造は、データ幾何学を捉えることができることが示されている。
ユークリッド空間のデータのために最初に開発された多くの標準的なデータ解析ツールは、対称リーマン多様体上のデータに効率的に一般化することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:59:55 GMT)
Proximity-induced gapless superconductivity in two-dimensional Rashba
semiconductor in magnetic field [0.0] スピン軌道結合が強い不規則半導体を記述した理論モデルを導入する。
我々のモデルは状態密度と超流動密度の予測を提供する。
我々のモデルは、他の超伝導体-半導体ヘテロ構造のその場パラメーターを探索するために使用できる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:49:51 GMT)
Prompt Selection and Augmentation for Few Examples Code Generation in Large Language Model and its Application in Robotics Control [0.0] プロンプトとステップバイステップ推論は、Large Language Models(LLMs)の機能を強化した。
本稿では,数学的推論とロボットアーム操作の改善を目的とした,迅速な選択と拡張アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:13:29 GMT)
Prediction of Wort Density with LSTM Network [0.0] 本稿では,手動データ収集における誤差を低減するために,センサによるウール密度測定を支援するシステムを提案する。
ワート密度を直接測定する代わりに、圧力や温度などの安価な標準センサーによって得られた測定値から密度を計算する方法を開発した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 06:36:33 GMT)
Practically adaptable CPABE based Health-Records sharing framework [0.0] CPABEとOAuth2.0をベースとした、効率的なアクセス制御と認可のためのフレームワークを提案し、単一のクライアントアプリケーション間でのEHR共有の実現性を改善した。
提案するフレームワークの実装とその分析比較は,性能とレイテンシの最小化の観点から,その可能性を示唆している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:23:17 GMT)
Phononic bright and dark states: Investigating multi-mode light-matter
interactions with a single trapped ion [0.0] この研究は、単一の閉じ込められたイオンの有界運動によって、マルチモードの明るい状態と暗い状態が形成された最初の例である。
本稿では,量子情報処理における手法の可能性を強調した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:51:48 GMT)
On the rational invariants of quantum systems of $n$-qubits [0.0] 局所対称性群の作用に関して不変な混合状態の空間上の有理函数は、絡み合いの詳細な尺度と見なすことができる。
そのような不変な有理関数の体は、複素数に対して純粋に超越的であり、超越次数 4n − 2n-1$ を持つことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:18:53 GMT)
On the construction of a quantum channel corresponding to
non-commutative graph for a qubit interacting with quantum oscillator [0.0] 非可換グラフの理論に基づく誤り訂正を考える。
我々はPOVMの線形エンベロープとして非可換グラフを生成する量子チャネルを構築する。
このモデルでは、誤差補正部分空間を決定する量子斜めは明示的な表現を持つ。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:55:03 GMT)
On the Preservation of Africa's Cultural Heritage in the Age of
Artificial Intelligence [0.0] 本論文は,口頭伝承からデジタル時代への知識の普及の過程を辿り,言語の重要性と文化の多様性を浮き彫りにしたものである。
また、デジタル技術が記憶、コミュニケーション、文化保存に与える影響を探求し、アフリカなどにおけるデジタル文化(デジタル文化ではなく)の文化を促進する必要性を強調している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:18:40 GMT)
On the Approximation of Kernel functions [0.0] 論文はカーネル自体の近似に対処する。
単位立方体上のヒルベルト・ガウス核に対して、この論文は関連する固有関数の上界を確立する。
この改良により、Nystr"om法のような低階近似法が確かめられる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:50:07 GMT)
Nondestructive, quantitative viability analysis of 3D tissue cultures
using machine learning image segmentation [0.0] 本稿では,3次元培養における細胞生存率の定量化のための画像処理アルゴリズムについて述べる。
提案アルゴリズムは,1対の人的専門家に対して,数日にわたる全体像と培養マトリクスの合成において,同様の性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:12:25 GMT)
Node-weighted Graph Convolutional Network for Depression Detection in
Transcribed Clinical Interviews [0.0] グラフ畳み込みネットワーク(GCN)における自己接続エッジの重み付けのための簡単なアプローチを提案する。
本研究は, 転写検査によるうつ病検出に対する効果を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:56:47 GMT)
Neural Bradley-Terry Rating: Quantifying Properties from Comparisons [0.0] 我々は未知のアイテムの特性を定量化し評価する新しい機械学習フレームワークであるNeural Bradley-Terry Rating (NBTR)を紹介した。
提案手法はBradley-Terryモデルとニューラルネットワーク構造をシームレスに統合する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:45:41 GMT)
Multiset tomography: Optimizing quantum measurements by partitioning
multisets of observables [0.0] 測定回数を最小化するために、必要な繰り返しを考慮して観測可能量の多重集合を考える必要があることを示す。
マルチセットトモグラフィーは2次的改善が期待できるが,実現可能である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:01:48 GMT)
Multimode-cavity picture of non-Markovian waveguide QED [0.0] 非マルコフ系における導波路-QED問題の記述と解釈を行う。
このフレームワークは、導波管のブロックへの直感的な空間分解に基づいている。
応用として,最近同定された非マルコフ定常状態は,空洞モードを1つだけ保持することで理解可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:00:03 GMT)
Materials science in the era of large language models: a perspective [0.0] 大きな言語モデル(LLM)は、その印象的な能力によってかなりの関心を集めている。
この論文は、様々なタスクや規律にわたる曖昧な要求に対処する能力は、研究者を支援する強力なツールになり得ると論じている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:34:25 GMT)
Many-Body Localization in the Age of Classical Computing [0.0] 本総説では,MBL相の解明を目的とした最近の数値調査について述べる。
ドリフトは、多体系の力学で観察される熱化や非消滅輸送の傾向に関連している。
混乱した多体システムにおける熱化とその故障に関する疑問は、さらなる探査のために開放された領域である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:00:06 GMT)
MP2-based composite extrapolation schemes can predict core-ionization
energies for first-row elements with coupled-cluster level accuracy [0.0] X線光電子分光法(XPS)は、中核電子結合エネルギー(CEBE)を測定し、化学環境と結合に関する元素特異的な洞察を明らかにする。
本研究は,CEBEの完全基底集合(CBS)限界に対する外挿のための基底集合の選択を系統的に検討する。
Delta$CC-$Delta$MP2差分で補正された大規模で$Delta$MP2を使用する別の合成スキームは、0.02 eVで最適に外挿された$Delta$CC CEBEを定量的に回収することができる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:27:57 GMT)
MOAB: Multi-Modal Outer Arithmetic Block For Fusion Of Histopathological
Images And Genetic Data For Brain Tumor Grading [0.0] 脳腫瘍は、その成長に基づいて、異なるグレードに分類することができる。
グレーディングは組織像に基づいて行われ、患者の予後の最も重要な予測因子の1つである。
腫瘍の悪性度を予測するために, 異なるモードの潜在表現を組み合わせ, 算術演算に基づく新しいMOAB(Multi-modal Outer Arithmetic Block)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 00:33:28 GMT)
Learning and Decision-Making with Data: Optimal Formulations and Phase
Transitions [0.0] 歴史的データのみを利用できる場合に最適学習と意思決定の定式化を設計する問題を考察する。
我々は3つの異なるアウト・オブ・サンプル・パフォーマンス・レジームの存在を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:28:38 GMT)
LSTM-Based Text Generation: A Study on Historical Datasets [0.0] この研究は、LSTMベースのモデルが歴史的データセットに基づいて訓練されると、言語的に豊かで文脈的に関係のあるテキストを生成できることを示した。
シェイクスピア作品からテキストを予測する際のモデルの精度は0.9125であり、誤り率の低いことを示している。
モデルのトレーニング時間は100で、Nietzscheデータセットの効率を反映している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:25:01 GMT)
Krylov complexity for non-local spin chains [0.0] 本研究では、Isingモデルの異なる非局所バージョンにおけるKrylov複雑性を用いた演算子成長について検討する。
非局所性は演算子をすべてのサイトへ高速にスクランブルさせる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:11:27 GMT)
Killing versus branching: Unexplored facets of diffusive relaxation [0.0] 本研究では,Fynman-Kac経路積分核関数の緩和ダイナミクスを,殺傷を伴う分岐拡散過程の観点から解析する。
このことは、条件付きブラウン運動に対する平衡緩和の許容パスワイズ記述に新しい光を放つ。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:07:38 GMT)
Isometric tensor network optimization for extensive Hamiltonians is free
of barren plateaus [0.0] 等尺テンソルネットワーク状態(TNS)のエネルギー最適化にはバレンプラトーが存在しないことを示す。
TNSは、強相関量子物質の効率的な量子計算に基づく研究に期待できるルートである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 22:24:32 GMT)
Intra-Section Code Cave Injection for Adversarial Evasion Attacks on Windows PE Malware File [0.0] 本研究は,Windows PE のマルウェアファイルのセクション(区間内)内にコード穴を注入して,対向的摂動の空間を作る手法を提案する。
さらに、PEファイル内にコードローダが注入され、実行中に敵のマルウェアを元の形式に戻す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 04:34:42 GMT)
Improving deep learning with prior knowledge and cognitive models: A
survey on enhancing explainability, adversarial robustness and zero-shot
learning [0.0] 我々は、敵の防御を実現するために、現在および新興の知識インフォームドおよび脳にインスパイアされた認知システムについてレビューする。
脳に触発された認知法は、人間の心を模倣する計算モデルを用いて、人工知能や自律ロボットの知的な行動を強化する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:11:00 GMT)
Improving Speaker Assignment in Speaker-Attributed ASR for Real Meeting
Applications [0.0] 本稿では,実生活シナリオにおける話者分散ASR(SA-ASR)システムの最適化を目的とした新しい研究を提案する。
本稿では,Voice Activity Detection (VAD), Speaker Diarization (SD), SA-ASRを含む実生活用パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:11:29 GMT)
High-fidelity state transfer via quantum walks from delocalized states [0.0] 本研究では,有界1次元経路上に配置された量子ウォークによる状態伝達について検討する。
開始位置と反足脚位置を重畳した状態では,長期間にわたり高い忠実度を保っている。
また、離散時間量子ウォークを探索し、ウォーク全体を通して量子ビットの忠実度を評価する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:29:10 GMT)
Heat transport in the quantum Rabi model: Universality and ultrastrong
coupling effects [0.0] 量子Rabiモデルにおける熱浴との弱い相互作用における熱輸送は、クビット・オシレータ結合によって制御される。
線形伝導率と温度の普遍性は、Tlesssim T_K$で、結合依存の近藤様温度でT_K$である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:00:47 GMT)
Generation of complete graph states in a spin-$1/2$ Heisenberg chain
with a globally optimized magnetic field [0.0] 我々は,時間変化磁場を受けるスピン$1/2$ハイゼンベルク$XX$鎖を用いて,多粒子完全グラフ状態を生成する方法を提案する。
我々のスキームは、量子最適制御理論によって促進されるリアルタイム磁場形成と、原子間の最も近い隣り合う相互作用にのみ依存する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 21:35:55 GMT)
Gaussian process regression with Sliced Wasserstein Weisfeiler-Lehman
graph kernels [0.0] 教師付き学習は近年、計算物理学の分野で大きな注目を集めている。
伝統的に、そのようなデータセットはメッシュとして与えられる入力で構成され、多くのノードが問題幾何学を表す。
つまり、教師付き学習モデルは、ノード属性の連続した大きなスパースグラフを処理できなければならない。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:16:24 GMT)
GRITv2: Efficient and Light-weight Social Relation Recognition [0.0] 本研究は、グラフベースリレーショナル推論変換器(GRIT)の解析と改善に焦点を当てる。
PISC-fine データセットを用いて総合的アブレーション研究を行い,GRITv2 の効率と性能の改善について検討した。
GRITモデルにいくつかの特徴を導入し、新しいベンチマークをGRITv2-L(大型)とGRITv2-S(小型)の2つのバージョンで分析する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:49:59 GMT)
Free fermions beyond Jordan and Wigner [0.0] 正確なスペクトルを計算し、エレガントなグラフ理論の構成を一般化する。
また、この族が N=2 格子超対称性を持つことを説明する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 11:49:25 GMT)
Framework for Learning and Control in the Classical and Quantum Domains [0.0] 我々は,学習と制御を形式的に関連付ける枠組みを構築し,学習が制御にどう役立つかを示す。
我々のフレームワークは、古典的および量子制御と学習のネクサスにおける興味深い未解決問題を特定するのに役立ちます。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 23:25:13 GMT)
Fooling Neural Networks for Motion Forecasting via Adversarial Attacks [0.0] 動き予測タスクは、小さな摂動と単純な3次元変換の影響を受けやすいことを示す。
従来のCNNモデルと同様に、動き予測タスクは小さな摂動や単純な3次元変換の影響を受けやすいと結論付けている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:37:39 GMT)
First-Order Phase Transition of the Schwinger Model with a Quantum
Computer [0.0] 格子シュウィンガーモデルにおける一階位相遷移を位相的$theta$-termの存在下で検討する。
本研究では, モデルの位相構造を明らかにする観測可能な電場密度と粒子数が, 量子ハードウェアから確実に得られることを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:25:15 GMT)
Fast classical simulation of quantum circuits via parametric rewriting
in the ZX-calculus [0.0] 高速なGPU並列性を利用して古典シミュレーションの最終段階を迅速に行うことが可能であることを示す。
我々は,古典的シミュレーションタスクに対して,非パラメトリック手法と比較して,100倍の高速化を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:44:59 GMT)
Equivariant Variational Quantum Eigensolver to detect Phase Transitions
through Energy Level Crossings [0.0] 我々は、全スピンと翻訳対称性を保存し、一重項および三重項励起状態を正確に記述する等変量子回路を導入する。
また、ノイズが変動状態に与える影響も評価し、ゼロノイズ補間のような従来の緩和技術が物理的特性を確実に回復することを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 18:51:57 GMT)
Entanglement entropy of two disjoint intervals and spin structures in
interacting chains in and out of equilibrium [0.0] 我々は、相互作用するスピン鎖のパラダイム、ハイゼンベルクスピン-$frac12$ XXZ モデルを参照系とする。
例えば、空隙のない XXZ ハミルトニアンのフェルミオン類似体は、連続的なスケーリング極限において、質量のないチューリングモデルによって記述される。
スピンブロックのエントロピーを用いて、基礎となる無質量チューリングモデルのスピン構造を明らかにする方法を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:55:36 GMT)
Ensemble inequivalence in long-range quantum systems [0.0] アンサンブルの不等式は、システムを記述する統計的アンサンブルによって異なる熱力学特性を観測する可能性である。
ここでは、長距離量子強磁性体のアンサンブル非等価性の例を示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:45:59 GMT)
Enhancing Joint Motion Prediction for Individuals with Limb Loss Through
Model Reprogramming [0.0] 手足の喪失による運動障害は、世界中の何百万人もの個人が直面している重要な課題である。
人工装具などの高度な補助技術の開発は、切断者の生活の質を大幅に向上させる可能性がある。
このような技術の設計において重要な要素は、行方不明肢の基準関節運動の正確な予測である。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:10:45 GMT)
Enhancing Image Caption Generation Using Reinforcement Learning with
Human Feedback [0.0] 本研究では,人間に好まれるキャプションを生成するために,ディープニューラルネットワークモデルの性能を増幅する潜在的手法を検討する。
これは、教師付き学習と強化学習と人間のフィードバックを統合することで達成された。
我々は、人間の協調型生成AIモデル分野における継続的な進歩に寄与することを願って、我々のアプローチと結果のスケッチを提供する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 13:57:05 GMT)
Efficient first-order algorithms for large-scale, non-smooth maximum
entropy models with application to wildfire science [0.0] 大規模で非滑らかなMaxentモデルのトレーニングのための新しいアルゴリズムを提案する。
提案アルゴリズムはKullback-Leibler分散を利用して,大規模および非滑らかなMaxentモデルを効率的に学習する。
以上の結果から,我々のアルゴリズムは1桁の精度で芸術の状態を上回ります。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:33:55 GMT)
DivCon: Divide and Conquer for Progressive Text-to-Image Generation [0.0] 拡散駆動型テキスト・ツー・イメージ(T2I)生成は顕著な進歩を遂げた。
本稿では,T2I生成タスクを単純なサブタスクに分解する分割対コンカレント手法を提案する。
提案手法は,複雑なテクスチャプロンプトから複数のオブジェクトを生成する際の制御性と整合性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:24:44 GMT)
Constructing Variables Using Classifiers as an Aid to Regression: An
Empirical Assessment [0.0] 本稿では,初期入力ベクトルに含まれる情報を補完する変数の自動生成手法を提案する。
提案手法を5種類の回帰器を用いて検証し,33種類の回帰データセットで評価した。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 15:44:40 GMT)
Confinement of $N$-body systems and non-integer dimensions [0.0] 3次元量子系のスクイーズ過程は、外部磁場なしで、次元が非整数値を取ることができる$d$-methodによって記述することができる。
まず、両手法をN$粒子に一般化し、次元間の遷移を3$以下とする。
いずれの場合も、この2つの手法の導出した解析関係は非常にうまく機能することがわかった。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 08:52:48 GMT)
Coexistence of nonequilibrium density and equilibrium energy
distribution of quasiparticles in a superconducting qubit [0.0] 超伝導量子ビットで典型的に観測される準粒子の密度は、多くの桁の平衡で期待される値を超える。
ジョセフソン接合の両面の超伝導ギャップに差があるトランスモン量子ビットにおける電荷-パリティスイッチングの熱的活性化を測定する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 20:07:50 GMT)
COOD: Combined out-of-distribution detection using multiple measures for
anomaly & novel class detection in large-scale hierarchical classification [0.0] 異常および新しいクラスであるOOD(High-perform Out-of-distribution)の検出は、分類モデルの実用上重要な前提条件である。
教師付きモデルを用いて,個々のOOD測度を1つの組み合わせOOD測度に組み合わせる枠組みを提案する。
以上の結果から,COODはTPR@1%のFPRにおいて,最先端のOOD対策を含む個人よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:26:35 GMT)
Bond-Order Density Wave Phases in Dimerized Extended Bose-Hubbard Models [0.0] ボンドオーダー密度波位相(BODW)はその対称性の破れと位相特性の点で特徴づけられる。
我々の研究は、相互作用するBODW相と非相互作用するBODW相の間の橋渡しを提供し、二量体格子における長距離相互作用の重要性を強調する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:15:18 GMT)
Biphoton State Reconstruction via Phase Retrieval Methods [0.0] 自発パラメトリックダウン変換によって生じる双光子の空間構造を推測する方法を示す。
2階相関の空間分解解析により、ポンプのモジュラーを分離し、2光子状態への位相整合寄与を得られる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 16:56:37 GMT)
Authorship and the Politics and Ethics of LLM Watermarks [0.0] 本稿では,透かし方式の実践と活用の哲学的・政治的・倫理的影響について考察する。
背景として、LLM(LLM)と人間の両方を含む著者の定義が提案されている。
民間の透かしは、従来の著作者決定の基準とは相容れない、著作者決定のための徹底的な権利を民間企業に与える可能性があると論じられている。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 10:37:39 GMT)
Anisotropic Neural Representation Learning for High-Quality Neural
Rendering [0.0] 本稿では、学習可能なビュー依存機能を利用してシーン表現と再構成を改善する異方性ニューラル表現学習法を提案する。
我々の手法は柔軟であり、NeRFベースのフレームワークにプラグインできる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 02:22:50 GMT)
An Elemental Ethics for Artificial Intelligence: Water as Resistance Within AI's Value Chain [0.0] 水集約型データセンタ、汚染鉱物抽出、e-wasteダンピングは、AIのフットプリントの不可避な部分である。
私は、AIが燃料とする環境被害の影響を受ける地域に目を向け、地元の活動家から生じる抵抗の倫理を見極めます。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:30:22 GMT)
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages [0.0] 大規模言語モデル(LLM)は、自然言語処理タスクにおいて驚くほどの習熟度を示している。
LLMは、トレーニングデータが少ないため、低リソースの言語でよく機能するのに苦労することが多い。
本研究では,世界5000万人以上の人々が話す言語であるAmharicを話すためのLLaMA-2の訓練について検討する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 01:04:36 GMT)
Accurate Crystal Structure Prediction of New 2D Hybrid Organic Inorganic
Perovskites [0.0] 低次元有機-無機ペロブスカイト(HOIP)は、光吸収と発光の両面において、電子的に活性な材料として期待できるクラスである。
我々は,新しい2次元HOIPの構造を予測するための,正確で,効率的で,伝達可能で,広く適用可能な機械学習の原子間ポテンシャル(MLIP)を提案する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:39:08 GMT)
Absence of ground states for anions [0.0] N$電子ハミルトニアン$H(N, Z)$と総核電荷$Z$は、基底状態エネルギー$E(N, Z)$が$E(N, Z)=E(N-1, Z)$を$Z=N-1$としたとき、正規化可能な基底状態を持たないことを示す。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:40:23 GMT)
A unified diagrammatic approach in Liouville space to quantum transport
for bosonic and fermionic reservoirs [0.0] リウヴィル空間のマスター方程式形式に基づく量子輸送の図解的アプローチ
レッドフィールド理論は、部分的および完全な世俗的マスター方程式を議論して、2階に復元される。
非自明な輸送特徴は、クビットオシレータの変形と結合強度の相互作用の結果現れる。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 17:11:31 GMT)
A transductive few-shot learning approach for classification of digital
histopathological slides from liver cancer [0.0] 本論文は,2次元病理組織パッチの分類法として,少数ショット学習を用いた新しいアプローチを提案する。
病理組織学スライドにスライディングウインドウ手法を適用することにより,トランスダクティブラーニングの実践的メリットを解説する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 12:17:58 GMT)
A dark-field setup for the measurement of light-by-light scattering with
high-intensity lasers [0.0] 我々は、2つの光高強度レーザービームの衝突における光散乱を測定するための装置を提唱した。
我々の装置は、両レーザービームが衝突するのと同じ集束光学を用いており、単一光子レベルの非線形量子真空応答を検出するために暗視野アプローチを採用している。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 14:33:12 GMT)
A Solvable Model of Quantum Darwinism-Encoding Transitions [0.0] 我々は、入力キュービットが参照に絡み合う拡大木上のランダムなクリフォード回路を考える。
このモデルには量子ダーウィン主義のフェーズがあり、そこでは出力キュービットの任意の小さな分数から参照に関する古典的な情報の1つのビットを検索することができる。
本研究は,環境が符号化システム上に出現する変化モデルに対して,誘導位相遷移(MIPT)の測定手法について検討する。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 19:30:40 GMT)
A Mathematical Framework for the Problem of Security for Cognition in
Neurotechnology [0.0] インプラント可能なデバイス、非侵襲的なモニタリング、非侵襲的な治療はすべて、個人の認知のプライバシーと自律性を侵害する可能性を持っている。
多くの科学者や医師がこの問題に対処するよう呼びかけているが、適用の努力は限られている。
認知セキュリティに対処するための科学と工学の努力を妨げる大きな障壁は、関連する問題を記述し分析する明確な手段がないことである。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 03:44:18 GMT)
3DRef: 3D Dataset and Benchmark for Reflection Detection in RGB and
Lidar Data [0.0] 本稿では,マルチリターンライダー,RGB画像,および2D/3Dセマンティックラベルの5万以上のサンプルを含む,最初の大規模3D反射検出データセットを提案する。
提案したデータセットは, 高精度なグローバルアライメント, マルチモーダルデータ, 多様な反射物体や材料を備えた総合的なテストベッドを提供することにより, 反射検出を推し進める。
論文参考訳(メタデータ) (Mon, 11 Mar 2024 09:29:44 GMT)