Kosmos-G: Generating Images in Context with Multimodal Large Language Models [117.0] 現在の被写体駆動画像生成法では、テストタイムチューニングが必要であり、インターリーブされたマルチイメージとテキスト入力を受け付けない。
本稿では,マルチモーダル大規模言語モデルの高度なマルチモーダル認識機能を活用するモデルであるKosmos-Gを提案する。
Kosmos-Gは、インターリーブされたマルチイメージとテキスト入力によるゼロショットの主観的生成の印象的な能力を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:38:21 GMT)
HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion [114.2] 本稿では,高リアリズムと多彩なレイアウトの人体画像を生成する統一的なフレームワークHyperHumanを提案する。
本モデルは,統合ネットワークにおける画像の外観,空間的関係,幾何学の連成学習を強制する。
我々のフレームワークは最先端の性能を生み出し、多様なシナリオ下で超現実的な人間の画像を生成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:02:21 GMT)
GGRt: Towards Generalizable 3D Gaussians without Pose Priors in Real-Time [112.3] GGRtは、現実のカメラポーズの必要性を軽減する、一般化可能な新しいビュー合成のための新しいアプローチである。
最初のポーズフリーの一般化可能な3D-GSフレームワークとして、GGRtは$ge$5 FPSで、リアルタイムレンダリングは$ge$100 FPSで実現している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:47:35 GMT)
Boundary Matters: A Bi-Level Active Finetuning Framework [100.5] アクティブファインタニングの概念は、限られた予算内でモデルファインタニングに最も適したサンプルを選択することを目的としている。
従来のアクティブな学習手法は、バッチ選択に固有のバイアスがあるため、この設定で苦労することが多い。
そこで本研究では,アノテーションのサンプルを1ショットで選択するバイレベルアクティブファインタニングフレームワークを提案し,その2段階として,多様性のためのコアサンプル選択と不確実性のための境界サンプル選択を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:19:15 GMT)
How Powerful Potential of Attention on Image Restoration? [98.0] FFNを使わずに注意機構の可能性を探るため,実験的検討を行った。
本研究では,FFNを使わずに3段階にわたって注意を連続的に計算する連続スケーリング注意法(textbfCSAttn)を提案する。
我々の設計は、注意機構をよく調べ、いくつかの単純な操作がモデルの性能に大きく影響することを明らかにする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:23:12 GMT)
How Many Pretraining Tasks Are Needed for In-Context Learning of Linear Regression? [92.9] 様々なタスクで事前訓練されたトランスフォーマーは、顕著なインコンテキスト学習(ICL)能力を示す。
線形回帰のための線形パラメータ化単一層線形アテンションモデルの事前学習を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:01:17 GMT)
Mastering Text, Code and Math Simultaneously via Fusing Highly Specialized Language Models [92.9] 大規模言語モデル(LLM)は、3つのドメインすべてにまたがって高いパフォーマンスを同時に達成しようと試みている。
本稿では,すでに高度に特殊化されているモデルを融合する手法を提案する。
提案されているハウジングフレームワークであるUltraFuserは、すでに言語、コーディング、数学について十分に訓練されている3つの異なるスペシャリストで構成されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:22:31 GMT)
Online GNN Evaluation Under Test-time Graph Distribution Shifts [92.4] オンラインGNN評価という新たな研究課題は、よく訓練されたGNNが現実世界の未ラベルグラフに一般化する能力について、貴重な洞察を提供することを目的としている。
我々は、よく訓練されたGNNモデルのテスト時間一般化誤差を推定するために、LeBeDと呼ばれる効果的な学習行動不一致スコアを開発する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:28:08 GMT)
Horizon-Free Regret for Linear Markov Decision Processes [92.0] 最近の一連の研究は、強化学習における残念な境界が(ほぼ)計画的地平から独立していることを示している。
我々は、人気のある線形マルコフ決定過程(MDP)設定に対して、最初の地平面自由境界を与える。
遷移モデルを明示的に推定し、不均一な値関数を計算する先行研究とは対照的に、直接値関数と信頼集合を推定する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:50:58 GMT)
PASTA: Towards Flexible and Efficient HDR Imaging Via Progressively Aggregated Spatio-Temporal Aligment [91.4] PASTAは、HDRデゴスティングのためのプログレッシブアグリゲーションアグリゲーション・時空間アライメントフレームワークである。
提案手法は,特徴分散中の階層的表現を活用することにより,有効性と効率性を実現する。
実験結果から,従来のSOTA法よりもPASTAの方が視覚的品質と性能の両方で優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:05:29 GMT)
Softmax-free Linear Transformers [90.8] 視覚変換器(ViT)は、視覚知覚タスクの最先端を推し進めている。
既存の手法は理論的に欠陥があるか、視覚認識に経験的に効果がないかのいずれかである。
我々はSoftmax-Free Transformers (SOFT) のファミリーを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:52:40 GMT)
Think Twice Before Assure: Confidence Estimation for Large Language Models through Reflection on Multiple Answers [90.7] 本稿では,複数の候補回答の信頼性を徹底的に評価し,不正確な回答に対する過度な信頼を緩和する新しいパラダイムを提案する。
まず, LLMに各回答の正当性を反映し, 正当性を付与するように指示し, 総合的信頼度推定のための正当性を集約する2段階の枠組みを導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:38:26 GMT)
KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.2] KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:44:56 GMT)
Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond [87.2] 我々の目標は、マルチモーダルパーソナライゼーションシステム(UniMP)のための統一パラダイムを確立することである。
我々は、幅広いパーソナライズされたニーズに対処できる汎用的でパーソナライズされた生成フレームワークを開発する。
我々の手法は、パーソナライズされたタスクのための基礎言語モデルの能力を高める。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:21:31 GMT)
Tangent Bundle Convolutional Learning: from Manifolds to Cellular Sheaves and Back [84.6] この畳み込み操作に基づいて,タンジェントバンドルフィルタとタンジェントバンドルニューラルネットワーク(TNN)を定義する。
タンジェントバンドルフィルタは、スカラー多様体フィルタ、グラフフィルタ、標準畳み込みフィルタを連続的に一般化するスペクトル表現を許容する。
提案したアーキテクチャが様々な学習課題に与える影響を数値的に評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:00:45 GMT)
Open-world Machine Learning: A Review and New Outlooks [83.6] 本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:22:07 GMT)
FDGaussian: Fast Gaussian Splatting from Single Image via Geometric-aware Diffusion Model [81.0] FDGaussianは、シングルイメージ3D再構成のための新しい2段階フレームワークである。
最近の手法では、通常、事前訓練された2次元拡散モデルを用いて、入力画像から可塑性な新しいビューを生成する。
我々は,FDGaussianが様々な視点で高一貫性の画像を生成し,高品質な3Dオブジェクトを再構成することを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:24:36 GMT)
Enhancing Chain-of-Thoughts Prompting with Iterative Bootstrapping in Large Language Models [81.0] 大規模言語モデル (LLM) は、ステップ・バイ・ステップ・チェーン・オブ・シークレット (CoT) をデモンストレーションとして組み込むことで、様々な推論タスクにおいて高い効果的な性能を達成することができる。
本稿では,イターCoT (Iterative bootstrapping in Chain-of-Thoughts Prompting) を導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:28:13 GMT)
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models [79.5] 大規模言語モデル(LLM)は、強力な多言語機能を示している。
トレーニングコーパスの不均衡のため、主に英語中心である。
我々はNLPタスクから実際のユーザクエリまで評価を拡張した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:47:39 GMT)
Control of an environmental spin defect beyond the coherence limit of a central spin [79.2] 電子スピンレジスタのサイズを拡大するためのスケーラブルなアプローチを提案する。
我々は, 中心NVのコヒーレンス限界外における未知電子スピンの検出とコヒーレント制御を実証するために, このアプローチを実験的に実現した。
我々の研究は、ナノスケールセンシングを推進し、誤り訂正のための相関ノイズスペクトロスコピーを有効にし、量子通信のためのスピンチェーン量子ワイヤの実現を促進するため、より大きな量子レジスタを工学的に開発する方法を開拓する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:21:04 GMT)
Texture-GS: Disentangling the Geometry and Texture for 3D Gaussian Splatting Editing [79.1] 3Dガウススプラッティングは画期的なアプローチとして登場し、高忠実度再構成とリアルタイムレンダリングの能力に注目が集まっている。
そこで我々は,テクスチャ-GSという新しいアプローチを提案し,その外観を3次元表面上にマッピングされた2次元テクスチャとして表現することで幾何学から切り離す。
提案手法は,高精細な外観の編集を容易にするだけでなく,コンシューマレベルのデバイス上でのリアルタイムレンダリングも実現している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:42:55 GMT)
RAFT: Adapting Language Model to Domain Specific RAG [75.6] 本稿では、ドメイン内の「オープンブック」設定において、モデルが質問に答える能力を改善するためのトレーニングレシピであるRetrieval Augmented FineTuning(RAFT)を紹介する。
RAFTは、質問に答える助けとなる関連文書から、動詞の正しいシーケンスを引用することで、これを達成します。
RAFTは、PubMed、HotpotQA、Gorillaデータセット全体のモデルのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:26:02 GMT)
Think Before You Speak: Cultivating Communication Skills of Large Language Models via Inner Monologue [73.7] 大規模言語モデル(LLM)は、流動的で一貫性があり多様な応答を生成する。
しかし、それらは重要な能力、コミュニケーションスキルを欠いている。
本稿は,内的モノローグによるLLMのコミュニケーション能力向上を目的としている。
実験の結果,提案したCSIM戦略はバックボーンモデルを改善し,ベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:30:30 GMT)
DevBench: A Comprehensive Benchmark for Software Development [72.2] DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。
GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。
本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:23:34 GMT)
XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8] 低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:30:28 GMT)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.6] LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:55:47 GMT)
MYTE: Morphology-Driven Byte Encoding for Better and Fairer Multilingual Language Modeling [70.3] 多様な言語にまたがる一貫した大きさのセグメントで同一情報をエンコードする新しいパラダイムを導入する。
MYTEは99の言語すべてに対して短いエンコーディングを生成する。
これにより、多言語LMの性能が向上し、多言語間でのパープレキシティギャップが減少する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:21:11 GMT)
Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [68.0] 我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:22:02 GMT)
Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.5] この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:30:14 GMT)
TriSum: Learning Summarization Ability from Large Language Models with Structured Rationale [66.0] 本稿では,大規模言語モデルのテキスト要約能力を,コンパクトで局所的なモデルに抽出するフレームワークであるTriSumを紹介する。
本手法は,様々なベンチマーク上での局所モデル性能を向上させる。
また、要約の合理性に関する洞察を提供することで、解釈可能性も向上する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:36:38 GMT)
Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation [65.3] そこで本研究では,潜在的な人的原因を考慮に入れた各種命令誤りを導入した新しいベンチマークデータセットを提案する。
我々のベンチマークで最先端のVLN-CE法を評価する場合、成功率において顕著な性能低下(最大-25%)が観測される。
また, エラー検出とローカライゼーションにおいて, 最適な性能を実現するための, クロスモーダルトランスフォーマーアーキテクチャに基づく効率的な手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:36:15 GMT)
GigaPose: Fast and Robust Novel Object Pose Estimation via One Correspondence [64.8] GigaPoseは、RGB画像におけるCADベースの新しいオブジェクトポーズ推定のための高速で堅牢で正確な方法である。
提案手法では,通常の3次元ではなく,2自由度空間でテンプレートをサンプリングする。
最先端の精度を実現し、既存の精錬手法とシームレスに統合することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:05:31 GMT)
ObjectCompose: Evaluating Resilience of Vision-Based Models on Object-to-Background Compositional Changes [64.6] 本研究では,視覚モデルによる多様な背景背景環境に対するレジリエンスを評価する。
我々は、画像から画像への変換、画像から画像への変換、および画像から画像への変換モデルの生成機能を利用して、オブジェクトから背景への変換を自動的に生成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:43:21 GMT)
Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification [64.4] マルチモーダルオブジェクトReIDのための視覚変換器から多様なトークンを選択するための,textbfEDITORという新しい学習フレームワークを提案する。
我々のフレームワークはマルチモーダルオブジェクトReIDに対してより差別的な機能を生成することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:44:35 GMT)
SphereDiffusion: Spherical Geometry-Aware Distortion Resilient Diffusion Model [63.7] 制御可能な球状パノラマ画像生成は、様々な領域でかなりの応用可能性を持っている。
本稿では,これらの課題に対処するために,SphereDiffusionの新しいフレームワークを提案する。
Structured3Dデータセットの実験では、SphereDiffusionは制御可能な球面画像生成の品質を大幅に改善し、平均して約35%のFIDを相対的に削減している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:26:46 GMT)
LLM Inference Unveiled: Survey and Roofline Model Insights [62.9] 大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:58:58 GMT)
DiffMAC: Diffusion Manifold Hallucination Correction for High Generalization Blind Face Restoration [62.4] 視覚障害者の視力回復を支援するための拡散情報拡散フレームワークを提案する。
DiffMACは、多種多様な劣化シーンと異種ドメインにおいて、高度な顔の復元を実現する。
結果は,最先端手法よりもDiffMACの方が優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:44:15 GMT)
LightIt: Illumination Modeling and Control for Diffusion Models [61.8] 我々は、画像生成のための明示的な照明制御方法であるLightItを紹介する。
最近の生成法では照明制御が欠如しており、画像生成の多くの芸術的側面に不可欠である。
本手法は、制御可能で一貫した照明による画像生成を可能にする最初の方法である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:26:33 GMT)
Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.7] CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:33:49 GMT)
TRG-Net: An Interpretable and Controllable Rain Generator [61.3] 本研究は,降雨の基盤となる物理的発生機構を十分に考慮した,新しい深層学習型降雨発生器を提案する。
その意義は、発電機が予想される雨をシミュレートするために雨の本質的な要素を精巧に設計するだけでなく、複雑で多様な雨のイメージに微妙に適応することにある。
提案した雨発生器が発生した雨は, 高品質であるだけでなく, 排水作業や下流作業にも有効であることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:27:39 GMT)
Stimulate the Potential of Robots via Competition [60.7] 本稿では,個々のロボットが競技者から知識を得るのに役立つ,競争力のある学習フレームワークを提案する。
具体的には、競合相手間の競合情報を、有利な行動を学ぶための補助信号として導入する。
さらに,Multiagent-Race環境を構築し,競争環境において訓練されたロボットが,単一ロボット環境でのSoTAアルゴリズムで訓練されたロボットよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:21:39 GMT)
TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document [60.0] テキスト中心タスクに適した大規模マルチモーダルモデル(LMM)であるTextMonkeyを提案する。
ゼロ初期化によるシフトウィンドウアテンションの導入により、高い入力解像度でクロスウィンドウ接続を実現する。
テキストスポッティングとグラウンド化を包含する能力を拡張し、位置情報を応答に組み込むことで、解釈可能性を高める。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:51:30 GMT)
Guess & Sketch: Language Model Guided Transpilation [59.0] 学習されたトランスパイレーションは、手作業による書き直しやエンジニアリングの取り組みに代わるものだ。
確率的ニューラルネットワークモデル(LM)は、入力毎に可塑性出力を生成するが、正確性を保証するコストがかかる。
Guess & Sketch は LM の特徴からアライメントと信頼性情報を抽出し、意味的等価性を解決するためにシンボリック・ソルバに渡す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:03:05 GMT)
CODIS: Benchmarking Context-Dependent Visual Comprehension for Multimodal Large Language Models [59.0] 我々は、自由形式のテキストで提供されるコンテキストを用いて視覚的理解を高めるモデルの有効性を評価するために、CODISと名付けられた新しいベンチマークを導入する。
以上の結果から,MLLMは必ずしも人体性能に劣っていることが示唆された。
このことは、MLLMが視覚を文脈依存的に理解する能力を高めることの必要性を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:19:30 GMT)
Animate Your Motion: Turning Still Images into Dynamic Videos [58.6] 本稿では,マルチモーダル入力を管理する新しい手法であるScene and Motion Conditional Diffusion (SMCD)を紹介する。
SMCDは、認識されたモーションコンディショニングモジュールを組み込み、シーン条件を統合するための様々なアプローチを調査する。
我々のデザインは映像の品質、動きの精度、セマンティック・コヒーレンスを大幅に向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:36:24 GMT)
Meta Operator for Complex Query Answering on Knowledge Graphs [58.3] 我々は、異なる複雑なクエリタイプではなく、異なる論理演算子型が一般化性を向上させる鍵であると主張する。
本稿では,メタ演算子を限られたデータで学習し,様々な複雑なクエリの演算子のインスタンスに適応するメタ学習アルゴリズムを提案する。
実験結果から,メタオペレータの学習は,従来のCQAモデルやメタCQAモデルよりも効果的であることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:54:25 GMT)
DreamLLM: Synergistic Multimodal Comprehension and Creation [58.1] DreamLLMはマルチモーダル大規模言語モデル(MLLM)を初めて実現した学習フレームワークである
DreamLLMは生のインターリーブドドキュメントの生成を促進し、テキストと画像の両方のコンテンツと非構造化レイアウトをモデル化する。
その結果、DreamLLMはフリーフォームインターリーブコンテンツを生成する最初のMLLMとなった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:19:28 GMT)
Strong and Controllable Blind Image Decomposition [57.7] ブラインド画像分解は、画像に存在するすべてのコンポーネントを分解することを目的としている。
ユーザーは著作権保護のために、透かしなどの特定の劣化を保ちたいかもしれない。
制御可能なブラインド画像分解ネットワークというアーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:59:44 GMT)
Whose Side Are You On? Investigating the Political Stance of Large Language Models [56.9] 大規模言語モデル(LLM)の政治的指向性について,8つのトピックのスペクトルにわたって検討する。
我々の調査は、中絶からLGBTQ問題まで8つのトピックにまたがるLLMの政治的整合性について考察している。
この結果から,ユーザはクエリ作成時に留意すべきであり,中立的なプロンプト言語を選択する際には注意が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:02:24 GMT)
MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.8] We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:33:10 GMT)
A Matter of Annotation: An Empirical Study on In Situ and Self-Recall Activity Annotations from Wearable Sensors [56.6] そこで本研究では,Wildデータに着目した4つのアノテーション手法を比較した。
本研究は,異なるラベル付け手法がアノテーションの品質に直接影響を及ぼすことを示す。
アクティビティダイアログと可視化ツールを組み合わせることで,参加者のアクティビティデータを検査し,ラベル付けすることができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:13:42 GMT)
Take Care of Your Prompt Bias! Investigating and Mitigating Prompt Bias in Factual Knowledge Extraction [56.2] 近年の研究では、事前学習言語モデル(PLM)が、事実知識抽出において「急激なバイアス」に悩まされていることが示されている。
本稿では、様々な種類のプロンプトでバイアスを定量化し、その影響を異なるベンチマークで評価する。
提案手法は,推論時間における素早いバイアスを軽減するための表現に基づく手法である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:04:35 GMT)
Autoregressive Queries for Adaptive Tracking with Spatio-TemporalTransformers [55.5] リッチ時間情報は、視覚追跡における複雑なターゲットの出現に不可欠である。
提案手法は,6つの一般的な追跡ベンチマークにおいてトラッカーの性能を向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:39:26 GMT)
Generative Region-Language Pretraining for Open-Ended Object Detection [55.4] 我々は,高密度物体を検出し,その名前を自由形式の方法で生成できるGenerateUというフレームワークを提案する。
本フレームワークはオープン語彙オブジェクト検出手法GLIPに匹敵する結果が得られる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:52:39 GMT)
UNK-VQA: A Dataset and A Probe into Multi-modal Large Models' Abstention Ability [55.2] 本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:18:30 GMT)
Exploring the Potential of Large Language Models in Computational Argumentation [54.9] 計算的議論に関する研究は、主に議論マイニングと議論生成の2つのタイプのタスクを含む。
大規模言語モデルは、文脈を理解し、自然言語を生成する強力な能力を示している。
既存のタスクを6つの主要なカテゴリに分類し、14のオープンソースデータセットのフォーマットを標準化します。
さらに,LLMのエンドツーエンド性能を総合的に評価することを目的とした,対向音声生成のための新しいベンチマークデータセットを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:00:04 GMT)
Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.1] ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:18:43 GMT)
Perceptual Quality Assessment of Virtual Reality Videos in the Wild [53.9] 既存のパノラマビデオデータベースでは、合成歪みのみを考慮し、一定の視聴条件を仮定し、サイズに制限がある。
我々はVRVQW(VR Video Quality in the Wild)データベースを構築した。
我々は,2つの異なる視聴条件下で,139ドルの被験者から,スキャンパスと品質スコアを記録するための正式な心理物理実験を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:16:40 GMT)
Variance-Dependent Regret Bounds for Non-stationary Linear Bandits [52.9] 報酬分布の分散と$B_K$の分散を利用するアルゴリズムを提案する。
Restarted Weighted$textOFUL+$とRestarted$textSAVE+$の2つの新しいアルゴリズムを紹介します。
特に、V_K$が$K$よりはるかに小さい場合、我々のアルゴリズムは、異なる設定下での非定常線形バンドレットの最先端結果よりも優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:36:55 GMT)
BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.5] BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:21:34 GMT)
What Makes Good Collaborative Views? Contrastive Mutual Information Maximization for Multi-Agent Perception [52.4] マルチエージェント認識(MAP)は、複数のソースからのデータを解釈することで、自律システムが複雑な環境を理解することを可能にする。
本稿では,MAPにおける協調的視点の「良い」特性を探求することに焦点を当てた中間的協調について検討する。
中間コラボレーションのための新しいフレームワークCMiMCを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:18:55 GMT)
ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.0] ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:35:05 GMT)
SelfPromer: Self-Prompt Dehazing Transformers with Depth-Consistency [51.9] 本研究は,画像デハージングに有効な深度整合型セルフプロンプトトランスを提案する。
ヘイズ残像とその明確な像の深さが異なるという観測によって動機づけられた。
VQGANに基づくエンコーダ・デコーダネットワークにプロンプト、プロンプト埋め込み、そしてインタプリタを組み込むことにより、より優れた知覚品質を実現することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:31:21 GMT)
Aligning Step-by-Step Instructional Diagrams to Video Demonstrations [51.7] 組立図として表現される(i)命令ステップと、(ii)動画セグメントとを関連付ける新しい設定について考察する。
本稿では,ビデオの微妙な詳細化を学習する,教師付きコントラスト学習手法を提案する。
池田組立におけるIAW実験は, 代替案に対するアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:15:26 GMT)
Deep Neural Networks Tend To Extrapolate Predictably [51.3] ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:35:51 GMT)
A Fixed-Point Approach to Unified Prompt-Based Counting [51.2] 本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:05:44 GMT)
Generation is better than Modification: Combating High Class Homophily Variance in Graph Anomaly Detection [51.1] 異なるクラス間のホモフィリー分布の差は、ホモフィリックグラフやヘテロフィリックグラフよりも著しく大きい。
我々は、この現象を定量的に記述した、クラスホモフィリーバリアンスと呼ばれる新しい計量を導入する。
その影響を軽減するために,ホモフィリーエッジ生成グラフニューラルネットワーク(HedGe)と呼ばれる新しいGNNモデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:26:53 GMT)
GET: Unlocking the Multi-modal Potential of CLIP for Generalized Category Discovery [51.0] テキスト埋め込み合成器(TES)を提案する。
提案手法は,CLIPのマルチモーダルポテンシャルを解放し,すべてのGCDベンチマークにおいて,ベースライン手法よりも大きなマージンで性能を向上する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:40:13 GMT)
Region-aware Distribution Contrast: A Novel Approach to Multi-Task Partially Supervised Learning [50.9] マルチタスク密度予測にはセマンティックセグメンテーション、深さ推定、表面正規推定が含まれる。
既存のソリューションは通常、グローバルなクロスタスク画像マッチングのためのグローバルなイメージ表現の学習に依存している。
本提案では,ガウス分布を用いた地域表現をモデル化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:41:30 GMT)
HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.6] そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的な学習ベースラインは頑健な低レベル政策に支えられた場合,優れた性能を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:45:44 GMT)
Lodge: A Coarse to Fine Diffusion Network for Long Dance Generation Guided by the Characteristic Dance Primitives [50.4] 与えられた音楽に条件付けされた非常に長いダンスシーケンスを生成することができるネットワークであるLodgeを提案する。
提案手法は,グローバルな振付パターンと局所的な動きの質,表現性とのバランスを保ちながら,非常に長いダンスシーケンスを並列に生成することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:59:33 GMT)
Diffusion Models Trained with Large Data Are Transferable Visual Models [49.8] そこで本研究では,適度な量の目標データを用いて,基本的な視覚知覚タスクにおいて顕著な伝達性能を実現することができることを示す。
結果は、様々なタスクや実世界のデータセットにまたがる拡散モデルのバックボーンの顕著な転送可能性を示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:43:21 GMT)
Joint Multimodal Transformer for Dimensional Emotional Recognition in the Wild [49.7] 本研究は,キーベース・クロスアテンションを用いたマルチモーダルトランスフォーマアーキテクチャを用いた新しい音声視覚感情認識システムを提案する。
このフレームワークは、ビデオにおける音声および視覚的手がかり(表情と発声パターン)の相補的な性質を活用することを目的としており、単一のモダリティにのみ依存するよりも優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:23:38 GMT)
SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation [49.7] 本研究は, 背骨と頭部が非階層的であり, 単一スケールの機能で動作するSimPLRを, スケール認識型トランスフォーマーベース検出器により検出できることを示す。
マルチスケールおよびシングルスケールの最先端と比較して、我々のモデルはより大きなキャパシティ(自己監督型)モデルとより事前学習データにより、はるかに良くスケールする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:47:19 GMT)
RGM: A Robust Generalizable Matching Model [49.6] RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:41:08 GMT)
Less is More: One-shot Subgraph Reasoning on Large-scale Knowledge Graphs [49.5] 効率的かつ適応的な予測を実現するために,ワンショットサブグラフリンク予測を提案する。
設計原理は、KG全体に直接作用する代わりに、予測手順を2つのステップに分離する。
5つの大規模ベンチマークにおいて,効率の向上と性能の向上を実現している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:00:12 GMT)
Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.4] No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:16:07 GMT)
Understanding the Double Descent Phenomenon in Deep Learning [49.2] このチュートリアルは、古典的な統計学習の枠組みを設定し、二重降下現象を導入する。
いくつかの例を見て、セクション2では、二重降下において重要な役割を果たすと思われる帰納的バイアスを導入している。
第3節は2つの線形モデルで二重降下を探索し、最近の関連する研究から他の視点を提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:51:24 GMT)
Control and Automation for Industrial Production Storage Zone: Generation of Optimal Route Using Image Processing [49.2] 本稿では,DIPを用いた生産ラインモデルのゾーンに対する産業自動化手法の開発に焦点をあてる。
新カスケード法は、それぞれの段階を適切な方法で定義し、関連する手法を開発に含めることを可能にした。
システムはOpenCVライブラリをベースとしており、Java言語に基づいたオブジェクト指向プログラミング(OOP)プラットフォーム上に実装された人工視覚に焦点を当てたツールである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:50:19 GMT)
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models? [48.0] 本研究では,視覚モデルの知覚領域における空間認識能力に量子化がどう影響するかを検討する。
この結果から,異なるアーキテクチャの量子化に対する感度の相違が明らかになった。
この研究の主な貢献は、ニューラルネットワークの量子化に対する理解を深めることにあります。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:43:03 GMT)
Evaluating Perceptual Distances by Fitting Binomial Distributions to Two-Alternative Forced Choice Data [47.2] クラウドソースの知覚データセットが登場し、三つ子間で画像が共有されないため、ランク付けが不可能になった。
両面分布を用いた2AFC実験において,基礎となる意思決定過程を統計的にモデル化する。
このようにして、三重項ごとに異なる判定数を評価することができ、距離のセットに応じて判断の確率などのメトリクスを計算することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:21:04 GMT)
StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation [47.1] StyleTalkerは音声駆動のトーキングヘッド生成モデルである。
単一の参照画像から話し手の映像を合成することができる。
我々のモデルは、音声ヘッドビデオを印象的な品質で合成することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:48:04 GMT)
SparseFusion: Efficient Sparse Multi-Modal Fusion Framework for Long-Range 3D Perception [47.0] SparseFusionは,スパース3次元特徴を基盤として構築され,より効率的な長距離知覚を実現する新しい多モード融合フレームワークである。
提案したモジュールは,前景オブジェクトが存在可能なグリッドのみを埋める意味的側面と幾何学的側面の両方から疎結合を導入する。
長距離Argoverse2データセットでは、SparseFusionはメモリフットプリントを減らし、密度の高い検出器に比べて約2倍の速度で推論を高速化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:59:10 GMT)
Rough Transformers for Continuous and Efficient Time-Series Modelling [46.6] 実世界の医療環境における時系列データは、典型的には長距離依存を示し、一様でない間隔で観察される。
本稿では,入力シーケンスの連続時間表現で動作するトランスフォーマーモデルのバリエーションであるRough Transformerを紹介する。
Rough Transformersは、Neural ODEベースのモデルの利点を得ながら、バニラアテンションを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:29:45 GMT)
Llemma: An Open Language Model For Mathematics [46.6] 数学のための大きな言語モデルであるLlemmaを紹介します。
MATHベンチマークでは、Llemmaはすべての既知のオープンベースモデルより優れている。
レムマは道具の使用と公式な定理を証明することができるが、それ以上の微調整は行わない。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:14:39 GMT)
AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information [46.2] 本稿では,各アミノ酸/ペプチド間の条件付き相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。
AdaNovoは翻訳後修飾(PTM)によるアミノ酸の同定に優れ、データノイズに対する堅牢性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:46:37 GMT)
Logits of API-Protected LLMs Leak Proprietary Information [46.0] 比較的少数のAPIクエリから,APIで保護されたLLMに関する驚くほど多くの非公開情報を学習することが可能であることを示す。
現代のLLMは、モデル出力を全出力空間の線型部分空間に制限するソフトマックスボトルネックに悩まされている。
これは、安価なコストでいくつかの機能をアンロックするモデルイメージやモデルシグネチャに自らを結び付けていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:07:30 GMT)
Mitigating Dialogue Hallucination for Large Multi-modal Models via Adversarial Instruction Tuning [45.1] 大規模マルチモーダルモデル(LMM)の幻覚は,汎用アシスタントの信頼性を高めるために重要である。
本稿では,従来のユーザ・システム対話によって,このようなLMMの幻覚が著しく悪化することを示す。
幻覚対話を付加したマルチモーダル命令追従データセット上でLMMを頑健に微調整するAdversarial Instruction Tuningを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:27:12 GMT)
Generative Modelling of Stochastic Rotating Shallow Water Noise [45.0] 本稿では, サブグリッドスケールプロセスのパラメータ化に差が生じ, 流体力学の部分方程式のノイズを校正するための一般的な手法を提案する。
亜グリッドスケールプロセスのパラメータ化は、亜グリッドスケール変動に起因する系統的なモデル誤差を表現するために、気象・気候予測の不確実性の推定に必要である。
本手法は,入力データとして使用するモデルの標高変動を考慮した回転浅層水モデルで検証され,数値シミュレーションの結果,このノイズはガウス的ではないことがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:30:29 GMT)
Cognitive Architectures for Language Agents [44.9] 言語エージェントのための認知アーキテクチャ(CoALA)を提案する。
CoALAはモジュラーメモリコンポーネントを備えた言語エージェント、内部メモリと外部環境と相互作用する構造化されたアクションスペース、アクションを選択するための一般的な意思決定プロセスを記述する。
我々は、CoALAを使用して、振り返りによる調査と、最近の多くの作業の組織化を行い、より有能なエージェントに対する行動可能な方向を前向きに特定します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:44:11 GMT)
Using Uncertainty Quantification to Characterize and Improve Out-of-Domain Learning for PDEs [44.9] ニューラル演算子(NO)は特に有望な量子化として出現している。
本研究では,複数のNOをアンサンブルすることで,高いエラー領域を同定し,不確実性の高い推定を行うことができることを示す。
次に、ProbConservフレームワーク内でこれらのよく校正されたUQ推定を使ってモデルを更新するOperator-ProbConservを紹介します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:21:27 GMT)
HawkEye: Training Video-Text LLMs for Grounding Text in Videos [44.9] 我々は,HawkEyeを提案する。HawkEyeは,時間的ビデオグラウンドディングをテキストからテキストまで完全に行う最初のビデオテキストLLMの1つである。
時間的ビデオグラウンドイングに適用可能なトレーニングデータを収集するために,セグメントレベルのキャプションと負のスパンを持つ大規模ビデオテキストコーパスであるInternVid-Gを構築した。
また,ビデオ中のセグメントを粗い粒度で表現する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:58:18 GMT)
Animatable Gaussians: Learning Pose-dependent Gaussian Maps for High-fidelity Human Avatar Modeling [44.6] 強力な2次元CNNと3次元ガウススプラッティングを利用して高忠実度アバターを作成するアバター表現を導入する。
学習されたテンプレートは、ドレスのようなよりゆるい服をモデル化するための衣服に適応する。
我々の手法は、動的で現実的で一般化された外観を持つ生物のようなアバターを作ることができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:32:46 GMT)
Hessian-Free Laplace in Bayesian Deep Learning [44.2] Hessian-free Laplace (HFL)近似は、その分散を推定するために、ログ後部とネットワーク予測の両方の曲率を使用する。
ベイズ深層学習におけるLAの標準的な仮定の下では、HFLはLAと同じ分散を目標とし、事前学習されたネットワークで効率よく再生可能であることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:47:39 GMT)
Skeptic: Automatic, Justified and Privacy-Preserving Password Composition Policy Selection [44.0] パスワード保護システムに強制するパスワード構成ポリシーの選択は、重要なセキュリティ上の決定である。
実際には、この選択は厳密で正当化できるものではなく、システム管理者は直感だけでパスワード構成ポリシーを選択する傾向にある。
本研究では,大量の実世界のパスワードデータから構築されたパスワード確率分布を推定する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:19:08 GMT)
Finetuning Text-to-Image Diffusion Models for Fairness [43.8] 公平性は分布的アライメント問題である。
経験的手法では、職業的プロンプトに対する性別、人種、およびそれらの交叉バイアスを著しく低減する。
我々の手法は絶対的平等を超えた公平性の多様な視点を支えている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:42:39 GMT)
Uncovering the Hidden Cost of Model Compression [43.6] 視覚プロンプティングは、コンピュータビジョンにおける伝達学習の重要な方法として登場した。
モデル圧縮は視覚的プロンプトベース転送の性能に有害である。
しかし、量子化によってモデルが圧縮されるとき、キャリブレーションに対する負の効果は存在しない。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:04:31 GMT)
Skeleton-Based Human Action Recognition with Noisy Labels [43.6] NoiseEraSARは、グローバルなサンプル選択、コティーチング、クロスモーダル・ミックス・オブ・エキスパート戦略を統合している。
提案手法は,確立されたベンチマークの性能向上を実証し,新しい最先端標準を設定した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:42:28 GMT)
Lost in Disclosure: On The Inference of Password Composition Policies [43.2] パスワード構成ポリシーがシステム上でのユーザ・朝鮮語パスワードの分布にどのように影響するかを検討する。
より信頼性の高い結果を生み出すシンプルなアプローチを提案する。
本稿では,この手法を実装したpol-inferを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:37:51 GMT)
Traveling Waves Encode the Recent Past and Enhance Sequence Learning [42.6] 神経活動の進行波は脳全体で様々な領域やスケールで観測されている。
ある物理的に着想を得た仮説は、皮質シートが波動伝播系のように振る舞うことを示唆している。
このギャップを埋めるためのモデルを導入し、Wave-RNN(wRNN)を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:29:44 GMT)
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models [42.6] テキストのプロンプトによって駆動される現実的な3次元物体間相互作用(HOI)を創出する問題に対処する。
まず、入力テキストに条件付けされた人間と物体の両方の動きを生成するための二重分岐拡散モデル(HOI-DM)を開発する。
また,人間と物体の接触領域を予測するためのアベイランス予測拡散モデル(APDM)を開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:24:30 GMT)
Robust Sparse Estimation for Gaussians with Optimal Error under Huber Contamination [42.5] 本研究では,平均推定,PCA,線形回帰に着目したハマー汚染モデルにおけるスパース推定タスクについて検討する。
それぞれのタスクに対して、最適なエラー保証を備えた最初のサンプルと計算効率の良い頑健な推定器を与える。
技術レベルでは、スパース方式における新しい多次元フィルタリング法を開発し、他の応用を見出すことができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:51:27 GMT)
Rethinking Low-quality Optical Flow in Unsupervised Surgical Instrument Segmentation [42.5] ロボット補助手術において,ビデオベースの手術器具セグメンテーションが重要な役割を担っている。
教師なしのセグメンテーションは、光学フローの典型的に低い品質のために区別が難しいモーションキューに大きく依存している。
本研究は,低品質光流の固有の限界にもかかわらず,モデル性能の向上という課題に対処する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:19:02 GMT)
WebQAmGaze: A Multilingual Webcam Eye-Tracking-While-Reading Dataset [42.4] WebQAmGazeは、多言語で低コストなアイトラッキング対応データセットである。
WebQAmGazeには、英語、ドイツ語、スペイン語、トルコ語のテキストを自然に読む幅広い年齢層の600人の参加者によるWebカメラによるアイトラッキングデータが含まれている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:01:25 GMT)
Shifting Focus: From Global Semantics to Local Prominent Features in Swin-Transformer for Knee Osteoarthritis Severity Assessment [42.1] 我々はSwin Transformerの能力を利用して階層的な枠組みを通じて画像内の空間的依存関係を識別する。
我々の新しい貢献は、局所的な特徴表現を精細化し、分類器の最終的な分布に特化することにある。
Knee osteoArthritis (KOA) グレード分類のための2つの確立されたベンチマークを広範囲に検証した結果,本モデルは有意な堅牢性と精度を示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:09:58 GMT)
Towards Generalizable Deepfake Video Detection with Thumbnail Layout and Graph Reasoning [41.4] 社会とサイバーセキュリティに対するディープフェイクの脅威は、重大な公衆の不安を引き起こしている。
本稿では,Thumbnail Layout(TALL)という,エレガントでシンプルだが効果的な戦略を紹介する。
TALLはビデオクリップを予め定義されたレイアウトに変換し、空間的および時間的依存関係の保存を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:48:44 GMT)
Protein Discovery with Discrete Walk-Jump Sampling [41.0] 我々はスムーズなエネルギー関数を学び、ランゲヴィン・マルコフ連鎖モンテカルロの滑らかなデータ多様体からサンプリングし、一段階のデノイングで真のデータ多様体に投影する。
我々の離散ウォーク・ジャンプサンプリング形式は、エネルギーベースモデルの対照的な分散訓練とスコアベースモデルのサンプル品質の改善を組み合わせたものである。
抗体タンパク質生成モデルにおける本手法のロバスト性を評価し, タンパク質生成モデルに分布整合性スコアを導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:16:01 GMT)
CrossGLG: LLM Guides One-shot Skeleton-based 3D Action Recognition in a Cross-level Manner [41.0] 本稿では,大規模言語モデルから生成されたテキスト記述を利用して特徴学習を支援することを提案する。
まず、グローバルテキスト記述を用いて、情報的関節に焦点を当てたスケルトンエンコーダを導出する。
我々は,局所的なテキストと共同特徴の非局所的相互作用を構築し,最後のグローバル表現を形成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:51:35 GMT)
How Suboptimal is Training rPPG Models with Videos and Targets from Different Body Sites? [40.5] 現在のモデルのほとんどは、指先をターゲット/ラベルとして接触PSG測定を用いて、顔ビデオでトレーニングされている。
ニューラルモデルでは,前頭部でトレーニングすると,基底真理PSG信号のモルフォロジーがより良く予測できることが示される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:20:21 GMT)
IMPRINT: Generative Object Compositing by Learning Identity-Preserving Representation [40.3] IMPRINTは、2段階の学習フレームワークでトレーニングされた新しい拡散ベースの生成モデルである。
最初のステージは、オブジェクトエンコーダのコンテキストに依存しない、アイデンティティを保存する事前トレーニングをターゲットにしている。
第2段階では、この表現を利用して、背景に合成されたオブジェクトのシームレスな調和を学ぶ。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:37:04 GMT)
ANIM: Accurate Neural Implicit Model for Human Reconstruction from a single RGB-D image [40.0] ANIMは単視点RGB-D画像から任意の3次元形状を前例のない精度で再構成する新しい手法である。
我々のモデルは、深度情報を活用するためにピクセル整列とボクセル整列の両方の機能から幾何学的詳細を学習する。
実験によると、ANIMはRGB、表面正規、ポイントクラウド、RGB-Dデータを入力として使用する最先端の作業よりも優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:45:38 GMT)
Functional Graph Convolutional Networks: A unified multi-task and multi-modal learning framework to facilitate health and social-care insights [40.0] 本稿では,デジタルヘルスと縦断研究におけるマルチタスクとマルチモーダル学習の複雑さに対処する,関数型グラフ畳み込みネットワーク(funGCN)フレームワークを提案する。
funGCNは複数のエンティティに対して複数変数の長手データを処理する統一的なアプローチを提供し、小さなサンプルサイズであっても解釈可能である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:01:19 GMT)
Has It All Been Solved? Open NLP Research Questions Not Solved by Large Language Models [39.4] 大規模言語モデル(LLM)の最近の進歩は、多くの生成NLPアプリケーションのデプロイを可能にしている。
本稿では,NLP研究の方向性を探索に豊富にまとめる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:10:51 GMT)
T4P: Test-Time Training of Trajectory Prediction via Masked Autoencoder and Actor-specific Token Memory [39.0] 軌道予測は、複数のアクター間の相互作用を考慮することを必要とする難しい問題である。
データ駆動型アプローチは、この複雑な問題に対処するために使われてきたが、テスト期間中に分散シフトの下では信頼性の低い予測に悩まされている。
本研究では,観測データから回帰損失を用いたオンライン学習手法を提案する。
提案手法は,予測精度と計算効率の両方の観点から,既存の最先端オンライン学習手法の性能を超越した手法である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:47:14 GMT)
Ignore Me But Don't Replace Me: Utilizing Non-Linguistic Elements for Pretraining on the Cybersecurity Domain [38.5] サイバーセキュリティ情報はしばしば技術的に複雑で、構造化されていないテキストを通して中継される。
高レベルの専門知識を持つテキストドメインでは、ドメイン内のコーパスを事前訓練することが、ドメインの専門知識を得るための言語モデルとして一般的な方法である。
我々は,異なる事前学習手法を提案し,下流タスクと探索タスクを通してその効果を評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:35:02 GMT)
Training-Free Pretrained Model Merging [38.2] 双対空間制約(MuDSC)の下でのマージという,革新的なモデルマージフレームワークを提案する。
ユーザビリティを高めるため,マルチヘッドアテンションやグループ正規化など,グループ構造への適応も取り入れた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:12:48 GMT)
CoLeCLIP: Open-Domain Continual Learning via Joint Task Prompt and Vocabulary Learning [38.1] 本稿では,CLIPに基づくオープンドメインCLモデルを学習する新しいアプローチであるCoLeCLIPを紹介する。
CoLeCLIPは、タスクとクラスインクリメンタルな学習設定の両方で、オープンドメインCLの最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:28:21 GMT)
Frozen Feature Augmentation for Few-Shot Image Classification [38.0] 冷凍機能強化(FroFA)は、大幅なオーバーヘッドなしにパフォーマンスを向上させるレシピである。
本研究は,3つのネットワークアーキテクチャにおいて,可視的に単純なFroFA(明度など)を採用することにより,ショット性能が一貫した向上が期待できることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:59:40 GMT)
Emotion-Aware Multimodal Fusion for Meme Emotion Detection [37.9] MOOD(Meme emOtiOns データセット)は6つの基本的な感情を具現化する。
ALFRED (emotion-Aware muLtimodal Fusion foR Emotion Detection) は感情に富んだ視覚的手がかりを明示的にモデル化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:20:38 GMT)
OccFiner: Offboard Occupancy Refinement with Hybrid Propagation [36.8] OccFinerは、視覚ベースの占有率予測の精度を高めるために設計された、新しいオフボードフレームワークである。
OccFinerは、1)複数のローカルなフレームを暗黙的に整列して処理し、モデルエラーを訂正し、すべての距離にわたって占有精度を一貫して向上するマルチツーマルチローカルな伝搬ネットワークである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:31:45 GMT)
JoMA: Demystifying Multilayer Transformers via JOint Dynamics of MLP and Attention [36.7] 多層トランスフォーマーのトレーニング手順を理解するための新しい数学的枠組みであるジョイント/アテンション(JoMA)ダイナミクスを提案する。
JoMAは、最初に注意が粗くなり(正則なトークンを学ぶために)、次に非線形なアクティベーションの存在下で(より正則なトークンを学ぶために)密集する、と予測する。
入力トークンが潜在階層生成モデルによって生成されるとき、トークンを結合して多層トランスフォーマーの階層を形成する方法を説明するためにJoMAを利用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:03:21 GMT)
NECA: Neural Customizable Human Avatar [36.7] モノクラービデオやスパースビュービデオから多目的な人間の表現を学習する手法であるNECAを紹介する。
我々のアプローチの中核は、補完的な双対空間で人間を表現し、幾何学、アルベド、シャドー、および外部照明の非絡み合った神経場を予測することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:23:06 GMT)
Instance-optimal Clipping for Summation Problems in the Shuffle Model of Differential Privacy [36.0] クリッピング機構が$O(max_i x_i cdot loglog U /varepsilon)$のインスタンス最適誤差を実現する方法を示す。
また、この手法を高次元和推定問題とスパースベクトルアグリゲーションに拡張する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:04:00 GMT)
Dataset Distillation via the Wasserstein Metric [35.3] 最適な輸送理論に基づく計量であるワッサーシュタイン距離を導入し, データセット蒸留における分布整合性を高める。
提案手法は,高解像度データセットにまたがって,新しい最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:14:40 GMT)
Partially Observable Task and Motion Planning with Uncertainty and Risk Awareness [34.8] 統合型タスク・アンド・モーション・プランニング(TAMP)は、長期のロボット操作とナビゲーションの問題を一般化するための貴重なアプローチであることが証明されている。
これらの仮定は、プランナーが情報を収集し、リスクを認識した意思決定を行う能力を制限します。
本研究では,初期状態と行動結果の不確実性を伴う長期計画問題を効果的に解決できる不確実性とリスク認識(TAMPURA)を備えたTAMP戦略を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:42:14 GMT)
PAME: Self-Supervised Masked Autoencoder for No-Reference Point Cloud Quality Assessment [34.3] no-reference point cloud quality Assessment (NR-PCQA) は、参照なしでポイントクラウドの知覚的品質を自動的に予測することを目的としている。
本稿では,マスク付きオートエンコーダ(PAME)を用いた自己教師型事前学習フレームワークを提案する。
提案手法は,予測精度と一般化性の観点から,最新のNR-PCQA法よりも高い性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:01:33 GMT)
Progressive Divide-and-Conquer via Subsampling Decomposition for Accelerated MRI [34.0] 本稿では, サブサンプリングプロセスの分解を目的としたPDAC(Progressive Divide-And-Conquer)戦略を提案する。
提案手法は,一般に公開されている高速MRIとStanford2D FSEデータセットにおいて,優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:14:01 GMT)
Robust Shape Fitting for 3D Scene Abstraction [33.8] 特に,キュービドやシリンダーなどのボリュームプリミティブを用いて人工環境を記述することができる。
プリミティブフィッティングのためのロバストな推定器を提案し、キュービドを用いて複雑な現実世界環境を有意に抽象化する。
NYU Depth v2データセットの結果、提案アルゴリズムは、乱雑な現実世界の3Dシーンレイアウトをうまく抽象化することを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:37:43 GMT)
Intriguing Properties of Data Attribution on Diffusion Models [33.8] データ帰属は、望ましいアウトプットをトレーニングデータに戻そうとする。
データ属性は、高直感的または著作権のあるデータを適切に割り当てるためのモジュールになっている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:05:14 GMT)
P-MapNet: Far-seeing Map Generator Enhanced by both SDMap and HDMap Priors [33.7] 提案するP-MapNetでは、P文字は、モデル性能を改善するために、マッププリエントの導入に重点を置いているという事実を強調している。
注意に基づくアーキテクチャは,SDMapスケルトンに適応的に対応し,性能を大幅に向上させる。
P-MapNetは、長い範囲でより大きな改善をもたらす、探究可能なソリューションです。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:59:53 GMT)
TEDDY: Trimming Edges with Degree-based Discrimination strategY [33.2] 本稿では,一対一のエッジスペーシフィケーションフレームワークであるTEDDYを紹介する。
我々のTEDDYは,グラフ構造とモデルパラメータの両方のターゲット空間レベルを考慮し,単一のトレーニングでグラフ抽選チケット(GLT)を効率的かつ迅速に実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:12:18 GMT)
DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training [33.1] ゼロオーダー(ZO)最適化は、機械学習(ML)問題を解決する一般的なテクニックとなっている。
ディープニューラルネットワーク(DNN)のトレーニングにおけるZO最適化の有効性を、パフォーマンスを著しく低下させることなく実証した以前の研究はない。
我々は,ZO最適化をDNNトレーニングにスクラッチから拡張可能なZOディープラーニング(DL)フレームワークであるDeepZeroを開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:28:11 GMT)
zrLLM: Zero-Shot Relational Learning on Temporal Knowledge Graphs with Large Language Models [33.1] 埋め込み型TKGF法において,大規模言語モデルを用いて関係表現を生成する。
本稿では,TKGFモデルが従来見つからなかった関係で事実を予測する上で,より優れた性能を実現する上で有効であることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:38:07 GMT)
Anytime Neural Architecture Search on Tabular Data [33.1] ATLASは、表データ用に調整された初めてのニューラルネットワークサーチ(NAS)アプローチである。
トレーニングフリーとトレーニングベースアーキテクチャ評価の両方のパラダイムの長所を組み合わせたものだ。
事前定義された時間予算内で優れたパフォーマンスのアーキテクチャを取得し、新しい時間予算が利用可能になったら、より良いアーキテクチャを返すことができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:09:46 GMT)
Generating Images with 3D Annotations Using Diffusion Models [32.8] 拡散モデルに3次元幾何制御を組み込んだ3次元拡散スタイル転送(3D-DST)を提案する。
提案手法は,テキストプロンプトに加えて視覚的プロンプトを用いて拡散モデルを拡張する制御ネットを利用する。
明示的な3次元幾何制御により、生成した画像中のオブジェクトの3次元構造を容易に変更でき、グラウンドトルース3Dアノテーションを自動で取得できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:16:58 GMT)
DragAnything: Motion Control for Anything using Entity Representation [32.2] DragAnythingは、制御可能なビデオ生成における任意のオブジェクトのモーション制御を実現する。
提案手法は従来の手法(例えばDragNUWA)を26%上回る。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:53:11 GMT)
Grounding Data Science Code Generation with Input-Output Specifications [32.1] 大規模言語モデル(LLM)は、最近、自然言語プロンプトからコードを生成する驚くべき能力を示した。
LLMは出力をNLプロンプトとI/O仕様の両方と整合させることが困難である。
I/O 仕様に対する LLM の微調整のための新しい手法である GIFT4Code を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:18:45 GMT)
AD3: Implicit Action is the Key for World Models to Distinguish the Diverse Visual Distractors [31.6] 本稿では,視覚的邪魔者の暗黙的な動作を学習するためのImplicit Action Generator (IAG)を提案する。
暗黙的動作インフォームド・ディバース・ビジュアル・ディトラクタ・ディスタンス・ディスタンス・ディファクタ(AD3)という新しいアルゴリズムを提案する。
そこで本手法は,異種・同種両輪のトラヒックを特徴とする様々な視覚制御タスクにおいて,優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:46:19 GMT)
Context-Semantic Quality Awareness Network for Fine-Grained Visual Categorization [30.9] 細粒度視覚分類のための弱教師付き文脈意味品質認識ネットワーク(CSQA-Net)を提案する。
リッチな部分記述子とグローバルセマンティクスの空間的関係をモデル化するため,我々は新しい多部・多スケールクロスアテンション(MPMSCA)モジュールを開発した。
また、バックボーンネットワークの異なるレベルからの階層的セマンティクスを段階的に監視し、強化する汎用的マルチレベルセマンティクス評価モジュール(MLSQE)を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:40:44 GMT)
Using an LLM to Turn Sign Spottings into Spoken Language Sentences [30.9] 本稿では,サインスポッターと事前訓練された大言語モデルを用いてSLT性能を向上させるハイブリッドSLTアプローチであるSputter+GPTを提案する。
ビデオはまず、言語手話データセットに基づいて訓練されたスポッターによって処理され、個々のサインを識別する。
これらの標識はその後、強力な言語モデルに渡され、コヒーレントで文脈的に適切な音声言語文へと変換される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:14:34 GMT)
Detecting Propaganda Techniques in Code-Switched Social Media Text [30.8] コードスイッチトテキストにおけるプロパガンダのテクニックを検出するための新しいタスクを提案する。
我々は、20のプロパガンダ技術で注釈付けされた、英語とローマ・ウルドゥー語の間の1030のテキストのコーパスを作成した。
コードとデータセットはhttps://github.com/mbzuai-nlp/propaganda-codeswitched-textで公開されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:26:48 GMT)
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries [30.8] Federated Reinforcement Learning (FRL)は、複数のエージェントが生の軌跡を共有することなく、協調して意思決定ポリシーを構築することを可能にする。
本稿では,サーバに任意の値を送信可能な敵エージェントに対して堅牢なポリシー勾配に基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:45:36 GMT)
Repoformer: Selective Retrieval for Repository-Level Code Completion [30.7] 検索強化生成(RAG)の最近の進歩は、リポジトリレベルのコード補完の新たな時代が始まった。
本稿では,不要な場合の検索を回避できる選択的なRAGフレームワークを提案する。
我々のフレームワークは、異なる世代モデル、検索者、プログラミング言語を効果的に扱えることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:59:43 GMT)
Retrieving Conditions from Reference Images for Diffusion Models [30.1] 拡散モデルを用いた統合検索問題として主観駆動生成を考える。
本稿では,RetriNetという新しい拡散モデルアーキテクチャを導入する。
また、より難しい問題、概念構成を研究するために、研究で親しみやすいデータセットRetriBooruを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:37:32 GMT)
Benchmarking Adversarial Robustness of Image Shadow Removal with Shadow-adaptive Attacks [30.1] シャドウ除去は、画像に存在する地域影を消し去り、一貫した照明で自然の風景を再生するタスクである。
近年の深層学習技術は画像の影除去において顕著な性能を示したが、敵の攻撃に対する頑健さはほとんど解明されていない。
シャドウ画像の異なる領域の画素強度に基づいて攻撃予算を調整し, シャドウ・アダプティブ・ディベサール・アタック(シャドウ・アダプティブ・ディベサール・アタック)と呼ばれる新たなアプローチを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:43:42 GMT)
Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder [29.9] 超解像度(SR)と画像生成はコンピュータビジョンにおいて重要なタスクであり、現実世界のアプリケーションで広く採用されている。
しかし、既存のほとんどの手法は、固定スケールの倍率でのみ画像を生成し、過度なスムーシングやアーティファクトに悩まされている。
最も関連する研究は、インプリシット神経表現(INR)をデノナイズ拡散モデルに適用し、連続分解能で多種多様で高品質なSR結果を得た。
任意のスケールで入力画像の超解像やランダムノイズから生成できる新しいパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:45:40 GMT)
Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation [29.8] ポーズ条件付き人間の画像生成に新たなアプローチを導入し,その過程を2段階に分けた。
ハンドイメージとそれに対応するセグメンテーションマスクの両方を生成するために,マルチタスク設定でハンドジェネレータを訓練する。
適応されたコントロールネットモデルが第2段階で使用され、生成された手の周りにボディを塗り替え、最終的な結果が生成される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:31:41 GMT)
Regret Minimization via Saddle Point Optimization [29.8] 決定推定係数 (DEC) は, 構造的バンディットと強化学習における最悪の既往歴に対して, ほぼ下限および上限の値を与えることを示した。
推定・判定アルゴリズム(E2D)の任意の変種を導出する。
我々の定式化は有限モデルクラスと線形フィードバックモデルのための実用的なアルゴリズムにつながる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:09:13 GMT)
A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges [29.7] 複雑なゲームプレイシナリオにおけるLM使用状況と課題を概観する。
我々は,ゲームにおけるLMの進歩に向けた将来的な研究の道のりについて,今後の展望を述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:37:12 GMT)
Thermal-NeRF: Neural Radiance Fields from an Infrared Camera [29.6] 本研究では,IR画像のみからNeRFの形でボリュームシーン表現を推定する最初の方法であるTherial-NeRFを紹介する。
本研究では,既存の方法よりも優れた品質が得られることを示すため,広範囲な実験を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:27:15 GMT)
Analyzing the Expected Hitting Time of Evolutionary Computation-based Neural Architecture Search Algorithms [29.4] 期待ヒット時間(EHT)は、平均計算時間の複雑さを意味するため、理論上の最も重要な問題の一つである。
本稿では,ENASアルゴリズムのEHTを推定するための理論と実験を統合することによって,一般的な手法を提案する。
我々の知る限りでは、この研究はENASアルゴリズムの理論的基盤を確立する最初の試みである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:51:04 GMT)
EXAMS-V: A Multi-Discipline Multilingual Multimodal Exam Benchmark for Evaluating Vision Language Models [29.3] EXAMS-Vは、視覚言語モデルを評価するための、新しい挑戦的なマルチディシプリルマルチモーダル多言語試験ベンチマークである。
自然科学、社会科学、その他の雑学を対象とする20の学派にまたがる20,932の質問からなる。
質問は7つの言語ファミリーから11の言語で行われます。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:08:39 GMT)
Adversarial Training on Purification (AToP): Advancing Both Robustness and Generalization [29.1] 本稿では,AToP (Adversarial Training on Purification) という,ロバストな浄化器モデルを得るための新しいパイプラインを提案する。
そこで我々は,CIFAR-10,CIFAR-100,ImageNetteの大規模実験を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:19:09 GMT)
A resource-constrained stochastic scheduling algorithm for homeless street outreach and gleaning edible food [29.0] ミッションや運用の異なる社会変革組織が直面する資源制約付きアウトリーチ問題に対処する共通アルゴリズムソリューションを開発した。
そこで我々は,k$-step遷移の下で部分的に観測された非定常帯域に対する推定と最適化手法を開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:12:28 GMT)
Self-Compatibility: Evaluating Causal Discovery without Ground Truth [28.7] 本研究では,基底真理が存在しない場合に因果発見アルゴリズムの出力をfalsificationする新しい手法を提案する。
我々の重要な洞察は、統計的学習がデータポイントのサブセット間の安定性を求める一方で、因果学習は変数のサブセット間の安定性を求めるべきであるということである。
本研究では,不整合性の検出が,仮定や誤差が有限なサンプル効果によって誤って因果関係を推定することを証明する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:06:41 GMT)
Den-SOFT: Dense Space-Oriented Light Field DataseT for 6-DOF Immersive Experience [28.7] 我々は,移動式マルチカメラ大空間高密度光場キャプチャシステムを構築した。
本研究の目的は,一般的な3次元シーン再構築アルゴリズムの開発に貢献することである。
収集されたデータセットは、既存のデータセットよりもはるかに密度が高い。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:39:44 GMT)
Unified Projection-Free Algorithms for Adversarial DR-Submodular Optimization [28.6] 本稿では,DR-サブモジュラー最適化のための統合プロジェクションフリーのFrank-Wolfe型アルゴリズムを提案する。
非単調な設定で考慮されたすべての問題に対して、提案アルゴリズムは、証明されたサブ線形$alpha$-regret境界を持つ最初のものであるか、あるいは、最先端よりもより優れた$alpha$-regret境界を持つかのいずれかである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:05:44 GMT)
PERL: Parameter Efficient Reinforcement Learning from Human Feedback [27.7] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデルと人間の好みを結びつける強力な手法であることが証明されている。
本稿では,Huらによって導入されたLoRA(Lo-Rank Adaptation)のパラメータ効率向上手法を用いて,基礎となるモデルを学習するRLHFについて検討する。
PERLは従来のRLHF設定と同等に動作し、高速かつ少ないメモリでトレーニングを行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:43:46 GMT)
Rethinking Autoencoders for Medical Anomaly Detection from A Theoretical Perspective [27.7] 再構成に基づく手法、特にオートエンコーダ(AE)を利用する手法がこの分野で優位である。
本研究は, 異常検出におけるAEを用いた再構成手法の理論的基礎を提供することに焦点をあてる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:58:19 GMT)
Survey of Natural Language Processing for Education: Taxonomy, Systematic Review, and Future Trends [26.9] 我々は、NLPの最近の進歩を、教育領域に関連する問題の解決に焦点をあててレビューする。
教育領域におけるNLPの分類について述べるとともに,質問応答,質問構築,自動評価,誤り訂正など,典型的なNLPの応用に注目した。
今後の研究には、教育領域におけるデータセットの増加、LCMの制御可能な利用、難易度制御の介入、解釈可能な教育的NLP、適応学習の方法、教育統合システムなど、有望な6つの方向性をまとめる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:10:05 GMT)
VideoAgent: Long-form Video Understanding with Large Language Model as Agent [26.9] 本稿では,大規模言語モデルを中心的エージェントとして利用して,重要な情報を特定し,コンパイルして質問に答える,新たなエージェントベースシステムであるVideoAgentを紹介する。
本研究では,現在の最先端手法よりも優れた手法の有効性と効率性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:57:52 GMT)
Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM [26.8] 状態空間モデル(SSM)の最近の進歩は、長いシーケンスモデリングにおいてかなりの可能性を秘めている。
我々は,SSMを用いた先駆的な動き生成モデルを示す,シンプルで効率的な手法であるモーション・マンバを提案する。
提案手法は,HumanML3DおよびKIT-MLデータセットの最大50%のFID改善と最大4倍の高速化を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:24:45 GMT)
Quantum Circuits for partial differential equations via Schrödingerisation [26.7] 一般PDEのための量子アルゴリズムをSchr"オーダライゼーション手法を用いて実装する。
本稿では, 熱方程式の例と, 風上スキームで近似した対流方程式について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:42:03 GMT)
The Generalization Gap in Offline Reinforcement Learning [26.6] オフライン学習アルゴリズムは、オンライン学習アルゴリズムよりも、新しい環境でパフォーマンスが悪くなります。
行動クローニングは強力なベースラインであり、最先端のオフラインRLおよびシーケンスモデリングアプローチより優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:17:42 GMT)
Uncertainty-aware Surrogate Models for Airfoil Flow Simulations with Denoising Diffusion Probabilistic Models [26.2] 本研究は,拡散確率モデル(DDPM)を用いて乱流シミュレーションのための不確実性を考慮した代理モデルを訓練する試みである。
その結果,DDPMは解全体の分布を正確に把握でき,その結果,シミュレーションの不確かさを正確に推定できることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:16:23 GMT)
Exploring Language Model's Code Generation Ability with Auxiliary Functions [26.0] 近年のコード予測言語モデルで符号化された補助関数を利用する能力を総合的に評価する。
分析の結果,補助関数を呼ぶためのモデルの不使用な動作が明らかになった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:41:50 GMT)
Score Regularized Policy Optimization through Diffusion Behavior [25.9] オフライン強化学習の最近の進歩は拡散モデリングの潜在可能性を明らかにしている。
本稿では,批判モデルと事前学習した拡散行動モデルから,効率的な決定論的推論ポリシーを抽出することを提案する。
本手法は,移動作業における各種拡散法と比較して,動作サンプリング速度を25倍以上に向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:42:03 GMT)
Mipha: A Comprehensive Overhaul of Multimodal Assistant with Small Language Models [25.7] マルチモーダル小言語モデル(Multimodal Small Language Models, MLM)の設計側面について検討し, Mipha という名前の効率的なマルチモーダルアシスタントを提案する。
私たちのMipha-3Bは、最先端の大規模MLLM、特にLLaVA-1.5-13Bを複数のベンチマークで上回ります。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:48:05 GMT)
A General Method to Incorporate Spatial Information into Loss Functions for GAN-based Super-resolution Models [25.7] GAN(Generative Adversarial Networks)は超解像問題において優れた性能を示した。
GANは、予期せぬアーチファクトやノイズなど、出力に副作用をもたらすことが多い。
本稿では,多くのGANベース超解像(SR)モデルにおいて,トレーニングプロセスに必須空間情報を導入することで,効果的に活用できる汎用手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:29:16 GMT)
Optimal Block-Level Draft Verification for Accelerating Speculative Decoding [25.3] 本稿では,追加の計算コストやドラフトトークンを発生させることなく,ウォールクロックの高速化を実現する,より優れたドラフト検証アルゴリズムを提案する。
提案するブロックレベルの検証アルゴリズムを,幅広いタスクやデータセットで実証的に評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:28:22 GMT)
Medical Unlearnable Examples: Securing Medical Data from Unauthorized Traning via Sparsity-Aware Local Masking [24.9] Sparsity-Aware Local Masking (SALM) 法は、以前の戦略のように画像全体ではなく、重要なピクセル領域を選択的に摂動させる。
SALMは、ディープラーニングモデルの不正なトレーニングを効果的に防止し、従来の最先端のデータ保護手法より優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:35:36 GMT)
MAGPIE: Multi-Task Media-Bias Analysis Generalization for Pre-Trained Identification of Expressions [24.6] MAGPIEは、メディアバイアス検出用に明示的に調整された、最初の大規模マルチタスク事前学習アプローチである。
Bias By Expertsデータセットでは、メディアバイアス検出のこれまでのアプローチよりも優れています。
シングルタスクアプローチと比較して、微調整ステップの15%しか必要ありません。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:30:29 GMT)
FeatUp: A Model-Agnostic Framework for Features at Any Resolution [24.4] FeatUpは、失われた空間情報を深い特徴で復元するためのタスクおよびモデルに依存しないフレームワークである。
FeatUpの2つのバリエーションを紹介します。1つは、1つのフォワードパスで高分解能信号で特徴を導くもので、もう1つは暗黙のモデルを1つのイメージに適合させて、任意の解像度で特徴を再構成するものです。
FeatUpは、クラスアクティベーションマップ生成、セグメンテーションとデプス予測のためのトランスファーラーニング、セグメンテーションのためのエンドツーエンドトレーニングにおいて、他の機能アップサンプリングや画像超解像アプローチよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:57:06 GMT)
Beyond Gradient and Priors in Privacy Attacks: Leveraging Pooler Layer Inputs of Language Models in Federated Learning [24.1] 本稿では,現代言語モデルのアーキテクチャの脆弱性を狙う2段階のプライバシ攻撃戦略を提案する。
比較実験は、様々なデータセットやシナリオで優れた攻撃性能を示す。
私たちは、大きな言語モデルの設計において、これらの潜在的なプライバシーリスクを認識し、対処するようコミュニティに呼びかけます。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:23:05 GMT)
Monotonic Representation of Numeric Properties in Language Models [24.0] 言語モデル(LM)は、1902年生まれのカール・ポッパーのような数値的な性質に関する事実的な知識を表現することができる。
本稿では,エンティティの誕生年などの数値特性の表現を簡易に発見・編集する手法を提案する。
数値特性を単調に符号化する低次元部分空間を解釈可能かつ編集可能な方法で見つける。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:10:41 GMT)
Zero-shot Explainable Mental Health Analysis on Social Media by Incorporating Mental Scales [23.9] MAIMS(Incorporating Mental Scales)による精神分析は、精神状態を評価するために尺度を使用する心理的アセスメントの実践に着想を得たものである。
第一に、患者はメンタルスケールを完了し、第二に、心理学者は収集した情報をメンタルスケールから解釈し、情報的決定を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:02:02 GMT)
EXPLORER: Exploration-guided Reasoning for Textual Reinforcement Learning [23.8] テキスト強化学習のための探索誘導推論剤であるEXPLORERについて述べる。
実験の結果,EXPLORERはテキストワールド調理(TW-Cooking)およびテキストワールドコモンセンス(TWC)ゲームにおいて,ベースラインエージェントよりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:22:37 GMT)
SOS-Match: Segmentation for Open-Set Robust Correspondence Search and Robot Localization in Unstructured Environments [23.7] SOS-Matchは、非構造化環境でオブジェクトを検出し、マッチングするための新しいフレームワークである。
フィンランド南部の沿岸海域で収集されたドローン飛行を含む,バトヴィクの季節データセット上でSOS-Matchを評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:40:19 GMT)
DyST: Towards Dynamic Neural Scene Representations on Real-World Videos [23.4] モノクラー・リアル・ワールド・ビデオから現実のシーンの3次元構造とダイナミックスの両方を捉えることを目的としている。
我々のDynamic Scene Transformer (DyST) モデルは、モノクラー・リアル・ワールド・ビデオのシーンコンテンツへの遅延分解を学習する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:53:19 GMT)
CaVE: A Cone-Aligned Approach for Fast Predict-then-optimize with Binary Linear Programs [23.0] 本研究はバイナリ線形プログラム(BLP)に焦点をあて,予測最適化のための新たなエンドツーエンドトレーニング手法を提案する。
コーン整列ベクトル推定法 (CaVE) は, 予測コストベクトルをトレーニングインスタンスの真の最適解に対応する正規コーンと整列する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:45:39 GMT)
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis [23.0] SciAssessは科学文献の詳細な分析のためのベンチマークである。
記憶、理解、分析におけるLLMの能力を評価することに焦点を当てている。
一般的な化学、有機材料、合金材料などの様々な科学分野からの代表的タスクを含む。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:27:31 GMT)
Uncovering Latent Themes of Messaging on Social Media by Integrating LLMs: A Case Study on Climate Campaigns [23.0] 本稿では,ソーシャルメディアメッセージングにおけるテーマの発見と分析に新たなアプローチを提案する。
本稿では,Large Language Models (LLMs) の高度な機能を活用した,ループ型マシン・イン・ザ・ループ手法を提案する。
私たちの仕事は、ソーシャルメディアのダイナミックな性質に光を当て、現実の出来事に対するメッセージのテーマ的焦点の変化を明らかにします。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:54:00 GMT)
Online Policy Learning from Offline Preferences [22.9] 嗜好に基づく強化学習(PbRL)では、嗜好と呼ばれる人間のフィードバックから報酬関数が学習される。
本研究では,PbRLのオフライン選好と仮想選好を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:11:26 GMT)
Uni-SMART: Universal Science Multimodal Analysis and Research Transformer [22.9] 科学的研究とその応用において、科学的文献分析は、研究者が他者の業績に基づいて構築できるため、不可欠である。
LLM(Large Language Models)の出現は、この課題に対処する新しい方法を提供する。
マルチモーダル科学文献の詳細な理解を目的とした革新的モデルUni-を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:43:47 GMT)
MiniGPT-5: Interleaved Vision-and-Language Generation via Generative Vokens [22.8] 生成ボケンの概念を主軸とした,新たなインターリーブ型視覚・言語生成手法を提案する。
本手法は,記述自由なマルチモーダル生成のためのユニークな2段階学習戦略によって特徴付けられる。
我々のモデルであるMiniGPT-5は、マルチモーダル生成データセットのベースラインモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:54:08 GMT)
UniHDA: A Unified and Versatile Framework for Multi-Modal Hybrid Domain Adaptation [22.0] 提案するUniHDAは,複数のドメインからのマルチモーダル参照を持つハイブリッドドメインを生成可能なフレームワークである。
我々のフレームワークはジェネレータに依存しず、StyleGAN, EG3D, Diffusion Modelsなどの複数のジェネレータに汎用的です。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:44:00 GMT)
Robust COVID-19 Detection in CT Images with CLIP [21.8] 深層学習モデルは、特に新型コロナウイルス検出において、医療画像の課題に直面している。
凍結したCLIP画像エンコーダとトレーニング可能な多層認識(MLP)を活用して,これらの障害を克服するための最初の軽量検出器を提案する。
教師と学生のフレームワークを統合して、大量のラベルのないデータに便乗し、本質的なデータ制限にもかかわらず、我々のモデルは優れたパフォーマンスを達成できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:21:14 GMT)
Department Safer Digital Intimacy For Sex Workers And Beyond: A Technical Research Agenda [21.7] 多くの人は、セックスワーカー、クライアント、親密なコンテンツをレクリエーションに作り、共有する人々といったデジタル親密さに従事しています。
この近親相姦によって、スティグマによって悪化する、重大なセキュリティとプライバシーのリスクがもたらされる。
本稿では、より安全なデジタル親密性のための商用デジタル親密性脅威モデルと10の研究方向について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:16:01 GMT)
Generalization in diffusion models arises from geometry-adaptive harmonic representations [21.4] 画像復調のために訓練されたディープニューラルネットワーク(DNN)は、スコアベースの逆拡散アルゴリズムを用いて高品質なサンプルを生成することができる。
トレーニングセットの記憶に関する最近の報告は、これらのネットワークがデータの「真の」連続密度を学習しているかどうかという疑問を提起している。
データセットの重複しない部分集合でトレーニングされた2つのDNNは、ほぼ同じスコア関数を学習し、したがってトレーニング画像の数が十分に大きい場合、同じ密度を学習する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:21:48 GMT)
HUNTER: Unsupervised Human-centric 3D Detection via Transferring Knowledge from Synthetic Instances to Real Scenes [21.3] 本研究では,人間中心のシナリオに対する教師なし3次元検出手法を提案する。
注目に値することに,本手法は現在の最先端技術と比較して優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:46:54 GMT)
Solving General Noisy Inverse Problem via Posterior Sampling: A Policy Gradient Viewpoint [21.2] 本研究では,事前学習した拡散生成モデルを用いて,タスク固有モデルによる微調整を伴わずに,幅広い画像逆タスクを解く。
入力画像の誘導スコア関数を正確に推定するために,拡散ポリシー勾配(DPG)を提案する。
実験により,複数の線形および非線形の逆問題に対するガウス雑音とポアソン雑音の両方に対して,本手法は頑健であることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:38:47 GMT)
Learning Semilinear Neural Operators : A Unified Recursive Framework For Prediction And Data Assimilation [21.2] 無限次元半線形PDEに対する解演算子に対する学習に基づく状態空間アプローチを提案する。
本研究では,予測と修正操作を組み合わせることで,予測とデータ同化の両立を可能にするフレキシブルな手法を開発した。
本研究では, 倉本・シヴァシンスキー, ナヴィエ・ストークス, コルテヴェーグ・ド・ブリーズ方程式を用いて, 提案モデルが雑音に対して頑健であり, 任意の量の測定値を用いて, 計算オーバーヘッドが少なく, 長期間の地平線上での予測を補正できることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:47:48 GMT)
DyRoNet: A Low-Rank Adapter Enhanced Dynamic Routing Network for Streaming Perception [21.2] DyRoNetは、ストリーミング知覚を高めるために低ランクの動的ルーティングを組み込むことによって革新する動的ルータネットワークである。
DyRoNetのアーキテクチャの中心はSpeed Routerモジュールであり、最も適切な分岐ネットワークに入力データを動的に割り当てるインテリジェントなルーティング機構を使用している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:30:13 GMT)
Machine Unlearning: Solutions and Challenges [21.1] 機械学習モデルは、機密性、不正、悪意のあるデータを不注意に記憶し、プライバシ侵害、セキュリティ脆弱性、パフォーマンス劣化のリスクを生じさせる可能性がある。
これらの問題に対処するために、機械学習は訓練されたモデルに対する特定の訓練データポイントの影響を選択的に除去する重要なテクニックとして登場した。
本稿では,機械学習における解の包括的分類と解析について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:29:24 GMT)
Bergeron: Combating Adversarial Attacks through a Conscience-Based Alignment Framework [20.8] Bergeronは、大規模言語モデルの攻撃に対する堅牢性を改善するために設計されたフレームワークである。
有害なコンテンツのアウトプットを監視しながら、プライマリモデルを着信攻撃から保護する方がよい。
経験的分析により、既存のアライメントトレーニングでモデルを補完するためにBergeronを使用することで、複数の商用およびオープンソース LLM の堅牢性と安全性を向上させることができることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:13:06 GMT)
Towards Non-Adversarial Algorithmic Recourse [20.8] 反実的な説明とは対照的に、敵対的な例は、それらが根底的な真実よりも誤分類につながるという独特の特徴を持っていると論じられている。
本稿では,非対人的アルゴリズムの議論を紹介するとともに,高い状況下では,対人的特徴を示さない対実的説明を得ることが不可欠である理由を概説する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:18:21 GMT)
Knowledge Condensation and Reasoning for Knowledge-based VQA [20.8] 近年の研究では、外部知識ベースから知識パスを取得し、それを使って質問に答えている。
本稿では,知識凝縮モデルと知識推論モデルという2つの相乗的モデルを提案する。
本手法は知識に基づくVQAデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:06:06 GMT)
A Decade of Privacy-Relevant Android App Reviews: Large Scale Trends [20.7] 私たちは、時間、国、アプリタイプ、さまざまなプライバシトピック、さらにはさまざまな感情にまたがって、ユーザーがプライバシーについて何を書いているかを調べます。
プライバシーレビューは200か国以上から来るが、33か国はプライバシーレビューの90%を提供している。
驚いたことに、プライバシーを議論するレビューが肯定的であることは珍しくない(32%)。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:59:55 GMT)
Synthesizing Physical Backdoor Datasets: An Automated Framework Leveraging Deep Generative Models [20.3] 本稿では、バックドア研究者が悪意のある物理的バックドアデータセットを作成するためのレシピを公開する。
物理的なバックドアデータセットの作成に伴う複雑性を効果的に軽減する。
実験の結果、"レシピ"によって生成されたデータセットによって、敵が印象的な攻撃成功率を達成することができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:30:00 GMT)
Continuous QA Learning with Structured Prompts [20.2] Dianaは動的アーキテクチャベースの生涯QAモデルで、一連のQAタスクを学習しようとする。
階層的に整理された4つのプロンプトは、異なる粒度からQA知識を取得するためにダイアナで使用される。
実験では、Dianaは、特に目に見えないタスクの処理において、最先端のQAモデルよりも優れています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:53:58 GMT)
An Empirical Study on Developers Shared Conversations with ChatGPT in GitHub Pull Requests and Issues [20.1] ChatGPTはソフトウェア開発プラクティスに大きな影響を与えています。
広く採用されているにもかかわらず、協調コーディングにおけるアシスタントとしてのChatGPTの影響はほとんど解明されていない。
210と370人の開発者のデータセットを分析し、GitHubのプルリクエスト(PR)とイシューでChatGPTとの会話を共有しました。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:58:37 GMT)
Leveraging CLIP for Inferring Sensitive Information and Improving Model Fairness [19.9] サブ人口間の性能格差は、ディープラーニングに基づく視覚認識モデルに存在することが知られている。
これまでの研究は、センシティブな属性ラベルの知識を前提として、このような公平性に関する懸念に対処してきた。
感性のある属性ラベルを必要としない新しいパラダイムを探求し、視覚言語モデルであるCLIPを活用することにより、余分なトレーニングの必要性を回避する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:37:15 GMT)
Energy-based Automated Model Evaluation [19.9] 本稿では,AutoEvalフレームワークをより効率的かつ効果的にするための新しい手段として,Meta-Distribution Energy(MDE)を提案する。
MDEは、個々のサンプルに関連する情報(エネルギー)に基づいて、メタ分布統計を確立し、エネルギーベースの学習によってよりスムーズな表現を提供する。
我々は、MDEの有効性を検証するために、モダリティ、データセット、異なるアーキテクチャのバックボーンにわたる広範な実験を提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:51:28 GMT)
Deep Geometry Handling and Fragment-wise Molecular 3D Graph Generation [19.6] 初期の3次元構造に基づく分子生成手法は原子のパラダイムに従っている。
フラグメントワイズ生成パラダイムは、有望なソリューションを提供する。
ディープジオメトリ・ハンドリングプロトコルはモデルアーキテクチャを超えて設計の焦点を広げる。
FragGenは、幾何学的に信頼性が高く、断片的な分子生成法である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:45:41 GMT)
Overcoming Distribution Shifts in Plug-and-Play Methods with Test-Time Training [19.5] Plug-and-Play Priorsは、逆計算画像問題を解決するためのよく知られた方法である。
学習モデルの一般的な問題は、トレーニングデータとテストデータの間に分散がある場合のパフォーマンス低下である。
テストタイムトレーニング(TTT)は、データのトレーニングとテストで学んだパフォーマンスを改善する新しい方法として提案されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:04:30 GMT)
Fourier Transporter: Bi-Equivariant Robotic Manipulation in 3D [19.3] 本稿では,2重のSE(d)xSE(d)対称性をピックプレース問題に適用し,より高い試料効率を実現するフーリエトランスポーター(FourTran)を提案する。
FourTranは、専門家によるデモを使って訓練されたオープンループの行動クローニング手法で、新しい環境におけるピック・プレース・アクションを予測する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:39:18 GMT)
EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba [19.1] 本研究は、軽量モデル設計における視覚状態空間モデルの可能性を探究し、EfficientVMambaと呼ばれる新しい効率的なモデル変種を導入することを提案する。
我々のEfficientVMambaは、グローバルおよびローカルの両方の表現機能を利用するように設計されたビルディングブロックを構成する効率的なスキップサンプリングにより、アトラスベースの選択的スキャン手法を統合する。
実験の結果,EfficientVMambaは計算複雑性を縮小し,様々な視覚タスクの競合結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:48:47 GMT)
Learning Flexible Body Collision Dynamics with Hierarchical Contact Mesh Transformer [19.0] 階層型メッシュ構造を用いて長距離依存を学習可能な階層型コンタクトメッシュトランス(HCMT)を提案する。
HCMTは長距離相互作用を可能にし、階層メッシュ構造はすぐに遠くの位置への衝突効果を伝播させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:57:46 GMT)
Image Demoireing in RAW and sRGB Domains [18.9] 我々は、Gated Feedback Module (GFM) と Frequency Selection Module (FSM) を備えたスキップ接続型復号モジュール(SCDM)を開発した。
我々はRGB Guided ISP(RGISP)を設計し、デバイス依存のISPを学習し、色回復のプロセスを支援する。
我々のRRIDは、PSNRでは0.62dB、SSIMでは0.003のモアレパターン除去とカラーキャスト補正の性能において、最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:55:25 GMT)
Structure-Based Drug Design via 3D Molecular Generative Pre-training and Sampling [18.9] 我々は,3次元分子生成と最適化フレームワークを組み合わせるため,MorEdit3Dを提案する。
フラグメントを用いた分子生成のための新しい3次元グラフ編集モデルを開発した。
そこで,本研究では,自己サンプル分子を用いた目標学習戦略を用いて,目標関連特性を改善する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:33:48 GMT)
ChatPattern: Layout Pattern Customization via Natural Language [18.6] ChatPatternはフレキシブルパターンカスタマイズのための新しいLarge-Language-Modelフレームワークである。
LLMエージェントは、自然言語の要求を解釈し、特定の要求を満たす設計ツールを操作することができる。
ジェネレータは条件付きレイアウト生成、パターン修正、メモリフレンドリーなパターン拡張を最適化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:15:22 GMT)
Synthesizing Physical Backdoor Datasets: An Automated Framework Leveraging Deep Generative Models [18.5] 本稿では、バックドア研究者が悪意のある物理的バックドアデータセットを作成するためのレシピを公開する。
物理的なバックドアデータセットの作成に伴う複雑性を効果的に軽減する。
実験の結果、"レシピ"によって生成されたデータセットによって、敵が印象的な攻撃成功率を達成することができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:30:00 GMT)
CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in Korean [18.5] 韓国における1,995対のQAペアからなる文化・言語知能のベンチマークについて紹介する。
CLIcKは、公式の韓国の試験と教科書からデータを入手し、質問を言語と文化の2つの主要なカテゴリで11のカテゴリに分けている。
CLIcKを用いて、13の言語モデルを用いて、パフォーマンスを評価する。評価では、カテゴリ間でのパフォーマンスに関する洞察と、その理解に影響を与えるさまざまな要因を明らかにする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:53:31 GMT)
Single- and Multi-Agent Private Active Sensing: A Deep Neuroevolution Approach [18.5] 本稿では,eavesdropperの存在下でのアクティブ仮説テストにおいて,一元的かつ一元的な問題に焦点をあてる。
集中型問題ではニューロエボリューション(NE)に基づく新しいフレームワークを提案するが、分散化問題では協調型マルチエージェントタスクを解くための新しいNEベースの手法を開発する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:55:56 GMT)
Energy Correction Model in the Feature Space for Out-of-Distribution Detection [18.5] エネルギーベースモデル (EBM) を用いて, 分布内分布(ID) の密度を学習すると, 競合検出結果が得られた。
これを解決するために、クラス条件ガウス分布の混合のエネルギーベースの補正を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:37:04 GMT)
DyBluRF: Dynamic Neural Radiance Fields from Blurry Monocular Video [18.4] 動きのぼかしに影響を受ける単眼ビデオから鋭い新しいビューを合成する動的放射場アプローチであるDyBluRFを提案する。
入力画像中の動きのぼかしを考慮し、シーン内のカメラ軌跡とオブジェクト離散コサイン変換(DCT)トラジェクトリを同時にキャプチャする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:48:37 GMT)
Grasp Anything: Combining Teacher-Augmented Policy Gradient Learning with Instance Segmentation to Grasp Arbitrary Objects [18.3] TAPG(Teacher-Augmented Policy Gradient)は、強化学習と政策蒸留を統括する新しい2段階学習フレームワークである。
TAPGは、オブジェクトセグメンテーションに基づいて、誘導的かつ適応的でありながら、センセータポリシーの学習を促進する。
トレーニングされたポリシーは、シミュレーションにおける散らかったシナリオや、人間の理解可能なプロンプトに基づいて現実世界から、多種多様なオブジェクトを順応的に把握する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:48:16 GMT)
Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.9] 本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:58:17 GMT)
Seeking Flat Minima with Mean Teacher on Semi- and Weakly-Supervised Domain Generalization for Object Detection [17.8] 半教師付きドメイン一般化オブジェクト検出(SS-DGOD)と弱い教師付きDGODの2つの問題設定について検討する。
オブジェクト検出器は,同じ平均教師学習フレームワークを用いて,2つの設定で効果的に学習可能であることを示す。
また,平らなミニマを見つけるために,簡単な正規化手法を平均教師学習フレームワークに組み込むことを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:10:50 GMT)
TextBlockV2: Towards Precise-Detection-Free Scene Text Spotting with Pre-trained Language Model [17.8] 既存のシーンテキストスポッターは、画像からテキストを見つけて書き起こすように設計されている。
提案するシーンテキストスポッターは、高度なPLMを活用して、きめ細かい検出を行うことなく性能を向上させる。
PLMベースの認識モジュールは、事前学習期間中に得られた包括的な言語知識から恩恵を受け、複雑なシナリオを効果的に処理する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:38:25 GMT)
SNIP: Bridging Mathematical Symbolic and Numeric Realms with Unified Pre-training [17.6] シンボリック・数値統合事前学習モデルSNIPを紹介する。
潜在空間解析を行うことにより、SNIPが表現のクロスドメインな洞察を提供するのを観察する。
その結果、SNIPは様々なタスクに効果的に移行し、完全に教師付きベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:00:29 GMT)
Learning Markov State Abstractions for Deep Reinforcement Learning [17.3] 本稿では,マルコフの抽象状態表現を学習するのに十分であることを示す。
次に、逆モデル推定と時間的コントラスト学習を組み合わせた実践的な訓練手順について述べる。
提案手法は,ドメインの基盤構造を捉える表現を学習し,サンプル効率を向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:13:09 GMT)
CSDNet: Detect Salient Object in Depth-Thermal via A Lightweight Cross Shallow and Deep Perception Network [16.9] CSDNetはコヒーレンスを少なくして2つのモダリティを統合するように設計されている。
CSDNet for Salient Object Detection (SOD) タスクをロボット認識に適用する。
我々のアプローチはVDT-2048データセットで検証される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:49:33 GMT)
Scenario Engineering for Autonomous Transportation: A New Stage in Open-Pit Mines [16.6] 本研究は,シナリオ工学と自律交通システムを統合する新しいパラダイムを紹介する。
このパラダイムは2つの有名な露天掘り鉱山で検証されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:36:27 GMT)
IRAD: Implicit Representation-driven Image Resampling against Adversarial Attacks [16.6] 本稿では,画像再サンプリングという,敵対的攻撃に対する新たなアプローチを提案する。
画像再サンプリングは、幾何学的変換によって指定されたシーンの再調整や再レンダリングの過程をシミュレートして、離散画像を新しい画像に変換する。
本手法は,クリーンな画像の精度を維持しつつ,多様な深層モデルの様々な攻撃に対する対角的堅牢性を著しく向上することを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:31:26 GMT)
Multi-criteria Token Fusion with One-step-ahead Attention for Efficient Vision Transformers [16.6] Vision Transformer (ViT) はコンピュータビジョンのバックボーンとして登場した。
近年の作業は、冗長なトークンをプルーニングまたはファンクションすることにより、自己保持層の二次コストを低減している。
ここでは,トークンの融合は情報損失を最小限に抑えるために,トークン間の多様な関係を考慮する必要があると論じる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:30:29 GMT)
Experimental demonstration of improved reference-frame-independent quantum key distribution over 175km [16.6] 我々は、Eveにリークした境界情報の統計量を含む改良されたRFI-QKDプロトコルを実験的に実証した。
本研究は、RFI-QKDにより達成可能な通信距離を延長し、その実用化に顕著な進展をもたらすものと信じている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:33:19 GMT)
Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding [16.5] 入力としてCLIPを埋め込んだ画像のみを取り込む画像から3D生成パイプラインであるIsotropic3Dを提案する。
等方性3Dは、最適化をSDS損失のみを静止させることで、方位角の等方性w.r.t.にすることができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:27:58 GMT)
Open Continual Feature Selection via Granular-Ball Knowledge Transfer [16.5] データ前処理における連続的特徴選択(CFS)のための新しいフレームワークを提案する。
提案手法は,連続学習(CL)とグラニュラーボールコンピューティング(GBC)の強みを組み合わせたものである。
提案手法は,最先端の特徴選択法と比較して,有効性と効率の両面で優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:43:03 GMT)
Bridging Implicit and Explicit Geometric Transformation for Single-Image View Synthesis [16.1] シーソー」問題:再計画されたコンテンツを保存し、現実的なアウトオブビュー領域を完成させる。
本稿では,効率的な非自己回帰モデルを用いて,シーソー問題を緩和する単一画像ビュー合成フレームワークを提案する。
我々の損失関数は、明示的特徴が暗黙的特徴の再投影領域を改善し、暗黙的特徴が明示的特徴のアウト・オブ・ビュー領域を改善することを促進する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:21:04 GMT)
Accurate Segmentation of Optic Disc And Cup from Multiple Pseudo-labels by Noise-aware Learning [16.1] 本稿では,光ディスクとカップセグメンテーションの精度向上を目的として,MPNN(Multiple Pseudo-labels Noise-aware Network)のラベルデノベーション手法を提案する。
具体的には、MPNNは、真のラベルに基づいて訓練された複数の異なるネットワークと、これらの擬似ラベルガイドから抽出された画素レベルのコンセンサス情報によって擬似ラベルを生成する。
MPNNのトレーニングフレームワークは、清潔なピクセルとノイズの多いピクセルからセグメンテーションを学ぶための教師/学生アーキテクチャによって構築されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:38:04 GMT)
Unprocessing Seven Years of Algorithmic Fairness [16.0] 7年前、研究者は、異なる人口集団にわたるモデルのエラー率を等化するためのポストプロセッシング手法を提案した。
いくつかのデータセットに対する何千ものモデル評価を通じて、これらの主張を実証的に評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:02:26 GMT)
MR-MT3: Memory Retaining Multi-Track Music Transcription to Mitigate Instrument Leakage [15.9] 本稿では,SOTA(State-of-the-art)トークンに基づくマルチインストラクト自動音楽書き起こし(AMT)モデルであるMT3モデルの改良について述べる。
本稿では, メモリ保持機構, 先行トークンサンプリング, トークンシャッフルなどの改良を加えたMR-MT3を提案する。
これらの手法はSlakh2100データセットで評価され、改善されたF1スコアと楽器リークの低減を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:13:38 GMT)
Backdoor Secrets Unveiled: Identifying Backdoor Data with Optimized Scaled Prediction Consistency [15.6] 現代の機械学習システムは、バックドア中毒の攻撃に弱い。
本稿では,有毒データセット内のバックドアデータの自動識別を提案する。
提案手法は,バックドアデータポイントの同定において,現在のベースラインの性能を上回ることが多いことを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:35:07 GMT)
Delivery Optimized Discovery in Behavioral User Segmentation under Budget Constraint [15.6] ユーザの行動フットプリントは,行動ベースのユーザセグメント(あるいはセグメント)を発見し,ユーザに対してセグメント固有のメッセージを配信することを可能にする。
セグメントの発見後、FacebookやGoogleのような好みのメディアチャンネルを通じてメッセージを送ることは難しい。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:16:14 GMT)
Fast, Expressive SE$(n)$ Equivariant Networks through Weight-Sharing in Position-Orientation Space [15.5] 我々は,畳み込みネットワークにおける重み共有の概念を,ポイントペア上でのメッセージ関数の共有として定式化する。
我々は3次元点雲処理のための効率的な同変群畳み込みネットワークを開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:21:33 GMT)
NetBench: A Large-Scale and Comprehensive Network Traffic Benchmark Dataset for Foundation Models [15.5] ネットワークトラフィック(ネットワークトラフィック、英: network traffic)は、インターネット上のコンピュータやシステム間でパケットとして送信されるデータの量である。
我々は,機械学習モデルを評価するための大規模かつ包括的なベンチマークデータセットであるNetBenchを紹介する。
我々は,8つの状態-Of-The-Art(SOTA)分類モデルと2つの生成モデルを評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:09:54 GMT)
Insect-Foundation: A Foundation Model and Large-scale 1M Dataset for Visual Insect Understanding [15.4] 現在のマシンビジョンモデルは、高性能を達成するために大量のデータを必要とする。
Insect-1M"データセットは,昆虫に関する基礎モデルトレーニングに革命をもたらすことを意図したゲーム変更リソースである。
私たちのデータセットは、昆虫の幅広い範囲をカバーしており、100万枚の画像を含む分類分類階層と昆虫の記載の密度の高い識別ラベルは、昆虫学のパノラマ的なビューを提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:15:00 GMT)
Metrics on Markov Equivalence Classes for Evaluating Causal Discovery Algorithms [15.4] 合成データに対する因果探索手法の評価には、この明確な目的がどの程度達成されたかの分析を含めるべきである。
本研究では,2つの因果グラフの分離・接続の違いを正確に把握できないことを示す。
この欠点に対処するために, s/c-距離, マルコフ距離, 信仰度距離という3つの新しい測度を導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:21:56 GMT)
Expressivity of Spiking Neural Networks [15.2] 本研究では,ニューロンの発射時間内に情報を符号化したスパイクニューラルネットワークの能力について検討する。
ReLUネットワークとは対照的に、スパイクニューラルネットワークは連続関数と不連続関数の両方を実現することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:50:58 GMT)
Codebook Transfer with Part-of-Speech for Vector-Quantized Image Modeling [15.1] 本稿では、事前学習された言語モデルからVQIMへ、十分に訓練されたコードブックを転送することを目的とした、VQCTというパート・オブ・音声による新しいコードブック転送フレームワークを提案する。
4つのデータセットに対する実験結果から,VQCT法は従来の最先端手法よりも優れたVQIM性能が得られることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:24:13 GMT)
Perceptual Quality-based Model Training under Annotator Label Uncertainty [15.0] アノテーションは、アノテータラベルの不確実性と呼ばれるデータラベリング中に不一致を示す。
モデル学習のための複数のラベルを客観的に生成する新しい知覚品質ベースモデルトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:52:18 GMT)
The Whole is Better than the Sum: Using Aggregated Demonstrations in In-Context Learning for Sequential Recommendation [15.0] 大規模言語モデル(LLM)は、様々なNLPタスクにおいて優れた性能を示している。
本稿では,命令形式,タスク整合性,デモ選択,デモ数の影響について検討する。
本稿では,複数のデモユーザを集約したデモに組み込む LLMSRec-Syn という新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:28:19 GMT)
DSP: Dynamic Sequence Parallelism for Multi-Dimensional Transformers [14.9] 本稿では,多次元トランスモデルに対する効率的なシーケンス並列化を実現するための新しいアプローチである動的シーケンス並列化(DSP)を提案する。
鍵となる考え方は、多次元の注意の潜在的特性を利用して、現在の段階に応じて並列性次元を動的に切り替えることである。
実験の結果、DSPは従来のシーケンス並列化法よりもエンドツーエンドのスループットを42.0%から216.8%改善した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:53:50 GMT)
SVD-LLM: Truncation-aware Singular Value Decomposition for Large Language Model Compression [14.8] 大規模言語モデル(LLM)のための新しいSVDベースの圧縮手法であるSVD-LLMを提案する。
SVD-LLMは、特異値と圧縮損失の直接マッピングを保証するために、トラクション対応のデータホワイトニング戦略を組み込んでいる。
SVD-LLMを3つのLLMファミリーの合計11のデータセットと7つのモデルで4つのスケールで評価した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:59:10 GMT)
ScoreCL: Augmentation-Adaptive Contrastive Learning via Score-Matching Function [14.7] 自己教師付きコントラスト学習(CL)は表現学習において最先端のパフォーマンスを達成した。
各種CL法を一貫して改良することにより,ScoreCLと呼ばれる手法の汎用性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:44:55 GMT)
Intent-conditioned and Non-toxic Counterspeech Generation using Multi-Task Instruction Tuning with RLAIF [14.3] オンラインヘイトスピーチに対する反応として定義されているCounterspeechは、非センセーショナルソリューションとしてますます利用されている。
ヘイトフルステートメントにおける社会的バイアスの背景にある実践的意味をモデル化し,反音声生成を促進させる新しいフレームワークであるCoARLを紹介した。
CoARLの最初の2つのフェーズは、連続的なマルチインストラクションチューニング、インテント、反応、攻撃的ステートメントの害を理解するためのモデルを教えること、そしてインテント条件付き逆音声を生成するためのタスク固有の低ランクアダプタ重みを学習することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:03:49 GMT)
Imperio: Language-Guided Backdoor Attacks for Arbitrary Model Control [14.2] 本稿では,NLPモデルの言語理解機能を活用し,バックドア攻撃を増強するImperioを提案する。
敵は言語誘導命令を通じて任意の出力で被害者モデルを操作できる。
3つのデータセット、5つの攻撃、9つの防御実験により、Imperioの有効性が確認された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:34:36 GMT)
Efficient Multiplayer Battle Game Optimizer for Adversarial Robust Neural Architecture Search [14.1] 本稿では,効率的なマルチプレイヤーバトルゲーム(EMBGO)として知られるメタヒューリスティックアルゴリズムを提案する。
この研究の背後にある動機は、元のMBGOの欠点を正す必要があることにある。
EMBGOは、移動と戦闘フェーズを統合することでこれらの制限を緩和し、元の最適化フレームワークを簡素化し、探索効率を向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:45:32 GMT)
Accurate and Data-Efficient Micro-XRD Phase Identification Using Multi-Task Learning: Application to Hydrothermal Fluids [14.1] 本研究は,制約を克服するためにマルチタスク学習アーキテクチャを用いたディープラーニングの可能性を示す。
我々はMTLモデルを訓練し、ラベル付き実験データの必要性を最小限に抑え、mu-XRDパターンの位相情報を同定した。
生および未加工のXRDパターンを解析するために調整されたMTLモデルは、前処理データの解析モデルと密な性能を達成した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:23:30 GMT)
Cross-domain Random Pre-training with Prototypes for Reinforcement Learning [13.9] タスク非依存型クロスドメイン事前学習は、画像ベース強化学習(RL)において大きな可能性を秘めている
CRPTproは、画像ベースのRLのプロトタイプを備えたクロスドメインのランダム事前訓練フレームワークである。
CRPTproはクロスドメインランダムポリシーを使用して、複数のドメインから多様なデータを簡単かつ迅速にサンプリングし、事前学習効率を向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:29:42 GMT)
Gradient based Feature Attribution in Explainable AI: A Technical Review [13.8] ブラックボックスAIモデルの急増は、内部メカニズムを説明し、信頼性を正当化する必要性を喚起している。
勾配に基づく説明は、ニューラルネットワークモデルに直接適用することができる。
アルゴリズムの性能を測定するために,人的評価と定量的評価の両方を導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:49:31 GMT)
Differentiable Euler Characteristic Transforms for Shape Classification [13.6] オイラー特性変換(ECT)は、形状とグラフの幾何学的特徴と位相的特徴を組み合わせた強力な表現であることが証明されている。
我々は,ECTをエンドツーエンドで学習できる新しい計算層を開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:17:35 GMT)
E4C: Enhance Editability for Text-Based Image Editing by Harnessing Efficient CLIP Guidance [13.5] 拡散ベースの画像編集は、ソースイメージコンテンツを保存し、新しいコンテンツを生成したり、修正を加えたりする複合プロセスである。
テキストベースのtextbf 編集のための textbfCLIP 誘導によるゼロショット画像編集手法である textbfEnhance textbfEditability を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:26:48 GMT)
Don't Half-listen: Capturing Key-part Information in Continual Instruction Tuning [13.5] キーパート情報ゲイン(KPIG)に基づく新しい連続的命令チューニング手法を提案する。
本手法は,マスク部分の情報ゲインを計算し,データを動的に再生し,トレーニング対象を洗練させる。
実験により,本手法は観察タスクと保留タスクの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:54:20 GMT)
P-Mamba: Marrying Perona Malik Diffusion with Mamba for Efficient Pediatric Echocardiographic Left Ventricular Segmentation [13.3] P-Mamba を用いた小児心エコー図左室分画の高効率化について検討した。
具体的には、最近提案された視覚マンバエンコーダブランチの視覚マンバ層に目を向ける。
他のDWTベースのPMDエンコーダブランチでは、ノイズ抑制にPMDを利用するDWTベースのPerona-Malik Diffusion(PMD)ブロックを考案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:04:16 GMT)
InterLUDE: Interactions between Labeled and Unlabeled Data to Enhance Semi-Supervised Learning [13.0] 半教師付き学習(SSL)はラベル付きデータとラベルなしデータの両方でトレーニングすることでタスクパフォーマンスを向上させる。
本稿では,ラベル付きラベルなしインタラクションの恩恵を受ける2つの部分からなるSSLを強化するための新しいアプローチであるInterLUDEを紹介する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:54:10 GMT)
Adaptive Random Feature Regularization on Fine-tuning Deep Neural Networks [13.0] 適応ランダム特徴正規化(AdaRand)と呼ばれる単純な手法を提案する。
AdaRandは、訓練モデルの特徴抽出器が、補助的なソース情報や適切な計算コストを伴わずに、下流の分類タスクのための特徴ベクトルの分布を適応的に変更するのに役立つ。
実験の結果、AdaRandは他の微調整正規化よりも優れており、補助的な情報源情報と重い計算コストが要求されることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:26:59 GMT)
DeepRepViz: Identifying Confounders in Deep Learning Model Predictions [13.0] DeepRepVizは、ディープラーニング(DL)モデルの予測において、共同創設者を特定するように設計されたフレームワークである。
この枠組みを大規模ニューロイメージングデータセットで検証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:01:24 GMT)
Post-hoc Bias Scoring Is Optimal For Fair Classification [12.9] バイアススコアと呼ばれる新しいインスタンスレベルのバイアス尺度を導入し、修正規則は有限量のバイアススコアの上に単純な線形ルールである。
DPとEOpの制約の場合、修正規則は1つのバイアススコアをしきい値にし、EOの制約の場合、線形修正規則を2つのパラメータに適合させることが要求される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:09:24 GMT)
RangeLDM: Fast Realistic LiDAR Point Cloud Generation [12.9] 本研究では,高品質なLiDAR点雲を高速に生成するための新しいアプローチであるRangeLDMを紹介する。
Hough 投票による点雲から範囲画像への正確な投影のために、レンジビューデータ分布を補正することで、これを実現する。
我々は、レンジ誘導型識別器を考案し、3次元構造的忠実性を維持するようモデルに指示する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:19:57 GMT)
Multivariate Gaussian Approximation for Random Forest via Region-based Stabilization [12.8] ポアソン過程によって与えられる一連のトレーニングポイントに基づいて,ランダムな森林予測のためのガウス近似境界を導出する。
我々のアプローチは、ランダムな森林予測が地域ベースの安定化と呼ばれる特定の幾何学的特性を満たすという重要な観測に基づいている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:50:41 GMT)
"It Can Relate to Real Lives": Attitudes and Expectations in Justice-Centered Data Structures & Algorithms for Non-Majors [12.8] 性別や人種の多様性を持つ中等教育の学生が、正義中心のデータ構造とアルゴリズムのコースをどう経験するかを検討する。
クラス全体では,自信の計算と帰属意識という,次のような態度が顕著に増加した。
黒、ラテックス、中東、北アフリカ、ネイティブアメリカン、太平洋諸島の学生は、白人やアジア人の学生と比べて大きな差はなかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:20:23 GMT)
Linear optimal transport subspaces for point set classification [12.7] 本研究では,ある種類の空間的変形を経験する点集合を分類する枠組みを提案する。
提案手法では,Linear Optimal Transport (LOT) 変換を用いて,集合構造データの線形埋め込みを求める。
様々な点集合分類タスクにおける最先端の手法と比較して、競争力のある精度を達成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:39:27 GMT)
DRAGIN: Dynamic Retrieval Augmented Generation based on the Real-time Information Needs of Large Language Models [12.6] 大規模言語モデル(LLM)のリアルタイム情報要求に基づく動的検索拡張生成を導入する。
本フレームワークは,テキスト生成プロセスにおいて,LLMのリアルタイム情報要求に基づいて,いつ,何を取得するかを決定するように設計されている。
実験の結果,DRAGINは全タスクにおいて優れた性能を示し,本手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:45:37 GMT)
An Ecosystem for Personal Knowledge Graphs: A Survey and Research Roadmap [12.6] PKGの全体像は、その潜在能力を最大限に解き放つために必要である、と我々は主張する。
我々は,PKGがデータサービスやデータソースに対する明確なインターフェースを持つ大規模エコシステムの一部である,PKGの統一フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:20:52 GMT)
Approximate Nullspace Augmented Finetuning for Robust Vision Transformers [12.5] 線形代数からのヌル空間の概念にインスパイアされた視覚変換器の堅牢性を高める。
このモデルでは, 対角線や自然像の帰属に対する頑健さが示される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:07:39 GMT)
Identifying Causal Effects using Instrumental Time Series: Nuisance IV and Correcting for the Past [12.5] ベクトル自己回帰(VAR)プロセスのような時系列モデルにおけるIV回帰を考察する。
i.d.テクニックの直接的な適用は、過去に依存性を正しく調整しなかったため、一般的には矛盾する。
我々は,その一貫性を証明し,その因果効果が分布一般化にどのように用いられるかを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:13:03 GMT)
CAMixerSR: Only Details Need More "Attention" [12.5] 本稿では,コンボリューションを単純なコンテキストに割り当てるコンテンツ対応ミキサー (CAMixer) と,スパーステクスチャに変形可能なウィンドウアテンションを提案する。
具体的には、CAMixerは学習可能な予測器を使用して複数のブートストラップを生成する。ウィンドウのワープのオフセット、ウィンドウの分類のためのマスク、動的プロパティとの畳み込みのための畳み込みアテンションなどである。
単純にCAMixerを積み重ねることで、大画面SR、軽量SR、全方位SRにおいて優れた性能を実現するCAMixerSRを得る。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:22:27 GMT)
FBPT: A Fully Binary Point Transformer [12.4] 本稿では,ロボット工学やモバイルデバイスの分野で広く応用され拡張される可能性を持つ,FBPT(Fully Binary Point Cloud Transformer)モデルを提案する。
32ビットの完全精度ネットワークの重みとアクティベーションを1ビットのバイナリ値に圧縮することにより、提案したバイナリポイントクラウドトランスフォーマーネットワークは、ストレージフットプリントと計算リソースの要求を大幅に削減する。
本稿の主な焦点は、バイナリポイントクラウドトランスフォーマーモジュールの使用によるパフォーマンス劣化問題に対処することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:45:10 GMT)
Measurement-device-independent quantum random number generation over 23 Mbps with imperfect single-photon sources [12.3] 測定デバイス非依存(MDI)量子乱数生成(QRNG)により、認証されたランダム性を生成する。
単一光子源の不完全性に対するロバストな計測トモグラフィー手法に基づく高速MDI-QRNG方式を提案する。
提案手法を実験的に実証し,23Mbps以上の生成速度に対応する7.37倍10-2$ビットの信頼最小エントロピー下界を得た。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:11:49 GMT)
Polarization-based cyclic weak value metrology for angular velocity measurement [12.2] 弱測定は、選択後の低い確率でほとんどの光子を捨てながら、メートルの変化の検出を増幅することが証明されている。
従来の電力リサイクル方式では、失敗した後光子の繰り返し選択が可能であり、非効率な後選択を克服し、検出精度を向上する。
本研究では,偏光に基づく弱値角速度測定に焦点をあて,ガウスビームの時間シフト検出精度を高めるために3つの循環法を導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:14:20 GMT)
Adaptivity is not helpful for Pauli channel learning [12.1] このノートは、適応戦略が、絡み合った入力でPauliチャネルを学習し、テストするための追加の利点を提供していないことを示している。
まず、一般ノルム$l_p$に対して、絡み合った入力を持つパウリチャネルを学習する際の厳密なクエリ複雑性を確立する。
誤差分布のエントロピーを特徴とするPauliチャネルのノイズレベルを推定するクエリの複雑さが$Theta(4n/n)$であることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:24:22 GMT)
SemanticHuman-HD: High-Resolution Semantic Disentangled 3D Human Generation [12.1] 本稿ではセマンティックHuman-HDについて紹介する。
SemanticHuman-HDは10242ドルの解像度で3D認識画像合成を実現する最初の方法でもある。
提案手法は, 3次元衣服生成, セマンティック・アウェア画像合成, 制御可能な画像合成など, 様々な用途にエキサイティングな可能性を開く。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:18:56 GMT)
Enhanced Coherence-Aware Network with Hierarchical Disentanglement for Aspect-Category Sentiment Analysis [12.0] 本稿では,ACSAタスクの階層的絡み合い(ECAN)を考慮したコヒーレンス対応ネットワークを提案する。
我々は,コヒーレンス表現に絡み合った複数のカテゴリと感情を効果的に分離し,SOTA(State-of-the-art)のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:32:44 GMT)
NeuralOCT: Airway OCT Analysis via Neural Fields [12.0] 気道OCT画像処理のための学習ベースアプローチである$textttNeural OCTを提案する。
具体的には、$textttNeural OCTは、OCTスキャンから2Dセグメンテーションによるポイントクラウド抽出と、ニューラルネットワークによるポイントクラウドからの3D再構成という2つのステップを堅牢にブリッジすることで、3Dジオメトリを抽出する。
実験の結果,$textttNeural OCT$は,平均A線誤差が70マイクロメートル未満の高精度で頑健な3次元気道再建を実現することがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:35:14 GMT)
CPGA: Coding Priors-Guided Aggregation Network for Compressed Video Quality Enhancement [11.9] 符号化先行情報から時間的・空間的情報を利用するためのCPGA(Coding Priors-Guided Aggregation)ネットワークを提案する。
VQEタスクの研究を容易にするために,ビデオ符号化優先(VCP)データセットを構築した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:53:31 GMT)
Accurate Retraining-free Pruning for Pretrained Encoder-based Language Models [11.8] K-pruneは、事前訓練されたエンコーダベースの言語モデルのための、正確な再学習不要な構造化プルーニングアルゴリズムである。
既存のリトレーニングフリープルーニングアルゴリズムと比較して、F1スコアは58.02%pに向上した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:51:19 GMT)
Molecular Identification and Peak Assignment: Leveraging Multi-Level Multimodal Alignment on NMR [11.8] 本稿では,知識誘導型インスタンスワイズ識別(K-M3AID)を用いたマルチレベルマルチモーダルアライメント(Multi-Level Multimodal Alignment)を提案する。
K-M3AIDは、グラフレベルのアライメントモジュール、ノードレベルのアライメントモジュール、通信チャネルの3つの主要なモジュールを持つ二重協調型コントラスト学習アーキテクチャを採用している。
経験的検証は、複数のゼロショットタスクにおけるK-M3AIDの有効性を裏付ける。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:31:41 GMT)
Spiking Neural Networks for Fast-Moving Object Detection on Neuromorphic Hardware Devices Using an Event-Based Camera [11.7] 本稿では,球検出のためのイベントベースカメラとスパイキングニューラルネットワーク(SNN)を組み合わせた新しいソリューションを提案する。
我々は、複数のニューロモルフィックエッジデバイスにまたがってSNNソリューションを実装し、それらの精度と実行時間の比較を行う。
ロボットのためのSNNソリューションの比較では、ニューロモルフィックエッジデバイス上のSNNがクローズドループロボットシステムでリアルタイムに動作可能であることも示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:53:10 GMT)
milliFlow: Scene Flow Estimation on mmWave Radar Point Cloud for Human Motion Sensing [11.5] mmWaveレーダーはプライバシーにやさしい機能のために人気を博している。
我々はmmWave点雲の相補的な動き情報としてシーンフローを推定する新しい深層学習手法である MilliFlow を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:26:20 GMT)
Enhancing Human-Centered Dynamic Scene Understanding via Multiple LLMs Collaborated Reasoning [11.5] ビデオベースヒューマンオブジェクトインタラクション(V-HOI)検出は,セマンティックシーン理解において重要な課題である。
以前のV-HOI検出モデルは、特定のデータセットの正確な検出に大きく進歩した。
本稿では、現在のV-HOI検出モデルの性能向上を図るために、V-HOI Multi-LLMs Collaborated Reasoning (V-HOI MLCR)を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:51:15 GMT)
Robust Influence-based Training Methods for Noisy Brain MRI [11.5] 脳腫瘍を分類するために、ノイズの多いMR画像のディープラーニングモデルを訓練する難しいが現実的な設定について研究する。
ノイズの多いMRIトレーニングデータに対して頑健な2つのトレーニング手法を提案する。
実験結果から、ISRとISPは、ノイズの多いトレーニングデータに対して、ディープラーニングモデルを堅牢にトレーニングできることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:30:25 GMT)
Towards Adversarially Robust Dataset Distillation by Curvature Regularization [11.5] 蒸留したデータセットに対向ロバスト性を組み込むことで、これらのデータセットでトレーニングされたモデルが高い精度を維持し、より良い対向ロバスト性を得る。
そこで本研究では, 従来の逆算法よりも計算オーバーヘッドの少ない蒸留プロセスに曲率正規化を組み込むことにより, この目標を達成する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:31:03 GMT)
A Novel Framework for Multi-Person Temporal Gaze Following and Social Gaze Prediction [11.3] 現場のすべての人々の視線目標と社会的視線ラベルを共同で予測する新しい枠組みを導入する。
i) 個人に関連する視線情報をキャプチャする個人固有のトークンを処理する、時間的、トランスフォーマーベースのアーキテクチャ。
我々は,VSGazeでトレーニングしたモデルで全てのタスクを共同で処理できることを示し,マルチパーソナライズされた視線追跡と社会的視線予測の最先端結果を得た。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:50:45 GMT)
Local positional graphs and attentive local features for a data and runtime-efficient hierarchical place recognition pipeline [11.1] 本稿では,既存のアプローチを拡張し,新しいアイデアを提示する,ランタイムとデータ効率のよい階層型VPRパイプラインを提案する。
まず,ローカル画像の特徴の空間的コンテキスト情報を符号化する学習不要かつ実行効率のよいアプローチであるローカル位置グラフ(LPG)を提案する。
第2に,アテンタティブ・ローカルSPED(Attentive Local SPED)について述べる。
第3に,超次元計算を利用した階層型パイプラインを提案し,高速な候補選択と候補再評価のために,全体的HDC記述子と同じ局所的特徴を利用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:26:39 GMT)
Device-independent quantum secret sharing with noise pre-processing and post-selection [11.0] デバイス非依存(DI) QSSは、デバイスの内部動作に関するセキュリティ上の仮定を緩和することができる。
本稿では,グリーンベルガー・ホーネ・ザイリンガー状態に基づくDI-QSSプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:34:02 GMT)
The cool and the cruel: separating hard parts of LWE secrets [11.0] スパースバイナリLWEシークレットに対する既知の攻撃には、スパースデュアルアタックとミドルアタックにおけるハイブリッドスパースデュアルミートが含まれる。
本稿では,メモリ要求の少ない新しい統計的攻撃を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:16:21 GMT)
Cardiac Magnetic Resonance 2D+T Short- and Long-axis Segmentation via Spatio-temporal SAM Adaptation [10.9] CMR2D+TSAMはCMR2D+Tセグメンテーションに適応するための新しいアプローチである。
CMR2D+T-SAMは、STACOM2011データセット上の既存のディープラーニング手法より優れている。
また、Diceスコアが0.840、HDが4.076ピクセルのACDCで優れた一般化を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:27:55 GMT)
On the low-shot transferability of [V]-Mamba [10.8] 本研究は,[V]-マンバの移動学習の可能性を探るために焦点をシフトする。
我々は、その性能を、異なる数ショットのデータ予算と効率的な転送方法で比較する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:29:33 GMT)
Interactive Trimming against Evasive Online Data Manipulation Attacks: A Game-Theoretic Approach [10.8] 悪意のあるデータ中毒攻撃は、機械学習プロセスを破壊し、深刻な結果をもたらす可能性がある。
これらの攻撃を軽減するため、トリミングのような距離ベースの防御法が提案されている。
トリミング戦略を用いてオンラインデータ操作攻撃を防御するインタラクティブなゲーム理論モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:59:05 GMT)
Can Factual Statements be Deceptive? The DeFaBel Corpus of Belief-based Deception [10.8] DeFaBelコーパス(DeFaBel corpus)は,信仰に基づく詐欺のクラウドソースリソースである。
この事実性、個人的な信念、欺く意図の相互作用は、まだ未調査の領域である。
DeFaBel corpus にはドイツ語 1031 のテキストが含まれており、そのうち643 は偽造、388 は非偽造である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:46:00 GMT)
Advancements in 3D Lane Detection Using LiDAR Point Clouds: From Data Collection to Model Development [10.8] LiSV-3DLaneは大規模な3Dレーンデータセットで、20kフレームのサラウンドビューのLiDAR点雲と豊富なセマンティックアノテーションから構成される。
本稿では,LiDARを用いた新しい3次元車線検出モデルLiLaDetを提案し,LiDAR点雲の空間的幾何学的学習をBird's Eye View (BEV) に基づく車線識別に取り入れた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:08:32 GMT)
AutoHLS: Learning to Accelerate Design Space Exploration for HLS Designs [10.7] 本稿では,深層ニューラルネットワーク(DNN)とベイズ最適化(BO)を統合してHLSハードウェア設計最適化を高速化する,AutoHLSという新しいフレームワークを提案する。
実験の結果,探索時間の70倍のスピードアップが得られた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:14:44 GMT)
NTIRE 2023 Image Shadow Removal Challenge Technical Report: Team IIM_TTI [10.7] NTIRE2023シャドウ除去チャレンジの準備としてShadowFormerを分析し,議論する。
LPIPSでは0.196点(19点中3点)、平均オピニオンスコア(MOS)では7.44点(19点中4点)のスコアを得た。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:40:23 GMT)
Not Just Change the Labels, Learn the Features: Watermarking Deep Neural Networks with Multi-View Data [10.6] DNN内に効率よく透かしを埋め込むため,Multi-view dATa をベースとした新しい透かし手法 MAT を提案する。
提案手法を様々なベンチマークで検証し,モデル抽出攻撃に対する防御効果を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:12:41 GMT)
MEDPNet: Achieving High-Precision Adaptive Registration for Complex Die Castings [10.5] 本稿では,Multiscale Efficient Deep Closest Point (MEDPNet) と呼ばれる高精度適応型登録手法を提案する。
MEDPNet法は、効率的なDCP法を用いて粗大なダイカストポイントクラウドデータ登録を行い、次いでMDR法を用いて精度の高い登録を行う。
提案手法は, 複雑なダイカスト点クラウドデータに適用した場合の, 最先端の幾何学的および学習的登録法と比較して, 優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:42:38 GMT)
Towards Embedding Dynamic Personas in Interactive Robots: Masquerading Animated Social Kinematics (MASK) [10.4] 本稿では,キャラクターライクなペルソナを用いたユーザエンゲージメントを高める革新的な対話型ロボットシステムの設計と開発について述べる。
ペルソナ駆動のダイアログエージェントの基礎の上に構築されたこの研究は、エージェントアプリケーションを物理的な領域に拡張し、より没入的でインタラクティブな体験を提供するためにロボットを活用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:22:32 GMT)
PPM : A Pre-trained Plug-in Model for Click-through Rate Prediction [10.3] クリックスルー率(CTR)予測はレコメンダシステムにおける中核的なタスクである。
我々は、textbfP$re-trained $textbfP$lug-in CTR $textbfM$odel、すなわちPPMを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:42:23 GMT)
Designing Sousveillance Tools for Gig Workers [10.3] 独立して契約した従業員として、ギグワーカーは職場監視の結果に不当に苦しむ。
批判的な理論家の中には、そのような権力の乱用に対処する潜在的手段としての監視を提案した者もいる。
半構造化インタビューを行い、ギグワーカーと共同設計活動を主導した。
我々は、監視経験に対するギグワーカーの態度と過去の経験を識別する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:08:26 GMT)
Identifying Health Risks from Family History: A Survey of Natural Language Processing Techniques [10.1] 本研究では,家族性疾患のリスクを特定するために,デジタル健康記録を活用するために開発された技術について文献調査を行った。
ルールベースの手法は研究が盛んであり、現在も家族の歴史抽出に積極的に利用されている点を強調した。
より最近の取り組みは、大規模で事前訓練された言語モデルに基づくニューラルモデルの構築である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:43:07 GMT)
Lifelong Person Re-Identification with Backward-Compatibility [9.9] LReID (Lifelong person re-identification) は、連続的にやってくるデータセットに基づいてモデルを逐次訓練する現実的なシナリオを前提としている。
本稿では,LReIDの後方互換性を初めて取り入れることで,上記の問題に対処する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:08:59 GMT)
ST-LDM: A Universal Framework for Text-Grounded Object Generation in Real Images [9.9] テキストグラウンドドオブジェクト生成(TOG)と呼ばれる新しい画像編集シナリオを提案する。
本稿では,Swin-Transformerをベースとした汎用フレームワークST-LDMを提案する。
本モデルでは,拡散モデル固有の生成能力を保ちながら,注意機構の局所化を促進する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:02:31 GMT)
NLP Verification: Towards a General Methodology for Certifying Robustness [9.9] 我々は,NLP検証パイプラインの一般的なコンポーネントを除去し,評価する試みを行っている。
我々は、検証された部分空間のセマンティック・ジェネリシビリティの技術的課題を識別し、対処する効果的な方法を与える。
埋め込みギャップの効果を解析するための一般的な手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:43:52 GMT)
Large Language Model-informed ECG Dual Attention Network for Heart Failure Risk Prediction [9.8] 心不全は、世界的な死亡率の上昇により、公衆衛生上の大きな課題となる。
臨床的に得られた12誘導心電図(ECG)を用いたHFリスク予測手法を提案する。
本稿では,初期のHF予測に不可欠な複雑なECG特徴を捉えるために設計された,軽量なデュアルアテンションECGネットワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:25:09 GMT)
Neural network based time-resolved state tomography of superconducting qubits [9.8] 個々の量子ビットに対して全状態トモグラフィーが可能な時間分解ニューラルネットワークを提案する。
このスケーラブルなアプローチは、キュービット当たりの専用モジュールで、低信号対雑音比で桁違いに読み出し誤差を緩和する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:40:23 GMT)
Experimental verification of the steering ellipsoid zoo via two-qubit states [9.7] 量子ステアリング楕円体(Quantum steering ellipsoid)は、ブロッホ図における別の相関量子ビットの測定によって操れる全ての量子ビット状態の集合を視覚化する。
幾何学的性質の異なる様々な種類の量子楕円体が楕円体動物園を形成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:13:54 GMT)
Distilling Knowledge for Short-to-Long Term Trajectory Prediction [9.6] 長期軌道予測はコンピュータビジョン、機械学習、ロボット工学の分野において重要な問題である。
本稿では,学生ネットワークに長期軌跡予測を誘導する短期軌跡モデル予測器の蒸留を利用する新しい手法であるDi-Longを提案する。
実験の結果,提案手法は長期予測に有効であり,最先端の性能を実現することができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:53:11 GMT)
Enhancing LLM Factual Accuracy with RAG to Counter Hallucinations: A Case Study on Domain-Specific Queries in Private Knowledge-Bases [9.5] 大規模言語モデル(LLM)の現実的精度を向上させるために,検索拡張生成(RAG)を利用するエンド・ツー・エンドのシステム設計を提案する。
我々のシステムはRAGパイプラインと上流データセット処理と下流性能評価を統合している。
本実験は,ドメイン固有で時間に敏感な質問に対して,より正確な回答を生成するシステムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:30:14 GMT)
FEDORA: Flying Event Dataset fOr Reactive behAvior [9.5] イベントベースのセンサーは、高速な動きを捉えるための標準フレームベースのカメラに代わる低レイテンシと低エネルギーの代替として登場した。
Flying Eventデータセット fOr Reactive behAviour (FEDORA) - 知覚タスクのための完全に合成されたデータセット。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:28:59 GMT)
Prediction of Vessel Arrival Time to Pilotage Area Using Multi-Data Fusion and Deep Learning [9.5] 本稿では,マルチデータフュージョンと深層学習手法を用いて,船舶の操縦場到着時刻の予測について検討する。
シンガポールの2つの実世界のデータセットに関する試験が行われ、以下の有望な結果が得られた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:25:04 GMT)
Leveraging Synthetic Data for Generalizable and Fair Facial Action Unit Detection [9.4] 本稿では,合成データとマルチソースドメイン適応(MSDA)を用いて,ラベル付きデータの不足や対象の多様性の問題に対処することを提案する。
具体的には,合成表情再ターゲティングにより多様なデータセットを生成することを提案する。
ジェンダーフェアネスをさらに向上させるために、PM2は実際のデータの特徴と女性と男性の合成画像とを一致させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:50:18 GMT)
Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting [9.4] 本稿では,既存の多視点拡散モデルを強化するために設計されたニューラルネットワークアーキテクチャであるMulti-view ControlNet(MVControl)を紹介する。
MVControlは最適化ベースの3D生成のための3D拡散ガイダンスを提供することができる。
効率性を追求するために、一般的に使用される暗黙の表現の代わりに、3Dガウスを表現として採用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:57:20 GMT)
MOTIV: Visual Exploration of Moral Framing in Social Media [9.3] 本稿では、ソーシャルメディア上での道徳的レトリックの分析のためのビジュアル・コンピューティング・フレームワークを提案する。
マイクロブログデータで表されるこれらの道徳的次元のそれぞれの背後にあるテクスタイエン、テキスタイル、テキスタイルをデコンストラクションし視覚化するための方法論を提案する。
この視覚的アプローチは、迅速かつ協調的な仮説テストをサポートし、議論を呼んでいる政治的問題の背後にある道徳的価値に関する洞察を得るのに役立ちます。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:11:58 GMT)
MKF-ADS: Multi-Knowledge Fusion Based Self-supervised Anomaly Detection System for Control Area Network [9.3] 制御エリアネットワーク(英: Control Area Network, CAN)は、車両ネットワークにおける電子制御ユニット(ECU)間の通信プロトコルである。
CANは、本質的にセキュリティ上のリスクのために、厳しいセキュリティ上の課題に直面している。
本稿では,MKF-ADSと呼ばれる自己教師付き多知識融合異常検出モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:57:44 GMT)
Taiyi: A high-performance CKKS accelerator for Practical Fully Homomorphic Encryption [9.2] 新たな暗号理論であるFully Homomorphic Encryptionは、重大なセキュリティ上の利点を提供するが、性能上のオーバーヘッドによって妨げられる。
一連の加速器の設計により、FHEアプリケーションの性能が大幅に向上し、現実の応用に近づいた。
これらのアクセラレーターは、大きなオンチップメモリと領域に関連する課題に直面します。
従来の最先端設計との比較評価では1.5倍の性能向上を示し、オーバヘッドを15.7%削減している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:51:07 GMT)
Pointing the Way: Refining Radar-Lidar Localization Using Learned ICP Weights [9.2] 本稿では,ライダーマップに対するレーダー計測の局所化を改善するための,ディープラーニングに基づく新しいアプローチを提案する。
ICPベースのレーダーライダーローカライゼーションシステム上に構築されており、高レベルのスキャン情報に基づいてレーダーポイントを重み付けする学習前処理ステップを含んでいる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:21:26 GMT)
Latent Object Characteristics Recognition with Visual to Haptic-Audio Cross-modal Transfer Learning [9.2] この研究は、潜伏する観測不可能なオブジェクトの特性を認識することを目的としている。
視覚は一般的にロボットによる物体認識に使われるが、隠された物体を検出するには効果がない。
本稿では,視覚から触覚へのクロスモーダル・トランスファー学習手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:18:14 GMT)
An intuitive multi-frequency feature representation for SO(3)-equivariant networks [9.1] 本稿では,高次元特徴空間に3次元点をマッピングするための同変特徴表現を提案する。
我々の表現はVNへの入力として使用することができ、その結果、我々の特徴表現により、VNはより詳細をキャプチャすることを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:36:50 GMT)
Depth-induced Saliency Comparison Network for Diagnosis of Alzheimer's Disease via Jointly Analysis of Visual Stimuli and Eye Movements [8.9] 特殊な視覚刺激下での眼球運動は、アルツハイマー病の認知異常を検出する潜在的な非侵襲的バイオマーカーとして機能する。
眼球運動解析のためのDepth-induced saliency comparison Network (DISCN)を提案する。
以上の結果から,DECNはAD患者と正常コントロールの眼球運動の分類において一貫した妥当性が得られた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:15:57 GMT)
MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation [8.8] 本稿では,1枚のRGB画像から3次元コンピュータ支援デザイン(CAD)モデルを用いてオブジェクトの6-DoFポーズを決定するための単発アプローチを提案する。
まず、ポーズ分類を行い、3Dオブジェクトを分類されたポーズに描画する。
第2段階は、クラス内のきめ細かい残留ポーズを予測するために回帰を実行する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:07:55 GMT)
Predictive Clustering of Vessel Behavior Based on Hierarchical Trajectory Representation [8.7] 階層型容器挙動(PC-HiV)の予測クラスタリング
PC-HiVはまず階層表現を用いて全ての軌道を行動列に変換する。
そして、その表現に基づいて、シーケンスの各タイムスタンプで進化を予測する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:22:16 GMT)
Follow-Up Differential Descriptions: Language Models Resolve Ambiguities for Image Classification [8.7] Follow-up Differential Descriptions (FuDD)は、クラス記述を各データセットに合わせて調整するゼロショットアプローチである。
FuDDはまず各画像のあいまいなクラスを特定し、次にLarge Language Model(LLM)を使用して、それらの区別する新しいクラス記述を生成する。
FuDD は,12 個のデータセットに対して,汎用的な記述アンサンブルやナイーブな LLM 生成記述を一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:58:05 GMT)
S3LLM: Large-Scale Scientific Software Understanding with LLMs using Source, Metadata, and Document [8.5] 大規模言語モデル(LLM)は、複雑な科学的コードを理解するための新しい経路を提供する。
S3LLMは、ソースコード、コードメタデータ、要約された情報を対話的で対話的な方法で検証できるように設計されたフレームワークである。
S3LLMは、大規模科学計算ソフトウェアを迅速に理解するために、ローカルにデプロイされたオープンソースLLMを使用する可能性を実証している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:04:27 GMT)
Generative deep learning-enabled ultra-large field-of-view lens-free imaging [8.5] 我々は、ホログラフィック画像再構成に生成人工知能(AI)を活用するディープラーニング(DL)ベースのイメージングフレームワーク、GenLFIを提案する。
我々は、GenLFIが550ドル以上のリアルタイムFOVを達成でき、現在のLFIシステムを20倍以上上回り、世界最大規模の共焦点顕微鏡よりも1.76倍大きいことを実証した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:56:22 GMT)
SocialGenPod: Privacy-Friendly Generative AI Social Web Applications with Decentralised Personal Data Stores [8.4] SocialGenPodは、生成型AI Webアプリケーションをデプロイする、分散型でプライバシフレンドリな方法である。
私たちは、ユーザが生成するAIアプリケーションからユーザデータを分離するために、Solid(分散Web仕様)をどのように使用できるかを示します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:43:02 GMT)
Team Trifecta at Factify5WQA: Setting the Standard in Fact Verification with Fine-Tuning [8.3] 本稿では,事実検証のための質問回答とテキスト分類コンポーネントからなる包括的フレームワークであるPre-CoFactv3を提案する。
私たちのチームは、AAAI-24 Factify 3.0 Workshopで第1位を獲得し、ベースラインの精度を103%上回り、第2の競争相手よりも70%リードを維持しました。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:24:28 GMT)
Robust Identity Perceptual Watermark Against Deepfake Face Swapping [8.3] ディープフェイク・フェイススワップは、ディープジェネレーティブ・モデルの急速な開発で重要なプライバシー問題を引き起こしている。
本稿では,Deepfakeの顔スワップに対する検出とソーストレースを同時に行う,最初の堅牢なアイデンティティ認識型透かしフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:27:00 GMT)
Facial Kinship Verification from remote photoplethysmography [8.2] Kinship Verification (FKV) は、2人の被験者が人間の顔に基づいて親族関係を持つかどうかを自動的に判定することを目的としている。
従来のFKVは、スプーフ攻撃に脆弱であり、プライバシーの問題を引き起こすため、課題に直面している。
本稿では,FKVを生体信号で探索し,リモート光合成反射に着目した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:16:30 GMT)
Revisiting Adversarial Training under Long-Tailed Distributions [8.2] 敵の訓練は、このような攻撃に対抗する最も効果的な方法の1つとして認識されている。
Balanced Softmax Loss単独で、トレーニングオーバーヘッドを大幅に削減しつつ、完全なRoBalアプローチに匹敵するパフォーマンスを実現することができることを示す。
これを解決するために,データ拡張をソリューションとして検討し,バランスの取れたデータと異なり,データ拡張は頑健なオーバーフィッティングを効果的に軽減するだけでなく,ロバスト性も著しく改善することを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:29:41 GMT)
RCooper: A Real-world Large-scale Dataset for Roadside Cooperative Perception [8.1] 実世界の大規模RCooperデータセットを公開し、実用的な道路側協調認識の研究を華々しくする。
データセットは,2つの代表的なトラフィックシーンを含む,50kイメージと30kポイントのクラウドで構成されている。
構築されたベンチマークは、道路側協調認識の有効性を証明し、さらなる研究の方向性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:44:02 GMT)
HIG: Hierarchical Interlacement Graph Approach to Scene Graph Generation in Video Understanding [8.1] 既存の手法は単純な関係モデルを活用しながら複雑な相互作用に焦点を当てている。
階層構造内の統一層とグラフを利用する階層型インターレースグラフ (HIG) という新しい手法を提案する。
提案手法は,様々なシナリオで実施された広範囲な実験を通じて,他の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:33:32 GMT)
Cyber-Twin: Digital Twin-boosted Autonomous Attack Detection for Vehicular Ad-Hoc Networks [8.1] Vehicular Ad-hoc NETworks(VANETs)の急速な進化は、インテリジェントトランスポートシステム(ITS)の転換期へと導いてきた。
VANETは、妨害やDDoS(Distributed Denial of Service)攻撃など、サイバー攻撃の影響を受けやすくなっている。
既存の方法は、動的攻撃を検出し、VANETサイバーセキュリティを強化するためにデジタルツイン技術と人工知能(AI)モデルを統合するのに困難に直面している。
本研究では、VANETにおけるRSUのセキュリティを高めるために、デジタルツイン技術とAIを組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:42:22 GMT)
Improving Medical Multi-modal Contrastive Learning with Expert Annotations [8.1] eCLIPはCLIPモデルの強化版であり、放射線学者の眼球熱マップの形で専門家アノテーションを統合する。
対照的なマルチモーダル医療画像解析における重要な課題、特にデータ不足と「モダリティギャップ」に対処する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:54:04 GMT)
Scalable Algorithms for Individual Preference Stable Clustering [8.0] 本稿では,IP安定クラスタリングのための自然局所探索アルゴリズムについて検討する。
このアルゴリズムでは,$O(log n)$-IP安定性が保証され,$n$は入力の点数を表す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:58:27 GMT)
MeDSLIP: Medical Dual-Stream Language-Image Pre-training for Fine-grained Alignment [8.0] 本稿では,医療用デュアルストリーム言語-画像事前学習(MeDSLIP)フレームワークを提案する。
MeDSLIPは、視覚的およびテキスト的表現を解剖学的関連ストリームと病理学的関連ストリームに切り離すことにより、視覚言語によるきめ細かいアライメントを確立する。
MeDSLIPは、NIH CXR14、RSNA Pneumonia、SIIM-ACR Pneumothoraxの3つの公開データセット上で、ゼロショットおよび教師付き微調整設定で評価される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:03:29 GMT)
ATOM: Asynchronous Training of Massive Models for Deep Learning in a Decentralized Environment [7.9] Atomは、分散化された環境で巨大なモデルの非同期トレーニング用に設計された、レジリエントな分散トレーニングフレームワークである。
atomは、スワップをシームレスにモデルし、トレーニングスループットを最適化するために複数のコピーを同時にトレーニングすることで、1つのホスト(ピア)に完全なLLMを適合させることを目的としている。
異なるGPT-3モデル構成を用いて実験したところ、最適ネットワーク接続のシナリオでは、原子は最先端の分散パイプライン並列化アプローチを組み込んだ場合、トレーニング効率を最大20倍に向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:43:43 GMT)
D-Net: Dynamic Large Kernel with Dynamic Feature Fusion for Volumetric Medical Image Segmentation [7.9] 動的大カーネル(DLK)および動的特徴融合(DFF)モジュールを提案する。
D-Netは、マルチスケールの大規模な受容場を効果的に利用し、グローバルな文脈情報を適応的に活用することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:49:43 GMT)
VISA: Variational Inference with Sequential Sample-Average Approximations [7.8] 逐次サンプル平均近似(VISA)を用いた変分推論を提案する。
VISAは、サンプル平均近似を用いて、重要重み付きフォワード-KL変量推論を拡張する。
我々は,VISAが標準重み付きフォワードKL変分推定に匹敵する近似精度を達成できることを実証した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:03:41 GMT)
Regularization-Based Efficient Continual Learning in Deep State-Space Models [7.7] 本稿では,大惨事な忘れを伴わずに,進化するタスクに適応できる連続学習DSSMを提案する。
提案するCLDSSMは、正規化に基づく継続学習(CL)手法を統合し、一定の計算とメモリコストで効率的な更新を保証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:14:18 GMT)
When Training-Free NAS Meets Vision Transformer: A Neural Tangent Kernel Perspective [7.7] ViT における基本的特徴学習の嗜好は,NTK を NTK を ViT に適用することの非効率性に寄与することを示す。
入力からフーリエ特徴を統合することで、標準NTKを高周波領域に一般化するViNTKと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:12:45 GMT)
Triple GNNs: Introducing Syntactic and Semantic Information for Conversational Aspect-Based Quadruple Sentiment Analysis [7.6] 本稿では、DiaASQを強化するために、Triple GNNsネットワークを導入する。
発話内の構文依存をモデル化するためにGCN(Graph Convolutional Network)と、発話間の相互作用を構築するためにDual Graph Attention Network(DualGAT)を採用している。
2つの標準データセットの実験により、我々のモデルは最先端のベースラインを大きく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:15:48 GMT)
Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics [7.6] QDAC(Quality-Diversity Actor-Critic)は、アクターに批判的な深層強化学習アルゴリズムである。
他の品質多様性手法と比較すると、QDACは性能が著しく高く、振る舞いも多様である。
また、学習したスキルを活用して、他のベースラインよりも5つの摂動環境に適応できることも示しています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:09:47 GMT)
Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images [7.5] ゲノムインフォームドハイパーアテンションネットワーク(G-HANet)は、トレーニング中にヒストリーゲノム知識を効果的に蒸留することができる。
ネットワークは、クロスモーダル・アソシエーション・ブランチ(CAB)とハイパーアテンション・サバイバル・ブランチ(HSB)から構成される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:20:09 GMT)
EHA: Entanglement-variational Hardware-efficient Ansatz for Eigensolvers [7.5] 量子多体系と量子化学のベンチマーク問題を解くために,Entment-variational Hardware- efficient Ansatz (EHA)を提案する。
EHAは問題に依存せず、ハードウェア効率が良く、特にNISQデバイスに適している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:23:29 GMT)
Denoising Task Difficulty-based Curriculum for Training Diffusion Models [7.4] 拡散に基づく生成モデルは、生成モデリングの領域において強力なツールとして登場した。
本研究では,時間ステップ間の連続確率分布間の収束挙動と相対エントロピーの変化に着目した。
本稿では,拡散モデルの学習過程を改善するため,カリキュラム学習から手書きの学習手法を導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:34:34 GMT)
Learning Physical Dynamics for Object-centric Visual Prediction [7.4] 視覚シーンの基盤となるダイナミクスをモデル化し、未来についての理屈をモデル化する能力は、人間の知性の中心である。
本稿では,オブジェクト間の視覚的ダイナミクスを学習することにより,将来予測を行う,教師なしオブジェクト中心予測モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:45:25 GMT)
Matrix Completion via Nonsmooth Regularization of Fully Connected Neural Networks [7.3] ディープニューラルネットワークのような非線形推定器を使うことで、性能の向上が達成できることが示されている。
本稿では,標準中間表現の観点から,FCNNモデルの正規化によるオーバーフィット制御を行う。
本シミュレーションは,既存の線形および非線形アルゴリズムと比較して,提案アルゴリズムの優位性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:00:37 GMT)
Geographic Spines in the 2020 Census Disclosure Avoidance System [7.3] 2020年国勢調査開示回避システム(英: 2020 Census Disclosure Avoidance System、DAS)は、特定の階層的な地理的単位の集合に対する横断的な集計に独立したノイズを加える、正式な私的なメカニズムである。
本稿では,DAS内部での初期ノイズ測定が出力データベースの精度に与える影響について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:35:16 GMT)
Read between the lines -- Functionality Extraction From READMEs [7.3] Gitファイルから機能を抽出する,新鮮で有用なバージョンを紹介します。
このタスクの背後にあるモチベーションは、コード関連のタスクに大規模言語モデルを使用することに関する研究と開発活動が最近急増したことに起因している。
最高の微調整された70億コードラマモデルは、それぞれChatGPTとBardに対するF1スコアに対して70%と20%の利得を示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:11:57 GMT)
HyPer-EP: Meta-Learning Hybrid Personalized Models for Cardiac Electrophysiology [7.2] 本稿では,個人化された心臓デジタル双生児を記述するための新しいハイブリッド・モデリング・フレームワークを提案する。
そこで我々は,物理系と神経系の両方のコンポーネントを識別するための新しいメタラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:30:00 GMT)
Quantum Advantage of One-Way Squeezing in Enhancing Weak-Force Sensing [7.2] 純粋量子状態における相互対称性を破り、量子COMセンサの性能をさらに向上する方法を提案する。
回転するCOM共振器について検討し、逆方向を選択的に駆動することで、高い非相互光スクイーズを発生させることができることを示す。
我々の研究は、スピン系以外の様々なシステムで既に達成されている相互対称性の破れが、高度な量子センサーの能力をさらに強化するための新たな戦略として役立つことを確認した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:51:52 GMT)
Construction of all MDS and involutory MDS matrices [7.2] 有限体 $mathbbF_pm$ 上のすべての$ntimes n$ MDS と involutory MDS のハイブリッド構成のための2つのアルゴリズムを提案する。
提案アルゴリズムは探索空間を効果的に狭め、$(n-1) 倍 (n-1) の MDS 行列を同定する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:03:02 GMT)
Approximation and bounding techniques for the Fisher-Rao distances [7.1] 我々はフィッシャー・ラオ距離の数値的ロバストな近似と有界化について考察する。
特に、近似に対する任意の小さな加算誤差を保証するための一般的な方法を得る。
我々は,フィッシャー・ラオ測地線のプロキシとして機能する曲線長をベースとした2つの新しい距離を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:05:16 GMT)
Time-Frequency Jointed Imperceptible Adversarial Attack to Brainprint Recognition with Deep Learning Models [7.0] 本稿では,時間領域と周波数領域のEEG信号を同時攻撃する新たな敵攻撃手法を提案する。
本手法は,3つのデータセットと3つのディープラーニングモデルに対して,最先端の攻撃性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:06:34 GMT)
SculptDiff: Learning Robotic Clay Sculpting from Humans with Goal Conditioned Diffusion Policy [6.9] SculptDiffは、目標条件付き拡散に基づく模倣学習フレームワークである。
点雲状態の観測と連動して、様々なターゲット形状の粘土彫刻ポリシーを学ぶ。
我々の知る限りでは、これが3次元変形可能なオブジェクトの操作ポリシーをうまく学習する最初の実世界の方法である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:34:59 GMT)
From Chaos to Clarity: Time Series Anomaly Detection in Astronomical Observations [6.9] 天文観測における教師なし異常検出のための2段階フレームワークを提案する。
最初の段階では、トランスフォーマーベースのエンコーダデコーダアーキテクチャを用いて、各星の通常の時間パターンを学習する。
第2段階では、並列ノイズの発生に対処するために、ウィンドウワイズグラフ構造学習を用いてグラフニューラルネットワークを強化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:39:12 GMT)
End-to-end Adaptive Dynamic Subsampling and Reconstruction for Cardiac MRI [6.9] 適応型動的MRIサブサンプリングと再構成のための新しいエンドツーエンドフレームワークを提案する。
我々のパイプラインは、DLベースの適応サンプリング装置を統合し、ケース固有の動的サブサンプリングパターンを生成し、最先端の2D動的再構成ネットワークでエンドツーエンドに訓練する。
以上の結果から,特に高加速度での再現性は良好であった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:31:35 GMT)
Neural Natural Language Processing for Long Texts: A Survey on Classification and Summarization [6.7] ディープニューラルネットワーク(DNN)の採用は自然言語処理(NLP)に大きな恩恵を受けている。
オンラインにアップロードされた文書のサイズがますます大きくなると、長文の自動理解が重要な問題になる。
この記事では、この動的ドメインのエントリポイントとして機能し、2つの目的を達成することを目的としています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:31:05 GMT)
NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices [6.5] リアルタイムの高精度光フロー推定は,様々な応用において重要な要素である。
我々は,高精度かつ計算コストの懸念に対処する,高速な光フローアーキテクチャであるNeuFlowを提案する。
当社のアプローチはエッジコンピューティングプラットフォーム上で約30FPSを実現しており、複雑なコンピュータビジョンタスクのデプロイにおいて大きなブレークスルーをもたらしている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:58:51 GMT)
A comprehensive study on Frequent Pattern Mining and Clustering categories for topic detection in Persian text stream [6.4] 本研究の目的は,トピック検出のための最適なアルゴリズムについて広範な研究を行うことである。
ペルシアのソーシャルネットワーク投稿のテキストがデータセットとして使用される。
以上の結果から,人間が容易に理解できるキーワードトピックを探索する場合には,ハイブリッドカテゴリーの方が優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:08:58 GMT)
When Geoscience Meets Foundation Models: Towards General Geoscience Artificial Intelligence System [6.4] 地球科学基礎モデル (GFMs) は、地球科学における大規模な学際データを統合するための革命的なアプローチである。
GFMは構造化データと非構造化データのペタバイトから貴重な洞察を抽出する。
現在の制限にもかかわらず、GFMは気候変動、自然災害、持続可能性といった問題に対する重要な洞察を提供するという大きな約束を持っている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:37:52 GMT)
Structured Evaluation of Synthetic Tabular Data [6.4] タブラルデータは一般的には不完全であり、ボリュームは小さく、プライバシー上の懸念からアクセス制限されている。
本稿では,観測データと同じ分布から合成データを抽出すべきと仮定した,単一の数学的目的を持つ評価フレームワークを提案する。
深層学習を利用した構造情報型シンセサイザーとシンセサイザーの評価を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:58:37 GMT)
Lost in Overlap: Exploring Watermark Collision in LLMs [6.4] 本研究は,2つの透かしが同時に同じテキストに存在している二重透かし衝突に着目した。
研究は、透かし衝突が上流と下流の両方の透かしアルゴリズムの検出器の検出性能に脅威をもたらすことを実証している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:06:21 GMT)
CFT$_D$ from TQFT$_{D+1}$ via Holographic Tensor Network, and Precision Discretisation of CFT$_2$ [6.4] 我々は、RG作用素の固有状態の解法により、$D$次元における共形場理論の経路積分を構築することができることを示す。
また、CFT$_D$を対称TQFT$_D$間の相転移点として探索するために$D=2,3$の数値法を考案し、説明する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:54:05 GMT)
Application of attention-based Siamese composite neural network in medical image recognition [6.4] 本研究は,注目とシームズニューラルネットワークに基づく認識モデルを構築した。
アテンションに基づくニューラルネットワークは、分類効果を改善するためにメインネットワークとして使用される。
その結果、画像サンプルの数が少ないほど、利点が明らかになることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:13:51 GMT)
Error mitigated shadow estimation based on virtual distillation [6.4] シャドウ推定 (Shadow Estimation) は、未知の量子状態の多数の特性を、限られた一連の測定によって推定する手法である。
本稿では,短期量子デバイスにおける仮想蒸留に基づく誤差緩和型シャドウ推定手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:33:36 GMT)
Weight fluctuations in (deep) linear neural networks and a derivation of the inverse-variance flatness relation [6.1] 単層および二層線形パラメータ化ニューラルネットワークの定常(遅延)学習状況について検討する。
重み変動に対する新しい異方性源として層間結合を同定する。
本稿では,最近観測された線形ニューラルネットワークモデルにおける逆分散-平坦性関係の解析的導出について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:13:46 GMT)
GPT-who: An Information Density-based Machine-Generated Text Detector [6.1] 精神言語学的に認識される最初の多クラスドメイン非依存型統計検出器であるGPT-whoを提案する。
この検出器はUDDベースの特徴を用いて、各大言語モデル(LLM)生成テキストのユニークな統計的シグネチャをモデル化する。
過剰なテキストが認識できない場合でも、非常に洗練されたLCMによって生成されたテキストを区別できるGPT- who can distinguishing texts。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:21:28 GMT)
The long-term and disparate impact of job loss on individual mobility behaviour [5.9] 本稿では,モバイル端末のGPSデータをセンサ情報とともに活用し,雇用状況の推測を行うフレームワークを提案する。
雇用者や失業者の移動パターンを分析することで,行動に有意な差異が認められた。
これらの違いは、失業以来、特により脆弱な人口集団の個人に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:18:50 GMT)
Diamond Micro-Chip for Quantum Microscopy [5.9] ダイヤモンド中の窒素空孔(NV)中心は、電流、磁化、スピンの顕微鏡として人気が高まっている。
111配向NVアンサンブルを含むダイヤモンドマイクロチップを特徴付け,高分解能量子顕微鏡への応用を実証する。
この研究は、DMCがNV量子顕微鏡の材料、装置、地質学、生物医学、化学科学への応用を拡大する可能性を確立している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:48:36 GMT)
DD-VNB: A Depth-based Dual-Loop Framework for Real-time Visually Navigated Bronchoscopy [5.9] リアルタイムビジュアルナビゲート気管支鏡(DD-VNB)のためのDepth-based Dual-Loopフレームワークを提案する。
DD-VNBフレームワークは、深さ推定とデュアルループローカライゼーションという2つの重要なモジュールを統合している。
患者からのファントムデータとin-vivoデータを用いた実験により,本フレームワークの有効性が示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:25:48 GMT)
PU-Ray: Domain-Independent Point Cloud Upsampling via Ray Marching on Neural Implicit Surface [5.8] 我々は任意のレートで新しいレイベースのアップサンプリング手法を提案し、各クエリ線とその対応するパッチに対して深さ予測を行う。
非符号距離関数 (UDF) で定義された神経暗示面上の球面追跡線マーチングアルゴリズムをシミュレーションした。
ルールベースの中間点問合せサンプリング手法は, 最寄りの近傍の復元損失関数を用いて訓練されたエンドツーエンドモデルを必要としない, より均等な分散点を生成する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:04:33 GMT)
Demystifying Faulty Code with LLM: Step-by-Step Reasoning for Explainable Fault Localization [5.8] 本研究では, 説明可能な断層定位のためのステップバイステップ推論について検討した。
私たちは600行の欠陥に関する説明とともに、欠陥のあるコードファイルのデータセットを作成しました。
ランダムに採取された30例中22例において,FuseFLは正しい説明が得られた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:47:20 GMT)
Riemannian Flow Matching Policy for Robot Motion Learning [5.7] 本稿では,ロボットビジュモータポリシーの学習と合成のための新しいモデルを提案する。
RFMPはよりスムーズな行動軌跡を提供し,推論時間を大幅に短縮することを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:48:41 GMT)
Neural Erosion: Emulating Controlled Neurodegeneration and Aging in AI Systems [5.7] 我々は、Large Language Models (LLMs) によるIQテストを使用して、神経浸食の概念を導入する。
この意図的な浸食は、シナプスやニューロンを非難すること、または訓練中または訓練後にガウスノイズを付加することを含み、LSMの性能は制御的に低下する。
私たちの知る限りでは、コンピュータビジョン領域で動作する他の研究と比べて、神経変性をテキストデータでモデル化する最初の研究である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:00:00 GMT)
MMO: Meta Multi-Objectivization for Software Configuration Tuning [5.7] 補助的な性能目標を考慮したメタ多目的化(MMO)モデルを提案する。
重みを気にせずにMMOモデルを効果的に活用する方法を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:09:15 GMT)
A2CI: A Cloud-based, Service-oriented Geospatial Cyberinfrastructure to Support Atmospheric Research [5.7] 大気研究を支援する地理空間型サイバーインフラクチャーを開発したNSFが出資したプロジェクトの結果を報告する。
まず、サービス指向システムフレームワークを紹介し、クラウドコンピューティングの原則に従って、データ発見モジュール、データ管理モジュール、データ統合モジュール、データ分析および可視化モジュールの実装の詳細を説明します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:28:38 GMT)
The Power of Training: How Different Neural Network Setups Influence the Energy Demand [5.5] この研究は、機械学習のトレーニング体制と学習パラダイムのバリエーションがコンピューティングのエネルギー消費に与える影響、特にライフサイクルを考慮したHPCハードウェアに与える影響を評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:43:10 GMT)
Debiasing Algorithm through Model Adaptation [5.5] 因果解析を行い、問題のあるモデル成分を同定し、フィードフォワードの中間層が最も偏りを伝達しやすいことを明らかにする。
解析結果に基づいて,これらの層の重み行列に線形射影を適用することにより,モデルに介入する。
提案手法であるDAMAは,下流タスクにおけるモデルの性能を維持しながら,様々な指標によって測定されるバイアスを著しく低減する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:39:26 GMT)
NNCTC: Physical Layer Cross-Technology Communication via Neural Networks [5.3] 技術間通信は、多様な無線技術間のシームレスな相互作用を可能にする。
NNCTCは、無線通信におけるトレーニング可能なニューラルモデルの適応性に着想を得たニューラルネットワークベースのクロステクノロジー通信フレームワークである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:36:44 GMT)
URS-NeRF: Unordered Rolling Shutter Bundle Adjustment for Neural Radiance Fields [5.3] ニューラルレイディアンスフィールド(NeRF)のための新しいローリングシャッター束調整法を提案する。
我々は、無秩序なローリングシャッター(RS)画像を用いて、暗黙の3D表現を得る。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:08:27 GMT)
Liquid Staking Tokens in Automated Market Makers [5.3] LST(Liquid stake tokens)は、ブロックチェーンの証明にステークされた資産のトークン化表現である。
自動市場メーカ(AMM)におけるLCT液状度を理論的にモデル化する。
我々は、これらのメトリクスを、最も関連するAMMプールのLSTに対して経験的に測定する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:53:46 GMT)
Adaptive Multi-Modal Cross-Entropy Loss for Stereo Matching [5.3] 本稿では,ADL(Adaptive Multi-modal Cross-Entropy Los)を提案する。
提案手法は,KITTI 2015 と 2012 のベンチマークでそれぞれ1位である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:04:38 GMT)
Lifted Causal Inference in Relational Domains [5.2] 関係領域における因果効果を効率的に計算するために,昇降法が適用可能であることを示す。
本稿では,昇降レベルの因果効果を計算するために,昇降因果推論アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:44:27 GMT)
Safety Cases: Justifying the Safety of Advanced AI Systems [5.1] これはAIシステムが大惨事を引き起こす可能性が低いという構造化された根拠である。
安全を正当化するための議論の4つのカテゴリについて論じる。大惨事を引き起こすことができないこと、十分に強力な制御手段、危害を引き起こす能力に拘わらず信頼感があること、信頼できるAIアドバイザへの言及である。
我々は、各カテゴリにおける議論の具体的な例を評価し、AIシステムが安全にデプロイ可能であることを正当化するために、議論をどのように組み合わせるかを概説する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:53:13 GMT)
Limits of Approximating the Median Treatment Effect [5.1] メディア処理効果は推定不可能であり、$mathbfa-b$の値のソート順序に依存する新しい近似の概念を詳述する。
MTEを推定するアルゴリズムはすべて、変数を計算するアルゴリズムの誤差に匹敵する近似誤差が得られることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:30:06 GMT)
Low-density parity-check representation of fault-tolerant quantum circuits [5.1] 本稿では,フォールトトレラント量子回路の設計と解析を行うツールキットを提案する。
古典的低密度パリティチェック符号を用いて安定化回路を表現するためのフレームワークを提案する。
タナーグラフ記法を用いて回路からLDPCコードを生成する手順について概説する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:56:38 GMT)
Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation [5.0] 大規模な言語モデル(より大きなLM)は、幻覚的内容を含むテキストを生成できる。
各種の命令調整型LMの自己コントラクションに関する包括的調査を行う。
本稿では,自己矛盾を効果的に検出・緩和する新しいプロンプトベースのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:04:34 GMT)
TransLandSeg: A Transfer Learning Approach for Landslide Semantic Segmentation Based on Vision Foundation Model [4.8] 視覚基盤モデル(VFM)に基づく地すべりセマンティックセグメンテーションのための伝達学習手法であるTransLandSegを提案する。
提案した適応転写学習(ATL)アーキテクチャは,SAMのパラメータの1.3%のトレーニングで,SAMの強力なセグメンテーション能力を地すべり検出に伝達することを可能にする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:18:53 GMT)
A Question on the Explainability of Large Language Models and the Word-Level Univariate First-Order Plausibility Assumption [4.8] 説明の信号、雑音、信号対雑音比について統計的に定義する。
次に、信号と雑音の代替定義を用いて、これらの結果を改善する可能性について議論する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:15:23 GMT)
How (un)ethical are instruction-centric responses of LLMs? Unveiling the vulnerabilities of safety guardrails to harmful queries [4.7] 大型言語モデル(LLM)の安全性と倫理的利用に関する懸念が高まっている。
当社の作業は,特定の問題に対してゼロになっている – 命令中心の応答を生成するように要求することで,LLMをどの程度の頻度で誘導することが可能か,という点です。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:57:58 GMT)
Evaluating the Ebb and Flow: An In-depth Analysis of Question-Answering Trends across Diverse Platforms [4.7] コミュニティ質問回答(Community Question Answering, CQA)プラットフォームは,クエリに対する迅速な応答をユーザに提供することで,着実に人気を集めている。
本稿では,これらの要因を,人気の高い6つのCQAプラットフォームのコンテキスト内で調査する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:07:46 GMT)
EAGLE: An Edge-Aware Gradient Localization Enhanced Loss for CT Image Reconstruction [4.6] 本稿では,CT画像再構成の視覚的品質向上を目的とした新しい損失関数であるEagle-Lossを提案する。
Eagle-Lossは、勾配変化における局所的特徴のスペクトル分析を適用して、シャープネスと明確に定義されたエッジを強化する。
この結果から,Eagle-Lossは画像の視覚的品質を常に向上し,ネットワークアーキテクチャ全体にわたって最先端の手法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:28:06 GMT)
ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions [4.6] Vision Transformer (ViT) はコンピュータビジョンにおいて大きな成功を収めているが、密集した予測タスクではうまく機能しない。
コンボリューショナル・マルチスケール機能を有するVTバックボーンであるViT-CoMerについて述べる。
階層的特徴をまたいだマルチスケールの融合を行う,シンプルで効率的なCNN-Transformer双方向核融合モジュールを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:30:14 GMT)
Towards Practical Fabrication Stage Attacks Using Interrupt-Resilient Hardware Trojans [4.5] 我々は、割り込み耐性トロイの木馬(IRT)と呼ばれる新しい種類のハードウェアトロイの木馬を紹介する。
IRTはCPUにおける非決定的トリガーの問題にうまく対処できる。
我々の設計は、製造段階攻撃時のシームレスな統合を可能にしている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:55:23 GMT)
SurvRNC: Learning Ordered Representations for Survival Prediction using Rank-N-Contrast [4.5] Survival Rank-N Contrast (SurvRNC) は、生存時間に基づいて順序付けられた表現を得るための正規化器としての損失関数である。
訓練にSurvRNC法を用いることで,異なる深層生存モデルにおいて高い性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:00:11 GMT)
Are LLMs Good Cryptic Crossword Solvers? [4.5] クリプティッククロスワード(英: Cryptic crosswords)とは、様々なレベルの言語を操り、様々な種類のワードプレイに対処するソルバの能力に依存するパズルである。
従来の研究では、現代のNLPモデルにおいても、そのようなパズルを解くことが難しいことが示唆されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:57:08 GMT)
DistALANER: Distantly Supervised Active Learning Augmented Named Entity Recognition in the Open Source Software Ecosystem [4.4] 本稿では,オープンソースソフトウェアシステムに適したエンティティ認識(NER)技術を提案する。
提案手法は,2段階の遠隔教師付きアノテーションプロセスを用いて,注釈付きソフトウェアデータの不足に対処することを目的としている。
我々のモデルは最先端のLLMよりもかなり優れています。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:29:52 GMT)
CinPatent: Datasets for Patent Classification [4.3] 我々は、CPCコードを用いて収集した英語と日本語の2つの新しいデータセットを紹介した。
英語データセットには45,131の特許文書と425のラベルがあり、日本語データセットには54,657のドキュメントと523のラベルが含まれている。
本研究では,2つのデータセット上での強いマルチラベルテキスト分類手法の性能を比較した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:03:46 GMT)
SwinMTL: A Shared Architecture for Simultaneous Depth Estimation and Semantic Segmentation from Monocular Camera Images [4.3] 本研究では,一台のカメラを用いた同時深度推定とセマンティックセマンティックセグメンテーションが可能な,革新的なマルチタスク学習フレームワークを提案する。
提案手法は共有エンコーダデコーダアーキテクチャに基づいており,計算効率を損なうことなく,深度推定とセマンティックセグメンテーションタスクの精度を向上させるために様々な手法を統合する。
このフレームワークは、屋外のCityscapesデータセットと屋内のNYU Depth V2データセットという2つのデータセットで徹底的に評価されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:04:27 GMT)
Extraction of Sleep Information from Clinical Notes of Patients with Alzheimer's Disease Using Natural Language Processing [4.3] 睡眠は、高齢者の最適な認知機能に不可欠なライフスタイルに関連する要因の1つである。
伝統的に睡眠情報を取得する方法は、時間がかかり、効率が悪く、測定不能であり、患者の主観的な経験に限られる。
本研究では,ルールベース自然言語処理(NLP)アルゴリズム,機械学習モデル,およびLarge Language Model(LLM)ベースのNLPアルゴリズムを開発し,睡眠関連概念の抽出を自動化する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:59:17 GMT)
Development and Application of a Monte Carlo Tree Search Algorithm for Simulating Da Vinci Code Game Strategies [4.3] 本研究では,モンテカルロ木探索(MCTS)アルゴリズムの複雑な意思決定環境における効率性について検討する。
この研究は、Da Vinci Codeのボードゲームにおける固有の分岐分岐は、グラフィクス処理ユニット(GPU)上で実行される場合、並列性を著しく損なうことを示唆している。
比較分析の結果,GPU実装とは対照的に,非線形拡張パターンと識別可能な性能トラフを有するCPU実装では,性能が線形に向上していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:43:37 GMT)
SCILLA: SurfaCe Implicit Learning for Large Urban Area, a volumetric hybrid solution [4.2] SCILLAは2次元画像から大きな運転シーンを再構築するハイブリッドな表面学習手法である。
SCILLAは,様々な都市シナリオにおいて,正確な3次元表面のシーン表現を学べることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:31:17 GMT)
LyZNet: A Lightweight Python Tool for Learning and Verifying Neural Lyapunov Functions and Regions of Attraction [4.2] 安定解析のためのニューラルネットワークリアプノフ関数の統合学習と検証を提供するPythonフレームワークについて述べる。
提案するツールはLyZNetと呼ばれ、物理インフォームドニューラルネットワーク(PINN)を用いてニューラルネットワークを学習して解決する。
このツールは、合成検証のためのネットワークローサブシステムへの自動分解結合非線形システムも提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:35:56 GMT)
Signed Diverse Multiplex Networks: Clustering and Inference [4.1] 設定は多重バージョンに拡張され、すべてのレイヤが同じノードのコレクションを持ち、SGRDPGに従う。
まず,ネットワーク構築過程におけるエッジの符号の保持が,推定とクラスタリングの精度の向上につながることを示す。
第二に、新しいアルゴリズムを用いることで、階層の強い一貫したクラスタリングと、部分空間推定の高精度を保証できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:22:50 GMT)
Fast and Simple Explainability for Point Cloud Networks [4.0] 本稿では,ポイントクラウドデータのための高速で簡単なAI(XAI)手法を提案する。
トレーニングされたネットワークダウンストリームタスクに関して、ポイントワイズの重要性を計算します。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:46:31 GMT)
Mining Clinical Notes for Physical Rehabilitation Exercise Information: Natural Language Processing Algorithm Development and Validation Study [4.0] 本研究の目的は,身体リハビリテーション運動情報を抽出・分類するための様々なNLPアルゴリズムを開発し,評価することである。
脳卒中と診断された13,605人のコホートを同定し,リハビリテーション治療ノートを含む臨床ノートを検索した。
その後、ルールベース、機械学習ベースのアルゴリズム、大規模言語モデル(LLM)ベースのアルゴリズム(ChatGPT)を含む最先端のNLPアルゴリズムを開発し、比較した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:55:52 GMT)
Lowering Detection in Sport Climbing Based on Orientation of the Sensor Enhanced Quickdraw [4.0] 壁に取り付けられた登山器具に取り付けられた加速度センサを用いてデータを収集するプロトタイプが開発された。
対応するセンサはエネルギー効率が良いように構成されているため、費用と代替の時間消費の観点から実用的になる。
本稿では、ハードウェア仕様、超低電力モードでセンサが測定したデータ、異なる経路におけるセンサの向きパターンを検出し、低電力モードを特定するための教師ありアプローチを開発する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:18:20 GMT)
Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.9] 画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:44:40 GMT)
A Multi-constraint and Multi-objective Allocation Model for Emergency Rescue in IoT Environment [3.9] 我々はMSGWFLM(Multi-Objective Shuffled Gray Froging Model)を開発した。
この多目的リソース割り当てモデルは、28の多様な課題に対して厳格にテストされている。
その効果は複雑で多サイクルの緊急救助シナリオで特に顕著である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:42:00 GMT)
Price-Discrimination Game for Distributed Resource Management in Federated Learning [3.7] FedAvgのようなバニラ連合学習(FL)では、パラメータサーバ(PS)と複数の分散クライアントが典型的な買い手市場を形成する。
本稿では、異なるクライアントに対して同じサービス価格を提供するのではなく、異なるクライアントが提供するサービスの価格を区別することを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:04:05 GMT)
Detection and Discovery of Misinformation Sources using Attributed Webgraphs [3.7] 本稿では、ラベル付きニュースドメインと、アウトリンクおよびバックリンクドメインへの接続を含む、新しい属性付きWebグラフデータセットを提案する。
本稿では,これらの属性付きWebグラフを用いたニュースサイトの信頼性検出におけるグラフニューラルネットワークの成功例を示す。
また、未知の誤報ニュースソースを発見するための新しいグラフベースのアルゴリズムを導入・評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:39:21 GMT)
Effectiveness of the syndrome extraction circuit with flag qubits on IBM quantum hardware [3.7] 我々は,IBM量子コンピュータ上でフラグ量子ビットを用いたシンドローム抽出回路の実装に成功したことを報告した。
データキュービットはシンドロームキュービットに隣接していないが、繰り返し符号の距離が増加するにつれて論理誤差率は指数関数的に減少する。
これは、IBM量子コンピュータ上のフラグ量子ビットを用いたシンドローム抽出回路の実装が成功したことを確認する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:36:44 GMT)
SimPB: A Single Model for 2D and 3D Object Detection from Multiple Cameras [3.6] ビュービュー内の2Dオブジェクトと、複数のカメラからBEV空間内の3Dオブジェクトを同時に検出するSimPBと呼ばれる単一のモデルを提案する。
ハイブリッドデコーダは複数のマルチビュー2Dデコーダ層と複数の3Dデコーダ層で構成され、それぞれの検出タスク用に特別に設計されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:39:39 GMT)
Interpretable Machine Learning for Survival Analysis [3.6] 解釈可能な機械学習(IML)や説明可能な人工知能(XAI)はこの10年でますます重要になっている。
簡単に利用できるIML手法の欠如は、公衆衛生における医療実践者や政策立案者が機械学習の潜在能力を最大限に活用することを妨げる可能性がある。
一般のIML分類学の文脈における生存分析のためのIML法に関する限られた既存の研究成果について概説する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:38:00 GMT)
A Structure-Preserving Kernel Method for Learning Hamiltonian Systems [3.6] 構造保存されたカーネルリッジ回帰法は、潜在的に高次元かつ非線形なハミルトン関数の回復を可能にする。
本稿では,勾配の線形関数を含む損失関数が要求される問題に対して,カーネル回帰法を拡張した。
固定正則化パラメータと適応正則化パラメータを用いて収束率を提供する完全誤差解析を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:20:21 GMT)
An Improved Strategy for Blood Glucose Control Using Multi-Step Deep Reinforcement Learning [3.6] 血糖コントロール(BG)は、体外インスリン注入によって、個人のBGを健康な範囲に保持する。
最近の研究は、個別化および自動化されたBG制御アプローチの探索に費やされている。
深層強化学習(DRL)は新たなアプローチとしての可能性を示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:48:34 GMT)
Creating and Leveraging a Synthetic Dataset of Cloud Optical Thickness Measures for Cloud Detection in MSI [3.5] 雲の形成は、しばしば地球の地表を観測する光学衛星による不明瞭な観測である。
雲の光学的厚さ推定のための新しい合成データセットを提案する。
信頼性と汎用性を備えたクラウドマスクを実データで取得するために活用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:27:42 GMT)
Neuroformer: Multimodal and Multitask Generative Pretraining for Brain Data [3.5] 最先端のシステム神経科学実験は大規模なマルチモーダルデータを生み出し、これらのデータセットは分析のための新しいツールを必要とする。
視覚領域と言語領域における大きな事前学習モデルの成功に触発されて、我々は大規模な細胞分解性神経スパイクデータの解析を自己回帰生成問題に再構成した。
我々はまず、シミュレーションデータセットでNeuroformerを訓練し、本質的なシミュレートされた神経回路の動作を正確に予測し、方向を含む基盤となる神経回路の接続性を推定した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:07:06 GMT)
Optimal phase estimation in finite-dimensional Fock space [3.4] 有限次元フォック空間において、NOON状態は、粒子数が固定されているが空間次元のマイナス 1 に等しいとき、最適に停止する。
この問題に答える定理を3つ提示し、実際の最終的な精度限界を実現するための完全な最適スキームを提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:55:25 GMT)
Dissipation as a resource for Quantum Reservoir Computing [3.4] 量子貯水池計算の分野における散逸によるポテンシャル増強について述べる。
連続散逸に基づく我々のアプローチは、従来の量子貯水池計算の提案の力学を再現するだけでなく、その応用も可能である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:45:24 GMT)
Graph Enhanced Reinforcement Learning for Effective Group Formation in Collaborative Problem Solving [3.4] 本研究では,協調的問題解決環境における効果的なグループ形成の課題について論じる。
本稿では,グラフ理論と強化学習を活用した新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:04:40 GMT)
Exact Consistency Tests for Gaussian Mixture Filters using Normalized Deviation Squared Statistics [3.4] 本稿では,正規化偏差二乗(NDS)統計の枠組み内での整合性テストの新しい正確な結果を得る。
結果の整合性試験の精度と有用性を静的および動的混合推定例で数値的に示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:04:33 GMT)
Large Language Models to Generate System-Level Test Programs Targeting Non-functional Properties [3.3] 本稿では,テストプログラムを生成するためのLarge Language Models (LLM)を提案する。
我々は、DUTの非機能特性を最適化するために、事前訓練されたLLMがテストプログラム生成でどのように機能するかを、一目で見てみる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:01:02 GMT)
A Short Survey on Importance Weighting for Machine Learning [3.3] 分布シフトと呼ばれる、トレーニングとテストの分布の違いを仮定した教師あり学習は、その密度比による重み付けによって統計的に望ましい特性を保証できることが知られている。
この調査は、機械学習と関連する研究における重み付けの幅広い応用について要約する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:31:46 GMT)
Learning on JPEG-LDPC Compressed Images: Classifying with Syndromes [3.3] ゴール指向通信では、受信機の目的は、元のデータを再構成するのではなく、ディープラーニングモデルを適用することである。
本稿では,低密度パリティチェック(LDPC)符号を用いてエントロピー符号化を実現する方法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:07:38 GMT)
Sequential Monte Carlo for Inclusive KL Minimization in Amortized Variational Inference [3.1] SMC-Wakeは,モンテカルロの連続検層を用いて包摂的KL偏差の勾配を推定する補正式である。
シミュレーションと実データの両方を用いた実験では、SMC-Wakeは既存の手法よりも後方を正確に近似する変動分布に適合する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:13:48 GMT)
A Dual-domain Regularization Method for Ring Artifact Removal of X-ray CT [3.1] 検出ユニットの望ましくない応答から生じる計算トモグラフィー画像のリングアーティファクトは、画像品質と診断信頼性を著しく低下させた。
本稿では,元のCT画像の整合性を保ちながら,リングアーティファクトを効果的に除去するための二重領域正規化モデルを提案する。
提案モデルでは, 検出ユニットの応答不整合補償係数を革新的に更新することにより, シングラム上の垂直ストライプアーティファクトを補正する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:22:05 GMT)
Data Ethics Emergency Drill: A Toolbox for Discussing Responsible AI for Industry Teams [3.0] データ倫理緊急訓練(DEED)と呼ばれるツールボックスを設計し、テストしました。
DEEDは、チームの特定の職場やアプリケーションに文脈的に置かれる架空の倫理的緊急シナリオのロールプレイである。
その結果,実践者がロールプレイから学んだ教訓を実生活に応用できることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:20:51 GMT)
GreedyML: A Parallel Algorithm for Maximizing Submodular Functions [3.0] 分散メモリマルチプロセッサ上での単調部分モジュラ関数の最大化のための並列近似アルゴリズムについて述べる。
我々の研究は、データ要約、機械学習、グラフスカラー化といった分野における実践的な応用のために、大規模データセットのサブモジュラー最適化問題を解決する必要性によって動機付けられている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:19:09 GMT)
RID-TWIN: An end-to-end pipeline for automatic face de-identification in videos [2.8] RID-Twinは、モーションからアイデンティティを分離して、ビデオの顔の自動識別を実行するパイプラインである。
本稿では,広く利用されているVoxCeleb2データセット上での方法論の性能を評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:59:21 GMT)
Convergence and Recovery Guarantees of Unsupervised Neural Networks for Inverse Problems [2.7] 我々は、逆問題を解決するために訓練された教師なしフィードフォワード多層ニューラルネットワークのクラスに対して、決定論的収束と回復保証を提供する。
また、スムーズなアクティベーション関数を持つ2層ディープ逆プリエントネットワークが保証の恩恵を受けるようなオーバーパラメトリゼーション境界を導出する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:59:11 GMT)
Variational Quantum Eigensolvers with Quantum Gaussian Filters for solving ground-state problems in quantum many-body systems [2.5] 量子多体系における基底状態を近似する新しい量子アルゴリズムを提案する。
我々の手法は変分量子固有解法(VQE)と量子ガウスフィルタ(QGF)を統合する。
提案手法は,特に雑音条件下での収束速度と精度の向上を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:26:24 GMT)
Adversarial Adaptive Sampling: Unify PINN and Optimal Transport for the Approximation of PDEs [2.5] ニューラルネットワークモデルにより与えられた近似解とトレーニングセットのランダムサンプルを同時に最適化する新しいminmax式を提案する。
鍵となる考え方は、深層生成モデルを用いてトレーニングセット内のランダムサンプルを調整し、近似されたPDE解によって誘導される残差が滑らかなプロファイルを維持することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:48:23 GMT)
A Hybrid SNN-ANN Network for Event-based Object Detection with Spatial and Temporal Attention [2.5] イベントカメラは、時間分解能が高く、動きのぼやけが少ないダイナミックレンジを提供し、オブジェクト検出タスクを約束する。
Spiking Neural Networks(SNN)はイベントベースの知覚データに自然に一致するが、Artificial Neural Networks(ANN)はより安定したトレーニングダイナミクスを表示する傾向がある。
イベントカメラを用いたオブジェクト検出のための,最初のハイブリッドアテンションベースのSNN-ANNバックボーンを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:28:31 GMT)
AI-enhanced Collective Intelligence: The State of the Art and Prospects [2.5] 人間とAIは、人間またはAIの集団的能力を単独で超える補完的能力を持っている。
本稿では,人間-AI集団知能の多層表現を概念化するために,ネットワーク科学からの視点を取り入れた。
エージェントの多様性と相互作用がシステムの集合的知性にどのように影響するかを考察する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:11:15 GMT)
Maglev for Dark Matter: Dark-photon and axion dark matter sensing with levitated superconductors [2.5] 磁気浮上型超伝導体を用いて暗黒光子および軸流暗黒物質を検出することを提案する。
いくつかの実験室では、これらの暗黒物質候補を高周波で探すが、mathrm1,kHz$以下の周波数に敏感であるものはほとんどない。
本手法は, 暗黒光子とアクシオン暗黒物質の両方のプローブにおいて, 先行感度を達成できることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:15:25 GMT)
A Data-Driven Approach for Mitigating Dark Current Noise and Bad Pixels in Complementary Metal Oxide Semiconductor Cameras for Space-based Telescopes [2.4] 我々は、CMOSカメラの暗電流ノイズと悪い画素を緩和するデータ駆動フレームワークを提案する。
私たちのアプローチには、ピクセルクラスタリングと関数フィッティングという2つの重要なステップがあります。
その結果,宇宙望遠鏡の検出効率は大幅に向上した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:15:06 GMT)
Computer User Interface Understanding. A New Dataset and a Learning Framework [2.4] コンピュータUI理解の難しい課題を紹介します。
ユーザがアクションのシーケンスを実行しているビデオのセットでデータセットを提示し、各画像はその時点のデスクトップコンテンツを表示する。
また,データセットに関連する特徴を付加する合成サンプル生成パイプラインを構成するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:26:52 GMT)
Evaluation of Quantum and Hybrid Solvers for Combinatorial Optimization [2.4] 本研究は、D-Wave Systemsが提供する技術について包括的に評価する。
ベンチマークとして,データセンターのエネルギー最適化モデルを提案する。
D-Wave量子およびハイブリッドソルバを比較して、考慮されたアプリケーションに最も適したものを特定する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:43:21 GMT)
Hole subband dispersions in a cylindrical Ge nanowire: exact results based on the axial Luttinger-Kohn Hamiltonian [2.4] 軸近似におけるルッティンガー・コーン・ハミルトニアンに基づいて、円筒Geナノワイヤのホールサブバンド分散を決定する超越方程式を解析的に導出した。
これらの方程式は球面近似を用いて導出した方程式よりも一般であり、サブバンド分散の成長方向依存性を研究するのに適している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:04:45 GMT)
Securing Federated Learning with Control-Flow Attestation: A Novel Framework for Enhanced Integrity and Resilience against Adversarial Attacks [2.3] 分散機械学習パラダイムとしてのフェデレートラーニング(FL)は、新たなサイバーセキュリティ課題を導入した。
本研究では,従来サイバーセキュリティに用いられてきた制御フロー(CFA)機構にインスパイアされた,革新的なセキュリティフレームワークを提案する。
我々は、ネットワーク全体にわたるモデル更新の完全性を認証し、検証し、モデル中毒や敵対的干渉に関連するリスクを効果的に軽減する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:03:34 GMT)
Federated Learning with Anomaly Detection via Gradient and Reconstruction Analysis [2.3] 自動エンコーダ駆動のデータ再構成と勾配解析を相乗化して、前例のない精度で有毒データを検出・緩和する新しいフレームワークを提案する。
本手法は, 最小偽陽性率を維持しつつ, 異常検出精度を15%向上させる。
私たちの仕事は、分散学習のセキュリティにおける将来の進歩の道を開くものです。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:54:45 GMT)
SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians [2.2] 暗黙の神経表現法は、未構造化画像から3Dシーンを学習する際、顕著な進歩を見せている。
非教師的手法でシーンオブオーダの存在を対処するために、過渡的なガウシアンを訓練する新しいメカニズムを導入する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:00:04 GMT)
CDGP: Automatic Cloze Distractor Generation based on Pre-trained Language Model [2.2] 本稿では,事前学習型言語モデル (PLM) の代替案としての利用について検討する。
実験により、PLM強化モデルは大幅な性能改善をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:14:26 GMT)
Understanding Addition in Transformers [2.1] 本稿では,n桁整数加算を行うために訓練された1層トランスフォーマーモデルの包括的解析を行う。
提案手法は,各桁を対象とする並列ストリームに分割し,各桁の異なる位置に合わせて最適化されたアルゴリズムを用いることを示唆している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:17:08 GMT)
Observational entropy with general quantum priors [2.0] 観測エントロピーは、暗黙的に一様参照を含むことを示す。
系が無限次元である場合やエネルギー制約のある場合、均一な事前は使用できないため、均一な量子状態に置き換えることで一般化を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:32:32 GMT)
Unsupervised Adaptive Deep Learning Method For BCI Motor Imagery Decoding [2.0] 本稿では,オンライン上で使用しながら,監督を必要とせずにオフラインのパフォーマンスレベルに達する適応手法を提案する。
本稿では,脳波データからの運動画像脳復号の効率を実証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:22:10 GMT)
BirdSet: A Multi-Task Benchmark for Classification in Avian Bioacoustics [2.0] 研究の不整合は この領域の進歩を妨げる 顕著な課題を引き起こします
本研究では,鳥の発声を分類するための総合的なアプローチで研究活動を統合する統一的なフレームワークであるBirdSetベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:10:40 GMT)
Algorithmic Identification of Essential Exogenous Nodes for Causal Sufficiency in Brain Networks [2.0] 脳の因果関係などの因果関係の解明において、因果関係の仮定は重要な役割を担っている。
そこで本稿では, 因果関係に係わる必要を満足する本質的ノードを決定するためのアルゴリズム的同定手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:35:35 GMT)
Mutual Information Bounded by Fisher Information [2.0] 我々は、フィッシャー情報の観点から、相互情報に対する一般的な上限を導出する。
本稿では, 量子位相推定のケーススタディを用いて, 境界値の有用性について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:35:35 GMT)
Generative AI in EU Law: Liability, Privacy, Intellectual Property, and Cybersecurity [2.0] 本稿では、欧州連合の文脈におけるジェネレーティブAIと大規模言語モデル(LLM)の法的および規制的意味について述べる。
責任、プライバシー、知的財産権、サイバーセキュリティの側面を分析する。
生成モデルの安全性とコンプライアンスを保証するためのレコメンデーションを提案している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:10:29 GMT)
Improved quantum data analysis [1.8] 我々は、$O(log2 m)/epsilon2)$$$d$次元状態のサンプルのみを必要とする量子"Threshold Search"アルゴリズムを提供する。
また, $tildeO((log3 m)/epsilon2)$サンプルを用いた仮説選択法も提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:19:51 GMT)
PyHySCO: GPU-Enabled Susceptibility Artifact Distortion Correction in Seconds [1.8] 我々はPyTorchで実装されたユーザフレンドリーなEPI歪み補正ツールであるPyHySCOを紹介した。
PyHySCOは時間的な物理的歪みモデルと数学的定式化を用いており、訓練なしで信頼性が高い。
Human Connectome Projectの3Tデータと7Tデータを用いた大規模な検証では、PyHySCOはRGPツールの上位ツールに匹敵する精度を、ほんの少しのコストで達成していることを示唆している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:49:13 GMT)
Evaluating how interactive visualizations can assist in finding samples where and how computer vision models make mistakes [1.8] コンピュータビジョン(CV)モデルを作成するシステムであるSpriteのコンテキストにおいて、2つのインタラクティブな可視化を提示する。
これらの視覚化は、Spriteのユーザがモデルに苦労している画像を特定し(評価)、(計画的な)画像を選択するのにどのように役立つかを調べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:23:16 GMT)
Occluded Cloth-Changing Person Re-Identification [1.8] 着替え者の再識別は, 着替えのシナリオにおいて, 着替えとは無関係な特徴を用いて歩行者の身元を把握することを目的としている。
そこで我々は,新しい課題として,隠蔽布を交換する人物の再同定を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:26:20 GMT)
Conformal Predictions for Probabilistically Robust Scalable Machine Learning Classification [1.8] コンフォーマルな予測により、信頼性と堅牢な学習アルゴリズムを定義することができる。
基本的には、アルゴリズムが実際に使われるのに十分であるかどうかを評価する方法である。
本稿では,設計当初から信頼性の高い分類学習フレームワークを定義した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:59:24 GMT)
Efficient near-optimal decoding of the surface code through ensembling [1.7] MWPMベースのデコーダの調和したアンサンブルは、個々のアンサンブルよりも低い論理誤差率を達成する。
我々は、調和は高度に正確なリアルタイム復号化への有効な道筋を提供すると結論づける。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:49:46 GMT)
Secure Distributed Storage: Optimal Trade-Off Between Storage Rate and Privacy Leakage [1.7] 我々は、T$サーバ上でデータを分散的に保存する問題について考察する。
具体的には、(i)データは任意の$tau$サーバからリカバリ可能であり、(ii)任意の$z$サーバからプライベートのままである必要がある。
このモデルでは、(i)ストレージサイズと所望のプライバシのレベルとの基本的なトレードオフと、(ii)エンコーダに必要な局所ランダム性の最適な量とのトレードオフが主な結果である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:50:46 GMT)
Large Language Models and User Trust: Focus on Healthcare [1.7] 本稿では,LLMにおける臨床医の信頼度と,その精度と能力への影響について検討する。
主な関心事の1つは、LLMが学習のアウトプットにより依存するようになると生じる潜在的なフィードバックループである。
LLMの自己参照学習ループと医療専門家のデスクイリングに関連する潜在的なリスクを掘り下げる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:04:45 GMT)
Belief Change based on Knowledge Measures [1.7] 知識尺度(KM)に基づく新しい量的信念変化フレームワークを提案する。
我々の貢献は、(i) [1] が特別の場合である KM に対する一般的な情報理論的アプローチ、(ii) いわゆる AGM の仮定を満たす KM ベースの BC 作用素、(iii) AGM を満足する BC 作用素を KM ベースの BC 作用素として特徴づけることである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:40:11 GMT)
CoSMo: a Framework to Instantiate Conditioned Process Simulation Models [1.6] 本稿では,ユーザの制約やアプリオリ知識の他の性質に基づいて,CoSMo(Conditioned Process Simulation Models)の発見に適した,新しいリカレントニューラルネットワークを提案する。
このアーキテクチャは、宣言型ルールを学習フェーズに組み込むことで、特定の制約に従うイベントログのシミュレーションを容易にする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:49:33 GMT)
Quantization Avoids Saddle Points in Distributed Optimization [1.6] 分散非最適化は、多くの分散システムの重要な機能を支える。
本研究の目的は,サドル点収束を2次定常点収束に効果的に回避できることを示すことである。
簡単に調整可能な量子化により、ユーザの制御により、通信オーバーヘッドを積極的に削減できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:58:20 GMT)
MARS via LASSO [1.5] 我々はMARS法の自然変種を提案し,研究する。
提案手法は,関数の凸クラス上での少なくとも2乗推定に基づいている。
我々の推定器は有限次元凸最適化によって計算できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 05:44:37 GMT)
Introducing Adaptive Continuous Adversarial Training (ACAT) to Enhance ML Robustness [1.5] 敵の訓練は、これらの攻撃に対する機械学習モデルの堅牢性を高めることが判明した。
特にネットワークやサイバーセキュリティのような ダイナミックな分野において
このレターでは、Adaptive Continuous Adversarial Training (ACAT)を導入し、モデルに敵のトレーニングサンプルを継続的に統合する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:52:25 GMT)
Open Stamped Parts Dataset [1.4] 自動車製造のための切削された金属シートの合成と実像を特徴とするOpen Stamped Partsデータセット(OSPD)を提示する。
実際の写真は7台のカメラから撮影され、7,980枚の未ラベル画像と1,680枚のラベル画像で構成されている。
合成データは、訓練用画像7,980枚、検証用画像1,680枚、テスト用画像1,680枚を含む。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:00:42 GMT)
Exploring Optical Flow Inclusion into nnU-Net Framework for Surgical Instrument Segmentation [1.3] nnU-Netフレームワークは、時間情報なしで単一のフレームを分析するセマンティックセグメンテーションに優れていた。
オプティカルフロー(OF)は、ビデオタスクでよく使われるツールで、動きを推定し、時間情報を含む単一のフレームで表現する。
本研究は,nU-Netアーキテクチャに付加的な入力として,オペレーショナル・インスツルメンテーション・セグメンテーション・タスクの性能向上を目的としている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:36:26 GMT)
A Novel Federated Learning-Based IDS for Enhancing UAVs Privacy and Security [1.3] フライングアドホックネットワーク(FANET)内で運用されている無人航空機(UAV)は、これらのネットワークの動的で分散的な性質のためにセキュリティ上の問題に直面している。
以前の研究では、すべてのデバイスからのデータを保存し分析する中心的なエンティティとして、集中的な侵入検出に主に焦点が当てられていた。
本稿では、FANETにおける集中型システムによる課題に対処するFL-IDS(Federated Learning-based Intrusion Detection System)を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:41:03 GMT)
Leveraging Neural Radiance Field in Descriptor Synthesis for Keypoints Scene Coordinate Regression [1.3] 本稿では,Neural Radiance Field (NeRF) を用いたキーポイント記述子合成のためのパイプラインを提案する。
新たなポーズを生成してトレーニングされたNeRFモデルに入力して新しいビューを生成することで、当社のアプローチは、データスカース環境でのKSCRの機能を強化します。
提案システムは,最大50%のローカライズ精度向上を実現し,データ合成に要するコストをわずかに抑えることができた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:40:37 GMT)
Deep Regularized Compound Gaussian Network for Solving Linear Inverse Problems [1.3] 問題固有の統計的事前選択を可能にする線形逆問題に対する2つの新しいアプローチを考案する。
第1の方法は、正規化された最小二乗目的関数を最小化する反復アルゴリズムである。
第2の方法は、DR-CG-Netと呼ばれる新しいDeep regularized(DR)ニューラルネットワークで、事前情報を学習する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:35:01 GMT)
Strict Partitioning for Sporadic Rigid Gang Tasks [1.2] 本稿では,厳密なパーティショニングという,厳密なギャングタスクのための分割型スケジューリング手法を提案する。
各パーティション内では、タスクは任意のタイプのスケジューラを使ってスケジュールすることができる。
エッジTPUベンチマークに基づく大規模合成実験とケーススタディにより、厳密なパーティショニングは、最先端のグローバルギャングのスケジューリング可能性分析よりも優れたスケジュール性を実現することが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:17:24 GMT)
Quantum memory at nonzero temperature in a thermodynamically trivial system [1.2] 定数レートの古典的および量子的低密度パリティチェック符号は、非ゼロ温度で$textitthermodynamic$相転移を持たないことを示す。
広いエネルギー状態を作る際の回路の複雑さは熱力学的遷移を渡らずに分岐する可能性があると推測する。
フォールトトレラントなパッシブデコーダは、無測定の量子誤り訂正に有効である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:00:03 GMT)
Efficient Detection of Exchangeable Factors in Factor Graphs [1.1] 本稿では,交換可能因子(DEFT)検出アルゴリズムを導入し,実際に2つの因子が交換可能かどうかの計算労力を大幅に削減する。
我々は,DEFTが置換数を大幅に削減する制約を効果的に同定し,実験的な評価においてDFTの効率性を検証することを証明した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:20:56 GMT)
Reliable uncertainty with cheaper neural network ensembles: a case study in industrial parts classification [1.1] オペレーションリサーチ(OR)では、予測モデルはしばしばアウト・オブ・ディストリビューション(OOD)のシナリオに遭遇する。
複数の独立したNNで構成されるディープアンサンブルは、有望なアプローチとして現れている。
本研究は,1つのNNと1つのディープアンサンブル,および3つの効率的なNNアンサンブルを総合的に比較した最初のものである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:38:48 GMT)
Explainability through uncertainty: Trustworthy decision-making with neural networks [1.1] 不確実性は、あらゆる機械学習モデルの主要な特徴である。
ニューラルネットワークでは特に重要であり、過信されがちである。
XAIとしての不確実性は、下流の意思決定タスクにおけるモデルの信頼性を改善する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:22:48 GMT)
Automatic Report Generation for Histopathology images using pre-trained Vision Transformers and BERT [1.1] 既存のトレーニング済みビジョントランスフォーマー(ViT)を用いて4096x4096サイズのWSIのパッチを符号化し,レポート生成のための双方向表現(BERT)モデルを構築することで,パフォーマンスとポータブルなレポート生成機構を構築することができることを示す。
本手法は,画像を記述するキャプションの生成と評価だけでなく,画像の組織型や患者の性別の分類にも有効である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:39:24 GMT)
Goodness of fit by Neyman-Pearson testing [1.0] 仮説テストのためのナイマン・ピアソンの戦略は、データから代替仮説が選択された場合に適合する。
高エネルギー物理コライダー実験における新しい物理効果の検出を目的とした新しい物理学習機械(NPLM)法が開発されている。
NPLMは、予想される分布からのデータの小さな離脱に対するより敏感なテストとして現れ、特定の種類の異常を検出するには偏らない。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:30:28 GMT)
Attention-Enhanced Hybrid Feature Aggregation Network for 3D Brain Tumor Segmentation [1.0] グリオ芽腫は、早期診断と迅速な介入を必要とする非常に攻撃的で悪性な脳腫瘍である。
この課題に対処するため、人工知能(AI)が主導する医療のアプローチは、脳腫瘍の効率的な診断と評価に関心を寄せている。
提案手法では,マルチスケール,注意誘導型,ハイブリッドU-Net形状モデルであるGLIMSを用いて,脳腫瘍の3次元セグメント化を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:52:17 GMT)
Response Style Characterization for Repeated Measures Using the Visual Analogue Scale [1.0] 視覚的アナログ尺度(VAS)は、人々の感情を正確に、かつ容易に評価できる能力から、スライダベースの尺度として人気を博している。
その重要性にもかかわらず、VASのレスポンススタイル(RS)を扱うことにはほとんど注意が払われていない。
我々は,様々な種類の繰り返し測定されたVASデータに対する新しいRP特性評価法を開発した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:33:10 GMT)
Dual Symmetry Classification of Non-Hermitian Systems and $\mathbb{Z}_2$ Point-Gap Topology of a Non-Unitary Quantum Walk [0.9] 非エルミート系は、エルミート系と比較してよりリッチな位相的性質を示す。
非エルミート系は非エルミート的ハミルトニアンあるいは時間進化作用素の対称性関係を用いて分類することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:30:21 GMT)
Predicting Arbitrary State Properties from Single Hamiltonian Quench Dynamics [0.9] アナログ量子シミュレータ上での任意の状態特性を推定するハミルトンシャドウプロトコルを導入する。
このプロトコルは高度な制御を必要とせず、幅広いアナログ量子シミュレータに適用することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:47:07 GMT)
End-to-End Graph-Sequential Representation Learning for Accurate Recommendations [0.8] 本稿では,これら2つのパラダイムの相乗効果を利用した新しい多表現学習フレームワークを提案する。
いくつかのデータセットに対する実験的な評価から,提案フレームワークによる逐次的およびグラフ的コンポーネントの相互学習が推奨性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:40:50 GMT)
Apriori Knowledge in an Era of Computational Opacity: The Role of AI in Mathematical Discovery [0.8] 証明チェッカーがそのような機械に取り付けられている場合、それらからアプリロリの数学的知識を得ることができると論じる。
多くの人は、アペルとハケンのプログラムから4色理論の真の数学的知識を得ることができると認めている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:38:26 GMT)
Unveiling Wash Trading in Popular NFT Markets [0.8] 4つの非偽造トークン(NFT)市場における2500万以上のトランザクションを分析します。
本稿では,トランザクションのネットワーク特性を行動解析と統合するアルゴリズムを提案する。
以上の結果から, インセンティブのあるNFT市場は, 洗剤取引量の割合が高いことが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:52:52 GMT)
VRHCF: Cross-Source Point Cloud Registration via Voxel Representation and Hierarchical Correspondence Filtering [0.7] 広い適用性を有するポイントクラウド登録のための新しいフレームワークを提案する。
クロスソースのクラウド登録では、3DCSRデータセット上で最高のRRを獲得し、9.3%の改善率を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:00:29 GMT)
Cardiac valve event timing in echocardiography using deep learning and triplane recordings [0.7] 心エコー法において,三面体記録を利用した深層学習手法を提案する。
本手法は,従来のEDおよびESに関連付けられた弁イベントを含む,6つの異なる事象を検出する性能の向上を実証する。
提案手法は,より正確で迅速かつ包括的な事象検出を可能にすることによって臨床実践に大きな影響を与える可能性があり,臨床測定の精度が向上する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:58:49 GMT)
Perceptual Scales Predicted by Fisher Information Metrics [0.7] 知覚はしばしば、観察者の外部にある物理的変数を内部の心理的変数に変換する過程と見なされる。
知覚尺度は、刺激間の相対的な差異を比較するための心理物理学的な測定から導かれる。
ここでは、古典的(空間周波数、方向)および古典的でない物理変数の知覚尺度を測定することの価値を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:44:51 GMT)
Learning interacting fermionic Hamiltonians at the Heisenberg limit [0.7] ハイゼンベルク極限でフェルミオンハバードハミルトニアン類を学ぶアルゴリズムを提供する。
このプロトコルは一定量の状態準備と測定誤差に対して堅牢である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:24:32 GMT)
Testing MediaPipe Holistic for Linguistic Analysis of Nonmanual Markers in Sign Languages [0.7] 我々はMediaPipe Holistic(MPH)と古いソリューション(OpenFace, OF)を比較する。
MPHは眼球運動の言語学的解析には不十分である。
我々は、これらの制限を克服するために追加の修正モデルをトレーニングする以前の提案を再検討する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:59:21 GMT)
Verification of Quantum Computations without Trusted Preparations or Measurements [0.6] 我々は、既知の検証スキームを信頼されたゲートのみに依存するプロトコルに変換するモジュール的で構成可能で効率的な方法を提案する。
我々の最初の貢献は、Z軸とビットフリップの1量子ビット回転の信頼できる適用に対するBQPの量子検証の問題を非常に軽量に削減することである。
2つ目の構成は、信頼できる準備や測定なしに、任意の量子計算を量子出力で情報理論的に検証することは一般的に可能であることを示している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:54:28 GMT)
Few-Shot Image Classification and Segmentation as Visual Question Answering Using Vision-Language Models [0.6] 本稿では,FS-CS問題を視覚質問 (VQA) 問題に変換する視覚指導評価 (VISE) 手法を提案する。
提案手法は,Pascal-5iおよびCOCO-20iデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:29:41 GMT)
Quantum Fisher information and polaron picture for identification of transition coupling in quantum Rabi model [0.6] 我々は、量子ラビモデルにおける量子フィッシャー情報(QFI)を用いて遷移結合を同定する。
遷移結合の正確な式は、ポラロン周波数再正規化の分極パワー-法則効果のインスピレーションによって得られる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:49:46 GMT)
A Conceptual Model for the Analysis of Investigation Elements in Games [0.6] 本稿では,ゲームデザインの観点から調査ゲームを分析するために開発された4E概念モデルを提案する。
基底理論はモデル構築の方法論として用いられ、基礎となる概念の深い理解を可能にした。
全体として、4Eモデルは、調査ゲーム要素を理解するための包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:04:30 GMT)
A Survey of Source Code Representations for Machine Learning-Based Cybersecurity Tasks [0.6] グラフベースの表現は最も人気のある表現カテゴリである。
Tokenizers と Abstract Syntax Trees (AST) は、全体として最も一般的な2つの表現である。
最も一般的なサイバーセキュリティタスクは脆弱性検出である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:27:48 GMT)
Redefining Developer Assistance: Through Large Language Models in Software Ecosystem [0.6] 本稿では,インストラクションチューニングによって開発されたDevAssistLlamaを紹介し,ソフトウェア関連自然言語クエリの処理を支援する。
DevAssistLlamaは、特に複雑な技術ドキュメントの扱いに長けており、ソフトウェア固有のタスクにおける開発者の能力を向上させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:23:12 GMT)
PQDynamicISP: Dynamically Controlled Image Signal Processor for Any Image Sensors Pursuing Perceptual Quality [0.6] ISPのパラメータをチューニングする代わりに,各環境,さらにはローカルでも動的に制御することを提案する。
本手法では,1つのISPで複数のイメージセンサを動的制御により処理することができるが,従来の手法では各センサのトレーニングが必要であった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:08:24 GMT)
Application of machine learning to experimental design in quantum mechanics [0.5] 本稿では,量子センサの精度を最適化する機械学習手法を提案する。
フレームワークはPythonパッケージのqsensoroptで実装されている。
我々は,この手法のNV中心およびフォトニック回路への応用について検討した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:07:46 GMT)
Discrete approximations of Gaussian smoothing and Gaussian derivatives [0.5] 本稿では,離散データに適用するためのスケール空間理論におけるガウススムージングとガウス微分計算の近似問題に関する詳細な処理法を開発する。
我々は、これらのスケール空間の操作を明示的な離散的畳み込みの観点から区別する3つの主要な方法を考える。
本稿では,これら3つの主要な離散化手法の特性を理論的および実験的に検討する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:08:30 GMT)
KIF: A Framework for Virtual Integration of Heterogeneous Knowledge Bases using Wikidata [0.5] ウィキデータベースをラングアフランカとして使用して異種知識ベースを統合する知識統合フレームワークを提案する。
KIFはWikidataのデータモデルと語彙とユーザ定義のマッピングを活用し、統合された基盤の統一されたビューを公開する。
我々は、KIFの設計と実装について述べ、化学領域における実際の統合問題の解決にどのように利用したのかを議論し、KIFの性能とオーバーヘッドに関する実験結果を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:46:36 GMT)
Fast data-driven spectrometer with direct measurement of time and frequency for multiple single photons [0.4] 512個の単光子アバランシェダイオード検出器の線形アレイに基づく単光子感度分光計を提案する。
我々は、同時単一光子の時間と周波数を直接測定できる高速なデータ駆動演算を用いる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:34:38 GMT)
A Bayesian Gaussian Process-Based Latent Discriminative Generative Decoder (LDGD) Model for High-Dimensional Data [0.4] 潜在判別生成デコーダ(LDGD)は、多様体発見過程において、データと関連するラベルの両方を用いる。
LDGDは,データサイズに制限のあるシナリオに対して,多様体を頑健に推論し,正確にラベルを予測することができることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:42:09 GMT)
A systematic mapping on quantum software development in the context of software engineering [0.4] 本稿では,量子コンピュータ用に開発されたソフトウェアの特徴と特徴について,系統的なマッピング研究を行う。
本研究の実施について詳述した3つの研究課題に答える目的で,計24の論文をデジタル図書館を用いて選択した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:44:23 GMT)
A comparative study on machine learning approaches for rock mass classification using drilling data [0.4] 掘削・爆発トンネルにおける現在の岩石工学設計は、技術者の観察的評価に依存している。
トンネル掘削時に収集した高分解能センサ・データセットであるMWDデータ(MWD)は未利用である。
本研究の目的は,MWDデータを岩盤工学の実用的な指標に自動変換することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:37:19 GMT)
Improved discrete particle swarm optimization using Bee Algorithm and multi-parent crossover method (Case study: Allocation problem and benchmark functions) [0.4] 本稿では,OMPCDPSO(OMPCDPSO)を提案する。
我々は,ハチアルゴリズムの見物ミツバチを用いた,独立して集中した近傍探索を行った。
この研究で開発されたアルゴリズム(OMCDPSO)は、47(76.60%)のうち36の試験関数で、他のアルゴリズムよりも優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:08:37 GMT)
Evaluation of GlassNet for physics-informed machine learning of glass stability and glass-forming ability [0.4] ガラスの安定性(GS)を計算するのに必要な特性温度を予測できるオープンソースのトレーニング済みNNモデルGlassNetの適用について検討する。
本研究では,これらの予測と組み合わせてGSの予測を行い,ランダムな森林モデルがGlassNetに類似した精度を提供することを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:03:34 GMT)
Missing Data Imputation With Granular Semantics and AI-driven Pipeline for Bankruptcy Prediction [0.3] この研究は、倒産予測のためのパイプラインの設計に焦点を当てている。
欠落した値、高次元データ、高クラス不均衡データベースの存在は、そのタスクにおける大きな課題である。
粒度のセマンティクスを付加した新しいデータ計算法が導入された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:01:09 GMT)
On Recovering Higher-order Interactions from Protein Language Models [0.3] 3つのタンパク質-緑色蛍光タンパク質(GFP)、腫瘍タンパク質P53(TP53)、GドメインB1(GB1)に適用されるタンパク質言語モデルESM2の系統的フーリエ解析を行うフレームワークを開発する。
ESM2 はスパースフーリエ変換に適するスポーシティ・ラゲネス平面の 3 つの領域で支配されていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:35:47 GMT)
Unsupervised Threat Hunting using Continuous Bag-of-Terms-and-Time (CBoTT) [0.3] 我々は、研究者やサイバーセキュリティアナリストが異常に基づく脅威狩りを行うのを助けるために、教師なしのフレームワークを提案する。
このフレームワークは、他の研究者がベンチマーク分析やサイバーセキュリティ分析を行い、SIEMログの異常を見つけるために使用することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:16:10 GMT)
COGNAC: Circuit Optimization via Gradients and Noise-Aware Compilation [0.3] 我々は、量子回路をコンパイルするための新しい戦略であるCOGNACを提案する。
ゲートを絡み合う時間帯に通知される単純なノイズモデルを用いる。
我々は、多数の明示的な消去書き直し規則を必要とせず、回路のゲート数を削減した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:59:59 GMT)
Data-Driven Distributionally Robust Safety Verification Using Barrier Certificates and Conditional Mean Embeddings [0.2] 問題を非現実的な仮定にシフトすることなく,スケーラブルな形式検証アルゴリズムを開発する。
問題を非現実的な仮定にシフトさせることなく,スケーラブルな形式検証アルゴリズムを開発するためには,バリア証明書の概念を用いる。
本稿では,2乗法最適化とガウス過程エンベロープを用いて効率よくプログラムを解く方法を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:32:02 GMT)
Assessment of error variation in high-fidelity two-qubit gates in silicon [0.2] 我々はスピン量子ビットプロセッサの誤差を研究し、それらの物理的起源を結びつける。
2量子ゲートの99%以上の忠実度で一貫した繰り返し動作を示す。
結果は、シリコンスピンベースの量子ビットをフルスケールの量子プロセッサにスケールアップする能力と課題の両方を強調している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:18:41 GMT)
Deep learning in a bilateral brain with hemispheric specialization [0.2] 本研究では,両半球の相互作用が与えられたタスクにおいて良好に動作するかを検討する。
そこで本研究では,自然界で観測された横性化を模倣する人工ニューラルネットワークを提案する。
解析の結果,ヘミスフィアはネットワークヘッドによって利用される相補的特徴を表すことがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:05:21 GMT)
SOMson -- Sonification of Multidimensional Data in Kohonen Maps [0.2] 自己組織化マップ (SOMs) は、低次元マップ上の高次元特徴空間を可視化するニューラルネットワークである。
基礎となるデータの対話的ソナライゼーションであるSOMsonをデータ拡張手法として提案する。
ユーザスタディの代わりに、インタラクティブなオンライン例を示し、読者がSOMson自身を探索できるようにします。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:02:59 GMT)
Moodle Usability Assessment Methodology using the Universal Design for Learning perspective [0.2] 本研究の目的は,ユニバーサル・デザイン・フォー・ラーニングの原則に基づいて,Moodleプラットフォームのユーザビリティを評価する手法を設計することである。
我々は、それぞれのMoodle v.2.xとv.3.xファミリーのバージョンの2つのインスタンスを評価するユースケースの結果を提供する。
我々は、国際アクセシビリティ標準に準拠するために、プラットフォームがいくつかの重要な要素を改善しなければならないと結論付けている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:19:04 GMT)
RadCLIP: Enhancing Radiologic Image Analysis through Contrastive Language-Image Pre-training [0.2] RadCLIPは、X線画像解析を洗練させるために、コントラスト言語-画像事前学習を利用するクロスモーダル基礎モデルである。
評価の結果,RadCLIPは放射線画像と対応するテキストアノテーションを効果的に一致させることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:18:08 GMT)
Deep Learning for Multi-Level Detection and Localization of Myocardial Scars Based on Regional Strain Validated on Virtual Patients [0.1] 我々は, 心筋疾患の基質をグローバル, 領域, セグメントレベルで予測するための単一の枠組みを提案する。
臨床標準ブルジー表現から多チャンネル2D画像への入力データの解剖学的意味の表現を提案する。
The Fully Convolutional Network (FCN) is trained to detect and localization myocardial scar from Regional left Venentricular (LV) strain pattern。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:31:33 GMT)
Enriching User Shopping History: Empowering E-commerce with a Hierarchical Recommendation System [0.1] 推薦システムは、ユーザのショッピング履歴を分析して、正確なレコメンデーションを提供することができる。
リッチなユーザ履歴は、より正確なレコメンデーションをもたらす。
実際のアプリケーションでは、ユーザーは、求めているアイテムが最低価格の電子商取引プラットフォームを好む。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:28:03 GMT)
tsGT: Stochastic Time Series Modeling With Transformer [0.1] 本稿では,汎用トランスアーキテクチャ上に構築された時系列モデルであるtsGTを紹介する。
tsGT は MAD と RMSE の最先端モデルより優れており、QL と CRPS のピアよりも 4 つの一般的なデータセットで優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:24:40 GMT)
DFRWS EU 10-Year Review and Future Directions in Digital Forensic Research [0.1] 本報告では、デジタル・フォレスティクス・リサーチ・ヨーロッパ(DFRWS EU)で発行された135件の査読記事について、初回公開から10年を経過して調査する(2014-2023)。
DFRWS EUの記事の包括的な研究は、デジタル法科学、デバイス法学、技術と基礎、アーティファクト法学、マルチメディア法学、メモリ法学、ネットワーク法学などのサブ分野を含んでいる。
この分析は、この10年間のデジタル法医学研究の進化に関する洞察を与え、将来的な研究の方向性を明らかにしている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:51:23 GMT)
DFRWS EU 10-Year Review and Future Directions in Digital Forensic Research [0.1] 本報告では、デジタル・フォレスティクス・リサーチ・ヨーロッパ(DFRWS EU)で発行された135件の査読記事について、初回公開から10年を経過して調査する(2014-2023)。
DFRWS EUの記事の包括的な研究は、デジタル法科学、デバイス法学、技術と基礎、アーティファクト法学、マルチメディア法学、メモリ法学、ネットワーク法学などのサブ分野を含んでいる。
この分析は、この10年間のデジタル法医学研究の進化に関する洞察を与え、将来的な研究の方向性を明らかにしている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:51:23 GMT)
Design and Flight Demonstration of a Quadrotor for Urban Mapping and Target Tracking Research [0.0] 本稿では,都市マッピング,ハザード回避,目標追跡研究のための画像センサを備えた小型四角形機のハードウェア設計と飛行実証について述べる。
車両には5台のカメラが装備されており、2対の魚眼ステレオカメラが装備されており、ほぼ一方向の視界と2軸ジンバルカメラが装備されている。
Robot Operating Systemソフトウェアを実行するNVIDIA Jetson Orin Nanoコンピュータがデータ収集に使用されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:15:18 GMT)
With a Little Help from Photons: Quantum Field Theory on Continuous-Variable Quantum Computers [0.0] 我々は、任意のハミルトニアンの下で量子力学状態の時間発展を再現する方法を開発し、証明する。
提案手法は,目的状態における所望の時間進化を誘導する特殊準備された量子状態である進化状態を構築することに集中する。
本稿では, CVQCのフィールド理論を, フィールド値の判別なしにエンコードできるように拡張可能な, 新たなフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:31:09 GMT)
Viewing the process of generating counterfactuals as a source of knowledge: a new approach for explaining classifiers [0.0] 本稿では,このシミュレーションプロセスを,使用可能な知識を,後に異なる方法で生成するための情報源として捉えることを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:08:52 GMT)
Using the inductive-energy participation ratio to characterize a superconducting quantum chip [0.0] 超伝導量子チップのシミュレーションと検証のための誘導エネルギー参加率(IEPR)法を開発した。
本研究は,シミュレーションおよび検証技術の大幅な向上を約束するものである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:15:46 GMT)
Using Contextual Information for Sentence-level Morpheme Segmentation [0.0] 形態素セグメンテーションをシーケンス・ツー・シーケンス問題として再定義し、個々の単語を分離するのではなく、文全体を入力として扱う。
その結果,多言語モデルの方が単言語モデルに比べて優れた性能を示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:12:32 GMT)
Unscrambling of single-particle wave functions in systems localized through disorder and monitoring [0.0] 本研究では,局所粒子を正確に特徴付ける自由フェルミオン波動関数のスレーター行列式を求めるプロセスを開発する。
その結果, 単一粒子波動関数を応用して, 観測された自由フェルミオンや乱れモデルなどのシステムにおける局在化遷移特性について, 貴重な知見を得ることが可能となった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:16:44 GMT)
Universal high-fidelity quantum gates for spin-qubits in diamond [0.0] 最近の実験では、マルチキュービット量子プロセッサ、光配線、基本量子誤り訂正プロトコルが実証されている。
大規模システムに対する鍵となるオープンな課題の1つは、高忠実な普遍量子ゲートを実現することである。
ダイヤモンド中の窒素空孔中心の電子スピンと核スピンによって形成される2量子系に対して、完全な高忠実ゲートを設計し、実証する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:00:02 GMT)
Universal correlations in chaotic many-body quantum states: Fock-space formulation of Berrys random wave model [0.0] 相互作用量子系におけるカオス固有状態のランダム性は、粒子あたりの有限エネルギーによって課される微妙な相関を隠蔽することを示す。
これらの相関関係は、単粒子系におけるカオス固有関数に対するベリーズアプローチが多体空間に持ち上げられるときに明らかとなる。
次に、相互相関の普遍性と拡張係数のガウス分布をカオス固有状態の符号として同定する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:26:17 GMT)
Understanding Stress: A Web Interface for Mental Arithmetic Tasks in a Trier Social Stress Test [0.0] ストレスは、脳の反応を反映する動的なプロセスである。
ストレスを測定する従来の方法は、しばしば時間がかかり、バイアスを思い出す可能性がある。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:43:49 GMT)
Transport of non-classical light mediated by topological domain walls in a SSH photonic lattice [0.0] トポロジカルフォトニクスシステムは、伝播中に量子光特性を保護するための有望なプラットフォームとして出現している。
トポロジカルドメイン壁を持つSu-Schrieffer-Heegerフォトニック格子を横断する非古典的な光のダイナミクスについて検討する。
本研究は, 格子を横断する非古典光の高忠実輸送を実証し, システムトポロジで保護されている既知結果を再現した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:15:38 GMT)
Transforming Competition into Collaboration: The Revolutionary Role of Multi-Agent Systems and Language Models in Modern Organizations [0.0] 本稿では,マルチエージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく計算エンティティがユーザインタラクションに与える影響について考察する。
提案手法では,大規模言語モデル (LLM) から発達したエージェントを用いて,行動要素を考慮したプロトタイピングを行う。
我々は,多エージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく革新的な利用に基づいて,組織戦略に有用なエージェントの開発の可能性を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:44:51 GMT)
Towards a general framework for improving the performance of classifiers using XAI methods [0.0] 本稿では,XAI手法を用いた事前学習型ディープラーニング(DL)分類器の性能向上のためのフレームワークを提案する。
オートエンコーダベースおよびエンコーダデコーダベースと呼び、それらの重要な側面について議論する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:04:20 GMT)
Towards Two Bloch Sphere Representation of Pure Two Qubit States and Unitaries [0.0] 最大絡み合う状態を表すのに適した2つのブロッホ球形状を同定する。
2つのブロッホ球の座標軸の相対方向は状態を記述するために用いられる。
分離可能な最大絡み合い状態や、絡み合いや非絡み合いの回転を記述・描写する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:03:53 GMT)
Topological frequency conversion in rhombohedral multilayer graphene [0.0] ロンボヘドラル多層グラフェンは 位相周波数変換をサポートする
ベルナール二層グラフェンは, 消散率の低いため, THzスケールの用途に最も有望であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:35:08 GMT)
ThreatCluster: Threat Clustering for Information Overload Reduction in Computer Emergency Response Teams [0.0] 情報ソースの脅威と多様性はCERTにとって課題となる。
新たな脅威に対応するため、CERTはタイムリーで包括的な方法で情報を集める必要がある。
本稿では,CERTにおける情報過負荷を低減する方法について考察する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:46:49 GMT)
Thermal time as an unsharp observable [0.0] 量子調和振動子に付随するConnes-Rovelli熱時間は(非シャープ)観測可能、すなわち正の演算子値測定値として記述できることを示す。
この結果は、一次元の自由質量を持たない相対論的粒子と、非可換積分によって平衡状態が与えられる仮説物理系に拡張される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:53:24 GMT)
Thermal Earth Model for the Conterminous United States Using an Interpolative Physics-Informed Graph Neural Network (InterPIGNN) [0.0] 本研究では物理インフォームドグラフニューラルネットワークに基づくデータ駆動空間アルゴリズムを提案する。
このモデルは,地下温度,表面熱流,岩石熱伝導率を同時に予測することにより,3次元熱伝導則をほぼ満たすよう訓練された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:55:07 GMT)
The cost of solving linear differential equations on a quantum computer: fast-forwarding to explicit resource counts [0.0] 一般線型常微分方程式に対する解を量子状態に符号化するコストの非漸近計算を初めて与える。
古典力学の大規模クラスの安定性がそれらの高速なフォワードを可能にすることを示す。
ヒストリー状態は常に任意の安定線型系に対して複雑性$O(T1/2)$で出力できる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:53:52 GMT)
The Gauge Picture of Quantum Dynamics [0.0] 局所性は、波動関数振幅が局所運動方程式に従わないという意味で、シュル「オーディンガー」(Schr"odinger) 図において明らかでない。
局所性は、量子力学の大域的ユニタリ不変性を局所ゲージ不変量に"ゲージ"することにより、運動方程式において明示的に達成できることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:58:58 GMT)
The Emergence of the Hexagonal Lattice in Two-Dimensional Wigner Fragments [0.0] 非常に低い密度では、均一な電子ガス中の電子が自発的に対称性を破り、ウィグナー結晶と呼ばれる結晶格子を形成する。
ウィグナー結晶の破片の密度分布の第一原理による数値的研究を報告する。
二次元ウィグナー結晶の基底状態構造であると予測された六角形結晶構造の出現を観察する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:27:54 GMT)
Studying Stabilizer de Finetti Theorems and Possible Applications in Quantum Information Processing [0.0] 量子情報理論において、量子状態がそのサブシステムの置換の下で不変であれば、その限界は1つのサブシステムの状態のパワーの混合によって近似することができる。
近年、置換よりも大きな対称性群に対して同様の観測が可能であることが判明した。
このことは、この対称性が現れるアプリケーションで同様の改善が見つかるかどうかという疑問を自然に提起する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:55:12 GMT)
Statistical Properties of the log-cosh Loss Function Used in Machine Learning [0.0] 本稿では,ログコッシュ損失が発生する分布関数について述べる。
また、量子レグレッションにlog-cosh関数を用いる方法についても検討する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:58:47 GMT)
Speckled-speckle field as a resource for imaging techniques [0.0] 光の相関状態、古典的および量子的状態は、いくつかのイメージング技術の実装において有用な応用を見出すことができる。
使用元のうち、レーザービームの拡散器通過によって生じる擬熱状態は、標準的な選択である。
相関度の高い光を生成するために, 数値シミュレーションと実験実装の両方を用いて2つの拡散器を用いて得られたスペックル・スペックル場について検討し, 特性評価を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:17:39 GMT)
Specification and Enforcement of Activity Dependency Policies using XACML [0.0] 異なるアクティビティ間の依存関係は、お互いの実行に影響を与え、制限します。
ACACモデルでは、要求されたアクティビティを制御するための決定パラメータとして、"D"と表記されるアクティビティ依存が考慮されている。
本稿では,広く使用されているeXtensible Access Control Language (XACML) を用いて,アクティビティ依存ポリシーを規定するポリシーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:12:37 GMT)
Single-photon emitters in WSe$_2$: The critical role of phonons on excitation schemes and indistinguishability [0.0] 発光過程においてWSe$_2$量子エミッタが経験するフォノンスペクトル密度を再構成する手法を提案する。
共鳴励起下では、強いフォノン結合により$sim$0.80に制限された励起子生成フィデリティが得られる。
近共振フォノンアシスト励起下では、0.976(0.997)の準均一励起忠実度を観測する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:57:04 GMT)
Sequential measurements thermometry with quantum many-body probes [0.0] 計算ベースでの1つの量子ビットシーケンシャルな測定により、多体系の正確な温度測定が可能になることを示す。
その後の2つの測定の間の時間は、プローブが熱を起こさないように、熱化時間よりも小さくすべきである。
これにより、逐次測定スキームは平衡プローブの複雑なエネルギー測定によって達成できる精度を超える精度に達することができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:54:40 GMT)
Sensing Aharonov--Bohm phase using a multiply-orbiting-ion interferometer [0.0] 本研究では,イオン物質波干渉計であるAharonov--Bohm相の測定法を提案する。
電位のイオン軌道はリッサホス曲線を形成し、イオン回転の方向が逆になる。
本研究におけるアハロノフ-ボーム相の感度は約300rad/sの回転感度に対応する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 02:59:12 GMT)
Search-based Ordered Password Generation of Autoregressive Neural Networks [0.0] GPTに基づくパスワード推測モデルであるSOPGesGPTを構築し,SOPGを用いてパスワードを生成する。
最も影響力のあるモデルであるOMEN、FLA、PassGAN、VAEPassと比較すると、SOPGesGPTは有効率とカバーレートの両方においてはるかに優れている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:30:38 GMT)
Sample complexity of matrix product states at finite temperature [0.0] 計算複雑性理論は、基底状態エネルギーの評価が量子コンピュータ上でも解けることを明らかにしている。
ここでは行列積状態形式を用いて有限温度状態を記述する。
高温と低温では, システムサイズによるスケーリングの挙動は, それぞれ直線的, 二次的である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:52:52 GMT)
SO(n) AKLT Chains as Symmetry Protected Topological Quantum Ground States [0.0] この理論は、一次元量子スピン系を考える際に生じる一対の対称性保護位相(SPT)位相を研究する。
基底状態構造を記述する新しい結果と、$n$が偶数であるとき、その特異な$O(n)$-to-$SO(n)$対称性の破れを示す。
我々は、有限対称性群 $G$ に対する分裂状態に対するオガタの SPT 指数の定義をコンパクトリー群 $G$ に対する SPT 指数に拡張する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:22:49 GMT)
RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging [0.0] 既存の非学習ベースの車両制御ソリューションは主にルールと最適化に依存している。
近年のDeep Reinforcement Learningの進歩は、将来性を示し、学術的な関心を集めている。
エゴ車とその周辺車両の実用性を明確に考慮した,アクセラレーションと車線変更決定のための新しい学習ベースモデル。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:32:45 GMT)
Quantum state preparation via engineered ancilla resetting [0.0] フラストレーションのない親ハミルトニアンの基底状態を作成するために,周期的量子リセットを組み込んだプロトコルについて検討する。
このプロトコルでは、ハミルトニアンを操り、システムとアシラリー自由度の間の局所的な結合を可能にする。
以上の結果から,アンシラ系の絡み合いはより高速な収束に不可欠であることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:02:44 GMT)
Quantum nonlinear optics on the edge of small lattice fractional quantum Hall fluids [0.0] 格子分数量子ホール液体の外部電位に対するエッジモードの量子力学について検討した。
非線形キラルルッティンガー液体理論は, 格子状小領域においても, 定量的に正確な説明を提供することを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:00:02 GMT)
Quantum gates utilizing dark and bright states in open dissipative cavity QED [0.0] 本稿では、単一光子と量子エミッタのアンサンブルを含む開散性ナノキャビティとの相互作用に基づく量子ゲートの一般形式と具体的実装について述べる。
ナノキャビティ場に結合した量子エミッタの絡み合った明るい暗黒状態のリッチダイナミクスは、入射光子の量子状態の効率的な操作を引き起こす。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:32:30 GMT)
Quantum chip design optimization and automation in superconducting coupler architecture [0.0] 超伝導カプラアーキテクチャは、スケーラブルで高性能な量子プロセッサに大きな可能性を示す。
レイアウトの観点からハイパフォーマンスの「Qubit-Coupler-Qubit (QCQ)」を効率的にかつ自動的に設計する方法はいまだ不明である。
レイアウトの幾何学的設計にのみ依存する重要なゼロカップリング条件を得る。
本稿では,超上界に到達するための最適レイアウト設計手法を提案し,効率的かつ高性能なレイアウト設計を実現する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 04:28:33 GMT)
Quantum Synchronization in Nonconservative Electrical Circuits with Kirchhoff-Heisenberg Equations [0.0] 我々は古典的および量子化された電気回路の散逸理論を開発する。
ポアソン・レイリーブラケットを用いた所定の回路の運動方程式を導出する。
量子環境では、運動方程式はキルヒホフ・ハイゼンベルク方程式と呼ばれる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:07:23 GMT)
Quantum States Seen by a Probe: Partial Trace Over a Region of Space [0.0] 部分的トレース演算は、デコヒーレンス効果と量子測定において重要な役割を果たす。
空間の特定の領域における量子状態を制限するために使うことができる。
縮小状態は、空間範囲に制限のある理想的なプローブによって検出できる状態として解釈される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:39:12 GMT)
Quantum Computing Simulation of a Mixed Spin-Boson Hamiltonian and Its Performance for a Cavity Quantum Electrodynamics Problem [0.0] 本稿では,光子ホッピングを許容する一対の空洞における相転移をシミュレーションする手法を提案する。
シミュレーションは、控えめな量の量子資源で行うことができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:23:38 GMT)
Physics-informed generative model for drug-like molecule conformers [0.0] 共振器生成のための拡散型生成モデルを提案する。
我々のモデルは結合構造の再現に焦点をあてており、古典的な力場において伝統的に見られる関連する用語から構築されている。
ディープラーニングは、トレーニングセットから原子タイピングと幾何学的パラメータを推測するために使用される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:21:25 GMT)
Optimising finite-time photon extraction from emitter-cavity systems [0.0] 本研究では,エミッタキャビティシステムから有限時間単一光子抽出限界を求める手法を開発した。
これらの手法を用いて、有限時間光子抽出の限界とそれらを満たす波束を研究する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:41:43 GMT)
Operation fidelity explored by numerical range of Kraus operators [0.0] 現在の量子デバイスは、所望の量子チャネルを正確に実装する必要がある。
低次元チャネルにおける動作忠実度の統計的特性を解析する。
演算忠実度の測定された分布は、2つの量子演算を区別するために用いられる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:40:39 GMT)
Open quantum system simulation of time and frequency resolved spectroscopy [0.0] レーザーパルスとの相互作用によって引き起こされる分子複合体における励起エネルギー移動のダイナミクスは、基礎となる物理過程に固有の窓を与える。
効率性と時間スケールは励起結合に依存するだけでなく、分子の振動モードへのエネルギーの放出にも影響される。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:53:09 GMT)
Nonlinear-ancilla aided quantum algorithm for nonlinear Schrödinger equations [0.0] 一般的な非線形シュリンガー方程式を効率的に解くために、非線形に進化できる単一アンシラ量子ビットの使い方を示す。
我々は、中性原子量子ビットとボース=アインシュタイン凝縮体とのスピンスピンカップリングによるそのような非線形量子ビットの実現を提案する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:48:29 GMT)
Non-reciprocal dynamics and non-Hermitian skin effect of repulsively bound pairs [0.0] 本稿では,Bose-Hubbardモデルとエンジニアリング環境との結合について検討する。
単一粒子と二重粒子は反対の方向で拡散できることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:32:15 GMT)
Non-Hermitian systems with a real spectrum and selective skin effect [0.0] まず、実スペクトルを持つ非エルミートハミルトニアンを構成するための簡単なアプローチを示す。
代わりに、エルミート・ハミルトニアン $H_0$ と正半定値行列 $A$ の積によって与えられる。
A$ がエルミートエネルギーのみを必要とするとき、結果として生じる$H$ は実かつ複素共役エネルギーレベルを持つ擬エルミートエネルギーである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:19:12 GMT)
Noise-independent Route towards the Genesis of a COMPACT Ansatz for Molecular Energetics: a Dynamic Approach [0.0] 本稿では,多体摂動理論に基づく新しいアンザッツ構築戦略を提案する。
アンザッツに付随する精度と量子複雑性は、予め定義された摂動順序によってのみ決定される。
我々は, アンサッツの精度, パラメータ数, 回路深さの両面において, 連成クラスタベースのアンサッツと比較して, より優れた性能を示すことを示した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:13:17 GMT)
Multi-Objective Reinforcement Learning-based Approach for Pressurized Water Reactor Optimization [0.0] PEARLは、従来のポリシーに基づく多目的強化学習法とを、単一のポリシーを学習することで区別する。
ディープラーニングと進化的テクニックにインスパイアされたいくつかのバージョンが作成され、制約のない問題ドメインと制約のない問題ドメインの両方に対応している。
2つの実用的PWRコアローディングパターン最適化問題を用いて実世界の応用性を実証した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:25:34 GMT)
Monkeypox disease recognition model based on improved SE-InceptionV3 [0.0] 本研究はSE-InceptionV3モデルを改良し,SENetモジュールを組み込み,インセプションV3フレームワークにL2正規化を組み込むことでサルポックス病の検出を向上する。
本モデルは,テストセットにおいて96.71%の精度を示し,従来の手法やディープラーニングモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:01:44 GMT)
Microscopic understanding of NMR signals by dynamic mean-field theory for spins [0.0] 非局所スピンDMFT(nl-spinDMFT)の多元性アプローチ
最近開発された不規則スピン(spinDMFT)の動的平均場理論は、核スピンのスピンダイナミクスをうまく捉えている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:54:46 GMT)
Markovian and non-Markovian master equations versus an exactly solvable model of a qubit in a cavity [0.0] 量子マスター方程式は一般に開量子系の力学をモデル化するために用いられるが、その精度は正確に解けるモデルの解析解と比較されることは稀である。
非マルコフ的時空マスター方程式を2階(レッドフィールド)と4階まで、および3種類のマルコフ的マスター方程式とみなす。
粗粒度マスター方程式は、弱い結合や高い量子ビット周波数に対して標準RWAベースのリンドブラッドマスター方程式よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 01:06:06 GMT)
Jordan Algebraic Formulation of Quantum Mechanics and The Non-commutative Landau Problem [0.0] 非可換ランダウ問題のジョルダン代数的定式化と調和ポテンシャルについて述べる。
非可換パラメータは、ジョルダン設定における連想項の項で記述される。
これにより、この特定の問題に対する状態ベクトルに対するジョルダン=シュリンガー時変方程式が導かれる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:19:13 GMT)
Iterative Confinement of Ions via the Quantum Zeno Effect: Probing Paradoxical Energy Consequences [0.0] これまでに導入した量子ゼノ効果(QZE)に基づくイオントラップ機構を基礎として,イオンを近接させる新しい手法を提案する。
提案手法は導体板の囲いにおけるイオンによる電磁力の繰り返し測定を含む。
本稿では,連続したQZE測定によるシステムのエネルギー利得と,そのような測定を行うエネルギーとのダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:31:26 GMT)
Investigating grammatical abstraction in language models using few-shot learning of novel noun gender [0.0] 我々は,LSTMとデコーダのみのトランスフォーマーが,フランス語の文法的ジェンダーを人間のように抽象化できるかどうかを評価するために名詞学習実験を行った。
両言語モデルが一対二の学習例から新約名詞のジェンダーを効果的に一般化し,合意文脈にまたがって学習したジェンダーを適用した。
モデルの一般化行動は、それらが人間のように文法的な性別を抽象的なカテゴリーとして表現していることを示しているが、詳細を探求するにはさらなる作業が必要である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:25:59 GMT)
Improving Fairness in Credit Lending Models using Subgroup Threshold Optimization [0.0] textitSubgroup Threshold(textitSTO)と呼ばれる新しいフェアネス手法を導入する。
STOは、個々のサブグループの分類閾値を最適化して、それらの間の全体的な識別スコアを最小化する。
実世界の信用貸付データセットを用いた実験により、STOは性別差別を90%以上削減できることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 19:36:56 GMT)
Impact of dark states on the stationary properties of quantum particles with off-centered interactions in one dimension [0.0] 一次元に閉じ込められた非相対論的粒子に対する2体接触相互作用の一般化を提案する。
粒子は距離cが離れているときにのみ相互作用する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:44:23 GMT)
Higgs Condensates are Symmetry-Protected Topological Phases: I. Discrete Symmetries [0.0] 対称性保護位相 (SPT) としてヒッグス位相の最小記述を提案する。
ヒッグス相は、物理的文脈に依存する高次磁気対称性と物質対称性によって保護されている。
ヒッグス相のSPTの性質は、例えば異なるヒッグス凝縮体間の遷移においてバルクに現れる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 00:47:58 GMT)
Heat transport in the quantum Rabi model: Universality and ultrastrong coupling effects [0.0] 量子Rabiモデルにおける熱浴との弱い相互作用における熱輸送は、クビット・オシレータ結合によって制御される。
線形伝導率と温度の普遍性は、Tlesssim T_K$で、結合依存の近藤様温度でT_K$である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:50:19 GMT)
Guideline for the Production of Digital Rights Management (DRM) [0.0] DRM開発のための改革はなく、単に削除するだけだ。
本研究は、DRMのさまざまな種類を概説し、正例と負例の両方を列挙する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:54:31 GMT)
Group-Mix SAM: Lightweight Solution for Industrial Assembly Line Applications [0.0] 我々は、重厚画像エンコーダを軽量画像エンコーダに置き換え、SAMを実用的な組立ラインのシナリオに展開できるようにする。
その結果、Group-Mix SAMと呼ばれる軽量SAMのパラメータは37.63% (2.16M)、パラメータは42.5%(15614.7M)、浮動小数点演算はMobileSAMより少ない。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 06:48:44 GMT)
Ground states of one-dimensional dipolar lattice bosons at unit filling [0.0] 閉鎖によって調整されるであろう近縁近傍の双極子間相互作用の尾は、予期せぬ絶縁相をもたらすことを示す。
これらの絶縁相は、トポロジカルまたはトポロジカルに自明であり、サイト占有の特異な相関によって特徴づけられる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:56:32 GMT)
Granular Aluminum Parametric Amplifier for Low-Noise Measurements in Tesla Fields [0.0] グラニュラルアルミニウム (grAl) のような運動的インダクタンス材料は、面内磁場に対して自然にレジリエンスを持つ非線形性の代替源を提供する。
2つの結合したGraAl共振器で作られた非縮退増幅器を1Tまでの面内磁場に抵抗する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:30:21 GMT)
Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement [0.0] 本稿では,低楕円拡散に基づく画像のインペイントと強調のためのアルゴリズムを提案する。
また、この部分リーマン構造を利用して、全く新しいアンシャープフィルタを定義する。
網膜シンチグラフィーにおける血管造影法について検討した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:20:14 GMT)
Genuine non-Gaussian entanglement of light and quantum coherence for an atom from noisy multiphoton spin-boson interactions [0.0] 絡み合いと量子コヒーレンスは、量子技術の進歩において中心的な役割を果たす。
ここでは、2モードの多重光子Jaynes-Cummings (MPJC) モデルを考える。
エンタングルメントと量子コヒーレンスがどのように最適に生成され、その後どのように操作されるかを示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:15:31 GMT)
Full leading-order nuclear polarization in highly charged ions [0.0] 核励起スペクトルはハートリーフォックに基づくランダム位相近似を用いて計算される。
有効なスカイム力は、核子間の相互作用を記述するために用いられる。
形式主義は、有効真空分極と自己エネルギー図によって与えられる2つの寄与を予測する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:37:37 GMT)
From Algorithms to Outcomes: Reviewing AI's Role in Non-Muscle-Invasive Bladder Cancer Recurrence Prediction [0.0] 主要な尿路癌である膀胱がんは、イギリスで毎日15人が死亡している。
リスクを過大評価し,精度の低いスコアシステムによる再発予測ツール。
機械学習(ML)技術は、NMIBCの再発を予測するための有望なアプローチとして登場した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:03:45 GMT)
Formal Security Analysis of the AMD SEV-SNP Software Interface [0.0] AMD Secure Encrypted 技術は、仮想マシンをハイパーバイザのような特権の高いソフトウェアから保護することによって、機密計算を可能にする。
我々は、SEV Secure Nested Paging (SEV-SNP) と呼ばれる、最新のSEVイテレーションにおけるソフトウェアインターフェースの最初の包括的シンボリックモデルを開発する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:39:55 GMT)
Finite temperature detection of quantum critical points via internal quantum teleportation [0.0] 本研究では, 有限温度データを用いた量子臨界点の検出に, テレポーテーションプロトコルが有効であることを示す。
以前の提案とは対照的に、外部キュービットを入力状態として使用する必要はなく、システム内のキュービットの1つにテレポートする。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:53:53 GMT)
Fast biological imaging with quantum-enhanced Raman microscopy [0.0] 我々は,Ramanプロセスの最適効率で動作可能な,明るい圧縮シングルビームを用いた量子増強型Raman顕微鏡を報告する。
18秒で100×100ピクセルの撮像速度はセルオルガンのダイナミックスを解消する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:44:18 GMT)
Exploring the Capability of Text-to-Image Diffusion Models with Structural Edge Guidance for Multi-Spectral Satellite Image Inpainting [0.0] 衛星画像データに対するテキスト・ツー・イメージ・インペインティング・モデルの有用性について検討する。
StableDiffusion と ControlNet に基づいた新しいインペイントフレームワークが導入された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 09:35:10 GMT)
Exact time-evolving scattering states in open quantum-dot systems with an interaction: Discovery of time-evolving resonant states [0.0] クーロン相互作用を持つオープンダブル量子ドット系の時間進化多電子状態について検討する。
量子ドット上の局在電子の初期状態について、我々は新しいタイプの正確な時間進化状態を見つけ、これを時間進化共鳴状態と呼ぶ。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:39:50 GMT)
Even quantum advice is unlikely to solve PP [0.0] PP $subseteq$ BQP/qpoly ならば、カウント・ヒエラルキーは崩壊する。
これは、PP が量子アドバイスでさえ任意の固定サイズ$nk$の回路を持っていないという関連する無条件の主張を回復させる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 03:33:27 GMT)
Ergonomic Design of Computer Laboratory Furniture: Mismatch Analysis Utilizing Anthropometric Data of University Students [0.0] コンピュータ・ラボラトリー・エルゴノミクスを改善するのに適した人文計測に基づく家具次元
調整不能椅子と調整不能椅子の2種類の家具について検討した。
提案した寸法は, 既設の家具と比較して, 男女ともに適合性が高く, ミスマッチ率も低かった。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 13:00:08 GMT)
Entanglement patterns of quantum chaotic Hamiltonians with a scalar U(1) charge [0.0] 本研究では,制約付きRTTアンサンブルを用いて,物理系における固有状態アンサンブルの挙動を正確に記述できることを示す。
我々の研究は、RMTアンサンブルが、基礎となるハミルトニアンの全ての特徴を考慮に入れなければならないことを明らかにしている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:00:05 GMT)
Effective time-dependent temperature for fermionic master equations beyond the Markov and the secular approximations [0.0] 一定の温度で環境に結合した量子系を考える。
普遍法則に従う有効時間依存性の接触温度を持つレッドフィールド方程式を用いて,システムの進化を減少させる方法について述べる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:53:04 GMT)
Dynamics, locality and weak measurements: trajectories and which-way information in the case of a simplified double-slit setup [0.0] 近年の研究では、弱い測定に基づく一方的な情報取得の可能性を再考している。
弱い結合ポインタを組み込んだ簡易なダブルスリット構成について検討する。
弱ポインタによって提供される情報がどのように解釈され、局所的な画像内のダイナミクスを推測するかを検討する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:00:30 GMT)
Disparities in access to US quantum information education [0.0] 量子情報科学(QIS)のコースワークと学位プログラムは、米国の機関に急速に普及している。
しかし、量子労働者教育へのアクセスは不平等に分散し、不公平に民間の研究機関の学生に恩恵を与えている。
2022年秋時点の456の高等教育機関を対象に,回帰分析を用いてQISコースの分布を分析した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:18:22 GMT)
Detecting Brain Tumors through Multimodal Neural Networks [0.0] 本研究の目的は、グレースケール画像として処理されたMRIスキャンの分類のためのマルチモーダルモデルの性能を評価することである。
結果は有望であり、モデルが約98%の精度に達すると、同様の結果が得られる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:47:51 GMT)
Counterfactual Analysis of Neural Networks Used to Create Fertilizer Management Zones [0.0] 精密農業では、フィールド内変動を考慮した管理ゾーン(MZ)の利用は、効率的な肥料管理を促進する。
肥料の応答性に基づくMZクラスタリング手法を提案する。
2つの収量予測データセットの結果,MZ比に最も影響を与える特徴は,肥料流出を促進するか妨げる地形特性と関連していることが示された。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:29:32 GMT)
Constant-sized self-tests for maximally entangled states and single projective measurements [0.0] 自己テストは、測定された古典的な統計に依存する量子システムの強力な認証である。
本稿では,少数の入力と出力を持つ2部構成ベルシナリオにおける自己検査について考察するが,量子状態と任意に大きな次元の測定を行う。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 18:18:02 GMT)
Concrete Quantum Channels and Algebraic Structure of Abstract Quantum Channels [0.0] 一般化された非可逆チャネルと等等性チャネルを識別する試みが行われた。
この研究の背後にある動機は、チャネル変換の可逆性に適用可能であることである。
これは量子情報理論における符号化問題と関連している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:11:24 GMT)
Comprehensive Study Of Predictive Maintenance In Industries Using Classification Models And LSTM Model [0.0] この研究は、SVM(Support Vector Machine)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、畳み込みニューラルネットワークLSTMベース(Convolutional Neural Network LSTM-based)など、さまざまな機械学習分類手法を掘り下げて、マシンのパフォーマンスを予測し分析することを目的としている。
本研究の主な目的は、精度、精度、リコール、F1スコアなどの要因を考慮して、これらのアルゴリズムの性能を評価し、機械性能を予測・解析することである。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:47:45 GMT)
Complete equational theories for classical and quantum Gaussian relations [0.0] ガウス関係と正アフィンラグランジュ関係のハイパーグラフプロップに対して生成子と関係を与える。
前者は完全不定形前処理によりガウス確率過程を拡張し、後者は無限にスクイーズされた状態を持つガウス量子力学を拡張する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:09:24 GMT)
ChatGPT as a mapping assistant: A novel method to enrich maps with generative AI and content derived from street-level photographs [0.0] ボランティア地理情報(VGI)と大規模言語モデル(LLM)を組み合わせた実験結果について述べる。
GPT-3.5-turbo は OpenStreetMap (OSM) において各道路に最適なタグ付けを提案するよう指示された。
結果は、基礎となるAIモデルを変更することなく、マッピング提案の精度を効果的に向上する2つの方法を示す。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 16:15:51 GMT)
Chain-structured neural architecture search for financial time series forecasting [0.0] 連鎖構造探索空間における3つの一般的なニューラルネットワーク探索戦略(ベイズ最適化、ハイパーバンド法、金融時系列予測の文脈における強化学習)を比較した。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:05:59 GMT)
Cannabis Seed Variant Detection using Faster R-CNN [0.0] 本稿では,現在最先端のオブジェクト検出モデルであるFaster R-CNNを用いて,大麻種子の変種検出について検討する。
タイの大麻種子データセットに,17種類の異なるクラスからなるモデルを実装した。
各種測定値のパフォーマンスを比較し,mAPスコア94.08%,F1スコア95.66%を達成して,より高速な6つのR-CNNモデルを評価する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 22:49:47 GMT)
Can a GPT4-Powered AI Agent Be a Good Enough Performance Attribution Analyst? [0.0] 本研究では,AIエージェントの様々なパフォーマンス属性タスクへの適用について紹介する。
パフォーマンスドライバの分析では93%を超え、マルチレベルの属性計算では100%を達成し、公式な試験基準をシミュレートするQA演習では84%を超える精度を達成している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 17:12:57 GMT)
AraTrust: An Evaluation of Trustworthiness for LLMs in Arabic [0.0] AraTrustはアラビア語でLarge Language Models(LLMs)の総合的信頼性ベンチマークである。
GPT-4は最も信頼できるLCMであり、特にAceGPT 7BやJais 13Bといったオープンソースモデルはベンチマークで60%のスコアを得るのに苦労しました。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 23:52:18 GMT)
Application of GPT Language Models for Innovation in Activities in University Teaching [0.0] GPT(Generative Pre-trained Transformer)は、人工知能および自然言語処理技術である。
様々な分野の大学教育にGPT言語モデルを適用することへの関心が高まっている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:31:52 GMT)
An Energy-Efficient Ensemble Approach for Mitigating Data Incompleteness in IoT Applications [0.0] 同時にエネルギー効率を向上しながら、データの不完全性に対して堅牢なIoTベースの機械学習システムを構築することが重要である。
ENAMLEは、同時に欠落するデータの影響を緩和するための、能動的でエネルギーに配慮した技術である。
本研究では,ENAMLEのエネルギー効率を示す2つの異なるデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 15:01:48 GMT)
An AIC-based approach for articulating unpredictable problems in open complex environments [0.0] システムアプローチを採用することで、信頼性の高いシステムを設計する際のアーキテクトの予測能力を改善することを目指している。
このアプローチを説明するために、航空宇宙ケーススタディが使用されます。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 20:30:02 GMT)
AUTONODE: A Neuro-Graphic Self-Learnable Engine for Cognitive GUI Automation [0.0] オンラインニューログラフィック操作と深部探索によるユーザインタフェースの自律的変換
我々のエンジンはエージェントが複雑に理解し実装し、非並列な効率で動的Web環境に適応することを可能にする。
AUTONODEの汎用性と有効性は一連の実験を通じて実証され、様々なWebベースのタスクを管理する能力を強調している。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 10:27:17 GMT)
A unified diagrammatic approach in Liouville space to quantum transport for bosonic and fermionic reservoirs [0.0] リウヴィル空間のマスター方程式形式に基づく量子輸送の図解的アプローチ
レッドフィールド理論は、部分的および完全な世俗的マスター方程式を議論して、2階に復元される。
非自明な輸送特徴は、クビットオシレータの変形と結合強度の相互作用の結果現れる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 08:48:15 GMT)
A survey of synthetic data augmentation methods in computer vision [0.0] 本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 07:34:08 GMT)
A single-photon large-momentum-transfer atom interferometry scheme for Sr/Yb atoms with application to determining the fine-structure constant [0.0] 我々は、中性原子種の光子反動を1光子光時計遷移で測定する中間スケール原子干渉計を提案する。
Sr と Yb の場合,3m の高さの原子干渉計は現在の技術で最大質量測定精度が$Delta m / m sim 1times 10-11$ であるのに十分である。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 11:52:14 GMT)
A de Finetti theorem for quantum causal structures [0.0] 古典的確率、量子状態、量子チャネルに関する同様の質問は、いわゆる「デ・フィネッティの定理」によって美しく答えられる。
この結果は、不定因数順序や、雑音量子デバイスに適用可能なマルチ時間非マルコフ過程を含む任意の因数構造を持つプロセスに拡張する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 14:00:59 GMT)
A Vocabulary of Board Game Dynamics [0.0] 本稿では,ボードゲーム力学を専門とする語彙について述べる。
私たちは、調査を通じて検証と改善の対象となる一連の動的概念を生成するためにフォーカスグループを使用します。
結果として得られる概念は、分類学的構造を用いて語彙に分類され、これらの概念をより広くより一般的な概念にまとめることができる。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:56:10 GMT)
A Multilingual Perspective on Probing Gender Bias [0.0] ジェンダーバイアスは、性別に基づいて個人を標的とする体系的なネガティブな治療の一形態である。
この論文は、ジェンダーバイアスが言語および言語技術を通してどのように表現されるかというニュアンスについて考察する。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 21:35:21 GMT)
A Big Data Approach to Understand Sub-national Determinants of FDI in Africa [0.0] 本稿では,アフリカ企業におけるFDIの所有に影響を与える地域レベル(サブ国家)特性を定量化するための,テキストマイニングとソーシャルネットワーク分析に基づく新しい手法を提案する。
地域的(準国家的な)構造的特徴と制度的特徴が、外国の所有権を決定する上で重要な役割を担っていることが示唆されている。
論文参考訳(メタデータ) (Fri, 15 Mar 2024 12:12:54 GMT)