Fugu-MT: arxivの論文翻訳(概要)

Imagen 3 [140.2]
本稿では,テキストプロンプトから高品質な画像を生成する潜時拡散モデルであるImagen 3を紹介する。安全と表現に関する問題と、モデルの潜在的な害を最小限にするために使用した手法について議論する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:56:20 GMT)
GT23D-Bench: A Comprehensive General Text-to-3D Generation Benchmark [111.8]
GT23D-Benchは、General Text-to-3D (GT23D)の最初の包括的なベンチマークである我々のデータセットは、各3Dオブジェクトに64ビューの深度マップ、正規マップ、レンダリング画像、粗大なキャプションをアノテートする。本手法は, テクスチャの忠実度, マルチビューの整合性, 幾何学的正当性を考慮した3次元視覚品質と, 多粒度視覚的3次元表現とのテキストアライメントを測定する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:32:08 GMT)
Byte Latent Transformer: Patches Scale Better Than Tokens [101.1]
Byte Latent Transformer (BLT) はバイトを動的サイズのパッチにエンコードする。固定推論コストに対して、BLTはパッチとモデルサイズの両方を同時に拡大することにより、トークン化ベースのモデルよりもはるかに優れたスケーリングを示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:33:32 GMT)
TraceVLA: Visual Trace Prompting Enhances Spatial-Temporal Awareness for Generalist Robotic Policies [95.3]
VLAモデルの行動予測のための時空間認識を容易にするために,視覚的トレースプロンプトを導入する。我々は,これまでに収集した150Kロボット操作トラジェクトリのデータセットに基づいてOpenVLAを微調整し,新しいTraceVLAモデルを開発した。 4B Phi-3-Vision に基づくコンパクトな VLA モデルを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:40:51 GMT)
OP-LoRA: The Blessing of Dimensionality [93.1]
低ランクアダプタは、少数のパラメータしか持たない大型モデルの微調整を可能にする。しばしば最適化の課題を提起するが、収束性は低い。推論コストを増大させることなく、トレーニングを加速する過剰パラメータ化アプローチを導入する。視覚言語タスクの改善、特に画像生成の顕著な向上を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:55:19 GMT)
LongVILA: Scaling Long-Context Visual Language Models for Long Videos [86.3]
LongVILAは、Long-contextビジュアル言語モデルのためのフルスタックソリューションである。 LongVILAは、VILAのビデオフレーム数を8から2048に効率的に拡張し、6,000フレーム(100万枚以上のトークン)のビデオニードル・イン・ア・ヘイスタックで99.8%の精度を達成した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:32:06 GMT)
VibeCheck: Discover and Quantify Qualitative Differences in Large Language Models [82.9]
VibeCheckは、2つの大きな言語モデルを自動的に比較するシステムである。明確に定義され、差別化され、ユーザ整合したモデル(ビーブ)の特性を発見する。 VibeCheckは、ラマは友好的で、面白く、やや物議を醸していると明かす。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:09:12 GMT)
SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians [77.8]
3D Gaussian Splattingは、その効率的なトレーニングとリアルタイムレンダリングで注目を集めている。我々は,協調型コンテキスト認識シーン表現を促進する新しいアプローチであるSuperGSegを紹介する。 SuperGSegは、オープン語彙オブジェクトローカライゼーションとセマンティックセグメンテーションタスクの両方において、以前の作業より優れている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:01:19 GMT)
NeRF-Texture: Synthesizing Neural Radiance Field Textures [77.2]
与えられた多視点画像からテクスチャを捕捉・合成するためのニューラルレージアンス場(NeRF)を用いた新しいテクスチャ合成法を提案する。提案したNeRFテクスチャ表現では、微細な幾何学的詳細を持つシーンをメソ構造テクスチャと基盤形状に分割する。我々は潜伏特徴のパッチマッチングによってNeRFベースのテクスチャを合成できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:41:48 GMT)
A Library for Learning Neural Operators [77.2]
我々は、演算子学習のためのオープンソースのPythonライブラリであるNeuralOperatorを紹介する。ニューラルネットワークは有限次元ユークリッド空間の代わりに関数空間間の写像に一般化される。 PyTorch上に構築されたNeuralOperatorは、ニューラルオペレータモデルのトレーニングとデプロイのためのツールをすべて提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:49:37 GMT)
CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models [74.8]
改良されたストリーミング音声合成モデルCosyVoice 2を提案する。具体的には,音声トークンのコードブック利用を改善するために,有限スカラー量子化を導入する。我々は,様々な合成シナリオをサポートするために,チャンク対応因果フローマッチングモデルを開発した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:59:39 GMT)
Olympus: A Universal Task Router for Computer Vision Tasks [74.1]
Olympusは,マルチモーダル大規模言語モデル(MLLM)を,幅広いコンピュータビジョンタスクを処理可能な統一フレームワークに変換する新しいアプローチである。 Olympusは20のタスクで平均94.75%のルーティング精度を達成し、連鎖したアクションシナリオでは91.82%の精度を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:27:52 GMT)
SOLO: A Single Transformer for Scalable Vision-Language Modeling [74.1]
我々はvisiOn-Language mOdelingのための単一変換器SOLOを提案する。 SOLOのような統一された単一トランスフォーマーアーキテクチャは、LVLMにおけるこれらのスケーラビリティ上の懸念に効果的に対処する。本稿では,オープンソースの7B LVLMであるSOLOの開発のための,最初のオープンソーストレーニングレシピを紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:11:31 GMT)
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications [73.8]
ビジョントランスフォーマー(ViT)は、トークンミキサーの強力なグローバルコンテキスト能力によって、ニューラルネットワークの革命的な進歩を示す。 CAS-ViT: Convolutional Additive Self-attention Vision Transformerを導入し、モバイルアプリケーションにおける効率と性能のバランスを実現する。 ImageNet-1Kのパラメータは12M/21Mで83.0%/84.1%である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:19:24 GMT)
Spatial Annealing for Efficient Few-shot Neural Rendering [73.5]
我々はtextbfSpatial textbf Annealing regularized textbfNeRF (textbfSANeRF) という,正確で効率的な数発のニューラルレンダリング手法を導入する。単に1行のコードを追加することで、SANeRFは、現在の数ショットのニューラルレンダリング方法と比較して、より優れたレンダリング品質とはるかに高速な再構築速度を提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:12:25 GMT)
Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.1]
低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。 RAWMambaと呼ばれる新しいMambaスキャニング機構を提案する。また,Retinex の先行したRetinex Decomposition Module (RDM) も提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:00:36 GMT)
AIpparel: A Large Multimodal Generative Model for Digital Garments [71.1]
縫製パターンの生成と編集のための大規模なマルチモーダルモデルであるAIpparelを紹介する。当社のモデルでは,12万以上のユニークな衣服をカスタマイズした大規模データセット上で,最先端の大規模マルチモーダルモデルを微調整する。本稿では,これらの複雑な縫製パターンを簡潔に符号化し,LLMが効率的に予測できる新しいトークン化手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:15:54 GMT)
AtomThink: A Slow Thinking Framework for Multimodal Mathematical Reasoning [71.0]
AtomThinkは、長い思考の連鎖(CoT)をステップバイステップで構築するフレームワークであり、複雑な推論を行うためのMLLMを導く。 AtomMATHは、長いCoTの大規模マルチモーダルデータセットであり、数学的タスクの原子能力評価指標である。 AtomThinkはベースラインMLLMの性能を大幅に改善し、MathVistaでは50%、MathVerseでは120%の精度向上を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:54:04 GMT)
Coherent 3D Scene Diffusion From a Single RGB Image [68.3]
単一のRGB画像からのコヒーレントな3次元シーン再構成のための拡散に基づく新しい手法を提案する。本手法は,シーン内のすべてのオブジェクトの3次元ポーズとジオメトリを同時に認識する。一つのRGB画像3Dシーン再構成のタスクを条件付き拡散プロセスとしてフレーミングすることにより,本手法は最先端の手法を超越する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:26:45 GMT)
UniMed-CLIP: Towards a Unified Image-Text Pretraining Paradigm for Diverse Medical Imaging Modalities [68.1]
対照的な学習によって訓練された視覚言語モデル(VLM)は、自然画像タスクにおいて顕著な成功を収めた。 UniMedは530万以上の画像テキストペアからなる、大規模でオープンソースのマルチモーダル医療データセットである。我々は、6つのモダリティのための統一VLMであるUniMed-CLIPを訓練し、ゼロショット評価において顕著な利益を得た。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:40 GMT)
VisionArena: 230K Real World User-VLM Conversations with Preference Labels [68.1]
VisionArenaは、ユーザと視覚言語モデル(VLM)間の230万の現実世界会話のデータセット私たちのデータセットは73Kのユニークなユーザ、45のVLM、138の言語で構成されています。キャプションやユーモアのようなオープンなタスクは非常にスタイルに依存しており、現在のVLMは空間的推論や計画タスクに苦労している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:12:23 GMT)
SafetyDPO: Scalable Safety Alignment for Text-to-Image Generation [68.1]
テキスト・ツー・イメージ(T2I)モデルは広く普及しているが、その限られた安全ガードレールはエンドユーザを有害なコンテンツに晒し、モデル誤用を許容する可能性がある。現在の安全対策はテキストベースのフィルタリングや概念除去戦略に限られており、モデルの生成能力からわずかに概念を除去することができる。直接選好最適化(DPO)によるT2Iモデルの安全アライメント手法であるSafetyDPOを導入する。我々は、ローランク適応(LoRA)行列の形で、特定の安全関連から生成プロセスを導くことができる安全専門家を訓練する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:52 GMT)
Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.9]
インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL) Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:40:10 GMT)
GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction [67.8]
3次元占有予測は、周囲の包括的認識のため、自動運転にとって重要である。本研究では、シーンの進化を知覚に利用するための世界モデルに基づくフレームワークを提案する。我々のフレームワークは、追加の計算を導入することなく、mIoUの単一フレームの性能を2%以上向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:54 GMT)
SUMI-IFL: An Information-Theoretic Framework for Image Forgery Localization with Sufficiency and Minimality Constraints [66.9]
イメージフォージェリーローカライゼーション (IFL) は, 改ざん画像誤用を防止し, 社会安全を守るための重要な技術である。本稿では,情報理論IFL フレームワーク SUMI-IFL について紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:08:02 GMT)
LMAgent: A Large-scale Multimodal Agents Society for Multi-user Simulation [66.5]
大規模言語モデル(LLM)ベースのAIエージェントは、人間のような知性を達成するために、大きな進歩を遂げた。 LMAgentは,マルチモーダル LLM に基づく大規模かつマルチモーダルなエージェント社会である。 LMAgentでは、友人とチャットする以外に、エージェントは自動で商品を閲覧、購入、レビューしたり、ライブストリーミングのeコマースを行うこともできる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:33:38 GMT)
Apollo: An Exploration of Video Understanding in Large Multimodal Models [65.1]
本稿では,大規模マルチモーダルモデルにおいて映像理解を効果的に推進する要因を明らかにする研究について述べる。われわれのモデルは、1時間の動画を効率よく知覚でき、Apollo-3Bは、LongVideoBenchの55.1で、既存の7ドルBのモデルよりも優れている。 Apollo-7B は 7B LMM に対して MLVU では 70.9 、 Video-MME では 63.3 である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:53:24 GMT)
Gumbel Counterfactual Generation From Language Models [64.6]
対実的推論が介入と概念的に異なることを示す。そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。提案手法は,従来の介入手法が望ましくない副作用を有意に生み出しているのに対し,本手法は有意義な反事実を生じさせることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:30:41 GMT)
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving [63.9]
DriveMMは、画像やマルチビュービデオなどの多様なデータ入力を処理するために設計された、大規模なマルチモーダルモデルである。我々は、6つの公開ベンチマークで評価を行い、未確認のデータセットでゼロショット転送を行い、DriveMMはすべてのタスクで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:13:44 GMT)
BiCert: A Bilinear Mixed Integer Programming Formulation for Precise Certified Bounds Against Data Poisoning Attacks [62.9]
データ中毒攻撃は、現代のAIシステムにとって最大の脅威の1つだ。データ中毒攻撃は、現代のAIシステムにとって最大の脅威の1つだ。データ中毒攻撃は、現代のAIシステムにとって最大の脅威の1つだ。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:56:39 GMT)
GATEAU: Selecting Influential Sample for Long Context Alignment [62.9]
GATEAUは、長距離依存関係に富む影響力のあるサンプルを同定する。実験結果から, GATEAUは有効に有効なサンプルを同定し, これらのサンプルに基づいてトレーニングしたモデルにより, より優れた指示追従能力と長文理解能力を示すことが示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:16:57 GMT)
A Geometry-Aware Message Passing Neural Network for Modeling Aerodynamics over Airfoils [61.6]
空気力学は航空宇宙工学の重要な問題であり、しばしば翼のような固体物と相互作用する流れを伴う。本稿では, 固体物体上の非圧縮性流れのモデル化について考察する。ジオメトリを効果的に組み込むため,メッシュ表現に翼形状を効率よく,かつ効率的に統合するメッセージパッシング方式を提案する。これらの設計選択は、純粋にデータ駆動の機械学習フレームワークであるGeoMPNNにつながり、NeurIPS 2024 ML4CFDコンペティションで最優秀学生賞を受賞し、総合で4位となった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:40:02 GMT)
SnapGen-V: Generating a Five-Second Video within Five Seconds on a Mobile Device [61.4]
本稿では,大規模ビデオ拡散モデルのパワーをエッジユーザーにもたらすための包括的加速フレームワークを提案する。我々のモデルは0.6Bのパラメータしか持たないため、iPhone 16 PMで5秒以内に5秒のビデオを生成することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:56 GMT)
CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.2]
脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:27:54 GMT)
SCBench: A KV Cache-Centric Analysis of Long-Context Methods [61.0]
KVキャッシュ中心の視点から長文の手法を評価するベンチマークであるSCBenchを紹介する。我々は、Gated Linear RNNsやMamba-Attention Hybridsを含む8つのカテゴリの長期コンテキストソリューションについて、広範なKVキャッシュ中心の分析を行う。本研究は,O(n)メモリとサブO(n2)プリフィルによるスパース符号化が堅牢に動作する一方で,サブO(n)メモリ手法がマルチターンシナリオに悩まされていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:59:52 GMT)
COMET: Benchmark for Comprehensive Biological Multi-omics Evaluation Tasks and Language Models [56.8]
COMETは、シングルオミクス、クロスオミクス、マルチオミクスタスクのモデルを評価することを目的としている。まず、我々は、DNA、RNA、タンパク質の主要な構造的および機能的側面をカバーする、下流タスクとデータセットの多様なコレクションをキュレートし、開発する。そこで我々は,DNA,RNA,タンパク質の既存の基礎言語モデルと,新たに提案されたマルチオミクス法を評価する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:42:00 GMT)
The Art of Deception: Color Visual Illusions and Diffusion Models [55.8]
近年の研究では、人工ニューラルネットワーク(ANN)が視覚錯覚によっても騙せることが示されている。拡散モデルにおいて視覚錯覚がどのように符号化されているかを示す。また,テキスト・ツー・イメージ拡散モデルを用いて,現実的な画像に新たな視覚錯覚を生成する方法を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:07:08 GMT)
Why Does Dropping Edges Usually Outperform Adding Edges in Graph Contrastive Learning? [54.4]
グラフがネットワークにどのように適合するかを定量化するために、新しいメトリック、すなわちエラー通過率(EPR)を導入する。理論的な結論に触発されて,エッジの追加とエッジドロップを併用した新しいGCLアルゴリズムを提案する。具体的には、EPRから得られる重みに応じてエッジを追加・ドロップすることで、ビューを生成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:12:40 GMT)
RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning [53.8]
本稿では,RLDG(Reinforcement Learning Distilled Generalists)を提案する。我々は、RL生成データで訓練されたジェネラリストポリシーが、人間の実演で訓練された者より一貫して優れていたことを実証する。以上の結果から,タスク固有RLと一般政策蒸留を組み合わせることで,より有能で効率的なロボット操作システムの開発が期待できる可能性が示唆された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:57:55 GMT)
Dynamic Try-On: Taming Video Virtual Try-on with Dynamic Attention Mechanism [52.9]
ビデオの試用は、その膨大な現実世界の潜在能力にとって有望な分野だ。これまでの研究は主に、製品服のイメージを単純な人間のポーズでビデオに移すことに重点を置いてきた。本稿では,Diffusion Transformer(DiT)に基づく新しいビデオトライオンフレームワークであるDynamic Try-Onを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:20:53 GMT)
Structural Entropy Guided Probabilistic Coding [52.0]
構造エントロピー誘導型確率的符号化モデルSEPCを提案する。我々は、構造エントロピー正規化損失を提案することにより、潜在変数間の関係を最適化に組み込む。分類タスクと回帰タスクの両方を含む12の自然言語理解タスクに対する実験結果は、SEPCの優れた性能を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:23:58 GMT)
Large Action Models: From Inception to Implementation [51.8]
大規模アクションモデル(LAM)は動的環境内でのアクション生成と実行のために設計されている。 LAMは、AIを受動的言語理解からアクティブなタスク完了に変換する可能性を秘めている。創発から展開まで,LAMを体系的に開発するための総合的なフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:19:56 GMT)
Guidance Not Obstruction: A Conjugate Consistent Enhanced Strategy for Domain Generalization [50.0]
ドメイン内のクラス間での差別的一般化の獲得が不可欠である。分布の整合性を求めるのとは対照的に、ドメイン関係の階級間差別を保護しようと努力する。我々は,新たな分布レベルのUniversum戦略を用いて,追加的なドメイン関係のクラス条件分布を生成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:25:16 GMT)
TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes [49.4]
我々は,交通監視カメラを協調的な認識で位置決めする問題に取り組む。我々は,新しいニューラルネットワークであるTrafficLocを導入し,交通カメラを3次元参照マップ内にローカライズする。実験の結果,我々のTrafficLocは,最先端のイメージ・ツー・ポイント・クラウド登録方式よりも位置決め精度が向上していることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:42:53 GMT)
AdvPrefix: An Objective for Nuanced LLM Jailbreaks [49.0]
AdvPrefixは、最適化が容易でありながら、モデルの振舞いをより微妙に制御できる新しい目的である。我々の目的はモデル依存プレフィックスを利用しており、高いプリフィル攻撃の成功率と低い負のログ類似度という2つの基準に基づいて自動的に選択される。 AdvPrefixは、既存のjailbreak攻撃にシームレスに統合して、パフォーマンスを無償で改善することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:00:57 GMT)
Physical Informed Driving World Model [47.0]
DrivePhysicaは、本質的な物理原理に準拠したリアルなドライビングビデオを生成するために設計された革新的なモデルだ。我々は,Nuscenesデータセット上での3.96 FIDと38.06 FVDの駆動ビデオ生成品質と下流認識タスクにおける最先端性能を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:05:34 GMT)
Topological nature of edge states for one-dimensional systems without symmetry protection [46.9]
我々は,一次元近傍(単位セル間)のエッジ状態の数を正確に予測する巻数不変量を数値的に検証し,解析的に証明する。我々の不変量はユニタリ変換と類似変換の下で不変である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:44:54 GMT)
SUGAR: Subject-Driven Video Customization in a Zero-Shot Manner [46.8]
我々は、主観的動画カスタマイズのためのゼロショット方式SUGARを提案する。入力画像が与えられた場合、SUGARは被写体のビデオを生成し、任意の視覚属性で生成を調整できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:01:51 GMT)
Balancing Confidentiality and Transparency for Blockchain-based Process-Aware Information Systems [46.4]
機密性と透明性の両立を目的とした,ブロックチェーンベースのPAISアーキテクチャを提案する。スマートコントラクトは公開インタラクションを制定、強制、保存し、属性ベースの暗号化技術は機密情報へのアクセス許可を指定するために採用されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:55:31 GMT)
The Language of Motion: Unifying Verbal and Non-verbal Language of 3D Human Motion [46.0]
本稿では,多モーダル言語モデルを用いて,言語と非言語を統一する新しいフレームワークを提案する。提案手法は,音声合成における最先端性能を実現する。我々は、現実世界の応用には、人間の動きの言語と非言語を統一することが不可欠であると信じている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:33:48 GMT)
Controlling dynamical systems into unseen target states using machine learning [45.8]
我々は、複雑な力学系を以前に見つからなかったターゲット状態に制御するための、モデルフリーでデータ駆動の方法論を提案する。提案手法は、観測されていないパラメータ状態におけるシステムの挙動を正確に予測し、任意の目標状態への遷移を制御できるようにする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:21:56 GMT)
TrustUQA: A Trustful Framework for Unified Structured Data Question Answering [45.5]
信頼性の高いQAフレームワークであるTrustUQAを提案する。我々はTrustUQAを3種類の構造化データをカバーする5つのベンチマークで評価した。 1つのデータタイプに特有のベースラインと比較して、データセットの2つで最先端を達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:15:46 GMT)
Efficient Continual Pre-training of LLMs for Low-resource Languages [45.4]
大規模コーパスからテキストのサブセットを選択するアルゴリズムを開発した。さらなる改良を求めて,LLM語彙に含まれるトークンを選択する新しいアルゴリズムを設計する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:13:35 GMT)
Effective dynamics from minimising dissipation [45.3]
同じ物理系は観測の規模によって異なる実効理論で記述できることが知られている。本研究では、量子系の大規模力学を時間的に離散的に発展させるユニタリを見つけるための処方則を定式化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:39:21 GMT)
Detecting LLM Hallucination Through Layer-wise Information Deficiency: Analysis of Unanswerable Questions and Ambiguous Prompts [45.0]
大規模言語モデル(LLM)は、自信を持って不正確な応答を頻繁に生成する。本稿では,情報フローの系統的解析によるモデル幻覚の検出手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:14:49 GMT)
Dissipation-induced Quantum Homogenization for Temporal Information Processing [45.0]
本稿では,貯水池コンピューティングの代替プラットフォームとして,乱れた量子ホモジェナイザーを提案する。その結果、核磁気共鳴アンサンブルまたはフォトニック系として物理的に実装可能な量子均質化プロトコルが、貯水池コンピュータとして機能する可能性が示唆された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:05:41 GMT)
Simple Guidance Mechanisms for Discrete Diffusion Models [44.4]
我々は、均一ノイズを利用した新しい拡散モデルを開発し、その出力を連続的に編集できるため、より誘導可能である。我々はこれらのモデルの品質を、最先端の性能をもたらす新しい連続時間変動下界で改善する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:08:30 GMT)
BrushEdit: All-In-One Image Inpainting and Editing [44.0]
BrushEditは、インペイントベースの命令誘導画像編集パラダイムである。本研究では,MLLMとデュアルブランチ画像の描画モデルを統合することで,自由形式の命令編集を可能にするシステムを提案する。本フレームワークは,MLLMとインパインティングモデルを効果的に組み合わせ,7つの指標で優れた性能を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:58:06 GMT)
Going Beyond Feature Similarity: Effective Dataset distillation based on Class-aware Conditional Mutual Information [43.4]
本稿では,データセットのクラス認識複雑性を評価するために,条件付き相互情報(CMI)を導入する。合成データセットのクラス認識複雑性を制約しながら,蒸留損失を最小限に抑える。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:10:47 GMT)
LinGen: Towards High-Resolution Minute-Length Text-to-Video Generation with Linear Computational Complexity [43.3]
本稿では,ピクセル数に対してコストが線形にスケールするリニア・コンプレシティ・テキスト・ビデオ生成フレームワークを提案する。初めてLinGenは、品質を損なうことなく、単一のGPU上で高解像度の分長ビデオ生成を可能にする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:55:10 GMT)
ROUTE: Robust Multitask Tuning and Collaboration for Text-to-SQL [42.0]
我々は,オープンソースのText2用LLMの包括的機能を改善するために,RObust mUltitask Tuning and collaboration mEthod (ROUTE)を提案する。提案手法は,tosql生成に関する各種合成トレーニングデータを用いて,マルチタスク制御ファインチューニング(SFT)から始める。また,マルチタスク・コラボレーション・プロンプティング(MCP)戦略を導入し,スクル生成時の幻覚を低減する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:41:18 GMT)
Optimal Multitask Linear Regression and Contextual Bandits under Sparse Heterogeneity [41.8]
マルチタスク学習手法は、データセット間の共通性を活用することにより効率を向上する。マルチタスク線形回帰と文脈帯域幅をスパースヘテロジニティ下で検討した。提案手法は,多くの下界を提供することにより,最小限の最適化が可能であることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:38:11 GMT)
Hybrid Preference Optimization for Alignment: Provably Faster Convergence Rates by Combining Offline Preferences with Online Exploration [41.4]
大規模言語モデルと人間の嗜好を整合させる新しい手法を提案する。アクティブなプライオリティクエリコストとリアルタイム実装オーバーヘッドのため、オンライン探索はコストがかかる可能性がある。優先フィードバックを持つハイブリッドRLHFに対して、証明可能な理論境界を初めて与える。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:42:24 GMT)
V2PE: Improving Multimodal Long-Context Capability of Vision-Language Models with Variable Visual Position Encoding [40.8]
VLM(Vision-Language Models)は、様々なマルチモーダルタスクを扱う上で有望な能力を示しているが、長いコンテキストシナリオでは苦労している。本稿では,視覚トークンに可変インクリメントを取り入れた新しい位置符号化手法を提案し,長いマルチモーダルシーケンスのより効率的な管理を実現する。細調整されたモデルでは、標準タスクと長文マルチモーダルタスクの両方で高い性能が得られることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:58:33 GMT)
Real-time Identity Defenses against Malicious Personalization of Diffusion Models [39.9]
本研究では,1つのフォワードパスを通じて対向摂動を生成するニューラルネットワークであるReal-time Identity Defender (RID)を紹介する。 RIDは前例のない効率を実現し、防御時間は1つのGPUでは0.12秒、標準のIntel i9 CPUでは1.1秒である。解析の結果,RIDの摂動は自然騒音とは異なる特性を示しながら,従来の防御効果を模倣していることが明らかとなった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:27:08 GMT)
Mixture of Online and Offline Experts for Non-stationary Time Series [39.4]
非定常時系列に対するMOOE(Mixture of Online and Offline Experts)を提案する。 MOOEはオフライン間隔から静的オフラインの専門家を学び、現在のオンライン間隔で動的オンラインエキスパートを維持する。具体的には、アルゴリズムの有効性を証明するために、理論解析、パラメータ収束の導出、後悔境界、一般化誤差境界に焦点をあてる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:38:34 GMT)
DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding [39.1]
We present DeepSeek-VL2, a Advanced series of large Mixture-of-Experts (MoE) Vision-Language Models。ビジョンコンポーネントには、アスペクト比の異なる高解像度画像を処理するために設計された動的タイリングビジョン符号化戦略が組み込まれている。言語コンポーネントについては、Multi-head Latent AttentionメカニズムでDeepSeekMoEモデルを活用します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:37:48 GMT)
Exact gradients for linear optics with single photons [38.7]
一般化パラメータシフト則を用いて位相シフト器に関する量子回路の勾配解析式を導出する。そこで本研究では,表現のシフト数を減らし,全体の複雑さを低減できる2つの戦略を提案する。数値的に、この一般化されたパラメータシフト規則は、代替手法よりも少ないパラメータ更新ステップでコスト関数の最小値に収束できることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:31:44 GMT)
WHAT-IF: Exploring Branching Narratives by Meta-Prompting Large Language Models [38.7]
WHAT-IFは、ゼロショットメタプロンプティングを使用して、事前に書かれたストーリーから分岐物語を作成するシステムである。このシステムはコヒーレントでよく構造化された代替ストーリーラインを生成する。ブランチプロットツリーをグラフに格納し、ストーリーの追跡と最終的なIFシステムの構造の促進と維持を支援する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:48:54 GMT)
Accurate and Scalable Estimation of Epistemic Uncertainty for Graph Neural Networks [38.2]
固有GNNの不確実性推定を改善するための新しいトレーニングフレームワークを提案する。我々のフレームワークは、新しいグラフアンカー戦略を通じて、データをグラフデータに中心付けるという原則に適応する。本研究は,GNNの不確実性推定に関する知見を提供し,信頼度推定におけるG-$Delta$UQの有用性を実証する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:32:21 GMT)
Object-Focused Data Selection for Dense Prediction Tasks [38.1]
本稿では、制約付きアノテーション予算の下でラベル付けのための画像の代表的なサブセットを選択することの課題について考察する。我々は,オブジェクトレベルの表現を活用して,選択した画像サブセットがターゲットクラスを意味的にカバーすることを保証するオブジェクト指向データ選択(OFDS)を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:47:05 GMT)
MERaLiON-AudioLLM: Technical Report [37.9]
シンガポールの多文化景観に合わせた最初の音声テキストモデルであるMERaLiON-AudioLLMを紹介する。 MERaLiON-AudioLLMは、局所的なアクセントや方言の多様な言語的ニュアンスに対処するために、高度な音声処理とテキスト処理を統合している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:15:05 GMT)
On the Power of Adaptive Weighted Aggregation in Heterogeneous Federated Learning and Beyond [37.9]
フェデレーション平均化(FedAvg)は、フェデレーション学習(FL)において最も基本的なアルゴリズムである最近の実証実験の結果、FedAvgは多くの実世界の異種タスクでうまく機能することが示された。我々はFedAWAREと呼ばれるシンプルで効果的なFedAvg変種を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:34:56 GMT)
Towards Unified Benchmark and Models for Multi-Modal Perceptual Metrics [37.9]
CLIPや大規模マルチモーダルモデル(LMM)などの汎用視覚言語モデルは、ゼロショット知覚メトリクスとして適用することができる。提案するUniSim-Benchは、7つのマルチモーダルな知覚的類似性タスクと合計25のデータセットを包含するベンチマークである。我々の評価では、汎用モデルは平均的に合理的に機能するが、個々のタスクの特化モデルに遅れが生じることが多い。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:38:09 GMT)
Integrative Analysis of Financial Market Sentiment Using CNN and GRU for Risk Prediction and Alert Systems [37.7]
本稿では,CNN(Convolutional Neural Networks)とGated Recurrent Units(GRU)を統合することで,株式市場の感情を詳細に検証する。 CNNのロバストな特徴抽出能力は、ネットワークテキストデータの事前処理と分析に利用され、局所的な特徴やパターンを識別する。抽出した特徴系列はGRUモデルに入力され、時間とともに感情状態が進行し、将来の市場の感情やリスクに潜在的に影響することを理解する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:17:23 GMT)
ASLoRA: Adaptive Sharing Low-Rank Adaptation Across Layers [37.7]
ASLoRAはグローバル共有と部分適応共有を組み合わせた多層パラメータ共有戦略である。我々は様々なNLPタスクの実験を行い、パラメータの25%未満を使用しながら、ASLoRAがLoRAより優れていることを示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:32:13 GMT)
Probabilistic Inverse Cameras: Image to 3D via Multiview Geometry [37.5]
2次元画像からマルチビュー3次元への階層的確率的アプローチを導入する。拡散 "プライア" は、未知の3D幾何学をモデル化し、拡散 "デコーダ" を条件として、対象の新たなビューを生成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:46:46 GMT)
Embedding-Informed Adaptive Retrieval-Augmented Generation of Large Language Models [37.0]
Retrieval-augmented large language model (LLMs) は、様々なNLPタスクにおいて非常に有能である。このことに動機づけられた、適応検索拡張生成(ARAG)研究は、クエリによって要求される知識が LLM に欠如している場合にのみ検索する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:45:14 GMT)
Navigating the Future of Federated Recommendation Systems with Foundation Models [36.9]
近年,FRS(Federated Recommendation Systems)として知られるFLとレコメンデーションシステムの統合が注目されている。しかし、FLのプライバシー要件とRSの典型的なデータ空間の問題により、FRSはデータの不均一性や不足といった固有の制限に直面している。本研究では、ファンデーションモデル(FM)を用いたFRSの総合的なレビューを行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:41:02 GMT)
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts [36.0]
DEFAMEは、オープンドメイン、テキストイメージクレーム検証のためのゼロショットMLLMパイプラインである。 DEFAMEは、ファクトチェックの問題を6段階のプロセスとして表している。画像によるクレームや、視覚的証拠を必要とするクレームを含む、事実チェックのエンドツーエンドの問題を解決する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:11:18 GMT)
$\nabla^2$DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials [35.9]
この研究は、nablaDFTをベースにした$nabla2$DFTと呼ばれる新しいデータセットとベンチマークを提示している。分子構造の2倍、コンフォーメーションの3倍、新しいデータタイプとタスク、最先端のモデルを含んでいる。 $nabla2$DFTは、大量の薬物様分子の緩和軌道を含む最初のデータセットである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:32:48 GMT)
AgentMixer: Multi-Agent Correlated Policy Factorization [35.7]
AgentMixerは、個々の部分的に監視可能なポリシーを、非線形に完全に監視可能な共同ポリシーに結合する。 AgentMixerは、Multi-Agent MuJoCo、SMAC-v2、Matrix Game、Predator-Preyベンチマークにおける最先端のメソッドより優れているか、あるいは一致している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:12:33 GMT)
Can LLMs Convert Graphs to Text-Attributed Graphs? [35.5]
本研究では,大規模言語モデル(LLM)を活用し,既存のグラフをテキスト対応グラフに自動的に変換するTopology-Aware Node description Synthesis (TANS)を提案する。我々は,テキストリッチ,テキストリミテッド,テキストフリーのグラフ上でTANSを評価し,単一のGNNが多様なグラフをまたいで操作できることを実証した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:32:59 GMT)
FM2S: Self-Supervised Fluorescence Microscopy Denoising With Single Noisy Image [35.3]
効率的な自己教師型蛍光顕微鏡(FM2S)を提案する。データ拡張のための適応的グローバルローカルノイズ付加モジュールを提案する。次に、2層ニューラルネットワークをトレーニングし、ノイズ付加画像からフィルタ画像へのマッピングを学習する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:45:25 GMT)
Building a Multi-modal Spatiotemporal Expert for Zero-shot Action Recognition with CLIP [34.9]
マルチテンポラルダイナミクスを理解するための新しいCLIフレームワークを提案する。視覚面では,効率的なダイナミック・クロスショット・アテンションを提案する。セマンティック側では、アクション知識グラフを構築してテキスト拡張を行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:30:52 GMT)
B-VLLM: A Vision Large Language Model with Balanced Spatio-Temporal Tokens [34.8]
視覚エンコーダと統合された大規模言語モデル(VLLM)は、視覚理解において有望な性能を示している。 Balanced Vision-VLLM(B-VLLM):タスクに関連する時間的手がかりを効果的に活用することを目的とした新しいVLLMフレームワーク。 B-VLLMは、映像理解におけるフレーム数と視覚トークン数のバランスをとるのに有効であり、様々な映像理解において優れた性能が得られる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:13:40 GMT)
SocialEyes: Scaling mobile eye-tracking to multi-person social settings [34.8]
我々は、複数の移動眼球追跡装置から収集した同期データを、集合的な視聴体験中にストリーミングし、記録し、分析するシステムを開発した。我々は,2つの公開イベント(N=60)毎に,30人の同時視聴者によるライブコンサートと映画上映でシステムをテストした。我々の新しい分析指標と可視化は、協調行動と社会的相互作用を理解するための集合的視線追跡データの可能性を示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:15:29 GMT)
Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization [34.8]
本稿では, 既存の拡散式蒸留法に対する新しい枠組みを提案し, 生成ではなく拡散モデルを用いて選択する。提案手法は,入力画像とテキストプロンプトに基づいて拡散モデルから発生するノイズを予測し,各ペアの損失を算出する。この合理化フレームワークは単一段階の蒸留プロセスを実現するとともに,我々の手法が様々なメトリクスにわたって最先端の手法より優れていることを示す広範な実験を行った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:34:46 GMT)
RETQA: A Large-Scale Open-Domain Tabular Question Answering Dataset for Real Estate Sector [34.8]
RETQAは、Real Estateのための最初の大規模オープンドメイン中国語タブラル質問回答データセットである。不動産情報、不動産会社財務情報、土地競売情報という3つの主要領域内の16のサブフィールドにまたがる4,932のテーブルと20,762の質問応答ペアで構成されている。本稿では,大規模言語モデルと音声言語理解タスクを統合したSLUTQAフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:45:14 GMT)
Model-diff: A Tool for Comparative Study of Language Models in the Input Space [34.7]
本稿では,ブルートフォース列挙が実現不可能な大入力空間を考慮した新しいモデル比較分析手法を提案する。実験により、大規模な入力空間におけるLM間の定量的予測の違いが初めて明らかとなり、モデルプラジャリズムのような応用のためのモデル解析が促進される可能性がある。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:06:25 GMT)
Inferentially-Private Private Information [34.5]
情報開示は、公開情報がプライベート情報と相関している場合、プライバシーを侵害する可能性がある。本稿では,ベイズ敵対者が得る推論パワーを,解放された信号を観測することで,プライバシー漏洩を計測する推論プライバシの概念について考察する。我々のゴールは、解放された信号の情報を最大限に活用する、秘密の私的情報構造を考案することである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:25:58 GMT)
GoHD: Gaze-oriented and Highly Disentangled Portrait Animation with Rhythmic Poses and Realistic Expression [33.9]
GoHDは、非常にリアルで表現力があり、コントロール可能なポートレートビデオを作成するために設計されたフレームワークである。潜時ナビゲーションを利用したアニメーションモジュールを導入し、目に見えない入力スタイルの一般化能力を向上させる。コンホメータ構造付き条件拡散モデルは、韻律を意識した頭部ポーズを保証するように設計されている。 2段階のトレーニング戦略は、より時間依存的ではあるが、音声関連の少ない動きの発生から、頻繁でフレームワイドな唇運動蒸留を分離するために考案された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:11:13 GMT)
Identification of highly-forbidden optical transitions in highly charged ions [33.8]
最近、Ar$13+$で最初の高電荷イオン(HCI)ベースの光時計がデモされた。本稿では、線形ポールトラップに制限されたHCIにおけるサブヘルツクロック遷移に対する量子論理に着想を得た実験的探索手法について検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:50:50 GMT)
Hesitation and Tolerance in Recommender Systems [33.8]
ためらいは広く、ユーザエクスペリエンスに大きな影響を与えています。ユーザーが興味のないコンテンツにより多くの時間を費やすと、ネガティブな感情が生まれます。我々は,寛容行動を示す信号を特定し,電子商取引と短ビデオプラットフォームの両方からのデータセットを分析した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:14:10 GMT)
Visual Object Tracking across Diverse Data Modalities: A Review [33.0]
ビジュアルオブジェクト追跡(VOT)はコンピュータビジョンにおいて魅力的な重要な研究分野である。まず, RGB, 熱赤外, 点雲追跡の3種類の主要な単一モードVOTについて検討した。次に,RGB-Depth,RGB-Thermal,RGB-LiDAR,RGB-Languageの4種類のマルチモーダルVOTを要約する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:25:18 GMT)
A Statistical Analysis for Supervised Deep Learning with Exponential Families for Intrinsically Low-dimensional Data [33.0]
本研究では,指数関数系に従って説明変数が分散された場合の教師付き深層学習について考察する。説明変数の上界密度を仮定すると、収束速度は $tildemathcalOleft(dfrac2lfloorbetarfloor(beta + d)2beta + dn-frac22beta + dn-frac22beta + dn-frac22beta + dn-frac22beta と特徴づけられる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:15:17 GMT)
GAOKAO-Eval: Does high scores truly reflect strong capabilities in LLMs? [33.0]
大規模言語モデル(LLM)は人為的なベンチマークを用いて一般的に評価される。 GAokaO-Evalは、ハイスコアが人間の手動能力を本当に反映していないことを明らかにした。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:38:10 GMT)
A Universal Degradation-based Bridging Technique for Domain Adaptive Semantic Segmentation [32.1]
DiDAは拡散前進過程として形式化された普遍的な劣化に基づくブリッジ技術である。プラグアンドプレイソリューションとして、DiDAは様々な劣化操作をサポートし、既存のUDAメソッドとシームレスに統合する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:35:27 GMT)
Estimating Conditional Average Treatment Effects via Sufficient Representation Learning [31.8]
本稿では,その特徴を十分に表現するためにtextbfCrossNet という新しいニューラルネットワークアプローチを提案し,条件平均処理効果(CATE)を推定する。数値シミュレーションと実験により,本手法が競合手法より優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:21:58 GMT)
SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation [31.8]
既存の手法の限界に対処する新しいテキスト誘導ベクトルグラフィックス合成法を提案する。本稿では,階層型イメージベクタライゼーション(HIVE)フレームワークについて紹介する。また、SVGの多様性を向上させるために、ベクトル化粒子を用いたスコア蒸留(VPSD)手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:40:57 GMT)
TIV-Diffusion: Towards Object-Centric Movement for Text-driven Image to Video Generation [31.4]
テキスト駆動映像生成(TI2V)は、第1フレームと対応するテキスト記述が与えられた制御可能なビデオを生成することを目的としている。本稿では,オブジェクト中心のテキスト・ビジュアルアライメントを通じて,TIV-Diffusionと呼ばれる新しい拡散型TI2Vフレームワークを提案する。我々のTIV-Diffusionは、既存のTI2V法と比較して最先端の高品質ビデオ生成を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:52:13 GMT)
Citation Amnesia: On The Recency Bias of NLP and Other Academic Fields [30.6]
本研究は, 43年間にわたる20分野にわたる研究成果を引用する傾向について検討した(1980-2023)。我々はこの減少を「引用年齢不況」と呼び、経済学者が経済活動の減少期間を定義する方法に類似している。以上の結果から,近年の著作の引用は出版率の上昇によるものではないことが示唆された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:50:18 GMT)
Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation [29.9]
視覚的モビリティ学習のためのスコア・アンド・ディストリビューション・マッチング・ポリシー(SDM Policy)を提案する。 SDMポリシーは拡散ベースのポリシーを2段階最適化プロセスを通じて単一ステップジェネレータに変換する。最先端のアクション品質を持ちながら、6倍の推論スピードアップを達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:44:16 GMT)
A Comprehensive Framework for Analyzing the Convergence of Adam: Bridging the Gap with SGD [28.9]
本稿では,Adamの収束特性を解析するための,新しい包括的枠組みを提案する。我々は、アダムが漸近的でない複雑性サンプルを勾配降下の値と類似して得ることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:58:52 GMT)
Can Students Beyond The Teacher? Distilling Knowledge from Teacher's Bias [28.4]
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達し、その性能を向上させる技術である。現在のKDフレームワークは、学生モデルを誤解させる正しい知識と間違った知識の両方を送信します。本稿では,バイアスを補正し,学生モデルの性能を大幅に向上させる新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:40:20 GMT)
CSL-L2M: Controllable Song-Level Lyric-to-Melody Generation Based on Conditional Transformer with Fine-Grained Lyric and Musical Controls [28.1]
CSL-L2Mは、インアテンショントランスフォーマーデコーダに基づく、制御可能な歌声レベル・歌詞・メロディ生成法である。 REMI-Alignedは、歌詞と旋律の間の厳格な音節と文レベルのアライメントを含む新しい音楽表現である。事前学習したVQ-VAEから抽出した人間のラベル付き音楽タグ、文レベルの統計的音楽属性、学習された音楽特徴について紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:05:53 GMT)
A Survey of Mamba [27.9]
近年,基礎モデル構築の代替手段として,Mambaという新しいアーキテクチャが登場している。本研究では,マンバモデルの発展,多様なデータにマンバを適応させる技術,およびマンバが優れている応用について検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:16:06 GMT)
Building Better: Avoiding Pitfalls in Developing Language Resources when Data is Scarce [27.9]
与えられた言語のデータは、トークンの集まり以上のものと見なすべきである。優れたデータ収集とラベル付けのプラクティスは、より人間中心で社会的に意識した技術を構築する上で鍵となる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:56:43 GMT)
KAGNNs: Kolmogorov-Arnold Networks meet Graph Learning [27.6]
グラフニューラルネットワーク(GNN)は,ノードとグラフ表現を学習するためのデファクトツールとなっている。本研究では,グラフ学習タスクにおけるKAN(Kolmogorov-Arnold Networks)の性能とGNNの性能を比較する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:34:22 GMT)
EVLM: Self-Reflective Multimodal Reasoning for Cross-Dimensional Visual Editing [27.6]
EVLM (Editing Vision-Language Model) は、参照視覚とともに曖昧な指示を解釈するように設計されている。 EVLMはバイナリラベルを必要とせずに主観的な編集の好みをキャプチャする。画像、ビデオ、3D、および4D編集タスクにわたる実験は、EVLMが一貫性のある高品質な命令を生成することを示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:15:01 GMT)
SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution [27.3]
我々は、堅牢でトレーニング不要な透かしフレームワークであるSuperMarkを提案する。 SuperMarkは既存の手法を使って初期ガウスノイズに透かしを埋め込む。次に、トレーニング済みの超解像モデルを適用して、透かしのノイズを消音し、最終的な透かしの画像を生成する。抽出には、透かし画像がDDIM変換により初期透かしノイズに逆戻りされ、埋め込み透かしが抽出される。実験により、SuperMarkは既存のメソッドに匹敵する忠実性を達成し、ロバスト性を大幅に改善した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:20:59 GMT)
Prompt2Perturb (P2P): Text-Guided Diffusion-Based Adversarial Attacks on Breast Ultrasound Images [27.0]
Prompt2Perturbは,テキスト命令によって駆動される新たな言語誘導攻撃法である。本手法は, 3つの乳房超音波データセットにおいて, 最先端の攻撃技術より優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:56:12 GMT)
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with Smartwatches [26.6]
スマートウォッチを利用したハンドウォッシング手順評価のためのウェアラブルソリューションであるUWashを提案する。我々は,ハンドウォッシング評価のタスクを,コンピュータビジョンと同様のアクションセグメンテーション問題とする。 51名の被験者による実験では、手洗いジェスチャー認識におけるUWash 92.27%の精度が示されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:08:47 GMT)
EvalGIM: A Library for Evaluating Generative Image Models [26.6]
テキストから画像への生成モデルを評価するためのライブラリであるEvalGIMを紹介する。 EvalGIMは、品質、多様性、一貫性を測定するために使用されるデータセットとメトリクスを幅広くサポートする。 EvalGIMには、テキストから画像への生成モデルのための2つの新しい分析手法を導入する評価演習も含まれている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:15:35 GMT)
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video [26.5]
高品質な再構成とモノクロビデオからの高速レンダリングを実現するために,COLMAPフリーな動的3DガウススティングフレームワークであるSplineGSを提案する。中心となるのは、連続的な動的3次元ガウス軌道を表す新しい動き適応スプライン(MAS)法である。カメラパラメータ推定と3次元ガウス属性の同時最適化手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:09:14 GMT)
Hidden Biases of End-to-End Driving Datasets [25.9]
私たちは、CARLA Leaderboard 2.0のエンドツーエンドの運転を初めて試みます。トレーニングデータセットを体系的に分析し、新たな洞察を得る。我々のモデルは2024年のCARLA Challengeの地図とセンサーのトラックでそれぞれ第1位と第2位にランクされている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:51:22 GMT)
Mr. DETR: Instructive Multi-Route Training for Detection Transformers [25.8]
モデルをマルチタスクフレームワークとして扱い、同時に1対1と1対マニーの予測を行う。本研究では,一対一予測のための一次経路と,一対多予測のための2つの補助訓練経路を特徴とする多経路学習機構を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:39:27 GMT)
Efficient Large-Scale Traffic Forecasting with Transformers: A Spatial Data Management Perspective [25.5]
本稿では,大規模トラフィック予測のための空間依存性をモデル化するPatchSTGという新しいトランスフォーマーフレームワークを提案する。具体的には,トランスフォーマーの動的計算に関わる点数を削減するために,新しい不規則な空間パッチを設計する。 4つの実世界の大規模トラフィックデータセットによる実験結果から、当社のPatchSTGは、最先端のパフォーマンスで、列車の速度とメモリ使用率の改善を最大10倍と4倍に向上することが示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:59:18 GMT)
Trained Transformer Classifiers Generalize and Exhibit Benign Overfitting In-Context [25.4]
線形回帰タスクにおいて、線形変圧器がランダムなインスタンス上で事前学習されている場合、通常の最小二乗法と同様のアルゴリズムを用いて予測を行うことを示す。いくつかの設定では、これらの訓練されたトランスフォーマーは「コンテキスト内の良性オーバーフィット」を示すことができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:14:45 GMT)
Dynamic Entity-Masked Graph Diffusion Model for histopathological image Representation Learning [25.2]
動的Entity-Masked Graph Diffusion Modelによる自己管理型病理画像表現学習法であるH-MGDMを紹介する。具体的には,予備訓練において,相補的な部分グラフを潜時拡散条件として,自己教師対象として用いることを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:18:36 GMT)
GaussianAD: Gaussian-Centric End-to-End Autonomous Driving [23.7]
視覚に基づく自動運転は、十分な性能と低コストのために大きな可能性を秘めている。既存のほとんどの方法は、決定のために密度の高い表現(例えば鳥の眼図)やスパース表現(例箱)を採用する。本稿では、ガウス中心のエンドツーエンド自動運転フレームワークを探求し、3Dセマンティックガウスを利用して、そのシーンを広義に記述する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:30 GMT)
The statistical advantage of automatic NLG metrics at the system level [23.1]
統計的には、人間は偏りがなく、高分散推定器であり、メトリクスは偏りがあり、低分散推定器である。ブートストラップを用いて、これらの推定器の誤差をペアワイズ予測(どの生成システムが優れているか?)で比較する。分析では,測定値の補正誤差を人間と完全セグメントレベルのアノテータと比較した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:16:14 GMT)
A Single-Frame and Multi-Frame Cascaded Image Super-Resolution Method [22.9]
現実の世界では、補間情報が限られているため、倍率の増加に伴い、シングルフレームとマルチフレームの超解像再構成の性能は急速に低下する。マルチフレーム超解像と単一フレーム超解像を結合した2段階画像超解像法を提案する。提案手法は,主観的および知覚的品質測定において優れた性能を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:29:08 GMT)
Temporal Action Localization with Cross Layer Task Decoupling and Refinement [22.9]
時間的アクションローカライゼーション(TAL)は、ビデオ内のアクションを分類し、ローカライズする2つのタスクを含む。 CLTDR(Cross Layer Task Decoupling and Refinement)を用いた新しいTAL法を提案する。提案手法は,THUMOS14,MultiTHUMOS,EPIC-KITCHENS-100,ActivityNet-1.3,HACSの5つのベンチマークにおいて,最先端性能を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:38:45 GMT)
A Survey on Web Application Testing: A Decade of Evolution [22.8]
Webアプリケーションテスト(WAT)は、Webアプリケーションの機能、セキュリティ、信頼性を保証する上で重要な役割を果たす。過去10年間に様々なWATアプローチが開発されてきた。本稿では,テストケースの生成と実行,評価,評価など,WATに関わる主なステップについて検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:13:28 GMT)
RP-SLAM: Real-time Photorealistic SLAM with Efficient 3D Gaussian Splatting [22.8]
RP-SLAM(RP-SLAM)は、単眼およびRGB-Dカメラのための3Dガウススプラッティングに基づく視覚SLAM法である。リアルタイム性能とモデルコンパクト性を確保しつつ、最先端の地図レンダリング精度を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:27:35 GMT)
$\textrm{A}^{\textrm{2}}$RNet: Adversarial Attack Resilient Network for Robust Infrared and Visible Image Fusion [22.7]
Infrared and visible image fusion (IVIF) は視覚能力を高める重要な技術である。本稿では,textrmAtextrm2$RNetと呼ばれる新たな攻撃耐性ネットワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:24:12 GMT)
Small Language Model as Data Prospector for Large Language Model [22.7]
textttNUGGETSは、大規模なデータセットから高品質なデータを特定し、選択する。 textttSuperNUGGETSは、大きな言語モデル(LLM)の代わりに小さな言語モデル(SLM)を使用して、優れたワンショットインスタンスのためにデータをフィルタリングする。実験の結果, textttSuperNUGGETS は textttNUGGETS に比べて 1-2% しか低下しないが, 効率は58。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:23:58 GMT)
An Information-Theoretic Framework for Out-of-Distribution Generalization with Applications to Stochastic Gradient Langevin Dynamics [22.6]
機械学習におけるアウト・オブ・ディストリビューションの一般化について検討し,情報理論の一般化境界を確立する汎用フレームワークを提案する。我々のフレームワークは、Integral Probability Metricと$f$-divergenceの間を自由に補間する。 CMI(Mutual Information Conditional)法と組み合わせて$f$-divergenceに着目し,CMIに基づく一般化境界を導出する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:26:53 GMT)
Cycle-Consistent Bridge Diffusion Model for Accelerated MRI Reconstruction [22.6]
既存のディープラーニング手法は、通常、アンダーサンプルデータからイメージを従来の再構成アプローチで再構築する。近年,拡散モデルによる画像の忠実度向上の可能性が高まっている。 CBDMは2つの橋梁拡散モデルを用いて、一貫した損失を伴うサイクル一貫性の拡散過程を構築する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:35:34 GMT)
MPPO: Multi Pair-wise Preference Optimization for LLMs with Arbitrary Negative Samples [22.5]
本研究では,モデル応答の平均確率を利用して報酬関数に適合するMPPOアルゴリズムを提案する。 Pair-wise、Pair-wise、List-wiseの実装の比較により、Pair-wiseアプローチが最高のパフォーマンスを実現することがわかった。実験の結果、MPPOは様々なベンチマークで優れた性能を示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:18:58 GMT)
TrialSynth: Generation of Synthetic Sequential Clinical Trial Data [21.8]
変動オートエンコーダ(VAE)は、合成時系列臨床試験データを生成する際の課題に対処するために設計された。実験の結果,Trial Synthは他の同等の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:48:20 GMT)
Learning Visually Grounded Domain Ontologies via Embodied Conversation and Explanation [21.4]
我々は,エージェントが(誤った)予測を説明するたびに,教師からの是正フィードバックによってエージェントの知識ギャップを克服する学習フレームワークを提供する。低リソースの視覚処理シナリオでテストし、エージェントは異なる種類のおもちゃのトラックを認識することを学ばなければならない。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:28:21 GMT)
Neural Text Normalization for Luxembourgish using Real-Life Variation Data [21.4]
ByT5 と mT5 アーキテクチャを用いた最初のシーケンス・ツー・シーケンス正規化モデルを提案する。実生活変動データを用いたシーケンスモデルは,ルクセンブルク語におけるテーラーメイド正規化に有効な手法であることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:08:28 GMT)
Prompt-Guided Mask Proposal for Two-Stage Open-Vocabulary Segmentation [21.3]
オープン語彙セグメンテーション(open-vocabulary segmentation)の課題に取り組み、異なる環境における幅広いカテゴリのオブジェクトを識別する必要がある。既存の方法はCLIPのようなマルチモーダルモデルを使うことが多い。本稿では,PMP(Prompt-Guided Mask Proposal)を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:22:50 GMT)
The Complexity Dynamics of Grokking [21.1]
本稿では,コルモゴロフ複雑性理論に基づくニューラルネットワークの内在的複雑性の新しい尺度を提案する。ネットワークトレーニングを通じて、このメトリックを追跡することで、複雑性の上昇と低下で構成される、トレーニングダイナミクスの一貫性のあるパターンを見つけることができます。速度歪み理論と最小記述長原理の知見に基づいて、ニューラルネットワークの損失圧縮に対する原理的なアプローチを定式化した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:57:59 GMT)
Filter or Compensate: Towards Invariant Representation from Distribution Shift for Anomaly Detection [21.0]
近年のAnomaly Detection (AD) 法は, ID(In-Distribution)データで大きな成功を収めている。実世界のデータは、しばしば分散シフトを示し、従来のAD手法で大きなパフォーマンス低下を引き起こす。本研究では,教師と学生のネットワーク間のミスアライメントを低減するために,配布特化情報を補償するFiCoを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:57:47 GMT)
A Fixed-Point Approach for Causal Generative Modeling [20.9]
本稿では,構造因果モデル(Structure Causal Models, SCM)を因果順序付き変数の固定点問題として記述する新しい形式論を提案する。トポロジカル順序付け(TO)を考えると,その特異な回復のために最も弱い既知の条件を確立する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:56:04 GMT)
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization [20.7]
VQTalkerは、ベクトル量子化に基づく多言語音声ヘッド生成フレームワークである。我々のアプローチは、人間の発話は有限個の異なる音の単位からなるという音素原理に基づいている。 VQTalkerは、ビデオ駆動と音声駆動の両方のシナリオで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:14:57 GMT)
Super-Resolution for Remote Sensing Imagery via the Coupling of a Variational Model and Deep Learning [20.7]
リモートセンシング画像再構成のための勾配誘導マルチフレーム超解像(MFSR)フレームワークリモートセンシング画像再構成のための新しい勾配誘導型マルチフレーム超解像(MFSR)フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:19:48 GMT)
Programmable simulation of high-order exceptional point with a trapped ion [20.7]
多次元イオン系における高次非エルミートハミルトニアンをシミュレートするためのネイティブプログラマブル制御を実験的に実証した。この結果は,高次元散逸系のスケーラブルな量子シミュレーションの道を開くものである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:00:22 GMT)
ChainStream: An LLM-based Framework for Unified Synthetic Sensing [20.6]
我々は、自然言語を統合インターフェースとして使用し、個人データを処理し、ユーザコンテキストを感知することを提案する。私たちの仕事は、大きな言語モデル(LLM)や他の生成モデルにインスパイアされています。自然言語に基づくコンテキストセンシングの性能を評価するために,133のコンテキストセンシングタスクを含むベンチマークを作成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:25:26 GMT)
Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments [20.3]
ゼロショット環境下でのビジョンランゲージナビゲーション(VLN-CE)の課題に対処する。本稿では,ゼロショットVLN-CEを逐次的かつ制約対応なサブインストラクション完了プロセスとして再構成するConstraint-Aware Navigator (CA-Nav)を提案する。 CA-Navは2つのコアモジュールを使用して、サブインストラクションをナビゲーションプランに継続的に変換する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:38:41 GMT)
Exploring the Frontiers of Animation Video Generation in the Sora Era: Method, Dataset and Benchmark [20.0]
本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。 1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。また,948種類のアニメーションビデオの評価ベンチマークを収集し,特にアニメーションビデオ生成のための指標を開発した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:24:58 GMT)
Learning Structural Causal Models from Ordering: Identifiable Flow Models [20.0]
本稿では,変数の可逆変換を部品的に再現するフローモデルを提案する。本稿では,すべての因果メカニズムの同時学習を可能にする設計改善を提案する。本手法は,既存の拡散法に比べて計算時間を大幅に短縮する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:25:56 GMT)
Human-Like Embodied AI Interviewer: Employing Android ERICA in Real International Conference [19.9]
本稿では,高度な対話機能を備えたアンドロイドロボットを統合した人間型AIインタビュアーを提案する。 SIGDIAL 2024では42名を対象に実例調査を行い,69%が陽性であった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:19:49 GMT)
A Differentiable Wave Optics Model for End-to-End Computational Imaging System Optimization [19.8]
エンドツーエンドの最適化は、計算画像システム設計のための強力なデータ駆動方式として登場した。複合光学のエンドツーエンド最適化のために光輸送における収差と回折の両方をモデル化することは困難である。複合光学の収差と回折の両方を効率的にモデル化する微分可能な光学シミュレータを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:57:47 GMT)
Bootstrapping Heterogeneous Graph Representation Learning via Large Language Models: A Generalized Approach [19.8]
グラフ表現学習法は,グラフ構造内の複雑な関係や特徴を捉えることで,複雑な非ユークリッドデータを扱うのに極めて効果的である。既存のヘテロジニアスグラフニューラルネットワーク(HGNN)は有望な結果を示しているが、ノードタイプとエッジタイプの事前知識と統一ノード特徴形式が必要である。大規模言語モデル(LLM)を用いたグラフ表現学習の最近の進歩は、新しいソリューションを提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:39:00 GMT)
A Decade of Deep Learning: A Survey on The Magnificent Seven [19.4]
ディープラーニングは、過去10年間に人工知能の風景を根本的に変えてきた。本稿では,この分野の広範な調査から選択した,最も影響力のあるディープラーニングアルゴリズムについて概観する。本稿では,残差ネットワーク,トランスフォーマー,ジェネレーティブ・アドバーサリアル・ネットワーク,変分オートエンコーダ,グラフニューラルネットワーク,コントラスト言語-画像事前学習,拡散モデルなどの重要なアーキテクチャについて論じる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:55:39 GMT)
Graph Similarity Computation via Interpretable Neural Node Alignment [19.3]
GED(Graph Edit Distance)とMCS(Maximum Common Subgraphs)は、グラフの類似性を評価するために一般的に使用されるメトリクスである。ディープラーニングモデルはよく知られたブラックボックス'であるため、典型的な1対1のノード/サブグラフアライメントプロセスは見ることができない。我々は,ノードアライメント基底真理情報に頼ることなく,新しい解釈可能なニューラルノードアライメントモデルを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:23:27 GMT)
NowYouSee Me: Context-Aware Automatic Audio Description [19.2]
我々は、コンテキスト認識自動音声記述システムのパイオニアである$mathrmCA3D$を紹介した。提案された$mathrmCA3D$は、ビジュアルキューのみを使用する最初のエンドツーエンドのトレーニングシステムである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:40:37 GMT)
Recording for Eyes, Not Echoing to Ears: Contextualized Spoken-to-Written Conversion of ASR Transcripts [19.0]
本研究では,ASRと文法の誤りに対処する文脈対応型スポンケン・トゥ・ブリッテン変換(CoS2W)タスクを提案する。このタスクは、Large Language Models(LLM)のコンテキスト内学習機能と自然に一致する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:48:44 GMT)
Andes: Defining and Enhancing Quality-of-Experience in LLM-Based Text Streaming Services [18.9]
大規模言語モデル(LLM)は現在、リアルタイム翻訳やチャットボットといった会話型AIサービスの中核にある。本稿では,テキストストリーミングサービスにおけるQoE(Quality-of-Experience)の概念を,各ユーザのエンド・ツー・エンドのインタラクション・タイムラインを考慮して導入し,定義する。本稿では,QoE 対応 LLM サービスシステムである Andes を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:01:16 GMT)
Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers [18.9]
ビジョントランスフォーマー(ViT)の最近のトークン削減手法では、トークンの埋め込みの類似度を測定し、最も類似したペアを組み合わせるトークンマージが組み込まれている。本手法では,ViTフォワードパスから分離した軽量な埋め込みモジュールを導入し,トークンマージ専用の特徴を抽出する。分離構造のおかげで既存のViTバックボーンにシームレスに統合することができ、デカップリングされた埋め込みのみを学ぶか、微調整でエンドツーエンドで学習することでモジュール的にトレーニングすることができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:17:11 GMT)
LAION-SG: An Enhanced Large-Scale Dataset for Training Complex Image-Text Models with Structural Annotations [18.7]
既存のテキスト・トゥ・イメージ(T2I)モデルは、複数のオブジェクトと複雑な関係を含む合成画像生成において、劣化した性能を示す。シーングラフの高品質な構造アノテーションを備えた大規模データセットであるLAION-SGを構築した。合成画像生成のモデルを評価するベンチマークであるCompSG-Benchについても紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:13:47 GMT)
Real-Time Fall Detection Using Smartphone Accelerometers and WiFi Channel State Information [18.6]
スマートフォンの慣性計測ユニット(IMU)を最適化したWi-Fiチャネル状態情報(CSI)と統合したリアルタイム転倒検出システムを提案する。専用に開発されたAndroidアプリケーションは、ユーザが転倒を経験し、移動できない場合、緊急アラートを発行する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:07:41 GMT)
Learning Complex Non-Rigid Image Edits from Multimodal Conditioning [18.5]
我々は、与えられた人間(具体的には人の1つのイメージ)を新しいシーンに挿入することに集中する。安定拡散の上に構築された本手法は,テキストとポーズを高度に制御し,自然な画像を生成する。身元保存は「夢中」の場面、特に人と物体が相互作用する場面において、より困難な課題であることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:41:08 GMT)
Recurrent Drafter for Fast Speculative Decoding in Large Language Models [18.3]
本稿では,高度な投機的復号法であるRecurrent Drafterを提案する。大規模言語モデル(LLM)推論の最先端の高速化を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:50:19 GMT)
Semi-IIN: Semi-supervised Intra-inter modal Interaction Learning Network for Multimodal Sentiment Analysis [18.2]
Semi-IINは、マルチモーダル感情分析のためのセミ教師付きインターモーダル相互作用学習ネットワークである。 Semi-IINはマスクされた注意とゲーティング機構を統合し、効果的な動的選択を可能にする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:48:07 GMT)
Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration [18.2]
本稿ではSafeDiffと呼ばれる新しい状態拡散フレームワークを紹介する。これにより、現在のロボットの状態と視覚的コンテキスト観察から予測状態列を生成する。リアルタイムの触覚フィードバックを組み込んでシーケンスを洗練させる。実験では, 視覚触覚モデルにより, ドア開口部の有害な力の危険性が著しく軽減された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:45:26 GMT)
You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects [18.1]
ExecutionAgentは任意のプロジェクトをインストールし、テストケースを実行するように設定し、プロジェクト固有のスクリプトを生成する自動テクニックである。 ExecutionAgentは、14の異なるプログラミング言語と多くの異なるビルドおよびテストツールを使用する50のオープンソースプロジェクトに適用します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:30:51 GMT)
TSGaussian: Semantic and Depth-Guided Target-Specific Gaussian Splatting from Sparse Views [18.1]
TSGaussianは、新しいビュー合成タスクにおける幾何学的劣化を避けるために、意味的制約と深さ事前の制約を組み合わせる新しいフレームワークである。提案手法は,バックグラウンドアロケーションを最小化しながら,指定された目標に対する計算資源の優先順位付けを行う。大規模な実験により、TSGaussianは3つの標準データセット上で最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:26:38 GMT)
RTL-Breaker: Assessing the Security of LLMs against Backdoor Attacks on HDL Code Generation [17.5]
大規模言語モデル(LLM)は、ハードウェア設計のためのコード生成/補完タスクにおいて顕著な可能性を示している。 LLMはいわゆるデータ中毒やバックドア攻撃の影響を受けやすい。ここでは、攻撃者はトレーニングデータに対して悪意のあるコードを注入し、LLMによって生成されたHDLコードに渡すことができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:36:48 GMT)
ManipGPT: Is Affordance Segmentation by Large Vision Models Enough for Articulated Object Manipulation? [17.4]
本稿では,調音対象の最適相互作用領域を予測するためのフレームワークであるManipGPTを紹介する。我々は、シミュレートされた9.9kの画像と実際の画像のデータセットを作成し、シミュレートとリアルのギャップを埋めた。我々は,ロボット操作のシナリオに対して,モデルのコンテキスト内セグメンテーション機能を適用することにより,部分レベルの割当セグメンテーションを大幅に改善した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:22:01 GMT)
EP-CFG: Energy-Preserving Classifier-Free Guidance [17.4]
本稿では, EPCFG (Energy-Preserving-Free Guidance) について述べる。提案手法は,各段階の条件付き予測に一致するように誘導された出力を再スケールし,任意に頑健な変形を加えてアーチファクトの抑制を改善する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:49:25 GMT)
WiseAD: Knowledge Augmented End-to-End Autonomous Driving with Vision-Language Model [17.1]
WiseADは、推論、オブジェクト認識、リスク分析、運転提案、軌道計画を駆動できる特殊な視覚言語モデルである。我々は、知識と計画データセットを駆動する共同トレーニングを採用し、モデルが知識に整合した軌道計画を実行できるようにする。運転知識の多様性が拡大するにつれて、重大な事故が顕著に減少し、運転スコアと経路完成度が11.9%、12.4%向上した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:14:24 GMT)
Trusted Unified Feature-Neighborhood Dynamics for Multi-View Classification [17.0]
マルチビュー分類(MVC)は、異なる視点におけるドメインギャップと不整合に起因する固有の課題に直面している。堅牢なMVCのためのTUNED(Trusted Unified Feature-Neighborhood Dynamics)モデルを提案する。この手法は, 局所的およびグローバルな特徴近傍構造(F-N)を, 堅牢な意思決定のために効果的に統合する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:10:35 GMT)
EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling [16.9]
そこで本研究では,VRデバイスからのスパーストラッキング信号と事前スキャン環境を用いて,全体動作推定を行う手法を提案する。セマンティックな環境制約と幾何的な環境制約を統合することで、これらの多仮説推定を洗練させる。本手法は,動き-環境相互作用シナリオにおける人間の動き推定の大幅な改善を目立たせ,最先端の性能を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:06:46 GMT)
AutoPatent: A Multi-Agent Framework for Automatic Patent Generation [16.9]
我々はDraft2Patentと呼ばれる新しい実用的なタスクとそれに対応するD2Pベンチマークを導入し、初期ドラフトに基づいて17Kトークンを平均化する完全長の特許を生成するためにLarge Language Modelsに挑戦する。提案するマルチエージェントフレームワークであるAutoPatentは,LPMベースのプランナーエージェント,ライターエージェント,検査エージェントをPGTreeとRRAGで組み合わせて,長文かつ複雑かつ高品質な特許文書を生成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:27:34 GMT)
Efficient Sign-Based Optimization: Accelerating Convergence via Variance Reduction [16.8]
それぞれ$mathcalO(d1/2T-1/2 + dn-1/2)$と$mathcalO(d1/4T-1/4)$の収束率を改善する2つの新しいアルゴリズムを導入する。提案手法の有効性を検証した数値実験を行った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:11:01 GMT)
TreeEval: Benchmark-Free Evaluation of Large Language Models through Tree Planning [16.6]
TreeEvalは、大規模言語モデル(LLM)のベンチマークフリー評価手法である。これにより、高性能なLLMが再現不可能な評価セッションをホストし、本質的にデータ漏洩を回避することができる。パラメータサイズの異なるモデルに対して,7ドルB,13ドルB,33ドルBを含む6ドルモデルを評価し,約45ドルの質問でAlpacaEval2.0との相関係数を最大化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:48:13 GMT)
DG-Mamba: Robust and Efficient Dynamic Graph Structure Learning with Selective State Space Models [16.4]
選択状態空間モデル(Mamba)を用いた動的グラフ構造学習フレームワークを提案する。我々のフレームワークは、敵攻撃に対する最先端のベースラインよりも優れている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:00:55 GMT)
Strong Structural Bounds for MaxSAT: The Fine Details of Using Neuromorphic and Quantum Hardware Accelerators [16.3]
量子アニールやニューロモルフィックチップのようなハードウェアアクセラレーターは、ハミルトンの基底状態を見つけることができる。それまでの研究は、構文的・構造的特性ではなく、エンコーディングのサイズにのみ関係していた。我々は、MaxSAT、Max2SAT、およびハードウェアアクセラレータの基盤となる2次非制約バイナリ最適化問題(QUBO)の間の構造認識の低減を確立する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:18:08 GMT)
DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach [16.1]
本稿では,マルチエージェント強化学習(MARL)と生成拡散モデル(GDM)を組み合わせた共同手法を提案する。第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient(MADDPG)におけるアクタネットワークを置き換える新しいDNNタスク割当アルゴリズム(GDM-MADDPG)を導入する。シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:48:45 GMT)
GigaHands: A Massive Annotated Dataset of Bimanual Hand Activities [16.1]
GigaHandsは56人の被験者と417のオブジェクトから34時間の両手の動きを捉えた巨大な注釈付きデータセットである。マーカレスキャプチャのセットアップとデータ取得プロトコルにより,完全自動3Dハンドとオブジェクト推定が可能となる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:20:30 GMT)
EI-Drive: A Platform for Cooperative Perception with Realistic Communication Models [16.0]
EI-DriveはエッジAIベースの自動運転シミュレーションプラットフォームである。高度な協調認識とより現実的なコミュニケーションモデルを統合する。 EI-Driveを用いた実験では、車両の安全性と性能が大幅に向上した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:37:44 GMT)
Synthetic multi-dimensional Aharonov-Bohm cages in Fock state lattices [16.0]
超伝導量子回路を用いた多次元FSLの構成を実証する。量子重畳状態のコヒーレントな干渉を探索し、特定の部分空間内で極端に局所化を達成する。我々の発見は、高次元システムにおける幅広い種類の量子状態の挙動を操作するための道を開いた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:13:43 GMT)
CRS Arena: Crowdsourced Benchmarking of Conversational Recommender Systems [15.9]
本稿では,対話型レコメンダシステム(CRS)のスケーラブルなベンチマークプラットフォームであるCRS Arenaを紹介する。 CRS Arenaは会話とユーザのフィードバックを収集し、CRSの信頼性評価とランキングのための基盤を提供する。 CRS-ArenaDialは、474の会話とそれに対応するユーザフィードバックのデータセットであり、Eloレーティングシステムに基づくシステムの予備的なランキングである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:16:38 GMT)
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models [15.9]
我々はLarge Language Models(LLMs)の内部言語表現を探索するために、言語最小ペアを活用する。 3つの言語で100以上のLLMと150k以上の最小ペアにまたがる大規模な実験では、4つの重要な側面から言語的類似性の特性を明らかにした。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:50:26 GMT)
Multi-Head Encoding for Extreme Label Classification [15.8]
eXtreme Classification Label (XLC) は、大量のラベルを識別するために確立されている。カテゴリの数が増加するにつれて、分類器内のパラメータの数や非線形演算も増加する。これにより計算過負荷問題(CCOP)が発生する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:53:47 GMT)
END$^2$: Robust Dual-Decoder Watermarking Framework Against Non-Differentiable Distortions [15.8]
現実世界の歪みは、しばしば微分不可能であり、エンドツーエンドのトレーニングの課題に繋がる。本稿では,非微分歪みをトレーニングにうまく組み込むために,新しいデュアルデコーダアーキテクチャ (END$2$) を提案する。提案手法は, 様々な非微分歪みの下で, 最先端のアルゴリズムより優れる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:37:30 GMT)
Inverse Reinforcement Learning by Estimating Expertise of Demonstrators [15.7]
IRLEED(Inverse Reinforcement Learning by Estimating Expertise of Demonstrators)は、実証者の専門知識の事前知識なしにハードルを克服する新しいフレームワークである。 IRLEEDは既存の逆強化学習(IRL)アルゴリズムを強化し、報酬バイアスと行動分散に対処するために、実証者準最適性のための一般的なモデルを組み合わせる。オンラインおよびオフラインのIL設定、シミュレーションと人為的なデータによる実験は、IRLEEDの適応性と有効性を示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:59:14 GMT)
Acquisition of Spatially-Varying Reflectance and Surface Normals via Polarized Reflectance Fields [15.7]
実世界の物体の幾何と空間的に変化する反射率を正確に測定することは複雑な作業である。偏光反射場キャプチャーと包括的統計解析アルゴリズムを用いた新しい手法を提案する。広帯域の多種多様な物体の捕集形状と反射率を, 拡散度から光沢の範囲で示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:39:55 GMT)
Unexpected but informative: What fixation-related potentials tell us about the processing of ambiguous program code [15.5]
我々はプログラマに不明瞭なプログラムコードパターンのオンライン処理を解析するが、コンピュータではない。プログラムコードにおける曖昧なものと対照的に、混乱の原子は400msから700msの時間で前頭葉の後期陽性を引き起こす。これらのデータは、プログラムコードや自然言語における予期せぬ情報入力に応答して、脳が同様の神経認知機構を担っていることを示唆するものである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:38:10 GMT)
CAS-GAN for Contrast-free Angiography Synthesis [15.5]
ヨウ化コントラスト剤は、多くの介入手順で広く利用されるが、患者にかなりの健康リスクをもたらす。本稿では,X線アンギオグラフィーを合成するための「仮想コントラスト剤」として機能する新しいGANフレームワークであるCAS-GANを提案する。 CAS-GANのFIDは5.87,MDは0.016であった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:49:03 GMT)
Targeted Angular Reversal of Weights (TARS) for Knowledge Removal in Large Language Models [15.4]
大規模言語モデル(LLM)から知識を除去するターゲット角反転法(TARS)を導入する。 TARS法はまず LLM と詳細なプロンプトを組み合わせることで,選択した概念に関する情報を集約する。次に、この近似概念ベクトルを改良し、その近似概念ベクトルをノイズで摂動させることにより、高い確率で概念トークンをトリガーする。 TARS法のモジュラリティは、有名な文学探偵シャーロック・ホームズや惑星土星など、ラマ3.1の8Bから連続的に概念を除去することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:26:34 GMT)
A Character-Centric Creative Story Generation via Imagination [15.3]
我々はCCI(Character-centric Creative Story Generation via Imagination)と呼ばれる新しいストーリー生成フレームワークを紹介する。 CCIは創造的ストーリー生成のための2つのモジュール、IG(Image-Guided Imagination)とMW(Multi-Writer model)を備えている。 IGモジュールでは,文字や背景,メインプロットといった重要なストーリー要素を視覚的に表現するために,テキスト・ツー・イメージモデルを利用する。 MWモジュールはこれらのストーリー要素を使用して複数のペルソナ記述候補を生成し、ストーリーに挿入する最適なストーリーを選択することにより、物語の豊かさと深さを高める。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:50:50 GMT)
Catch-Up Distillation: You Only Need to Train Once for Accelerating Sampling [15.3]
本稿では, 速度推定モデルの現在のモーメント出力を前回のモーメント出力と一致させる「キャッチアップ蒸留(CUD)」を提案する。具体的には、CUDは、元の正規微分方程式(ODE)訓練目標を調整し、現在のモーメント出力を、基底真理ラベルと前のモーメント出力の両方に整合させる。 CUDの有効性を示すため、我々はCIFAR-10、MNIST、ImageNet-64で徹底的なアブレーションと比較実験を行った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:36:28 GMT)
ADA-Track++: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association [15.2]
多視点カメラによる3D MOTのための新しいエンドツーエンドフレームワークであるADA-Track++を紹介する。エッジ拡張型クロスアテンションに基づく学習可能なデータアソシエーションモジュールを提案する。我々は、この関連モジュールをDTRベースの3D検出器のデコーダ層に統合する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:22:55 GMT)
HyViLM: Enhancing Fine-Grained Recognition with a Hybrid Encoder for Vision-Language Models [15.1]
HyViLMは、エンコーディング中に全体のコンテキストを保持しながら、任意の解像度の画像を処理するように設計されている。同じ条件下での最先端のMLLMと比較して、HyViLMは既存のMLLMを10タスク中9タスクで上回ります。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:49:53 GMT)
DroidSpeak: KV Cache Sharing for Efficient Multi-LLM Serving [15.1]
DroidSpeakは、微調整言語モデル(LLM)間のコンテキスト共有を最適化するフレームワークである。 DroidSpeakのスループットは最大で3倍,プリフィル時間は2.6倍に向上する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:53:25 GMT)
Hierarchical Prompt Decision Transformer: Improving Few-Shot Policy Generalization with Global and Adaptive Guidance [14.9]
本稿では,検索拡張によって実現した階層的プロンプト手法を提案する。本手法は,2層のソフトトークンを導出プロンプトとして学習する。アダプティブトークンは、キュレートされたデモセグメントから動的に取得され、コンテキスト対応のガイダンスが保証される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:31:51 GMT)
Enhancing the Reasoning Capabilities of Small Language Models via Solution Guidance Fine-Tuning [14.9]
本稿では,SG(Solution Guidance)およびSGFT(Solution-Guidance Fine-Tuning)について紹介する。 SGは、特定の計算ではなく、意味的および論理的なレベルでの問題理解と分解に焦点を当てている。 SGFTは、SLMを微調整して正確な問題解決ガイダンスを生成することができ、任意のSLMにプロンプトとして柔軟に供給することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:45:26 GMT)
Generative AI in Medicine [14.9]
本稿では, 臨床医, 患者, 臨床治験主催者, 研究者, 研修生を対象に, ジェネレーティブなAI利用事例を概観する。プライバシーとセキュリティの維持、透明性と解釈可能性の改善、株式の維持、厳格なモデル評価など、さまざまな課題について議論する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:32:21 GMT)
Benchmarking Linguistic Diversity of Large Language Models [14.8]
本稿では,言語モデルによる人間の言語的豊かさの保全を検討することの重要性を強調する。言語多様性の観点からLLMを評価するための包括的枠組みを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:46:03 GMT)
Enhancing Brain Age Estimation with a Multimodal 3D CNN Approach Combining Structural MRI and AI-Synthesized Cerebral Blood Volume Data [14.8]
脳年齢ギャップ推定(BrainAGE)は、脳年齢を理解するための神経画像バイオマーカーである。現在のアプローチでは、主にT1強調MRI(T1w MRI)データを使用し、構造脳情報のみをキャプチャする。我々は,VGGに基づくアーキテクチャを用いたディープラーニングモデルを開発し,線形回帰を用いた予測を組み合わせた。我々のモデルは3.95年の平均絶対誤差(MAE)とテストセットの$R2$ 0.943を達成し、類似したデータでトレーニングされた既存のモデルよりも優れていた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:29:35 GMT)
Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators [14.7]
大きな言語モデル(LLM)は、検証可能な事実に矛盾する応答を生成する傾向がある。応答幻覚を軽減するために,比較器駆動型復号時間(CDT)フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:03:07 GMT)
Universal Inceptive GNNs by Eliminating the Smoothness-generalization Dilemma [14.5]
Inceptive Graph Neural Net-work (IGNN) を提案する。我々のIGNNは23のベースライン法より優れており、ホモフィルグラフとヘット電子グラフの両方で優れた性能を誇示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:44:47 GMT)
Debiased Multimodal Understanding for Human Language Sequences [14.4]
本研究では,非保守的共同創設者として働く被験者の影響を抑えるために,因果介入モジュールであるSuCIを提案する。プラグアンドプレイコンポーネントとして、SuCIは偏見のない予測を求めるほとんどの方法に広く適用することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:49:02 GMT)
Towards Automated Cross-domain Exploratory Data Analysis through Large Language Models [14.2]
本稿では,自動クロスドメイン探索データ分析システムであるTiInsightについて述べる。 TiInsightは、GPT-4を用いてスパイダーデータセット上で86.3%の階層的実行精度を達成した。また、Birdデータセット上での最先端のパフォーマンスも示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:08:54 GMT)
Too Big to Fool: Resisting Deception in Language Models [14.2]
大規模言語モデルは、ウェイトエンコードされた知識と、正確な応答を生成するプロンプトからのコンテキスト内情報とをバランスさせなければならない。本稿では,同じ家族内の様々な能力のモデルが,コンテキスト内情報を意図的に誤解させるのにどう対処するかを考察する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:03:10 GMT)
No Free Lunch for Defending Against Prefilling Attack by In-Context Learning [14.2]
In-Context Learning (ICL) は, 実演中に逆文構造を用いることで, ジェイルブレイク攻撃を効果的に防ぐことができることを示す。実験結果と分析結果から,ICLによる脱獄前予防のための無料ランチは存在しないと結論した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:58:12 GMT)
Boosting the Validity of Multi-Class Quantum Outputs: Living on the Edge [14.2]
本稿は,n次元単純体のエッジへの計測の新たなマッピングを導入し,マルチクラス分類における出力表現に焦点を当てた。提案手法は,有効回路出力サンプル数を直接的に改善すると共に,その出力の精度を1ホット符号化よりも向上することを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:09:09 GMT)
All-in-One: Transferring Vision Foundation Models into Stereo Matching [13.8]
AIO-Stereoは、複数の異種VFMからの知識を柔軟に選択し、単一のステレオマッチングモデルに転送することができる。 AIO-Stereoは、複数のデータセットで最先端のパフォーマンスを達成し、ミドルベリーデータセットで1st$をランク付けしている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:59:17 GMT)
Data Pruning Can Do More: A Comprehensive Data Pruning Approach for Object Re-identification [13.7]
この研究は、オブジェクトの再識別タスクに適用されたデータプルーニングメソッドの実現可能性について、最初の研究である。トレーニング中のロジット履歴を十分に活用することにより,本手法は試料の重要度を定量化するための,より正確で包括的な指標を提供する。提案手法は高効率であり,従来の手法に比べて10倍のコストで重要なスコア推定を行うことができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:27:47 GMT)
ScaleOT: Privacy-utility-scalable Offsite-tuning with Dynamic LayerReplace and Selective Rank Compression [13.7]
オフサイトチューニングは、大きな言語モデルをチューニングするためのプライバシ保護方法である。プライバシ・ユーティリティ・スケール可能な新しいオフサイトチューニングフレームワークであるScaleOTを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:00:48 GMT)
MVC-VPR: Mutual Learning of Viewpoint Classification and Visual Place Recognition [13.7]
本稿では,視点的自己分類と視覚的位置認識の相互学習を紹介する。データセットは、位置認識のための記述子抽出器を同時に訓練しながら、教師なしの方法で分割される。提案手法は, 基底真理ラベルを用いてデータセットを分割する, 最先端(SOTA)手法を抽出する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:44:42 GMT)
Still "Talking About Large Language Models": Some Clarifications [13.7]
私の論文 “Talking About Large Language Models” は、かつては、大規模言語モデルに対する還元主義的な姿勢を提唱するものとして解釈されてきた。この短い注記は、メタ物理ではなく語の使用(誤用)に関係した、より大きな哲学的プロジェクトという文脈で、この論文を描いている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:21:29 GMT)
IMPROVE: Impact of Mobile Phones on Remote Online Virtual Education [13.6]
本研究は,オンライン教育における携帯電話利用が学習者に与える影響を評価するためのIMPROVEデータセットを提案する。このデータセットは、学術的パフォーマンスと主観的な学習者のフィードバックを評価するだけでなく、生体、行動、生理的信号も取得する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:29:05 GMT)
Pre-Training Representations of Binary Code Using Contrastive Learning [13.6]
ContraBinは、ソースコードとコメント情報をバイナリと統合する、対照的な学習テクニックである。我々は、人書きと合成コメントがバイナリコード理解タスクに与える影響を分析する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:37:17 GMT)
DisPose: Disentangling Pose Guidance for Controllable Human Image Animation [13.4]
本稿では、高密度入力を伴わずに、より汎用的で効果的な制御信号を抽出するDisPoseを提案する。 DisPoseは、人間の画像アニメーションにおけるスパーススケルトンポーズをモーションフィールドガイダンスとキーポイント対応に分解する。既存のモデルにシームレスに統合するために,プラグイン・アンド・プレイハイブリッド・コントロールネットを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:30:44 GMT)
Static Pruning in Dense Retrieval using Matrix Decomposition [12.9]
密集検索の時代には、文書のインデックス化と検索は主に、文書を埋め込みに変換するエンコーディングモデルに基づいている。近年の研究では, 組込みサイズを減らし, 回収効率を向上できる可能性が示唆されている。そこで本研究では,主成分分析による埋込み寸法の低減のための新しい静的プルーニング手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:09:20 GMT)
RemDet: Rethinking Efficient Model Design for UAV Object Detection [12.7]
無人航空機(UAV)画像における物体検出は研究の焦点領域として現れている。現在のリアルタイム物体検出器は、UAV画像に最適化されていない。これらの課題に対処するために,新しい検出器RemDetを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:00:57 GMT)
Reasoner Outperforms: Generative Stance Detection with Rationalization for Social Media [12.5]
本研究は、明確な解釈可能な有理性を含む姿勢予測を含む生成的アプローチを採用する。姿勢検出に推論を組み込むことで、より小さなモデル(FlanT5)がGPT-3.5のゼロショット性能を上回ることが判明した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:34:39 GMT)
An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques [12.5]
拡散に基づく識別モデル強化フレームワーク(DBMEF)を提案する。このフレームワークは、差別的および生成的モデルをトレーニング不要な方法でシームレスに統合する。 DBMEFは、プラグアンドプレイ方式で識別モデルの分類精度と能力を効果的に向上させることができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:41:26 GMT)
Evidential time-to-event prediction with calibrated uncertainty quantification [12.4]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:36:29 GMT)
Enhancing Fine-Grained Vision-Language Pretraining with Negative Augmented Samples [12.4]
既存のビジョンランゲージ事前学習法は、様々な視覚言語タスクにおいて顕著に改善されている。しかし、多くのニュアンスな視覚言語アプリケーションにとって重要な、きめ細かい理解能力は依然として限られている。我々は,NASを革新的に組み込んだ視覚言語事前学習モデルであるNegative Augmented Samples(NAS)を導入する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:39:31 GMT)
Quaffure: Real-Time Quasi-Static Neural Hair Simulation [11.9]
本稿では,様々な身体のポーズ,形状,髪型に一般化した髪の変形を予測する新しいニューラルアプローチを提案する。我々のモデルは自己監督的損失を用いて訓練されており、高価なデータ生成とストレージの必要性を排除している。我々のアプローチは、コンシューマハードウェア上で数ミリ秒の推論時間しか持たないリアルタイムアプリケーションに非常に適しています。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:44:56 GMT)
FaceShield: Defending Facial Image against Deepfake Threats [11.8]
犯罪活動におけるディープフェイクの使用の増加は重大な問題を示し、広範な論争を引き起こしている。拡散モデル(DM)が生み出すディープフェイクを標的とした新たな攻撃戦略を提案する。提案手法は3つの主要要素からなる: (i) DMの注意機構を操作し, 認知過程において保護された顔の特徴を排除し, (ii) 敵の摂動の堅牢性を高めるために顕著な顔特徴抽出モデルをターゲットにし, (iii) ガウス的ぼかしとローパスフィルタリング技術を用いてJPEG歪みに対する頑健性を高めつつ, 知覚能力を向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:20:35 GMT)
StyO: Stylize Your Face in Only One-shot [11.7]
本稿では,1つの芸術的対象を持つ顔のスタイリングに焦点を当てた。このタスクの既存の作業は、ジオメトリの変化を達成しながら、ソース内容の保持に失敗することが多い。上記の問題を解決するために,新しいStyOモデル,すなわち1ショットで顔をスタイリングする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:09:48 GMT)
AMuSeD: An Attentive Deep Neural Network for Multimodal Sarcasm Detection Incorporating Bi-modal Data Augmentation [11.6]
AMuSeD (bi-modal data augmentation を用いたMUltimodal Sarcasm dEtection の深部ニューラルネットワーク) を提案する。このアプローチでは,Multimodal Sarcasm Detection dataset (MUStARD) を用いて,2段階のバイモーダルデータ拡張戦略を導入する。第2フェーズでは、サルカシックなイントネーションを維持するために特別に調整された、FastSpeech 2ベースの音声合成システムを洗練する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:42:51 GMT)
MulSMo: Multimodal Stylized Motion Generation by Bidirectional Control Flow [11.5]
既存の方法では、情報は通常、スタイルからコンテンツへのみ流れ、スタイルとコンテンツの間に衝突を引き起こす可能性がある。この作業では、スタイルとコンテンツの間に双方向の制御フローを構築し、そのスタイルをコンテンツに向けて調整します。我々は、文や画像を含む複数のモダリティに1つのモダリティ、すなわちスタイル運動から、コントラスト学習を通じてスタイル化されたモーション生成を拡張する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:40:26 GMT)
Adjusting Model Size in Continual Gaussian Processes: How Big is Big Enough? [11.4]
多くの機械学習モデルでは、トレーニング前にサイズを制御するパラメータを設定する必要がある。「これは、どのくらい大きいのか」という疑問に繋がる。ここでは、データが漸進的に利用可能になるため、最終的なデータセットサイズはトレーニング前には分かっていない。最適な性能を維持しつつ,モデルサイズを自動的に調整する手法を開発した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:36:43 GMT)
Learn and Unlearn in Multilingual LLMs [11.4]
本稿では,多言語大言語モデル(LLM)における有害情報の伝播について検討する。フェイク情報は、どのような言語であっても、異なる言語にまたがって広がり、生成されたコンテンツの完全性と信頼性を損なう。標準のアンラーニング技術は、典型的には英語データに焦点を当てるが、多言語文脈における有害なコンテンツの拡散を緩和するには不十分である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:55:46 GMT)
MANGO: Multimodal Acuity traNsformer for intelliGent ICU Outcomes [11.4]
Intelligent ICU 結果に対する Multimodal Acuity traNsformer を提案する。患者の容積状態、遷移、生命維持療法の必要性の予測を強化するように設計されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:51:15 GMT)
Optimal Bounds for Private Minimum Spanning Trees via Input Perturbation [11.3]
近似最小スパンニングツリー(MST)のプライベートリリース問題について検討する。既存のプライベートMSTアルゴリズムはトレードオフに直面し、計算効率または精度を犠牲にする。重みベクトルをプライベートにするのに十分でない入力のランダムな摂動により、結果は非公開となり、最先端のエラー保証が達成される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:22:39 GMT)
BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion [11.3]
本稿では,両方向ステップワイド・フィーチャーアライメントとフュージョンという,不整合な医用画像融合法を提案する。特徴アライメントの観点では、BSFA-Fは双方向の段階的なアライメント変形場予測戦略を採用している。複数のデータセットにまたがる実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:38:29 GMT)
From Allies to Adversaries: Manipulating LLM Tool-Calling through Adversarial Injection [11.3]
ツールコールは、外部ツールを統合することで、LLM(Large Language Model)アプリケーションを変更した。本稿では,LDMツールコールシステムの脆弱性を利用した対向型ツールインジェクションによる新しいフレームワークであるToolCommanderを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:15:24 GMT)
NetOrchLLM: Mastering Wireless Network Orchestration with Large Language Models [11.0]
大規模言語モデル(LLM)は、洗練された自然言語理解機能を活用することで、様々な領域に革命をもたらした。本稿では、様々な無線固有モデルをシームレスにオーケストレーションする無線ネットワークORCHestrator LLMフレームワークであるNetORCHLLMを提案する。アプローチの実用性を示す包括的なフレームワークが導入された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:48:15 GMT)
EVOS: Efficient Implicit Neural Training via EVOlutionary Selector [11.0]
Evolutionary Selector(EVOS)は、インプシットニューラル表現(INR)の高速化のための効率的な訓練パラダイムである進化過程において、各サンプルを個人として扱い、最も適したサンプルのみが生き残り、トレーニングに有効に含まれる。本手法は, トレーニング時間を約48%-66%削減し, 追加コストを伴わず, 優れた収束性を確保した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:11:42 GMT)
Operator algebra and algorithmic construction of boundaries and defects in (2+1)D topological Pauli stabilizer codes [10.9]
位相一般化されたパウリ安定化符号のすべての境界と欠陥を2次元で構成する計算アルゴリズムを提案する。このアルゴリズムを適用し、Z$トーリック符号の2つの境界と6つの欠陥、Z_4$トーリック符号の3つの境界と22の欠陥、カラー符号の6つの境界と270の欠陥、異常な3つのフェミオン符号の6つの欠陥を明示的に示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:44:37 GMT)
Precision-Enhanced Human-Object Contact Detection via Depth-Aware Perspective Interaction and Object Texture Restoration [10.8]
人間オブジェクト接触(Human-object Contact、HOT)は、人間と物体が接触する領域を正確に識別するように設計されている。現在の手法では、オブジェクトが頻繁にビューをブロックしているシナリオを考慮できません。我々は、深度マップ生成モデルを用いて、カメラに関連する人間や物体の深度情報を提供するPIHOTと呼ばれる視点相互作用HOT検出器を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:15:52 GMT)
SwiftTry: Fast and Consistent Video Virtual Try-On with Diffusion Models [10.7]
本研究の目的は,被着者の入力映像と新しい衣服が与えられた場合,被着者が着ている新しい映像を合成することである。我々は,映像仮想試着を条件付き映像塗装作業として再認識し,衣服を入力条件として機能させる。本稿では,冗長計算を最小化しながら時間的一貫性を維持する新しい手法であるShiftCachingを紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:50:26 GMT)
CCT-Code: Cross-Consistency Training for Multilingual Clone Detection and Code Search [10.5]
言語間類似性を利用した新しい訓練法であるクロス一貫性トレーニング(CCT)を提案する。このトレーニングはエンコーダベースモデルとデコーダベースモデルの両方に有効であることを示す。トレーニングされたエンコーダベースのCCT-LMモデルは、POSJ-104(モノリンガルなC++クローン検出ベンチマーク)で96.73%のMAPとAdvTest(モノリンガルなPythonコード検索ベンチマーク)で47.18%のMRRで新しい状態を達成している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:32:04 GMT)
Higher Order Transformers: Enhancing Stock Movement Prediction On Multimodal Time-Series Data [10.3]
我々は,高次変圧器の導入により,金融市場の株価変動を予測するという課題に取り組む。我々は、自己保持機構とトランスフォーマーアーキテクチャを高次に拡張し、時間と変数の複雑な市場ダイナミクスを効果的に捉える。本稿では,歴史的価格と関連するつぶやきからのマルチモーダル信号を利用して,技術的および基本的分析を統合するエンコーダ・デコーダモデルを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:26:35 GMT)
One Node One Model: Featuring the Missing-Half for Graph Clustering [10.3]
グラフクラスタリングの特徴の選択は、クラスタを同時に検出し、これらのクラスタに関連する機能を特定する必要があるため、難しい。本稿では,各ノードに対して排他的モデルを構築し,ノード群に対する予測の組み合わせとしてノードラベルを定義する「1ノード1モデル」という新しいパラダイムを提案する。具体的には、提案したFeature Personalized Graph Clustering (FPGC) メソッドは、各ノードのクラスタ関連機能をSwitch-and-excitationブロックを使用して識別し、これらの機能を各モデルに統合して最終的な表現を形成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:42:36 GMT)
HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection [10.1]
我々は新しい高周波空間知覚特徴ピラミッドネットワーク(HS-FPN)を提案する。 HS-FPNは、小さな物体の特徴を豊かに強調するために、ハイパスフィルタを通じて高周波応答を生成する。第2に、FPNが欠落している空間依存を捉えるための空間依存認識モジュール(SDP)を開発した。実験により, HS-FPNに基づく検出器は, 微小物体検出のためのAI-TODデータセット上での最先端モデルに対して, 競争上の優位性を示すことが示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:59:12 GMT)
One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.1]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:21:02 GMT)
See Where You Read with Eye Gaze Tracking and Large Language Model [10.1]
本稿では,リニアとジャンプの両方をサポートする読み上げトラッキングとハイライトシステムを提案する。制御された実験では、信頼性の高いリニアリーディングトラッキングが示され、ジャンプリーディングの精度は84%である。 18名のボランティアによる実地試験は,読解段落の追跡と強調においてシステムの有効性を実証した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:44:31 GMT)
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks [10.0]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて非常に効果的であることが証明されている。既存の手法はしばしば、実質的なエンドツーエンドのLLM推論スピードアップを達成するのに苦労する。 SLEBは、冗長なトランスフォーマーブロックを排除し、LCMを合理化するための新しいアプローチである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:44:34 GMT)
Toy-GS: Assembling Local Gaussians for Precisely Rendering Large-Scale Free Camera Trajectories [10.0]
現在、大規模な無料カメラトラジェクトリの3Dレンダリング、すなわち任意の入力カメラトラジェクトリが大きな課題となっている。本稿では,大規模フリーカメラの軌跡を正確に描画するToy-GS法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:10:53 GMT)
Continual Distillation Learning: An Empirical Study of Knowledge Distillation in Prompt-based Continual Learning [9.9]
本稿では,継続学習(CL)における知識蒸留(KD)を考慮した連続蒸留学習(CDL)の問題を紹介する。教師モデルと学生モデルは一連の課題を学習する必要があるが、教師モデルに関する知識はオンライン的に生徒モデルを改善するために学生に蒸留される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:49:45 GMT)
BinarySelect to Improve Accessibility of Black-Box Attack Research [9.9]
アドリアテキスト攻撃の研究は、NLPモデルの堅牢性をテストするのに有用である。トランスの台頭は、攻撃をテストするのに必要な時間を大幅に増加させた。本稿では,トークン発見に必要なクエリ数を大幅に削減するBinarySelectという,より効率的な選択手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:42:30 GMT)
ReFT: Reasoning with Reinforced Fine-Tuning [9.8]
本稿では,Reinforced Fine-Tuning (ReFT) というシンプルな手法を提案する。 ReFTはまずSFTを用いてモデルをウォームアップし,さらにオンライン強化学習,特に本論文のPPOアルゴリズムを用いる。 GSM8K、MathQA、SVAMPデータセットの実験では、ReFTがSFTを大幅に上回っている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:44:11 GMT)
Quantifying Positional Biases in Text Embedding Models [9.7]
テキスト埋め込みにおけるコンテンツ位置と入力サイズの影響について検討する。実験の結果, 埋め込みモデルは, 位置符号化機構によらず, 入力の開始点を不均等に優先順位付けしていることが判明した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:52:25 GMT)
PanSR: An Object-Centric Mask Transformer for Panoptic Segmentation [9.7]
パノプティクスのセグメンテーションはコンピュータビジョンの基本課題であり、自動運転車の認識にとって重要な要素である。最近のマスクトランスフォーマーベースの手法は、標準的なベンチマークでは素晴らしいパフォーマンスを達成しているが、小さなオブジェクト、混み合ったシーン、広範囲のオブジェクトスケールを示すシーンで重大な課題に直面している。そこで我々は,PanSRを用いたパン光学セグメンテーション手法を提案する。PanSRは,インスタンスのマージを効果的に軽減し,小さなオブジェクト検出を向上し,混み合うシーンにおけるパフォーマンスを向上し,挑戦的なLaRSベンチマーク上での最先端のPQを,Cityscapesで最先端のパフォーマンスに到達しつつ,注目すべき+3.4PQ向上を実現した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:12:37 GMT)
Performance evaluation of predictive AI models to support medical decisions: Overview and guidance [9.7]
本稿では,医療実践における予測AIモデルの有効性を検証する際に,古典的,現代的パフォーマンス指標のメリットを評価することを目的とする。ここでは,5つのパフォーマンス領域(識別,校正,総合,分類,臨床ユーティリティ)を対象として,グラフィカルな評価を伴う32のパフォーマンス指標について論じる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:11:47 GMT)
Synthetic Potential Outcomes and Causal Mixture Identifiability [9.6]
異種性は、類似性の異なる概念に従って集団をグループ化することで、複数のレベルで解決することができる。本稿では,システムに対する介入や摂動の因果反応に関するグループ化を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:58:47 GMT)
Targeted Hard Sample Synthesis Based on Estimated Pose and Occlusion Error for Improved Object Pose Estimation [9.6]
モデルに依存しない新しいハードサンプル合成法を提案する。本研究では,最先端ポーズ推定モデルを用いて,複数のROBIデータセットオブジェクトに対して最大20%の精度で検出率を向上することを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:59:08 GMT)
Direct Encoding of Declare Constraints in ASP [9.6]
Declare制約のための新しいエンコーディングを導入し、それらのセマンティクスを直接ASPルールとしてモデル化する。本稿では,2つのプロセスマイニングタスクにおける新しい手法の有効性を評価する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:11:33 GMT)
RAGServe: Fast Quality-Aware RAG Systems with Configuration Adaptation [9.5]
RAG (Retrieval Augmented Generation) は、大規模な言語モデルが外部知識でより良い応答を生成することを可能にする。本稿では、クエリを協調的にスケジュールし、各クエリのキーRAG構成を適応する最初のRAGシステムであるRAGServeについて述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:39:30 GMT)
Deep Learning for Spectrum Prediction in Cognitive Radio Networks: State-of-the-Art, New Opportunities, and Challenges [9.5]
本稿では,新しい帯域内時間スペクトル予測フレームワークViLSTransTMを提案する。このフレームワークは、視覚的自己注意と長期記憶を統合し、スペクトル利用パターンの局所的およびグローバル的長期的依存関係をキャプチャする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:36:05 GMT)
Vision Language Models See What You Want but not What You See [9.3]
他人の意図を知り、他人の視点をとることは、人間の知性の2つの中核的な構成要素である。本稿では,視覚言語モデルにおける意図理解と視点獲得について考察する。意外なことに、VLMは意図的理解では高いパフォーマンスを達成できるが、視点決定では低いパフォーマンスを実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:57:19 GMT)
Benchmarking Table Comprehension In The Wild [9.2]
TableQuestは、LLM(Large Language Models)の全体的なテーブル理解能力を評価するために設計された新しいベンチマークである。我々は7つの最先端モデルを用いて実験を行い、事実の特定に妥当な精度にもかかわらず、より洗練された推論や多段階の計算を行うために必要な場合には、しばしばフェールすることを示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:52:37 GMT)
Enhancing Nursing and Elderly Care with Large Language Models: An AI-Driven Framework [9.2]
本稿では,大規模言語モデル(LLM)の看護・介護への応用について検討し,AIによる患者のモニタリングとインタラクションに着目した。我々は,中国の看護データセットを導入し,インクリメンタル・プレトレーニング(IPT)と教師付き微調整(SFT)技術を実装し,特殊タスクにおけるLLM性能を向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:10:56 GMT)
Radiology Report Generation via Multi-objective Preference Optimization [9.2]
本稿では,MPO(Multi-objective Preference Optimization)を用いた新しいRRG手法を提案する。提案手法は,1つのモデルで異なる選好に適合するレポートを生成し,最先端の性能を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:55:30 GMT)
Political Actor Agent: Simulating Legislative System for Roll Call Votes Prediction with Large Language Models [9.0]
政治アクターエージェント(PAA)は、制限を克服するために大規模言語モデルを利用する新しいフレームワークである。ロールプレイングアーキテクチャを採用し、立法制度をシミュレートすることで、PAAはロールコール投票を予測するためのスケーラブルで解釈可能なパラダイムを提供する。我々は,第117-118回衆議院議員投票記録を用いた総合的な実験を行い,PAAの優れた性能と解釈可能性について検証した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:05:05 GMT)
AI and the Future of Digital Public Squares [9.0]
大規模言語モデル(LLM)の4つの応用を,デジタル公共広場の改良に適用する。 LLMはどちらも、大規模に会話のパラダイムをシフトする有望な機会を与え、デジタル公共広場に異なるリスクをもたらすと我々は主張する。我々は、デジタル公共広場を強化するAIの将来の研究と投資に関する議題を策定する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:15:20 GMT)
MalMixer: Few-Shot Malware Classification with Retrieval-Augmented Semi-Supervised Learning [8.7]
MalMixerは、スパーストレーニングデータを用いて精度の高い半教師付きマルウェアファミリー分類器である。そこで,MalMixerは,数ショットのマルウェアファミリー分類設定において,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:42:48 GMT)
Sharpening Your Density Fields: Spiking Neuron Aided Fast Geometry Learning [8.7]
そこで我々は,手動選択の必要性を排除し,閾値を動的に調整するスパイキングニューロン機構を導入する。我々は、合成データセットと実世界のデータセットの両方に関する広範な実験を通じて、我々のアプローチを検証する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:51:03 GMT)
Exact eigenstates of multicomponent Hubbard models: SU($N$) magnetic $η$ pairing, weak ergodicity breaking, and partial integrability [8.3]
一般化された$eta$-pairing機構は、外対角長距離秩序と磁気長距離秩序を特徴とする固有状態の構築を可能にする。これらの正確な固有状態は、ハバード・ハミルトニアンが効果的に非相互作用モデルに還元する可積分部分列を構成することを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:52:32 GMT)
Analyzing the Generalization and Reliability of Steering Vectors [8.3]
ステアリングベクトルは分布内および分布外の両方にかなりの制限があることを示す。分散において、ステアビリティは異なる入力間で高度に変動する。アウト・オブ・ディストリビューション(out-of-distribution)、ステアリングベクトル(steering vector)はよく一般化されるが、いくつかの概念はプロンプトの合理的な変化に対して脆弱である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:51:35 GMT)
secml-malware: Pentesting Windows Malware Classifiers with Adversarial EXEmples in Python [8.2]
secml-malwareは、最先端のホワイトボックスとブラックボックスの攻撃をWindowsマルウェア検知器に実装している。 secml-malwareは、Windowsのマルウェア検知器に対する敵攻撃を計算するための最初のPythonライブラリである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:02:11 GMT)
See Behind Walls in Real-time Using Aerial Drones and Augmented Reality [8.2]
ARD2は、2つの空中ドローンと拡張現実(AR)デバイスを使用したリアルタイムな壁面監視を可能にするフレームワークである。第1段階では、ARD2は、ドローン、ユーザ、ターゲット間の幾何学的関係を利用して、ターゲットの方向をユーザーのARディスプレイに投影する。第2段階では、ターゲットの輪郭を再構築するためにドローンの画像が合成され、ユーザは壁の後ろのターゲットを視覚化することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:45:39 GMT)
MVQ:Towards Efficient DNN Compression and Acceleration with Masked Vector Quantization [8.1]
限られた数のコードワードで重要な重みをよりよく近似することを目的としたMVQと呼ばれる新しいアプローチが提案されている。本アルゴリズムは,画像分類,オブジェクト検出,セグメンテーションタスクの様々なモデルで検証される。 ASIC評価では, MVQ加速器はエネルギー効率を2.3$times$で向上し, ベースEWS加速器と比較してサイストリックアレイのサイズを55%削減する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:30:35 GMT)
Solving Epistemic Logic Programs using Generate-and-Test with Propagation [8.0]
本稿では,エピステミック論理プログラムのためのジェネレーション・アンド・テストベースの解法のための一般的なフレームワークを提案する。線形オーバーヘッドを発生させるだけで、テストが必要な候補の数を指数関数的に削減できることを示す。我々はこれらの理論的な結果に基づいて新しい解法を実装し、よく知られたベンチマークで3.3倍のスピードアップを実現し、91%以上のインスタンスを解き、既存の解法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:05:14 GMT)
Meeting Utility Constraints in Differential Privacy: A Privacy-Boosting Approach [8.0]
本稿では,ほとんどのノイズ付加型DP機構と互換性のあるプライバシブースティングフレームワークを提案する。私たちのフレームワークは、ユーティリティ要件を満たすために、サポートの望ましいサブセットに出力が落ちる可能性を高める。提案手法は,実用性制約下での標準DP機構よりも低いプライバシー損失を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:34:30 GMT)
Label-template based Few-Shot Text Classification with Contrastive Learning [8.0]
本稿では,単純かつ効果的なテキスト分類フレームワークを提案する。ラベルテンプレートは入力文に埋め込まれ、クラスラベルの潜在値を完全に活用する。教師付きコントラスト学習を用いて、サポートサンプルとクエリサンプル間の相互作用情報をモデル化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:51:50 GMT)
Extracting PAC Decision Trees from Black Box Binary Classifiers: The Gender Bias Study Case on BERT-based Language Models [7.9]
決定木は一般的な機械学習手法であり、その固有の説明可能性で知られている。説明可能なAIでは、決定木は複雑なブラックボックスAIモデルのサロゲートモデルや、そのようなモデルの部品の近似として使用することができる。本稿では,AIモデルから抽出した決定ツリーの忠実度を理論的に保証するために,確率的近似(PAC)フレームワークを用いて検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:14:08 GMT)
When Quantum Meets Classical: Characterizing Hybrid Quantum-Classical Issues Discussed in Developer Forums [7.9]
ハイブリッド量子古典コンピューティングは、両方の世界のベストを達成するための妥協として浮上している。この研究は、ハイブリッドアプリケーションの開発者が直面している実世界の531の問題を徹底的に分析した。ハイブリッドアプリケーションの開発者にとって繰り返し発生する障害を特定し、それらを克服するための行動可能なレコメンデーションを特定します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:37:29 GMT)
Enhancing Multimodal Large Language Models Complex Reason via Similarity Computation [7.7]
LVLMの解釈可能性はまだ未調査領域である。 LLaVA1.5のようなモデルでは、テキストと意味的に関連付けられた画像トークンは、情報フローの収束度が高い。本稿では,LVLMの複雑な推論能力の向上を目的とした画像トークン削減手法であるSimignoreを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:13:44 GMT)
Precise Antigen-Antibody Structure Predictions Enhance Antibody Development with HelixFold-Multimer [7.7]
HelixFold-MultimerはAlphaFold-Multimerのフレームワーク上に構築されている。抗体発生の洞察を与え、より正確な結合部位の同定を可能にする。これらの進歩は、抗体研究と治療革新を支援するHelixFold-Multimerの可能性を浮き彫りにした。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:36:23 GMT)
Timealign: A multi-modal object detection method for time misalignment fusing in autonomous driving [7.6]
Timealignモジュールは、SOTA GraphBEVフレームワークに基づいて、LiDAR機能を予測し、監視と組み合わせて、そのような時間的ミスアライメントに取り組む。我々の研究は、LiDARのデータラグが存在するときの特徴の整合性を改善するために、LiDARの歴史的フレームを使用した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:48:38 GMT)
MST-R: Multi-Stage Tuning for Retrieval Systems and Metric Evaluation [7.6]
マルチステージチューニング戦略を用いて,検索器の性能を対象領域に適応させるシステムを提案する。 RIRAGチャレンジ用にリリースされたデータセット上で、システムパフォーマンスをベンチマークする。我々は、RegNLPチャレンジリーダーボードのトップランクを獲得することで、大きなパフォーマンス向上を達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:53:29 GMT)
Interlocking-free Selective Rationalization Through Genetic-based Learning [7.5]
我々は、学習オーバーヘッドを必要としない選択的合理化のための最初のインターロックフリーアーキテクチャであるGenSPPを提案する。人工的および実世界のベンチマーク実験により、我々のモデルはいくつかの最先端の競合より優れていることが示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:52:48 GMT)
A dual contrastive framework [7.4]
地域レベルの視覚理解は、大規模視覚言語モデルにとって大きな課題となる。潜在空間のきめ細かいアライメントによる領域レベルの理解を高めるためのフレームワークであるAlignCapを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:45:18 GMT)
Algorithmic Collusion Without Threats [7.3]
標準的な経済的な直観は、超競争的な価格が脅威の使用から生じるか、一方の当事者がその支払いを最適化するために失敗することである。双方のプレイヤーが脅威を符号化しないアルゴリズムを使っている場合でも、超競争的価格が出現する可能性があることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:48:14 GMT)
Simulating Hard Attention Using Soft Attention [7.3]
ソフトアテンショントランスフォーマーは、全ての注意を位置のサブセットに効果的に集中させることができることを示す。また, 温度スケーリングにより, ソフトマックス変圧器は, 平均重み付きアテンション変圧器の大規模サブクラスをシミュレートできることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:27:42 GMT)
A Grounded Typology of Word Classes [7.2]
情報理論に触発されて、意味的満足度を実証的な尺度として「接地性」を定義した。我々の測度は言語間の機能的(文法的)クラスと語彙的(コンテンツ的)クラスの間の満足度非対称性を捉えている。 30の言語に対する基底性スコアのデータセットをリリースします。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:58:48 GMT)
Observation of quantized vortex in an atomic Bose-Einstein condensate at Dirac point [7.2]
グラフェン様光ハニカム格子中の原子ボース-アインシュタイン凝縮物に基づくディラック点における量子化された渦の出現を観察した。我々の研究は、量子気体中で渦を生成する新しい方法を提供し、この方法は汎用的で、様々な種類の光学格子に適用できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:16:22 GMT)
Quasi-Bayesian sequential deconvolution [7.1]
ストリーミングやオンラインドメインで$f$を見積もるための、原則化されたシーケンシャルなアプローチを開発します。局所的および一様ガウス中心極限定理は$f_n$に対して成立し、信頼できる区間とバンドを$f$とする。本手法の実証的検証は, 合成データと実データを用いて行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:08:51 GMT)
Bridging Sequence-Structure Alignment in RNA Foundation Models [7.1]
基礎モデル(FM)におけるRNA配列と構造との整合性についてはまだ研究されていない。既存のFMは配列構造アライメントを確立するのに苦労しており、ゲノム情報の自由な流れを妨げる。 OmniGenomeはRNA配列を構造コンテクスト化されたモデリングに基づく二次構造に整合させる訓練されたRNA FMである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:59:58 GMT)
XYScanNet: An Interpretable State Space Model for Perceptual Image Deblurring [7.0]
ディープステートスペースモデル(SSM)は、CNNやTransformerネットワークに代わる有望な選択肢として浮上している。本研究では,スライスとスライスを交互に走査するスライス・アンド・スキャン方式を提案する。我々はXYScanNetを開発した。XYScanNetは軽量な機能融合モジュールと統合されたSSMアーキテクチャで、画像の劣化を改善できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:33:18 GMT)
Retrieval-Augmented Semantic Parsing: Using Large Language Models to Improve Generalization [6.9]
本稿では,Retrieval-Augmented Semantic Parsing (RASP)を紹介する。実験の結果,LLMはセマンティック解析において,従来のエンコーダ・デコーダベースラインよりも優れていることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:30:20 GMT)
Arbitrary Reading Order Scene Text Spotter with Local Semantics Guidance [6.9]
局所的な意味知識は、テキストの内容だけでなく、正しい読み順の空間情報も含んでいる。本研究では,ローカルセマンティックスガイドのシーンテキストスポッター(LSGSpotter)を提案する。 LSGSpotterは、洗練された検出の制限なしに任意の読み順スポッティングタスクを達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:20:43 GMT)
ExeChecker: Where Did I Go Wrong? [6.9]
本研究では,リハビリテーション演習の解釈のために,コントラスト学習ベースのフレームワークであるExeCheckerを提案する。我々の研究は、人間のポーズ推定、グラフアテンションニューラルネットワーク、トランスフォーマーの解釈の領域における最先端の進歩の上に成り立っている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:34:54 GMT)
UN-DETR: Promoting Objectness Learning via Joint Supervision for Unknown Object Detection [6.8]
Unknown Object Detection (UOD) は、クローズドワールドの仮定によって制限された伝統的な検出パラダイムとは異なる、目に見えないカテゴリのオブジェクトを識別することを目的としている。従来の手法では, 局所化情報と分類情報の両方から, 客観性学習のための監視信号が得られ, UODの性能は低下した。そこで我々は,UN-DETRというトランスフォーマーをベースとした UOD フレームワークを提案し,それに基づいて IPS (Instance Presence Score) を作成し,オブジェクトの存在の確率を表す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:45:11 GMT)
Results of the 2024 Video Browser Showdown [6.8]
本報告では,オランダのアムステルダムで開催された2024年1月29日のマルチメディアモデリング国際会議において,第13回ビデオブラウザ・ショーダウンの結果を報告する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:09:27 GMT)
Performance analysis of different photon-mediated entanglement generation schemes under optical dephasing and spectral diffusion [6.8]
固体量子エミッタは、チップスケールのフォトニックおよび電子デバイスとよく統合された量子ビットシステムを提供する。固体量子エミッタの現実雑音下での3つの共通光子媒介絡方式の性能を比較した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:02:18 GMT)
Efficient Solutions For An Intriguing Failure of LLMs: Long Context Window Does Not Mean LLMs Can Analyze Long Sequences Flawlessly [6.7]
大規模言語モデル(LLM)は、長い逐次入力の解釈と解析において顕著な能力を示した。本稿では,長い入力シーケンスを扱う場合,LLMが短くなるという,驚くべき制限を明らかにする。本稿では,LLMの性能を最大50%向上させるアドホックな手法を提案し,評価する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:29:05 GMT)
IGNITE: Individualized GeNeration of Imputations in Time-series Electronic health records [6.6]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。 IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:04:57 GMT)
KVDirect: Distributed Disaggregated LLM Inference [6.6]
大規模言語モデル(LLM)は多くの応用の新たな基盤となり、嵐のように人間の社会を形作る。プリフィルとデコードステージを分離する分散推論は、ハードウェア利用とサービス品質を改善するための有望なアプローチである。本稿ではKVキャッシュ転送を最適化したKVDirectを導入し,分散分散分散分散化LLM推論を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:54:16 GMT)
WormKAN: Are KAN Effective for Identifying and Tracking Concept Drift in Time Series? [6.4]
WormKANはコンセプトを意識したkanベースのモデルで、共同進化する時系列のコンセプトドリフトに対処する。 WormKANはPatch Normalization、Temporal Representation Module、Concept Dynamicsの3つの重要なコンポーネントで構成されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:23:09 GMT)
Pretraining Vision-Language Model for Difference Visual Question Answering in Longitudinal Chest X-rays [6.4]
差分視覚質問応答(diff-VQA)は、画像間の差分に基づいて複雑な質問に答えることを必要とする課題である。以前はdiff-VQAタスクのための特定のネットワークアーキテクチャの設計に重点が置かれていたが、モデルの性能を高める機会がなかった。本稿では,diff-VQAタスクのための自然および縦部胸部X線データに基づいて,PLURALと呼ばれる新しいVLMを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:59:10 GMT)
Keep It Simple: Towards Accurate Vulnerability Detection for Large Code Graphs [6.2]
本稿では,階層グラフの洗練と文脈対応グラフ表現学習を具現化した新たな脆弱性検出手法であるANGLEを提案する。本手法は, 精度とF1スコアの点で, 他のいくつかのベースラインを著しく上回っている。大きなコードグラフでは、ANGLEは最先端のAMPLEに比べて34.27%-161.93%の精度向上を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:27:51 GMT)
Comparing Differentiable and Dynamic Ray Tracing: Introducing the Multipath Lifetime Map [6.1]
これらの課題に対処するために、微分可能および動的レイトレーシングフレームワークが登場した。この2つのテクニックの概要と、NVIDIAのUniBoの3DSCATとSionnaの2つの最先端ツールの比較分析について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:48:46 GMT)
CP-DETR: Concept Prompt Guide DETR Toward Stronger Universal Object Detection [6.0]
ほぼ全てのシナリオにおいて競合するCP-DETRと呼ばれる強力な普遍的検出基盤モデルを提案する。具体的には、プロンプトと視覚間の情報相互作用を強化する効率的なプロンプト視覚ハイブリッドエンコーダを設計する。テキストプロンプトに加えて、視覚プロンプトと最適化プロンプトという2つの実用的な概念プロンプト生成手法を設計した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:36:29 GMT)
HiTZ at VarDial 2025 NorSID: Overcoming Data Scarcity with Language Transfer and Automatic Data Annotation [6.0]
Intent Detection, Slot Filling, Dialect Identificationの3つのタスクからなるNorSID共有タスクを提案する。 Intent DetectionとSlot Fillingでは、17言語で利用可能なxSIDデータセットを活用するために、言語間設定でマルチタスクモデルを微調整した。ダイアレクト同定の場合、最終的な提案は、提供された開発セットに微調整されたモデルで構成され、最高スコアを得た。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:31:06 GMT)
Self-test loss functions for learning weak-form operators and gradient flows [6.0]
未知のパラメータに依存するテスト関数を用いる自己テスト損失関数を導入する。提案した自己テスト損失関数はエネルギー勾配を保存し、微分方程式の対数類似比と一致する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:46:39 GMT)
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens [5.9]
ResGenは、サンプリング速度を損なうことなく高忠実度サンプルを生成する効率的なRVQベースの離散拡散モデルである。我々は,ImageNet 256x256における条件付き画像生成とゼロショット音声合成の2つの課題に対して,提案手法の有効性と一般化性を検証する。 RVQの深さを拡大するにつれて、我々の生成モデルは、同様の大きさのベースラインモデルと比較して、より優れた生成忠実度またはより高速なサンプリング速度を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:31:17 GMT)
SVGBuilder: Component-Based Colored SVG Generation with Text-Guided Autoregressive Transformers [5.9]
本稿では,テキスト入力から高品質な色付きSVGを生成するためのコンポーネントベース自動回帰モデルを提案する。計算オーバーヘッドを大幅に削減し、従来の方法に比べて効率を向上する。既存のSVGデータセットの限界に対処し、我々の研究を支援するために、カラーSVGの最初の大規模データセットであるColorSVG-100Kを紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:24:11 GMT)
CONCLAD: COntinuous Novel CLAss Detector [5.9]
本稿では,展開後データにおける新規クラス検出の問題に対する包括的解決法を提案する。我々は、既知のクラス(es)サンプルと新しいクラス(es)サンプルを区別するために、反復不確実性推定アルゴリズムを用いる。私たちは受け入れ次第コードを公開します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:41:28 GMT)
A Comparative Study of LLMs, NMT Models, and Their Combination in Persian-English Idiom Translation [5.7]
本稿ではペルシャ語$rightarrow$ Englishと英語$rightarrow$Persian翻訳の慣用表現を含む2つのパラレルデータセットを紹介する。オープンソースとクローズドソースのLLM, NMTモデルおよびそれらの組み合わせを評価した。クロード3.5-ソネットは、両方の翻訳方向において優れた結果をもたらす。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:29:27 GMT)
GraSP: Simple yet Effective Graph Similarity Predictions [5.7]
グラフ類似性計算 (GSC) とは、1組のグラフ間の類似性を計算することである。 GraSP は、GED および MCS 予測のための単純だが効果的な GSC アプローチである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:55:02 GMT)
Operator solutions of linear systems and small cancellation [5.6]
特に、$mathbbZ_p$、$$p$の奇素数上の線型系が存在する。特に、$mathbbZ_p$、$$p$の奇素数上の線型系が存在する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:40:42 GMT)
Adversarial Robustness of Bottleneck Injected Deep Neural Networks for Task-Oriented Communication [5.6]
本稿では,Deep Neural Networks (DNNs) のタスク指向通信システムにおけるinformation Bottleneck (IB) 目標を用いた対角的ロバスト性について検討する。 IBベースのアプローチは、下流タスクをターゲットにした攻撃に対してベースラインレジリエンスを提供するが、タスク指向コミュニケーションのための生成モデルへの依存は新たな脆弱性をもたらすことを実証的に示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:33:36 GMT)
Unveiling the Energy Vampires: A Methodology for Debugging Software Energy Consumption [5.6]
本稿では,ソフトウェアシステムにおけるエネルギー消費ホットスポットの同定と分離のためのエネルギーデバッグ手法を提案する。分析の結果,AlpineディストリビューションとUbuntuディストリビューションのエネルギー消費の相違が明らかとなった。我々は,memcpyの分離とベンチマークにより,エネルギー差の主な原因として確認した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:49:19 GMT)
GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion [5.5]
記録からの光リアルな3D頭部アバター再構成は、観測が限られているため困難である。複数視点の頭部拡散モデルを導入し,その先行特性を利用して,欠落した領域を埋め,視界の整合性を確保する。本研究では,コモディティデバイスで撮影したモノクローナルビデオから高忠実度アバターを復元した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:31:22 GMT)
QSM-RimDS: A highly sensitive paramagnetic rim lesion detection and segmentation tool for multiple sclerosis lesions [5.5]
常磁性リム病変(英: Paramagnetic rim lesions, PRLs)は、MS病変における自然免疫応答のバイオマーカーである。 QSM-RimDSは、共同PRL区分けとPRL検出のためのディープラーニングベースのツールである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:18:00 GMT)
Trustworthy and Explainable Decision-Making for Workforce allocation [5.3]
本稿では、労働力配分のための意思決定ツールの開発に焦点をあてた進行中のプロジェクトについて述べる。私たちの目標は、スケジュールされたタスクへのチームの配置を最適化するだけでなく、その決定に対して明確で理解可能な説明を提供するシステムを作ることです。このツールは、Human-in-the-loopメカニズムを組み込むことで、ユーザの信頼を高め、対話的なコンフリクト解決を促進することを目的としている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:46:13 GMT)
A Call to Arms: AI Should be Critical for Social Media Analysis of Conflict Zones [5.2]
本稿は、ウクライナ戦争で記録された、特定の兵器システムと、それらを用いた武装集団の記章を特定することに焦点を当てる。この研究は、コンフリクトコンテキストに関する類似のオンラインドキュメントを調べるための大きな機会を示しています。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:33:32 GMT)
Analyzing Neural Network Robustness Using Graph Curvature [5.2]
本稿では,グラフ理論解析の観点から,ニューラルネットワーク(NN)のロバスト性問題に対する新たな考察を示す。我々は、ニューラルネットワークのリッチ曲率の概念を定義し、それをNN出力に"データ転送に頻繁に使用されるボトルネックNNエッジを特定するために使用します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:00:50 GMT)
ExclaveFL: Providing Transparency to Federated Learning using Exclaves [5.1]
ExclaveFLは、攻撃を検出するためのエンドツーエンドの透明性と整合性を実現するFLプラットフォームである。実験の結果,ExclaveFLは,広範囲な攻撃を検知しながら,9%未満のオーバーヘッドを発生させることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:20:30 GMT)
Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices [5.1]
Crack-EdgeSAMは、プロンプトボックスを生成するためにYOLOv8を統合するセルフプロンプトクラックセグメンテーションシステムである。このシステムは1024×1024ピクセルの画像を、私たちのPC上で46FPS、Jetson Orin Nanoで8FPSで処理します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:38:04 GMT)
Infinite-dimensional next-generation reservoir computing [5.0]
次回の貯水池計算(NG-RC)は、複雑なシステムの時間内予測の優れた性能に多くの注目を集めている。本稿では, NG-RCは, 空間共有機能が非常に大きい場合でも, 訓練が実現可能な隆起として普遍性を持つことを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:39:04 GMT)
Towards Fair Graph Neural Networks via Graph Counterfactual without Sensitive Attributes [5.0]
本稿では,Fairwosというフレームワークを提案する。まず, 疑似感性属性を生成する機構を提案し, 疑似感性属性の欠如を解消する。次に、実際のデータセットからグラフ反事実を見つけるための戦略を設計する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:11:40 GMT)
WordVIS: A Color Worth A Thousand Words [4.9]
文書分類において、マルチモーダルなアプローチがますます人気になっている。これらのアプローチは、膨大な量のトレーニングデータと広範な計算能力を必要とするため、未利用である。本稿では,テキスト機能を直接視覚空間に埋め込むことにより,これらの問題に対処する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:12:55 GMT)
Leveraging Programmatically Generated Synthetic Data for Differentially Private Diffusion Training [4.8]
プログラムで生成された合成データは、プライバシーの漏洩を避けるために、分類のための差分プライベートトレーニングに使われてきた。合成データで訓練されたモデルは非現実的なランダムな画像を生成し、生成モデルに合成データを適用するための課題を提起する。この課題に対処するために、拡散モデルで生成された合成データを活用するDPSynGenを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:22:23 GMT)
Robust image classification with multi-modal large language models [4.7]
逆の例では、ディープニューラルネットワークが不正確な予測を高い信頼性で行う可能性がある。これらの脆弱性を軽減するために、事前にモデルを強化するために、敵の訓練と検出に基づく防御が提案されている。本稿では,これらの防衛を多モード情報と組み合わせ,補完する新しい防衛手法であるMulti-Shieldを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:49:25 GMT)
SoK: Decentralized AI (DeAI) [4.7]
ブロックチェーンベースのDeAIソリューションのためのSoK(Systematization of Knowledge)を提案する。モデルライフサイクルに基づいて既存のDeAIプロトコルを分類する分類法を提案する。我々は、ブロックチェーン機能がAIプロセスのセキュリティ、透明性、信頼性の向上にどのように貢献するかを調査する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:08:32 GMT)
Computational Advantage in Hybrid Quantum Neural Networks: Myth or Reality? [4.6]
ハイブリッド量子ニューラルネットワーク(HQNN)は、計算性能を向上させる可能性に注目されている。量子層は純粋に古典的なモデルよりも計算上の優位性を提供しますか? 本稿では,従来のモデルとハイブリッドモデルがアーキテクチャの複雑さを増す問題にどのように適応するかを考察する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:59:47 GMT)
Iterating the Transient Light Transport Matrix for Non-Line-of-Sight Imaging [4.6]
時間分解非視線イメージング(NLOS)は、TLTM(Transient Light Transport Matrix)の一部を測定するアクティブシステムを利用する本研究では,全TLTMを効率の良いアルゴリズムで処理し,隠れたシーンの異なる部分の照明を集中して検出できることを実証する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:35:42 GMT)
Activation Sparsity Opportunities for Compressing General Large Language Models [4.6]
この研究は、最先端AIモデルにおけるアクティベーション空間の強制とパープレキシティ(精度)のトレードオフを体系的に調査する。重要なFFN成分の主記憶容量の約50%の削減と計算精度の低下を無視できる精度で達成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:26:54 GMT)
Expressive MIDI-format Piano Performance Generation [4.5]
この研究は、MIDIフォーマットで表現力のあるピアノ演奏を生成することができる生成型ニューラルネットワークを示す。音楽の表現性は、鮮明なマイクロタイピング、豊かなポリフォニックテクスチャ、様々なダイナミクス、持続的なペダル効果によって反映される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:35:16 GMT)
Sparse Portfolio Selection via Topological Data Analysis based Clustering [4.5]
本稿では、トポロジカルデータ解析ツールを使用し、スパースポートフォリオ構築に適したデータ駆動クラスタリングに基づくストックセレクション戦略を提案する。クラスタリングアルゴリズムとTDAを統合する戦略は,多様な市場シナリオにおいて,さまざまなパフォーマンス指標にまたがるスパースポートフォリオのパフォーマンスを著しく向上させた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:20:13 GMT)
Automated Collection of Evaluation Dataset for Semantic Search in Low-Resource Domain Language [4.5]
多くの特定の用語を使用するドメイン固有言語は、しばしば低リソース言語に分類される。本研究では,低リソースなドメイン固有ドイツ語のセマンティック検索を評価するために,テストデータセットの自動収集という課題に対処する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:47:26 GMT)
Leveraging Large Language Models to Detect npm Malicious Packages [4.5]
本研究では,Large Language Models (LLMs) の有効性を実証的に検討した。我々は、悪意のあるコードを検出する悪意のあるコードレビューワークフローであるSocketAIを紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:41:50 GMT)
TACOMORE: Leveraging the Potential of LLMs in Corpus-based Discourse Analysis with Prompt Engineering [4.4]
LLMを取り入れたコーパスベースの談話分析は、不満足なパフォーマンス、幻覚、そして不成功の問題によって妨げられていると論じられている。提案手法であるTACOMOREは,この領域において効果的なプロンプトフレームワークとして機能することを目的としている。我々は, GPT-4o, Gemini-1.5-Pro, Gemini-1.5.Flashの3つのLLM実験を行い, TACOMOREが3つの代表的な談話解析タスクにおいて, LLMの性能向上に役立つことを発見した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:41:24 GMT)
MVCTrack: Boosting 3D Point Cloud Tracking via Multimodal-Guided Virtual Cues [4.3]
3Dオブジェクトトラッキングは、自律走行とロボット工学において不可欠である。既存の方法は、しばしばスパースと不完全なポイントクラウドのシナリオで苦労する。疎点雲を豊かにする仮想キューを生成するマルチモーダル誘導仮想キュー投影方式を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:17:48 GMT)
Schmidt number criterion via general symmetric informationally complete measurements [4.3]
一般対称情報完全測定から得られた相関行列のトレースノルムに基づいてシュミット数基準を導出する。我々は,このシュミット数基準が,フィデリティ,CCNR,MUB,EAMなどの他の基準よりも有効で優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:01:37 GMT)
Differentially Private Multi-Sampling from Distributions [4.3]
本研究は,DPエフェッスルサンプリングのサンプル複雑性,すなわち,このタスクの実行に必要なサンプルの最小数について検討する。エンフルティサンプリングの2つの変種を定義し、そこでは、プライベートに$m>1$サンプルを近似することを目的としている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:14:05 GMT)
FIRE-3DV: Framework-Independent Rendering Engine for 3D Graphics using Vulkan [4.2]
本稿では,最新のVulkanグラフィックスAPIをサポートする,パフォーマンスを重視した軽量レンダリングエンジンを提案する。我々のエンジンは、動的シミュレーションフレームワークであるAMBF(Asynchronous Multi-Body Framework)のレガシーレンダリングパイプラインの近代化に使用されている。実験によると、エンジンは2ミリ秒以内のGPU計算時間を維持しながら、700万以上の三角形でシミュレーションされたシーンをレンダリングできる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:10:27 GMT)
VLR-Bench: Multilingual Benchmark Dataset for Vision-Language Retrieval Augmented Generation [4.2]
本稿では,視覚言語モデル(VLM)を検索拡張生成(RAG)に基づいて評価するための視覚質問応答(VQA)ベンチマークであるVLR-Benchを提案する。既存の外部知識に基づくVQA評価データセットとは異なり、提案したVLR-Benchは5つの入力パスを含む。提案手法は,VLR-IFと表される命令追従を自動生成する32,000のデータセットを構築した。このデータセットは、入力パスに基づいて適切な回答を生成する方法を学ぶことによって、VLMのRAG能力を高めるように設計されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:11:26 GMT)
Distributed Phase Estimation Algorithm and Distributed Shor's Algorithm [4.2]
Shorのアルゴリズムは、最も重要な量子アルゴリズムの1つである。 NISQ時代には相当量の量子ビットを必要とする。分散位相推定アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:30:53 GMT)
On the Limit of Language Models as Planning Formalizers [4.1]
大規模言語モデルは、接地された環境で検証可能な計画を作成するのに失敗する。新たな作業のラインは、計画領域の形式表現を生成するフォーマライザとしてLLMを使うことの成功を示しています。我々は,PDDLとして記述を効果的に定式化できるモデルが十分に大きいことを観察し,それらを直接的に生成する計画よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:50:22 GMT)
Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems [4.1]
Retrieval Augmented Generation(RAG)は、会話質問回答(ConvQA)を介して企業のデータと対話するためのバックボーンとして機能する。本研究では,RAGONITE(RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE ,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGO NITE)について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:28:17 GMT)
Benchmarking LLMs for Mimicking Child-Caregiver Language in Interaction [4.1]
LLMは人間のような対話を生成できるが、初期の子どもと大人の交流をシミュレートする能力はほとんど解明されていない。現状のLSMは、単語と発話レベルにおいて、子どもと介護者の対話を近似することができるが、子どもと介護者の分散パターンの再現に苦慮し、アライメントを誇張し、人間によって示される多様性のレベルに到達できなかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:30:36 GMT)
ProbeSDF: Light Field Probes for Neural Surface Reconstruction [4.0]
SDFベースのディファレンシャルレンダリングフレームワークは、最先端のマルチビュー3次元形状再構成を実現している。我々は、その中核的な外観モデルを最小限に修正することで、このアプローチの族を再検討する。この性能は、広く異なる2つの一般的なアプリケーションフィールド上の実データ上で一貫して達成されることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:18:26 GMT)
Brain-inspired Chaotic Graph Backpropagation for Large-scale Combinatorial Optimization [4.0]
教師なし学習を伴うグラフニューラルネットワーク(GNN)は、効率的な時間複雑性で大規模最適化問題(COP)を解決することができる。しかし、現在の主流のバックプロパゲーションベースのトレーニングアルゴリズムは、ローカルなミニマに陥りがちである。カオスグラフバックプロパゲーション(CGBP)というカオス学習アルゴリズムを導入し,カオスだけではなく,高い効率でトレーニングを行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:00:57 GMT)
Towards Efficient Methods in Medical Question Answering using Knowledge Graph Embeddings [3.9]
自然言語処理(NLP)では、機械読解(MRC)は与えられた文脈に基づいて質問に答えるタスクである。医療領域における質問に対処するために、BioBERT、SciBERT、ChatGPTといった現代言語モデルは、膨大なドメイン内医療コーパスで訓練されている。本稿では、そのようなドメイン固有の事前学習に頼ることなく、モデルにドメイン知識を注入するためのリソース効率のよいアプローチを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:19:47 GMT)
Solving Robust Markov Decision Processes: Generic, Reliable, Efficient [3.8]
マルコフ決定プロセス(MDP)は確率の存在下でのシーケンシャルな意思決定のための確立されたモデルである。我々は、汎用的で信頼性があり、効率的なRMDPを解くためのフレームワークを提供する。我々のプロトタイプ実装は、既存のツールよりも桁違いに優れている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:55:48 GMT)
Recommendation and Temptation [3.7]
本稿では、二元的行動を考慮した新しいユーザモデルを提案し、最適な推薦戦略を開発する。提案手法は,MovieLensデータセットから得られた実世界のデータに基づいて,合成シミュレーションとシミュレーションの両方を用いて評価する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:44:22 GMT)
TTAQ: Towards Stable Post-training Quantization in Continuous Domain Adaptation [3.7]
トレーニング後の量子化(PTQ)は、完全な精度のモデルを小さなキャリブレーションセット上で低ビット表現に量子化することで、ハードウェアの過大なコストを削減する。従来のPTQメソッドは、動的で絶え間なく変化する現実世界のシナリオで失敗することが多い。本稿では、従来のPTQの性能劣化に対処するため、TTAQと呼ばれるテスト時間適応のための新しい安定な量子化プロセスを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:34:59 GMT)
Shape error prediction in 5-axis machining using graph neural networks [3.6]
本稿では, グラフニューラルネットワークを用いた5軸加工における形状誤差の予測手法を提案する。グラフ構造は、表面点と隣接する関係を表すノードで定義される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:38:47 GMT)
Err on the Side of Texture: Texture Bias on Real Data [3.6]
テクスチャ・アソシエーション・バリュー(TAV)は、オブジェクトを分類する際に特定のテクスチャの存在に依存するモデルがいかに強く依存しているかを定量化する新しいメトリクスである。以上の結果から, テクスチャバイアスは, その90%以上は, 学習したテクスチャと真のラベルとが一致していないテクスチャを含む自然対逆例の存在を説明できることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:53:16 GMT)
Symmetry enforced entanglement in maximally mixed states [3.6]
量子多体系の絡み合いは通常、環境との相互作用に脆弱である。不変セクターにおける最大混合状態の絡み合いと相関を解析する。すべてのアベリア対称性に対して、MMISは分離可能であり、全ての非アベリア対称性に対して、MMISは絡み合っている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:23:09 GMT)
Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models [3.5]
高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:04:21 GMT)
Improvement in Sign Language Translation Using Text CTC Alignment [3.5]
本稿では,CTC/AttentionとTransfer Learningを組み合わせた新しい手法を提案する。共同CTC/Attentionは階層的エンコーディングを導入し、デコード中の注意機構とCTCを統合する。提案手法は,最先端技術に匹敵する結果を達成し,純アテンションベースラインを上回ります。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:34:05 GMT)
SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames [3.5]
SF-Locは軽量なビジュアルマッピングとマップ支援型ローカライゼーションシステムである。マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:05:27 GMT)
Neural Network-Based Frequency Optimization for Superconducting Quantum Chips [3.5]
超伝導量子チップのためのニューラルネットワークに基づく周波数構成手法を提案する。トレーニングされたニューラルネットワークモデルは、周波数設定エラーを推定し、中間最適化戦略は、チップのローカライズされた領域内の最適な構成を特定する。また、変動量子固有解法のためのクロストーク対応ハードウェア効率アンサッツを設計し、改良されたエネルギー計算を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:47:52 GMT)
Enhanced Low-Dose CT Image Reconstruction by Domain and Task Shifting Gaussian Denoisers [3.5]
低放射線線量 (LDCT) からのCTは, 投射データに高ノイズが伴うため困難である。本稿では,2段階の手法と最先端の再現性を組み合わせた簡易性と効率性を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:11:35 GMT)
Role-playing Prompt Framework: Generation and Evaluation [3.3]
大規模言語モデル(LLM)は、自然言語生成、ユーザ命令の理解、人間に似た言語使用のエミュレートにおいて、優れた習熟度を示す。本稿では、ロールプレイング対話データセットの生成にGPTの機能を活用するために設計されたプロンプトベースのフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:13:08 GMT)
Accessible, At-Home Detection of Parkinson's Disease via Multi-task Video Analysis [3.2]
既存のAIベースのパーキンソン病検出方法は、主にモータや音声タスクの単調な分析に焦点を当てている。本稿では,このマルチモーダルデータを利用して診断精度を向上させる不確実性校正核融合ネットワーク(UFNet)を提案する。 UFNetは、精度、ORC曲線下(AUROC)の面積、非隣接特異性を維持しながら感度において、シングルタスクモデルよりも優れていた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:46:38 GMT)
Modeling Story Expectations to Understand Engagement: A Generative Framework Using LLMs [3.2]
本稿では,ストーリーがどのように展開されるかという聴衆の考え方をモデル化するための新しい枠組みを紹介する。提案手法は,各ストーリーの複数の潜在的継続を生成し,期待,不確実性,驚きに関連する特徴を抽出する。その結果、読み、コメント、投票のためのエンゲージメントの異なるタイプは、現在のコンテンツ機能と期待されるコンテンツの異なる組み合わせによって引き起こされることが明らかとなった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:53:34 GMT)
Sims: An Interactive Tool for Geospatial Matching and Clustering [3.1]
similarity Search (Sims)は、ユーザーが関心のある領域を視覚化し、比較し、地理空間検索を行うことができるノーコードウェブツールである。 Simsは、モデル作成よりも機能探索に焦点を当てることで、既存のモデリングツールを補完するように設計されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:55:24 GMT)
Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data [3.1]
ゼロショットNERに対して報告されたF1スコアは、これらのアプローチの真の能力を過大評価している。本稿では,学習と評価におけるエンティティタイプ間のセマンティックな類似性の両方をキャプチャする,ファミリアリティ(Familiarity)を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:06:58 GMT)
SPT: Sequence Prompt Transformer for Interactive Image Segmentation [3.1]
対話型セグメンテーションにシーケンシャルな画像情報を利用するSPT(Sequence Prompt Transformer)を提案する。本モデルは,(1)画像のシーケンスから情報を取得するシーケンス・プロンプト・トランスフォーマー(SPT)と,その精度向上のためのクリック・マスクの2つのキーコンポーネントから構成される。我々は、複数のベンチマークデータセットに対するアプローチを評価し、我々のモデルがすべてのデータセットにまたがる最先端の手法を超えることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:49:18 GMT)
Harnessing Large Language Models for Mental Health: Opportunities, Challenges, and Ethical Considerations [3.1]
大規模言語モデル(LLM)は、メンタルヘルスの専門家にリアルタイムサポート、データ統合の改善、ケアを探す行動を促進する能力を促進するAI駆動のツールである。しかし、その実装には重大な課題と倫理的な懸念が伴う。本稿では,精神保健におけるLLMの変容の可能性について検討し,関連する技術的・倫理的複雑さを強調し,協調的・多分野的なアプローチを提唱する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:18:51 GMT)
Artificial Intelligence in Mental Health and Well-Being: Evolution, Current Applications, Future Challenges, and Emerging Evidence [3.1]
本稿では、メンタルヘルスと幸福のためのAI分野における進化、現状、今後の課題について論じる。メンタルヘルスにおけるAIの統合は、伝統的な治療とオープン・イノベーティブなソリューションを強化するために急速に成長している。しかし倫理的な課題は、プライバシ、データセキュリティ、アルゴリズムの偏見に続きます。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:06:35 GMT)
Do Large Language Models Show Biases in Causal Learning? [3.0]
因果学習は、利用可能な情報に基づいて因果推論を行う能力を開発するための認知過程である。本研究では,大言語モデル(LLM)が因果錯覚を発生させるかどうかを考察する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:03:48 GMT)
Are Conditional Latent Diffusion Models Effective for Image Restoration? [3.0]
CLDMは高いレベルの意味的相関を捉えるのに優れており、空間条件付きテキスト・ツー・イメージ生成のようなタスクに効果的である。画像の知覚品質を高めることが目的であるIRにおいて、これらのモデルは劣化した画像と地上の真実画像の関係をモデル化することが困難である。その結果, CLDMのスケーリングの利点にもかかわらず, 特に劣化の少ない場合には, 高い歪みや意味的偏差が生じることが明らかとなった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:51:11 GMT)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [3.0]
大言語モデルに埋め込まれた様々な種類のバイアスの影響を評価して、センシティブな分野における公正な利用を保証することが重要である。英語には偏見評価に関する広範な研究があるが、バングラ語のような主要言語にとって、そのような取り組みは稀で不十分である。これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:55:37 GMT)
Synthetic to Authentic: Transferring Realism to 3D Face Renderings for Boosting Face Recognition [3.0]
画像から画像への変換技術(I2I)の3次元レンダリング画像への現実性伝達の可能性について検討した。本研究では、3Dレンダリング画像にリアリズムを移すことにより、3Dレンダリング画像をよりリアルに見せることにより、顔認識(FR)システムの性能を高めることができることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:09:55 GMT)
Is it the model or the metric -- On robustness measures of deeplearning models [2.8]
ディープフェイク検出の文脈におけるロバスト精度(RA)の正当性について再検討する。本稿では, RAとRRの比較を行い, モデル間の類似のRAにもかかわらず, モデルが異なる許容レベル(摂動レベル)でRRが変化することを示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:26:58 GMT)
A Practical Quantum Hoare Logic with Classical Variables, I [2.8]
古典変数を持つ量子プログラムを推論するためのHoare型論理について述べる。私たちのアプローチは、以前の作業よりもいくつかの改善を提供します。これは量子配列とパラメータ化された量子ゲートを含む古典変数を持つ量子プログラムに適用される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:28:19 GMT)
Predicting Many Crystal Properties via an Adaptive Transformer-based Framework [2.8]
本稿では,空間群,要素情報,単位セル情報を統合する適応型トランスフォーマーベースのフレームワークであるCrystalBERTを紹介する。これらの特徴を取り入れることで、トポロジカルな分類において91%の精度を達成し、先行研究を超越し、以前は誤分類されていた物質を同定する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:23:03 GMT)
Panacea: Novel DNN Accelerator using Accuracy-Preserving Asymmetric Quantization and Energy-Saving Bit-Slice Sparsity [2.8]
低ビット精度とそれらのビットスライス間隔は、大規模ディープニューラルネットワーク(DNN)推論において、GEMM(GeneralMatrix-multiplications)を加速するために研究されている。近年の研究では、追加の操作を必要とせず、アクティベーションに非対称量子化を積極的に活用している。本稿では,非対称化ビットスライスGEMMを初めて提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:44:09 GMT)
Matrix Completion via Residual Spectral Matching [2.7]
ノイズ行列の完成は、レコメンデーションシステム、信号処理、画像復元などへの応用により、大きな注目を集めている。本稿では,残差の数値的および位置的情報を含む新しい残差スペクトルマッチング基準を提案する。スパースランダム行列のスペクトル特性を解析し,低ランク摂動と部分観測の影響を限定することによって,最適統計特性を導出する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:42:42 GMT)
Atomic Learning Objectives Labeling: A High-Resolution Approach for Physics Education [2.7]
本稿では,物理学習のための高分解能マップを作成するための新しいアプローチを提案する。物理問題の自動ラベル付けには,大規模言語モデルを用いる。我々の研究は、学習目標を質問にマッピングするより粒度の細かいアプローチを提案することによって、学習分析の分野に貢献する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:05:31 GMT)
Optimal Geometry of Oscillators in Gravity-Induced Entanglement Experiments [2.7]
フォームファクタが$Lambda$の上限が2pi$であることを示し、発振器システムの基本的な限界を明らかにする。この最適化は実験的な制約を緩和し、GIEに基づく量子重力の検証を実現に近づける。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:56:09 GMT)
Agro-STAY : Collecte de données et analyse des informations en agriculture alternative issues de YouTube [2.6]
CNRS STAYプロジェクト(Savoirs Techniques pour l'Auto-Suffisance, sur YouTube)では、YouTubeで共有されるテクニックを分析して、このトピックを探求している。 Agro-STAYは、YouTubeビデオとそのコメントからのデータの収集、処理、視覚化のために設計されたプラットフォームである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:37:37 GMT)
Data-Driven Transfer Learning Framework for Estimating Turning Movement Counts [2.6]
本研究では,交点における移動数(TMC)の推定に伝達学習を活用する新しい枠組みを提案する。提案したTLモデルの性能を8つの最先端回帰モデルと比較し,平均絶対誤差とルート平均正方形誤差の最小値を得た。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:02:16 GMT)
A Hybrid Real-Time Framework for Efficient Fussell-Vesely Importance Evaluation Using Virtual Fault Trees and Graph Neural Networks [2.6]
Fussell-Vesely Importance (FV)は、システム障害に対する基本的なイベントの影響を反映している。従来のFVの計算方法は複雑で時間を要する。本研究では,基本事象のFV重要度を評価するためのハイブリッドリアルタイムフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:31:44 GMT)
AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark [2.6]
データクリーニングを自動的に生成する大規模言語モデル(LLM)の推論能力を評価する。本研究では, LLMエージェントが, 様々な難易度でそのアドレスデータクリーニング目的を自動的に生成する能力を評価するためのデータクリーニングベンチマークを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:43:35 GMT)
What constitutes a Deep Fake? The blurry line between legitimate processing and manipulation under the EU AI Act [2.5]
私たちは、EUのAI法におけるディープフェイクの定義は、ディープフェイクによって引き起こされる課題に対処するために十分に特定されていないと論じています。この定義は、ディープフェイク(deep fake)のスコープが多すぎる。 Googleのベストテイク機能のような編集機能が、透明性義務の例外であると考えることができるかは不明だ。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:42:19 GMT)
FDM-Bench: A Comprehensive Benchmark for Evaluating Large Language Models in Additive Manufacturing Tasks [2.5]
複雑なパラメータの管理とFused Deposition Modelingにおける印刷欠陥の解決は依然として困難である。大きな言語モデル(LLM)は、FDMにおけるこれらの課題に対処する可能性を提供します。 FDM-Benchは、FDM固有のタスク上でLLMを評価するために設計されたベンチマークデータセットである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:16:14 GMT)
Temporal Causal Discovery in Dynamic Bayesian Networks Using Federated Learning [2.4]
本研究では,動的ベイズネットワークの構造を,各パーティに水平に分散したデータから推定するフェデレート学習手法を提案する。合成および実データを用いた実験結果から,本手法が他の最先端技術より優れていることが明らかとなった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:09:35 GMT)
Low-Rank Adaptation with Task-Relevant Feature Enhancement for Fine-tuning Language Models [2.4]
ニューラルネットワーク表現の編集の観点から,タスク関連機能向上のためのローランク適応型タスク関連特徴強調(LoRATRF)を提案する。 NLUを含むデータセットの希少性に関する実験として,本手法は33.71%のパラメータを削減し,SOTA低ランク手法と比較して各種データセットの性能を向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:38:49 GMT)
Which cycling environment appears safer? Learning cycling safety perceptions from pairwise image comparisons [2.4]
都市がより持続可能な交通手段に移行するためには、循環が不可欠だ。しかし、安全上の懸念は、個人が循環する上で重要な抑止力として残されている。本研究では, 個人がサイクリングリスクをどう認識するかを把握し, 理解する問題に取り組む。我々は,現実のイメージのペア比較にアプローチを基づき,回答者に2組の道路環境を提示する。サイクリングにとって、より安全なものを選ぶように求めます。収集したデータを用いて、個人の反応から学習し、画像から直接好みを学習するマルチロスフレームワークを用いて、シアム・畳み込みニューラルネットワークを訓練する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:56:40 GMT)
Too Late to Train, Too Early To Use? A Study on Necessity and Viability of Low-Resource Bengali LLMs [2.3]
低リソース言語専用の英語指向の大規模言語モデルの必要性について検討する。オープンウェイトおよびクローズドソースLLMの性能を、微調整エンコーダデコーダモデルと比較する。 LLMは一般的に推論タスクに優れるが,Bengaliスクリプト生成を必要とするタスクのパフォーマンスは不整合である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:15:51 GMT)
A provable control of sensitivity of neural networks through a direct parameterization of the overall bi-Lipschitzness [2.3]
本稿では,凸ニューラルネットワークとルジャンドル・フェンシェル双対性に基づくバイリプシッツ性のための新しいフレームワークを提案する。コンベックスニューラルネットワークとルジャンドル・フェンシェル双対性に基づく,このような明瞭で厳密な制御を実現する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:23:00 GMT)
Minimum Reduced-Order Models via Causal Inference [2.3]
本研究では、因果エントロピーと呼ばれる情報理論指標を用いて、スパースROMの同定に効率的な手法を提案する。因果エントロピーのガウス近似は、非常に非ガウス統計の存在下においても、非常によく機能することを示す。また, 得られたROMを用いて, 部分観測とデータ同化による観測値の復元を行った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:46:29 GMT)
A Survey on Knowledge Graph Structure and Knowledge Graph Embeddings [2.3]
本論文は,著者の知識に基づいて,文献における知識グラフ埋め込みモデルとグラフ構造の確立した関係を探索した最初の総合的な調査である。この研究がこの分野のさらなる研究を刺激し、KGs、KGEMs、リンク予測タスクのより包括的な理解に寄与することが著者の希望である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:30:09 GMT)
DK-PRACTICE: An Intelligent Educational Platform for Personalized Learning Content Recommendations Based on Students Knowledge State [2.2]
この研究では、機械学習を活用してパーソナライズされた学習レコメンデーションを提供するインテリジェントなオンラインプラットフォームであるDK-PRACTICEを紹介した。システムは,前の回答の正確さと正確性に基づいて,各学生の次の質問を動的に選択する。テストが完了すると、DK-PRACTICEは学生のインタラクション履歴を分析して学習教材を推薦する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:35:37 GMT)
Enhancing Automated Loop Invariant Generation for Complex Programs with Large Language Models [2.2]
ACInvは、自動複雑プログラムループ不変生成ツールである。静的解析とLLM(Large Language Models)を組み合わせることで、適切なループ不変量を生成する。我々はACInvの実験を行い、ACInvはデータ構造を持つデータセットにおいて、以前のツールよりも優れていたことを示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:36:18 GMT)
NeCA: 3D Coronary Artery Tree Reconstruction from Two 2D Projections via Neural Implicit Representation [2.2]
2DX線侵襲的冠動脈造影は、リアルタイム心臓手術におけるCVD評価において最も広く採用されている画像モダリティである。放射線の限界のため、しばしば2つの血管造影プロジェクションが取得され、血管形状の限られた情報を提供する。マルチレゾリューションハッシュエンコーダと差別化可能なコーンビームフォワードプロジェクタ層を用いたニューラル暗黙表現に基づく,NeCAと呼ばれる自己教師型ディープラーニング手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:16:52 GMT)
Does Multiple Choice Have a Future in the Age of Generative AI? A Posttest-only RCT [2.1]
効果的な学習ツールとしてのマルチチョイス質問(MCQ)の役割は過去の研究で議論されてきた。本研究は,学習におけるオープン応答型質問に対するMCQの有効性を評価する。テスト後の条件間では有意な学習差は認められなかったが,教官の指導に要した時間は大幅に短縮された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:37:20 GMT)
A unified framework for classical and quantum uncertainty relations using stochastic representations [2.1]
これまでに発見されたすべての不確実性関係は、同じ力学の表現によってのみ導出可能であることを示す。この手法をマルコフ開量子系に応用し、その力学を解明する。このことは、古典系と量子系の両方の不確実性関係を、その性質の固有の性質として完全に確立する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:55:27 GMT)
Fine Tuning Large Language Models for Medicine: The Role and Importance of Direct Preference Optimization [2.1]
ファインチューニングの最も一般的な2つの方法は、スーパーバイザード・ファインチューニング(SFT)と直接選好最適化(DPO)である。医学における5つの共通自然言語タスクにおけるSFTとDPOの性能を比較した。 SFTだけではテキストデータの分類に十分であるのに対し、DPOは、より複雑な臨床推論、要約、臨床トリアージのタスクのパフォーマンスを向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:37:01 GMT)
Feature Selection for Latent Factor Models [2.1]
特徴の選択は、高次元データセットで関連する特徴をピンポイントするのに不可欠である。分類のための伝統的な特徴選択方法は、クラスごとに特徴を選択するためにすべてのクラスからデータを使用する。本稿では,低ランク生成法に基づくクラスモデルを用いて,各クラスの特徴を個別に選択する特徴選択手法について検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:20:10 GMT)
DeepCA: Deep Learning-based 3D Coronary Artery Tree Reconstruction from Two 2D Non-simultaneous X-ray Angiography Projections [2.0]
心臓血管疾患(CVD)は、世界中で最も多い死因である。 CVDの診断において,侵襲的X線冠動脈造影(ICA)は最も重要な画像モダリティの1つである。 ICAは一般的に2Dプロジェクションしか取得しないため、冠動脈の3D形状は解釈が困難である。本研究では,非定常投射間における非剛性心・呼吸運動の補正を目的とした,emphDeepCAという新しい深層学習パイプラインを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:00:55 GMT)
Analysis and suppression of errors in quantum random access memory errors under extended noise models [2.0]
QRAMは任意の局所的不整合雑音チャネルに対して高い耐性を示す。 QRAMのノイズレジリエンスの保持範囲を完全に定量化することで、QRAMアーキテクチャの設計ガイドを提供することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:59:16 GMT)
Llama 3 Meets MoE: Efficient Upcycling [1.8]
本研究では,Llama 3-8B から 8-Expert Top-2 MoE モデルをトレーニングし,事前学習の典型的な計算値の 1% 以下で,事前学習した高密度チェックポイントを活用する効率的なトレーニングレシピを提案する。提案手法は,学術ベンチマークのダウンストリーム性能を向上し,MMLUの0ショット精度を$textbf2%で向上させる。トレーニング済み重量をシームレスに使用するために、NeMoのオンラインアップサイクルも統合し、高容量のMoEモデルの開発に費用対効果が期待できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:22:19 GMT)
GeoConformal prediction: a model-agnostic framework of measuring the uncertainty of spatial prediction [1.8]
ジオコンフォーマル予測(GeoConformal Prediction)と呼ばれるモデルに依存しない不確実性評価手法を提案する。空間回帰と空間予測の2つの古典的空間予測事例に適用する。また,GeoConformalは,地理知識探索だけでなく,将来的なGeoAIモデルの設計の指導にも有用であることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:47:01 GMT)
Envisioning National Resources for Artificial Intelligence Research: NSF Workshop Report [1.7]
このワークショップは、AI研究のための国家資源の最初の課題と機会を特定することを目的としている。このレポートは重要な発見を概説し、ワークショップにおけるニーズや推奨事項を特定している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:00:31 GMT)
Predicting Internet Connectivity in Schools: A Feasibility Study Leveraging Multi-modal Data and Location Encoders in Low-Resource Settings [1.7]
EOとMLを用いた学校インターネット接続予測に関する研究について述べる。 EOおよび地上データを用いたMLは, 精度, F1スコア, 偽陽性率において, 両国で最高の成績を示した。我々の研究は、低リソース環境でのデータ駆動型デジタルインフラ開発を支援する実践的なアプローチを示します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:20:29 GMT)
SCRUBD: Smart Contracts Reentrancy and Unhandled Exceptions Vulnerability Dataset [1.7]
ラベル付き脆弱性を持つ既存のSCデータセットには制限がある。これらのツールのパフォーマンスを比較するための標準化されたデータセットがない。本稿では,REとUXをラベル付けした実世界のSCと合成SCのデータセットを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:43:58 GMT)
Fair Decentralized Learning [1.7]
フェアモデルトレーニングのためのクラスタリングベースの機械学習アルゴリズムであるtextscFacadeを紹介する。 textscFacadeは、時間とともにノードを適切なクラスタに動的に割り当て、ノードが完全に分散された方法で各クラスタの特別なモデルを協調的にトレーニングすることを可能にする。 3つのデータセットに対する実験結果は、モデル精度と公平性の観点から、我々のアプローチの優位性を示すものである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:45:48 GMT)
Evaluation of Code LLMs on Geospatial Code Generation [1.7]
大規模言語モデル(LLM)は、データサイエンスと機械学習アプリケーションのためのPythonコードを生成することができる。本稿では,空間的タスクの選択に基づいて,コード生成モデルの評価ベンチマークを構築した。我々のデータセットは、地理空間的コーディングタスクを高精度に解決できる新しいモデルの開発に貢献することを期待している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:05:53 GMT)
Semi-Periodic Activation for Time Series Classification [1.7]
この研究は、時系列ニューラルネットワークにおける活性化のための、有界、単調、非線形性、周期性などの特性を包括的に分析する。我々はLeakySineLUと呼ばれるこれらの特性のカバレッジを最大化する新しいアクティベーションを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:06:49 GMT)
Clustering Algorithms and RAG Enhancing Semi-Supervised Text Classification with Large LLMs [1.7]
本稿では,テキスト分類タスクに特化して設計された,新しい半教師付き学習フレームワークを提案する。本手法は,ReutersとWeb of Scienceのデータセットでそれぞれ95.41%,82.43%の最先端の精度を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:11:31 GMT)
Patchfinder: Leveraging Visual Language Models for Accurate Information Retrieval using Model Uncertainty [1.7]
本稿では,視覚言語モデル(VLM)に基づいて情報抽出を改善するアルゴリズムであるPatchFinderを提案する。まず、VLMの出力の最大ソフトマックス確率に基づいて、信頼度に基づくスコアを考案し、その予測に対するモデルの信頼度を測定する。このメトリックを使用して、PatchFinderは適切なパッチサイズを決定し、入力ドキュメントをオーバーラップしたパッチに分割し、ターゲット情報に対する信頼性ベースの予測を生成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:27:56 GMT)
Tri-Cam: Practical Eye Gaze Tracking via Camera Network [1.6]
本稿では,3つの安価なRGBウェブカメラを用いた,実践的なディープラーニングベースの視線追跡システムであるTri-Camを紹介する。効率的なトレーニングのための分割ネットワーク構造と、分離された視線追跡タスクを処理するための指定されたネットワーク設計を備えている。我々は、最先端の商用アイトラッカーであるTobiiに対するTri-Camの評価を行い、より広い自由移動領域をサポートしながら、同等の精度を実現した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:43:40 GMT)
Reward Machine Inference for Robotic Manipulation [1.6]
Reward Machines (RM) は、RLが拡張された時間的地平線上でポリシーをトレーニングする能力を向上する。本稿では,ロボット操作タスクの視覚的実演から直接RMを学習するための新しいLfD手法を提案する。提案手法を視覚に基づく操作タスクに適用し,推論されたRMがタスク構造を正確に把握し,RLエージェントが最適なポリシーを効果的に学習できることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:32:53 GMT)
AMUSE: Adaptive Model Updating using a Simulated Environment [1.6]
予測モデルは、基礎となるデータ分布が時間とともに変化し、性能が低下するコンセプトドリフトの課題にしばしば直面する。シミュレーションデータ生成環境内で学習した強化学習を活用する新しい手法であるAMUSEを提案する。その結果、AMUSEは予想されるパフォーマンス改善に基づいたアップデートを積極的に推奨している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:04:46 GMT)
HARDMath: A Benchmark Dataset for Challenging Problems in Applied Mathematics [1.6]
本稿では,解析的近似技術を必要とする応用数学問題に挑戦するデータセットであるHARDMathを紹介する。本フレームワークは,数値基底真理に対して検証された解を用いて,多数の問題を自動生成する。 HARDMath-miniは,366問題からなるサブサンプルテストセットであり,応用科学の文脈で定式化された40の単語問題に対して,オープンソースLLMとクローズドソースLLMの両方を評価する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:03:43 GMT)
MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning [1.5]
ディープニューラルネットワーク(DNN)は、わずかに敵対的な摂動に対して脆弱である。トレーニング中の強力な特徴表現学習は、元のモデルの堅牢性を大幅に向上させることができることを示す。本稿では,多目的特徴表現学習手法であるMORELを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:55:33 GMT)
Towards Cross-Lingual Audio Abuse Detection in Low-Resource Settings with Few-Shot Learning [1.5]
低リソース言語における乱用言語検出のための事前学習音声表現の可能性について検討する。提案手法は,モデルに依存しないメタラーニングフレームワークに表現を統合し,乱用言語を10言語に分類する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:59:06 GMT)
Modeling the Human Visual System: Comparative Insights from Response-Optimized and Task-Optimized Vision Models, Language Models, and different Readout Mechanisms [1.5]
視覚入力を用いた応答最適化モデルでは,早期・中期の視覚領域において,より優れた予測精度が得られることを示す。言語的記述では捉えられない入力の知覚的特徴に敏感な視覚野の3つの異なる領域を同定する。本稿では,意味的内容に基づいて受容場や特徴マップを変調し,既存のSOTAよりも3～23%精度が向上する手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:49:39 GMT)
Access to care improves EHR reliability and clinical risk prediction model performance [1.5]
134,513人からなる全Usデータセットを用いて,医療機械学習パイプラインへのケアアクセスの効果を検討した。以上の結果より, 患者自己申告条件により, コスト制約や遅発性ケアを要した患者は, EHRの信頼性が低下することが明らかとなった。これらの結果は、医療アクセスがデータの信頼性と臨床予測性能の両方に系統的に影響を及ぼすという最初の大規模な証拠となる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:46:36 GMT)
Interpretability analysis on a pathology foundation model reveals biologically relevant embeddings across modalities [1.5]
我々は、病理予知基礎モデルの埋め込みについてスパースオートエンコーダを訓練した。 Sparse Autoencoderの機能は, 解釈可能な, 単意味的な生物学的概念を表す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:17:21 GMT)
Copy-Move Detection in Optical Microscopy: A Segmentation Network and A Dataset [1.5]
CMSeg-Net(CMSeg-Net)は、未確認の複製領域を識別できるコピー・モーブ・フォージェリー・セグメンテーション・ネットワークである。 CMSeg-Netはマルチレゾリューションエンコーダデコーダアーキテクチャ上に構築されており、自己相関と相関支援空間アテンションモジュールが組み込まれている。我々は、ICIP 2022 Challengeのオープンデータを用いて、FakeParaEggという名前の顕微鏡画像の複写フォージェリーデータセットを作成しました。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:29:00 GMT)
A Generative AI-driven Metadata Modelling Approach [1.5]
本稿では,ジェネレーティブなAI駆動型Human-Large Language Model (LLM) を用いたメタデータモデリング手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:26:04 GMT)
HyperGraphOS: A Modern Meta-Operating System for the Scientic and Engineering Domains [1.4]
本稿では,オペレーティングシステムの領域における重要なイノベーションであるHyperGraphOSについて述べる。モデルベースのエンジニアリング、グラフモデリング、データコンテナ、ドキュメント、および計算要素を扱うツールを組み合わせることを目的としている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:18:39 GMT)
Cultural Evolution of Cooperation among LLM Agents [1.4]
我々は,AIエージェントの「社会的」が,欠陥に対するインセンティブに直面して相互に有益な社会的規範を学習できるかどうかを検討する。協調の進化は基本モデルによって著しく異なることが判明した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:45:49 GMT)
Tipping Points, Pulse Elasticity and Tonal Tension: An Empirical Study on What Generates Tipping Points [1.3]
タップポイントは、曲の重要なターンポイントを特徴づける変化の瞬間である。 6つのショパン・マズカースのアシュケナジーの録音におけるタイミング情報と計算による音節張力値を比較した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:27:46 GMT)
A Novel Methodology in Credit Spread Prediction Based on Ensemble Learning and Feature Selection [1.3]
債券のスプレッドは債券投資の重要な指標であり、債券投資家が効果的なトレーディング戦略を考案するための貴重な洞察を提供する。本研究では,アンサンブル学習技術を活用した新たな信用拡散予測モデルを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:26:36 GMT)
Financial Fine-tuning a Large Time Series Model [1.3]
我々は,最新の時系列基礎モデルTimesFMの性能を価格予測に基づいて評価した。価格データの不規則性のため、TimesFMを直接適用すると不満足な結果が得られます。我々は、価格予測のタスクのために、財務データにTimeFMを微調整することを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:51:00 GMT)
Robust Monocular Visual Odometry using Curriculum Learning [1.3]
本研究は,単眼視線量推定の難解な幾何学的問題に対処するために,革新的なカリキュラム学習手法を適用した。我々は、新しいCLアプローチを統合することにより、エンドツーエンドのDeep-Patch-Visual Odometryフレームワークを強化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:27:12 GMT)
Differentially Private Decentralized Optimization with Relay Communication [1.3]
プライバシリーク頻度(PLF)は,アルゴリズムの通信とプライバシリークの関係を明らかにする指標である。 DP-RECAL は, 演算子分割法と中継通信機構を利用して, PLF の低減を図っている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:13:07 GMT)
First Train to Generate, then Generate to Train: UnitedSynT5 for Few-Shot NLI [1.3]
We present UnitedSynT5, a Advanced extension of Entailment Few-Shot Learning (EFL)。我々は、T5ベースのジェネレータを使用して、厳格にクリーン化され、トレーニングデータに統合された追加の前提-仮説ペアを合成する。この拡張データセット上でGTR-T5-XLモデルをトレーニングし、SNLIデータセットで94.7%の精度、E-SNLIデータセットで94.0%の精度、MultiNLIデータセットで92.6%の精度を達成し、以前のSOTAモデルを上回った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:28:11 GMT)
The Correlated Gaussian Sparse Histogram Mechanism [1.2]
スパースヒストグラムを$(varepsilon, delta)$-differential privacy でリリースする問題について考察する。我々はLebedaの手法を採用し、非ゼロ数に相関ノイズを加えることで、空間境界を持つ場合にのみノイズの大きさを小さくできることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:51:33 GMT)
Towards Using Machine Learning to Generatively Simulate EV Charging in Urban Areas [1.1]
本研究では、限られたデータで都市部における電気自動車(EV)の充電プロファイルを予測することの課題に対処する。我々のモデルは、ピーク電力需要と日々の負荷を予測し、充電行動に関する洞察を提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:55:19 GMT)
T-GMSI: A transformer-based generative model for spatial interpolation under sparse measurements [1.1]
空間補間のためのトランスフォーマーベース生成モデル (T-GMSI) を提案する。 T-GMSIは、従来の畳み込みベースの手法をViTに置き換えて特徴抽出とDEMを行い、特徴認識損失関数を組み込んで精度を高める。 T-GMSIは、70%以上の幅を持つデータセットから高品質な標高面を生成するのに優れ、微調整なしで様々な風景を横断する強い伝達性を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:01:39 GMT)
Who's the (Multi-)Fairest of Them \textsc{All}: Rethinking Interpolation-Based Data Augmentation Through the Lens of Multicalibration [1.1]
また,Fair Mixupの4つのバージョンを,最大81個の辺縁化グループを持つ2つの構造化データ分類問題に対してストレス試験を行った。ほぼすべての実験において、Fair Mixupはベースラインのパフォーマンスとフェアネスを基準にしていますが、単純なバニラMixupはFair Mixupとベースラインの両方をパフォーマンスします。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:36:12 GMT)
Analyzing Fairness of Computer Vision and Natural Language Processing Models [1.1]
機械学習(ML)アルゴリズムは、医療、金融、教育、法執行など、さまざまな分野における意思決定において重要な役割を果たす。広く採用されているにもかかわらず、これらのシステムは潜在的なバイアスや公平性の問題のために倫理的・社会的懸念を提起する。本研究では,非構造化データセットに適用したコンピュータビジョンと自然言語処理(NLP)モデルの公平性の評価と改善に焦点を当てた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:35:55 GMT)
Analyzing Fairness of Classification Machine Learning Model with Structured Dataset [1.1]
本研究では,分類タスクにおける構造化データセットに適用された機械学習モデルの公平性について検討する。 3つのフェアネスライブラリ、MicrosoftのFairlearn、IBMのAIF360、GoogleのWhat If Toolが採用されている。この研究は、MLモデルのバイアスの程度を評価し、これらのライブラリの有効性を比較し、実践者に対して実行可能な洞察を導出することを目的としている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:31:09 GMT)
Ultra-High Resolution Segmentation via Boundary-Enhanced Patch-Merging Transformer [1.1]
境界強化パッチマージ変圧器(BPT)と呼ばれる新しいUHRセグメンテーション法を提案する。 BPT は,(1) トークンを情報領域に動的に割り当てる Patch-Merging Transformer (PMT) と,(2) 境界情報を利用する境界拡張モジュール (BEM) の2つのキーコンポーネントから構成される。我々のBPTは、余分な計算オーバーヘッドを伴わずに、従来の最先端手法よりも優れている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:53:07 GMT)
MeshA*: Efficient Path Planing With Motion Primitives [1.1]
本研究では,移動可能な動作が環境のグリッド表現に整合した動作プリミティブの有限集合として表現される経路計画問題について検討する。そこで本研究では,これらの細胞に移動プリミティブの配列を同時に組み込むことによって,グリッドセルを探索する手法を提案する。得られたアルゴリズムであるMeshA*は、完全性と最適性の保証を確実に保持し、従来の格子ベースの計画よりも顕著に優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:00:21 GMT)
Dynamic Fog Computing for Enhanced LLM Execution in Medical Applications [1.1]
大きな言語モデル(LLM)は、大量の異種データを変換し、解釈し、理解することができる。保護された健康情報(PHI)の繊細な性質は、データプライバシとリモートLLMプラットフォームへの信頼に関する有効な懸念を提起する。我々は,LLM実行環境を,不透明で集中型のクラウドプロバイダから分散型の動的フォグコンピューティングアーキテクチャに移行することを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:44:55 GMT)
On the Significance of Intermediate Latents: Distinguishing Quantum Causal Scenarios with Indistinguishable Classical Analogs [1.0]
我々は、観測変数を表すノードと、潜伏変数または隠れ変数を表すノードの両方を含む有向非巡回グラフについて考察する。我々は、潜在ノードの量子解釈への変化が、古典的に区別できない因果的シナリオの区別をいかに引き起こすかを強調した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:08:30 GMT)
Low-Resource Fast Text Classification Based on Intra-Class and Inter-Class Distance Calculation [1.0]
LFTCと呼ばれる低リソースかつ高速なテキスト分類モデルを提案する。当社のアプローチは,各クラスに対して,クラス内データ内の正規性情報を完全にマイニングするコンプレッサーリストを構築することから始まります。 LFTCを9つの公開ベンチマークデータセットで評価した結果,性能と処理時間に大きな改善が見られた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:22:13 GMT)
RAID-Database: human Responses to Affine Image Distortions [1.0]
このデータ記述子は、上垂体アフィン画像変換に対する人間の反応のセットを提示する。これらの反応は、確立された精神物理学(最大相違尺度法)を用いて測定された。実験では、105人の観察者、20000人以上の画像の比較が行われた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:34:34 GMT)
A Trust-Centric Approach To Quantifying Maturity and Security in Internet Voting Protocols [1.0]
本稿では,インターネット投票システムのセキュリティと成熟度を定量化する,信頼中心の成熟度スコアリングフレームワークを提案する。選択したインターネット投票プロトコルに対して包括的信頼モデル解析を行う。このフレームワークは、分散化、信頼、セキュリティの側面が不可欠である他のシステムに適用できるほど一般的です。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:33:38 GMT)
Enhancing Temporal Understanding in Audio Question Answering for Large Audio Language Models [0.9]
AQA(Audio Question Answering)タスクには、オーディオイベント分類、オーディオキャプション、オープンエンド推論が含まれる。 LALMは一般的な音声理解では優れているが、時間的推論では限られている。本稿では,音声時間的推論におけるこれらの課題と限界について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:29:55 GMT)
Advances in Transformers for Robotic Applications: A Review [0.9]
我々は、ロボティクスにおけるトランスフォーマーの最近の進歩とトレンドを概観する。自律システムにおけるロボット認識,計画,制御への統合について検討する。信頼性の高い計画と知覚のために、トランスフォーマーの異なるバリエーションがロボティクスにどのように適応されているかについて議論する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:02:15 GMT)
Utilizing Multi-step Loss for Single Image Reflection Removal [0.9]
歪んだイメージは、オブジェクト検出やイメージセグメンテーションといったタスクに悪影響を及ぼす可能性がある。単一画像を用いた画像反射除去のための新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:11:38 GMT)
MK-SGN: A Spiking Graph Convolutional Network with Multimodal Fusion and Knowledge Distillation for Skeleton-based Action Recognition [0.9]
MK-SGNはスケルトンに基づく行動認識にスパイキングニューラルネットワーク(SNN)のエネルギー効率を活用するために提案されている。 GCNのグラフ表現能力とSNNの省エネルギー性を統合することにより、MK-SGNはエネルギー消費を大幅に削減する。提案手法は従来のGCN法に比べて98%以上のエネルギー消費を著しく削減する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:11:30 GMT)
Geometric sparsification in recurrent neural networks [0.9]
大きなニューラルモデルを実行する際の計算コストを改善するための一般的なテクニックはスパース化である。本稿では,リカレントニューラルネット(RNN)のスペーサー化手法を提案する。変調正則化はより安定なリカレントニューラルネットを誘導し、90%以上の高忠実度モデルを実現することを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:12:02 GMT)
CaLoRAify: Calorie Estimation with Visual-Text Pairing and LoRA-Driven Visual Language Models [0.9]
視覚言語モデル(VLM)は、現実世界の文脈を理解し、対話的な相互作用を可能にするのに優れている。本稿では,食材認識とカロリー推定を両立させる新しいVLMフレームワークであるCaLoRAifyについて述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:51:32 GMT)
Frequency matters: Modeling irregular morphological patterns in Spanish with Transformers [0.9]
本稿では,変圧器を用いたニューラルネットワークの学習行動について,不規則な摂動パラダイムに関して評価する。我々は、スペイン語動詞のコーパスでモデルを訓練し、入力に基づいて訓練されたモデルと(不規則な)単語の増分分布と比較する。我々の実験では、周波数条件によって、モデルが驚くほど不規則なパターンを学習できることが示されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:27:37 GMT)
Solid Waste Detection, Monitoring and Mapping in Remote Sensing Images: A Survey [0.8]
不適切に管理された埋立地は、浸透雨水を介して土壌と地下水を汚染し、動物と人間の両方に脅威を与える。現場検査のような伝統的な埋立地識別アプローチは、時間と費用がかかる。地球観測衛星(EO)は、センサーと撮像機能を備えた衛星で、数十年にわたって高解像度のデータを提供してきた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:26:51 GMT)
Evaluating the effectiveness, reliability and efficiency of a multi-objective sequential optimization approach for building performance design [0.8]
本稿では,建築形状,ファブリック,HVACシステム,建築性能制御の多目的設計最適化のための逐次的アプローチを提案し,評価する。シーケンシャルアプローチの性能は、NSGA-IIアルゴリズムと比較して、完全な因子探索と比較される。本研究は、シーケンシャル最適化アプローチが、標準NSGA-IIアルゴリズムの高効率かつ堅牢な代替手段であることを示唆している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:00:00 GMT)
Cardiovascular Disease Detection By Leveraging Semi-Supervised Learning [0.8]
心臓血管疾患(CVD)は、世界規模で死の主な原因として存続する。 CVD検出のための従来の教師付き学習アプローチは、大規模ラベル付きデータセットに大きく依存している。本稿では,ラベル付きサンプルが少ない場合にCVD検出の効率と精度を高めるために,半教師付き学習モデルを用いる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:15:38 GMT)
Towards the Characterization of Representations Learned via Capsule-based Network Architectures [0.8]
Capsule Networks (CapsNets) は、標準的なディープニューラルネットワークのよりコンパクトで解釈可能な代替品として再導入された。本稿では,これらのタイプのネットワークの解釈可能性を評価するための,体系的で原則的な研究を行う。 MNIST, SVHN, PASCAL-part, CelebAデータセットにおける解析から, CapsNetsで符号化された表現は, 文献で一般的に述べられているような部分的関係とは無関係で, 厳密には関係がない可能性が示唆された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:17:28 GMT)
Enhanced Speech Emotion Recognition with Efficient Channel Attention Guided Deep CNN-BiLSTM Framework [0.8]
音声感情認識(SER)は、感情コンピューティングの強化と人間とコンピュータの相互作用の領域の強化に不可欠である。本稿では,注目に基づく局所特徴ブロック(ALFB)を統合し,音声信号から高レベルな特徴ベクトルをキャプチャする軽量なSERアーキテクチャを提案する。また,グローバルな特徴ブロック(GFB)技術を用いて,音声信号の逐次的,グローバルな情報と長期的依存関係をキャプチャする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:55:03 GMT)
LLM Distillation for Efficient Few-Shot Multiple Choice Question Answering [0.8]
MCQA(Multiple Choice Question Answering)は、医学、法学、教育など、多くの現実世界の応用において重要な問題である。本稿では,データ生成とスコアリングに大規模言語モデルを用いる,シンプルで効果的な手法を提案する。提案手法では, 精度が28.9%から39.3%に向上し, 5ショットで直接微調整したベースラインに比べて10%以上向上した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:48:36 GMT)
Characterization of Tunnel Diode Oscillator for Qubit Readout Applications [0.8]
この低温マイクロ波源は、大規模量子ビットリードアウトシステムにおいて大きなスケーラビリティの可能性を示している。出力周波数は140MHzで、一般に半導体中の電子の量子ビット読み出しに用いられる。位相ノイズは、市販の電圧源を鉛蓄電池に置き換えることで大幅に改善された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:58:48 GMT)
Finite Sample Analysis of Tensor Decomposition for Learning Mixtures of Linear Systems [0.6]
入力出力データから線形力学系の混合を学習する問題について検討する。本研究では, テンソル分解を用いて混合系の成分モデルのインパルス応答を推定するモーメントベース推定器を提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:41:27 GMT)
RowDetr: End-to-End Row Detection Using Polynomials [0.6]
RowDetrは、スムーズなパフォーマンス機能を利用して、画像空間における作物の境界を規定するエンドツーエンドのニューラルネットワークである。ノイズラベルがなくても学習の堅牢性を高めるために、エネルギーベースの新しい損失関数PolyOptLossが導入された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:38:36 GMT)
Quantum and thermal pressures from light scalar fields [0.6]
2つの薄板間の光スカラー場変動の交換によって引き起こされる量子および熱圧の式を導出する。カメレオン、シンメトロン、環境依存のディラトンモデルでは、熱圧力が量子圧力と等しく、あるいは超えるようなパラメータ空間に大きな領域が見つかる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:26:39 GMT)
Floquet-Thermalization via Instantons near Dynamical Freezing [0.6]
本研究では, 動的凍結現象を解析し, 翻訳的に不変な多体系が創発的保存法則を示す。フローケ流再正規化(英語版)を用い、ハミルトニアンの時間依存部分は、有効ハミルトニアンから徐々に分離される。また, 凍結時には, 凍結から遠ざかるよりも熱化の時間スケールが遅くなり, 流れの軌跡が連続的に瞬時に発生することを観察した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:00:01 GMT)
SMMF: Square-Matricized Momentum Factorization for Memory-Efficient Optimization [0.6]
SMMFはAdamのような広く使われている適応学習率Matrixのメモリ要求を最大96%削減するメモリ効率である。本研究では,SMMF の残差解析を行い,AdamNC などの非メモリ効率適応学習率 Matrix と同様に収束することを示す。我々の実験では、SMMFは、Adafactor、CAME、SM3といった最先端のメモリ効率と比較して最大96%のメモリを消費し、同等のモデル性能を実現している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:03:14 GMT)
High-purity single-photon generation based on cavity QED [0.6]
キャビティ量子電磁力学(QED)に基づく高純度単一光子生成手法を提案する。この構造は、原子崩壊による再励起過程の抑制を可能にする。提案手法は,分散量子計算や量子通信の高精度化に寄与することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:25:34 GMT)
Beyond Toxic Neurons: A Mechanistic Analysis of DPO for Toxicity Reduction [0.6]
安全微調整アルゴリズムは、言語モデルにおける有害な出力を減らすために広く用いられている。現在の説明では、DPOは毒性ニューロンの活性化を抑えることでこれを達成している。本研究は,安全性向上が言語モデルにおける有害なアウトプットをいかに減少させるか,新しい力学的知見を提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:41:32 GMT)
Uncertainty-Aware Artificial Intelligence for Gear Fault Diagnosis in Motor Drives [0.5]
本稿では,ベイジアンニューラルネットワーク(BNN)を用いたモータの故障診断の不確かさの定量化手法を提案する。 BNNはネットワーク重みを固定値ではなく確率分布として扱う。ノイズの多いデータに対するロバスト性の改善、(b)モデル予測の解釈可能性の向上、(c)意思決定プロセスにおける不確実性を定量化する能力など、いくつかの利点がある。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:50:35 GMT)
Low-Latency Scalable Streaming for Event-Based Vision [0.5]
本稿では,Media Over QUICに基づくイベントベースデータに対するスケーラブルなストリーミング手法を提案する。我々は、最先端のオブジェクト検出アプリケーションが、劇的なデータ損失に対して回復力があることを示す。我々は、検出mAPを0.36まで下げる平均的な減少を観察した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:39:27 GMT)
iMoT: Inertial Motion Transformer for Inertial Navigation [0.5]
iMoTは、革新的なトランスフォーマーベースの慣性オドメトリー法である。正確な位置推定のために、運動と回転のモードからクロスモーダル情報を取得する。 iMoTは軌道再構成において、より優れたロバスト性と精度を実現するため、最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:52:47 GMT)
Multi-Surrogate-Teacher Assistance for Representation Alignment in Fingerprint-based Indoor Localization [0.5]
本稿では、受信信号強度(RSS)指紋データセット間の転送可能な表現を学習するためのプラグイン・アンド・プレイフレームワークを提案する。この作業には、エキスパートトレーニングとエキスパート蒸留の2つの主要なフェーズが含まれている。 3つのWiFi RSS指紋データセットのベンチマーク実験により、このフレームワークの有効性が示された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:00:26 GMT)
Aspen Open Jets: Unlocking LHC Data for Foundation Models in Particle Physics [0.5]
我々は、CMS 2016 Open Dataから派生した約180Mの高額なp_T$ジェットからなるAspenOpenJetsデータセットを紹介した。 AspenOpenJets上でのOmniJet-$alpha$ファンデーションモデルの事前トレーニングにより、ドメインシフトの大きな生成タスクのパフォーマンスが向上することを示す。実際の陽子-陽子衝突データに基づいて,ジェットベース基礎モデルの事前学習の能力を示すとともに,ML対応のAspenOpenJetsデータセットを一般向けに提供した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:00:03 GMT)
CrossVIT-augmented Geospatial-Intelligence Visualization System for Tracking Economic Development Dynamics [0.5]
センスコノミクス(Senseconomic)は、マルチモーダル画像とディープラーニングを通じて経済動態を追跡するスケーラブルなシステムである。このシステムは郡レベルの経済予測において0.8363のR二乗値を達成し、分散コンピューティングを用いて処理時間を23分に短縮した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:31:48 GMT)
Benchmarking Attention Mechanisms and Consistency Regularization Semi-Supervised Learning for Post-Flood Building Damage Assessment in Satellite Images [0.5]
災害後の建物被害評価は、迅速な対応と災害後の復興計画に不可欠である。現在の研究では、ニューラルネットワーク設計における変化検出(CD)から、災害評価(DA)の明確な要件を考慮できない。本論文は,1) DA衛星画像における変化特徴の構築はCDよりも微妙である,2) DAデータセットはデータ不足とラベルの不均衡に直面する,という2つの重要な違いに焦点を当てる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:46:21 GMT)
High-dimensional Statistics Applications to Batch Effects in Metabolomics [0.5]
大規模な代謝学ではバッチ効果は避けられない。品質制御に基づく同時テスト(QC-ST)と共分散補正(CoCo)を提案する。 QC-STは、異なるバッチ間でQCサンプルの平均ベクトルと共分散行列の統計的意義を同時に検出することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:10:48 GMT)
One world, one opinion? The superstar effect in LLM responses [0.5]
大規模言語モデル(LLM)は、情報の共有とオンラインアクセスの方法を形作っている。本研究では,10言語におけるプロンプトを用いて,LLMを各分野において最も顕著な人物とみなす人物について検討した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:03:56 GMT)
Unsupervised Named Entity Disambiguation for Low Resource Domains [0.4]
GST(Group Steiner Trees)の概念を利用した教師なしアプローチを提案する。 GSTは、候補エンティティ間のコンテキスト的類似性を用いて、最も関連性の高いエンティティの曖昧さの候補を特定することができる。我々は、さまざまなドメイン固有のデータセットでPrecision@1の観点で、最先端の教師なしメソッドを40%以上(例では)上回っています。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:35:00 GMT)
Scaling Combinatorial Optimization Neural Improvement Heuristics with Online Search and Adaptation [0.4]
リミテッドロールアウトビームサーチ(Limited Rollout Beam Search, LRBS)を導入する。 LRBSは, 分散性能と大規模問題インスタンスへの一般化の両方を著しく向上させることを示す。また、事前訓練された改善ポリシーのオフラインおよびオンライン適応に検索戦略を採用し、検索性能を向上させる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:25:27 GMT)
Learning payoffs while routing in skill-based queues [0.4]
我々は,全支払パラメータを適応的に学習し,全支払パラメータを最大化する機械学習アルゴリズムを構築した。このアルゴリズムは,残差の下限を導出することにより,対数項に最適であることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:33:50 GMT)
Robust Dequantization of the Quantum Singular value Transformation and Quantum Machine Learning Algorithms [0.4]
この弱い仮定の下では、ランダム化線形代数の技法がどれだけ多く適用できるかを示す。また、これらの結果を用いて、多くの量子機械学習アルゴリズムの頑健な復号化を行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:46:46 GMT)
Text2Cypher: Bridging Natural Language and Graph Databases [0.4]
Text2Cypherは、自然言語クエリをCypherクエリ言語に変換することで、このギャップを埋めることを目指している。公開されているいくつかのデータセットを合計44,387のインスタンスに組み合わせ、整理し、整理した方法について説明している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:50:51 GMT)
Reliability of Topic Modeling [0.4]
トピックモデルの信頼性を定量化する標準的な手法は,2つの広く使用されているトピックモデルにおいて,その変動の本質的な側面を捉えるのに失敗することを示す。合成データと実世界のデータから、マクドナルドの$omega$は信頼性の最高のカプセル化を提供することを示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:36:52 GMT)
Single Channel EEG Based Insomnia Identification Without Sleep Stage Annotations [0.3]
不眠症患者50名,健常者50名を用いて,本モデルの有効性を検証した。開発されたモデルでは、現在の睡眠監視システムを簡素化し、家庭内振動モニタリングを可能にする可能性がある。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:02:22 GMT)
waveOrder: generalist framework for label-agnostic computational microscopy [0.3]
相関計算顕微鏡は、動的生物学的システムのマッピングを加速している。本稿では,生体分子間の構造秩序 (wave Order) の光画像化のためのフレームワークについて報告する。我々は, 定量的位相イメージング, 位相・偏光を用いた定量的ラベルフリーイメージング, 蛍光デコンボリューションイメージングなど, 複数の3次元計算顕微鏡法を実装した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:58:10 GMT)
Stabilizer entropy in non-integrable quantum evolutions [0.3]
エンタングルメントとスタビライザーエントロピーは、量子多体系における複雑な振る舞いの開始に関与している。本研究では, エンタングルメント, スタビライザーエントロピー, およびそれらの相互作用を評価する新しい量について検討した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:00:00 GMT)
Empowering Patients for Disease Diagnosis and Clinical Treatment: A Smart Contract-Enabled Informed Consent Strategy [0.3]
デジタル医療システムは医療サービスに革命をもたらし、提供者協力の促進、診断の強化、治療の最適化と改善を行っている。優れた品質、高速、信頼性、費用対効果のサービスを提供します。研究者たちは、情報技術、コンピューティングリソース、デジタル健康記録を統合することで、健康上の課題に対処している。医療のデジタル化は、患者のデータプライバシーとセキュリティに重大なリスクをもたらします。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:20:15 GMT)
Ultrastrong photon superbunching from electron shelving and time integral [0.3]
本稿では,超強2次・高次相関で超広帯域光を発生させる機構を提案する。強い相関に関する研究と技術の両方の応用は、光子相関を生成するためのこの容易にアクセス可能で操作可能なメカニズムにより、広く促進される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:35:57 GMT)
Bright and Purcell-enhanced single photon emission from a silicon G center [0.2]
シリコンG中心からの明るいパーセルエミッションをナノフォトニックキャビティに結合して示す。我々は0.97nsの自然放出率を得るが、これはシリコンで報告された最も速い単一光子放出率である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:10:44 GMT)
Electron matter waves with internal torque [0.2]
角運動量とトルクは、任意の空間スケールにおける基礎的および応用物理学の重要な原理である。原子やサブ原子構造における角運動量の調査や制御には、フェムト秒スケールとピコメータースケールのトルクが必要である。ここでは、電子顕微鏡中の電子を時間依存性のキラリティと内部トルクを持つ波状パケットに形成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:06:59 GMT)
Assessing high-order effects in feature importance via predictability decomposition [0.2]
特徴量における協調効果の定量化のための新しい手法を提案する。特に,特徴量尺度の適応バージョンを提案する。 GEANTによる模擬検出器の陽子/陽子判別への応用について報告する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:47:16 GMT)
On Adversarial Robustness and Out-of-Distribution Robustness of Large Language Models [0.2]
大規模言語モデル(LLM)における対向ロバストネスとOODロバストネスの相関について検討する。以上の結果より, 対向ロバスト性とOODロバスト性との間にはニュアンスな相互作用がみられ, 移動性に限界があることが示唆された。これらの相互作用を、より大きなモデルと様々なアーキテクチャにわたって評価するためには、さらなる研究が必要である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:04:25 GMT)
The role of nuclear spin diffusion in dynamic nuclear polarization of crystalline nanoscale silicon particles [0.1]
超偏極ナノ粒子(NP)は、室温緩和時間が30時間を超える高い偏極レベルを提供する。本研究では, 室温での過分極促進と緩和時間(脱ケイ)が粒子径に大きく依存していることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:09:03 GMT)
Searching for Structure: Investigating Emergent Communication with Large Language Models [0.1]
我々は,大規模言語モデルが人工言語を学習し,使用する古典的参照ゲームについてシミュレートする。この結果から, 当初構造化されていない全体言語は, 2つのLLMエージェントが正常に通信できるような構造的特性を持つことが明らかとなった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:35:21 GMT)
Shaping the Future of Social Media with Middleware [0.1]
ミドルウェア(Middleware)は、ユーザとプラットフォームの間のサードパーティ製ソフトウェアインターミディエートである。ミドルウェアは、デジタルエクスペリエンスを形作るための、よりユーザ中心で民主的なアプローチを可能にします。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:07:05 GMT)
Green's function approach to interacting lattice polaritons and optical nonlinearities in subwavelength arrays of quantum emitters [0.1]
量子エミッタのサブ波長アレイは、コヒーレント光マッターに対する効率的な自由空間アプローチを提供する。非線形過程の解析的な研究を可能にする図式グリーン関数法について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:24:21 GMT)
Benchmarking large language models for materials synthesis: the case of atomic layer deposition [0.1]
材料合成における大規模言語モデル(LLM)の性能を評価するために,オープンな質問ベンチマークであるALDbenchを導入する。我々のベンチマークは、大学院レベルから分野の最先端のドメインエキスパートまで、難易度の高い質問で構成されています。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:10:29 GMT)
A high optical access cryogenic system for Rydberg atom arrays with a 3000-second trap lifetime [0.1]
低温環境に収容された87ドルRb原子の光トウィーザアレイについて述べる。 3000 sの原子トラップの寿命を実証し、損失の最適化と測定を可能にした。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:23:34 GMT)
Subsystem Thermalization Hypothesis in Quantum Spin Chains with Conserved Charges [0.0]
我々は、量子イジング鎖の純状態の熱化仮説を$Z$対称性、$U(1)$対称性を持つXXZ鎖、$SU(2)$対称性を持つXXX鎖を考える。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:45:07 GMT)
deepNoC: A deep learning system to assign the number of contributors to a short tandem repeat DNA profile [0.0]
我々はSTRプロファイルの電気泳動信号をシミュレートする解析パイプラインを開発し、事実上無制限に事前の学習材料を生成することができる。我々は、100万のプロファイルをシミュレートして、ディープニューラルネットワークアーキテクチャ(DeepNoCという名前のアルゴリズム)を使用して、多くのコントリビュータ推定ツールをトレーニングすることにより、高いレベルのパフォーマンスが1から10のコントリビュータに対して89%達成されていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 02:42:56 GMT)
What we learned while automating bias detection in AI hiring systems for compliance with NYC Local Law 144 [0.0]
ニューヨーク市の地方法144条は、雇用者に対して、雇用プロセスに使用される自動雇用決定ツール(AEDT)の独立したバイアス監査を実施するよう求めている。この法律は、コンプライアンスを確保するためにAI開発者と実装者が実行しなければならないバイアステストの最小セットを概説している。我々は、この法律に基づいて実施された監査を収集、分析し、ベストプラクティスを特定し、雇用主のコンプライアンスを合理化するためのソフトウェアツールを開発した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:14:26 GMT)
VibrantVS: A high-resolution multi-task transformer for forest canopy height estimation [0.0]
本稿では,4バンド国立農業画像プログラム (NAIP) 画像を用いたキャノピー高さモデル (CHM) 推定のための視覚変換器 (ViT) モデルの適用について検討する。我々は,このモデルの有効性を,他の3つのベンチマーク・ピアレビューモデルと比較し,エコリージョンやクラスの高さにまたがる精度と精度で比較した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:47:11 GMT)
ViTHSD: Exploiting Hatred by Targets for Hate Speech Detection on Vietnamese Social Media Texts [0.0]
まず、ベトナムのソーシャルメディアテキストを対象としたヘイトスピーチ検出データセットViTHSDを紹介する。データセットには10Kコメントが含まれており、各コメントには、クリーン、攻撃、ヘイトという3つのレベルがある特定のターゲットにラベルが付けられている。データセットから得られたアノテーション間の合意は、コーエンのカッパ指数によって0.45であり、中程度のレベルとして示される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:12:22 GMT)
Vehicle Detection and Classification for Toll collection using YOLOv11 and Ensemble OCR [0.0]
本研究は, YOLOv11コンピュータビジョンアーキテクチャとアンサンブルOCR技術を組み合わせて, プラザごとの1台のカメラを用いて, 自動料金徴収に革命をもたらす革新的な手法を提案する。我々のシステムは、幅広い条件で平均精度0.895を達成し、ライセンスプレート認識では98.5%、軸検出では94.2%、OCR信頼スコアでは99.7%を達成している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:04:02 GMT)
Using Low-Discrepancy Points for Data Compression in Machine Learning: An Experimental Comparison [0.0]
ニューラルネットワークのトレーニングのために,低差分点に基づく2つの手法を探索し,大規模なデータセットを削減する。 1つ目はDickとFeischlの手法で、これはデジタルネットと平均化手順に依存している。ディジタルネットを用いた第2の手法を構築するが、平均化ではなくクラスタリングを行う。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:47:04 GMT)
User Identity Protection in EEG-based Brain-Computer Interfaces [0.0]
脳コンピュータインタフェース(BCI)は、脳と外部デバイスとの間の直接的な通信経路を確立する。 EEGはBCIで最も一般的な入力信号であり、その利便性と低コストのためである。 EEG信号には、保護されるべきユーザーアイデンティティ、感情など、豊富なプライベート情報も含まれている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:48:33 GMT)
Unveiling the optimization process of Physics Informed Neural Networks: How accurate and competitive can PINNs be? [0.0]
本研究では、物理インフォームドニューラルネットワークの潜在的な精度について、従来の類似した研究や従来の数値手法と対比して検討する。改良された最適化アルゴリズムを選択することで、結果の精度が大幅に向上することがわかった。損失関数の簡単な修正は精度を向上し、拡張のための追加の道を提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:03:10 GMT)
Understand the Effectiveness of Shortcuts through the Lens of DCA [0.0]
差分凸アルゴリズム(DCA)は、凸ショートカットとして表現できる非関数を最小化するためのよく知られた非最適化アルゴリズムである。従来の解釈に合わないResNetという新しいアーキテクチャを提案しました。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:46:17 GMT)
The role of inhibitory control in garden-path sentence processing: A Chinese-English bilingual perspective [0.0]
ガーデニングパスの文章を読む際には、人々は競合する解釈を解決しなければならないが、最初の誤解は再分析されたにもかかわらず言語化される可能性がある。本研究は、中国語と英語のバイリンガル間の誤解釈の管理における抑制的制御(IC)の役割について考察する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:45:30 GMT)
The effect of quantum decoherence on inflationary gravitational waves [0.0]
インフレーションの理論は、現在宇宙で観測されている構造を量子力学的に生成されたゆらぎから説明するためのメカニズムを提供する。インフレーションの間、テンソル摂動は他の場と(少なくとも重力的に)相互作用する。この量子デコヒーレンスにより, 重力波パワースペクトルのスケール依存的な増加が, システムと環境間の相互作用の強度と時間依存性に依存することを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:15:59 GMT)
The PET Paradox: How Amazon Instrumentalises PETs in Sidewalk to Entrench Its Infrastructural Power [0.0]
2021年、AmazonはEchoとRingデバイスをリニューアルし、Sidewalkの「ゲートウェイ」に改造した。この矛盾が、Amazonのクラウド接続サービスであるSidewalkの実証的研究とどのように現れるのかを調査する。私たちは、Sidewalk接続によって可能になった新しい情報フローが、監視と競争の懸念を高める方法を示します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:29:32 GMT)
Symmetric masking strategy enhances the performance of Masked Image Modeling [0.0]
Masked Image Modeling (MIM) は、ラベルのない画像から詳細な視覚表現を取得することに焦点を当てた自己教師付き学習の技法である。モデルがグローバルな特徴とローカルな特徴を効果的に捉えるのに役立つ新しいマスキング戦略を提案する。このマスキング戦略であるSymMIMに基づいて,MIMのためのトレーニングパイプラインを提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:01:44 GMT)
SymPT: a comprehensive tool for automating effective Hamiltonian derivations [0.0]
シュリーファー・ヴォルフ変換(SWT)の自動化を目的とした解析ソフトウェアSymPTを導入する。 SymPT は変換の生成元を導出するための体系的で一般化可能な解を提供し、任意の摂動系に対する効果的なハミルトニアンの正確な計算を可能にする。このツールは、標準SWTを超えて、任意の結合排除、ブロック対角化、フル対角化ルーチンを組み込むように、時間非依存と時間周期のハミルトニアンの両方をサポートする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:10:18 GMT)
Superresolution imaging of two incoherent sources via two-photon interference sampling measurements in the transverse momenta [0.0]
2つの熱源のうちの1つからの1つの基準光子と1つの光子の干渉による2光子ビートの発生を実証した。 2つの熱源間の距離の任意の値の推定における最終的な量子精度は、ウェーブパケット空間構造とは独立に達成できる。この技術は、顕微鏡、天文学、リモートセンシングにおいて重要な応用に最適な候補となる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:41:59 GMT)
Strategic Insights in Human and Large Language Model Tactics at Word Guessing Games [0.0]
2022年の初めには、単純な言い回しゲームが嵐で世界を席巻した。本稿では,2年以上に渡り発展してきた日常的なゲームプレイヤーの戦略を考察する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:01:19 GMT)
Speech-based Multimodel Pipeline for Vietnamese Services Quality Assessment [0.0]
本研究は,ベトナムのサービスセクターに着目した,サービス品質評価のための新たなディープラーニングアプローチを提案する。従来の評価手法を超越したマルチモーダルパイプラインを活用することで、従来の評価の限界に対処する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:41:55 GMT)
Space-time toy model for Hawking radiation [0.0]
異なる計量表現で平坦な時空の2つのセクションをグルーリングすることにより、ブラックホール蒸発のための簡易な玩具モデルを構築する。この玩具モデルの単純な構造により、真空状態の異なる2点関数の正確な解析解を構築することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:20:23 GMT)
Solving the Inverse Alignment Problem for Efficient RLHF [0.0]
言語モデルトレーニングにおける「逆アライメント問題」を定義する。本研究では,周期的に凍結されたポリシーに沿ったオフライン嗜好データセットのサブセットに対して,報酬モデルを繰り返し微調整することにより,バニラRLHFを改善するか否かを検討する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:47:38 GMT)
Separation of measurement uncertainty into quantum and classical parts based on Kirkwood-Dirac quasiprobability and generalized entropy [0.0]
本稿では,全測定の不確かさを量子部品と古典部品に加法的に分解する2つの方法を提案する。 2つの分解における真正の量子不確実性は、量子的文脈性を証明するのに十分であり、必要であると主張する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:58:37 GMT)
Selective State Space Memory for Large Vision-Language Models [0.0]
State Space Memory Integration (SSMI)は、LVLMの効率的な微調整のための新しいアプローチである。 SSMIは長距離依存関係をキャプチャし、タスク固有の視覚的およびシーケンシャルなパターンを効果的に注入する。 COCO Captioning、VQA、Flickr30kといったベンチマークデータセットの実験は、SSMIが最先端のパフォーマンスを達成することを実証している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:40:50 GMT)
Seeking the Casimir Energy [0.0]
空洞内の真空の基底状態エネルギーは、外部の値よりも小さくすることができる。超伝導体の臨界温度$T_c$が空洞内に置かれたときに変化するかどうかを調査する。 12マイクロケルビンよりも大きい$T_c$の変化は検出しないが、理論的には0.025マイクロケルビンの順序で変化が期待できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:52:20 GMT)
Script-Based Dialog Policy Planning for LLM-Powered Conversational Agents: A Basic Architecture for an "AI Therapist" [0.0]
大規模言語モデル(LLM)による会話エージェントは,行動医療の大規模サポートをユーザに提供する可能性を秘めている。対話型エージェントにおける対話型ポリシー計画のための新しいパラダイムを導入し、専門家が書いた「スクリプト」に従って行動できるようにする。我々は,異なるプロンプト技術を用いてスクリプトベースの対話ポリシー計画法を2種類実装し,LLM患者との合計100の会話を合成する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:12:47 GMT)
Scalable Spider Nests (...Or How to Graphically Grok Transversal Non-Clifford Gates) [0.0]
これは、ZX-計算を用いてスタビライザコードをいかに理解できるかを研究する一連の「グラフィックグラッキング」論文の第2弾である。本稿では, クモの巣の恒等性と呼ばれるZX-ダイアグラムを含む複合体をZX-計算で捉えることができ, 一つの新規則からこれらすべての同一性が帰納的に証明できることを示す。これは、Clifford "grokking"論文で開発されたCSSコードのZX図と組み合わせて、任意のCSSで実装可能なClifford階層の第3レベルにおけるルールセットの簡単な特徴付けを与えることができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:23:20 GMT)
Roughening dynamics of interfaces in two-dimensional quantum matter [0.0]
2次元量子イジングモデルの強磁性相における界面粗化遷移のシグネチャについて検討する。この結果は、Rydberg原子系で容易に実験できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:57:23 GMT)
Romanized to Native Malayalam Script Transliteration Using an Encoder-Decoder Framework [0.0]
本稿では,ローマ字化マラヤラムを母語文字に変換する逆文字化モデルの開発について述べる。公開可能なIndic言語トランスリテラクションデータセットから得られた430万のトランスリテラルペアのキュレートと組み合わせたコレクションを使用しました。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:33:26 GMT)
Resolving the Quantum Measurement Problem through Leveraging the Uncertainty Principle [0.0]
シュロディンガー方程式は不完全であり、本質的には測定による波動関数の崩壊を説明することができない。位相空間の量子力学では、観測窓をチューニングすることで不確実性を任意に調整できることを示す。我々のフレームワークは、古典力学、量子力学、デコヒーレンス、本質的な量子力学における測定など、異なる概念を橋渡ししているように見える。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:56:21 GMT)
Research Integrity and GenAI: A Systematic Analysis of Ethical Challenges Across Research Phases [0.0]
学界における生成AI(GenAI)ツールの急速な開発と利用は、ユーザにとって複雑で多面的な倫理的課題を提示している。本研究は、さまざまな研究段階におけるGenAIの使用による倫理的懸念について検討することを目的とする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:31:45 GMT)
Quasicondensation and off-diagonal long-range order of hard-core bosons during a free expansion [0.0]
1次元の準凝縮は、ゼロ温度でのハードコアボソン(HCB)の平衡系で起こることが知られている。我々は,HCBの動的準凝縮を再考し,その問題を完全に解析的に処理する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:22:43 GMT)
Quantumness of relic gravitons [0.0]
したがって、MHz と THz の間の重力子の潜在的な検出は、重力場に関連するマクロ量子状態の直接的な証拠である可能性がある。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:32:15 GMT)
Quantum Kernel Machine Learning With Continuous Variables [0.0]
量子カーネルを連続変数量子コンピューティングプラットフォームのための閉形式関数として表現する。すべての核がガウス函数の積として表現され、特徴写像のパラメータの代数函数として表されることを示す。我々は、GKP状態符号化のような無限星級数の特徴写像で定義されるカーネルを、有限星級数の特徴写像で定義されるカーネルによって任意に近似することができることを証明した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:11:55 GMT)
Quantum Imaging with X-rays [0.0]
我々は,1時間あたり約6,300対の検出速度と,X線光子対に対するエネルギー反相関の観測を報告した。結果は、X線量子光学技術の可能性を拡大するX線量子イメージングの大幅な進歩を示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:52:41 GMT)
Quadratic unconstrained binary optimization and constraint programming approaches for lattice-based cyclic peptide docking [0.0]
ペプチド-タンパク質ドッキング問題は、合理的かつ効率的な薬物設計を促進する構造生物学において重要な問題である。本研究は, ペプチド環化およびペプチド-タンパク質ドッキングに関連する目的と制約を, 四面体格子上の2粒子モデルに組み込むことにより, 最近の取り組みを延長する。エンド・ツー・エンドのフレームワークを実装し、タンパク質データバンク(PDB)のインスタンス上でのメソッドの評価を可能にします。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:30:17 GMT)
Propulsion force and heat transfer for nonreciprocal nanoparticles [0.0]
非相反ナノ粒子を含む熱伝達とカシミール力の解析を行った。 2つのナノ粒子の場合、1つの粒子は非相反し、もう1つの粒子は異方的である必要がある。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:54:30 GMT)
Projective characterization of higher-order quantum transformations [0.0]
本研究は,超作用素プロジェクタを用いた高次量子変換を特徴付ける枠組みを提案する。この研究の主な新規性は、'prec'コネクターの代数の導入である。これにより、射影フレームワーク内で特徴づけられる任意の写像の可能なシグナリング構造を評価することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:25:34 GMT)
Predictive Query-based Pipeline for Graph Data [0.0]
グラフ埋め込み技術は大規模グラフの解析と処理を単純化する。 GraphSAGE、Node2Vec、FastRPといったいくつかのアプローチは、グラフの埋め込みを生成する効率的な方法を提供する。埋め込みをノード特性として保存することにより、異なる埋め込み技術を比較し、それらの有効性を評価することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:03:57 GMT)
Predictive Pattern Recognition Techniques Towards Spatiotemporal Representation of Plant Growth in Simulated and Controlled Environments: A Comprehensive Review [0.0]
本稿では,最先端の予測パターン認識技術について概説する。植物形質の確率論的モデリングと動的環境相互作用の統合に着目した。主なトピックは、予測タスクのための回帰とニューラルネットワークベースの表現モデルだ。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:22:35 GMT)
Pre-Deployment Information Sharing: A Zoning Taxonomy for Precursory Capabilities [0.0]
高インパクトで潜在的に危険な能力は、早期の警告ショットに分解されるべきである。これらの早期警告ショットはそれぞれ、前駆的な機能に対応すべきである。本稿では,危険能力帯(地域分類)の分類を,停滞した情報交換の枠組みに関連付けて提案する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:38:42 GMT)
Pixel Intensity Tracking for Remote Respiratory Monitoring: A Study on Indonesian Subject [0.0]
RGBカメラ画像を用いた画素強度変化(PIC)に基づく非接触手法を提案する。実験では、バウンディングボックスのサイズが3つ、フィルターオプションが3つ(ラプラシア語、ソベル語、フィルターなし)、コーナー検出アルゴリズムが2つあった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:57:31 GMT)
Physics Instrument Design with Reinforcement Learning [0.0]
本稿では、勾配に基づく楽器最適化法に代わる物理機器の設計に強化学習(Reinforcement Learning, RL)を用いる場合について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:08:28 GMT)
Personalized and Safe Route Planning for Asthma Patients Using Real-Time Environmental Data [0.0]
喘息患者は、屋外活動における空気の質、気候条件、交通密度にしばしば影響を受ける。ここでは、Microsoft Weather APIが提供するリアルタイムデータを利用する健康に配慮したフレームワークを提示する。高度なA*アルゴリズムは、空気質指標、温度、交通密度、その他の患者関連健康データに依存するルートの動的変化を提供する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:33:19 GMT)
Perfect revivals of Rabi oscillations and hybrid Bell states in a trapped ion [0.0]
ラビ振動の完全再生は、特定の条件下では、捕捉されたイオンの集団反転において可能であることを示す。この性質から、原子運動のシュル「オーディンガー猫状態」はユニタリダイナミクスによって自然に生成されることが分かる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:47:16 GMT)
Optimal Offline ORAM with Perfect Security via Simple Oblivious Priority Queues [0.0]
我々は,メモリアクセスのシーケンスを事前に把握している,いわゆるオフラインORAMについて検討する。我々は、時間フォワード処理により、不要な優先度待ち行列から完全なセキュリティを備えた、最初の最適オフラインORAMを得る。我々の構築に基づいて、我々はまた、不明瞭で完全にセキュアな構成の効率的な外部メモリインスタンス化を提示する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:08:55 GMT)
Nonlocality of Quantum States can be Transitive [0.0]
量子ステアリングは3ビット設定で既に遷移性を示すことを示す。また,非局所性推移性問題と,非局所性に関する概ね見過ごされた多言語性との関係についても論じる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:00:12 GMT)
Nonlocal transfer of high-dimensional unitary operations [0.0]
空間相関を利用して任意のユニタリ演算子の結果を任意の入力状態で非局所的にアクセスする手法を提案する。我々の研究は、将来の量子ネットワークのインスタンスにおいて、量子シミュレーションと計算を効率的に分散する方法を開拓した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 00:20:36 GMT)
Non-Local to Local Eigenbasis Permutations of Pauli Product Diagonal Operators [0.0]
本稿では、量子ハミルトニアンの非局所、スパース、対角形の局所形式へのマッピングの実現可能性について検討する。そのような写像が必ずしも可能であるとは限らないことを証明し、「準粒子局所性導出」を確定的に否定する。我々の仮説は、中性子星のベッケンシュタイン-ホーキングエントロピーとブラックホール転移との相関関係から、この確率の急激な遷移を示唆している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:48:01 GMT)
No quantum solutions to linear constraint systems in odd dimension from Pauli group and diagonal Cliffords [0.0]
線形制約系(LCS)は、古典的でない相関の研究において驚くほど多彩なツールであることが証明されている。特に、奇数次元に LCS が存在するかどうかは不明であるが、古典的な解は持たない。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:24:27 GMT)
Neural Vector Tomography for Reconstructing a Magnetization Vector Field [0.0]
本研究では,スムーズなニューラルネットワークを用いて基礎となるベクトル場をモデル化する。ニューラルネットワークの活性化関数が滑らかに選択される可能性があるため、モデルは高品質な再構成をもたらす。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 07:28:14 GMT)
NLP Cluster Analysis of Common Core State Standards and NAEP Item Specifications [0.0]
Camilli (2024) は、一連のコンテンツ標準とアイテム仕様の関係をマッピングするために自然言語処理(NLP)を用いた方法論を提案した。本研究は,NLPがマッピングプロセスの改善に有効であることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:56:21 GMT)
Multivariate Time Series Clustering for Environmental State Characterization of Ground-Based Gravitational-Wave Detectors [0.0]
LIGOのような重力波観測所は、大規模で地上の機器をインフラに収容している。厳密な地震隔離にもかかわらず、これらは依然として地震騒音やその他の地球外障害の影響を受けやすいままである。これらの観測所の地震状態を特徴づけて、検出器オペレーターに知らせる一連の時間パターンを特定することが重要である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:51:39 GMT)
Multi-Feature Fusion and Compressed Bi-LSTM for Memory-Efficient Heartbeat Classification on Wearable Devices [0.0]
多機能核融合と双方向長短期記憶(Bi-LSTM)を用いた心電図(ECG)を用いた心拍分類の資源効率向上手法を提案する。このデータセットは、MIT-BIH Arrhythmia Database: Normal (N)、Left Bundle Branch Block (LBBB)、Right Bundle Branch Block (RBBB)、Premature Ventricular Contraction (PVC)、Paced Beat (PB)の5つのオリジナルクラスで構成されている。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:48:04 GMT)
MSC: Multi-Scale Spatio-Temporal Causal Attention for Autoregressive Video Diffusion [0.0]
これらの問題に対処するためのマルチスケール因果関係(MSC)フレームワークを提案する。本研究では,空間次元の多重分解能と時間次元の高低周波数を導入し,効率的な注意計算を実現する。理論的には、我々の手法は計算の複雑さを大幅に減らし、訓練の効率を高めることができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:39:09 GMT)
MALAMUTE: A Multilingual, Highly-granular, Template-free, Education-based Probing Dataset [0.0]
言語モデル(LM)は様々な広い領域で優れている。彼らは特定の、きめ細かい知識の領域で習熟を証明しなければならない。 MALAMUTEは教育ベースの最初のクローゼスタイルのデータセットである。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:46:33 GMT)
Lost in the Middle, and In-Between: Enhancing Language Models' Ability to Reason Over Long Contexts in Multi-Hop QA [0.0]
マルチホップ質問応答設定における「中間のロスト」問題の効果を示す。文脈の端からの情報の距離に関して,性能が劣化することを示す。また,過剰な文書の内容を減らすことで問題を緩和する方法を実験した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:13:19 GMT)
LineGS : 3D Line Segment Representation on 3D Gaussian Splatting [0.0]
LineGSは幾何学誘導型3次元ライン再構成と3次元ガウススプラッティングモデルを組み合わせた新しい手法である。その結果, ベースライン法と比較して, 幾何精度とモデルコンパクト性に有意な改善が認められた。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:57:07 GMT)
Leveraging Quantum Superposition to Infer the Dynamic Behavior of a Spatial-Temporal Neural Network Signaling Model [0.0]
本稿では,神経生物学および機械学習に関連する大規模ネットワークのダイナミクスに関する新しい問題クラスを導入,解決する。これらの問題を量子重ね合わせを利用して定式化し,Deutsch-Jozsa と Grover の量子アルゴリズムを用いて効率的に解けることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:57:16 GMT)
Leveraging Chemistry Foundation Models to Facilitate Structure Focused Retrieval Augmented Generation in Multi-Agent Workflows for Catalyst and Materials Design [0.0]
ケミカル基礎モデルは,構造に着目したセマンティックケミカル情報検索の基盤として機能することを示す。また,OpenCLIP などのマルチモーダルモデルと化学基礎モデルの併用について述べる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:11:25 GMT)
Lens Distortion Encoding System Version 1.0 [0.0]
LDESは、あるビューから別のビューへの直接変換に使用される単一の高品質でアニマタブルなSTMapを生成する。 View Mapsは自由に組み合わせたり、変換したり、アニメーションしたりできるので、アナモルフィックから球面歪みへのスムーズなシフトのような効果もできる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 03:42:00 GMT)
Large collective power enhancement in dissipative charging of a quantum battery [0.0]
古典場によって駆動されるN$2レベル原子の集まりと、共通の貯水池に崩壊する量子電池のモデルを考える。エネルギー$E$が$N$にスケールし、変動が$Delta E/Eから0$にスケールする広範政権において、我々の散逸的な充電プロトコルは、ハミルトンプロトコルによってこの体制では達成できないスケールである$N2$に比例するパワーを得る。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:02:46 GMT)
Kinetic inductance traveling wave amplifier designs for practical microwave readout applications [0.0]
チタン窒化ニオブ(NbTiN)をパラメトリック増幅に用いる速度インダクタンストラベリング波増幅器これらのデバイスは、約5.5-7.25GHzの3dB帯域を持つ10dB以上のゲインを示す。我々はNbTiN伝送路のインピーダンスミスマッチを観察するが、これは利得リップルの大半の源である可能性が高い。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:16:54 GMT)
Investigating generalization capabilities of neural networks by means of loss landscapes and Hessian analysis [0.0]
本稿では,新たに改良されたPyTorchライブラリLoss Landscape Analysis(LLA)を用いたニューラルネットワーク(NN)の一般化機能について検討する。 LLAは、NN Hessianの特性とともに、損失景観の可視化と解析を容易にする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:02:41 GMT)
Impact of Shoe Parameters on Gait Using Wearables [0.0]
本研究は、慣性計測ユニット(IMU)センサーを搭載したウェアラブルデバイスを用いる。ウェアラブルデバイスから収集された生センサデータは、拡張カルマンフィルタを用いて処理される。本分析では, 靴パラメータと歩行特性, 安定性, 移動性, 歩数, 推進力の相関性について検討した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:57:41 GMT)
Identifying Predictions That Influence the Future: Detecting Performative Concept Drift in Data Streams [0.0]
本稿では,データストリームにおける潜在的な性能的概念的ドリフトを特定することを目的とした,新しいタイプのドリフト検出タスクを提案する。 CheckerBoard Performative Drift Detection (CB-PDD) と呼ばれる最初のドリフト検出手法を提案する。その結果,CB-PDDは高い有効性,偽検出率の低下,内在的ドリフトに対するレジリエンス,半合成データセットにおける実行的ドリフトを効果的に検出する能力を示した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:45:18 GMT)
IQViC: In-context, Question Adaptive Vision Compressor for Long-term Video Understanding LMMs [0.0]
我々は、新しいビジュアルコンプレッサー、IQViC(In-context, Question Adaptive Visual)を組み込んだ長期ビデオ理解のためのフレームワークを提案する。 IQViCはトランスフォーマーベースのビジュアル圧縮機であり、ビデオの完全な視覚的特徴に依存する既存の方法とは異なり、質問条件付きテキスト内圧縮を可能にする。提案するIQViCフレームワークの有効性と,映像理解の精度とメモリ効率の観点から,最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:52:02 GMT)
How good is my story? Towards quantitative metrics for evaluating LLM-generated XAI narratives [0.0]
XAIにおけるLLMの急速な応用は、定量的な説明をユーザフレンドリーな物語に変換することである。 LLM生成の物語を評価するためのフレームワークを提案し,いくつかの自動メトリクスを探索する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:45:45 GMT)
Holographic Non-Hermitian Lattices and Junctions with PT-Restoring RG Flows [0.0]
Inhomogenoeus non-Hermitian strong linked holographic field theory。 PTを自発的に破壊する解と、そうでない解を見つける。このことは、arXiv:2110.05289の摂動的なセットアップで観測されたものと同様、IRにPT対称性の復元が存在すると主張する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:30:14 GMT)
Gillespie algorithm for quantum jump trajectories [0.0]
本稿では,古典的Gilespieアルゴリズムに触発された量子ジャンプの解法を提案する。物理複雑性を増大させる例を4つ含み、オープン量子系シミュレーションにおける関心の体系をまたいだアルゴリズムの性能について論じる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:52:02 GMT)
Generation of massively entangled bright states of light during harmonic generation in resonant media [0.0]
入射レーザー光の絡み合った高調波を生成するために、物質の非線形光学応答をいかに制御できるかを示す。我々の分析は、量子情報科学に影響を及ぼすように、アト秒物理学と量子光学のインターフェースにおいて驚くべき機会を開く。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:24:53 GMT)
Gaussian quantum Markov semigroups on finitely many modes admitting a normal invariant state [0.0]
ガウス量子マルコフ半群(GQMS)は、いくつかの量子系の進化をモデル化する上で、基本的な重要性を持つ。正規不変状態を持つこれらのGQMSを完全に特徴付け、正規不変状態の集合を記述する。まず、デコヒーレンス自由部分代数と$mathbfZ$のスペクトルとの関係を明らかにする。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 10:01:18 GMT)
Fitness landscape for quantum state tomography from neutron scattering [0.0]
最近、2スピン相互作用における静的構造因子と量子基底状態の直接接続が証明された。これは中性子散乱による量子状態トモグラフィーの可能性を示している。構造因子の平均2乗距離と関連する状態との線形関係を見出した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:00:03 GMT)
Financial Sentiment Analysis: Leveraging Actual and Synthetic Data for Supervised Fine-tuning [0.0]
汎用言語モデルは、金融における感情分析には一般的すぎる。我々は、短い財務文を長い財務文に導入し、フィンベルト-lcはデジタルテキストから感情を決定する。その結果,ファイナンシャル・フレーズバンクのデータに対するf1スコアが50%,合意レベルが100%であった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 04:59:50 GMT)
Exploring Text Representations for Online Misinformation [0.0]
偽ニュースと呼ばれる誤報や偽報は、社会を苦しめ続けている。この論文は、誤情報を検出するのに有用な表現の作成に寄与する。これは、分類とクラスタリングを用いた偽ニュース検出におけるトピック機能の有効性を示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:22:36 GMT)
Exploration of optimal hyperfine transitions for spin-wave storage in $^{167}$Er$^{3+}$:Y$_2$SiO$_5$ [0.0]
磁場下では、特定のZEFOZ点における最長のTrm hyp$は、サイト1(サイト2)に対して150 s (90 s)を超えると予測される。この実験は、ZEFOZ点の位置におけるこの傾向を好んでいる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:13:08 GMT)
Exchange-Symmetrized Qudit Bell Bases and Bell-State Distinguishability [0.0]
単一粒子ヒルベルト空間次元$d$のキューディ対の絡み合いは、量子情報処理にとって重要なポテンシャルを持つ。 2つの粒子間の状態の交換の下で、定対称性を持つ一般化ベル基底を導入する。我々は、線形進化と局所測定に制限されたデバイスによって明確に区別できるキュディットベル状態の数を定量化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:33:43 GMT)
Exact quantization of nonreciprocal quasi-lumped electrical networks [0.0]
本稿では、非線形で非相反的な準ランプ型電気ネットワークの正準量子化可能なハミルトン記述を得るための正確な方法を提案する。我々は、一般準ループ要素ネットワークのハミルトン的記述を求める際に生じる特異点を同定し、分類する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 18:30:34 GMT)
Evaluation of quantum key distribution systems against injection-locking attacks [0.0]
デコイ状態のBB84プロトコルの現在のセキュリティ証明は、アリスの信号の均一な位相ランダム化を前提としている。本研究は, 射出ロックから位相脱ランダム化を特徴付ける実験手法を提案する。提案手法はソースに依存しない手法であり, インジェクションロック攻撃に対する一般的なQKDシステムの評価に利用できる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:21:14 GMT)
Evaluation of GPT-4o & GPT-4o-mini's Vision Capabilities for Salt Evaporite Identification [0.0]
本稿では, 染色画像から塩分を同定する手法として, OpenAI の視覚モデル (GPT-4o と GPT-4o-mini) の可能性について検討する。 GPT-4o モデルは 57% の精度と 0.52 F1 のスコアを達成し、ランダムチャンス (8%) と GPT-4o mini (1% の精度) の両方を著しく上回った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 22:02:48 GMT)
Error threshold in active steering protocols for few-qubit systems [0.0]
振幅および位相雑音による誤差チャネルの存在下での弱測定量子ビットのアクティブステアリングプロトコルについて検討した。エラーレートが十分に小さい場合、プロトコルは、高忠実で高純度な事前指定された純粋なターゲット状態に近づき、安定化する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:46:51 GMT)
Entanglement, separability and correlation topology of interacting qubits [0.0]
そのような量子ビットの進化した結合状態は、ポテンシャルの性質やパラメータによって分離可能あるいは絡み合った状態である可能性があることが示されている。量子ビットを他の量子ビットにコピーすることで、新しい量子ビット位相測定法について検討した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:39:05 GMT)
Entangled states from sparsely coupled spins for metrology with neutral atoms [0.0]
粒子間結合数の対数のみを特徴とするスパース相互作用グラフを用いて、量子センシングのための最適状態を生成することができることを示す。結果として得られる疎結合グラフとプロトコルは、光学的ツイーザにおける原子の動的再構成を用いて効率よく実装することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:53:56 GMT)
Enhanced photoisomerization with hybrid metallodielectric cavities based on mode interference [0.0]
ハイブリッド金属誘電体キャビティが光異性化反応に及ぼす影響について検討した。狭いフォトニックモードと互いに結合する広いプラズモンモードによるスペクトル密度の干渉により、ハイブリッドキャビティはエネルギー選択的なパーセル効果をもたらす。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 13:07:17 GMT)
Emotional Images: Assessing Emotions in Images and Potential Biases in Generative Models [0.0]
本稿では、生成人工知能(AI)モデルにより生成された画像の感情的誘発における潜在的なバイアスと矛盾について検討する。我々は、AIが生成した画像によって誘発される感情と、それらの画像を作成するために使用されるプロンプトによって誘発される感情を比較した。発見は、AI生成画像が元のプロンプトに関係なく、しばしばネガティブな感情的コンテンツに傾いていることを示している。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:26:00 GMT)
Edge AI-based Radio Frequency Fingerprinting for IoT Networks [0.0]
暗号は、小さなフットプリントのリソース制限されたデバイス(つまりIoT)に対して、しばしばリソース集約的である。 RFF(Radio Frequency Fingerprinting)は、暗号化ソリューションに頼ることなく、有望な認証手段を提供する。リソース制約のあるデバイスに適した、非常に軽量なEdge AIベースのRFFスキームを2つ導入する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:55:10 GMT)
Dynamic Cross-Modal Alignment for Robust Semantic Location Prediction [0.0]
本稿では,この課題に固有の文脈的あいまいさとモダリティの相違に対処するための識別フレームワークであるtextitContextualized Vision-Language Alignment (CoVLA)を紹介する。ベンチマークデータセットの実験では、CoVLAは最先端の手法を著しく上回り、精度は2.3%、スコアは2.5%向上した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:29:37 GMT)
Driving of an open quantum system at finite temperature across first- and second-order quantum phase transitions [0.0]
非零温度でのクビットの開完全連結系は有限時間間隔で駆動される。駆動は、第1および第2次量子相遷移の有限サイズの前駆体を分解された基底状態相から絡み合った基底状態相へと導く。量子相転移に伴うパラメータ領域における熱浴の存在と、地表面に影響を及ぼす回避交差の特定のパターンと、励起状態とが相まって、ターゲット地表面状態の生成精度が著しく向上する可能性が示唆された。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 20:01:14 GMT)
Deterministic steady-state subradiance within a single-excitation basis [0.0]
サブラディアンスは量子情報に有望な応用を示すが、その実現はスーパーラディアンスよりも難しい。本研究は,完全サブラジオアンスと真の多部量子絡み合い資源を持つ単一励起基底における状態空間を紹介する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:08:48 GMT)
Data Integration with Fusion Searchlight: Classifying Brain States from Resting-state fMRI [0.0]
本稿では,異なる静止状態fMRI計測値に含まれる相補的な情報を組み合わせるための融合サーチライトフレームワークを提案する。説明可能なAIによって、各メトリックのデコードに対する差分の影響を再構築できることを示します。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:24:52 GMT)
Critical behavior of the Schwinger model via gauge-invariant VUMPS [0.0]
変分一様行列積状態(VUMPS)アルゴリズムとゲージ不変行列積 ansatz を組み合わせた格子シュウィンガーモデルについて検討した。同時臨界・極限連続体におけるスケーリングを解析し、データの崩壊が顕著な精度でIsingクラスと一致していることを確認する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 05:16:21 GMT)
Coordinate Space Modification of Fock's Theory-Harmonic Tensors in the Quantum Coulomb Problem [0.0]
フォックの運動量空間における水素原子の基本的な理論を考える。フォックの理論を変更し、運動量空間の記述を放棄する。シュラディンガー方程式が4次元ラプラス方程式となる座標 4D 空間を求める。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 08:28:17 GMT)
Continuous symmetry entails the Jordan algebra structure of quantum theory [0.0]
連続対称性は、さらに3つの要件とともに、有限次元一般化確率論の基礎となる数学的構造が単純ユークリッドジョルダン代数となることを示す。さらなる要件は、スペクトル性、強い状態空間、および gbit property と呼ばれる条件である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:46:14 GMT)
Client-Side Patching against Backdoor Attacks in Federated Learning [0.0]
フェデレーション学習は、悪意のある参加者によって起動されるバックドア攻撃に対して脆弱である。本稿では,クライアント側のバックドア攻撃を緩和するフェデレーション学習システムのための新しい防御機構を提案する。我々のアプローチは、バックドア攻撃の影響を和らげるために、敵対的学習技術とモデルパッチを利用する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 23:17:10 GMT)
Class flipping for uplift modeling and Heterogeneous Treatment Effect estimation on imbalanced RCT data [0.0]
授業と治療の不均衡は、アップリフト/HTE推定において重要な問題である。本稿では,選択したレコードのクラス値のフリップに基づくアンダーサンプリングに代わるアプローチを提案する。提案手法は予測効果を歪めず,キャリブレーションを必要としないことを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:49:40 GMT)
CESAR: A Convolutional Echo State AutoencodeR for High-Resolution Wind Forecasting [0.0]
風力エネルギー、特に高分解能は、非線形統計モデルの開発を要求する。この研究は、Convolutional Echo State AutoencodeRCESARネットワークベースのモデルを導入している。 CESARは、提案されている建設現場の風速と電力の予測を最大17%向上させることができるかを示す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:41:59 GMT)
Buzz to Broadcast: Predicting Sports Viewership Using Social Media Engagement [0.0]
本稿では,投稿数,コメント,スコア,およびTextBlobおよびVADERからの感情分析を含むソーシャルメディアの指標を用いて,スポーツ観戦の回帰に基づく予測手法を提案する。このモデルは、$R2$ 0.99、Mean Absolute Error (MAE)は1.27万、Root Mean Squared Error (RMSE)は2.33万である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 17:34:18 GMT)
Behaviour of One-Site Entanglement and Reduced Fidelity in an Anisotropic Spin-2 chain [0.0]
一般的な異方性スピン2鎖のMP基底状態における絡み合いと忠実度測定のばらつきについて検討した。これらのMP状態は、システムの正確な基底状態解を表す。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 06:09:16 GMT)
Automated Image Captioning with CNNs and Transformers [0.0]
本研究の目的は、入力画像の自然言語記述を生成する自動画像キャプションシステムの構築である。我々は、CNN-RNNから、より先進的なトランスフォーマーベース技術まで、さまざまなテクニックを採用しています。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 19:12:11 GMT)
Are you doing better than random guessing? A call for using negative controls when evaluating causal discovery algorithms [0.0]
ランダムな推測よりも優れた評価基準を提案する。本研究では,様々な因果発見評価指標の予測行動について,ランダムな推定の下で正確な分布結果を得る。これらのメトリクスは、特定のシナリオにおいてランダムな推定の下で非常に大きな値を達成できることを示し、したがって、負の制御結果を報告することなく、それらを使用することを警告する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:00:26 GMT)
Anticoncentration and magic spreading under ergodic quantum dynamics [0.0]
ランダム量子回路のダイナミックスの下でのマジックのアンチ集中と平衡は、システムサイズと対数的にスケールするときに起こる。この研究は、一次元エルゴード・フロケモデルとハミルトン系における反集中と魔法の拡散を調べることでこのアイデアに挑戦する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 16:00:34 GMT)
Adopting Explainable-AI to investigate the impact of urban morphology design on energy and environmental performance in dry-arid climates [0.0]
本研究では,都市建築エネルギーモデリング(UBEM)と機械学習(ML)と説明可能なAI技術を組み合わせた都市形態評価手法を提案する。テヘランの密集した都市景観をケーススタディとして、この研究は30の形態パラメータが主要なエネルギー指標に与える影響を評価し、ランク付けする。その結果、建築形態、窓と壁の比率、商業比率がエネルギー効率に影響を与える最も重要なパラメータであることが判明した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:19:49 GMT)
Adaptive Sampling to Reduce Epistemic Uncertainty Using Prediction Interval-Generation Neural Networks [0.0]
本稿では,予測モデルにおけるてんかんの不確実性を低減するための適応サンプリング手法を提案する。我々の主な貢献は、潜在的なてんかんの不確実性を推定する計量の開発である。ガウス過程(GP)に基づくバッチサンプリング戦略も提案する。本研究では, 実験肥料の施肥率を選択するために, 3つの一次元合成問題と, 農業分野に基づく多次元データセットについて検討した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 21:21:47 GMT)
AI in the Cosmos [0.0]
情報源分類、スペクトルエネルギー分布モデリングなど、天体物理学におけるAI応用例を強調し、生成AIによる達成可能な進歩について議論する。 AIの使用は、バイアスやエラー、AIモデルの“ブラックボックス”といった課題を導入している。これらの問題は、人間の専門知識とドメイン固有の知識をAIアプリケーションに統合するHG-AI(Human-Guided AI)の概念を通じて解決することができる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:30:11 GMT)
A modular entanglement-based quantum computer architecture [0.0]
マルチパーティの絡み合いを利用したモジュラー量子計算アーキテクチャを提案する。ベル対よりも異なる種類の多部絡み合いを用いることで、モジュール間のより効率的で柔軟な結合が可能になる。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 09:35:27 GMT)
A logic for reasoning with inconsistent knowledge -- A reformulation using nowadays terminology (2024) [0.0]
本稿では,不整合知識を用いた推論の論理について述べる。信頼関係は、相容れない仮定を選択するために用いられる。矛盾が導出されない限り、その知識は一貫していると仮定される。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:22:39 GMT)
A Non-Convex Optimization Strategy for Computing Convex-Roof Entanglement [0.0]
混合状態に対する絡み合いの数値計算法を開発した。この手法は曲線を確実に再現するのに十分であることがわかった。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 14:29:02 GMT)
A Gated Residual Kolmogorov-Arnold Networks for Mixtures of Experts [0.0]
Gated Residual Kolmogorov-Arnold Networks (GRKAN)に基づく新しいMoEフレームワークであるKAMoEを紹介する。デジタル資産市場と不動産評価の実験を通じて、KAMoEは様々なタスクやモデルタイプで従来のMoEアーキテクチャを一貫して上回っていることを実証した。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 15:04:30 GMT)
A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データをクラスタリングするための情報理論手法を提案する。提案手法は,Information Bottleneckアルゴリズムの決定論的変種に基づいて構築される。 4つのクラスタリング手法に対して,本手法の性能評価を行った。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 11:01:06 GMT)
A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0]
Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。本研究では,マルチスケール特徴表現の強化を目的としたCAGA(Cascaded Atrous Group Attention)モジュールを提案する。提案手法は,MCSIデータセットの0.98%のスコアで最先端性能を実現し,モデルのパラメータを元のEfficientViT-L1と比較して37.5%削減する。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 12:47:30 GMT)
A 3D lattice defect and efficient computations in topological MBQC [0.0]
本稿では,3次元クラスタ状態における計測ベース量子計算(MBQC)の効率的な完全フォールトトレラント実装について述べる。 2つの重要な特徴は、(i)基盤となるクラスタ状態における格子欠陥の導入と(ii)ルドルフ・グルーバー・リビット符号化の使用である。
論文参考訳（メタデータ） (Fri, 13 Dec 2024 01:26:14 GMT)