Fugu-MT: arxivの論文翻訳(概要)

OASIS: Open Agent Social Interaction Simulations with One Million Agents [147.0]
実世界のソーシャルメディアプラットフォームに基づくスケーラブルなソーシャルメディアシミュレータを提案する。 OASISは最大100万人のユーザをモデリングできる大規模なユーザシミュレーションをサポートする。我々は、情報拡散、グループ分極、XプラットフォームとRedditプラットフォーム間の群れ効果など、様々な社会現象を再現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:00:03 GMT)
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey [124.2]
マルチモーダルCoT (MCoT) 推論は近年大きな研究の注目を集めている。既存のMCoT研究は、画像、ビデオ、音声、オーディオ、3D、構造化データの課題に対処する様々な手法を設計している。我々はMCoT推論に関する最初の体系的な調査を行い、関連する基礎概念と定義を解明する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:47:43 GMT)
Trade-offs in Large Reasoning Models: An Empirical Analysis of Deliberative and Adaptive Reasoning over Foundational Capabilities [101.8]
近年のLRM(Large Reasoning Models)の進歩は、特殊推論タスクにおいて顕著な性能を示している。議論的推論能力の獲得は, LRMの基礎的能力を大幅に低下させることを示す。適応推論(Zero-Thinking, Less-Thinking, Summary-Thinking)がこれらの欠点を効果的に軽減できることを示します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:18:51 GMT)
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining [100.2]
SceneSplatは,3DGS上で動作する最初の大規模屋内シーン理解手法である。また,ラベルのないシーンからリッチな3D特徴学習を解放する自己教師型学習手法を提案する。 SceneSplat-7Kは、6868シーンからなる屋内シーンのための最初の大規模3DGSデータセットである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:50:25 GMT)
MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation [87.3]
推論セグメンテーション(Reasoning segmentation)は、人間の意図と空間的推論に基づく複雑なシーンにおける対象オブジェクトのセグメンテーションを目的としている。最近のマルチモーダル大言語モデル(MLLM)は印象的な2次元画像推論セグメンテーションを実証している。本稿では,2次元MLLMから3次元シーン理解へ知識を伝達するフレームワークであるMLLM-For3Dを紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:40:20 GMT)
Retrieval Augmented Generation and Understanding in Vision: A Survey and New Outlook [85.4]
Retrieval-augmented Generation (RAG) は人工知能(AI)において重要な技術である。具体化されたAIのためのRAGの最近の進歩は、特に計画、タスク実行、マルチモーダル知覚、インタラクション、特殊ドメインの応用に焦点を当てている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:33:28 GMT)
Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.0]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。 Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:21:33 GMT)
Inductive Moment Matching [81.0]
Inductive Moment Matching (IMM) は1段階または数段階のサンプリングのための新しい生成モデルである。 IMMはImageNet-256x256上の拡散モデルを8ステップのみを用いて1.99 FIDで上回り、CIFAR-10上で1.98の最先端の2ステップFIDをスクラッチから訓練したモデルで達成する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:26:01 GMT)
DexDiffuser: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation [78.6]
高度なロボティクスにとって、接触に富んだ相互作用による有害な操作が不可欠である。本稿では,適応的デキスタラス操作のための対話型拡散計画フレームワークであるDexDiffuserを紹介する。当社のフレームワークは, 目標適応度の高いタスクにおいて, 平均70.7%の成功率を実現し, コンタクトリッチな操作における堅牢性と柔軟性を強調した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:51:01 GMT)
SG-Tailor: Inter-Object Commonsense Relationship Reasoning for Scene Graph Manipulation [73.8]
本稿では,2つのノード間の競合のない関係を予測する自己回帰モデルであるSG-Tailorを紹介する。エッジ修正のために、SG-Tailorは、競合を解消し、グラフをグローバルに調整するために、Cut-And-Stitch戦略を採用している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:11:04 GMT)
EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting [72.6]
生物学的ビジョンにインスパイアされたイベントカメラは、時間分解能の高い画素の強度を非同期に記録する。本稿では,イベントカメラの利点を3DGSにシームレスに統合するイベント支援フリートラジェクトリ3DGSを提案する。提案手法を,パブリックタンクとテンプルのベンチマークと,新たに収集した実世界のデータセットであるRealEv-DAVISで評価した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:41:06 GMT)
VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation [70.7]
画像生成と映像生成の両方において人間の視覚的嗜好を学習するためのフレームワークであるVisionRewardを紹介する。 VisionRewardは、マシンメトリクスと人的評価の両方において、既存の画像およびビデオ報酬モデルを大幅に上回ることができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:37:33 GMT)
A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning [67.7]
事前訓練された視覚モデル(PVM)は現代のロボティクスの基本であるが、その最適構成は定かではない。セマンティック・ボトルネックを導入してオブジェクト中心の表現を誘導する手法であるSlotMIMを開発した。提案手法は,画像認識,シーン理解,ロボット学習評価において,従来の作業よりも大幅に改善されている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:34:06 GMT)
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation [67.3]
視覚言語ナビゲーション(VLN)のためのリライト駆動型AugMentation(RAM)パラダイムを提案する。書き換え機構を応用して, シミュレータフリー, 省力化の両面で新たな観察指導が可能となり, 一般化が促進される。離散環境 (R2R, REVERIE, R4R) と連続環境 (R2R-CE) の両方における実験により, 本手法の優れた性能と優れた一般化能力が示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:18:17 GMT)
Convergence of Policy Mirror Descent Beyond Compatible Function Approximation [66.4]
我々は,より弱い変動支配を前提とした理論的PMD一般政策クラスを開発し,最良クラス政策への収束を得る。我々の主観念は、占有度-勾配測度によって誘導される局所ノルムによって誘導される新しい概念を活用する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:17:50 GMT)
Large Language Models: A Survey [66.4]
大規模言語モデル(LLM)は、広範囲の自然言語タスクにおける強力なパフォーマンスのために、多くの注目を集めている。 LLMの汎用言語理解と生成能力は、膨大なテキストデータに基づいて数十億のモデルのパラメータを訓練することで得られる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:51:01 GMT)
FisherTune: Fisher-Guided Robust Tuning of Vision Foundation Models for Domain Generalized Segmentation [65.9]
既存のアプローチでは、パラメータを選択的に微調整するか、VFMを凍結し、アダプタのみを更新する。我々は、Domain-Related Fisher Information Matrix (DR-FIM) によって誘導される堅牢な微調整法である textbfFisherTune を提案する。 DR-FIMはタスクやドメイン間でパラメータの感度を測定し、汎用性を維持し、DGSS適応性を高めるための選択的更新を可能にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:47:15 GMT)
Aligning Multimodal LLM with Human Preference: A Survey [62.9]
大規模言語モデル(LLM)は、タスク固有のトレーニングを必要とせずに、単純なプロンプトで幅広い汎用タスクを処理できる。 MLLM(Multimodal Large Language Models)は、視覚的、聴覚的、テキスト的データを含む複雑なタスクに対処する大きな可能性を実証している。しかし、真理性、安全性、o1のような推論、および人間の嗜好との整合性に関する重要な問題は未解決のままである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:07:54 GMT)
Multi-focal Conditioned Latent Diffusion for Person Image Synthesis [59.1]
遅延拡散モデル(LDM)は高解像度画像生成において強力な機能を示した。これらの制約に対処する多焦点条件付き潜時拡散法(MCLD)を提案する。本手法では,顔の同一性やテクスチャ固有の情報を効果的に統合する多焦点条件アグリゲーションモジュールを利用する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:10:16 GMT)
Unified Geometry and Color Compression Framework for Point Clouds via Generative Diffusion Priors [58.9]
テスト時統合幾何および3次元点雲の色圧縮フレームワークを提案する。本手法は,形状や色を圧縮する上で,既存のベースラインに比べて優れた性能を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:27:48 GMT)
CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation [57.9]
本稿では,大規模視覚基盤モデル(LVFM)を効果的に活用し,エッジモデルの性能を向上させる知識蒸留手法であるCustomKDを提案する。我々のシンプルで効果的なCustomKDは、LVFMに固有のよく一般化された特徴を、モデルの違いを減らすために、与えられた学生モデルにカスタマイズする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:53:08 GMT)
End-to-End Implicit Neural Representations for Classification [57.6]
Inlicit Neural representations (INRs) は、ニューラルネットワークパラメータの信号を符号化し、信号再構成に優れた結果を示す。 INRをベースとした分類は、CNNのようなピクセルベースの手法に比べて、依然としてかなり低性能である。本研究は,SIRENを学習段階のスキームとともに初期化するエンド・ツー・エンドの戦略を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:02:23 GMT)
Certifiably Robust Policies for Uncertain Parametric Environments [57.2]
本稿ではパラメータ上の未知分布を持つパラメトリックマルコフ決定プロセス(MDP)に基づくフレームワークを提案する。パラメータによって誘導される未知のサンプル環境に対するIMDPの学習と解析を行う。当社のアプローチは,信頼度の高い政策のパフォーマンスに厳密な拘束力をもたらすことを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:24:23 GMT)
Personalized Language Models via Privacy-Preserving Evolutionary Model Merging [57.2]
大規模言語モデル(LLM)におけるパーソナライゼーションは、個々のユーザまたはユーザグループの好みに合わせてモデルをカスタマイズすることを目指している。進化的アルゴリズム(PriME)によるプライバシ保護モデルマージを提案する。 PriMEは、ユーザのプライバシを保護しながら、タスク固有のメトリクスを直接最適化するために、勾配のないメソッドを使用している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:46:07 GMT)
ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data [56.2]
広範に利用可能なビデオデータから学習することで、RLを自動的に誘導するデータ駆動手法を提案し、分析する。インテント条件付き値関数を使用して、多様なビデオから学び、これらのゴール条件付き値を報酬に組み込む。実験により、ビデオ学習値関数は、様々なデータソースとうまく機能し、人間のビデオ事前学習からのポジティブな転送を示し、目に見えない目標に一般化し、データセットサイズでスケールできることが示されている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:24:33 GMT)
Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models [54.0]
大規模言語モデル(LLM)は複雑なタスクにおいて顕著な機能を示した。 OpenAI o1とDeepSeek-R1の最近の進歩は、System-2推論ドメインのパフォーマンスをさらに改善した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:24:54 GMT)
Deformable Radial Kernel Splatting [53.9]
Deformable Radial Kernel (DRK)を導入し,ガウススプラッティングをより汎用的で柔軟なフレームワークに拡張する。 DRKは、エッジシャープネスと境界曲率の正確な制御を可能にしながら、様々な形状プリミティブを効率的にモデル化する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:26:18 GMT)
Interpreting Object-level Foundation Models via Visual Precision Search [53.8]
より少ない領域で正確な属性マップを生成する視覚的精度探索法を提案する。本研究では,DINO と Florence-2 の SOTA に対するオブジェクトレベルのタスク解釈可能性の向上を,様々な評価指標で示す。提案手法は,複数の評価指標にまたがる既存の手法を超越して,視覚的接地や物体検出タスクにおける障害を解釈することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:10:30 GMT)
F-LMM: Grounding Frozen Large Multimodal Models [53.8]
我々は,人間とAIの会話において,F-LMM(F-LMM)を解凍したLMMを提示する。単語と画素の対応が視覚的接地によって誘導されるという事実は、十分に訓練されたLMMの注意機構に本質的に存在するという事実に基づいている。表現セグメンテーションと単視的物語グラウンドベンチマークの競合性能を実現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:20:35 GMT)
Forensics-Bench: A Comprehensive Forgery Detection Benchmark Suite for Large Vision Language Models [53.6]
Forensics-Benchは、新しい偽検出評価ベンチマークスイートである。 63,292件の厳密にキュレートされたマルチチョイスの視覚的質問からなり、112件の独特な偽造検出をカバーしている。 GPT-4o, Gemini 1.5 Pro, Claude 3.5 Sonnetの22のオープンソースLVLMと3つのプロプライエタリモデルについて徹底的な評価を行った。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:00:23 GMT)
MathAgent: Leveraging a Mixture-of-Math-Agent Framework for Real-World Multimodal Mathematical Error Detection [53.3]
これらの課題に対処するために設計された新しいMixture-of-Math-AgentフレームワークであるMathAgentを紹介する。 MathAgentはエラー検出を3つのフェーズに分解し、それぞれが特別なエージェントによって処理される。実世界の教育データに基づいてMathAgentを評価し,誤差ステップ同定の精度を約5%向上した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:25:08 GMT)
Expanding the Boundaries of Vision Prior Knowledge in Multi-modal Large Language Models [53.1]
本稿では、視覚エンコーダの事前知識がMLLMの性能に与える影響を定量化するために、新しい計量である$Rank_e$を導入する。視覚エンコーダレベルで事前知識を明示的に組み込んだ2段階トレーニングフレームワークであるVisPREを提案する。実験の結果,視覚エンコーダの事前知識の増大はMLLMの視覚理解能力を大幅に向上させることが示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:33:09 GMT)
Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.7]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。 NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:52:36 GMT)
PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.7]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。 PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:24:32 GMT)
LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation [52.2]
LASERは、チューニング不要のLCM駆動のアテンションコントロールフレームワークである。テキスト条件付きイメージ・トゥ・アニメーションベンチマークを提案し,その有効性と有効性を検証する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:01:44 GMT)
Optical-Flow Guided Prompt Optimization for Coherent Video Generation [51.4]
我々は,光フローによる映像生成プロセスをガイドするMotionPromptというフレームワークを提案する。ランダムフレーム対に適用した訓練された識別器の勾配を用いて,逆サンプリングステップにおける学習可能なトークン埋め込みを最適化する。提案手法により,生成したコンテンツの忠実さを損なうことなく,自然な動きのダイナミクスを忠実に反映した視覚的コヒーレントな映像シーケンスを生成することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:34:32 GMT)
Cat-AIR: Content and Task-Aware All-in-One Image Restoration [50.5]
Cat-AIRは textbfAnd textbfTask-aware framework for textbfImage textbfRestoration のための新しいフレームワークである。 Cat-AIRは、異なるタスクに対して局所的およびグローバル的情報を適応的にバランスをとる、交互に変化する空間チャネルアテンション機構を組み込んでいる。実験により、Cat-AIRは広範囲の修復作業において最先端の結果を達成し、従来の方法よりもFLOPを少なくすることを示した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:25:52 GMT)
Dynamic Allocation Hypernetwork with Adaptive Model Recalibration for FCL [49.5]
適応型モデル再校正(textbfFedDAH)を用いた動的アロケーション・ハイパーネットワークの医療領域におけるサーバサイドFCLパターンを提案する。バイアス最適化のために,従来のモデルの変更候補を現在のサーバ更新に組み込むために,新しい適応モデル再校正(AMR)を導入する。 AMOSデータセットの実験では、異なるタスクストリームを持つサイトの他のFCLメソッドよりもFedDAHの方が優れていることが示されています。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:12:56 GMT)
SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer [49.2]
本稿では,テキスト・画像生成における効率的なスケーリングを実現する線形拡散変換器であるSANA-1.5を提案する。効率的なトレーニングスケーリング、モデルの深さ決定、推論時間スケーリングの3つの重要なイノベーションを紹介します。これらの戦略により、SANA-1.5 は GenEval 上のテキスト計算画像アライメントスコア 0.81 を達成し、VILA-Judge による推論スケーリングにより、さらに 0.96 に改善できる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:41:24 GMT)
TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting [49.0]
本稿では, 八面体配向型3次元ガウス平板を用いた高速PBR材料生成のためのTexGaussianを提案する。本手法は,PBR素材をより視覚的に合成し,非条件シナリオとテキスト条件シナリオの両方において,従来の方法よりも高速に動作させる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:27:04 GMT)
Diffusion Transformer Policy [48.5]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:03:59 GMT)
M3Net: Multimodal Multi-task Learning for 3D Detection, Segmentation, and Occupancy Prediction in Autonomous Driving [48.2]
M3Netは、自動運転の検知、セグメンテーション、および3D占有率予測に同時に取り組む新しいネットワークである。 M3NetはnuScenesベンチマークで最先端のマルチタスク学習性能を達成する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:08:09 GMT)
PSHuman: Photorealistic Single-image 3D Human Reconstruction using Cross-Scale Multiview Diffusion and Explicit Remeshing [47.2]
PSHumanは、マルチビュー拡散モデルから事前情報を利用した人間のメッシュを明示的に再構築する新しいフレームワークである。単視点の人間の画像に直接多視点拡散を適用すると、厳密な幾何学的歪みが生じることが判明した。そこで我々は, SMPL-Xのようなパラメトリックモデルを用いて, 人間のポーズの断面形状の整合性を高めるために, 生成モデルを定式化した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:27:12 GMT)
From Knowledge Generation to Knowledge Verification: Examining the BioMedical Generative Capabilities of ChatGPT [45.7]
本手法は, 疾患中心の関連性の生成と関連性検証という2つのプロセスから構成される。選択したLSMとしてChatGPTを用いて,疾患と関連する薬物,症状,遺伝子との連携を確立するために,迅速なエンジニアリングプロセスを構築した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:02:53 GMT)
Learning Visual Generative Priors without Text [45.4]
I2I(Image-to-image)の生成について検討した。我々のI2Iモデルは、より基礎的な視覚的先行として機能し、既存のT2Iモデルよりも同等または優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:10:56 GMT)
Decoupling Angles and Strength in Low-rank Adaptation [45.0]
Decoupled Low-rank Adaptation (DeLoRA)は学習可能な低ランク行列を正規化しスケールする新しい微調整法である。 DeLoRAは競合するPEFT法の性能に適合し,強靭性を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:00:56 GMT)
GEMeX: A Large-Scale, Groundable, and Explainable Medical VQA Benchmark for Chest X-ray Diagnosis [44.8]
胸部X線診断(GEMeX)のための大規模・地中・説明可能な医用VQAベンチマークを導入する。 151,025の画像と1,605,575の質問により、GEMeXは現在最大の胸部X線VQAデータセットである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:25:56 GMT)
One-Shot Manipulation Strategy Learning by Making Contact Analogies [43.4]
本稿では,新しい物体への高速かつ広範囲な一般化による操作戦略のワンショット学習のための新しいアプローチMAGICを提案する。リファレンスアクショントラジェクトリを活用することで、MAGICは、新しいオブジェクト上の類似した接触点とアクションのシーケンスを効果的に識別する。 MAGICは既存の手法よりも優れた性能を示し、実行速度を大幅に向上し、異なるオブジェクトカテゴリへの一般化を実現している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:02:09 GMT)
EventHallusion: Diagnosing Event Hallucinations in Video LLMs [42.7]
MLLM(Multimodal Large Language Models)はビデオ理解の分野で大きな進歩を遂げている。本稿では,イベントに対するビデオLLMの幻覚を評価する新しいベンチマークであるEventHallusionを提案する。また,ビデオLLMの幻覚化問題に対処するため,TCD(Temporal Contrastive Decoding)と呼ばれるシンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:16:06 GMT)
Hardware-efficient quantum error correction via concatenated bosonic qubits [41.6]
量子コンピュータは、論理量子ビットが多くのノイズの多い物理量子ビットで冗長に符号化される量子エラー補正を組み込む必要がある。ここでは、マイクロファブリケート超伝導量子回路を用いて、符号化されたボソニックキャット量子ビットの連結から形成される論理量子ビットメモリを実現する。論理量子ビットメモリの性能とスケーリングについて検討し,位相フリップ補正繰り返し符号がしきい値以下で動作していることを見出した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:24:42 GMT)
Finsler Multi-Dimensional Scaling: Manifold Learning for Asymmetric Dimensionality Reduction and Embedding [41.6]
次元化の削減は、データ分析や可視化における中心的な応用とともに、重要なパターンを保ちながら、特徴的次元を減らし、複雑なデータを単純化することを目的としている。基礎となるデータ構造を維持するため、多次元スケーリング(MDS)法は距離などの対等な相似性を保存することに重点を置いている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:03:22 GMT)
MammAlps: A multi-view video behavior monitoring dataset of wild mammals in the Swiss Alps [41.6]
MammAlps(マムアルプス)は、スイス国立公園の9つのカメラトラップから収集した野生生物の行動のデータセットである。 6135個の単一動物クリップに基づいて,最初の階層的・マルチモーダルな動物行動認識ベンチマークを提案する。また,活動,種,個体数,気象条件の同定を目的とした第2の生態指標を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:51:58 GMT)
Quantile-Based Randomized Kaczmarz for Corrupted Tensor Linear Systems [39.9]
テンソル回帰(テンソルレグレッション)として知られる、劣化した測定値からテンソル値の信号を再構成すること。本研究では、テンソル線形系問題である$mathcalA MathcalX=mathcalB$に対処し、$mathcalA$は測定演算子、$mathcalX$は未知のテンソル値信号、$mathcalB$は測定値を含む。このような破損は、送信、感覚、記憶のエラーがインスタンス毎に稀であるが、データセット全体にわたって起こりうる、大規模なテンソルデータでよく見られる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:15:33 GMT)
Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k [39.5]
商用レベルのビデオ生成モデルであるOpen-Sora 2.0について紹介する。トップパフォーマンスビデオ生成モデルのトレーニングコストは,高い制御性を有することを示す。 Open-Sora 2.0を完全にオープンソースにすることで、先進的なビデオ生成技術へのアクセスを民主化することを目指している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:43:54 GMT)
Are Images Indistinguishable to Humans Also Indistinguishable to Classifiers? [39.3]
ニューラルネットワークベースの分類器の観点からは、高度な拡散モデルでさえもこの目標には程遠いことが示される。本手法は,生成したデータの特定の特徴を解析することにより,拡散モデルの診断ツールとして自然に機能する。次に、モデルオートファジー障害に光を当て、生成されたデータの使用に関する洞察を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:42:05 GMT)
PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting [38.5]
最大4K解像度(2048$times$4096)を効率的にサポートする汎用フィードフォワードアプローチであるPanSplatを提案する。提案手法は,フィボナッチ格子を配置した球状3次元ガウスピラミッドを特徴とし,情報冗長性を低減しつつ画質を向上させる。実験により、PanSplatは、合成データセットと実世界のデータセットの両方で、優れた効率と画質を実現することが示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:46:58 GMT)
Anomize: Better Open Vocabulary Video Anomaly Detection [38.4]
Open Vocabulary Video Anomaly Detectionは、ベースと新規の両方の異常を検出し分類する。最初の課題は曖昧さの検出であり、モデルが正確な異常スコアを不慣れな異常に割り当てるのに苦労する。第二の課題は分類の混乱であり、新しい異常はしばしば視覚的に類似したベースインスタンスとして誤って分類される。そこで我々は,新しいラベルの符号化の指針となるラベル関係を取り入れ,新しいビデオと対応するラベルのアライメントを改善することを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:49:32 GMT)
MAO: Efficient Model-Agnostic Optimization of Prompt Tuning for Vision-Language Models [37.9]
即時チューニングのためのモデル非依存最適化(MAO)を提案する。データ駆動型拡張フレームワークを導入し、初期データの分散を最適化する。タスク固有の機能処理パイプラインを強化するために、Alterable Regularizationモジュールを組み込んだ。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:59:33 GMT)
Histomorphology-driven multi-instance learning for breast cancer WSI classification [37.7]
現在のスライド画像(WSI)分類法は、組織形態情報を効果的に組み込むのに苦労している。組織形態をWSI分類に明示的に組み込んだ新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:25:29 GMT)
Quantum-enabled Rydberg atomic polarimetry of radio-frequency fields [37.7]
ライドバーグ原子は、高周波(RF)と光ドメインの間で効率的に光子を結合する。原子状態の角運動量量子化による分光シグネチャについて検討する。本研究は、量子気象電場評価のためのRydberg原子偏光度測定の展望について重要な知見を与える。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:13:36 GMT)
Selecting and Pruning: A Differentiable Causal Sequentialized State-Space Model for Two-View Correspondence Learning [36.3]
2視点対応学習は,イメージペア間の真と偽の対応を識別することを目的としている。 Mamba固有の選択性にインスパイアされ、textbfCorrMamba, textbfCor correspondingence filterを提案する。我々の方法は、AUC@20textdegreeにおいて、以前のSOTAを2.58ドルの絶対パーセンテージポイントで上回っている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:44:21 GMT)
Principles of Visual Tokens for Efficient Video Understanding [36.1]
少人数のトークンを効果的に選択できる軽量ビデオモデルLITEを提案する。 LITEはデータセットやその他のタスクに対して,再トレーニングを必要とせずに一般化可能であることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:09:19 GMT)
SymmCompletion: High-Fidelity and High-Consistency Point Cloud Completion with Symmetry Guidance [35.9]
対称性誘導に基づく高能率補完手法であるSymCompletionを導入する。提案手法は,局所対称性変換ネットワーク (LSTNet) とSGFormer (Symmetry-Guidance Transformer) の2成分からなる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:45:37 GMT)
Unraveling the Effects of Synthetic Data on End-to-End Autonomous Driving [35.5]
SceneCrafterは3Dガウススプレイティングに基づくリアルでインタラクティブで効率的な自動運転シミュレータである(3DGS)。 SceneCrafterは、さまざまなトラフィックシナリオにわたる現実的な運転ログを効率的に生成する。また、エンドツーエンドモデルの堅牢なクローズドループ評価を可能にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:27:43 GMT)
Metaphor-based Jailbreaking Attacks on Text-to-Image Models [35.2]
タブーゲームに触発されたtextbfmetaphor ベースの textbfjailbreaking textbf attack 手法である textbfMJA を導入する。我々の敵対的プロンプトは、様々なオープンソースおよび商用T2Iモデル間で強い転送可能性を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:40:39 GMT)
Quantized Spike-driven Transformer [35.2]
スパイクニューラルネットワークは、従来の人工ニューラルネットワークに代わる有望なエネルギー効率の代替として出現している。量子化スパイク駆動型トランスフォーマーベースライン(QSD-Transformer)を提案する。 QSD-Transformerは性能劣化に悩まされることが多い。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:55:16 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [35.0]
MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。 MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:55:02 GMT)
Concept-as-Tree: Synthetic Data is All You Need for VLM Personalization [34.6]
コンセプト・アズ・トレー(CaT)は木構造としての概念を表し、正と負のサンプルのデータ生成を可能にする。十分に設計されたデータフィルタリング戦略により、当社のCaTフレームワークは、生成されたデータの品質を保証できます。この研究は、VLMパーソナライズのための制御可能な初めての合成データパイプラインである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:45:43 GMT)
CLCR: Contrastive Learning-based Constraint Reordering for Efficient MILP Solving [34.1]
制約順序付けは、MILP(Mixed-Integer Linear Programming)ソルバの効率において重要な役割を果たす。 CLCR(Contrastive Learning-based Constraint Reordering)は,制約順序を体系的に最適化し,MILP解決を高速化する新しいフレームワークである。ベンチマーク実験により、CLCRは解の精度を犠牲にすることなく、解の時間を30%削減し、LPイテレーションを25%削減した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:01:43 GMT)
DEPTH: Discourse Education through Pre-Training Hierarchically [33.9]
DEPTHは、談話指向の事前学習目標を用いて文の潜在表現を学習するエンコーダ・デコーダモデルである。我々のアプローチは、他の自然言語理解能力(NLU)に最小限の影響を与えながら、T5の談話能力を拡張する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:06:07 GMT)
Sneaking Syntax into Transformer Language Models with Tree Regularization [33.7]
構文的帰納バイアスの導入は、トランスフォーマー言語モデルにおけるより堅牢でデータ効率のよい学習を解放する可能性がある。ここでは,銀パースからの括弧決定を微分可能性制約の集合に変換する補助的損失関数であるTreeRegを紹介する。 TreeRegは標準のLM目標とシームレスに統合され、アーキテクチャの変更は不要である。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:26:25 GMT)
SLAM3R: Real-Time Dense Scene Reconstruction from Monocular RGB Videos [33.6]
SLAM3Rは、RGBビデオを用いたリアルタイム、高品質、高密度な3D再構成のための新しいシステムである。フィードフォワードニューラルネットワークを通じて、ローカルな3D再構成とグローバルな座標登録をシームレスに統合する。 20FPS以上のリアルタイム性能を維持しつつ、最先端の復元精度と完全性を達成する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:01:39 GMT)
One is Plenty: A Polymorphic Feature Interpreter for Immutable Heterogeneous Collaborative Perception [32.2]
自律運転における協調的知覚は、個々のエージェントの知覚能力を著しく向上させる。既存のほとんどのメソッドはインタプリタを通してセマンティックギャップをブリッジする。ポリモーフィック機能インタプリタであるPolyInterを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:21:21 GMT)
M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask [32.1]
インターネット上の画像(Baidu TiebaのPS Barなど)は様々な技術を用いて操作される。操作された画像を原画像から抽出するだけで得られるマスクには、様々なノイズが含まれている。変化検出の分野に触発されて、元の画像と操作された画像を、同じ画像の時間経過とともに変化として扱う。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:50:57 GMT)
SVGFusion: Scalable Text-to-SVG Generation via Vector Space Diffusion [32.0]
本稿では,実世界のSVGデータにスケール可能なテキスト間SVGモデルであるSVGFusionを紹介する。 SVGFusionの中核となる考え方は、人気のあるText-to-Imageフレームワークを使用して、ベクトルグラフィックスの連続的な潜在空間を学習することである。 SVGFを効果的に訓練し,評価するために,大規模で高品質なSVGデータセットであるSVGX-Datasetを構築した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:20:45 GMT)
Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization [31.7]
本稿では、優先最適化のパラダイムを用いて、モダリティバイアス問題を解決することを提案する。具体的には、まず摂動を導入し、特定のモダリティの情報量を減らすことでデータセットを構築する。自動構築したデータにおける避けられないノイズに対処するために、ノイズロバストな平均絶対誤差と直接選好最適化における二項交叉エントロピーを組み合わせる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:00:11 GMT)
OmnimatteZero: Training-free Real-time Omnimatte with Pre-trained Video Diffusion Models [31.5]
オムニマテゼロ(OmnimatteZero)は、オムニマテの既訓練ビデオ拡散モデルを利用したトレーニング不要の手法である。ビデオからオブジェクトを取り除き、個々のオブジェクト層をその効果とともに抽出し、それらのオブジェクトを新しいビデオに合成する。自己注意マップは、オブジェクトとそのフットプリントに関する情報をキャプチャし、それらを使ってオブジェクトの効果を描き、クリーンな背景を残します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:26:48 GMT)
STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models [31.4]
大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対してますます脆弱になっている。本稿では,リアルタイムジェイルブレイク判定のための軽量フレームワークSTShieldを紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:23:07 GMT)
Enhance GNNs with Reliable Confidence Estimation via Adversarial Calibration Learning [30.5]
優れた予測性能にもかかわらず、GNNは信頼度が低いことがしばしばある。この問題は、不正検出やリスクアセスメントといった高リスク領域における信頼性に関する懸念を提起する。本稿では,異なるノード群間のキャリブレーションを適応的に強化する新しいAdvCaliフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:04:41 GMT)
D$^3$: Scaling Up Deepfake Detection by Learning from Discrepancy [29.9]
既存の文献は、目に見えない発電機上でのディープフェイク検出の一般化能力を強調している。この研究は、より一般化と堅牢性のある普遍的なディープフェイク検出システムに向けた一歩である。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:36:20 GMT)
Improving the Transferability of Adversarial Attacks on Face Recognition with Diverse Parameters Augmentation [29.5]
顔認識(FR)モデルは、良質な顔画像を微妙に操作する敵の例に対して脆弱である。既存の敵攻撃法は、サロゲートモデルを増強する潜在的な利点を見落としていることが多い。本稿では,DPA攻撃法(Diverse Parameters Augmentation)と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:14:27 GMT)
SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures [29.2]
高品質な画素レベルのセグメンテーションマップを生成するために,SCSegamba(Structure-Aware Vision Mamba Network)を提案する。具体的には、軽量なGated Bottleneck Convolution(GBC)とStructure-Aware Scanning Strategy(SASS)を組み合わせたSAVSS(Structure-Aware Visual State Space Module)を開発した。クラックベンチマークを用いた実験により,本手法は他のSOTA法よりも優れており,パラメータが2.8Mで最高性能を達成できた。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:59:45 GMT)
Effective and Efficient Masked Image Generation Models [28.7]
実証的に、eMIGMはImageNet生成に強いパフォーマンスを示す。 eMIGMは最先端の連続拡散モデルに匹敵する性能を達成する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:33:29 GMT)
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE [28.6]
本稿では,多次元ベクトル量子化変分オートエンコーダ(VQVAE)を利用して3Dオブジェクトをトークン化する新しいフレームワークであるScale AutoRegressive 3D(SAR3D)を紹介する。次の単一トークンの代わりにマルチスケールの潜在表現で次のスケールを予測することで、SAR3Dは生成時間を著しく短縮する。実験の結果,SAR3Dは現行の3D生成法よりも高速かつ高品質であることがわかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:01:53 GMT)
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering [28.5]
誤解を招くチャートの視覚化は、知覚を歪め、誤った結論につながる可能性がある。大規模言語モデル(MLLM)の最近の進歩は、強力なチャート理解能力を示している。本稿では,ミスリーディングチャート質問回答ベンチマーク(Misleading Chart Question Answering (Misleading ChartQA)ベンチマーク)を紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:56:33 GMT)
Taste More, Taste Better: Diverse Data and Strong Model Boost Semi-Supervised Crowd Counting [28.4]
人口密度の高いシーンのアノテーションコストに対処するためには,半教師による群集カウントが不可欠である。我々は、データとモデルの両方に重点を置いた、テイスト・モア・テイスト・ベター(TMTB)と呼ばれる新しいフレームワークを提案する。我々は,4つのベンチマークデータセットの広範な実験を行い,提案手法が最先端の手法よりも大きなマージンで優れていることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:38:01 GMT)
MotiF: Making Text Count in Image Animation with Motion Focal Loss [28.0]
Text-Image-to-Video (TI2V) の生成は、テキスト記述に従って画像からビデオを生成することを目的としている。我々は、モデル学習をより多くの動きを持つ領域に誘導する、シンプルで効果的なアプローチであるMotiFを紹介した。運動熱マップを生成するために光学的流れを使用し、運動の強度に応じて損失を重み付けする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:30:55 GMT)
Omnidirectional Multi-Object Tracking [27.9]
パノラマ画像は、Multi-Object Tracking(MOT)をサポートする包括的な情報を提供するほとんどのMOTアルゴリズムは、視野が限られているピンホール画像用に調整されており、パノラマ環境での有効性を損なう。我々はOmniTrackを提案する。OmniTrackは、Tracklet Managementを組み込んで時間的キューを導入し、FlexiTrackインスタンスをオブジェクトのローカライゼーションとアソシエーションに利用し、CircularStatEモジュールを使って画像や幾何学的歪みを緩和する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:58:13 GMT)
VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation [27.8]
VideoAutoArenaは、LMMのビデオ分析能力を自動評価するアリーナスタイルのベンチマークである。 VideoAutoArenaは、ユーザシミュレーションを利用して、ビデオ理解におけるモデルパフォーマンスを厳格に評価する、オープンエンドで適応的な質問を生成する。我々は、より困難なビデオ分析シナリオに対処するためにモデルをプッシュするために、障害駆動型進化戦略を導入し、徐々に疑問の複雑さを増す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:01:22 GMT)
FROG: Fair Removal on Graphs [27.6]
本研究では,公正な未学習課題に対して,グラフ構造とそれに対応するモデルを協調的に最適化する手法を提案する。具体的には、私たちのアプローチは、忘れるのを妨げる冗長なエッジを取り除くことで、未学習の効率を高めるためにグラフを再構成する。フェアアンラーニング性能の信頼性を評価するために,最悪ケース評価機構を導入する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:39:53 GMT)
Teaching Large Language Models to Regress Accurate Image Quality Scores using Score Distribution [27.4]
我々は,Multi-modal Large Language Models (MLLM) を用いて,正確な品質スコアを回帰する。鍵となる課題は、品質スコアが本質的に連続であり、一般的にガウス分布としてモデル化されるのに対し、MLLMは離散トークン出力を生成することである。スコア分布をソフトラベルに識別する分布に基づく手法を提案する。スコア分布の特性を保存し、高精度で画像間関係を維持する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:59:31 GMT)
LongDiff: Training-Free Long Video Generation in One Go [27.4]
LongDiff は位置マッピング (PM) と Informative Frame Selection (IFS) で構成されるトレーニング不要の手法である。提案手法は,時間的位置の曖昧さと情報の希薄化という,映像生成の短期的一般化を妨げる2つの重要な課題に対処する。提案手法は,市販ビデオ拡散モデルの可能性を解き明かし,高品質な長編ビデオ生成を実現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:34:57 GMT)
Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [27.0]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:36:48 GMT)
MMAC-Copilot: Multi-modal Agent Collaboration Operating Copilot [26.5]
PCアプリケーションと対話する大規模言語モデルエージェントは、実環境とのインタラクションの特異なモードのため、しばしば制限に直面します。アプリケーションとのインタラクション能力を高めるために,Multi-Modal Agent Collaboration framework (MMAC-Copilot)を提案する。 GAIAベンチマークと新たに導入したビジュアルインタラクションベンチマーク(VIBench)を用いてMMAC-Copilotを評価する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:04:57 GMT)
DualCP: Rehearsal-Free Domain-Incremental Learning via Dual-Level Concept Prototype [26.3]
我々は、新しい知識の学習とRFDILにおける古い知識の保持の対立に対処するため、各クラスにデュアルレベル概念プロトタイプ(DualCP)を設計する。 DualCPを構築するために、各クラスに対して粗粒度と細粒度の両方のプロトタイプを生成するコンセプトプロトタイプジェネレータ(CPG)を提案する。 DomainNet、CDDB、CORe50データセットの実験により、本手法の有効性が示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:06:35 GMT)
Vision-R1: Evolving Human-Free Alignment in Large Vision-Language Models via Vision-Guided Reinforcement Learning [26.1]
LVLM(Large Vision-Language Models)は通常、2段階の訓練パラダイムの事前訓練と教師付き微調整を行う。言語領域から派生した嗜好最適化は,学習後強化戦略として有効である。本稿では,LVLMのための新しい視覚誘導型R1様強化学習アルゴリズムであるVision-R1を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:21:14 GMT)
What Time Tells Us? An Explorative Study of Time Awareness Learned from Static Images [25.9]
静的画像から時間認識を学ぶ可能性を探る。タイムスタンプと関連する視覚表現を協調的にモデル化するための時間画像コントラスト学習手法を提案する。本研究は,静止画像から時間関連視覚手がかりを学習し,様々な視覚課題に有用であることが示唆された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 01:56:35 GMT)
PathoHR: Breast Cancer Survival Prediction on High-Resolution Pathological Images [25.8]
乳癌生存予測のための新しいパイプラインであるPathoHRを提案する。当社のアプローチでは,パッチワイドWSI表現を強化するために,プラグイン・アンド・プレイ高解像度ビジョン変換器(ViT)を組み込む必要がある。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:37:24 GMT)
EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test [25.7]
LLMコミュニティのトレンドは、推論コストを増大させることなく、モデルインテリジェンスを改善するためにトレーニングデータをスケールアップすることです。 EAGLE-3は直接トークン予測に賛成して機能予測を放棄し、トップ層機能への依存を多層機能融合に置き換える。これらの改善により、パフォーマンスが大幅に向上し、ドラフトモデルがトレーニングデータのスケールアップの恩恵を完全に受けられるようになりました。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:33:08 GMT)
Balanced Direction from Multifarious Choices: Arithmetic Meta-Learning for Domain Generalization [24.7]
分散シフトに対処するために、ドメインの一般化を提案する。 1次メタ学習アルゴリズムはドメインの一般化に強い性能を示す。算術重み付き勾配を用いた単純かつ効果的な算術メタラーニングを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:24:28 GMT)
Simulating Filter Bubble on Short-video Recommender System with Large Language Model Agents [24.6]
本稿では,大規模言語モデルに基づくシミュレーションフレームワークを用いて,推薦アルゴリズムとユーザフィードバックのダイナミクスを明らかにする。我々は、コンテンツ均質化を悪化させる人口動態の特徴やカテゴリーアトラクションなどの重要な要因を同定する。我々は、女性や低所得者などの脆弱なグループに対する株式の保護について提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:35:58 GMT)
Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization [23.8]
本稿では,過度な最適化問題を緩和するために,行動対応型政策最適化(BSPO)手法を提案する。 BSPOは強化学習過程におけるOOD反応の発生を減少させる。実験の結果,BSPOは報酬過度最適化の防止においてベースラインよりも優れていた。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:20:59 GMT)
Surrogate Learning in Meta-Black-Box Optimization: A Preliminary Study [23.3]
本稿では,代用学習プロセスと強化学習支援微分進化アルゴリズムを組み合わせたMetaBBOフレームワークを提案する。 Surr-RLDEは、サロゲート学習とポリシー学習の2つの学習段階から構成される。本稿では,Surr-RLDEが最近のベースラインと競合する性能を示すだけでなく,高次元問題に対する魅力的な一般化を示すことを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:07:57 GMT)
PG-SAM: Prior-Guided SAM with Medical for Multi-organ Segmentation [23.3]
本報告では, 精密なモダリティ事前整合器を用いて, 特定の医療知識を活用し, より優れたモダリティ整合性を実現するプリエントガイドSAM (PG-SAM) を提案する。我々のデコーダはマルチレベル特徴融合と反復マスク操作によりモデルの表現能力を向上する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:06:07 GMT)
Interpretable Feature Interaction via Statistical Self-supervised Learning on Tabular Data [22.2]
Spofeは、統計的厳密さによる明確な解釈可能性を達成するために、原則化された表現をキャプチャする、新しい自己教師型機械学習パイプラインである。このアプローチの基盤となるのは、正確なエラー境界と厳密な偽発見率(FDR)制御を提供する、堅牢な理論フレームワークです。さまざまな実世界のデータセットの実験は、Spotfeの有効性を実証している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:27:42 GMT)
Vehicular Road Crack Detection with Deep Learning: A New Online Benchmark for Comprehensive Evaluation of Existing Algorithms [22.2]
都市デジタルツイン (UDT) の新興分野において, 先進的インテリジェントロードインスペクション (IRI) 車両は土木インフラの維持に不可欠である。深層学習に基づく道路亀裂検出法は, より効率的に, 正確に, 客観的に亀裂を検出するために開発された。本稿では,SoTA の深層学習に基づくアルゴリズムについて,(2) 教師なし,(3) 半教師付き,(4) 道路亀裂検出のための弱教師付き手法を徹底的に検討する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:26:18 GMT)
Strategic Prompt Pricing for AIGC Services: A User-Centric Approach [21.6]
現在のアプローチでは、生成AIモデルの選択と活用において、ユーザの戦略的2段階の決定プロセスを見落としている。本稿では,迅速なエンジニアリングにおけるユーザのさまざまな能力を捉える理論的枠組みである即時あいまいさを導入する。当社のOPPアルゴリズムは,既存の価格設定機構と比較して,プラットフォームペイオフの最大31.72%の改善を実現している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:41:06 GMT)
PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos [21.4]
PhysTwinは、対話中の動的オブジェクトのスパースビデオを使用して、写真と物理的にリアルでリアルタイムなインタラクティブなレプリカを生成する新しいフレームワークである。提案手法は,(1)現実的な物理シミュレーションのためにバネ質量モデルを組み合わせた物理インフォームド表現,および幾何学のための生成形状モデル,およびレンダリングのためのガウススプラットである。本手法は,視覚的知覚の手がかりと逆物理の枠組みを統合し,部分的,隠蔽的,限定的な視点からでも高忠実度復元を可能にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:49:19 GMT)
MedPlan:A Two-Stage RAG-Based System for Personalized Medical Plan Generation [21.4]
MedPlanは、実生活のクリニックと整合する推論を構造化するフレームワークである。本手法では、まず患者症状と客観的データに基づいて臨床評価を作成した2段階のアーキテクチャを用いて、この評価から得られた構造化された治療計画を定式化し、検索強化世代による患者固有の情報に富む。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:03:56 GMT)
Long Is More Important Than Difficult for Training Reasoning Models [21.4]
問題の難しさよりも推論長が、主に訓練されたモデルの性能に影響を及ぼすことを示す。このモデルであるLong1K-32Bは,1,000のトレーニングサンプルだけで優れた性能を発揮する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:33:59 GMT)
SupReMix: Supervised Contrastive Learning for Medical Imaging Regression with Mixup [21.3]
医用画像退行に対するコントラスト学習の可能性は,2つの重要な側面,すなわち常性意識と硬さの欠如により,隠蔽されていると論じる。 SupReMixを用いた医用画像回帰のための教師付きコントラスト学習を提案する。アンカー・インクルージョン混合物(アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン混合物、アンカー・インクルージョン
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:28:08 GMT)
Diffusion Models with Deterministic Normalizing Flow Priors [21.2]
フローと拡散モデルを正規化する手法であるDiNof(textbfDi$ffusion with $textbfNo$rmalizing $textbff$low priors)を提案する。標準画像生成データセットの実験は、既存の手法よりも提案手法の利点を実証している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:57:35 GMT)
A new approach for encoding code and assisting code understanding [21.0]
GPTは、タスクや出力のグローバルな理解なしに、次の単語を生成する局所的で欲求的なプロセスに依存している。我々は、次の単語予測パラダイムを超えて、コード理解のための新しいパラダイムを提案する。我々は、そのコードを、画像とタンパク質構造の両方を模倣するグローバル情報の記憶を持つ異種画像パラダイムとしてエンコードする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:30:23 GMT)
SimMotionEdit: Text-Based Human Motion Editing with Motion Similarity Prediction [20.9]
本稿では,関連するタスク,動作類似度予測を導入し,マルチタスク学習パラダイムを提案する。我々は、意味論的意味のある表現の学習を促進するために、動きの編集と動きの類似性予測を共同で訓練する。実験は、アライメントと忠実さの両面において、我々のアプローチの最先端性能を実証した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:29:37 GMT)
Dynamic Task Vector Grouping for Efficient Multi-Task Prompt Tuning [20.4]
マルチタスクプロンプトチューニングでは、複数の高ソースのタスクを使用して、低ソースのターゲットタスクのパフォーマンスを改善する。既存のアプローチは、訓練されたソフトプロンプトを、すべてのソースタスクまたは単一の高相のソースタスクを1回だけ繰り返して転送する。最適な転送性能は、ソースタスクの組み合わせによってもたらされることがよくあります。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:09:04 GMT)
PanopticSplatting: End-to-End Panoptic Gaussian Splatting [20.0]
そこで我々は,オープン・ボキャブラリ・パノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノパノ本手法では,クエリ誘導型ガウス分割と局所的クロスアテンションを導入し,クロスフレームアソシエーションなしで2次元のインスタンスマスクを持ち上げる。本手法は,ScanNet-V2とScanNet++データセット上での3Dシーンパノビュータ再構成において,高い性能を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:45:39 GMT)
Real-World Remote Sensing Image Dehazing: Benchmark and Baseline [19.7]
実世界のリモートセンシングのハージーなイメージペアの不足により、既存の手法は、主に合成データセットに頼らざるを得なくなった。実世界のハズー画像とデハズー画像のペアを含む最初の大規模データセットであるRRSHID(Real-World Remote Sensing Hazy Image dataset)を紹介する。そこで本研究では,実世界のRSIDに適した新しいフレームワークMCAF-Netを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:15:46 GMT)
TSPRank: Bridging Pairwise and Listwise Methods with a Bilinear Travelling Salesman Model [19.7]
トラベリングセールスマン問題ランキング (TSPRank) は、ハイブリッド・ペア・リストワイズ・ランキング法である。 TSPRankの既存の手法に対する大きな利点は、ランク付け中にグローバルな情報をよりよく活用できることである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:50:23 GMT)
Mind with Eyes: from Language Reasoning to Multimodal Reasoning [19.7]
言語モデルは近年、推論の領域に進出していますが、より包括的で人間的な認知能力を達成する可能性を完全に解き放つことは、マルチモーダルな推論を通じて行われています。この調査は、最近のマルチモーダル推論アプローチの体系的な概要を提供し、それらを言語中心のマルチモーダル推論と協調マルチモーダル推論の2つのレベルに分類する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:40:44 GMT)
Instructing the Architecture Search for Spatial-temporal Sequence Forecasting with LLM [18.6]
大規模言語モデル(LLM)に基づくSTSFのための新しいNAS手法を提案する。提案手法は,STSFの既存のNAS法に対して,より優れた効率で競合効率を実現することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:59:04 GMT)
Gazing at Rewards: Eye Movements as a Lens into Human and AI Decision-Making in Hybrid Visual Foraging [18.6]
我々は、強化学習により訓練されたトランスフォーマーベースのビジュアルフォアガー(VF)モデルを開発する。我々のモデルは、一連のターゲットとその対応する値を取り、望ましくない視覚を用いて画像を処理します。眼球運動を連続させ、各固定アイテムを収集するかどうかを判断する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:34:04 GMT)
Unveiling the Tapestry: the Interplay of Generalization and Forgetting in Continual Learning [18.6]
AIでは、一般化とは、与えられたタスクに関連するアウト・オブ・ディストリビューション・データに対して、トレーニングされたデータ以外にうまく機能するモデルの能力を指す。継続的な学習方法は、しばしば破滅的な忘れを軽減し、以前のタスクからの知識を確実に保持するメカニズムを含んでいる。本稿では, 形状テクスチュア整合性規則化(STCR)と呼ばれる, 連続的な学習を支援する簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:48:05 GMT)
Atom of Thoughts for Markov LLM Test-Time Scaling [18.3]
大規模言語モデル(LLM)は、トレーニング時間スケーリングによって優れたパフォーマンスを達成する。推論の規模が大きくなるにつれて、既存のテストタイムスケーリング手法は、蓄積した履歴情報に悩まされる。複雑な推論は、独立して自己完結した一連のサブクエストを解くことで達成できる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:05:28 GMT)
Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes [18.2]
3次元屋内シーン生成は,デジタルおよび実環境の設計において重要な課題である。このタスクの既存の方法は、これらの属性に対して非常に限定的な制御を示す。提案手法であるDecorumにより,自然言語によるシーン生成プロセスの制御が可能となる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:48:44 GMT)
WISE: A Framework for Gigapixel Whole-Slide-Image Lossless Compression [17.9]
WSI(Whole-Slide Images)は、組織スライド全体の高解像度画像を提示することで、医療分析に革命をもたらした。スライドの物理的ストレージは避けるが、WSIは大量のデータを必要とするため、WSIレコードの保存とメンテナンスは高価で持続不可能である。 WISEは、ギガピクセルのWSI画像を平均36倍、最大136倍に効果的に圧縮できることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:51:24 GMT)
BADTV: Unveiling Backdoor Threats in Third-Party Task Vectors [17.7]
大規模な事前学習モデルにおけるタスク算術は、広範囲のトレーニングを伴わずに、様々な下流タスクへのアジャイル適応を可能にする。本稿では,テレビのバックドア攻撃に対する脆弱性について検討し,悪質なアクターがそれらを悪用してモデルの整合性を損なう方法を明らかにする。 BadTVはタスク学習, 忘れ, アナロジー操作において, 同時に有効であるように設計されたバックドア攻撃である。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:20:38 GMT)
Does GCL Need a Large Number of Negative Samples? Enhancing Graph Contrastive Learning with Effective and Efficient Negative Sampling [17.5]
Graph Contrastive Learningは、低次元グラフ表現を自己教師する。 GCLの有効性は多数の負の対に依存するという意見が一致している。有効かつ効率的な負のサンプルであるE2Negを用いて,GCLと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:09:31 GMT)
Speech Emotion Recognition with ASR Transcripts: A Comprehensive Study on Word Error Rate and Fusion Techniques [17.2]
本研究では,3つのよく知られたコーパス上の11種類のモデルから,単語誤り率(WER)の異なるASR文字を用いた音声感情認識のベンチマークを行った。本稿では, ASR 誤り訂正とモダリティゲート融合を統合した ASR 誤り処理フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:45:04 GMT)
SCULPT: Systematic Tuning of Long Prompts [17.0]
本稿では,迅速な最適化を階層木改良問題として扱うフレームワークを提案する。 SCULPTはプロンプトをツリー構造として表現し、コンテキスト整合性を維持しながらターゲット変更を可能にする。より安定し、解釈可能なプロンプト修正を生成し、タスク間のより良い一般化を保証する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:06:37 GMT)
EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling [16.9]
そこで本研究では,VRデバイスからのスパーストラッキング信号と事前スキャン環境を用いて,全体動作推定を行う手法を提案する。セマンティックな環境制約と幾何的な環境制約を統合することで、これらの多仮説推定を洗練させる。本手法は,動き-環境相互作用シナリオにおける人間の動き推定の大幅な改善を目立たせ,最先端の性能を実現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:16:55 GMT)
Trajectory Imputation in Multi-Agent Sports with Derivative-Accumulating Self-Ensemble [16.8]
提案するMIDAS(Multi-Adnt Imputer with Derivative-Accumulating Self-Enmble)は,多エージェント軌道を高精度かつ物理的に再現できるフレームワークである。 3つのスポーツデータセットの実験では、MIDASは位置精度と物理的妥当性の両方において既存のベースラインを著しく上回っている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:12:21 GMT)
Harnessing Frozen Unimodal Encoders for Flexible Multimodal Alignment [16.7]
最近の知見は、よく訓練された単調エンコーダのセマンティックな類似性が高いことを示唆している。凍結したユニモーダルエンコーダを用いて視覚と言語を協調する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:00:30 GMT)
PolarFree: Polarization-based Reflection-free Imaging [16.6]
PolaRGBは、RGB画像の偏光に基づく反射除去のための大規模なデータセットである。 PolarFreeは正確な反射除去のための反射のないキューを生成する。実験により、PolarFreeは難解な反射シナリオにおいて画像の明瞭さを著しく向上させることが示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:53:58 GMT)
Few-Shot Joint Multimodal Entity-Relation Extraction via Knowledge-Enhanced Cross-modal Prompt Model [16.0]
JMERE(Joint Multimodal Entity-Relation extract)は、ソーシャルメディア投稿において、エンティティとそれらの関係をテキストイメージペアから抽出することを目的とした課題である。 JMEREの既存の方法は大量のラベル付きデータを必要とする。 textbfKnowledge-textbfEnhanced textbfCross-modal textbfPrompt textbfModelを紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:01:21 GMT)
SplitFrozen: Split Learning with Device-side Model Frozen for Fine-Tuning LLM on Heterogeneous Resource-Constrained Devices [15.8]
プライベート、オンデバイスデータに基づく細調整された大型言語モデル(LLM)は、パーソナライズされたパーソナライズされたAIエージェントを強化することができる。本稿では,資源制約のあるエッジデバイス上で効率的な微調整を可能にする分割学習フレームワークSplitFrozenを提案する。 MRPC、MNLIマッチング、SST-2データセットによるGPT-2の実験では、極めて不均衡なデータの下で、SplitFrozenはFedLoRAとSplitLoRAの精度を69.4%上回っている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:03:44 GMT)
Latent Space Imaging [15.4]
人工視覚システムを進化させる新しい手法を提案する。潜時空間イメージングは、生成モデルの意味的にリッチな潜時空間に直接画像情報を符号化する。我々は,この原理を,1画素カメラをベースとした初期ハードウェアプロトタイプを用いて検証する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:04:20 GMT)
Adaptive Physics-informed Neural Networks: A Survey [15.4]
物理インフォームドニューラルネットワーク(PINN)は偏微分方程式を解くための有望なアプローチとして登場した。本調査は,移動学習とメタラーニングによる限界に対処する既存の研究をレビューする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:33:05 GMT)
Real-time Global Illumination for Dynamic 3D Gaussian Scenes [14.9]
動的3次元ガウスモデルとメッシュのためのパイプラインとともに,リアルタイムなグローバル照明手法を提案する。我々の研究は、動的照明によるリアルタイムアプリケーションにおける3Dガウスアンの可能性を強調し、パフォーマンスと最適化に関する洞察を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 01:51:36 GMT)
DiffusionTalker: Efficient and Compact Speech-Driven 3D Talking Head via Personalizer-Guided Distillation [14.4]
リアルタイム音声駆動の3D顔アニメーションは、アカデミックや業界では魅力的だ。近年のアプローチでは、音声駆動型3D顔アニメーションの非決定論的事実を考えるようになった。パーソナライザー誘導蒸留による限界に対応するためにDiffusionTalkerを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:55:54 GMT)
GINGER: Grounded Information Nugget-Based Generation of Responses [14.4]
そこで我々は,ヌゲット検出,クラスタリング,ランキング,トップクラスタの要約,および流速向上を基盤とした,接地応答生成のためのモジュールパイプラインを提案する。 AutoNuggetizerフレームワークで評価されたTREC RAG'24データセットの実験は、GINGERがこのベンチマークで最先端のパフォーマンスを達成したことを示している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:10:23 GMT)
Experience Retrieval-Augmentation with Electronic Health Records Enables Accurate Discharge QA [14.3]
RAGは、事実の医療知識を提供するために広く応用されている。ケースベースの知識は効果的な医学的推論に不可欠である。本稿では,ExpRAGフレームワークであるExperience Retrieval Augmentationを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:26:06 GMT)
Heterogeneous bimodal attention fusion for speech emotion recognition [14.2]
本稿では,会話感情認識における多段階多モードインタラクションのためのHBAF(Heterogeneous Bimodal Attention Fusion)という新しいフレームワークを提案する。ユニモーダル表現モジュールは、コンテキストコンテンツを低レベルのオーディオ表現に組み込んで、異種マルチモーダルギャップをブリッジする。マルチモーダル融合モジュールは動的バイモーダルアテンションと動的ゲーティング機構を用いて不正確な相互モーダル関係をフィルタリングする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:21:43 GMT)
An Image-like Diffusion Method for Human-Object Interaction Detection [14.0]
人物対毎のHOI検出の出力を画像として再キャストすることができる。 HOI-IDiffでは、画像のような拡散プロセスを用いてHOI検出出力を画像として生成し、新しい視点からHOI検出に取り組む。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:30:16 GMT)
Autonomous Data Selection with Zero-shot Generative Classifiers for Mathematical Texts [13.8]
本稿では,高品質な数学的テキストを自動的にキュレートする自動データ選択(AutoDS)を提案する。人間のアノテーションや専用のデータフィルタのトレーニングを必要とする従来のアプローチとは異なり、AutoDSはモデルのロジットのみに依存する。我々は、自動ドメイン固有データキュレーションの今後の研究を容易にするために、キュレートされたAutoMathTextデータセットをリリースする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:11:03 GMT)
Dynamic Topic Analysis in Academic Journals using Convex Non-negative Matrix Factorization Method [13.5]
本稿では,2段階の動的トピック分析フレームワークを提案する。トピックの一貫性、スパーシリティ、解釈可能性を改善するために凸最適化が組み込まれている。 2004年から2022年までのIEEEジャーナルの要約に提案手法を適用して、新興研究トピックを効果的に同定し、定量化する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:31:47 GMT)
DDEQs: Distributional Deep Equilibrium Models through Wasserstein Gradient Flows [13.4]
ディープ平衡モデル(Deep Equilibrium Models、DEQ)は、ニューラルネットワークの前方通過における固定点を解決する暗黙のニューラルネットワークのクラスである。本稿では,DDEQを集合や点雲などの離散的な測度入力に拡張する分散Deep Equilibrium Models(DDEQ)を提案する。実験では、ポイントクラウド分類やポイントクラウド補完といったタスクにおいて、最先端のモデルと競合できることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:49:23 GMT)
BERTDetect: A Neural Topic Modelling Approach for Android Malware Detection [13.4]
現在、Webアクセスは主にモバイルデバイスで行われ、Androidはモバイルデバイス市場のかなりのシェアを占めている。 Google Play Protectやアンチウイルスソフトウェアのようなツールを通じて悪意ある攻撃と戦う努力にもかかわらず、新しく進化したマルウェアはAndroidデバイスに侵入し続けている。ソースコード解析は有効だが限定的であり、攻撃者は検出を避けるために新しい変種のために古いマルウェアをすぐに放棄する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:09:44 GMT)
Distributed Bayesian Estimation in Sensor Networks: Consensus on Marginal Densities [13.4]
連続変数上の確率分布の関数空間において、確率的確率的アルゴリズムを導出する。これらの結果を利用して、個々のエージェントが観測する変数のサブセットに制限された新しい分散推定器を得る。これは、協調的なローカライゼーションやフェデレートドラーニングのような応用に関係しており、任意のエージェントで収集されたデータは、関心のあるすべての変数のサブセットに依存する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:33:31 GMT)
WLB-LLM: Workload-Balanced 4D Parallelism for Large Language Model Training [13.3]
WLB-LLMは、大規模言語モデルのトレーニングのためのワークロードバランスの4D並列処理である。 WLB-LLMは4次元並列化LLMトレーニングにおいて,作業負荷の不均衡を著しく軽減することを示した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:40:45 GMT)
Fast MLE and MAPE-Based Device Activity Detection for Grant-Free Access via PSCA and PSCA-Net [13.1]
高速で正確なデバイスアクティビティは、大規模なマシンタイプの通信をサポートするための許可なしアクセスにおける重要な課題である。本稿では,MLEに基づくデバイスアクティビティ検出手法を提案する。本稿では,計算時間を削減するために,PSCA-Netと呼ばれるディープアンローリングニューラルネットワークの実装を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:32:32 GMT)
A Novel Hat-Shaped Device-Cloud Collaborative Inference Framework for Large Language Models [12.6]
従来のクラウドベースの大規模言語モデル(LLM)は、高精度な要件を満たすが、低遅延とプライバシー強化に対する重要な要求には欠ける。我々は,U字型推論と投機的復号化の相補的長所を生かした,新しいデバイス-クラウド協調型推論フレームワークであるHATを提案する。 HATは,TTFTを41%,TBTを41%,TBTを77%削減し,有望な性能向上を実現していることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:54:58 GMT)
Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport [12.6]
エントロピー規則化ワッサースタイン2コストとその非バイアスバージョンであるシンクホーン発散を用いた確率測定の合成と解析について検討する。これらの係数とバリセンター関数の値は、次元非依存の収束率を持つサンプルから推定できることが示される。劣化点クラウドデータの分類にバリ中心係数を用い、ニューラルネットワークのベースラインと比較して、我々のアプローチは小さなトレーニングデータレシエーションにおいてより効率的であることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:18:04 GMT)
Knowledge Rumination for Client Utility Evaluation in Heterogeneous Federated Learning [12.5]
フェデレートラーニング(FL)は、いくつかのクライアントが生データを開示することなく、機械学習モデルを協調的にトレーニングすることを可能にする。非IIDデータと古いモデルは、グローバルモデルの実用性を低下させ、トレーニング失敗につながる可能性があるため、AFLに重大な課題をもたらす。我々はFedHistと呼ばれる新しいAFLフレームワークを提案し、非IIDデータと勾配安定度の両方がもたらす課題を効果的に解決する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:14:35 GMT)
Exploiting Deblurring Networks for Radiance Fields [12.5]
我々は、ぼやけたトレーニングビューから高品質な新規ビューを合成できる新しい放射場デブロアリングアプローチであるDeepDeblurRFを提案する。我々は,DeepDeblurRFが,トレーニング時間を大幅に短縮して,最先端のノベルビュー合成品質を達成できることを実証し,カメラモーションのぼかしとデフォーカスのぼかしの両方について広範な実験を行った。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:52:10 GMT)
MAB-Based Channel Scheduling for Asynchronous Federated Learning in Non-Stationary Environments [12.4]
フェデレートラーニングは、生のデータ交換なしでクライアント間での分散モデルトレーニングを可能にする。無線実装では、頻繁なパラメータ更新は高い通信オーバーヘッドを引き起こす。通信効率と公平性を向上しつつ,クライアントの安定性を低下させるための非同期フェデレーション学習スケジューリングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:54:42 GMT)
TCFG: Tangential Damping Classifier-free Guidance [11.2]
拡散モデルはテキストと画像の合成において顕著な成功を収めた。本研究では,非条件スコアの幾何学的視点を利用してCFG性能を向上させる新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:49:49 GMT)
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers [11.0]
Diffusion Transformerは、テキスト・ツー・イメージとテキスト・ツー・ビデオ生成において重要な役割を果たす。本稿では,Relevance-Guided Efficient Controllable GenerationフレームワークRelaCtrlを提案する。本手法は PixArt-delta と比較して, パラメータと計算複雑性の 15% しか得られず, 優れた性能を実現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:22:05 GMT)
A Framework for Finding Local Saddle Points in Two-Player Zero-Sum Black-Box Games [10.8]
サドルポイント最適化は、ポートフォリオ最適化、生成的敵ネットワーク、ロボット工学など、多くの現実世界のアプリケーションにおいて重要な問題である。本稿では,未知の(潜在的にノンコンケーブな)目的関数をモデル化するプロセスを利用するベイズ最適化に着想を得たフレームワークを提案する。ブラックボックスの非コンケーブ設定において,これらのアルゴリズムを合成的および現実的なデータセット上で実演する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:57:45 GMT)
Nuclear Deployed: Analyzing Catastrophic Risks in Decision-making of Autonomous LLM Agents [10.6]
大規模言語モデル(LLM)は、自律的な意思決定者へと進化し、ハイステークシナリオにおける破滅的なリスクに対する懸念を高めている。このようなリスクは,エージェントのHelpful,Harmlessness,Hoest(HHH)目標間のトレードオフから生じる可能性があるという知見に基づいて,新しい3段階評価フレームワークを構築した。 14,400個のエージェントシミュレーションを12個の先進LDMで行い、広範囲な実験と分析を行った。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:22:28 GMT)
LocDiffusion: Identifying Locations on Earth by Diffusing in the Hilbert Space [10.3]
画像ジオローカライズのためのメカニズムとして拡散を利用する手法を提案する。拡散における問題のある多様体再生成のステップを避けるため,我々は新しい球面位置符号化・復号化フレームワークを開発した。我々は、画像の誘導の下で位置を生成するLocDiffusionと呼ばれる条件付き潜伏拡散モデルを訓練する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:15:26 GMT)
Dense-SfM: Structure from Motion with Dense Consistent Matching [10.2]
多視点画像からの高密度かつ高精度な3次元再構成のための新しいフレームワークであるDense-SfMを提案する。 Dense-SfMはGaussian Splatting (GS)ベースのトラック拡張と密マッチングを統合し、より一貫性があり、より長い機能トラックを提供する。 Dense-SfMは最先端の手法よりも精度と密度が大幅に向上した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:33:34 GMT)
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning [10.1]
我々は,標準深部RLアルゴリズムの値ネットワークを再利用して探索を行う軽量アルゴリズムであるCAEを紹介する。 CAEは実装が簡単で、約10行のコードしか必要としない。実効価値ネットワークの学習が困難である複雑なタスクでは,CAE+を提案する。この拡張は、実装の単純さを維持しながらパラメータ数を1%以下に増やし、追加で10行のコードを追加するだけである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:59:24 GMT)
Exploring the Limits of Zero Shot Vision Language Models for Hate Meme Detection: The Vulnerabilities and their Interpretations [10.0]
本稿では,ハイトミーム検出などの複雑なタスクに対する現代の視覚言語モデル(VLM)の有効性について検討する。我々は、様々なプロンプトタイプを用いて、徹底的なプロンプトエンジニアリングと最先端VLMのクエリを行い、ヘイトフル/ハームフルミームを検出する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:26:00 GMT)
ModeSeq: Taming Sparse Multimodal Motion Prediction with Sequential Mode Modeling [9.6]
モードをシーケンスとしてモデル化する新しいマルチモーダル予測パラダイムであるModeSeqを導入する。一つのショットで複数の可塑性軌道をデコードする一般的な慣習とは異なり、ModeSeqは次のモードをステップ単位で推論するためにモーションデコーダを必要とする。また,軌道の多様化を図るため,EMTA(Early-Match-Take-All)トレーニング戦略を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:46:55 GMT)
WindowKV: Task-Adaptive Group-Wise KV Cache Window Selection for Efficient LLM Inference [9.6]
タスク適応型KVキャッシュウィンドウ選択手法であるWindowKVを提案する。 WindowKVは、元のKVキャッシュの12%しか使用せず、完全なKVキャッシュ保持に匹敵する性能を維持していることを示す。提案手法は,Needle-in-a-Haystack評価における最先端の結果も達成し,その有効性と堅牢性を強調した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:36:52 GMT)
Computation-Efficient and Recognition-Friendly 3D Point Cloud Privacy Protection [9.4]
3Dポイントクラウドは、自動運転車、ロボティクス、CADモデルなどのアプリケーションで広く利用されている。私たちの知る限りでは、これらのアプリケーションは3Dポイントクラウドにおけるプライバシー漏洩の問題を提起しています。私たちは3Dポイントのクラウドプライバシ問題を定義し、PointFlowGMMという名前の効率的なプライバシ保存フレームワークを提案しました。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:45:16 GMT)
Finding Stable Subnetworks at Initialization with Dataset Distillation [9.3]
本研究は,イテレーティブ・マグニチュード・プルーニングのインナーループにおける蒸留データを用いて,初期化時にスパース・トレーニング可能なワークを創出する。提案アルゴリズムは,ResNet-18およびCIFAR-10上での従来の宝くじの巻き戻し性能と一致する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:55:57 GMT)
QRCC: Evaluating Large Quantum Circuits on Small Quantum Computers through Integrated Qubit Reuse and Circuit Cutting [9.2]
高忠実度で動作可能な量子回路のサイズは、物理量子ビットの量と品質に制限される。 QRCCはqubitの再利用を利用して、カット数を最小限に抑え、処理後のオーバーヘッドを最小限に抑える。評価の結果, ゲートカットを考慮した場合, カット数を平均で29%削減し, 追加減算を行った。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:47:23 GMT)
Geometric Breaking of Quantum Strings in Kagome Rydberg Atom Array [9.0]
新たに開発された量子モンテカルロ法を用いて10倍のスケールの原子配列をシミュレートする。新たに形成された2本の弦は、突然のエネルギー増加を伴う、突然の非相関である。この研究は量子弦の理解に役立ち、高エネルギー物理学のシミュレーションにも光を当てる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:02:42 GMT)
Geometric Constrained Non-Line-of-Sight Imaging [8.9]
本研究では, 形状演算子のフロベニウスノルムを用いて, 通常の磁場の変動率を制御した新しい接合アルベド面再構成法を提案する。正規場の精度を向上させることにより、細部表現を高め、隠された物体形状の高精度な再構成を実現する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:56:00 GMT)
Accurate Peak Detection in Multimodal Optimization via Approximated Landscape Learning [8.8]
本稿では,ランドスケープ知識をフル活用してピーク検出を容易にする,APDMMO(APDMMO)と呼ばれるMMOPに適した新しい最適化フレームワークを提案する。具体的には,まず,多様なMMOPの回帰精度を向上させるために,非線形アクティベーションユニット群をアンサンブルする新しいサロゲートランドスケープモデルを設計する。そこで本研究では,学習したサロゲートランドスケープモデルに基づくバックプロパゲーションにより,潜在的ピーク領域を効率的に検出する自由度ピーク検出手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:21:53 GMT)
A Novel Two-Phase Cooperative Co-evolution Framework for Large-Scale Global Optimization with Complex Overlapping [8.8]
複雑な重なり合う大規模グローバル最適化問題に対処する新しい2相協調進化フレームワークを提案する。重なり合う問題の解法は、その数学的性質を基礎として、フレームワーク内に埋め込まれている。大規模な実験により、我々のフレームワーク内でインスタンス化されたアルゴリズムは、既存のアルゴリズムを著しく上回っていることが示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:21:11 GMT)
FALCON: Feedback-driven Adaptive Long/short-term memory reinforced Coding Optimization system [8.8]
大規模言語モデル(LLM)は、コードの自動生成において大きな進歩を遂げた。教師付き微調整(SFT)と人間からのフィードバック(RLHF)からの強化学習の課題は、正確で人間中心のコードを生成する失敗につながった。フィードバック駆動型適応長/短周期メモリ強化符号化最適化(FALCON)を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:12:25 GMT)
PanoGS: Gaussian-based Panoptic Segmentation for 3D Open Vocabulary Scene Understanding [8.7]
3D Gaussian Splatting (3DGS) はオープンな語彙シーン理解タスクの促進効果を示した。従来の方法では3Dインスタンスレベルの情報は識別できないが、通常はシーンの特徴とテキストクエリ間のヒートマップを予測する。新規かつ効果的な3次元パノプティカルオープンなシーン理解手法であるPanoGSを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:27:29 GMT)
KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies [8.7]
SAC(Soft Actor-Critic)は、連続的な制御タスクにおいて顕著な成功を収めたが、スパース報酬設定に苦慮している。本稿では, SAC と新規探索を併用した探索戦略のバランスをとることを目的とした KEA (Keeping Exploration Alive) を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:00:05 GMT)
Financial Wind Tunnel: A Retrieval-Augmented Market Simulator [8.7]
マーケットシミュレーターは、現実世界の市場のダイナミクスを模倣した高品質な合成金融データを作成しようとする。フィナンシャル・ウィンド・トンネル(Financial Wind Tunnel, FWT)は、制御可能で合理的で適応可能な市場ダイナミクスを生成するために設計された市場シミュレータである。 FWTは、様々なデータ周波数にわたってより包括的で体系的な生成機能を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:10:13 GMT)
Causality-Aware Next Location Prediction Framework based on Human Mobility Stratification [8.6]
本研究では,旅行パターンの移動性に着目した,次の位置予測のための因果認識フレームワークを提案する。提案するフレームワークは,複数の次の位置予測パラダイムを統合するプラグイン・アンド・プレイモジュールとして設計されている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:30:24 GMT)
Anomaly Detection and Localization for Speech Deepfakes via Feature Pyramid Matching [8.5]
音声ディープフェイク(英: Speech Deepfakes)は、ターゲット話者の声を模倣できる合成音声信号である。音声のディープフェイクを検出する既存の方法は教師あり学習に依存している。本稿では,音声深度検出を異常検出タスクとして再設定する,新しい解釈可能な一クラス検出フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:15:22 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [8.1]
厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:26:38 GMT)
Potentials and Limitations of Large-scale, Individual-level Mobile Location Data for Food Acquisition Analysis [8.0]
本稿では,食品取得分析における大規模GPSデータの可能性と限界について検討する。フロリダ州ジャクソンビルの個人による2億8800万件のGPS記録の高解像度データセットを用いて、ケーススタディを実施します。以上の結果から,GPSデータから取得行動に関する貴重な知見が得られたが,食品店への来店頻度を過小評価できる可能性が示唆された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:52:36 GMT)
FedSKD: Aggregation-free Model-heterogeneous Federated Learning using Multi-dimensional Similarity Knowledge Distillation [7.9]
フェデレートラーニング(FL)は、直接データを共有することなく、プライバシー保護のための協調モデルトレーニングを可能にする。 MHFL(Model-heterogeneous FL)は、クライアントが計算資源やアプリケーション固有のニーズに合わせて、不均一なアーキテクチャでパーソナライズされたモデルを訓練することを可能にする。ピアツーピア(P2P)FLはサーバ依存を除去するが、モデルドリフトと知識の希釈に悩まされ、不均一な設定での有効性が制限される。ラウンドロビンモデル循環による直接知識交換を容易にする新しいMHFLフレームワークであるFedSKDを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:33:10 GMT)
IGEV++: Iterative Multi-range Geometry Encoding Volumes for Stereo Matching [7.9]
ステレオマッチングのための新しいディープネットワークアーキテクチャIGEV++を提案する。提案したIGEV++は,不測領域の粗粒度形状情報をエンコードするMGEV(Multi-range Geometry Volumes)を構築する。適応的なパッチマッチングモジュールを導入し、大きな不均等領域や不整合領域のマッチングコストを効率的に計算する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:52:42 GMT)
Efficient Deep Learning Approaches for Processing Ultra-Widefield Retinal Imaging [7.8]
深層学習が医療画像の分類における主要な解決策として浮上している。これらの展開を超広視野(UWF)網膜イメージングデータセットに適用する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:43:24 GMT)
Reinforcement Learning-based Self-adaptive Differential Evolution through Automated Landscape Feature Learning [7.8]
本稿ではメタ学習過程における自動特徴学習を支援するメタBBO手法を提案する。我々は,マティーサ指数に基づく埋め込みを用いたアテンションベースニューラルネットワークを設計し,解人口を変換する。また、多種多様なDEM演算子を含む包括的アルゴリズム構成空間を強化学習支援DACパラダイムに組み込む。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:07:57 GMT)
Feature Learning beyond the Lazy-Rich Dichotomy: Insights from Representational Geometry [7.5]
本稿では,特徴学習のための表現幾何学に基づく分析フレームワークを提案する。ネットワークがタスクを解くのに有用な特徴を学習すると、タスク関連多様体は次第に無秩序になる。基礎となる多様体幾何の変化を追跡することにより、トレーニングを通して異なる学習段階を明らかにする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:39:56 GMT)
Energy-Based Model for Accurate Estimation of Shapley Values in Feature Attribution [7.4]
EmSHAP (Energy-based model for Shapley value Estimation) は、Shapleyコントリビューション関数の期待値を推定するために提案される。 GRU(Gated Recurrent Unit)結合分割関数推定法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:47:22 GMT)
Understanding the Effects of RLHF on the Quality and Detectability of LLM-Generated Texts [7.2]
人間のフィードバックからの強化学習によるさらなる編集が、生成したテキストの品質に与える影響について検討する。 RLHFはより検出しやすく、長く、繰り返し出力する。訓練ベースの検出器は短いテキストやコードを含むテキストに弱いが、ゼロショット検出器はより堅牢である。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:03:10 GMT)
A Siamese Network to Detect If Two Iris Images Are Monozygotic [7.1]
我々は,一対の虹彩画像をモノジゴティックアイライズや非モノジゴティックアイライズに分類するために,シームズネットワークアーキテクチャとコントラスト学習を採用している。本手法は, 単接合型虹彩対のヒト分類において, 従来報告されていたものを超える全虹彩画像を用いて精度を向上する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:04:06 GMT)
Physics-Aware Combinatorial Assembly Sequence Planning using Data-free Action Masking [6.9]
Combinatorのアセンブリは、標準化されたユニットプリミティブを使用して、ユーザ仕様を満たすオブジェクトを構築する。本稿では,物理組立のためのアセンブリ・シーケンス・プランニング(ASP)について検討する。我々は、目的物を構築するために、ユニットプリミティブを逐次配置するための建設方針を学ぶために、深層強化学習を採用する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:46:48 GMT)
Toward Conditional Distribution Calibration in Survival Prediction [6.9]
本研究では,モデルが観測した時点における個人生存確率を用いて,共形予測に基づく手法を提案する。限界キャリブレーションと条件キャリブレーションの両方に関する理論的保証を提供し、15の多様な実世界のデータセットに対して広範囲にテストする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:04:00 GMT)
Adaptive Rank Allocation: Speeding Up Modern Transformers with RaNA Adapters [6.7]
大規模言語モデルに対するRanc and Neuron Allocator (RaNA) アダプタを提案する。 RaNAはローランク行列分解と適応マスキングを適用してアテンションモジュールの成分を効率的に割り当てるランクアダプタを利用する。特に、ニューロンアダプタと比較して、RaNAはパープレキシティを最大7ポイント改善し、FLOPを最先端のTransformerアーキテクチャで$sim$44%削減すると、精度を最大8ポイント向上する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:38:19 GMT)
Understanding and Mitigating Side and Covert Channel Vulnerabilities Introduced by RowHammer Defenses [6.7]
本稿では,RowHammer mitigationsによるタイミングチャネル脆弱性の解析と評価を行う。我々のキーとなる観察は、RowHammer mitigationsの予防行動がタイミングチャネルを可能にする2つの特徴を持っていることです。我々は、RowHammer緩和によって引き起こされるメモリ遅延の差を利用する新しいタイプの攻撃であるLeakyHammerを紹介します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:26:47 GMT)
Optimizing Navigation And Chemical Application in Precision Agriculture With Deep Reinforcement Learning And Conditional Action Tree [6.6]
本稿では, 精密農業における生物ストレスのロボット管理のための, 強化学習に基づく新しい計画手法を提案する。このフレームワークは、条件付きアクションマスキングを備えた階層的な意思決定構造を用いており、高いレベルのアクションがロボットの探索を導く。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:38:13 GMT)
Shapley-Guided Utility Learning for Effective Graph Inference Data Valuation [6.5]
本稿では,グラフ推論データ評価の新しいフレームワークであるShapley-Guided Utility Learning (SGUL)を提案する。 SGULは、転送可能なデータ特化機能とモデル特化機能を組み合わせて、地上の真理ラベルに頼ることなく、テスト精度を近似する。 SGULは、インダクティブ設定とトランスダクティブ設定の両方において、既存のベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:35:03 GMT)
Wildfire Smoke Detection System: Model Architecture, Training Mechanism, and Dataset [6.3]
Vanilla Transformersは、中～高レベルの機能間のセマンティックな関連性に重点を置いており、煙の特徴を抽出するのが得意ではない。我々は,Swin TransformerをベースとしたCross Contrast Patch Embedding (CCPE)モジュールを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:34:39 GMT)
Theory-to-Practice Gap for Neural Networks and Neural Operators [6.3]
本稿では,ReLUニューラルネットワークとニューラル演算子を用いた学習のサンプリング複雑性について検討する。ボヒナーの$Lp$-ノルムの最良の収束速度は、モンテカルロの1/p$の速度で束縛されていることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:45:58 GMT)
Nonseparability of multipartite systems in dilaton black hole [6.1]
本研究では,自由体音場とフェルミオン場の両方に対して,Abe-Rajagopal (AR) $q$- Conditional Entropyを用いてN-Partite量子系の非分離性を検討する。興味深い発見は、ブラックホールのホーキング効果がフェルミオン場に対するW状態の純非分離性を生み出すことである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:39:47 GMT)
Smoke and Mirrors: Jailbreaking LLM-based Code Generation via Implicit Malicious Prompts [5.7]
本稿では,コード生成における安全性の懸念を明らかにするために,JailbreakingアプローチであるCodeJailbreakerを紹介する。最近リリースされたRCCBenchベンチマークの実験では、CodeJailbreakerが従来のジェイルブレイク戦略を大きく上回っていることが示されている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:06:12 GMT)
Model-Guardian: Protecting against Data-Free Model Stealing Using Gradient Representations and Deceptive Predictions [5.7]
モデル盗難は、クラウドにデプロイされた機械学習モデルの機密性をますます脅かしている。本稿では,Model-Guardianという新しい防衛フレームワークを紹介する。合成試料のアーティファクト特性と試料の勾配表現の助けを借りて、現在の防御の欠点に対処するように設計されている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:14:36 GMT)
QSM-RimDS: A detection and segmentation tool for paramagnetic rim lesions in multiple sclerosis [5.5]
Paramagnetic rim lesions (PRLs) は多発性硬化症(MS)における新たなバイオマーカーである深層学習に基づくQSM-RimNetは自動PRL検出を実現することができるが,この手法はリムセグメンテーションを提供しない。本研究の目的は,共同PRL検出とリムセグメンテーションのためのU-NetベースのQSM-RimDS法を開発することである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 01:34:16 GMT)
LoRA Subtraction for Drift-Resistant Space in Exemplar-Free Continual Learning [5.4]
本稿では,機能モデリングや前処理の保存を必要とせず,機能ドリフトを効果的に処理するDrift-Resistant Space(DRS)を提案する。提案手法は,複数のデータセットにまたがって,特に長いタスクシーケンスに対して,最先端の結果を一貫して達成する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:38:53 GMT)
Cross-Domain Underwater Image Enhancement Guided by No-Reference Image Quality Assessment: A Transfer Learning Approach [5.3]
単一水中画像強調(UIE)は難しい問題であるが、その開発は2つの大きな問題によって妨げられている。水中参照データセットのラベルは擬似ラベルであり、教師付き学習におけるこれらの擬似基底真理を頼りにするとドメインの不一致につながる。事前学習を通じてUIEの基本パラダイムをキャプチャするトランスUIEモデルを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:40:07 GMT)
Best Arm Identification with Resource Constraints [5.3]
資源制約付きベストアーム識別(BAIwRC)問題について検討する。エージェントは、各アームプルにリソースが消費されるリソース制約の下で、最適なアームを特定することを目的としている。資源集約アルゴリズム(SH-RR)を設計・解析する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:15:20 GMT)
"Whose Side Are You On?" Estimating Ideology of Political and News Content Using Large Language Models and Few-shot Demonstration Selection [5.3]
既存のイデオロギーを分類するアプローチは、大規模なデータセットのラベル付けを必要とするため、進化するイデオロギーの文脈に適応できないという点で制限されている。本稿では、オンラインコンテンツの政治的イデオロギーを、文脈内学習を通じて、米国政治スペクトルの文脈で分類する大規模言語モデルの可能性について検討する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:32:25 GMT)
Strengthening the No-Go Theorem for QRNGs [5.3]
量子乱数は、量子アルゴリズムに対するセキュリティに不可欠である。この作業は、QRNG OpenAPIを使用して量子脅威に対するセキュリティを強化する企業や政府にとって重要なものだ。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:04:47 GMT)
Multi-Disease-Aware Training Strategy for Cardiac MR Image Segmentation [5.2]
近年,ディープラーニングに基づくセグメンテーション手法が注目されている。これらのセグメンテーション法は、左心室(LV)や心筋(MYO)などの定期的な形をした臓器の分割に一般的に適している。右心室(RV)のような不規則な形状の臓器では不十分な働きをする
論文参考訳（メタデータ） (Sun, 23 Mar 2025 01:29:27 GMT)
Fus-MAE: A cross-attention-based data fusion approach for Masked Autoencoders in remote sensing [5.1]
Fus-MAEは、マスク付きオートエンコーダに基づく自己教師型学習フレームワークである。実験により,Fus-MAEは,SAR-光データ融合に適したコントラスト学習戦略と効果的に競合できることが示された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:58:13 GMT)
Beautimeter: Harnessing GPT for Assessing Architectural and Urban Beauty based on the 15 Properties of Living Structure [5.0]
Beautimeterは、GPT(Generative Pre-trained Transformer)技術を利用した新しいツールである。アレクサンドロスは、生物構造を特徴づけるスケールや太い境界などの15の基本的な性質を特定した。 GPTの高度な自然言語処理機能を統合することで、Beautimeter氏は、構造がこれらの15のプロパティを具体化する範囲を評価する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:58:41 GMT)
Exact Spectral Function of One-Dimensional Bose Gases [4.8]
我々は、量子可積分リーブ・ライニガーモデルの普遍的な多体相関特性を明らかにするブレークスルーを報告する。我々は、基底状態または有限温度状態を高い精度で「相対励起」できる全ての「相対励起」を計算することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:32:05 GMT)
Colonoscopy polyp detection with massive endoscopic images [4.6]
我々は、異なるデータセットで検証された平均精度を向上し、既存のエンドツーエンドのポリプ検出モデルを改善した。我々のモデルは、リアルタイム検出速度を維持しつつ、最先端のポリプ検出性能を実現することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:23:26 GMT)
Efficient Top-k s-Biplexes Search over Large Bipartite Graphs [4.5]
二部グラフ解析において、$s$-ビスプレックスの列挙は基本的な問題である。実世界のデータエンジニアリングでは、すべての$sビプレックスを見つけることは必要でも、計算的にも安価でもない。単純な2n列挙アルゴリズムを破るMVBPを提案する。 FastMVBPは、いくつかのインスタンスで最大3桁のベンチマークアルゴリズムより優れている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:03:40 GMT)
PIM: Physics-Informed Multi-task Pre-training for Improving Inertial Sensor-Based Human Activity Recognition [4.5]
IMUに基づくヒューマンアクティビティ認識(HAR)のための物理インフォームドマルチタスク事前学習(PIM)フレームワークを提案する。 PIMは、人間の動作の基本的物理的側面の理解に基づいて、プレテキストタスクを生成する。マクロf1スコアの約10%の利得と,クラスごとのラベル付き例は2～8例に過ぎなかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:16:01 GMT)
GLADMamba: Unsupervised Graph-Level Anomaly Detection Powered by Selective State Space Model [4.5]
GLADMambaは、選択状態空間モデルを UGLAD フィールドに適応させる新しいフレームワークである。我々の知る限りでは、マンバと明示的なスペクトル情報を UGLAD に導入するのはこれが初めてである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:40:17 GMT)
Active Inference for Energy Control and Planning in Smart Buildings and Communities [4.5]
アクティブ推論(AIF)は不確実性の下での意思決定の強力なフレームワークとして現れています。建築レベルのエネルギー管理とコミュニティレベルのエネルギー管理の両方に対処する新しい二重層AIFアーキテクチャを提案する。この研究は、分散AIFがエンジニアリングでどのように機能するかを示す最初のものである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:03:01 GMT)
SNRAware: Improved Deep Learning MRI Denoising with SNR Unit Training and G-factor Map Augmentation [4.5]
2つのバックボーン構造を持つ14種類のトランスフォーマーモデルと畳み込みモデルを、96,605個の心室逆転型シネコンプレックスの2,885,236枚の大データセット上にトレーニングした。 SNRAwareと呼ばれるこのトレーニングスキームは、MRI再構成プロセスの知識を活用して、大規模で高品質で多様な合成データセットをシミュレートし、モデルに対するノイズ分布に関する定量的情報を提供することにより、ノイズ発生性能を向上させる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:16:36 GMT)
Predicting performance-related properties of refrigerant based on tailored small-molecule functional group contribution [4.3]
本研究は, 常温沸点, 臨界温度, 臨界圧力, 気化エンタルピー, 偏心係数といった, 冷凍システムの運転効率に関する5つの重要な特性に焦点を当てた。調整された小分子群に基づいて、GC法と機械学習(ML)を組み合わせてこれらの性能関連特性をモデル化する。 GC-MLモデルの開発に続いて、そのパフォーマンスを分析して、グループ間コントリビューションの可能性を強調します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:31:39 GMT)
Adoption of Watermarking for Generative AI Systems in Practice and Implications under the new EU AI Act [4.2]
本稿では,画像生成において最も広く使用されている50のAIシステムについて,実証分析を行い,これをAI法の法的解析に組み込む。我々は、AI法に基づき、生成AI画像システムの4つのカテゴリを特定し、各カテゴリの法的義務を概説し、現在適切な透かしを実施しているのは、少数の提供者のみである。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:55:33 GMT)
DNA Bench: When Silence is Smarter -- Benchmarking Over-Reasoning in Reasoning LLMs [3.9]
Don't Answer Bench (DNA Bench)は、大規模言語モデル(LLM)を評価するための新しいベンチマークである。 DNAベンチは150個の逆向きに設計されたプロンプトから構成されており、人間が理解し、反応しやすくなっている。我々の実験により、RTMは必要以上に最大70倍のトークンを生成し、より単純な非推論モデルがより高精度で効率的に処理するタスクに失敗することが判明した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:12:34 GMT)
Training Multi-Layer Binary Neural Networks With Local Binary Error Signals [3.8]
バイナリニューラルネットワーク(BNN)は、わずか1ビットでアクティベーションを表現することで、機械学習とディープラーニングにおける計算とメモリ使用量を削減する。 BNNの既存のトレーニングアルゴリズムの多くは、バイナリ操作のフル活用を制限する浮動小数点Descent(SGD)に依存している。そこで本研究では,BNNのトレーニングのための完全バイナリおよび勾配のないアルゴリズムを初めて提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:59:38 GMT)
TransAnimate: Taming Layer Diffusion to Generate RGBA Video [3.7]
TransAnimateは、RGBA画像生成技術とビデオ生成モジュールを統合する革新的なフレームワークである。本稿では,方向矢印が動きを定義し,色がスケーリングを調節する対話型モーションガイド制御機構を提案する。我々は、RGBAビデオデータセットの作成、高品質なゲームエフェクトビデオ、抽出された前景オブジェクト、および合成透明なビデオを統合するパイプラインを開発した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:27:46 GMT)
Exploring Energy Landscapes for Minimal Counterfactual Explanations: Applications in Cybersecurity and Beyond [3.7]
説明可能な人工知能(XAI)において、対物的説明が顕著な方法として浮上している。本稿では、摂動理論と統計力学を統合し、最小限の反実的説明を生成する新しい枠組みを提案する。提案手法は,妥当性を維持しつつモデルの予測を変更するために必要な最小限の修正を系統的に同定する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:48:37 GMT)
AgentRxiv: Towards Collaborative Autonomous Research [3.6]
AgentRxivは、エージェントが研究目標に向けて協力し、研究者が発見を加速できるようにする。最高のパフォーマンス戦略が他の領域のベンチマークに一般化されることが分かりました。これらの結果は、自律エージェントが未来のAIシステムを人間と一緒に設計する役割を担っていることを示唆している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:16:42 GMT)
LakotaBERT: A Transformer-based Model for Low Resource Lakota Language [3.5]
北米のスー族の言語であるラコタは、流行の減少によって大きな課題に直面している。本稿では,Lakota用に設計された最初の大規模言語モデル(LLM)であるLakotaBERTを紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:31:12 GMT)
Temporal Relation Extraction in Clinical Texts: A Span-based Graph Transformer Approach [3.5]
I2B22012の時間的関連課題コーパスを用いて臨床イベントとその時間的関係を抽出する課題に対処する。本研究では,スパンベース実体関係抽出,臨床大言語モデル(LPLM),異種グラフ変換器(HGT)を統合した新しい手法である GraphTREX を紹介する。この研究は、時間的情報抽出の進歩だけでなく、時間的推論の強化による診断および予後モデルの改善の基礎となる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:34:49 GMT)
Dataset Distillation for Quantum Neural Networks [3.5]
大量の古典的データに対する量子ニューラルネットワーク(QNN)のトレーニングには時間と費用がかかる。我々は,QNNのParametric Quantum Circuit(PQC)において,残差接続とトレーニング可能なHermitianObservableを含む古典的LeNetモデルの量子変種を用いる。このアプローチは、元のデータと同等のパフォーマンスで、非常に情報に富むが、少数のトレーニングデータをもたらす。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:33:39 GMT)
Multiple-Particle Autofocusing Algorithm Using Axial Resolution and Morphological Analyses Based on Digital Holography [3.4]
本稿では,各粒子の3次元位置を比較的正確に求める自動焦点付けアルゴリズムを提案する。それぞれの主焦点粒子の平均強度と等価直径に基づいて、全ての主焦点粒子は最終的に確保される。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:53:14 GMT)
Shot Sequence Ordering for Video Editing: Benchmarks, Metrics, and Cinematology-Inspired Computing Methods [3.1]
AIによるビデオ編集におけるショットシーケンス順序付けタスクは、ビデオストーリーテリングを強化するための重要なアプローチとして現れている。本稿では,AVE-OrderとActivityNet-Orderという2つの新しいベンチマークデータセットを紹介する。また,映画メタデータと撮影ラベルを事前知識として組み込んだシネマトロジー埋め込みの概念をSSOモデルに導入する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:04:45 GMT)
Generative Data Imputation for Sparse Learner Performance Data Using Generative Adversarial Imputation Networks [3.1]
スキップや不完全な試みによるレスポンスの欠落は、データの疎結合を生み出す。我々は、GAIN(Generative Adrial Imputation Networks)を用いた生成的計算手法を提案する。提案手法は3次元のフレームワーク(学習者,質問,試行)を特徴とし,様々な空間レベルを柔軟に調節する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:11:53 GMT)
Bayesian Active Learning for Multi-Criteria Comparative Judgement in Educational Assessment [3.0]
比較判断(CJ)は、仕事を個別の基準に分解するのではなく、全体的評価によって代替的な評価手法を提供する。この方法は、人間によるニュアンスの比較能力を活用し、より信頼性が高く有効な評価を得る。ルーブリックは教育で広く使われており、グレーディングと詳細なフィードバックのための構造化された基準を提供しています。これにより、CJの総合的なランキングと、基準に基づくパフォーマンスのブレークダウンの必要性の間にギャップが生じる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:08:21 GMT)
Recommendation System in Advertising and Streaming Media: Unsupervised Data Enhancement Sequence Suggestions [3.0]
我々は,グラフの対照的な学習視点を取り入れた新しいフレームワークであるGlobal Unsupervised Data-Augmentation (UDA4SR)を導入し,シーケンシャルレコメンデーションのための堅牢なアイテム埋め込みを生成する。当社のアプローチは,データ拡張のためのGAN(Generative Adrial Networks)の統合から始まり,トレーニングデータの多様性と豊かさを高めるための第一歩となる。ユーザの動的かつ多様な関心をより効果的にモデル化するために,新しいターゲットアテンション機構を備えたCapsNetモジュールを改良する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:30:48 GMT)
Explaining the Impact of Training on Vision Models via Activation Clustering [2.9]
神経活動型視覚説明法(NAVE)について紹介する。 NAVEは視覚モデルエンコーダの内部表現を抽出し視覚化する手法である。機能アクティベーションのクラスタ化によって、NAVEは微調整なしで学習したセマンティクスに関する洞察を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:37:14 GMT)
Exploring Topic Trends in COVID-19 Research Literature using Non-Negative Matrix Factorization [2.9]
COVID-19 Open ResearchデータセットにNon-Negative Matrix Factorization (NMF)を用いたトピックモデリングを適用した。 NMFは文書終末行列を2つの非負行列に分解し、文書全体にわたるトピックとその分布を効果的に表現する。この知見は、新型コロナウイルス研究の背景にある知識構造の理解に寄与する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:37:52 GMT)
Self-Explaining Neural Networks for Business Process Monitoring [2.8]
我々は、私たちの知る限り、予測プロセス監視のための最初の*自己説明型ニューラルネットワーク*アーキテクチャを紹介します。我々のフレームワークは、予測を提供するだけでなく、予測ごとに簡潔な説明を出力するLSTMモデルを訓練する。提案手法は, 生成した説明の忠実さと効率の大幅な向上の両面から, ポストホックアプローチよりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:28:34 GMT)
DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents [2.8]
DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。 DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:25:46 GMT)
Evaluating Negative Sampling Approaches for Neural Topic Models [2.8]
否定的サンプリングは、ディープラーニングモデルがより良い表現を学べる効果的な手法として登場した。ニューラルトピックモデルに対する様々なネガティブサンプリング戦略の影響を包括的に分析する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:39:01 GMT)
SUNAR: Semantic Uncertainty based Neighborhood Aware Retrieval for Complex QA [2.8]
SUNARは、大規模言語モデルを利用して、近隣の認識検索プロセスをガイドする新しいアプローチである。 2つの複雑なQAデータセットに関する広範な実験を通じて、我々のアプローチを検証する。以上の結果から,SUNARは既存の検索と推論のベースラインを大幅に上回り,最大31.84%の性能向上を実現している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:50:44 GMT)
A Study on Neuro-Symbolic Artificial Intelligence: Healthcare Perspectives [2.6]
シンボリックAIは推論、説明可能性、知識表現に優れているが、ノイズのある複雑な現実世界のデータを処理する際の課題に直面している。ニューラルネットワークにおけるディープラーニング(ブラックボックスシステム)の研究のブレークスルーは注目に値するが、推論と解釈性は欠如している。ニューロシンボリックAI(NeSy)は、ニューラルネットワークに論理的推論を統合することによって、このギャップを埋めようとしている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 21:33:38 GMT)
Text-Driven Cross-Modal Place Recognition Method for Remote Sensing Localization [2.3]
Des4Posは、新しい2段階のテキスト駆動型リモートセンシングローカライゼーションフレームワークである。トップ1の精度は40%、トップ10の精度は半径5mの閾値で77%に達する。 KITTI360Poseテストセットの実験では、テキスト・ツー・ポイント・クラウドの場所認識におけるDes4Posの最先端性能が実証された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 11:36:19 GMT)
$D^2LoRA$: Data-Driven LoRA Initialization for Low Resource Tasks [2.3]
LoRA法を用いてタスク特化学習のためのポストトレーニング手法の解析を行う。次に、LoRAメトリクスを初期化するためのデータ駆動アプローチである$D2LoRA$を紹介します。実験によると、$D2LoRA$はGSM8Kベンチマークを1%改善し、タイトル生成タスクにおけるROUGEスコアを2ポイント改善した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:41:01 GMT)
ShED-HD: A Shannon Entropy Distribution Framework for Lightweight Hallucination Detection on Edge Devices [2.2]
大規模言語モデル(Ms.LS)は、幅広いタスクにおいて印象的な能力を示してきたが、幻覚を生み出す傾向にある。本稿では,特徴的不確実性パターンを効率的に検出する新しい幻覚検出フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:47:26 GMT)
Predicting Multitasking in Manual and Automated Driving with Optimal Supervisory Control [2.1]
本稿では、運転中に人間のマルチタスクをシミュレートする計算認知モデルを提案する。最適監督制御理論に基づいて、マルチタスクが運転要求、対話的タスク、自動化レベルの変化にどのように適応するかを予測する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:56:53 GMT)
Singular Value Decomposition and Its Blind Spot for Quantum Chaos in Non-Hermitian Sachdev-Ye-Kitaev Models [2.1]
特異値分解(SVD)法は非エルミート系における量子カオスの探索には不十分である。非正定値スペクトルを持つ系のエルミート極限において,SVDが従来の固有値統計を再現できないことを示す。我々は、この方向の今後の研究のために、より堅牢な手法であるバイランチョスアルゴリズムを採用することを提唱する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:04:44 GMT)
The Method of Critical AI Studies, A Propaedeutic [2.0]
批判的AI研究の分野における一般的な方法論的問題を概説する。我々は、文化的対象の人文的密接な分析における既存の強みを考慮に入れた、将来的な方法論のセットを、呼び、そして、指し示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:03:03 GMT)
Automatic High-Level Test Case Generation using Large Language Models [1.8]
主な課題は、テストスクリプトを書くのではなく、テスト作業とビジネス要件の整合性です。我々は、高レベルのテストケースを生成するためのトレーニング/ファインチューンモデルを構築するユースケースデータセットを構築した。当社の積極的なアプローチは要件テストのアライメントを強化し,早期テストケース生成を容易にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:14:41 GMT)
HH4AI: A methodological Framework for AI Human Rights impact assessment under the EUAI ACT [1.8]
論文では、自律性、データ、目標指向設計によって駆動される、AIの変革的な性質を強調している。重要な課題は、業界全体での“ハイリスク”なAIシステムの定義と評価である。リスクを分離し、評価するために設計されたゲートベースのフレームワークである、基本的権利影響評価(FRIA)手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:10:14 GMT)
Sharp Analysis of Power Iteration for Tensor PCA [1.7]
リヒャルトおよびモンタナリ2014で導入されたテンソルPCAモデルのパワーアルゴリズムについて検討する。まず、植込み信号に収束するためにパワーメソッドに必要なイテレーション数について、鋭い境界を定めます。第二に、我々の分析は、実力の閾値がポリログ(n)因子によって推測されるものよりも小さいことを明らかにしている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:00:35 GMT)
Lower Bounds for the Convergence of Tensor Power Iteration on Random Overcomplete Models [1.7]
ランダムなオーバーコンプリート状態からパワーイテレーションのダイナミクスを新たに解析する。驚くべきことに、任意の真の成分に電力反復を収束させるためには、緊張的に多くのステップが必要であることが示される。テンソル分解の一般的な目的関数がパワーパスに沿って厳密に増大していることを証明する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:04:08 GMT)
GhostWriter: Augmenting Collaborative Human-AI Writing Experiences Through Personalization and Agency [1.7]
GhostWriterはAIによって強化された書き込みデザインプローブで、ユーザーは強化されたエージェンシーとパーソナライゼーションを実行できる。 GhostWriterを編集や創造的なタスクに利用した18人の被験者を対象に、ユーザーがパーソナライズされたテキストを作成するのに役立つことを観察した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:08:00 GMT)
Equivariant Machine Learning Interatomic Potentials with Global Charge Redistribution [1.6]
機械学習原子間ポテンシャル(MLIP)は、物質特性を予測するための量子力学シミュレーションの計算的に効率的な代替手段を提供する。我々は、電子自由度を明示的に処理することで、長距離クーロン相互作用を取り入れた新しい同変MLIPを開発する。我々は,ベンチマーク周期的および非周期的データセットの領域にわたって,我々のモデルを体系的に評価し,短距離同変および長距離不変MLIPよりもエネルギーおよび力の予測が優れていることを示した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:26:55 GMT)
ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science [1.5]
ストリートビューイメージ(SVI)は、街路の特徴や構築環境を理解し、特徴付けるために、過去10年間に多くの研究で役立っている。我々は、フリーでオープンソースのPythonパッケージであるZenSVIを開発し、SVI分析の全プロセスを統合し、実装した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:30:12 GMT)
SLIDE: Sliding Localized Information for Document Extraction [1.5]
複数ウィンドウを重畳してローカルコンテキストを生成することで,長いドキュメントを処理するチャンキング手法であるSLIDE(Sliding Localized Information for Document extract)を紹介する。 GraphRAGのパフォーマンスが大幅に向上し、エンティティ抽出が24%向上し、英語の関係抽出が39%向上した。低リソース言語であるAfrikaansでは、SLIDEはエンティティ抽出が49%増加し、関係抽出が82%改善した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:00:39 GMT)
Physics-Guided Multi-Fidelity DeepONet for Data-Efficient Flow Field Prediction [1.5]
本研究では,効率的な時間的流れ場予測のための多要素深部演算ネットワーク(DeepONet)フレームワークを提案する。フレームワークの効率性と正確性を改善するために、いくつかの重要なイノベーションを紹介します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:48:18 GMT)
Feedback-enhanced quantum reservoir computing with weak measurements [1.5]
フィードバック強化型量子貯水池計算フレームワークを開発した。また,本モデルが従来のQRC手法よりも優れていることを示す。これらの知見は、次世代量子機械学習アプリケーションにおけるフィードバック強化型QRCの可能性を示している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:47:06 GMT)
Investigating Recent Large Language Models for Vietnamese Machine Reading Comprehension [1.5]
ベトナムのMRCデータセットであるViMMRC上で2つの最先端のLarge Language Model (LLM)を評価し評価する。我々の微調整モデルは GPT-3 や GPT-3.5 よりも小さいが、従来の BERT ベースのアプローチとこれらの大きなモデルよりも優れている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:08:11 GMT)
Generative AI for Validating Physics Laws [1.4]
我々は、物理の基本法則を実証的に検証するために、生成人工知能(AI)を提案する。提案手法は、各恒星の仮想温度条件下での反ファクトルミノシティをシミュレートする。ガイアDR3データを用いて、平均すると、恒星半径で温度の影響が増加し、絶対等級で減少し、理論的な予測と一致することを発見した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:57:26 GMT)
SFO: Piloting VLM Feedback for Offline RL [1.4]
VLM(Vision-Language Models)は、アクション条件のトレーニングデータがないため、制御タスクを解く能力に制限がある。 AIフィードバックからの強化学習における重要な課題は、VLM由来の信号を学習プロセスに統合する方法を決定することだ。本稿では,人間のフィードバックに基づく手法から,より複雑な強化学習を達成し,よりシンプルで効果的なアプローチであるフィルタリングと重み付き行動クローニングを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:08:55 GMT)
Credit Risk Meets Large Language Models: Building a Risk Indicator from Loan Descriptions in P2P Lending [1.2]
Peer-to-peer (P2P) 貸与は、借り手と貸し手をオンラインプラットフォームを介して接続するが、重要な情報非対称性に悩まされる。本稿では,テキスト中の文脈ニュアンスをキャプチャする能力で知られている大言語モデル(LLM)であるBERTを活用することで,この問題に対処する。借り手が提供するローン記述を使って、デフォルトのローンと非デフォルトのローンを区別するためにBERTを微調整します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:42:11 GMT)
Co-SemDepth: Fast Joint Semantic Segmentation and Depth Estimation on Aerial Images [1.0]
本稿では,空飛ぶロボットの単眼カメラを用いて,非構造環境における深度とセマンティックマップの予測を行う。本稿では,2つのタスクを正確かつ迅速に実行可能な共同ディープラーニングアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:25:07 GMT)
An Empirical Study of the Role of Incompleteness and Ambiguity in Interactions with Large Language Models [1.0]
人間の言語モデルと大規模言語モデル(LLM)の相互作用をモデル化するニューラルシンボリック・フレームワークを提案する。我々は質問の不完全性とあいまいさを、インタラクションで交換されたメッセージから導出可能な特性として定義する。その結果,不完全性やあいまいな質問の比率が高いデータセットでは,マルチターンインタラクションが要求されることがわかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:34:30 GMT)
Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations [0.9]
物理インフォームド深部生成モデル(sPI-GeM)は高次元空間と空間空間の両方でSDE問題を解くことができる。 sPI-GeMは空間空間のスケーラビリティを、広く使われている次元削減技術と同様の方法で解決する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:19:26 GMT)
Using Large Language Models for Template Detection from Security Event Logs [0.9]
イベントログ分析技術は、サイバー攻撃のタイムリーな検出と、過去のセキュリティインシデントの分析でセキュリティ専門家を支援するために不可欠である。構造化されていないテキストイベントログから行パターンやテンプレートを検出することは、イベントログ分析の重要なタスクとして認識されている。本稿では,構造化されていないセキュリティイベントログからテンプレートを教師なし検出するためのLarge Language Models (LLMs) の適用について検討する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:39:18 GMT)
The Representational Status of Deep Learning Models [0.9]
本稿では、DLMが対象をリレーショナルな意味で表現するが、一般的には、DLMがターゲットの局所的に意味論的に分解可能な表現を符号化していると考える理由はない、と論じる。この結果は、説明可能なAI(XAI)に即座に影響し、深層学習表現のグローバルリレーショナルな性質の探求に注意を向ける。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:29:58 GMT)
CLASP: Contrastive Language-Speech Pretraining for Multilingual Multimodal Information Retrieval [0.9]
CLASP(Contrastive Language-Speech Pretraining)は、音声テキスト情報検索に適した多言語表現である。トレーニングでは,フィクションから宗教まで15の分野を対象とする音声テキストデータセットを新たに導入した。複数の言語で評価した結果、CLASPはHITS@1、MRR、平均Rメトリクスで新しいベンチマークを確立している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:52:05 GMT)
On the effectiveness of LLMs for automatic grading of open-ended questions in Spanish [0.8]
本稿では,異なるLLMの性能について検討し,オープンエンド質問に対する短文回答を自動的に評価する手法を提案する。結果は、プロンプトのスタイルに特に敏感であり、プロンプト内の特定の単語やコンテンツに対するバイアスを示唆している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:43:27 GMT)
Quantum correlation and origin of Hawking radiation for mass-superposed BTZ black holes [0.8]
同じ質量比の異なる質量重ね合わせは、以前にも記録されていない現象である。また, 質量重畳されたBTZブラックホールであっても, 相関関数法はホーキング放射の発生位置を特定できることがわかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:57:03 GMT)
Literature Review: Cyber Security Monitoring in Maritime [0.7]
近年,情報技術 (IT) と運用技術 (OT) のインフラをターゲットとして,海事部門で多くのサイバー事件が起きている。これまでの研究では、サイバー攻撃を自動でタイムリーに検出することを目的としたサイバーセキュリティ監視に焦点が当てられていない。本稿では, この研究ギャップに対処し, 海上部門におけるサイバーセキュリティ監視の手法, アルゴリズム, ツール, アーキテクチャについて調査する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:06:25 GMT)
Lost in Cultural Translation: Do LLMs Struggle with Math Across Cultural Contexts? [0.7]
本研究では,Large Language Models (LLMs) の数学的推論能力に対する文化的文脈の影響を明らかにする。この結果から, LLMは, 基礎となる数学的構造が一定であっても, 文化的参照が変化しても数学問題に苦しむことが明らかとなった。明確な数学的訓練を持たないモデルであっても、関連する文化的文脈への露出は、文化的に埋め込まれた数学問題において、より大きく、数学的に熟練したモデルよりも優れることがある。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:35:39 GMT)
Agentic Business Process Management: The Past 30 Years And Practitioners' Future Perspectives [0.7]
私たちはBPM実践者に対して、エージェントの自律性、適応性、ヒューマンコラボレーション、プロセスのガバナンスに関する理解、期待、関心について、一連のインタビューを行います。この結果は、データ不整合、手動の介入、プロセスボトルネックの特定、プロセス改善の行動可能性、効率の向上、予測プロセスの洞察、積極的な意思決定支援に関する課題の両方を反映している。これらの懸念は、組織内のエージェントを管理するための堅牢な方法論的フレームワークの必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:15:24 GMT)
Iterative Multi-Agent Reinforcement Learning: A Novel Approach Toward Real-World Multi-Echelon Inventory Optimization [0.7]
マルチエケロン在庫最適化(MEIO)は、効果的なサプライチェーン管理において重要であるが、その固有の複雑さは重大な課題を引き起こす可能性がある。近年の研究では、深層強化学習(DRL)が従来の強化学習の代替として有望であることがわかった。本論文は複雑化に伴うMEIO問題に対するDRLの適用性について考察する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 20:52:21 GMT)
Threshold Crossings as Tail Events for Catastrophic AI Risk [0.7]
我々は,AIシステムにおける分岐駆動のジャンプと,その創発的な重み付き結果分布の分析を行った。我々の結果は、潜在的に破滅的なAIリスクを管理するために、AIシステムの監視、緩和、制御に関する研究に寄与する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:01:09 GMT)
Quantum dynamics evolution predicted by the long short-term memory network in the photosystem II reaction center [0.5]
深層学習モデルを用いて,拡張時間スケールで電荷輸送(CT)の挙動を予測した。 LSTMのスコープと有効性について、さらなる調査が求められている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:31:38 GMT)
Example-Based Learning in Software Engineering Education: A Systematic Mapping Study [0.4]
事例ベースラーニング(EBL)は、ソフトウェア工学教育(SEE)の品質向上を約束している。本研究は,ESBをSEEに用いた経験的証拠を調査し,分類することを目的とする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:14:25 GMT)
Strongly Electromechanical Coupled Phononic Waveguides in Aluminum Scandium Nitride on Silicon Carbide [0.4]
2次元に閉じ込められた導波管系は、フォノン回路成分の密度の点で大きな利点をもたらす。ギガヘルツ周波数でのフォノンの生成と誘導のためのそのような材料システムの一つがSiC上のAlScNである。 SiC上におけるAlScN中の2次元共振導波路構造を電気機械的に強く結合したモードで提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:38:01 GMT)
A Theoretical Framework for Graph-based Digital Twins for Supply Chain Management and Optimization [0.4]
グローバル化、市場需要の進展、持続可能性圧力により、サプライチェーン管理はますます複雑化している。グラフベースのモデリングは、サプライチェーン内の複雑な関係をキャプチャする強力な方法を提供する一方、Digital Twins(DT)はリアルタイム監視と動的シミュレーションを可能にする。本稿では, グラフモデリングとDTアーキテクチャを組み合わせることで, 動的かつリアルタイムなサプライネットワーク表現を実現するグラフベースDigital Twin Frameworkを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:27:58 GMT)
Enhanced prediction of spine surgery outcomes using advanced machine learning techniques and oversampling methods [0.3]
本研究は,オーバーサンプリング手法とグリッド探索最適化を取り入れ,脊椎手術結果を予測するための高度な機械学習手法を提案する。改良されたKNNモデルは76%の精度と67%のF1スコアを実現し、グリッド探索の最適化によりパフォーマンスが向上した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:39:19 GMT)
Learning to Interfere in Non-Orthogonal Multiple-Access Joint Source-Channel Coding [0.3]
マルチビューオートエンコーダを用いた圧縮とチャネル符号化を融合した機械学習支援型無線画像伝送方式を提案する。トレーニング可能なパラメータの数は, シングルユーザモデルに比べてわずか0.6%増加した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:27:20 GMT)
A Multi-Model Adaptation of Speculative Decoding for Classification [0.2]
本研究では,新たな投機的復号化手法を提案する。本稿では,最大3つの軽量ワーカーモデルと,より堅牢な1つの判断モデルを用いたマルチモデルフレームワークを提案する。分析の結果,30億のパラメータを持つボックスインストラクション/チャット微調整作業モデル(以下,3B)の縮小は,より大きな微調整作業モデルに匹敵する判断モデルとの整合性を示すことが示唆された。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 13:54:02 GMT)
Clarifying Misconceptions in COVID-19 Vaccine Sentiment and Stance Analysis and Their Implications for Vaccine Hesitancy Mitigation: A Systematic Review [0.2]
本研究の目的は、感情分析やスタンス検出を用いた研究の体系的レビューを行い、Twitter上でワクチンのヘシタシーを研究することである。本研究は, ツイートサンプル選択アプローチ, 自己報告型, 分類型, 結果の解釈の5次元の分類法に基づいて, 研究を分類した。我々は、新型コロナウイルスワクチンやワクチン接種に対する感情や姿勢を分析するために教師付き機械学習を用いた研究において、測定バイアスが広く用いられていることを発見した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:55:10 GMT)
DPFAGA-Dynamic Power Flow Analysis and Fault Characteristics: A Graph Attention Neural Network [0.2]
本稿では, 動的潮流解析と断層特性を考慮した共同グラフ注意ニューラルネットワーク(GAT)とアダプティブ隣人(CAN)によるクラスタリングを提案する。次に、スマートグリッドのユースケースアプリケーションで提案したフレームワークを評価し、既存の手法と公正に比較する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:30:41 GMT)
New Diamond Magnet CaCo2TeO6: Strong Quantum Fluctuations and Enhanced Competing Exchange Interactions Enabled by Octahedral Co2+ Ligand Fields [0.2]
CaCo2TeO6は、2つのOh-Co2+部位のダイヤモンド格子を特徴とする新しい材料である。この材料は強い量子ゆらぎ、競合する磁気交換相互作用の増大、磁場誘起磁気構造のチューニング性を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 01:57:51 GMT)
Who is the root in a syntactic dependency structure? [0.1]
ネットワーク科学の観点からは,根性という普遍的な概念に対する理論的かつ実証的な基礎を提供する。文の構文構造を単語間の構文的関係を示す木として考える。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:58:59 GMT)
Dynamic Gradient Sparse Update for Edge Training [0.1]
トレーニングにおけるバックプロパゲーションの勾配計算は、中間機能と計算損失を格納するために、大きなメモリバッファを必要とする。これはマイクロコントローラのようなメモリ制限されたエッジデバイスでは受け入れられない。本稿では,メモリ使用量を削減するために動的勾配スパース更新を用いたトレーニングアクセラレーション手法を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:32:12 GMT)
Word Sense Disambiguation in Persian: Can AI Finally Get It Right? [0.0]
ペルシャのホモグラフの曖昧化に適した新しいデータセットを提案する。本研究は,コサイン類似性法による各種埋没物の徹底的な探索を含む。我々は、精度、リコール、F1スコアの観点からモデルの性能を精査する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:44:23 GMT)
Won: Establishing Best Practices for Korean Financial NLP [0.0]
金融に焦点を当てた韓国の大規模言語モデルを評価するための最初のオープン・リーダーボードを提示する。 80kインスタンスのオープンインストラクションデータセットを公開し、トップパフォーマンスモデルで観測された広く使われているトレーニング戦略を要約する。最後に、これらのベストプラクティスを使って構築された完全にオープンで透明なLLMであるWonを紹介します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:52:38 GMT)
When neural implant meets multimodal LLM: A dual-loop system for neuromodulation and naturalistic neuralbehavioral research [0.0]
本稿では、応答性神経刺激(RNS)インプラントと人工知能駆動型ウェアラブルデバイスを組み合わせた新しいデュアルループシステムを提案する。 PTSD療法モードでは、移植されたクローズドループニューラルデバイスが扁桃体活動を監視し、病理組織振動を検出するためのオンデマンド刺激を提供する。神経科学研究モードでは、同じプラットフォームが現実世界の脳活動のキャプチャに適応している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:27:26 GMT)
Training A Neural Network For Partially Occluded Road Sign Identification In The Context Of Autonomous Vehicles [0.0]
交通標識の部分的閉塞が認識に与える影響について検討した。我々は、96%の精度で達成したカスタム畳み込みニューラルネットワーク(CNN)の性能を、転送学習を用いてトレーニングされたモデルと比較した。さらなる実験により、完全に見える標識のみに訓練されたモデルは、閉鎖された標識を認識すると効果を失うことが判明した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:25:56 GMT)
The Misinterpretable Evidence Conveyed by Arbitrary Codes [0.0]
エビデンス理論(エビデンスりょう、英: Evidence Theory)とは、不正確な推論を扱うための枠組みである。本稿では,生物間の任意の通信符号を表すためにエビデンス理論を用いる可能性について考察する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 07:31:26 GMT)
The Mathematics of Questions [0.0]
方程式 $i(A,B)+i(A,neg B)+i(neg A,B)+i(neg A,neg B)= 0$, where $i(A,B)=logfracP(Atext and B)P(A)P(B)$, and $P(A)$ は$A$の確率である。解は論理的命題の間の新たな基本的な情報的関係であり、それが解である
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:54:21 GMT)
The Local Approach to Causal Inference under Network Interference [0.0]
エージェントが社会的・経済的ネットワークにどのようにリンクされているかに依存する場合の因果推論のための新しい非パラメトリックモデリングフレームワークを提案する。提案手法は, エージェントがネットワーク上でどのようにリンクされているかを, 経路距離によって測定された他のエージェントと接続の設定を用いて特徴付ける。ポリシーや治療課題の影響は、同様に構成されたエージェントにまたがって結果データをプールすることで学習される。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:36:22 GMT)
Supervised Manifold Learning for Functional Data [0.0]
多様体学習の観点から分類の話題を考察する。低次元表現を学習するためにラベル情報を考慮に入れた新しい近接測度を提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 05:00:14 GMT)
Self-Attention Diffusion Models for Zero-Shot Biomedical Image Segmentation: Unlocking New Frontiers in Medical Imaging [0.0]
本稿では,ゼロショットバイオメディカルイメージセグメンテーションのための新しいアプローチであるDiffusion Attention Zero-shot Unsupervised System (ADZUS)を紹介する。 ADZUSは事前に訓練された拡散モデルの本質的な能力を生かし、その生成的および識別的ポテンシャルを利用して医用画像の分割を行う。皮膚病変のセグメンテーション、胸部X線感染症のセグメンテーション、白血球セグメンテーションなど、さまざまな医療画像データセットにわたる実験結果から、ADZUSが最先端のパフォーマンスを達成することが明らかとなった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:47:12 GMT)
SRMIR: Shadow Reward Models Based on Introspective Reasoning for LLM Alignment [0.0]
SRMIR(Shadow Reward Models Based on Introspective Reasoning)は、メンバーシップ推論攻撃におけるシャドーモデルにインスパイアされている。政策最適化のためのシャドウ報酬モデルを統合するために,線形結合と分類アプローチの2つの戦略を適用した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:40:29 GMT)
Regularization of ML models for Earth systems by using longer model timesteps [0.0]
正規化は機械学習(ML)モデルの一般化を改善する技術である。本稿では、カオス的な地球系をモデル化する際に、より長い時間ステップを用いることが、このような正規化にどのように結びつくかを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:41:10 GMT)
Quantum reservoir probing of quantum phase transitions [0.0]
量子状態遷移は局所的な量子クエンチによって誘起される局所化された平衡外励起によって検出できることを示す。局所的なクエンチの影響は異なる量子相によって異なり、量子臨界点付近で増幅された量子ゆらぎによって著しく抑制される。我々は、QRPが、パラダイム的可積分および非可積分量子スピン系における量子相転移、さらには位相的量子相転移を検出できることを実証した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 09:39:26 GMT)
Quantum advantage from negativity of work quasiprobability distributions [0.0]
量子電池は、多数のセルが存在する場合、直ちに「作業」を行うことで充電することができる。ここでは、これらの量子熱力学の2つの概念は、明らかに非連結であるように見えるが、単純な関係を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:41:33 GMT)
Quantum Frequential Computing: a quadratic runtime advantage for all computations [0.0]
ゲート周波数の増加により量子スピードアップが発生するため、我々は量子頻繁なコンピュータを開発する。この利点を実現するためには、コンピュータのアーキテクチャのごく一部のみが最適な量子制御状態を使用する必要があることを実証する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:06:20 GMT)
Quantum Brownian motion induced by fluctuating boundaries and compactification [0.0]
2つのゆらぎ点のような境界によって生じる点電荷の量子ブラウン運動について検討する。各系の長さスケールに波動関数を関連付けることで、固定境界とコンパクト化サイズを持つシナリオによく現れる典型的な発散が効果的に滑らかになることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 00:09:46 GMT)
Quantization of the electromagnetic field, entropy of an ideal monoatomic gas, and the birth of Bose-Einstein statistics [0.0]
1924年、アインシュタインはインドの物理学者S.N.ボースから短い原稿を受け取った。彼はすぐにボーゼの写本をドイツ語に翻訳し、それを『Zeitschrift f"ur Physik』に翻訳した。本稿では、アインシュタインが物質の量子統計的性質と電磁場の量子統計的性質を統一しようとしたときに苦労したいくつかの興味深い問題を述べる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:50:53 GMT)
Quantitative Evaluation of Multiple Instance Learning Reliability For WSIs Classification [0.0]
機械学習モデルは、多くの分野において不可欠なものとなっているが、その信頼性、特に高い領域では、依然として重要な懸念点である。計算病理学におけるWSI分類のために設計された多重インスタンス学習(MIL)モデルの信頼性を比較する。その結果,平均プールインスタンス(MEAN-POOL-INS)モデルは,他のネットワークと比較して信頼性が高いことがわかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:49:03 GMT)
Quantifying the influence of Vocational Education and Training with text embedding and similarity-based networks [0.0]
我々は、VETコースの潜在的な影響を定量化し、将来の経済と専門化と共に説明する。シンガポール第4次産業革命経済に関連するVETコースは、他の将来の経済関連コースよりも高い影響力を示す。我々は、労働市場における教育供給の不均等な分配を前提として、一般技能を必要とする特定の職業セクターにおけるVET供給の顕著な集中を示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 04:13:03 GMT)
Payload-Aware Intrusion Detection with CMAE and Large Language Models [0.0]
侵入検知システム(IDS)は悪意のあるトラフィックを特定するために重要であるが、従来のシグネチャベースの手法ではゼロデイ攻撃と偽陽性率が高い。本研究では,計算オーバーヘッドを低減しつつ検出精度を向上させる改良型畳み込み型マルチヘッドアテンション・アンサンブル(CMAE)モデルであるXavier-CMAEを提案する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 02:56:32 GMT)
Optimization of two-photon absorption for three-level atom [0.0]
光の最適状態の分光時間形状は、原子状態の寿命によって決定される。光の入力状態の絡み合いが質的に異なる2つの異なる相互作用機構を識別することができる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 10:53:58 GMT)
On the Origins of Sampling Bias: Implications on Fairness Measurement and Mitigation [0.0]
いくつかのバイアス源が存在し、機械学習によるバイアスは異なるグループによって等しく生まれると仮定される。特にサンプリングバイアスは、サンプリング手順によるバイアスを記述するために文献で矛盾的に使用される。サンプルサイズバイアス (SSB) とアンダーレ表現バイアス (URB) の明確に定義された変種を導入する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:23:07 GMT)
Nonlinear Domain Engineering for Quantum Technologies [0.0]
本稿では, 材料非線形性の人工構造に基づくフォトニック量子技術の高度に適応可能な技術について述べる。このアプローチの中核に位置する3波混合プロセスは、基礎となる量子力学的記述に基づいて、対応する光子特性を人工的に操作する方法を示している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:44:02 GMT)
Maxwell's Demon Is Foiled by the Entropy Cost of Measurement, Not Erasure [0.0]
従来の熱力学の第2法則は情報消去のエントロピーコストによって「マクスウェルのデーモン」から救われるという主張である。第2法則を保存する基本的な原理は、量子不確実性原理である、と私は主張する。私は、Szilardエンジン内の分子を局在させるための特定のエントロピーコストを得る。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:49:12 GMT)
Mapping Hymns and Organizing Concepts in the Rigveda: Quantitatively Connecting the Vedic Suktas [0.0]
NLP手法を用いて,Rigveda内の賛美歌の話題と意味的関連を同定した。リグヴェーダの現代英語訳からの1028のサクタ(賛美歌)が前処理され、サクタレベルの埋め込みが得られた。 Suktaネットワークにおけるトピックのコミュニティ検出は,Louvain,Leiden,およびラベル伝搬法を用いて行った。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:01:12 GMT)
Machine learning based animal emotion classification using audio signals [0.0]
本稿では,音声信号の処理と認識に基づいて,犬の感情状態を自動分類する機械学習手法を提案する。ヒューマンマシンインタフェースの改善や、音響データから感情を分類するためのより正確なツールの開発に有用な情報を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:58:03 GMT)
Leveraging Large Language Models for Automated Causal Loop Diagram Generation: Enhancing System Dynamics Modeling through Curated Prompting Techniques [0.0]
本稿では,大規模言語モデル(LLM)を用いて動的仮説のCLDへの変換を自動化する手法を紹介し,検証する。そこで,本研究では,SD教科書をベースとしたシンプルな動的仮説とそれに対応するCDDのセットを開発し,プロンプト手法の4つの組み合わせを比較し,エキスパートモデラーによってラベル付けされたCDDに対する性能評価を行った。その結果、シンプルなモデル構造とキュレートされたプロンプト技術を用いて、LCMは専門家が作ったものと同様の品質のCDDを生成でき、CLDの生成を加速できることがわかった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:57:51 GMT)
LLMs in the Classroom: Outcomes and Perceptions of Questions Written with the Aid of AI [0.0]
学生はChatGPTの助けを借りて質問が書かれたかどうかを知覚できなかった。 LLMによる質問に対する学生のスコアはほぼ9%低かった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:01:49 GMT)
Joint estimation of phase and uncorrelated dephasing in a differential quantum interferometer [0.0]
本稿では,差動位相シフトと非相関位相雑音の幅の同時推定のための最大推定法を提案する。従来の手法とは異なり,本手法は精度と精度の両面において,従来の楕円フィッティングよりも優れたデータ拡散と性能を明示的に説明する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:38:48 GMT)
Interpersonal Trust Among Students in Virtual Learning Environments: A Comprehensive Review [0.0]
仮想学習環境における学生間のコラボレーションと学習の成功の柱の1つとして、対人信頼が認められている。本研究は, VLEにおける学生の対人信頼を支える属性, フェーズ, 特徴について検討する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 08:09:30 GMT)
Informer in Algorithmic Investment Strategies on High Frequency Bitcoin Data [0.0]
本稿では,高頻度Bitcoinデータの自動取引戦略構築におけるInformerアーキテクチャの利用について検討する。異なる損失関数を持つインフォーマーモデルを用いた3つの戦略が提案され、評価された。この研究は、GMADL損失関数で訓練されたインフォーマーモデルを用いることで、買い買い得アプローチよりも取引結果が優れていることを示す。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:00:13 GMT)
HyperNOs: Automated and Parallel Library for Neural Operators Research [0.0]
HyperNOsは、ニューラルネットワークの探索プロセスの合理化と自動化を目的として設計されたPyTorchライブラリである。 HyperNOsは最先端の最適化アルゴリズムと並列コンピューティングを利用する。このライブラリは提供されたモデルとデータセットで簡単に使用できるように設計されているが、新しいデータセットやカスタムのニューラルオペレータアーキテクチャを使用するために容易に拡張できる。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 14:39:58 GMT)
Human-AI Interaction and User Satisfaction: Empirical Evidence from Online Reviews of AI Products [0.0]
本稿では,G2.comのAI関連製品のユーザレビューを10万件以上分析する。私たちは7つの中核HAI次元を特定し、レビューの中でそのカバレッジと感情を調べます。 HAIの4次元に対する感情は、適応性、カスタマイズ性、エラー回復、セキュリティが全体的なユーザ満足度に肯定的な関係があることに気付きました。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:16:49 GMT)
Guided Diffusion for the Extension of Machine Vision to Human Visual Perception [0.0]
誘導拡散を用いた人間の視覚知覚にマシンビジョンを拡張させる手法を提案する。誘導拡散は、マシンビジョンと人間の知覚の間のブリッジとして機能し、追加のオーバーヘッドなしにそれらの間の遷移を可能にする。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:04:26 GMT)
GeoBenchX: Benchmarking LLMs for Multistep Geospatial Tasks [0.0]
Sonnet 3.5 と GPT-4o は最高性能を達成し、Claude モデルは解決可能なタスクに優れていた。一般的な誤りには、幾何学的関係の誤解、時代遅れの知識への依存、非効率的なデータ操作などがある。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:20:14 GMT)
ExpertRAG: Efficient RAG with Mixture of Experts -- Optimizing Context Retrieval for Adaptive LLM Responses [0.0]
ExpertRAGは、Mixture-of-Experts (MoE)アーキテクチャとRetrieval Augmented Generation (RAG)を統合する新しい理論フレームワークである本稿では,エキスパートルーティングと組み合わせた動的検索ゲーティング機構を提案し,モデルが外部知識ストアを選択的に参照したり,専門的な内部エキスパートに依存したりすることを可能にする。本稿では,選択検索による計算コストの削減と,スパース専門家の利用によるキャパシティゲインの定量化を行う。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:26:23 GMT)
Enhancing Software Vulnerability Detection Using Code Property Graphs and Convolutional Neural Networks [0.0]
本稿では,コードプロパティグラフと機械学習を組み合わせたソフトウェア脆弱性検出手法を提案する。グラフデータに適応した畳み込みニューラルネットワークなど、さまざまなニューラルネットワークモデルを導入して、これらの表現を処理する。コントリビューションには、ソフトウェアコードをコードプロパティグラフに変換する方法論、グラフデータのための畳み込みニューラルネットワークモデルの実装、トレーニングと評価のための包括的なデータセットの作成が含まれている。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:12:07 GMT)
Detection of Somali-written Fake News and Toxic Messages on the Social Media Using Transformer-based Language Models [0.0]
本稿では,ソマリア語におけるこれらのギャップのいくつかを埋めるために,現在進行中の研究成果について述べる。我々はトランスフォーマーに基づく単言語ソマリ言語モデル(SomBERTa)を開発した。 SomBERTaは、有害コンテンツ、フェイクニュース、ニューストピック分類データセットに基づいて微調整され、評価される。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 15:45:31 GMT)
Constructing and explaining machine learning models for chemistry: example of the exploration and design of boron-based Lewis acids [0.0]
我々は、説明可能なAI技術を活用して、ホウ素系ルイス酸の合理的設計を探求する。ルイス酸は電子受容性のために有機反応において重要な役割を果たす。化学空間を適切に定義された分子足場に限定することにより,高精度な予測が可能となった。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 19:20:26 GMT)
Confronting Catastrophic Risk: The International Obligation to Regulate Artificial Intelligence [0.0]
我々は、AIによる人間の絶滅の脅威を軽減するための国際的義務があると主張している。我々は、AIの潜在的な存在リスクを軽減するために、規制措置を積極的に取ることが国際人権法における生命権の下での国家に対する肯定的な義務であると主張している。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 06:24:45 GMT)
Confidence Intervals for Performance Estimates in Brain MRI Segmentation [0.0]
3次元脳磁気共鳴画像(MRI)におけるセグメンテーションの典型的な信頼区間について検討する。与えられた精度を達成するのに必要なテストサイズは、しばしば分類タスクよりもはるかに低いことを示します。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:22:12 GMT)
Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance [0.0]
AIエージェントとのコラボレーションにより、コミュニケーションが137%増加し、人間がテキストや画像コンテンツ生成メッセージングに23%集中できるようになった。ヒューマンAIチームはソーシャルメッセージの送信を23%減らし、労働者1人あたりの生産性が60%向上し、高品質の広告コピーを作成した。 AIパーソナリティの素早いランダム化は、AI特性が人間の個性を補完し、コラボレーションを強化することを明らかにした。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 23:20:32 GMT)
COVID 19 Diagnosis Analysis using Transfer Learning [0.0]
本研究は、新型コロナウイルスの迅速かつ正確な診断におけるディープラーニングの利用について検討する。本稿では,VGG16,VGG19,ResNet50の更新版を含む最先端の畳み込みニューラルネットワーク(CNN)を活用した自動検出システムを提案する。その結果、最適化されたResNet50モデルは、97.77%の精度、100%の感度、93.33%の特異性、98.0%のF1スコアで最高の分類性能を達成した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:38:40 GMT)
Balancing Content Size in RAG-Text2SQL System [0.0]
本研究では,検索した文書の文書サイズと品質の相違点について検討する。テキスト2モデルにおける幻覚現象を考察し, 誤りを最小限に抑える上で, キュレートされた文書提示の重要性を強調した。我々の発見は、RAG + Text2システムの堅牢性を高めるロードマップを提供し、現実世界のアプリケーションに実用的な洞察を提供する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 18:27:29 GMT)
Assessing the influence of cybersecurity threats and risks on the adoption and growth of digital banking: a systematic literature review [0.0]
本研究では,サイバーセキュリティの脅威がデジタルバンキングのセキュリティ,適用,規制遵守に与える影響について検討する。デジタルバンキングプラットフォームをターゲットとする最も一般的なサイバー脅威、現代のセキュリティ対策の効果、金融サイバーセキュリティリスクの緩和における規制フレームワークの役割を批判的に評価する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 03:14:45 GMT)
Advancements and Challenges in Quantum Machine Learning for Medical Image Classification: A Comprehensive Review [0.0]
量子機械学習(QML)は、医療画像分類のための有望なソリューションを提供する。量子コンピューティングの並列化は、疾患の検出と診断のスピードと精度を大幅に向上させることができる。シミュレーションから実際の量子コンピュータへの移行を強調し、ノイズの多い量子ビットのような課題に対処する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:10:54 GMT)
Adiabatic charge transport in extended SSH models [0.0]
本稿では, 周期的に駆動されるSSH4モデルとSSHLRモデルにおいて, 断熱限界下で電荷輸送を研究する時間について紹介する。パラメータ空間全体は、残りのパラメータの特定の選択に対して位相的になり、完全なサイクルの終わりに励起電荷の有限量子化値へと導かれる。別の変数として時間を考えると、駆動モデルのこれらの新しい位相を運動量空間チャーン数、周期バルクおよび開バルク実空間ボット指数によって特徴づける。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:10:13 GMT)
Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization [0.0]
多要素強化学習(Multi-fidelity Reinforcement Learning, RL)フレームワークは、様々な精度とコストの分析モデルを統合することにより、計算資源を効率的に活用する。本研究では,複数の不均一な非階層的低忠実度モデルを高忠実度モデルとともに動的に活用する適応型多忠実RLフレームワークを提案する。提案手法の有効性はオクトコプター設計最適化問題において実証され,2つの低忠実度モデルと高忠実度シミュレータを用いた。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 22:29:08 GMT)
Adaptive Intelligence: leveraging insights from adaptive behavior in animals to build flexible AI systems [0.0]
適応的な生物学的知能の行動的および神経的基盤、AIの並行的な進歩についてレビューし、より適応的なアルゴリズムを構築するための脳に触発されたアプローチを探る。次のフロンティアは、従来のAIを超えて"適応知性(adaptive intelligence)"を開発することであり、ここで定義されているのは、生物学的インテリジェンスからの洞察を活用して、オンラインで学習し、一般化し、環境の変化に迅速に適応できるエージェントを構築することだ。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 16:59:23 GMT)
AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:12:16 GMT)
A semantic approach to mapping the Provenance Ontology to Basic Formal Ontology [0.0]
PROV-O は World Wide Web Consortium (W3C) で、さまざまなドメインにまたがる実績に関するデータを構造化するために使用される。これら2つの拡張とそれらによって編成されたデータとの相互運用性を高めるため、マッピング方法論とアライメントのセットが提示される。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 17:23:51 GMT)
(G)I-DLE: Generative Inference via Distribution-preserving Logit Exclusion with KL Divergence Minimization for Constrained Decoding [0.0]
(G)I-DLEは、KLの発散を利用して自己回帰言語モデルの固有条件確率分布を保存する制約付き復号法である。我々はK2-Evalデータセット上で,韓国語の流布度を評価するために,本手法の有効性を検証した。
論文参考訳（メタデータ） (Sun, 23 Mar 2025 12:37:14 GMT)