Fugu-MT: arxivの論文翻訳(概要)

Command A: An Enterprise-Ready Large Language Model [165.9]
コマンドAはエージェント最適化および多言語対応モデルである。クラス内で最高のRetrieval Augmented Generation機能を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:08:07 GMT)
Alleviating Hallucinations in Large Vision-Language Models through Hallucination-Induced Optimization [123.5]
大規模ビジュアル言語モデル(LVLM)は、マルチモーダルデータの理解において、例外的な能力を示した。彼らは必然的に幻覚に悩まされ、生成されたテキストと対応するイメージを切断する。現在の視覚的コントラスト復号法のほとんどは、視覚的不確実性情報を導入して幻覚を緩和しようとするものである。しかし、彼らは幻覚トークンを正確に誘導するのに苦労し、幻覚を緩和する効果を著しく制限した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:38:09 GMT)
EditRoom: LLM-parameterized Graph Diffusion for Composable 3D Room Layout Editing [114.1]
自然言語コマンドで様々なレイアウト編集を実行できるフレームワークであるEditRoomを提案する。特にEditRoomは、コマンドプランニングとターゲットシーンの生成にLarge Language Models(LLM)を利用している。既存の3Dシーンデータセットを拡張する自動パイプラインを開発し,83kの編集ペアを備えた大規模データセットであるEditRoom-DBを導入した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:38:07 GMT)
Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method [108.6]
本研究では,乱数から発散する概念に触発された偏差に基づくキャリブレーション手法を導入し,プリトレーニングデータ検出のためのトークン確率のキャリブレーションを行う。我々は,中国語テキスト上でのLLMの検出手法の性能を評価するために,中国語のベンチマークであるPatentMIAを開発した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:09:19 GMT)
4th PVUW MeViS 3rd Place Report: Sa2VA [105.9]
より強力なMLLM上でのテスト時間推定法を簡易に修正することで,MeVISのより強力な結果が得られることを示す。特に,画像とビデオの密接な理解のための統一モデルである,最近のSa2VAを採用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:06:47 GMT)
Feed-Forward Bullet-Time Reconstruction of Dynamic Scenes from Monocular Videos [101.5]
動的シーンのリアルタイム再構成と新しいビュー合成のための,モーション対応フィードフォワードモデルであるBTimerを提案する。提案手法は,すべてのコンテキストフレームから情報を集約することにより,所定の目標("bullet')タイムスタンプにおける3次元ガウススティング表現の全体像を再構成する。カジュアルなモノクロのダイナミックビデオが与えられた後、BTimerは150ms以内の弾道時間シーンを再構築し、静的および動的両方のシーンデータセットで最先端のパフォーマンスに到達した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:04:34 GMT)
Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control [98.0]
複数の空間制御入力に基づいて世界シミュレーションを生成する条件付き世界生成モデルであるCosmos-Transferを導入する。提案したモデルを解析し,ロボット2Realや自律走行車データ豊かさを含む物理AIへの応用を実証するために評価を行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:14:20 GMT)
Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization [97.7]
本稿では,選択的検索と知識の言語化を結合する新しいフレームワークであるSelf-Routing RAG(SR-RAG)を提案する。 SR-RAGは、LLMが外部検索と独自のパラメトリック知識の言語化を動的に決定できるようにする。近接探索による動的知識源推定を導入し,知識源決定の精度を向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:59:30 GMT)
Shot-by-Shot: Film-Grammar-Aware Training-Free Audio Description Generation [94.2]
ビデオ理解の基本単位として「ショット」を活用する2段階フレームワークを提案する。これには、隣接するショットへの時間的コンテキストの拡張や、ショットスケールやスレッド構造などのフィルム文法装置の導入が含まれる。我々の手法は、オープンソースとプロプライエタリなVisual-Language Modelsの両方と互換性がある。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:59:57 GMT)
Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains [92.4]
検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の数学的推論と符号化性能の向上に成功している。本稿では,医学,化学,心理学,経済学,教育など,さまざまな現実世界領域におけるRLVRの有効性と拡張性について検討する。我々は,2値検証による制限を克服するために,ソフトなモデルに基づく報酬信号を生成する生成的スコアリング手法を利用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:48:02 GMT)
When To Solve, When To Verify: Compute-Optimal Problem Solving and Generative Verification for LLM Reasoning [90.5]
大規模な言語モデルの推論能力を向上するための重要な戦略として、テスト時間計算のスケーリングが登場した。次世代予測課題としてのジェネレーティブ・リワード・モデル(GenRM)再フレーム検証の最近の進歩我々は、さまざまなモデルやデータセットにまたがる最も実用的な推論予算について、GenRMと自己整合性(SC)を評価した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:41:57 GMT)
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model [88.1]
Hyper SIGMAは、タスクやシーン間でHSI解釈を統合するビジョントランスフォーマーベースの基礎モデルである。さらに,約450Kのハイパースペクトル画像を含む,事前学習のための大規模ハイパースペクトルデータセットHyperGlobal-450Kを構築した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:14:22 GMT)
DecoFuse: Decomposing and Fusing the "What", "Where", and "How" for Brain-Inspired fMRI-to-Video Decoding [82.9]
既存のfMRI-to-video法は、しばしば空間情報や動き情報を見下ろしながら意味的内容に焦点を当てる。そこで我々は,fMRI信号から映像をデコードするための,脳にインスパイアされた新しいフレームワークであるDecoFuseを提案する。まず、ビデオはセマンティック、空間、動きの3つのコンポーネントに分解し、次に各コンポーネントを別々にデコードしてから、ビデオを再構成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:28:37 GMT)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.2]
逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。 DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。 DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:08:13 GMT)
Latent Covariate Shift: Unlocking Partial Identifiability for Multi-Source Domain Adaptation [82.1]
マルチソースドメイン適応(MSDA)は、ラベル付き対象ドメインのラベル予測関数を学習する際の課題に対処する。本稿では,潜在コンテンツ変数と潜時スタイル変数とともに,ドメイン間の潜時雑音を導入し,複雑な因果生成モデルを提案する。提案手法は、シミュレーションと実世界の両方のデータセットに対して、例外的な性能と有効性を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:47:59 GMT)
$C^2$AV-TSE: Context and Confidence-aware Audio Visual Target Speaker Extraction [80.6]
我々はMask-And-Recover (MAR)と呼ばれるモデルに依存しない戦略を提案する。 MARは、モダリティ間およびモダリティ間コンテキスト相関を統合し、抽出モジュール内の大域的推論を可能にする。各サンプルの難易度を向上するために, 精細信頼スコア(FCS)モデルを導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:01:30 GMT)
Will the Prince Get True Love's Kiss? On the Model Sensitivity to Gender Perturbation over Fairytale Texts [80.2]
本稿では, モデルが非現実的データ拡張を通じて, ジェンダーステレオタイプ摂動にどう反応するかを検討する。実験結果から, 性別の摂動に直面すると, モデルの性能低下がわずかであることがわかった。反現実的なトレーニングデータに基づいて微調整を行うと、モデルは反ステレオタイプな物語に対してより堅牢になる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:17:49 GMT)
Long-context Protein Language Modeling Using Bidirectional Mamba with Shared Projection Layers [77.0]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。そこで本研究では,選択的構造化状態空間モデルに基づく代替タンパク質であるBiMamba-Sに基づくLC-PLMを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:10:09 GMT)
Geometric Median Matching for Robust k-Subset Selection from Noisy Data [75.9]
最適分解点1/2のロバストな推定器であるGeometric Medianを利用する新しいk-subset選択法を提案する。提案手法は, k-subset を反復的に選択し,部分集合の平均が(潜在的に)ノイズデータセットの GM に近似し,任意の汚損の下でもロバスト性を確保する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:22:05 GMT)
MTL-LoRA: Low-Rank Adaptation for Multi-Task Learning [74.4]
MTL能力を大幅に向上させながら、低ランク適応の利点を保ちつつ、MTL-LoRAを提案する。 MTL-LoRAは、タスク固有の情報を識別し、共有知識をキャプチャするタスク適応パラメータを追加することで、LoRAを強化する。このアプローチにより、事前訓練されたモデルは、限られた数のトレーニング可能なパラメータで、異なるターゲットドメインに共同で適応することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:18:48 GMT)
Olympus: A Universal Task Router for Computer Vision Tasks [74.1]
Olympusは,マルチモーダル大規模言語モデル(MLLM)を,幅広いコンピュータビジョンタスクを処理可能な統一フレームワークに変換する新しいアプローチである。 Olympusは20のタスクで平均94.75%のルーティング精度を達成し、連鎖したアクションシナリオでは91.82%の精度を実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:08:07 GMT)
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.4]
BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。 BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:50:25 GMT)
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions [72.6]
BigCodeBenchは、大規模言語モデル(LLM)に対して、139のライブラリと7つのドメインから1140のきめ細かいタスクに対して、複数の関数呼び出しをツールとして呼び出すためのベンチマークである。評価の結果,LLMは機能コールを正確に使用するための複雑な指示に従うことができず,スコアは最大60%,人的性能は97%と極めて低いことがわかった。そこで本研究では,BigCodeBench-Instructという自然言語指向の変種を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:36:44 GMT)
A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.1]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。 Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:34:20 GMT)
Exploiting Mixture-of-Experts Redundancy Unlocks Multimodal Generative Abilities [69.3]
我々は、新しいモダリティを学ぶための追加能力の源として、Mixture-of-Experts(MoEs)内の冗長性を利用する。我々は、新しいモダリティのトークンのみに低ランク適応を適用することで、オリジナルの言語生成能力を保ちます。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:42:11 GMT)
ControlSR: Taming Diffusion Models for Consistent Real-World Image Super Resolution [68.7]
我々は、一貫した実世界の画像超解像(Real-ISR)に対して拡散モデルをテーム化する新しい方法であるControlSRを提案する。提案モデルでは,複数のテストセット上で複数の測定値にまたがる性能が向上し,既存の手法よりもLR画像でより一貫したSR結果が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:31:22 GMT)
Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.5]
半正直な設定で一貫したバックドア検出フレームワークを提案する。本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:56:20 GMT)
MaterialFusion: Enhancing Inverse Rendering with Material Diffusion Priors [67.7]
本稿では,テクスチャと材料特性に先立って2Dを組み込んだ,従来の3次元逆レンダリングパイプラインであるMaterialFusionを紹介する。本稿では,2次元拡散モデルであるStableMaterialについて述べる。種々の照明条件下で, 合成および実物体の4つのデータセット上でのMaterialFusionの照度特性を検証した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:35:49 GMT)
WikiVideo: Article Generation from Multiple Videos [67.6]
現実の出来事に関する複数のビデオから情報を集約する高レベルなウィキペディアスタイルの記事を自動的に作成する難題を提示する。 WikiVideoは、専門家が書いた記事と、記事の主張を裏付ける厳密な注釈付きビデオからなるベンチマークである。複数のビデオから記事を作成するためのインタラクティブな手法である共同記事生成(CAG)を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:22:15 GMT)
DoubleDiffusion: Combining Heat Diffusion with Denoising Diffusion for Texture Generation on 3D Meshes [67.4]
本稿では,3次元メッシュ上でテクスチャを直接生成する手法を提案する。この手法を生成拡散パイプラインに統合することにより,テクスチャ生成の効率を大幅に向上する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:27:48 GMT)
EventMamba: Enhancing Spatio-Temporal Locality with State Space Models for Event-Based Video Reconstruction [66.8]
EventMambaは、イベントベースのビデオ再構成タスク用に設計された、特殊なモデルである。 EventMambaは、Transformerベースの方法と比較して、優れた視覚的品質を提供しながら、スピードを著しく向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:49:17 GMT)
GENERator: A Long-Context Generative Genomic Foundation Model [66.5]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:14:15 GMT)
FisherTune: Fisher-Guided Robust Tuning of Vision Foundation Models for Domain Generalized Segmentation [65.9]
既存のアプローチでは、パラメータを選択的に微調整するか、VFMを凍結し、アダプタのみを更新する。我々は、Domain-Related Fisher Information Matrix (DR-FIM) によって誘導される堅牢な微調整法である textbfFisherTune を提案する。 DR-FIMはタスクやドメイン間でパラメータの感度を測定し、汎用性を維持し、DGSS適応性を高めるための選択的更新を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:23:00 GMT)
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis [65.4]
3Dビジョン言語(3D-VL)ベンチマークは、3D-VLモデルの評価に不足している。我々は3D-VLグラウンドとQAタスクのベンチマークであるBeacon3Dを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:32:41 GMT)
Articulated Kinematics Distillation from Video Diffusion Models [64.2]
Articulated Kinematics Distillation (AKD)は、高忠実度キャラクターアニメーションを生成するためのフレームワークである。 AKDはスケルトンに基づく3Dアセットの表現を使用しており、自由度(DoF)を大幅に削減している。 AKDは構造的整合性を維持しながら複雑な関節運動を蒸留する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:37:57 GMT)
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.1]
画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。 IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:23:56 GMT)
ShieldGemma 2: Robust and Tractable Image Content Moderation [63.4]
ShieldGemma 2はGemma 3上に構築された4Bパラメータの画像コンテンツモデレーションモデルである。このモデルでは、Sexually Explicit、Violence & Gore、Dangerous Contentの合成画像に対して、以下の主要な危険カテゴリにわたって堅牢な安全性リスク予測を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:20 GMT)
LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Gaps [63.1]
M-ALERTは、英語、フランス語、ドイツ語、イタリア語、スペイン語の5言語で大言語モデルの安全性を評価するベンチマークである。 M-ALERTは、ALERTの詳細な分類に従って、言語ごとの高品質なプロンプトが15kあり、合計で75kである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:02:40 GMT)
Scaling Language-Free Visual Representation Learning [62.3]
Visual Self-Supervised Learning (SSL) は現在、VQA (Visual Question Answering) のようなマルチモーダル環境で、コントラスト言語-画像事前学習 (CLIP) を過小評価している。このマルチモーダルギャップは、視覚的なSSLとCLIPモデルが異なるデータでトレーニングされているにもかかわらず、言語監督によって導入されたセマンティクスに起因することが多い。本稿では、同じMetaCLIPデータ上で、ビジュアルSSLとCLIPモデルの両方をトレーニングし、視覚エンコーダの多様なテストベッドとしてVQAを活用することにより、この問題を考察する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:59:15 GMT)
Memorizing is Not Enough: Deep Knowledge Injection Through Reasoning [60.0]
本稿では,知識注入のレベルである記憶,検索,推論,関連性を定義した4段階の知識注入フレームワークを提案する。次に、様々な知識注入シナリオを調査し、ベンチマーク上の各シナリオに対する知識注入の深さを評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:59:59 GMT)
Scoring Verifiers: Evaluating Synthetic Verification for Code and Reasoning [59.3]
本稿では,既存の符号化ベンチマークをスコアとランキングデータセットに変換して,合成検証の有効性を評価する手法を提案する。我々は4つの新しいベンチマーク(HE-R, HE-R+, MBPP-R, MBPP-R+)を公表し, 標準, 推論, 報酬に基づくLCMを用いて合成検証手法を解析した。実験の結果, 推論はテストケースの生成を著しく改善し, テストケースのスケーリングによって検証精度が向上することがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:19:14 GMT)
Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation [59.0]
人間は視覚と触覚を使って、環境変化の迅速な調整や接触力の適応制御といった非常に反応性の高い能力によって、コンタクトリッチなタスクを達成できる。既存の視覚模倣学習アプローチは、複雑な振る舞いをモデル化するためにアクションチャンキングに依存している。本稿では,Augmented Realityを通じてリアルタイム触覚フィードバックを提供する,低コスト遠隔操作システムであるTactARを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:54:35 GMT)
Robust Recommender System: A Survey and Future Directions [58.9]
まず,悪質な攻撃や自然騒音に耐える現在の手法を整理するための分類法を提案する。次に、不正検出、敵の訓練、悪意のある攻撃から守るための確実な堅牢な訓練など、各カテゴリにおける最先端の手法を検討する。さまざまなレコメンデーションシナリオの堅牢性や,正確性や解釈可能性,プライバシ,公正性といった他の特性との相互作用について論じる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:33:46 GMT)
NNsight and NDIF: Democratizing Access to Open-Weight Foundation Model Internals [58.8]
NNsightとNDIFを導入し、非常に大きなニューラルネットワークによって学習された表現と計算の科学的研究を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:04:53 GMT)
4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models [58.8]
動的シーンにおいて,時間に依存しない,あるいは時間に敏感なオープン語彙クエリを効率的に処理するために,4D言語フィールドを学習する4D LangSplatを提案する。 4D LangSplatは視覚機能から言語フィールドをバイパスし、オブジェクトワイドビデオキャプションから生成されたテキストから直接学習する。以上の結果から、4D LangSplatは時間に敏感かつ時間に依存しないオープン語彙クエリに対して,正確かつ効率的な結果が得られることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:10:36 GMT)
Multi-LLM Text Summarization [58.7]
本稿では,マルチLLM要約フレームワークを提案し,集中化と分散化を含む2つの異なるマルチLLM戦略について検討する。当社のフレームワークは,各会話のラウンドにおいて,生成と評価という,基本的に重要なステップを2つ備えています。我々のマルチLLM要約アプローチは, 1 つの LLM のみを最大 3 倍まで活用するベースラインを著しく上回っていることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:05:03 GMT)
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction [58.2]
近年,無限アニメライフシミュレーションの先駆的なアプローチとして,多ターンテキスト対話を画像生成のための言語命令に変換するために,大規模言語モデル(LLM)が採用されている。本稿では,MLLM(Multimodal Large Language Models)をベースとしたAnimeGamerを提案する。本稿では,アニメーション映像を高品質なビデオクリップにデコード可能な,アクション対応のマルチモーダル表現を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:57:18 GMT)
Bridging the Gap: Integrating Ethics and Environmental Sustainability in AI Research and Practice [57.9]
我々は、AIの倫理的影響を研究するための努力は、その環境への影響を評価するものと相まって行われるべきであると論じる。我々は,AI研究と実践にAI倫理と持続可能性を統合するためのベストプラクティスを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:53:11 GMT)
Making Large Language Models Better Reasoners with Orchestrated Streaming Experiences [57.9]
大規模言語モデル(LLM)は、ゼロショットまたは少数ショット設定下で中間思考を生成することで複雑な推論を行うことができる。複雑な外部の努力なしに自己改善できる推論タスクを解くためのフレームワークであるRoSEを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:04:04 GMT)
RipVIS: Rip Currents Video Instance Segmentation Benchmark for Beach Monitoring and Safety [57.2]
RipVISは、リップ電流セグメンテーション用に設計された大規模ビデオインスタンスセグメンテーションベンチマークである。我々のデータセットは、波の破れパターン、堆積物の流れ、水色の変化など、様々な視覚的文脈を包含している。結果は複数のメトリクスで報告され、特にリコールの優先順位付けと偽陰性の低減に$F$スコアに重点を置いている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:57:15 GMT)
PICLe: Pseudo-Annotations for In-Context Learning in Low-Resource Named Entity Detection [56.9]
In-context Learning (ICL)により、大規模言語モデルでは、デモをほとんど使わずにタスクを実行することができる。 PICLeは、ノイズの多い擬似アノテーション付き実演によるインコンテキスト学習のためのフレームワークである。バイオメディカルな5つのNEDデータセット上でPICLeを評価し,PICLeが低リソース環境でICLより優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:45:58 GMT)
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer [56.8]
本稿では,ユーザフレンドリーなテキスト記述と静的参照画像から動的エフェクトを生成する,画像アニメーションとしてのVFX生成のための新しいパラダイムを提案する。 i) VFXは15の多様なエフェクトカテゴリにまたがる最初の高品質なVFXビデオデータセットで、テキストによる記述と時間制御のためのスタートエンドタイムスタンプと、(ii) Video Diffusion Transformerをベースとした制御可能なVFX生成フレームワークであるVFX Creatorである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:54:57 GMT)
Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene [56.7]
共同自動運転(CAV)は有望な方向のようだが、開発のためのデータ収集は簡単ではない。本研究では,運転シーンにおける異なる視点から現実的な知覚を生み出すことを目的とした,救助支援のための新しいサロゲートを提案する。シミュレーションされたコラボレーティブデータと実車データを組み合わせた,最初のソリューションを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:10:21 GMT)
Form-Substance Discrimination: Concept, Cognition, and Pedagogy [55.2]
本稿では,高等教育におけるカリキュラム開発に欠かせない学習成果として,フォーム・サブスタンス・差別について検討する。本稿では,カリキュラム設計,評価実践,明示的な指導を通じて,この能力を育成するための実践的戦略を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:15:56 GMT)
$p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables [55.2]
任意の精度で連続関数を近似できる回帰モデルを構築している。提案モデルは、ニューラルネットワークアーキテクチャに基づく$p$-adicモデルの簡単な代替と見なすことができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:48:08 GMT)
Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.2]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。 VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:38:16 GMT)
Less is More: Efficient Black-box Attribution via Minimal Interpretable Subset Selection [52.7]
部分モジュラー部分集合選択の最適化問題として重要領域の帰属を再構成するLiMA(Less input is more faithful for Attribution)を提案する。 LiMAは、エラーを最小限に抑える最適な帰属境界を確保しながら、最も重要かつ最も重要でないサンプルを識別する。また, 帰属効率が1.6倍に向上し, 帰属効率が向上した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:58:15 GMT)
Scalable Mechanistic Neural Networks for Differential Equations and Machine Learning [52.3]
長い時間的シーケンスを含む科学機械学習応用のための拡張ニューラルネットワークフレームワークを提案する。計算時間と空間複雑度はそれぞれ、列長に関して立方体と二次体から線形へと減少する。大規模な実験により、S-MNNは元のMNNと精度で一致し、計算資源を大幅に削減した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:36:10 GMT)
S3C2 Summit 2024-08: Government Secure Supply Chain Summit [52.0]
サプライチェーンのセキュリティは、敵の攻撃から守る上で、考慮すべき重要な指標となっている。 2024年8月29日、Secure Software supply Chain Center (S3C2) の研究者が、10の政府機関から14人の実践者を集め、サプライチェーンのセキュリティ状態について議論した。サミットの目標は、企業と開発者の間で洞察を共有して、これから進む新しいコラボレーションやアイデアを育むことだ。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:54:41 GMT)
Stable Virtual Camera: Generative View Synthesis with Diffusion Models [51.7]
本稿では,シーンの新たなビューを生成する汎用拡散モデルであるスタブルバーチャルカメラ(Seva)を紹介する。このアプローチは、シンプルなモデル設計、最適化されたトレーニングレシピ、柔軟なサンプリング戦略によってこれらの制限を克服する。提案手法では,シームレスなループ閉鎖により,最大半分間の高品質なビデオを生成することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:22:54 GMT)
Training a Utility-based Retriever Through Shared Context Attribution for Retrieval-Augmented Language Models [51.6]
SCARLetは、RALMsでユーティリティベースのレトリバーをトレーニングするためのフレームワークである。マルチタスクの一般化とパッセージ間相互作用という2つの重要な要素が組み込まれている。ドメイン内とドメイン外の両方で、さまざまなタスクにまたがる10のデータセットに対するアプローチを評価します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:28:28 GMT)
PRISM-0: A Predicate-Rich Scene Graph Generation Framework for Zero-Shot Open-Vocabulary Tasks [51.3]
SGG(Scene Graphs Generation)では、オブジェクトノードの形式で視覚入力から構造化された表現を抽出し、それらを接続する。 PRISM-0はゼロショットオープン語彙SGGのためのフレームワークで、ボトムアップアプローチで基礎モデルをブートストラップする。 PRIMS-0は、イメージキャプションやSentence-to-Graph Retrievalのような下流タスクを改善する意味のあるグラフを生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:29:51 GMT)
TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting [51.0]
TurboFillは、高速な画像インペイントモデルであり、高品質で効率的なインペイントのためのインペイントアダプタを備えた、数ステップのテキスト-画像拡散モデルを強化する。我々は,新しい3段階の対角訓練手法を用いて,数ステップの蒸留テキスト・ツー・イメージ・モデルであるDMD2の塗布アダプタを訓練することで,これを克服する。実験の結果,TurboFillはマルチステップのBushNetと数ステップのインペインティング手法の両方に優れており,ハイパフォーマンスなインペインティングタスクのための新しいベンチマークが設定されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:33:29 GMT)
SMILE: Infusing Spatial and Motion Semantics in Masked Video Learning [51.0]
Masked Video Modelingはビデオ自己教師型学習(SSL)に有効なパラダイムである本稿では,空間的意味論と動き的意味論を融合させることにより,SMILEと呼ばれるビデオ表現学習のための新しいSSL手法を提案する。我々は、自然な映像データを必要とせず、強力な映像表現を学習できる、新しい自己教師型ビデオ学習パラダイムを確立した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:20:55 GMT)
Is the Top Still Spinning? Evaluating Subjectivity in Narrative Understanding [50.9]
曖昧なクレームにバイナリラベルを強制すると、評価の信頼性が低下する。請求項のニュアンス評価を提供する方法として,LCM生成した要約の編集を紹介する。我々は,ARMが主張の忠実性に関するアノテータ合意において,絶対的な21%の改善をもたらすことを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:08:24 GMT)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.3]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:43:19 GMT)
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations [50.0]
さまざまな下流タスクに事前訓練された基礎モデルを適用することは、人工知能のコアプラクティスである。これを解決するために、LoRAのようなパラメータ効率細調整(PEFT)手法が登場し、研究の焦点となっている。本稿では,行列型PEFT法を高次元パラメータ空間に拡張する一般化法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:36:45 GMT)
IntrinsiX: High-Quality PBR Generation using Image Priors [49.9]
IntrinsiXはテキスト記述から高品質な内在画像を生成する新しい手法である。シーンライティングを内蔵した既存のテキスト・ツー・イメージモデルとは対照的に,本手法では物理ベースのレンダリング(PBR)マップを推定する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:47:48 GMT)
Continual Cross-Modal Generalization [48.6]
クロスモーダル一般化は、マルチモーダル対から共有表現空間を学ぶことを目的としている。本稿では,新たなモダリティを仲介者モダリティを介して共有コードブックに漸進的にマッピングする連続学習手法を提案する。画像-テキスト,音声-テキスト,ビデオ-テキスト,音声-テキストによる実験により,本手法は多種多様なモーダル一般化タスクにおいて高い性能を発揮することが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:16:20 GMT)
RePoseD: Efficient Relative Pose Estimation With Known Depth Information [47.7]
本稿では,2つのカメラの相対的なポーズを,関連する単眼深度に対応する点対応から推定する新しい枠組みを提案する。新しいソルバは、スピードと精度の点で最先端のディープ・アウェア・ソルバより優れている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:02:01 GMT)
SuperDec: 3D Scene Decomposition with Superquadric Primitives [47.4]
SuperDecは、スーパークアッドリックプリミティブへの分解を通じてコンパクトな3Dシーン表現を作成するためのアプローチである。スーパークワッドリックに基づくコンパクトな表現が、様々なダウンストリームアプリケーションにどのように役立つかを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:29:35 GMT)
GeometryCrafter: Consistent Geometry Estimation for Open-world Videos with Diffusion Priors [47.2]
オープンワールドビデオから時間的コヒーレンスで高忠実度点マップシーケンスを復元する新しいフレームワークであるGeometryCrafterを提案する。 GeometryCrafterは最先端の3D精度、時間的一貫性、一般化能力を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:58:03 GMT)
Exploring the Collaborative Advantage of Low-level Information on Generalizable AI-Generated Image Detection [46.5]
既存のAI生成画像検出手法では、単一の低レベル情報しか考慮していない。異なる低レベル情報はしばしば異なる種類の偽造物に対する一般化能力を示す。適応型低レベルエキスパートインジェクションフレームワークを提案し、バックボーンネットワークが異なる低レベル情報から知識を受け入れて学習できるようにする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:38:08 GMT)
Attention-Guided Multi-scale Interaction Network for Face Super-Resolution [46.4]
CNNとTransformerハイブリッドネットワークは、顔超解像(FSR)タスクにおいて優れた性能を示した。マルチスケール機能を融合し、それらの相補性を促進する方法は、FSRの強化に不可欠である。本稿では,局所的およびグローバルな特徴相互作用とエンコーダとデコーダの位相的特徴相互作用を含む注意誘導型マルチスケールインタラクションネットワーク(AMINet)を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:21:48 GMT)
Beyond Wide-Angle Images: Unsupervised Video Portrait Correction via Spatiotemporal Diffusion Adaptation [46.2]
拡散モデルを用いた画像像補正フレームワークであるImagePDを提案する。トランスフォーマーの長距離認識と拡散モデルのマルチステップ認知を統合フレームワークに統合する。実験により,提案手法は既存の解よりも定量的に,質的に優れていることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:49:59 GMT)
Controllable Human Image Generation with Personalized Multi-Garments [46.0]
BootCompは、テキストから画像への拡散モデルに基づく新しいフレームワークである。本研究では,ヒトとマルチガーメントのペアからなる大規模な合成データセットを構築するためのデータ生成パイプラインを提案する。ファッションドメインにおいて、異なるタイプの参照ベース生成に適応することで、フレームワークの幅広い適用性を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:36:01 GMT)
Mixture-of-Attack-Experts with Class Regularization for Unified Physical-Digital Face Attack Detection [45.6]
現実のシナリオにおける顔認識システムは、デジタル攻撃と物理的攻撃の両方に影響を受けやすい。従来は包括的特徴空間を学習して分類を試みてきた。クラス認識正規化CLIPフレームワーク(FG-MoE-CLIP-CAR)を用いたファイングラインドMoEを提案する。 2つの統合物理デジタル攻撃データセットの実験結果から,提案手法がSOTA(State-of-the-art)性能を実現することを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:33:30 GMT)
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations [45.6]
我々はScholarCopilotを紹介した。ScholarCopilotは学術書記のための既存の大規模言語モデルを強化するために設計された統合フレームワークである。 ScholarCopilotは、検索トークン[RET]を生成して学術的な参照をいつ取得するかを決定し、その表現を利用してデータベースから関連する引用を検索する。効率を上げるために、単一のフレームワーク内で生成タスクと引用タスクの両方を共同で最適化します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:12:14 GMT)
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions [45.3]
包括的低レベル音声品質評価データセットであるQuariSpeechを紹介する。また,聴覚大言語モデルの低レベル音声理解能力を評価するために,QuariSpeech Benchmarkを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:33:53 GMT)
Hierarchical Procedural Framework for Low-latency Robot-Assisted Hand-Object Interaction [45.3]
本稿では,ロボット支援ハンドオブジェクトインタラクションを実現するための階層型手続きフレームワークを提案する。低レベルの調整階層は、継続的に更新された3Dハンドモデルを用いてロボットの動作を微調整する。リングウェアリングタスクのケーススタディは、医療や製造業などの補助技術への本研究の適用の可能性を示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:35:16 GMT)
Hierarchical analytical approach to universal spectral correlations in Brownian Quantum Chaos [45.0]
量子カオスの0次元ブラウンモデルにおけるスペクトル形状因子と時間外順序相関器の解析的アプローチを開発する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:59:55 GMT)
Controlling measurement-induced phase transitions with tunable detector coupling [45.0]
2つの競合する測定によって駆動される量子多体系の進化を研究する。システムと検出器間の可変結合による正の演算子値測定を用いる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:16:17 GMT)
DetailGen3D: Generative 3D Geometry Enhancement via Data-Dependent Flow [44.7]
DetailGen3Dは、生成された3D形状を強化するために特別に設計されたジェネレーティブなアプローチである。我々の重要な洞察は、潜在空間におけるデータ依存フローを通して、粗大から細小への変換を直接モデル化することである。改質時に正確な空間対応を確保するためのトークンマッチング戦略を導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:56:24 GMT)
Provable Guarantees for Nonlinear Feature Learning in Three-Layer Neural Networks [44.3]
3層ニューラルネットワークは,2層ネットワークよりも特徴学習能力が豊富であることを示す。この研究は、特徴学習体制における2層ネットワーク上の3層ニューラルネットワークの証明可能なメリットを理解するための前進である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:11:53 GMT)
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games [44.2]
本稿では,大規模言語モデル(LLM)と視覚言語モデル(VLM)のエージェント能力を評価する新しいベンチマークであるBALROGを紹介する。私たちのベンチマークでは、熟練していない人間が数秒で解決できるタスクや、習得に何年もかかるような極めて困難なタスクなど、さまざまな難易度を持つ既存の強化学習環境を取り入れています。より簡単なゲームでは,現行のモデルが部分的には成功しているが,より困難なタスクに苦しむことが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:45:22 GMT)
Beyond Quacking: Deep Integration of Language Models and RAG into DuckDB [44.1]
大規模言語モデル(LLM)により、このような検索と推論データパイプラインのプロトタイプがより簡単になった。これはしばしば、データシステムのオーケストレーション、データムーブメントの管理、低レベルの詳細処理を含む。我々はFlockMTLを紹介した。FlockMTLはLLM機能と検索拡張生成を深く統合した抽象化用拡張である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:48:17 GMT)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models [44.0]
我々は,大規模モデルの認知的マルチモーダル推論と問題解決能力を評価するために設計された新しいデータセットNTSEBenchを紹介する。データセットには2728の質問があり、合計4,642の画像が26種類に分類されている。これらの質問は、インドのNTSE試験から引き出され、視覚的およびテキスト的一般適性の問題が混在している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:25:53 GMT)
DG-TTA: Out-of-domain Medical Image Segmentation through Augmentation and Descriptor-driven Domain Generalization and Test-Time Adaptation [43.8]
ドメイン外の画像に事前訓練された深層学習セグメンテーションモデルを適用すると、品質の不足を予測できる。本研究では、拡張とともに強力な一般化記述子を用いて、ドメイン一般化事前学習とテスト時間適応を実現することを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:54:39 GMT)
GME: Improving Universal Multimodal Retrieval by Multimodal LLMs [43.5]
Universal Multimodal Retrieval (UMR) は、統一モデルを用いて様々なモダリティを探索することを目的としている。これまで、テキストデータのみを用いてUMRを実現するためにMLLM(Multimodal large language model)を採用してきた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:48:04 GMT)
Sample-level Adaptive Knowledge Distillation for Action Recognition [43.4]
知識蒸留(KD)は、訓練済みの大規模ネットワーク(教師)から知識を伝達することで、小さなネットワーク(学生)を学習することでニューラルネットワークを圧縮する本稿では,アクション認識のためのサンプルレベルの適応的知識蒸留フレームワークを提案する。 2つのビデオベンチマークと1つの画像ベンチマークの実験結果から,提案手法の優位性を実証した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:04:20 GMT)
Think Small, Act Big: Primitive Prompt Learning for Lifelong Robot Manipulation [43.4]
本稿では,再利用可能なロボットとプリミティブを用いて,生涯にわたるロボット操作を実現するプリミティブ・プロンプト・ラーニングを提案する。まず、マルチスキル事前学習段階を通じて、共有プリミティブを表現するプリミティブプロンプトのセットを学習する。新しいプロンプトは、凍結した事前訓練されたプロンプトで追加され、最適化される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:55:34 GMT)
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization [43.1]
ベクトル量子化(VQ)を用いたマスクド画像モデリング(MIM)は,自己教師付き事前学習と画像生成において大きな成功を収めている。本稿では,VQに基づく生成モデルにトークンマージ手法を組み込んで,画像生成と視覚表現学習のギャップを埋めるMergeVQを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:39:19 GMT)
ShortV: Efficient Multimodal Large Language Models by Freezing Visual Tokens in Ineffective Layers [42.9]
MLLM(Multimodal Large Language Models)はその巨大なサイズと多数の視覚トークンのために高い計算コストを被る。本稿では,レイヤの変換が視覚およびテキストトークンに与える影響を定量化する新しいメトリクスであるレイヤ貢献(LC)を紹介する。 LCを利用して非効率なレイヤを識別し,これらのレイヤの視覚的トークン更新を凍結する,トレーニング不要なShortVを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:47:55 GMT)
How does Watermarking Affect Visual Language Models in Document Understanding? [42.8]
視覚言語モデル(VLM)の性能に及ぼす透かしの影響を調べるための新しい評価フレームワークを提案する。実験の結果,VLMの性能は透かしによって著しく損なわれ,性能低下率は最大36%に達することがわかった。本研究は、文書理解のためのVLMの展開における重要な課題を強調し、透かし付き文書に頑健な推論機構を構築するための洞察を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:57:01 GMT)
HomeEmergency -- Using Audio to Find and Respond to Emergencies in the Home [42.2]
米国だけで、事故死は年間128,000人を超えている。我々の研究は、家庭の緊急事態に対処し、怪我や死を防ぐホームロボットを可能にすることを目的としている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:07:25 GMT)
Multi-Token Attention [42.0]
本稿では,複数クエリとキーベクトルを同時に重み付けできる新しいアテンション手法であるMulti-Token Attention (MTA)を提案する。提案手法は, 1つのベクトルの容量を超えるような, より豊かでニュアンスの高い情報を用いて, 関連するコンテキストを特定できる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:59:32 GMT)
FeatInsight: An Online ML Feature Management System on 4Paradigm Sage-Studio Platform [41.0]
FeatInsightは、機能設計、ストレージ、可視化、計算、検証、系統管理を含む、機能ライフサイクル全体をサポートするシステムである。 FeatInsightは4ParadigmのSage Studioプラットフォーム上で100以上の現実シナリオにデプロイされている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:39:45 GMT)
Generalization-aware Remote Sensing Change Detection via Domain-agnostic Learning [40.8]
変更検出のための一般化可能なドメイン非依存差分学習ネットワーク(DonaNet)を提案する。 DonaNetは、コード化された機能のドメイン固有のスタイルを取り除き、オブジェクトのクラス特性を強調することで、ドメインに依存しない表現を学ぶ。本稿では,潜在領域シフトを模倣する時間的一般化学習戦略を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:51:16 GMT)
Balancing Multi-Target Semi-Supervised Medical Image Segmentation with Collaborative Generalist and Specialists [40.7]
我々は,協力的ジェネリストと複数のスペシャリストからなる新しい手法をCGSと呼ぶ。それぞれのターゲットクラスにスペシャリストを雇うという考え方が中心であり、より大きなターゲットの優位性を避ける。理論的知見に基づいて,CGSがよりバランスの取れたトレーニングを達成できることを実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:52:12 GMT)
Hallucination of Multimodal Large Language Models: A Survey [40.7]
マルチモーダル大規模言語モデル(MLLM)は,多モーダルタスクにおいて顕著な進歩と顕著な能力を示した。これらの有望な発展にもかかわらず、MLLMは視覚的内容と矛盾する出力をしばしば生成する。本調査は,MLLMにおける幻覚の理解を深め,この分野のさらなる進歩を促すことを目的としている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:36:08 GMT)
Deconver: A Deconvolutional Network for Medical Image Segmentation [40.7]
本稿では,U字型アーキテクチャの中核となる学習可能なコンポーネントとして,画像復元から従来のデコンボリューション技術を統合する新しいネットワークであるDeconverを紹介する。デコンバーは計算コストのかかる注意機構を非負の効率的なデコンボリューション操作に置き換える。これは、DiceスコアとHausdorff距離における最先端のパフォーマンスを達成し、主要なベースラインと比較して計算コスト(FLOP)を最大90%削減する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:11:04 GMT)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.1]
我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。 FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。 FoTは、最も関連性の高い推論パスを選択するためにスパースアクティベーション戦略を採用し、効率と精度の両方を改善している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:48:43 GMT)
CoRanking: Collaborative Ranking with Small and Large Ranking Agents [40.0]
大規模言語モデル(LLM)は、優れたリストワイドランキング性能を示している。 CoRankingは、小規模と大規模なランキングモデルを組み合わせて、効率的かつ効果的なランク付けを行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:24:42 GMT)
UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering [39.8]
nameは、パーソナライズのための大きな言語モデルを促進するために、ユーザ埋め込みの有効性を評価するために設計されたベンチマークである。ユーザ埋め込みをモデル化するための様々な最先端手法について広範な実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:18:34 GMT)
Process or Result? Manipulated Ending Tokens Can Mislead Reasoning LLMs to Ignore the Correct Reasoning Steps [39.8]
入力推論チェーンの微妙なエラーに対するモデル推論の脆弱性について検討する。この脆弱性は、操作された計算結果を含む推論トークンが提示されたモデルが正しい推論ステップを無視し、その代わりに誤った結果を採用する傾向がある。我々の研究は、推論の堅牢性を理解することを強化し、推論集約アプリケーションに対するセキュリティ上の配慮を強調します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:07:54 GMT)
MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs [39.7]
高品質な医療推論データセットであるMedReasonを紹介する。我々のパイプラインは7つの医学データセットから様々な医学的質問の詳細な推論を生成する。私たちの最高のパフォーマンスモデルであるMedReason-8Bは、最先端の医療推論モデルであるHuatuo-o1-8Bを、臨床ベンチマークMedBulletsで最大4.2%上回っています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:31:44 GMT)
Towards shutdownable agents via stochastic choice [39.6]
グリッドワールドをナビゲートするための単純なエージェントを訓練するために、DReST報酬関数を使用します。これらのエージェントは、USEFULとNEUTRALで学ぶことができる。我々の理論的研究は、これらのエージェントが有用でシャットダウン可能であることを示唆している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:27:34 GMT)
Visual Acoustic Fields [39.4]
本研究では,3次元空間内の音や視覚信号をブリッジするフレームワークであるVisual Acoustic Fieldsを提案する。提案手法は,音生成と音像定位という2つの重要なモジュールを特徴とする。私たちの知る限りでは、これが3Dコンテキストで視覚信号と音響信号を接続する最初のデータセットです。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:16:38 GMT)
Scaling Prompt Instructed Zero Shot Composed Image Retrieval with Image-Only Data [39.2]
Composed Image Retrieval (CIR)は、テキストに付加された参照画像と一致する画像を取得するタスクである。画像とテキストのモダリティを効果的に組み合わせた埋め込み型再構成アーキテクチャを提案する。 InstructCIRというモデルでは、CIRRおよびFashionIQデータセット上のゼロショット合成画像検索において、最先端の手法よりも優れています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:03:46 GMT)
Taxonomizing Representational Harms using Speech Act Theory [38.4]
本稿では, 生成言語システムによって引き起こされる表現的害を, 特定の種類の食行為の迫害効果(即ち実世界の影響)として概念化する枠組みを提案する。次に、我々の枠組みを用いて、表現的害を引き起こす食行為のきめ細かい分類法を開発する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:00:17 GMT)
Can LLMs Assist Computer Education? an Empirical Case Study of DeepSeek [38.3]
本研究は,中国のネットワーク技術者によるコンピュータネットワークセキュリティに関するシミュレーション質問と実世界調査の両方を用いている。これらの結果は、プロンプトがロール定義を含むか否かに関わらず、モデルが一貫して機能することを示す。 DeepSeek-V3はネットワークセキュリティ教育にかなりの実用的価値を提供するが、マルチモーダルデータを処理する能力には課題がある。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:58:16 GMT)
Data Synthesis with Diverse Styles for Face Recognition via 3DMM-Guided Diffusion [37.8]
アイデンティティ保護顔合成は、仮想被験者の合成顔画像を生成することを目的としており、現実のデータを代用して顔認識モデルを訓練する。先行芸術は、一貫したアイデンティティと多様なスタイルでイメージを作成しようとするが、それらは両者のトレードオフに直面している。本稿では拡散型フェイスジェネレータであるMorphFaceを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:22:53 GMT)
Efficient Semantic Segmentation via Lightweight Multiple-Information Interaction Network [37.8]
リアルタイムセマンティックセグメンテーションのための軽量多情報インタラクションネットワーク(LMIINet)を提案する。 0.72Mのパラメータと11.74GのFLOPしか持たず、LMIINetは精度と効率のバランスを保っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:14:22 GMT)
Adaptive Federated Learning with Functional Encryption: A Comparison of Classical and Quantum-safe Options [37.8]
Federated Learning(FL)は、機械学習モデルをトレーニングするための協調的な方法である。 FLは、共有パラメータを利用してプライベートトレーニングデータを明らかにするリコンストラクション攻撃に対して脆弱である。 MLベースのネットワーク侵入検知システムのトレーニングのための最近のFL実装にMIFEを適用した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:18:06 GMT)
Dissipation and non-thermal states in cryogenic cavities [37.7]
室温環境に囲まれた低温鏡で作製した低温キャビティ中の光子の特性について検討した。リンドブラッドマスター方程式を用いて、キャビティモードの光子分布と統計的性質を導出する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:49:47 GMT)
Can LLMs Grasp Implicit Cultural Values? Benchmarking LLMs' Metacognitive Cultural Intelligence with CQ-Bench [37.6]
CQ-Benchは、大きな言語モデルの暗黙の文化的価値を推測する能力を評価するために設計されたベンチマークである。我々は、World Value SurveyとGlobalOpinionsデータセットの値を用いて、マルチ文字の会話ベースのストーリーデータセットを生成する。 o1モデルとDeepseek-R1モデルは、値選択において人間レベルのパフォーマンスに達するが、それでもニュアンスな姿勢検出では不足している。 GPT-4o-miniとo3-miniのスコア0.602と0.598は、オープンエンドの文化的推論の難しさを浮き彫りにした。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:54:47 GMT)
Robust Bayesian Optimization via Localized Online Conformal Prediction [37.5]
局所化オンライン共形予測に基づくベイズ最適化(LOCBO)を導入する。 LOCBOは局所オンライン共形予測(CP)によりGPモデルを校正する観測対象関数を保留するLOCBOのイテレートについて理論的性能保証を行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:58:45 GMT)
Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models [35.9]
テキスト・トゥ・イメージ(T2I)モデルは、しばしばセマンティック・リーク、不正確な特徴バインディング、生成した画像における重要な概念の欠落といった問題に悩まされる。本研究は,テキストトークン表現間の情報フローの役割を考察することによって,これらの現象を研究する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:17:44 GMT)
Efficient Construction of Model Family through Progressive Training Using Model Expansion [35.7]
本稿では,進行学習によるモデルファミリの効率的な構築法を提案する。本手法は,独立に訓練されたモデルに匹敵する性能を維持しつつ,計算コストを約25%削減する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:21:52 GMT)
GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning [35.4]
我々は、コード検証を伴う明示的なChain-of-Thought(CoT)推論を行う生成プロセス報酬モデルGenPRMを紹介する。実験の結果,GenPRMはMATHデータセットから23Kのトレーニングデータしか得られず,従来のPRMよりも有意に優れていた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:21:05 GMT)
Efficient Near-Optimal Algorithm for Online Shortest Paths in Directed Acyclic Graphs with Bandit Feedback Against Adaptive Adversaries [34.4]
本稿では,適応的相手に対する帯域フィードバックの下で,有向非巡回グラフ(DAG)における最短経路問題について検討する。我々は,任意の適応的敵に対して高い確率で$tilde O(sqrt|E|Tlog |X|)$の最小限の最小残差を求めるアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:35:42 GMT)
SPF-Portrait: Towards Pure Portrait Customization with Semantic Pollution-Free Fine-tuning [33.7]
SPF-Portraitは、テキスト駆動のポートレートカスタマイズにおいてセマンティックな汚染を排除しつつ、カスタマイズされたセマンティクスを純粋に理解する先駆的な研究である。筆者らはSPF-Portraitにおいて,従来の微調整パスの参照としてオリジナルのモデルを導入したデュアルパスパイプラインを提案する。本稿では,ターゲットセマンティクスの応答領域を正確に表現するセマンティック・アウェア・ファイン・コントロール・マップを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:37:30 GMT)
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning [33.4]
VideoMindは、ビデオ理解のための新しいビデオ言語エージェントである。ビデオの時間的推論に不可欠な機能を特定し,ロールベースのエージェントワークフローを開発する。軽量なLoRAアダプタによるシームレスなロールスイッチングを実現する新しいChain-of-LoRA戦略を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:49:08 GMT)
Improving Complex Reasoning with Dynamic Prompt Corruption: A soft prompt Optimization Approach [33.3]
本稿では,複雑な推論タスクにおけるソフトプロンプトの利点を活かすために,動的プロンプト破壊(DPC)を提案する。まず、Dynamic Triggerはソフトプロンプトの影響を測定し、有益か有害かを特定する。次に、動的破壊は、推論プロセスに干渉するキートークンを選択的にマスキングすることにより、ソフトプロンプトの負の効果を緩和する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:04:25 GMT)
Sharp Rates in Dependent Learning Theory: Avoiding Sample Size Deflation for the Square Loss [33.2]
L2$ と $Psi_p$ の位相が我々の仮説クラス $mathscrF$, $mathscrF$ に同値であるときにいつでも、$mathscrF$ は弱準ガウス類であることを示す。以上の結果から, 混合への直接的な依存は高次項に還元されるため, この問題は実現可能か否かを判断できる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:59:35 GMT)
Content-decoupled Contrastive Learning-based Implicit Degradation Modeling for Blind Image Super-Resolution [33.2]
急激な劣化モデルに基づくブラインド・スーパーレゾリューション(SR)は、コミュニティで注目を集めている。本稿では,CdCL(Content-decoupled Contrastive Learning-based blind image super- resolution)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:11:25 GMT)
A planar rotor trapped and coupled to the vibrational modes of an ion crystal [33.0]
平面ローターは、ポールトラップ内の原子イオンとともに分子イオンまたは荷電ナノ粒子を閉じ込めることで実現される。電気双極子モーメントを有する分子イオンまたは荷電ナノ粒子の場合, トラップ内の一般的な振動運動のモードに結合する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:48:15 GMT)
Learned Image Compression with Dictionary-based Entropy Model [33.0]
エントロピーモデルは学習画像圧縮において重要な役割を果たす。既存の手法のほとんどは、エントロピーモデルを形成するためにハイパープライアおよび自動回帰アーキテクチャを使用した。辞書に基づくクロスアテンションエントロピーモデルという新しいエントロピーモデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:43:10 GMT)
GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments [32.9]
GraphMasterは、データ制限された環境でグラフデータ合成用に特別に設計された最初のマルチエージェントフレームワークである。我々は6つの標準グラフベンチマークの「サブ」変種を新たに開発し、現実的な制約下での合成能力を試験するために特別に設計した。また,人間の評価とグラスマン多様体に基づく解析を併用した新しい解釈可能性評価フレームワークを開発した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:21:50 GMT)
ADGaussian: Generalizable Gaussian Splatting for Autonomous Driving with Multi-modal Inputs [32.9]
本稿では,ADGaussianと呼ばれる新しいアプローチを提案する。提案手法は,シングルビュー入力による高品質なレンダリングを実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:40:23 GMT)
Dual Diffusion for Unified Image Generation and Understanding [32.8]
マルチモーダル理解と生成のための大規模かつ完全なエンドツーエンド拡散モデルを提案する。我々は、画像とテキストの条件付き確率を同時にトレーニングするクロスモーダル最大推定フレームワークを活用する。我々のモデルは、最近の統合画像理解・生成モデルと比較して、競争性能が向上した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:09:34 GMT)
Data-free Knowledge Distillation with Diffusion Models [32.6]
Data-Free Knowledge Distillation (DFKD)は、教師のニューラルネットワークからの知識を、トレーニングデータへのアクセスを必要とせずに、学生のニューラルネットワークに転送することができる。本稿では拡散モデルに基づく新しい手法DiffDFKDを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:00:33 GMT)
STORYSUMM: Evaluating Faithfulness in Story Summarization [31.9]
本稿では,局所的な忠実度ラベルと誤り説明を含む短編を収録した新しいデータセットであるSTORYSUMMを紹介する。このベンチマークは、あるメソッドが挑戦的な不整合を検出できるかどうかをテストする評価方法である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:54:54 GMT)
FedORGP: Guiding Heterogeneous Federated Learning with Orthogonality Regularization on Global Prototypes [31.9]
フェデレートラーニング(FL)は、分散機械学習に不可欠なフレームワークとして登場した。現在のアプローチでは、クラスを分離する際の制限に直面している。本稿では,クラス内プロトタイプの類似性を奨励し,クラス間角分離を拡大するFedtFLORGを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:50:15 GMT)
RECKON: Large-scale Reference-based Efficient Knowledge Evaluation for Large Language Model [31.7]
大規模言語モデル(RECKON)の大規模参照に基づく効率的な知識評価 RECKONは、構造化されていないデータを管理可能なユニットに整理し、クラスタ毎にターゲットの質問を生成する。実験の結果,RECKONは従来の手法に比べて資源消費量を56.5%削減することがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:08:04 GMT)
V2V-LLM: Vehicle-to-Vehicle Cooperative Autonomous Driving with Multi-Modal Large Language Models [31.5]
本稿では,多モード大規模言語モデルと協調自律運転を統合した新しい問題設定を提案する。また,V2V-LLM(V2V-LLM)のベースライン手法を提案する。実験結果から,提案するV2V-LLMは,協調運転における様々なタスクを遂行する上で,有望な統一モデルアーキテクチャとなる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:13:32 GMT)
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes [30.9]
複雑なビジュアルテキスト生成(CVTG)は、視覚画像内の様々な領域に分散した複雑なテキストコンテンツを生成することに焦点を当てている。 InGでは、画像生成モデルはしばしば歪んだ、ぼやけたビジュアルテキストをレンダリングするか、あるいは視覚的なテキストを欠いている。我々は,新しいマルチビジュアルテキストレンダリング手法であるTextCrafterを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:56:45 GMT)
Information Retrieval for Climate Impact [30.7]
このワークショップは、学術、産業、政府、NGOの研究者を集めてコラボレーションを促進することを目的としている。このワークショップは、気候変動の影響を評価するための情報検索のための技術研究アジェンダの開発に貢献することに興味を持つ研究者や実践者の多様な集まりを集めた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:01:06 GMT)
Agent S2: A Compositional Generalist-Specialist Framework for Computer Use Agents [30.3]
コンピュータ利用エージェントは、コンピュータやモバイルデバイスのグラフィカルユーザインタフェース(GUI)と直接対話することで、デジタルタスクを自動化する。本稿では,様々なジェネラリストおよびスペシャリストモデルにまたがって認知的責任を委譲する新しい構成フレームワークであるAgens S2を紹介する。 Agent S2は、3つの著名なコンピュータ使用ベンチマーク上でのSOTA(State-of-the-art)のパフォーマンスを確立する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:40:27 GMT)
Hybrid Global-Local Representation with Augmented Spatial Guidance for Zero-Shot Referring Image Segmentation [30.2]
本研究では,周辺地域の文脈情報と詳細なマスク特化特徴を統合した,訓練不要でハイブリッドなグローバルな特徴抽出手法を提案する。標準RISベンチマーク実験により,本手法は既存のゼロショットRISモデルよりも大幅に優れていることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:13:39 GMT)
ToReMi: Topic-Aware Data Reweighting for Dynamic Pre-Training Data Selection [30.0]
ToReMiは、トピックの関連や観察された学習パターンに応じてトレーニングサンプル重量を調整する新しいフレームワークである。実験の結果,ToReMiの変種は従来の事前学習手法よりも優れた性能が得られることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:06:42 GMT)
MixerMDM: Learnable Composition of Human Motion Diffusion Models [30.0]
そこで,MixerMDMを紹介した。これは,事前学習されたテキスト条件付き人間の動き拡散モデルを組み合わせるための,最初の学習可能なモデル合成手法である。 MixerMDM を用いて1人・複数人の動作拡散モデルを組み合わせることにより、各人の動態を細かく制御する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:59:44 GMT)
Zero-Shot 4D Lidar Panoptic Segmentation [29.9]
SAL-4D(Segment Anything in Lidar--4D)は,市販のヴィジュアル・ランゲージ基礎モデルとともにビデオショットオブジェクト(VOS)の開発をLidarに蒸留する手法である。我々はVOSモデルを用いて、短いビデオシーケンスの擬似ラベルトラックレット、シークエンスレベルのCLIPシークエンスを持つトラックレットを4D Lidar空間に持ち上げ、マルチモーダルセンシング装置を用いてそれらをSAL-4Dモデルに蒸留する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:36:12 GMT)
ToVE: Efficient Vision-Language Learning via Knowledge Transfer from Vision Experts [29.4]
視覚言語(VL)学習は、広範囲な視覚知覚能力を必要とする。最近の研究は通常、これらの機能を開発するために、巨大なデータセット上の巨大なモデルをトレーニングすることに頼っている。本稿では,ビジョンエキスパートのハブから知識を伝達する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:02:40 GMT)
IDMR: Towards Instance-Driven Precise Visual Correspondence in Multimodal Retrieval [29.1]
インスタンス駆動型マルチモーダル画像検索(IDMR)は、テキスト記述シナリオにマッチしながら、クエリイメージと同じインスタンスを含む画像を取得するモデルを必要とする、新しいタスクである。この能力をベンチマークするために,実世界の物体追跡と一対一のビデオデータを用いたIDMRベンチを開発した。我々のMultimodal Large Language Model(MLLM)に基づく検索モデルは、1.2Mサンプルに基づいて訓練され、従来のベンチマークとゼロショットIDMRベンチの両方で最先端のアプローチより優れている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:47:20 GMT)
Visual Environment-Interactive Planning for Embodied Complex-Question Answering [28.9]
本研究は, Embodied Complex-Question Answeringタスクに焦点をあてる。このタスクの中核は、視覚環境の知覚に基づいて適切な計画を立てることにある。本稿では,多段階計画を考えると,計画を逐次的に定式化するための枠組みを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:26:28 GMT)
RainyGS: Efficient Rain Synthesis with Physically-Based Gaussian Splatting [28.6]
オープンワールドシーンにおける動的降雨効果を物理的精度で生成する新しい手法であるRainyGSを紹介した。提案手法の核となるのは,高速な3DGSレンダリングフレームワークにおいて,物理的雨滴と浅水シミュレーション技術の統合である。本手法は,30fps以上の降雨効果の合成をサポートし,降雨強度を柔軟に制御する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:06:36 GMT)
Exploring Scene Affinity for Semi-Supervised LiDAR Semantic Segmentation [28.5]
本稿では,運転シーンにおける半教師付きLiDARセマンティックセマンティックセグメンテーションのためのシーン親和性,すなわちシーン内一貫性とシーン間相関について検討する。 AISceneは教師教育を採用し、教師ネットワークを用いて、未ラベルのデータから擬似ラベル付きシーンを生成し、学生ネットワークの学習を監督する。実験の結果、AISceneは4つの設定で2つの人気のあるベンチマークで過去の手法よりも優れており、最も困難な1%のラベル付きデータにおいて1.9%と2.1%の顕著な改善を達成している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:31:12 GMT)
ConsistencyDet: A Few-step Denoising Framework for Object Detection Using the Consistency Model [28.2]
本稿では,物体検出を認知拡散過程として記述するための新しいフレームワークを提案する。 textbfConsistencyDetと呼ばれるこのフレームワークは、Consistency Modelとして知られる革新的な概念を活用している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:46:03 GMT)
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications [28.2]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、現実のアプリケーションへの移行には限界がある。本稿では、パーソナライズされたアライメントに関する最初の包括的調査を示す。本稿では、優先メモリ管理、パーソナライズされた生成、フィードバックに基づくアライメントを含む統合されたフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:33:19 GMT)
HumanDreamer: Generating Controllable Human-Motion Videos via Decoupled Generation [28.0]
本稿では、まずテキストプロンプトから多様なポーズを生成する、疎結合なヒューマンビデオ生成フレームワークを提案する。我々は、テキストプロンプトから構造化された人間のポーズを生成するためにトレーニングされたMotionDiTを提案する。さまざまなPose-to-Videoベースラインにわたる実験により,提案手法によって生成されたポーズが,多種多様な高品質な人力動画を生成できることが実証された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:43:35 GMT)
ActiveGAMER: Active GAussian Mapping through Efficient Rendering [27.9]
ActiveGAMERは3Dガウススプラッティング(3DGS)を利用して高品質でリアルタイムなシーンマッピングと探索を実現するアクティブマッピングシステムである。我々のシステムは、最先端のレンダリングと光度精度と完全性で環境を自律的に探索し、再構築する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:34:15 GMT)
Collaborative LLM Numerical Reasoning with Local Data Protection [27.8]
2つの重要な革新を伴うモデルコラボレーションフレームワークを提示します。コンテキスト対応合成戦略は、論理的一貫性を維持しながらクエリドメインをシフトする。ツールベースの回答再構成アプローチでは、リモート生成した問題解決パターンをコードスニペットで再利用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:02:25 GMT)
Mixture-of-Experts for Distributed Edge Computing with Channel-Aware Gating Function [27.4]
無線分散MoEのための新しいチャネル認識ゲーティング機能を提案する。我々は,各専門家の通信チャネルに対する各種信号対雑音比(SNR)をシミュレートし,これらのSNRに基づいて専門家に配布される特徴に雑音を加える。ゲーティング関数は、専門家の選択を最適化するために、機能とSNRの両方を利用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:05:44 GMT)
UnIRe: Unsupervised Instance Decomposition for Dynamic Urban Scene Reconstruction [27.3]
シーンを静的な背景と個々の動的インスタンスに分解する3D Splatting (3DGS)ベースのアプローチであるUnIReを提案する。中心となる4Dスーパーポイントは、多フレームLiDAR点を4D空間にクラスタ化する新しい表現である。実験により,本手法は動的シーン再構成において,高精度かつ柔軟なインスタンスレベルの編集を可能にしながら,既存の手法よりも優れた性能を示すことが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:15:58 GMT)
A Survey on Unlearnable Data [27.3]
Unlearnable Data(ULD)は、機械学習モデルが特定のデータから意味のあるパターンを学ぶのを防ぐ革新的な防御技術として登場した。我々は、異なるUDLアプローチを比較し、比較し、その強み、制限、および非学習性、不受容性、効率、堅牢性に関連するトレードオフを分析します。本稿では, モデル劣化に伴う摂動不感のバランスや, ULD生成の計算複雑性など, 重要な課題について論じる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:42:45 GMT)
Forward Learning with Differential Privacy [27.2]
そこで我々は,DP-ULR(Disdifferial Private Unified Likelihood Ratio)という,ブループライエタリな前方学習アルゴリズムを提案する。提案実験により,DP-ULRは,バックプロパゲーションに基づく従来の差分プライバシートレーニングアルゴリズムと比較して,競争性能が向上することが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:14:53 GMT)
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods [27.0]
拡散モデル(FDiff)の特徴分散のためのトレーニングフレームワークを提案する。本稿では,拡散モデルの現実性を高め,制御性を高める2つのサンプリング手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:50:35 GMT)
FastLloyd: Federated, Accurate, Secure, and Tunable $k$-Means Clustering with Differential Privacy [26.9]
本稿では,プライバシー保護のための$k$-meansクラスタリングの問題について検討する。セキュアな計算を使った既存のアプローチは、かなりのオーバーヘッドに悩まされ、出力のプライバシを提供しない。計算DPモデルを用いて,軽量でセキュアな集約型アプローチを設計する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:45:51 GMT)
GECKO: Gigapixel Vision-Concept Contrastive Pretraining in Histopathology [26.8]
本稿では,Gigapixel Vision-Concept Knowledge Contrastive Pretrainingを提案する。 Whole Slide Image (WSI)レベルの埋め込みとConcept Priorを一致させる。単調かつ多モーダルな事前訓練アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:49:59 GMT)
Near Field Localization via AI-Aided Subspace Methods [26.8]
NF-SubspaceNetは深層学習で強化された2次元MUSICアルゴリズムで,サロゲート共分散行列を学習し,挑戦条件下での局所化を改善する。また,学習のためのAIモデルとして,近接場部分空間法を鋳造することと組み合わせて,情報源数を正確に推定する新しいモデル順序対応訓練手法を開発した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:57:01 GMT)
Enhancing Fundus Image-based Glaucoma Screening via Dynamic Global-Local Feature Integration [26.7]
特徴抽出のための最適境界を自律的に決定する自己適応型注意窓を提案する。また,グローバルな特徴とローカルな特徴を,特徴線形読み出しによって効果的に融合するマルチヘッドアテンション機構を導入する。緑内障の分類において,本手法が優れた精度とロバスト性を実現することを示す実験結果が得られた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:28:14 GMT)
Prethermalization by Random Multipolar Driving on a 78-Qubit Superconducting Processor [26.7]
可変加熱速度多体系における長寿命予熱相の実験的観察を報告する。 78キュービットと137カプラの2次元構成で、遠方から平衡加熱のダイナミクスはシミュレーションの範囲を超えている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:23:17 GMT)
FA^{3}-CLIP: Frequency-Aware Cues Fusion and Attack-Agnostic Prompt Learning for Unified Face Attack Detection [26.6]
顔認識システムは物理的(例えば印刷された写真)やデジタル(例えばディープフェイク)の顔攻撃に対して脆弱である。既存の手法では、クラス内の大きなバリエーションにより、物理的およびデジタル攻撃を同時に検出するのに苦労している。本稿では、FAsupertextscript3-CLIP(FAsupertextscript3-CLIP)と呼ばれる攻撃検出モデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:19:50 GMT)
Prior Learning in Introspective VAEs [26.5]
変分オートエンコーダ(VAE)は教師なし学習とデータ生成のための一般的なフレームワークである。本研究では,Soft-IntroVAEに着目し,マルチモーダルで学習可能なフレームワークをこのフレームワークに組み込むことの意味について検討する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:18:54 GMT)
AP-CAP: Advancing High-Quality Data Synthesis for Animal Pose Estimation via a Controllable Image Generation Pipeline [26.5]
本稿では,動物ポーズ推定のための新しい制御可能な画像生成パイプライン,AP-CAPを提案する。このパイプライン内では、期待されたポーズで画像を合成できるマルチモーダル動物画像生成モデルを導入する。さらに, マルチソース表現を統合するモダリティ・フュージョン・アニマル画像合成戦略, 多様なポーズを動的に捉えるポス・アジャイメント・アニマル画像合成戦略, 視覚的セマンティック理解を強化するキャピオン・エンハンスメント・アニマル画像合成戦略の3つの革新的戦略を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:28:29 GMT)
Coca-Splat: Collaborative Optimization for Camera Parameters and 3D Gaussians [26.4]
Coca-Splatは、スパースビューのポーズレスシーン再構築と新規ビュー合成(NVS)の課題に対処する新しいアプローチである変形検出TRansformerにインスパイアされ、3次元ガウスおよびカメラパラメータの別クエリを設計する。変形可能なトランスフォーマー層を通じて層ごとにレイヤを更新し、単一のネットワークで共同最適化を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:48:46 GMT)
Z1: Efficient Test-time Scaling with Code [26.4]
大規模言語モデル(LLM)は、テスト時間コンピューティングのスケーリングを通じて、複雑な問題解決を実現することができる。本稿では,LLMをコード関連推論軌道上で学習する効率的なテスト時間スケーリング手法を提案する。オーバヘッドを過度に考慮する新しいシフトドシンキングウィンドウを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:01:50 GMT)
WorldScore: A Unified Evaluation Benchmark for World Generation [26.3]
我々は、ワールドジェネレーションのための最初の統一ベンチマークであるWorldScoreベンチマークを紹介する。 WorldScoreベンチマークには3000のテストサンプルのキュレートされたデータセットが含まれている。 WorldScoreのメトリクスは,3つの重要な側面 – 可制御性,品質,ダイナミック性 – を通じて生成された世界を評価します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:20:23 GMT)
MARIOH: Multiplicity-Aware Hypergraph Reconstruction [26.1]
エッジ乗法を利用して,投影されたグラフからオリジナルのハイパーグラフを再構成するための教師付きアプローチであるMARIOHを提案する。 10個の実世界のデータセットを用いた実験で,MARIOHは最先端の手法と比較して最大74.51%高い再現精度を達成した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:14:59 GMT)
Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs [25.9]
大規模言語モデル(LLM)は、大量のテキストコーパスの事前学習を通じて、強い推論と記憶能力を示す。これはプライバシーと著作権侵害のリスクを生じさせ、効率的な機械学習手法の必要性を強調している。 LLMの堅牢かつ効率的なアンラーニングを可能にする新しいフレームワークであるLoKUを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:53:30 GMT)
Enhancing the Robustness of LLM-Generated Code: Empirical Study and Framework [25.8]
RobGenは、モデルの再トレーニングを必要とせずに、コードの堅牢性を高めるように設計されたフレームワークである。 RobGenは、ロバストなモデル生成コードの比率を20.0%削減する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:06:38 GMT)
Mr. DETR: Instructive Multi-Route Training for Detection Transformers [25.8]
モデルをマルチタスクフレームワークとして扱い、同時に1対1と1対マニーの予測を行う。本研究では,一対一予測のための一次経路と,一対多予測のための2つの補助訓練経路を特徴とする多経路学習機構を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:32:36 GMT)
Monocular and Generalizable Gaussian Talking Head Animation [25.7]
単分子および一般化可能なガウス音声頭部アニメーション(MGGTalk)を紹介する。 MGGTalkはモノラルなデータセットを必要とし、パーソナライズされた再トレーニングをすることなく、未確認のIDに一般化する。我々は,MGGTalkが従来の最先端手法を超越し,様々な指標において優れた性能を発揮することを実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:16:52 GMT)
Explorable INR: An Implicit Neural Representation for Ensemble Simulation Enabling Efficient Spatial and Parameter Exploration [25.6]
現在のサロゲートモデルは、ポイントまたはリージョンベースの予測の柔軟性に欠ける。暗黙的ニューラル表現に基づくサーロゲートモデルであるExplorable INRを提案する。本研究では,空間探索とパラメータ探索を併用したExplorable INRにより,計算とメモリコストを大幅に削減できることを実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:33:28 GMT)
Example-Based Concept Analysis Framework for Deep Weather Forecast Models [25.6]
本研究では,類似の推論プロセスに従う事例を対象モデルにおける対象インスタンスとして識別する,実例に基づく概念分析フレームワークを開発する。本フレームワークは,気象メカニズムの曖昧さを解消するための概念割り当ての確率を含む,視覚的および概念的に類似した例をユーザに提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:22:41 GMT)
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation [25.5]
音声品質評価には、平均世論スコア(MOS)や話者類似度(SIM)など、複数の側面から音声を評価する必要があるのが一般的である。本稿では,最近導入された聴覚大言語モデル(LLM)を音声品質自動評価に活用することを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:35:25 GMT)
FairCoder: Evaluating Social Bias of LLMs in Code Generation [25.4]
コード生成における社会的バイアスを評価するための新しいベンチマークであるFairCoderを紹介する。このベンチマークでは、フェアネスのパフォーマンスを評価するために、3つのメトリクスが設計されている。その結果、全てのLSMが社会的偏見を示すことが明らかとなった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:17:32 GMT)
Low-Rank Thinning [25.3]
準ガウス的シンニングアルゴリズムは、一様サブサンプリングの品質に匹敵するが、サマリーポイントの数を著しく削減できる。既存の保証は、制限された分布範囲とカーネルベースの品質尺度のみをカバーし、悲観的な次元依存に悩まされている。本稿では, カーネルやデータマトリックスがほぼ低ランクである場合に, 高品質な圧縮を保証し, 任意の分布および任意のカーネルに適用可能な, サブガウス薄膜の新しい低ランク解析法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:36:49 GMT)
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data [24.8]
安全でないLMを生成するために無害なデータを使用する既存の攻撃は、応答の最初の数個のトークンでモデル拒絶を除去することに依存していることを示す。我々は、LMの定式的拒絶機構を利用して有害な応答を誘発する新たなデータ汚染攻撃、No, course, I Can Execute' (NOICE)について述べる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:57:07 GMT)
Zero-shot Benchmarking: A Framework for Flexible and Scalable Automatic Evaluation of Language Models [24.5]
タスクごとに高品質なベンチマークを作成するためのフレームワークであるZero-shot Benchmarking (ZSB)を提案する。 ZSBはシンプルで柔軟性があり、データ生成のためのプロンプトの作成と評価のためのプロンプトのみを必要とする。実際のデータを収集する作業や言語には、費用がかかるか実用的でない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:40:08 GMT)
Efficient LLaMA-3.2-Vision by Trimming Cross-attended Visual Features [24.3]
我々は、相互注意マップにおけるスパースの性質を利用して、冗長な視覚的特徴を選択的に創り出す。我々のモデルは、ベンチマークパリティを達成しながら、推論レイテンシとメモリ使用量を減らすことができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:10:32 GMT)
The Illusionist's Prompt: Exposing the Factual Vulnerabilities of Large Language Models with Linguistic Nuances [23.9]
大規模言語モデル(LLM)は、専門家でないユーザによるリアルタイム情報ソースとしてますます頼りになってきている。 The Illusionist's Promptは,言語的ニュアンスを敵対的クエリに組み込んだ,新たな幻覚攻撃である。我々の攻撃は、ユーザーの意図や意味を保ちながら、内部の事実的誤りを誘発する高度に伝達可能なイラストルプロンプトを自動生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:10:00 GMT)
Investigating Large Language Models in Diagnosing Students' Cognitive Skills in Math Problem-solving [23.8]
本研究では,現在最先端の大規模言語モデルが,数学における生徒の認知能力をどのように診断するかを検討する。 110の中学校数学問題に対する639の学生回答からなる新しいベンチマークデータセットであるMathCogを構築した。評価の結果,現在最先端のLCMでもF1スコアは0.5以下であり,誤った症例に対して強い虚偽の信頼感を示す傾向にあることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:29:41 GMT)
UniFlow: A Foundation Model for Unified Urban Spatio-Temporal Flow Prediction [23.8]
都市インフラの最適化と交通災害対応管理には,都市時流予測が不可欠である。従来のアプローチは、グリッドベースのデータまたはグラフベースのデータに合わせた、別々のモデルに依存してきた。本稿では,グリッドベースのグラフベースデータを統一した一般都市流予測モデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:32:13 GMT)
MetaLoRA: Tensor-Enhanced Adaptive Low-Rank Fine-tuning [23.7]
Low-Rank Adaptation (LoRA) は有望なパラメータ効率の微調整法として登場した。現在のLoRAの変種は、動的パラメータ調整とメタ学習能力の重要性を克服しながら、一般的なパラメータの削減に重点を置いている。本研究は,タスク関係をモデル化するためのLoRA生成手法を提案し,新しいパラメータ効率適応フレームワークであるMetaLoRAを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:34:26 GMT)
MPDrive: Improving Spatial Understanding with Marker-Based Prompt Learning for Autonomous Driving [23.0]
マーカベースのPmpt Learning framework (MPDrive) は、簡潔な視覚マーカーによる空間座標を表す。 MPDriveは、特に高度な空間的理解を必要とする場合に、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:49:39 GMT)
VisRL: Intention-Driven Visual Perception via Reinforced Reasoning [22.9]
本稿では、意図駆動型視覚知覚の問題に強化学習(RL)を適用した最初のフレームワークであるVisRLを提案する。中間焦点選択を試行錯誤によって最適化した内部決定として扱うことにより,コストのかかる領域アノテーションの必要性を解消する。提案手法は強いベースラインを常に上回り,その有効性と,異なるLMM間での強い一般化の両立を実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:23:59 GMT)
ZETA: Leveraging Z-order Curves for Efficient Top-k Attention [22.9]
本稿では,全シーケンスに対する過去のトークンの並列クエリを可能にするZETAを提案する。 ZETA は合成textscMulti-Query Associative Recall タスクにおける標準注意性能と一致する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:41:35 GMT)
Is Your LLM Secretly a World Model of the Internet? Model-Based Planning for Web Agents [22.6]
本稿では,各候補行動の結果をシミュレートし,考慮した世界モデルを用いたWebエージェントのためのモデルベース計画フレームワークを提案する。実証的な結果は、WebDreamerがリアクティブベースラインよりも大幅にパフォーマンスが向上していることを示している。我々の訓練された世界モデルDreamer-7Bは、GPT-4oに匹敵する性能を発揮し、複雑なウェブ環境における効率的かつ効率的な計画のための特殊な世界モデルの可能性を強調した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:04:47 GMT)
GTree: GPU-Friendly Privacy-preserving Decision Tree Training and Inference [22.6]
決定木(Decision Tree, DT)は、その汎用性、速度、解釈性から広く使われている機械学習モデルである。プライバシに敏感なアプリケーションでは、DTトレーニングのアウトソーシングとクラウドプラットフォームへの推論が、データのプライバシに関する懸念を提起する。 GTreeは、GPUを用いてMPCで保護されたセキュアDTトレーニングと推論を高速化する最初のスキームである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:33:59 GMT)
InformGen: An AI Copilot for Accurate and Compliant Clinical Research Consent Document Generation [22.5]
提案するインフォームジェネレーションは,ICF(ICF)ドラフト作成のためのLCM駆動型コーパスである。実験の結果、InformGenはFDAガイドラインから派生した18のコア規制規則にほぼ100%準拠していることが示されている。手動による介入と統合すると、InformGenは90%以上の事実精度を獲得し、バニラ GPT-4o モデルの 57%-82% をはるかに上回っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:14:48 GMT)
AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.3]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。静的代入や集中制御に依存する従来のマルチエージェントシステムとは異なり、エージェントは動的に専門化できる。 AgentNetはスケーラブルな適応性を促進し、組織間のプライバシ保護コラボレーションを可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:45:25 GMT)
Hierarchical Attention Networks for Lossless Point Cloud Attribute Compression [22.2]
本稿では,点雲の属性圧縮のための階層的注意コンテキストモデルを提案する。単純で効果的なレベル・オブ・ディーテール(LoD)構造を導入し、粗い粒度表現を生成する。同じ改善レベル内の点は並列に符号化され、共通のコンテキストポイントグループを共有する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:14:10 GMT)
Large Language Models are In-Context Molecule Learners [22.1]
In-Context Molecule Adaptation (ICMA)は、大規模言語モデルが文脈例から分子文アライメントを学習できるようにする新しいパラダイムである。 ICMAは、Hybrid Context Retrieval、Post-Retrieval Re- rank、In-context Molecule Tuningの3つのステージを組み込んでいる。実験の結果、ICMAは、余分な訓練コーパスや複雑な構造を伴わずに、LLMに最先端または同等のパフォーマンスを達成できることが示されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:02:03 GMT)
LLM-Human Pipeline for Cultural Context Grounding of Conversations [22.0]
社会的規範の遵守または違反は、しばしば会話のテナーを規定する。会話に「文化コンテキスト」を導入する。我々は中国の文化から、110kの社会規範と23kの会話の違反記述を生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:24:24 GMT)
m1: Unleash the Potential of Test-Time Scaling for Medical Reasoning with Large Language Models [21.8]
本研究は,医学的推論のためのテストタイムスケーリングとm1の総合的な研究である。各種医療タスクに対する評価は,テストタイムのスケーリングが医学的推論を継続的に促進することを示す。データスケールの増加,データ品質の向上,モデル能力の拡大により,医療知識の基盤化が一貫して進んでいることが判明した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:57:43 GMT)
Explainable AI-Based Interface System for Weather Forecasting Model [21.8]
本研究では,気象学におけるブラックボックスモデルの説明の要件を3つ定義する。適切なXAI法を各要件にマッピングし、生成した説明を定量的に定性的に検証する。以上の結果から, 意思決定性やユーザ信頼度の向上が示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:52:34 GMT)
You Cannot Feed Two Birds with One Score: the Accuracy-Naturalness Tradeoff in Translation [21.6]
我々は,情報理論の最近の進歩を数学的に証明し,そのような単一スコアの要約がシステムの性能の完全な図面を与えていないことを実証するために構築した。例えば、特定の精度のメートル法(BLEUなど)に翻訳システムを最適化することは、当初はシステムの自然性を改善するが、"オーバーフィッティング"のシステムは、その自然性を大幅に低下させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:31:40 GMT)
Unleashing the Power of Pre-trained Encoders for Universal Adversarial Attack Detection [21.0]
アドリアック攻撃は、現実世界のAIシステムにとって重要なセキュリティ脅威となる。本稿では,大規模事前学習型視覚言語モデルCLIPに基づく,軽量な逆検出フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:21:45 GMT)
LLM-Guided Search for Deletion-Correcting Codes [20.9]
削除訂正符号を構築するための新しい手法を提案する。一つの削除のために、我々の進化的探索は既知の最大サイズにマッチするコードを構成する関数を見つける。 2つの削除に対して、コード長(n = 12, 13 )および(16)に対して、新しい最もよく知られたサイズでコードを構成する関数を見つける。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:11:32 GMT)
CrackSQL: A Hybrid SQL Dialect Translation System Powered by Large Language Models [20.7]
CrackはルールとLLMベースのメソッドを組み合わせて制限を克服する最初のハイブリッドSQL方言翻訳システムである。 Crackは3つの翻訳モードをサポートし、Webコンソールインターフェース、PyPIパッケージ、コマンドラインプロンプトを含む複数のデプロイオプションを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:11:03 GMT)
Machine Unlearning Fails to Remove Data Poisoning Attacks [20.5]
データ削除要求に従うことに加えて、未学習の手法の潜在的な応用として、有毒なデータの影響を取り除くことが挙げられる。実験により,既存のアンラーニング手法は様々な環境で有効であることが実証されているが,データ中毒の影響を除去することはできなかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:49:56 GMT)
Towards Resilient Federated Learning in CyberEdge Networks: Recent Advances and Future Trends [20.5]
我々は,CyberEdgeネットワークにおけるレジリエント・フェデレート・ラーニング(ResFL)の最新技術について検討する。我々は,集約的推論と機能指向型セキュリティ機構を用いた共同トレーニングに重点を置いている。これらの進歩は、超低レイテンシ、人工知能(AI)駆動のネットワーク管理、敵攻撃に対するレジリエンスの改善を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:06:45 GMT)
Whispering Under the Eaves: Protecting User Privacy Against Commercial and LLM-powered Automatic Speech Recognition Systems [20.5]
本稿では,音声認識システムに対して音声認識を保護するための新しいフレームワークであるAudioShieldを提案する。摂動を潜伏空間に転送することにより、音質は広範囲に保存される。 AudioShieldは、リアルタイムのエンドツーエンドシナリオにおいて高い効果を示し、適応的な対策に対して強力なレジリエンスを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:49:39 GMT)
UniGS: Modeling Unitary 3D Gaussians for Novel View Synthesis from Sparse-view Images [20.1]
我々は,新しい3次元ガウス再構成と新しいビュー合成モデルであるUniGSを紹介する。 UniGSは、任意の数のスパースビュー画像から3Dガウスの高忠実度表現を予測する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:18:27 GMT)
HDVIO2.0: Wind and Disturbance Estimation with Hybrid Dynamics VIO [19.8]
フル6-DoF, トランスレーショナルおよびローテーション, 車両力学をモデル化し, それらをVIOに密に組み込むHDVIO2.0を提案する。本システムでは,風速25km/hまでの実地飛行だけでなく,パブリックおよび新しいドローンダイナミックスデータセットを用いた実験における最先端手法の性能を超越している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:08:27 GMT)
Conditional Temporal Neural Processes with Covariance Loss [19.8]
本稿では,条件付きニューラルプロセスと概念的に等価な新しい損失関数Covariance Lossを紹介する。我々は、最先端のモデルを用いた実世界のデータセットに関する広範な実験を行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:51:44 GMT)
OncoReg: Medical Image Registration for Oncological Challenges [19.6]
この作業は、OncoReg Challengeの背後にある方法論とデータについて詳述する。コンペのエントリーと結果の包括的分析を提供する。この登録タスクでは、特徴抽出が重要な役割を担っていることが判明した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:44:33 GMT)
Multilingual and Multi-Accent Jailbreaking of Audio LLMs [19.5]
Multi-AudioJailは、マルチリンガルおよびマルチアクセントオーディオジェイルブレイクを利用する最初の体系的なフレームワークである。音の摂動が言語間音声学とどのように相互作用し、ジェイルブレイクの成功率を急上昇させるかを示す。クロスモーダル・ディフェンスの研究を促進するためにデータセットをリリースする予定です。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:12:23 GMT)
Consistency-Guided Asynchronous Contrastive Tuning for Few-Shot Class-Incremental Tuning of Foundation Models [19.2]
CoACTは、(i)非同期コントラストチューニング、(ii)制御された微調整、(iii)一貫性のあるインクリメンタルチューニングの3つの重要なコンポーネントから構成される。提案したFew-Shot Class-Incremental Learning (FSCIL)とFew-Shot Class-Incremental Tuning (FSCIT)と呼ばれる新しい挑戦的なセットアップについて検討した。 CoACTは、FSCILで最大5.02%、個々のデータセットで最大12.51%、平均2.47%改善している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:28:44 GMT)
Video-T1: Test-Time Scaling for Video Generation [19.1]
大規模言語モデル(LLM)の研究者たちは、スケーリングをテスト時間に拡大した。ビデオ生成モデルが非自明な量の推論時間計算を許せば、挑戦的なテキストプロンプトによって生成品質をどの程度向上できるかという問題に答えることを目指している。テキスト条件付きビデオ生成ベンチマークの実験では、テスト時間計算の増加がビデオの品質を大幅に向上させることを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:52:58 GMT)
Where am I? Cross-View Geo-localization with Natural Language Descriptions [19.0]
クロスビュージオローカライゼーションは、ジオタグ付き衛星画像やOSMとマッチングすることで、ストリートビュー画像の位置を特定する。本稿では,シーンテキスト記述に基づいて,対応する衛星画像やOSMデータベースを検索することを目的とした,自然言語記述を用いたクロスビュージオローカライズのための新しいタスクを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:48:45 GMT)
Output Prediction of Quantum Circuits based on Graph Neural Networks [19.0]
本稿では,量子回路の出力期待値を予測するためのグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。我々は,同じデータセット上での畳み込みニューラルネットワーク(CNN)に対する雑音条件と雑音条件の両方において,GNNの予測性能を比較した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:38:47 GMT)
Diffusion Models in 3D Vision: A Survey [18.8]
3Dビジョンはコンピュータビジョンにおいて重要な分野となり、自律運転、ロボット工学、拡張現実、医療画像などの幅広い応用に力を入れている。本稿では,3次元オブジェクト生成,形状完備化,点雲再構成,シーン構築など,三次元視覚タスクに拡散モデルを用いる最先端の手法について概説する。計算効率の向上,マルチモーダル融合の強化,大規模事前学習による3次元タスクの一般化の促進など,潜在的なソリューションについて議論する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:46:41 GMT)
Improved Visual-Spatial Reasoning via R1-Zero-Like Training [18.6]
ビデオ視覚空間インテリジェンス(VSI)は、マルチモーダル大言語モデル(MLLM)の最も重要な推論能力の1つである。この研究は、R1-Zeroライクなトレーニングを通してMLLMの視覚空間的推論を改善するための、最初の詳細な研究を行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:11:11 GMT)
Simple yet Effective Node Property Prediction on Edge Streams under Distribution Shifts [18.6]
出現するエッジのストリームから動的ノード特性を予測するために、時間グラフニューラルネットワーク(TGNN)が開発された。本稿では,分散シフト下でのエッジストリーム上のノード特性の予測方法であるSPLASHを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:20:52 GMT)
LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents [18.6]
LVAgentは,MLLMエージェントの長時間映像理解におけるマルチラウンド動的協調を実現するフレームワークである。提案手法は,選択,知覚,行動,反射の4つの重要なステップから構成される。 LVAgentは4つのメインストリームビデオ理解タスクにおいて80%の精度を実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:07:45 GMT)
One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.6]
統一ロボット形態学アーキテクチャであるURMAを紹介する。我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。 URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:17:30 GMT)
Deep Generative Models: Complexity, Dimensionality, and Approximation [18.5]
生成ネットワークは低次元入力から高次元データを生成することができることを示す。本研究は,入力次元と生成ネットワークによるデータ分布のモデル化能力の関係について考察した。この新たな洞察は、複雑なデータ構造を扱うための生成ネットワークの実用的効果を裏付けるだけでなく、近似誤差、次元性、モデルの複雑さの間の重要なトレードオフを浮き彫りにする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:07:02 GMT)
MSCMNet: Multi-scale Semantic Correlation Mining for Visible-Infrared Person Re-Identification [18.4]
MSCMNetは、複数のスケールでセマンティック機能を包括的に活用するために提案されている。特徴抽出において、モダリティ情報損失を可能な限り小さくする。 SYSU-MM01、RegDB、 LLCMデータセットの大規模な実験により、提案したMSCMNetが最も精度が高いことを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:34:48 GMT)
Scene4U: Hierarchical Layered 3D Scene Reconstruction from Single Panoramic Image for Your Immerse Exploration [18.2]
本研究では,パノラマ画像を用いた新しい3次元シーン再構築フレームワークScene4Uを提案する。具体的には、Scene4Uはオープン語彙セグメンテーションモデルと大きな言語モデルを統合して、実際のパノラマを複数の層に分解する。次に、拡散モデルに基づく階層化された修復モジュールを用いて、視覚的手がかりと深度情報を用いて隠蔽領域を復元し、シーンの階層的表現を生成する。 Scene4Uは最先端の手法より優れ、LPIPSでは24.24%、BRISQUEでは24.40%向上し、訓練速度も最速となった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:17:24 GMT)
Privacy-Preserving Transfer Learning for Community Detection using Locally Distributed Multiple Networks [18.1]
ネットワークデータのコミュニティ検出において,TransNetと呼ばれる新しいスペクトルクラスタリング手法を開発した。我々は、異質でプライバシーが保護され、様々なソースにローカルに保存される補助的なソースネットワークを使用している。重み付きソースネットワークのみを用いた対象ネットワークと推定器のみを用いた推定器よりも優れた性能を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:19:07 GMT)
Experimental realization and synchronization of a quantum van der Pol oscillator [18.1]
そこで本研究では, 非線形減衰型自律型量子駆動散逸システムについて, 単一トラップ原子を用いて述べる。我々は、ドライブのない位相空間における量子極限サイクルの存在を実証する。さらに、ドライブの方向と直交する直線的消散の助けを借りて同期を向上できることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:02:50 GMT)
Using Language Models to Decipher the Motivation Behind Human Behaviors [17.9]
大規模な言語モデルへの様々なプロンプトによって、人間の行動を完全に引き出すことができることを示す。そして、どの行動を引き出すのにどのプロンプトが必要なのかを分析することで、人間の行動の背後にあるモチベーションを推測することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:37:24 GMT)
Rehearsal-free Federated Domain-incremental Learning [17.7]
RefFiLは、リハーサルのないフェデレーションドメインインクリメンタルラーニングフレームワークである。我々は、フェデレートされたドメイン・インクリメンタル・ラーニングにおける破滅的な忘れ課題を軽減するために、グローバルなプロンプト・シェアリング・パラダイムを導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:09:48 GMT)
CancerLLM: A Large Language Model in Cancer Domain [17.7]
CancerLLMは70億のパラメータとMistralスタイルのアーキテクチャを持つモデルで、270万近い臨床ノートと17種類のがんに関する515K以上の病理報告で事前訓練されている。 F1スコアは91.78%、表現型抽出は86.81%、ジガノア生成は86.81%である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:23:57 GMT)
Cooper: A Library for Constrained Optimization in Deep Learning [17.6]
Cooperは、ディープラーニングモデルにおける制約付き最適化問題を解決するオープンソースのパッケージである。 CooperはLagrangianベースの一階更新スキームをいくつか実装している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:52:53 GMT)
SCRec: A Scalable Computational Storage System with Statistical Sharding and Tensor-train Decomposition for Recommendation Models [17.6]
Deep Learning Recommendation Models (DLRMs)は、ソーシャルネットワークやビデオストリーミングといったWebアプリケーション間でパーソナライズされたコンテンツを配信する上で、重要な役割を果たす。性能の改善により、DLRMsのパラメータサイズはテラバイト(TB)に拡大し、メモリ帯域幅の要求はTB/sを超えるようになった。 TBスケールの産業用DLRMを扱えるスケーラブルな計算ストレージレコメンデーションシステムであるSCRecを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:12:45 GMT)
Retrieval-augmented Few-shot Medical Image Segmentation with Foundation Models [17.5]
本稿では,DINOv2 と Segment Anything Model 2 を併用して,画像の検索を行う手法を提案する。我々のアプローチでは、DINOv2の機能をクエリとして使用し、制限付きアノテートデータから類似したサンプルを検索し、それをメモリバンクにエンコードする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:02:44 GMT)
Epistemic Alignment: A Mediating Framework for User-LLM Knowledge Delivery [17.2]
本稿では,哲学文献から得られた知識の伝達に関する10の課題を提案する。ユーザはそれぞれの課題に対処するための回避策を開発しています。 AI開発者にとって、Epistemic Alignment Frameworkは、知識に対する多様なアプローチをサポートするための具体的なガイダンスを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:38:12 GMT)
Foundation Models for Autonomous Driving System: An Initial Roadmap [17.2]
ファンデーションモデル(FM)の最近の進歩は、自律運転システム(ADS)を著しく強化した。 ADSは、信頼性と安全性を確保するために厳格なソフトウェアエンジニアリングプラクティスを必要とする、非常に複雑なサイバー物理システムである。我々は、FMのインフラ、その自律運転システムへの応用、そして実際の応用の3つの重要な側面を網羅して、FMを自律運転に統合するための構造化されたロードマップを提示する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:45:31 GMT)
MagicPose4D: Crafting Articulated Models with Appearance and Motion Control [17.2]
我々は4次元生成における外観と動きの制御を洗練させるフレームワークであるMagicPose4Dを提案する。現行の4D生成方法とは異なり、MagicPose4Dはモーションプロンプトとしてモノクラービデオやメッシュシーケンスを受け入れる。我々はMagicPose4Dが4Dコンテンツ生成の精度と一貫性を著しく向上することを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:13:28 GMT)
Attention in Diffusion Model: A Survey [17.1]
本稿では拡散モデルにおける注意点の包括的調査について述べる。私たちは、その役割、デザインパターン、さまざまなモダリティやタスクを体系的に分析します。本研究は, 注意に関連する変化を, それらが与える構造的要素に応じて, 部品に分類する統合分類法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:00:49 GMT)
Generalizable Prompt Learning of CLIP: A Brief Overview [17.1]
この記事では、数発のプロンプト学習に基づくCLIPの概要を紹介する。このレビューの目的は、CLIPの一般化可能なプロンプトで研究を開始したばかりの研究者への参照を提供することである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:41:18 GMT)
Enhancing Domain Adaptation through Prompt Gradient Alignment [16.6]
我々は、ドメイン不変性と特定の特徴の両方を学ぶために、素早い学習に基づく一連の作品を開発する。我々は、UDAを、各目的がドメイン損失で表される多重目的最適化問題とみなした。我々の手法は、他の視覚言語モデル適応法より一貫して優れている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:56:06 GMT)
QG-VTC: Question-Guided Visual Token Compression in MLLMs for Efficient VQA [16.5]
画像はテキストよりも冗長な情報が多く、視覚的な詳細が特定の質問に関係しているわけではない。 MLLMに基づくVQAタスクのための新しい質問誘導型ビジュアルトークン圧縮手法であるQG-VTCを提案する。 QG-VTCは、事前訓練されたテキストエンコーダと学習可能なフィードフォワード層を使用して、ユーザ質問を視覚エンコーダの機能空間に埋め込む。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:07:19 GMT)
How Difficulty-Aware Staged Reinforcement Learning Enhances LLMs' Reasoning Capabilities: A Preliminary Experimental Study [16.4]
本稿では,難易度の高い強化学習戦略が推論性能を大幅に向上させる方法について,厳密な実験的検討を行った。本研究は,RLの最適化を著しく向上させることを特徴とする,明確な難易度に応じて,戦略的にトレーニングデータを選択することを示す。私たちはデータセットをGitHubとHugging Faceでオープンソース化します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:18:38 GMT)
An End-to-End Robust Point Cloud Semantic Segmentation Network with Single-Step Conditional Diffusion Models [16.4]
既存の条件付き拡散確率モデル (DDPM) とノイズ・コンディション・フレームワーク (NCF) は, 3次元シーン理解作業において依然として困難である。本稿では,CDSegNetというDDPMの条件付きノイズフレームワーク(CNF)に基づく,エンドツーエンドのロバストなセマンティックネットワークを提案する。 CNFのおかげで、CDSegNetは、非DDPMのような単一ステップの推論でセマンティックラベルを生成することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:48:53 GMT)
TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection [16.4]
本稿では,TeleAntiFraud-28kについて紹介する。本データセットは,(1)自動音声認識(ASR)で書き起こされた通話記録(匿名化元音声)を用いたプライバシ保存テキストトラス・サンプル生成,(2)大規模言語モデル(LLM)に基づく自己指示サンプリングによるシナリオカバレッジの拡大,の3つの戦略により構築されている。生成されたデータセットは、厳密に処理された28,511の音声テキストペアを含み、不正推論のための詳細なアノテーションを完備している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:04:47 GMT)
Feature-Preserving Mesh Decimation for Normal Integration [16.3]
正規積分は、測光ステレオから得られる通常の地図から3次元曲面を再構成する。本研究では,通常の積分に先立って,高密度画素格子をスパース異方性三角形メッシュに置き換える。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:56:47 GMT)
Learning Actionable Counterfactual Explanations in Large State Spaces [16.3]
リコースジェネレータは、しばしば特徴に基づく対実的説明(CFE)を通して、実行可能な洞察を提供するこれらの機能ベースのCFEは、過度に具体化されており、実世界のアクションと直接整合しない機能領域で推奨されることが多い。実世界の行動に根ざした3つの新しいリコースタイプを紹介する: 高レベル連続(emphhl-continuous)、高レベル離散(emphhl-discrete)、高レベルID(emphhl-id)CFE。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:36:37 GMT)
A Scalable Framework for Evaluating Health Language Models [16.3]
大規模言語モデル(LLM)は、複雑なデータセットを分析する強力なツールとして登場した。オープンエンドテキスト応答の現在の評価実践は、人間の専門家に大きく依存している。この研究はAdaptive Precise Boolean rubrics(リンク)を紹介している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:17:55 GMT)
Self-Vocabularizing Training for Neural Machine Translation [15.7]
トレーニングされた翻訳モデルは、元のBPE語彙とは別個のBPE語彙反復を用いて、バイトペア符号化サブセット(BPE)を使用するように誘導される。我々は,より小さく,より最適な語彙を自己選択する反復的手法である自己語彙学習を提案し,最大1.49BLEUの改善をもたらす。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:43:48 GMT)
Stable-Makeup: When Real-World Makeup Transfer Meets Diffusion Model [15.4]
現在のメークアップ転送方式は単純なメイクスタイルに限られており、現実のシナリオでは適用が困難である。本研究では,多様な現実世界の化粧品を堅牢に転写できる新しい拡散型化粧品転写法であるStable-Makeupを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:37:38 GMT)
Leveraging Contrast Information for Efficient Document Shadow Removal [15.4]
ドキュメントのシャドーは、デジタル化プロセスにおける大きな障害です。コントラスト表現による文書のシャドウ除去手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:06:20 GMT)
TOMG-Bench: Evaluating LLMs on Text-based Open Molecule Generation [14.9]
TOMG-BenchはLLMのオープンドメイン分子生成能力を評価する最初のベンチマークである。 25 LLMのベンチマークでは、現在の限界と潜在的な改善領域が明らかになっている。 OpenMolInsで微調整されたLlama3.1-8Bは、全オープンソースのLLMを上回り、TOMG-Benchで GPT-3.5-turbo を46.5%上回った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:18:55 GMT)
CopyQNN: Quantum Neural Network Extraction Attack under Varying Quantum Noise [14.8]
量子ニューラルネットワーク(QNN)は、ドメイン間で大きな価値を示し、よく訓練されたQNNは重要な知的特性を表す。最近の研究は、古典的および新しい量子戦略を用いたQNNモデル抽出攻撃について検討している。これらの攻撃は、ローカル代替QNNをトレーニングするためのラベル付きデータを取得するために、QNNプラットフォームに問い合わせることを含む。ノイズ感度に基づいてノイズデータを除去する3段階データクリーニング手法であるCopyQNNフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:30:44 GMT)
Dynamic Graph Structure Estimation for Learning Multivariate Point Process using Spiking Neural Networks [14.8]
Spiking Dynamic Graph Networkは、スパイキングニューラルネットワーク(SNN)とスパイク依存塑性(STD-P)の時間的処理能力を活用する新しいフレームワークである。イベントデータから直接動的時間的依存関係を学習し、一般化性とモデリングを強化することで、任意のデータセットに適応する。 NYC Taxi、911 Reddit、Stack Overflowなどの合成および実世界のデータセットで行った評価は、計算効率を維持しながら、優れた精度を示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:23:10 GMT)
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives: Data, Methods, and Challenges [14.7]
マルチモーダル音楽生成は、画像、ビデオ、テキストなどの複数のモダリティと、音楽スコアとオーディオをガイダンスとして使用する。本稿では、モーダル性の観点から音楽生成システムを分類し、この分野を概観する。この領域の主な課題は、効果的なマルチモーダル統合、大規模包括的なデータセット、体系的な評価方法である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:26:25 GMT)
TS-RAG: Retrieval-Augmented Generation based Time Series Foundation Models are Stronger Zero-Shot Forecaster [14.5]
時系列基礎モデル (TSFM) にはドメイン適応の固有のメカニズムが欠如しており、限定的な解釈可能性に悩まされている。 TS-RAGは、検索強化世代別時系列予測フレームワークである。 TS-RAGは最先端のゼロショット予測性能を達成し,様々な領域でTSFMを最大6.51%上回った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:23:59 GMT)
Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image [14.5]
本研究では,動きのぼかしを動き推定のためのリッチキューとして活用する新しいフレームワークを提案する。提案手法は, 単一動画像から直接, 濃密な運動流場と単眼深度マップを推定することにより機能する。本手法は,高速でアグレッシブなカメラの動きを強く捉えるIMUライクな計測法である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:58:06 GMT)
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond [14.4]
本稿では、長い推論モデルをトレーニングするためのオープンソースのスイートであるLight-R1を紹介する。カリキュラムの学習は、多段階のポストトレーニングと組み合わせて、データの難易度を徐々に高めていく。最終的なLight-R1-14B-DSは,AIME24と25のスコアが74.0,60.2の14Bモデル間でSOTA性能を実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:08:26 GMT)
VRM: Knowledge Distillation via Virtual Relation Matching [14.3]
我々は,関係性に基づく手法において,過度な適合性や刺激的な応答に対する感受性など,いくつかの重要な課題に対処する。我々は、有用なサンプル間、クラス間、およびビュー間相関の富をコンパクトにカプセル化する、新規に構築された親和性グラフを転送する。 CIFAR-100およびImageNetデータセットの実験は、提案した仮想関係マッチング(VRM)法の優れた性能を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:57:26 GMT)
Heterogeneous bimodal attention fusion for speech emotion recognition [14.2]
本稿では,会話感情認識における多段階多モードインタラクションのためのHBAF(Heterogeneous Bimodal Attention Fusion)という新しいフレームワークを提案する。ユニモーダル表現モジュールは、コンテキストコンテンツを低レベルのオーディオ表現に組み込んで、異種マルチモーダルギャップをブリッジする。マルチモーダル融合モジュールは動的バイモーダルアテンションと動的ゲーティング機構を用いて不正確な相互モーダル関係をフィルタリングする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:53:56 GMT)
CamoSAM2: Motion-Appearance Induced Auto-Refining Prompts for Video Camouflaged Object Detection [14.2]
実世界のシナリオにおける自動セグメンテーションへのSAM2の適用は、カモフラージュ認識と信頼性の高いプロンプト生成の課題に直面している。本稿では,MAPI(Motion-appearance prompt inducer)と改良フレームワークであるCamoSAM2を提案し,SAM2のプロンプトを自動生成・洗練する。提案モデルであるCamoSAM2は,mIoU測定値の8.0%と10.1%の増加を達成し,既存の最先端手法を著しく上回っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:45:17 GMT)
Collective charging of an organic quantum battery [14.2]
本研究では,1次元分子集合体と結合した単一モード空洞からなる量子電池(QB)の集合電荷について検討した。固定$N$とエキシトン-キャビティ結合には、最大蓄積エネルギー密度と最大充電電力密度がそれぞれの最大値に達する最適なエクシトン-エクシトン相互作用が存在する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:21:40 GMT)
Sabiá-3 Technical Report [14.0]
今回のレポートでは、新たなフラッグシップ言語モデルであるSabi'a-3と、より費用対効果の高い兄弟であるSabiazinho-3を紹介します。 Sabia-3は、特に推論集約的なタスクにおいて、これまでの最良モデルであるSabia-2 Mediumと比較して大幅に改善されている。 Sabia-3 の平均性能はフロンティア LLM と一致し、トークン当たりの3倍から4倍のコストで提供される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:19:49 GMT)
RedMotion: Motion Prediction via Redundancy Reduction [14.0]
自動運転車における動き予測のためのトランスフォーマーモデルであるRedMotionを紹介する。 RedMotionは冗長性低減を通じて環境表現を学習する。提案手法は,動作予測チャレンジにおけるHPTRやMTR++と比較して,競合的な結果が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:26:14 GMT)
On Benchmarking Code LLMs for Android Malware Analysis [13.9]
大規模言語モデル(LLM)は、様々なコードインテリジェンスタスクにおいて強力な機能を示しているが、Androidのマルウェア分析に対するその有効性はまだ未定である。本稿では,Android マルウェア解析タスクにおける Code LLM の有効性を体系的に評価するベンチマークフレームワークである Cama を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:05:49 GMT)
Investigating the Capabilities and Limitations of Machine Learning for Identifying Bias in English Language Data with Information and Heritage Professionals [13.6]
支配的なMLアプローチはバイアスを取り除き、公正なモデルを作成することができると仮定している。バイアスのある言語を識別するモデルを作成し、それを削除しようとするのではなく、データセットのバイアスに注意を向けます。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:51:25 GMT)
DivPrune: Diversity-based Visual Token Pruning for Large Multimodal Models [13.5]
LMM(Large Multimodal Models)にビジュアルトークンを追加すると、トークンの総数は数千に増加する。この問題に対処するため、視覚的トークンの一部を除去するトークンプルーニング手法が提案されている。提案手法であるDivPruneは冗長性を低減し,選択したトークンの最大多様性を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:02:04 GMT)
Role and Use of Race in AI/ML Models Related to Health [13.5]
健康関連人工知能と機械学習(AI/ML)モデルにおける人種の役割と利用は、注目と論争を呼んでいる。関連する問題の複雑さと広さにもかかわらず、ステークホルダーの検査と解決をガイドする堅牢で包括的な枠組みはいまだに欠如している。この視点は、AI/MLライフサイクルを中心に構成され、調査と意思決定を支援するために"検討すべきポイント"を網羅した、レース関連の課題を、幅広いベースで体系的で横断的なランドスケープ分析を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:27:31 GMT)
Vision Transformers for End-to-End Vision-Based Quadrotor Obstacle Avoidance [13.5]
高速な視覚に基づく四極子障害物回避のための注意に基づくエンドツーエンドアプローチの能力を実証する。我々は、高忠実度シミュレーションにおいて、深度画像制御のための視覚変換器(ViT)モデルに対して畳み込み、U-Netおよび繰り返しアーキテクチャを訓練し、比較する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:27:23 GMT)
CyberBOT: Towards Reliable Cybersecurity Education via Ontology-Grounded Retrieval Augmented Generation [13.4]
サイバーセキュリティ教育では、正確性と安全性が最重要であり、システムは、信頼に値する情報とドメインに適した情報を提供するために、表面レベルの関連性を超えなければならない。我々はCyberBOTを紹介した。CyberBOTは、コース固有の材料からコンテキスト情報を取り込み、ドメイン固有のサイバーセキュリティオントロジーを用いて応答を検証する。 CyberBOTはアリゾナ州立大学の大規模な大学院コースに展開され、100人以上の学生が専用のウェブベースのプラットフォームを通じてシステムに積極的に関与している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:19:22 GMT)
Reasoning-SQL: Reinforcement Learning with SQL Tailored Partial Rewards for Reasoning-Enhanced Text-to-SQL [13.2]
既存のアプローチはしばしば、その全体的な効果を制限する誘導バイアスを持つ手作りの推論パスに依存している。 OpenAI o1のような最近の推論強化モデルの成功に触発されて、テキスト・ツー・サーベイ・タスクに特化して設計された、新たな部分報酬セットを提案する。提案した報酬を用いたRL-onlyトレーニングは,教師付き微調整よりも高い精度と優れた一般化を継続的に達成できることを実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:53:16 GMT)
Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? [12.9]
既存の最先端LCMは, 極めて重篤なリサイクリング行動を示す。これは、最先端のLSMの真のインテリジェンスレベルを再評価するために私たちを補完するLLMコミュニティへの覚醒電話です。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:57:58 GMT)
RG-Attn: Radian Glue Attention for Multi-modality Multi-agent Cooperative Perception [12.9]
車間通信(V2X)は、単一エージェントシステムの知覚限界を克服する最適なソリューションを提供する。 PTP(Paint-To-Puzzle)とCo-Sketching-Co-Co(Co-Sketching-Co-Co)という2つの異なるアーキテクチャを提案する。提案手法は,実・模擬協調認識データセット上でのSOTA(State-of-the-art)性能を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:05:03 GMT)
Context-Aware Human Behavior Prediction Using Multimodal Large Language Models: Challenges and Insights [12.9]
本研究では,事前学習したMLLMを文脈を考慮した人間の行動予測に応用する体系的解析手法を提案する。我々のフレームワークは、ターゲットフレームにおける人間の振る舞いを予測する際に、92.8%のセマンティック類似性と66.1%の正確なラベル精度に達することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:28:19 GMT)
AI Hiring with LLMs: A Context-Aware and Explainable Multi-Agent Framework for Resume Screening [12.8]
大規模言語モデル(LLM)を用いたスクリーニング再開のためのマルチエージェントフレームワークを提案する。フレームワークは、履歴抽出器、評価器、要約器、スコアフォーマッターを含む4つのコアエージェントから構成される。この動的適応は、パーソナライズされた採用を可能にし、AI自動化と人材獲得のギャップを埋める。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:56:39 GMT)
Active teacher selection for reinforcement learning from human feedback [12.8]
人間のフィードバックからの強化学習(RLHF)により、機械学習システムは人間のフィードバックから目的を学ぶことができる。教師の合理性、専門性、コストの相違をモデル化するHidden Utility Banditフレームワークを提案する。我々は、さまざまなソリューションアルゴリズムを開発し、それらを紙レコメンデーションシステムと新型コロナウイルスワクチンテストという2つの現実世界の領域に適用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:34:11 GMT)
Loschmidt echo zeros and dynamical quantum phase transitions in finite-size quantum systems with linear quench [12.8]
位相遷移点を横切るとき、正確なLoschmidtエコーゼロは、クエンチ率を調整することで常にアクセス可能であることを示す。臨界時間は、クエンチ速度、システムサイズ、運動量モードの影響を受け、有限サイズ効果と臨界力学の間の相互作用を具現化している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:15:19 GMT)
TraceNet: Segment one thing efficiently [12.6]
本稿では,ユーザが選択した単一インスタンスを肯定的なタップで分割する,ワンタップ駆動の単一インスタンスセグメンテーションタスクを提案する。選択したインスタンスを受容的フィールドトレースによって明示的に特定するTraceNetを提案する。我々は、例えばIoU平均におけるTraceNetの性能と、ユーザーがタップした領域の比率を、高品質なシングルインスタンスマスクで評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:43:16 GMT)
Data Cleansing for GANs [12.5]
機械学習タスクに適用可能な効果的な戦略の1つは、パフォーマンスを改善する有害なインスタンスを特定することである。以前のアプローチでは、トレーニングインスタンスが存在しないことがパラメータに直接影響を与えている。本稿では,GAN評価基準がインスタンスの削除によってどのように変化するかに基づいて,各トレーニングインスタンスの有害度を測定するインスタンス評価手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:02:37 GMT)
Amelia: A Large Dataset and Model for Airport Surface Movement Forecasting [12.2]
Ameliaフレームワークは4つの重要なコントリビューションで構成されている。まず、Amelia-48はFAAのシステムワイド・インフォメーション・マネジメント(SWIM)プログラムを通じて収集された空港表面の動きの大規模なデータセットである。第2に,マルチエージェント・マルチエアポート軌道予測のための大規模トランスフォーマーベースラインであるAmeliaTFを開発した。第3に,Amelia-10は10の空港から292日間の処理後データからなる訓練と評価のベンチマークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:28:25 GMT)
StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation [12.0]
StarGenは、トレーニング済みのビデオ拡散モデルを長距離シーン生成のために自動回帰的に利用するフレームワークである。各ビデオクリップの生成は、隣接する画像の3Dワープと、以前に生成されたクリップから時間的に重なる画像とに条件付けされる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:18:01 GMT)
Provably accurate adaptive sampling for collocation points in physics-informed neural networks [11.9]
物理インフォームドニューラルネットワーク(PINN)は、サロゲート解法を効率的に学習する方法として登場した。本稿では,PDE残差のヘシアンに基づくコロケーション点の精度の高いサンプリング手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:45:08 GMT)
ALLVB: All-in-One Long Video Understanding Benchmark [11.9]
ALLVB(ALL-in-One Long Video Understanding Benchmark)は、長いビデオ理解のための総合的なベンチマークである。 16のカテゴリーで1,376本のビデオがあり、それぞれ平均で2時間近く、QAは252kだ。これはビデオの数、平均持続時間、QAの数で最大の長ビデオ理解ベンチマークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:30:16 GMT)
Learning to Normalize on the SPD Manifold under Bures-Wasserstein Geometry [11.8]
共分散行列は多くの科学分野において非常に有効であることが証明されている。表現学習における主要な課題は、この基礎となる幾何学的構造を尊重することである。本稿では,学習可能なパラメータを組み込んだ新しいRBNアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:12:58 GMT)
Beijing Normal University 12-meter Interferometric kHz GW Detector Prototype: Design and Scientific Prospects [11.8]
高周波体制、特にキロヘルツ(kHz)の範囲では、未探索のままである。北京師範大学(BNU)の試作機は、専用のkHz GW検出器を開発する先駆的な試みである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:53:52 GMT)
Designing Heterogeneous GNNs with Desired Permutation Properties for Wireless Resource Allocation [11.7]
グラフニューラルネットワーク(GNN)は、さまざまな無線ポリシを学ぶために設計されている。本稿では,所望の置換特性を満たすための設計手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:52:31 GMT)
The DeepSpeak Dataset [11.7]
ウェブカメラの前で話し、身振りで示す人々の、リアルタイムおよびディープフェイク映像の大規模なデータセットについて述べる。実際のビデオは500人の個人による合計50時間の映像で構成されている。フェイクビデオは、さまざまな最先端アバター、フェイススワップ、そして自然とAIが生成した音声によるリップシンクのディープフェイクで構成されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:02:39 GMT)
AnyTouch: Learning Unified Static-Dynamic Representation across Multiple Visuo-tactile Sensors [11.5]
Visuo-Tactileセンサーは、人間の触覚をエミュレートし、ロボットが物体を理解して操作できるようにする。そこで本研究では,4種類のビジュオ触覚センサを用いたマルチモーダル触覚マルチセンサデータセットであるTacQuadを紹介する。マルチレベル構造を持つ静的動的マルチセンサ表現学習フレームワークであるAnyTouchを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:17:30 GMT)
A predictive machine learning force field framework for liquid electrolyte development [11.5]
本稿では,分子動力学(MD)シミュレーションの予測フレームワークであるBAMBOOを紹介する。我々は、量子力学シミュレーションから学ぶため、BAMBOOのバックボーンとして、物理に着想を得たグラフ同変変変圧器アーキテクチャを設計する。また,アンサンブル知識蒸留手法を導入してMLFFに適用し,MDシミュレーションによる観測の変動を低減する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:36:27 GMT)
Real-Time Navigation for Autonomous Aerial Vehicles Using Video [11.4]
我々は,コンピュータビジョン(CV)アルゴリズムの作業量を削減するために,新しいマルコフ決定プロセス(MDP)フレームワークを導入する。提案するフレームワークは,機能ベースとニューラルネットベースのオブジェクト検出タスクの両方に適用する。これらの総合的なテストは、エネルギー消費と速度に大きな利点を示し、精度は限られている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:14:42 GMT)
Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder [11.4]
我々は,事前学習した拡散モデルにおける細粒度多属性制御を実現するために設計された,新しいプラグイン・アンド・プレイモジュールであるAttribute (Att) Adapterを紹介する。 Att-Adapterは柔軟性があり、トレーニングのためにペア化された合成データを必要としない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:42:51 GMT)
Learning-Based Approximate Nonlinear Model Predictive Control Motion Cueing [11.3]
モーションキューアルゴリズム(Motion Cueing Algorithms)は、シミュレーションされた車両の運動を、モーションシミュレータで再現できる運動に符号化する。本稿では,シリアルロボットを用いたモーションシミュレータのための新しい学習型MCAを提案する。計算負荷をオフライントレーニングにシフトすることで,高制御率でリアルタイム操作を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:52:30 GMT)
Self-Supervised Pretraining for Aerial Road Extraction [11.3]
航空画像分割のための深層ニューラルネットワークのための自己教師付き事前学習法を提案する。提案手法では,空中画像の欠落した領域の再構成をモデルで学習する。実験により、特に低データ状態において、プレトレーニングがセグメンテーションの精度を大幅に向上させることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:18:44 GMT)
DC-SGD: Differentially Private SGD with Dynamic Clipping through Gradient Norm Distribution Estimation [11.2]
クリッピング閾値Cを動的に調整する動的クリッピングDP-SGD(DC-SGD)を提案する。 DC-SGD-Pは勾配ノルムのパーセンタイルに基づいてクリッピング閾値を調整する一方、DC-SGD-Eは勾配の2乗誤差を最小限に抑えてCを最適化する。本結果は,DC-SGDの性能と効率性を強調し,差分学習のための実用的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:25:37 GMT)
Causal Concept Graph Models: Beyond Causal Opacity in Deep Learning [11.1]
因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)モデルの決定の根底にある「隠れた」因果構造を理解することの難しさを指す。この研究は、因果概念グラフモデル(Causal Concept Graph Models, Causal CGMs)を導入している。実験の結果, (i) 因果不透明モデルの一般化性能に一致し, (ii) ループ内修正を誤予測中間推論ステップに適用し, (iii) 介入シナリオと反事実シナリオの分析を支援することができた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:47:14 GMT)
Personalized Federated Training of Diffusion Models with Privacy Guarantees [11.1]
アクセシビリティ、コンプライアンス、倫理的根拠を持つデータの不足は、センシティブな分野における人工知能(AI)の採用への挑戦である。プライバシー、著作権、競争に対する懸念が高まっているため、制限のない公開データセットへのアクセスはますます制限されている。合成データは有望な代替手段として登場し、拡散モデルは高品質で多様な合成データを生成する効果的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:45:26 GMT)
Enhancing Large Language Models for Text-to-Testcase Generation [11.0]
大規模言語モデル(GPT-3.5)に基づくテキスト・ツー・テストケース生成手法を提案する。提案手法の有効性を,5つの大規模オープンソースプロジェクトを用いて評価した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:37:55 GMT)
Astrea: A MOE-based Visual Understanding Model with Progressive Alignment [10.9]
マルチモーダル理解において,Mixture-of-Experts (MoE)アーキテクチャに基づく視覚言語モデル (VLM) が重要なパラダイムとして登場した。本稿では,プログレッシブ事前アライメントに基づく新しいマルチエキスパート協調型VLMアーキテクチャであるAstreaを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:10:50 GMT)
Understanding the Effectiveness of Coverage Criteria for Large Language Models: A Special Angle from Jailbreak Attacks [10.9]
大規模言語モデル(LLM)は人工知能に革命をもたらしたが、重要なドメインにまたがるデプロイメントは、悪意のある攻撃に直面した際の異常な振る舞いを懸念している。本稿では,このような不確実性を特定する上で,従来のカバレッジ基準の有効性を評価するための総合的な実証的研究を行う。我々は、クエリを正規またはジェイルブレイクとして分類する際の高精度(平均93.61%)を実現するリアルタイムジェイルブレイク検出機構を開発した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:01:15 GMT)
Disentangling Safe and Unsafe Corruptions via Anisotropy and Locality [10.8]
最先端の機械学習システムは、脅威モデルに従って「小さい」が定義される場合、入力に対する小さな摂動に対して脆弱である。本稿では,既存の等方的およびグローバルな脅威モデルを超えるロバスト性を研究するために,textttProjected Displacement (PD) と呼ばれる新しい脅威モデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:00:20 GMT)
PLM4NDV: Minimizing Data Access for Number of Distinct Values Estimation with Pre-trained Language Models [10.7]
マルチセット/カラムの固有値数(NDV)推定は、多くのデータ管理タスクの基盤となる。何十年にもわたっての研究にもかかわらず、既存の手法のほとんどは、かなりの量のサンプルを必要とするか、見積もりを生成するために列全体にアクセスする必要がある。我々はこれらの課題に対処するために意味情報、すなわちスキーマを活用することを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:06:20 GMT)
DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing [10.7]
大規模言語モデル(LLM)は、データ処理において有望であることを示している。これらのフレームワークは、ユーザが指定した操作を実行する際のコスト削減に重点を置いている。これは複雑なタスクやデータに問題があります。本稿では,複雑な文書処理パイプラインを最適化するDocETLを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:47:19 GMT)
In-game Toxic Language Detection: Shared Task and Attention Residuals [10.7]
ゲーム内での有害な言語は、ゲーム産業やコミュニティにおいてホットポテトとなっている。ゲーム内チャットの性質が極めて短いため,毒性を検出することは依然として困難である。本稿では,実際のゲーム内チャットデータを用いて,ゲーム内有害言語共有タスクの確立について述べる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:12:05 GMT)
SRLCG: Self-Rectified Large-Scale Code Generation with Multidimensional Chain-of-Thought and Dynamic Backtracking [10.7]
Self-Rectified Large-Scale Code Generator (SRLCG) は、単一のプロンプトから完全なマルチファイルプロジェクトコードを生成するフレームワークである。 SRLCGは、新しい多次元チェーン・オブ・シークレット(CoT)と自己修正を使用して、LLMをガイドし、正確でロバストなコードファイルを生成する。実験の結果,SRLCGはDeepSeek-V3より15倍,GPT-4より16倍,CoTベースラインの少なくとも10倍のコードを生成することがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:23:43 GMT)
Oriented Object Detection in Optical Remote Sensing Images using Deep Learning: A Survey [10.6]
オブジェクト指向物体検出は、リモートセンシングにおいて最も基本的で困難なタスクの1つである。近年のディープラーニングの進歩により、オブジェクト指向物体検出の能力は大幅に向上した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:54:12 GMT)
A Comparative Tutorial of the Histogram-based Image Segmentation Methods [10.6]
多くの古典的ヒストグラムに基づく画像分割法が提案され、学術と産業の両方で重要な役割を果たしてきた。本チュートリアルでは、ヒストグラムに基づく画像分割技術の歴史と最近の進歩をまず概観し、次に4つのカテゴリに分けられる。本チュートリアルの目的は,(1)古典的ヒストグラムに基づくイメージセグメンテーション手法の原理を興味ある読者に教えること,2)これらの古典的ヒストグラムに基づく画像セグメンテーション手法の利点とデメリットを客観的に評価すること,3)これらの古典的ヒストグラムに基づく画像セグメンテーション手法と最先端のディープラーニングに基づく画像セグメンテーション手法のパフォーマンスを比較することである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:11:46 GMT)
Buyer-Initiated Auction Mechanism for Data Redemption in Machine Unlearning [10.4]
人工知能(AI)の急速な成長はプライバシーの懸念を引き起こしている。カリフォルニア州消費者プライバシ法(CCPA)のような主要な規制データ償還のための買い手主導型オークション機構を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:25:31 GMT)
FedPaI: Achieving Extreme Sparsity in Federated Learning via Pruning at Initialization [10.4]
Federated Learning (FL)は、エッジデバイス上での分散トレーニングを可能にする。現在の反復プルーニング技術は通信効率を向上するが、集中設計によって制限される。本稿では,Pruning at Initialization (PaI) を利用して極端に疎結合を実現する新しいFLフレームワークであるFedPaIを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:24:34 GMT)
Optimization Insights into Deep Diagonal Linear Networks [10.4]
直交ニューラルネットワークのパラメータを推定するための勾配流"アルゴリズム"の暗黙的正規化特性について検討した。我々の主な貢献は、この勾配流がモデル上のミラーフローを動的に誘導することであり、これは問題の特定の解に偏っていることを意味する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:13:37 GMT)
PSF-4D: A Progressive Sampling Framework for View Consistent 4D Editing [10.3]
4次元編集のためのプログレッシブサンプリングフレームワーク(PSF-4D)を提案する。時間的コヒーレンスのために、時間とともにフレームをリンクする相関したガウス雑音構造を設計する。ビュー間の空間的整合性を実現するために、クロスビューノイズモデルを実装している。提案手法は,外部モデルに頼らずに高品質な4D編集を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:01:21 GMT)
MolGround: A Benchmark for Molecular Grounding [10.2]
そこで本研究では,モデル参照能力の評価を目的とした分子基盤ベンチマークを提案する。我々はこれまでに79kのQAペアからなる分子理解ベンチマークを構築した。我々のシステムはGPT-4oを含む既存のモデルよりも優れており、その基盤出力は従来のタスクを強化するために統合されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:49:07 GMT)
VerifiAgent: a Unified Verification Agent in Language Model Reasoning [10.2]
本稿では,メタ検証とツールベース適応検証の2つのレベルを統合した統合検証エージェントを提案する。 VerifiAgentは推論型に基づいて適切な検証ツールを自律的に選択する。推論スケーリングに効果的に適用でき、より少ないサンプルとコストでより良い結果が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:05:03 GMT)
FastRM: An efficient and automatic explainability framework for multimodal generative models [10.2]
FastRMは、LVLMの説明可能な関連性マップを効率的に予測する手法である。 FastRMは計算時間を99.8%削減し、メモリフットプリントを44.4%削減した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:34:45 GMT)
Active Learning Design: Modeling Force Output for Axisymmetric Soft Pneumatic Actuators [10.2]
エラストマー材料からなる軟式空気圧アクチュエータ(SPA)は、大きなひずみと大きな力を与えることができる。同心ひずみ制限型軟質空気圧アクチュエータの力-圧力-高さ関係をモデル化する。この学習された物質モデルは,理論に基づくモデルと単純曲線整合アプローチより優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:43:00 GMT)
An Optimistic-Robust Approach for Dynamic Positioning of Omnichannel Inventories [9.9]
本稿では,データ駆動型・分散型・楽観的・ロバストなバイモーダル・インベントリ最適化 (BIO) 戦略を新たに導入する。 BIOのバイモーダルな性質は、従来のロバスト最適化(RO)のように、下方リスクのバランスをとる能力に起因している。 BIOは、ロバストネスを慎重にバランスしながら、高い平均性能を達成する従来のROに代わる、新しく、データ駆動で、分散のない代替手段を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:59:59 GMT)
Illuminating the Diversity-Fitness Trade-Off in Black-Box Optimization [9.8]
現実世界のアプリケーションでは、ユーザーは1つの高品質なソリューションよりも構造的に多様な設計選択を好むことが多い。本稿では, 所定のしきい値以上のペア距離を持つ一定数の解を同定する問題を考察する。このトレードオフが、根底にある最適化問題の性質にどのように依存するかを分析する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:14:29 GMT)
A Unified Virtual Mixture-of-Experts Framework:Enhanced Inference and Hallucination Mitigation in Single-Model System [9.8]
GPTやBERTのような生成モデルは、テキスト生成や要約といったタスクのパフォーマンスを大幅に改善した。しかし、「モデルが非現実的または誤解を招くコンテンツを生成する場所」という幻覚は、特に小規模アーキテクチャでは問題となる。本稿では,単一のQwen 1.5 0.5Bモデルにおいて,推論性能を高め,幻覚を緩和する仮想ミックス・オブ・エクササイズ(MoE)融合戦略を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:38:01 GMT)
CodeMMLU: A Multi-Task Benchmark for Assessing Code Understanding Capabilities of CodeLLMs [9.6]
CodeMMLUは、Code Large Language Modelsにおけるソフトウェアとコード理解の深さを評価するために設計されたベンチマークである。コード分析、欠陥検出、ソフトウェアエンジニアリングの原則など、さまざまな領域にまたがる2万近い質問が含まれている。評価の結果,最先端モデルでさえCodeMMLUと競合することが明らかとなった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:31:38 GMT)
Polynomial Time Quantum Gibbs Sampling for Fermi-Hubbard Model at any Temperature [9.6]
我々は、相互作用するフェルミオンに対応する摂動型リンドブレディアンの一定のギャップを最大結合強度まで証明する。これは格子フェルミオンのギャップの安定性に関する定理を用いて達成される。アプリケーションとして,検討されたシステムに対する分割関数の計算方法を説明する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:27:22 GMT)
SentenceKV: Efficient LLM Inference via Sentence-Level Semantic KV Caching [9.6]
SentenceKVは、セマンティックコヒーレンスを保持しながら推論効率を向上させるために設計された、新しいKVキャッシュアプローチである。本研究では,SentenceKVがモデル精度を損なうことなく,効率とメモリ使用量の両方において最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:08:57 GMT)
Communication-Efficient l_0 Penalized Least Square [9.6]
大規模データを用いた高次元疎線形回帰モデルに対する通信効率の良いペナル化回帰アルゴリズムを提案する。このアプローチには、拡張サポート検出とルート探索アルゴリズムに基づく、CESDARアルゴリズムという、最適化された分散システム通信アルゴリズムが組み込まれている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:32:15 GMT)
FingerSlid: Towards Finger-Sliding Continuous Authentication on Smart Devices Via Vibration [9.4]
移動体における振動モータと加速度計を用いて指の生体特性を検知する認証システムFingerSlidを提案する。 FingerSlidはさまざまなシナリオ下で多数の実験を通じて評価される。平均精度は95.4%で、99.5%の攻撃に耐えることができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:38:58 GMT)
Benchmarking Federated Machine Unlearning methods for Tabular Data [9.3]
マシンアンラーニングにより、モデルは要求時に特定のデータを忘れることができる。本稿では,フェデレートされた環境での機械学習手法のベンチマークに関する先駆的な研究について述べる。機械学習、ランダムフォレスト、ロジスティック回帰モデルの両方を用いて、この機能とインスタンスレベルでのアンラーニングについて検討する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:53:36 GMT)
Optimal or Greedy Decision Trees? Revisiting their Objectives, Tuning, and Performance [9.3]
我々は,ODTの比較的探索されていない2つの側面を同定し,解析する。実験により,180個の実・合成データセット上での最適および欲求的手法について,11の目的関数,6つのチューニング手法,および文献からの6つのクレームについて検討した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:35:39 GMT)
Markov $α$-Potential Games [9.2]
有限状態および有限作用を持つ任意のマルコフゲームは、マルコフ$alpha$-ポテンシャルゲームであることを示す。実際に重要なマルコフゲーム、2つの重要なクラス、マルコフ混雑ゲーム、摂動マルコフチームゲームについて研究する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:17:36 GMT)
TAMIS: Tailored Membership Inference Attacks on Synthetic Data [9.1]
微分プライベートな合成データ生成手法に対する新しいMIAであるTAMISを提案する。この攻撃は、最近公開された最先端の手法であるMAMA-MIAに基づいている。 TAMISはSNAKEチャレンジのレプリカでMAMA-MIAと同等あるいは類似のパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:08:48 GMT)
Observation of Quantum Darwinism and the Origin of Classicality with Superconducting Circuits [9.1]
自然に量子世界から日々の古典的な観察を合理化するにはどうすればいいのか? 量子ダーウィン主義は古典主義の出現を説明する魅力的な枠組みを提供する。我々は、古典性と量子相互情報の飽和をサポートする高度に構造化された分岐量子状態を観察した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:33:32 GMT)
HERA: Hybrid Edge-cloud Resource Allocation for Cost-Efficient AI Agents [9.1]
AIの領域では、GPT-4のような大規模言語モデル(LLM)がAIエージェントの運用の中心であり、主にクラウドで運用されている。ローカルベースの小型言語モデル(SLM)がより正確になるにつれて、クラウド排他的処理の必要性が再検討されている。本稿では,AIエージェントのサブタスクを局所的なSLMとクラウドベースのLLMに自動的に分割する適応反復レベルモデルセレクタ(AIMS)を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:36:13 GMT)
Using machine learning method for variable star classification using the TESS Sectors 1-57 data [9.0]
トランジット太陽系外惑星探査衛星(Transiting Exoplanet Survey Satellite, TESS)は、地球規模の太陽系外惑星を検出するために設計された全天球探査衛星である。約1,050,000光度曲線と2分間の周期を含む1～57セクターのデータを収集した。データをガイアの可変星カタログと交差マッチングすることで、さらなる分析のためにラベル付きデータセットを得た。我々は6046 EA, 3859 EW, 2058 CEP, 8434 DSCT, 482 RRab, 416 RRc, 9694 ROTを取得し, 新たに14092個の変光星を発見した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:58:23 GMT)
POPEN: Preference-Based Optimization and Ensemble for LVLM-Based Reasoning Segmentation [8.9]
既存のLVLMベースの推論セグメンテーション手法は、しばしば不正確なセグメンテーション結果とテキスト応答の幻覚に悩まされる。本稿では、これらの問題に対処し、改善された結果を達成するために設計された新しいフレームワークであるPOPENを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:51:01 GMT)
Local Information Matters: Inference Acceleration For Grounded Conversation Generation Models Through Adaptive Local-Aware Token Pruning [8.8]
Grounded Conversation Generation (GCG)は、オブジェクトセグメンテーションマスクとシームレスに連動する自然言語応答を生成するモデルを必要とする、新たなビジョンタスクである。 GLaMMやOMG-LLaVAといった最近のモデルは、多数の視覚トークンを処理するため、ピクセルレベルのグラウンド化を実現するが、かなりの計算コストがかかる。 FastV や PyramidDrop のような既存のトークンプルーニング手法は、正確な接地に不可欠な局所的な視覚的特徴を保存できない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:34:57 GMT)
The HCI GenAI CO2ST Calculator: A Tool for Calculating the Carbon Footprint of Generative AI Use in Human-Computer Interaction Research [8.7]
HCI(Human-Computer Interaction)研究における生成AI(GenAI)の利用の増加は、二酸化炭素排出量から気候への影響を誘導する。 HCIの研究者たちは、ハードウェアとそのエネルギー消費が平易な視点から隠されているクラウドベースのサービスを使うことが多い。 GenAI CO2ST Calculatorは、ジェネレーションAIを用いた研究におけるエネルギー消費と炭素フットプリントの推定を支援する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:02:45 GMT)
Think or Not Think: A Study of Explicit Thinking inRule-Based Visual Reinforcement Fine-Tuning [8.7]
マルチモーダル大言語モデル(MLLM)を用いた視覚分類のためのルールベース強化学習(RL)の微調整と思考プロセスの役割について検討した。等式精度の報酬を利用して微調整時のモデル思考を最小限に抑える新しいアプローチである textitNo-Thinking-RL を導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:52:37 GMT)
From Intuition to Understanding: Using AI Peers to Overcome Physics Misconceptions [8.6]
我々は、学生がニュートン力学の概念に関する基本的な物理学的誤解を正すのに役立つAI「ピア」を設計した。 165人の学生によるランダム化対照試験では、AI Peerと標的となる対話を行った学生はテスト後のスコアを平均10.5ポイント上回った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:09:13 GMT)
Detection of Disease on Nasal Breath Sound by New Lightweight Architecture: Using COVID-19 as An Example [8.5]
感染症、特に新型コロナウイルスは、世界的な健康問題であり続けている。本研究の目的は、スマートフォンで収集した鼻呼吸音声データを用いて、効率的で正確で費用対効果の高い新型コロナウイルス検出のための、新しい、軽量なディープニューラルネットワークを開発することである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:41:53 GMT)
$μ$KE: Matryoshka Unstructured Knowledge Editing of Large Language Models [8.5]
Matryoshka Unstructured Knowledge Editingは、メモリ更新と出力トークン間の依存関係を保存する。 $mu$KEは、最先端の方法よりも編集効率を最大12.33%向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:24:44 GMT)
DBF-UNet: A Two-Stage Framework for Carotid Artery Segmentation with Pseudo-Label Generation [8.2]
頸動脈セグメンテーションにおけるスパースアノテーション問題に対処する2段階セグメンテーションフレームワークを提案する。我々は,これらの中心線に沿ってアノテートされたスライスセントロイドとプロパゲートラベルを補間することにより,連続的な容器中心線を構築する。第2段階では,Dense Bidirectional Feature Fusion UNetを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:41:57 GMT)
Resource Allocation for RIS-Assisted CoMP-NOMA Networks using Reinforcement Learning [8.1]
この論文は、STAR-RIS、CoMP、NOMAの3つの変換技術の相乗的統合を探求する。この研究は、データレートの増大、スペクトル効率の向上、進化途上の6G開発環境のカバー範囲の拡大などにより、これらの技術が将来の無線ネットワークに革命をもたらす可能性を調査する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:14:01 GMT)
Convolutional Neural Networks Can (Meta-)Learn the Same-Different Relation [8.1]
人間は、関係を含む視覚的なタスクにおいて、CNNよりもはるかに優れている。メタラーニングによる学習では,従来のトレーニングと同一の差分関係を一般化できないCNNアーキテクチャが成功することを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:57:54 GMT)
Plan-and-Act using Large Language Models for Interactive Agreement [8.1]
最近の大規模言語モデル(LLM)はロボットの動作を計画することができる。状況的HRIにおけるLLMの適用の鍵となる問題は、「現在の人間の活動の反映」と「ロボットのタスクの優先順位付け」のバランスである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:41:05 GMT)
Global Intervention and Distillation for Federated Out-of-Distribution Generalization [7.9]
連合学習における属性スキューは、地元のモデルを非因果関係の学習に集中させる。本稿では,背景とラベルの急激な関係を断ち切るために,バックドア調整に多様な属性特徴を利用するFedGIDを提案する。 3つのデータセットの実験結果から、FedGIDは、見えないデータで主対象に集中するモデルの能力を向上することを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:36:24 GMT)
Towards scientific machine learning for granular material simulations -- challenges and opportunities [7.9]
粒状物質は粒状系の挙動を支配している。粒子スケールシミュレーションはこれらの相互作用に関する洞察を与えるが、計算コストはしばしば禁止される。このポジションペーパーは、最近のLorentz Center Workshop on "Machine Learning for Discrete Granular Media"から生まれた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:03:59 GMT)
Alleviating Performance Disparity in Adversarial Spatiotemporal Graph Learning Under Zero-Inflated Distribution [7.9]
対人訓練(AT)は、ゼロ・イン・ディストリクト(ZID)の下での多数派と少数派のパフォーマンス格差を悪化させるマイノリティクラスグラディエントと表現強化のためのフレームワークMinGREを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:31:39 GMT)
EMO: Edge Model Overlays to Scale Model Size in Federated Learning [7.8]
Federated Learning (FL)は、分散データを持つエッジデバイス上で機械学習モデルをトレーニングする。本稿では,SFL の課題を軽減しつつ,FL における大規模モデルのトレーニングを可能にするソリューションとして EMO を提案する。 EMOはFLと比較して17.77%の精度向上を実現し、通信コストを7.17倍まで削減し、SFLと比較して訓練時間を6.9倍まで短縮する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:34:58 GMT)
Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models [7.8]
フェデレート・プロンプト学習は,CLIP-like Vision-Language Model's (VLM's) によるファシリテート学習による堅牢な表現学習能力により,フェデレーション・プロンプト学習の恩恵を受ける。現在のフェデレートされたプロンプト学習手法は、通常、従来のFLパラダイムに制限されており、参加するクライアントは通常、サーバから単一のグローバル集約モデルしかダウンロードできない。適応確率の個人化混合(pFedMoAP)を提案する。これは、エキスパートの混合レンズ(MoE)を通して、迅速な学習プロセスをパーソナライズする新しいFLフレームワークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:53:12 GMT)
HCMA-UNet: A Hybrid CNN-Mamba UNet with Axial Self-Attention for Efficient Breast Cancer Segmentation [7.8]
本研究は,乳癌の病変分割のための新しいハイブリットセグメンテーションネットワークHCMA-UNetを提案する。我々のネットワークは軽量CNNバックボーンとMISMモジュールで構成される。我々の軽量モデルは2.87Mパラメータと126.44 GFLOPで優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:36:57 GMT)
Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention Lens [7.8]
LVLM(Large Vision-Language Models)の幻覚は、その信頼性を著しく損なう。本稿では,LVLMが視覚情報をどのように処理し,その処理が幻覚を引き起こすかについて述べる。本稿では,様々な頭部に情報を統合することで視覚的注意を調節する簡易な推論時間手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:33:30 GMT)
A Comparative Study of Scanpath Models in Graph-Based Visualization [7.6]
アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:51:18 GMT)
On-Chain Analysis of Smart Contract Dependency Risks on Ethereum [7.6]
私たちは2024年12月までに4100万以上の契約と1100億のインタラクションを分析します。私たちの結果は4つの重要な洞察をもたらします。私たちの仕事は、スマートコントラクト依存関係のリスクを理解するための、初めての大規模な基盤を提供します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:26:43 GMT)
On the Consistency of Multilingual Context Utilization in Retrieval-Augmented Generation [7.5]
大規模言語モデル(LLM)を用いた検索言語拡張生成(RAG)は,多言語質問応答タスクにおいて高い性能を示した。多言語RAGでは、検索されたパスは、ユーザが入力したクエリ以外の言語で書くことができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:55:23 GMT)
Hierarchical Flow Diffusion for Efficient Frame Interpolation [7.5]
本稿では,階層的拡散モデルを用いて,両側の光流を明示的にモデル化することを提案する。次に、フロー誘導画像合成器を用いて最終的な結果を生成する。本手法は他の拡散法に比べて10倍以上の精度で精度が向上する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:50:00 GMT)
Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service [7.3]
本稿では,テトゥーン語に特化したMTサービスであるtetun.orgの実際の使用パターンについて考察する。 10万件の翻訳要求を解析した結果,既存のコーパスに基づいて仮定に挑戦するパターンが明らかになった。この結果から,テトゥーンのような制度化されたマイノリティ言語のためのMTシステムは,教育的文脈に関連する領域の精度を優先すべきであることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:19:04 GMT)
Hawkeye:Efficient Reasoning with Model Collaboration [7.3]
CoT推論は,大規模言語モデル(LLM)の推論能力の向上に顕著な効果を示した。ほとんどのCoTトークンは不要であり、そのごく一部しか保持していないため、高品質な応答を生成するのに十分である。本稿では,大規模なモデルが簡潔なCoT命令を生成して,より小さなモデルに応答生成を誘導する,新しいトレーニング後推論フレームワークHAWKEYEを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:09:04 GMT)
Non-Determinism of "Deterministic" LLM Settings [7.0]
本研究では,10ランにまたがる8つの共通タスクに適用した場合に決定論的に設定された5つのLSMにおける非決定性について検討する。自然に発生する実行に最大15%の精度のばらつきがあり、最高のパフォーマンスと最悪のパフォーマンスのギャップがある。我々は,決定論の定量化に重点を置いた指標,Nでの合意率の総和はNで,TARa@Nで解析された回答の総和率はTARa@Nで紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:20:06 GMT)
ComFairGNN: Community Fair Graph Neural Network [6.9]
グラフニューラルネットワーク(GNN)におけるコミュニティレベルのバイアスを軽減するための新しいフレームワークを提案する。提案手法では,GNNにおける局所分布の多様さから生じるバイアスに対処する,学習可能なコアセットに基づくデバイアス機能を用いる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:14:17 GMT)
Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models [6.9]
外傷後ストレス障害 (PTSD) は, 臨床現場ではまだ診断されていない。本研究では,臨床面接書からPTSDを検出するための自然言語処理手法について検討した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:06:28 GMT)
Orientation Scores should be a Piece of Cake [6.9]
位置空間 $mathbbR2$ から位置空間 $mathbbR2times S1$ へ持ち上げ、位置方向の不確実性を最小化する。これらの最小不確実性状態がケーキウェーブレットによってよく近似されていることを示す。我々は,PDE-)G-CNNのネットワークの複雑さを低減し,モデルの性能にわずかに影響を及ぼすことなく,解釈可能性を向上させることを実験的に示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:09:20 GMT)
Accelerating Causal Network Discovery of Alzheimer Disease Biomarkers via Scientific Literature-based Retrieval Augmented Generation [6.8]
アルツハイマー病(AD)の診断は、早期発見、正確な疾患のステージング、標的治療、疾患進行のモニタリングの改善を可能にする。これらの因果関係を理解することは複雑であり、広範な研究が必要である。検索強化世代(RAG)を利用した先進的な大規模言語モデル(LLM)は、バイオマーカーの因果ネットワークの構築を支援し、さらなる医学的分析に役立つだろうか? 我々は過去25年間に発行されたAD関連研究論文200点を収集し,RAGと科学文献を統合してADバイオマーカーを抽出し,それらの因果関係を生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:15:17 GMT)
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.8]
大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:46:46 GMT)
Hamiltonian Dynamics Learning: A Scalable Approach to Quantum Process Characterization [6.7]
短時間のハミルトン力学に特化して設計された効率的な量子プロセス学習法を提案する。我々は、量子機械学習の応用を実証し、このプロトコルは、ユニタリ変換を直接学習することで、変分量子ニューラルネットワークの効率的なトレーニングを可能にする。この研究は、実用的な量子力学学習のための新しい理論的基盤を確立し、短期的およびフォールトトレラントな量子コンピューティングの両方においてスケーラブルな量子プロセスのキャラクタリゼーションの道を開いた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:17:33 GMT)
Smart Contracts in the Real World: A Statistical Exploration of External Data Dependencies [6.7]
10,500件のスマートコントラクトを分析し,古いものや誤ったものを除くと,9,356件の有効契約を保持できた。コントラクトコードを抽象構文木に変換するためにコード解析を採用し、外部データ依存関係に関連するキーワードを特定しました。 9,356の有効なスマートコントラクトを手作業で分類し、アプリケーションドメインと外部データとの典型的なインタラクション方法を確認しました。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:53:38 GMT)
MPCritic: A plug-and-play MPC architecture for reinforcement learning [6.7]
本稿では,MPCriticについて述べる。MPCriticは機械学習に優しいアーキテクチャで,MPCツールとシームレスに連携する。 MPCriticは、パラメータ化されたMPC問題によって定義された損失状況を利用して、バッチトレーニングステップに対する"ソフト"最適化に重点を置いている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:07:07 GMT)
Leveraging Large Language Models for Automated Definition Extraction with TaxoMatic A Case Study on Media Bias [6.6]
TaxoMaticは、学術文献からの定義抽出を自動化するフレームワークである。手動で評価された2,398項目のデータセットに基づいて分析し、Claude-3-sonnetは関連分類と定義抽出の両方において最良の結果を得た。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:47:16 GMT)
CFIRE: A General Method for Combining Local Explanations [6.3]
我々は,局所的な説明から,忠実で理解しやすい,そして完全なグローバルな意思決定ルールを計算するための,新しいeXplainable AIアルゴリズムを提案する。提案手法は,特定のブラックボックス決定に対して,各サンプルに対してどの寸法が重要かを示す局所的説明器で使用することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:04:33 GMT)
PolygoNet: Leveraging Simplified Polygonal Representation for Effective Image Classification [6.3]
本稿では,優越点や輪郭座標を用いた画像の多角形表現を効果的に活用する手法を提案する。本手法は, 計算要求を大幅に削減し, 訓練を加速し, 資源を保存する。ベンチマークデータセットの実験は、複雑性を減らし、一般化を改善し、エッジコンピューティングアプリケーションを容易にするためのアプローチの有効性を検証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:05:00 GMT)
A novel algorithm for optimizing bundle adjustment in image sequence alignment [6.3]
本稿では,低温電子トモグラフィーにおける画像シーケンスアライメントの文脈におけるバンドル調整(BA)モデルを最適化するための新しいアルゴリズムを提案する。アルゴリズムの性能を評価するために、合成データセットと実世界のデータセットの両方に関する大規模な実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:21:16 GMT)
Misaligned Roles, Misplaced Images: Structural Input Perturbations Expose Multimodal Alignment Blind Spots [6.3]
本稿では,ユーザとアシスタント間の役割混乱を利用した対人攻撃のクラスであるロール・モダリティ・アタック(RMA)を紹介する。 RMAはクエリ自体を変更することなく入力構造を操作する。本稿では,入力の急激な摂動に対してモデルを頑健にするための逆トレーニング手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:54:36 GMT)
KTCR: Improving Implicit Hate Detection with Knowledge Transfer driven Concept Refinement [6.3]
社会的・政治的文脈の変化は、新しいタイプのヘイトコンテンツや、これまで認識されていなかったヘイトパターンにつながる。最近の文献では、既存のヘイトデータセットを豊かにするデータ拡張ベースの手法を提案する。また, さらに増量用サンプルが加わったことにより, モデルの性能が低下することが観察された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:48:20 GMT)
Hierarchical Local-Global Feature Learning for Few-shot Malicious Traffic Detection [6.1]
悪意あるネットワーク攻撃は、ますます頻繁で洗練されたものになりつつある。ルールベースや機械学習ベースのアプローチを含む従来の検出方法は、出現する脅威を正確に識別するのに苦労する。我々は,新しい階層的な数ショットの悪意のあるトラフィック検出フレームワークであるHLoGを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:56:44 GMT)
High-Quality Pseudo-Label Generation Based on Visual Prompt Assisted Cloud Model Update [6.1]
既存の方法は、しばしば信頼性の高いクラウドモデルを仮定し、潜在的なエラーを無視したり、複雑な分散シフトに苦労する。本稿では,クラウド適応型高品質擬似ラベル生成(CA-HQP)を提案する。 Bellevueトラフィックデータセットの実験により、CA-HQPは既存の手法と比較して、擬似ラベルの品質を著しく改善することが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:20:16 GMT)
A Clustering Method with Graph Maximum Decoding Information [6.1]
本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。 CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。 3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:10:49 GMT)
Value Iteration for Learning Concurrently Executable Robotic Control Tasks [6.1]
本稿では,複数のタスクを同時に実行するための冗長ロボットの訓練手法を提案する。まず、学習された価値関数間のタスク独立性の概念を定義します。次に、タスク独立の定義を用いて、その制御目的を達成するための政策を促進するコスト関数を提案します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:31:36 GMT)
ReaLitE: Enrichment of Relation Embeddings in Knowledge Graphs using Numeric Literals [6.0]
リンク予測に適した知識グラフ埋め込み(KGE)手法は、グラフの実体と関係に重点を置いている。 ReaLitEは、エンティティの数値属性を動的に集約し、結合関係の埋め込みとマージする新しい関係中心KGEモデルである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:38:22 GMT)
Decomposition of one-layer neural networks via the infinite sum of reproducing kernel Banach spaces [6.0]
RKBSsの和は特徴空間の直和と互換性があることが示される。積分 RKBS を$p$-norm RKBSs の和に分解する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:21:48 GMT)
DynMoLE: Boosting Mixture of LoRA Experts Fine-Tuning with a Hybrid Routing Mechanism [6.0]
DynMoLEは、ルータの確率分布のTsallisエントロピーに基づいて、専門家の選択を動的に調整するハイブリッドルーティング戦略である。我々はDynMoLEが大幅な性能向上を実現していることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:14:19 GMT)
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations [5.9]
近年,ウェブ検索の結果を大規模言語モデル (LLM) に統合することで,人々が生成したコンテンツの検証に利用するかどうかが疑問視されている。本研究では,LLM生成コンテンツの評価において,検索結果の提供が参加者の認識精度と信頼度に与える影響について検討した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:36:14 GMT)
Nonhuman Primate Brain Tissue Segmentation Using a Transfer Learning Approach [5.8]
非ヒト霊長類(NHP)は、人間の脳機能や神経疾患を理解するための重要なモデルである。 NHPの脳組織セグメンテーションは神経疾患を理解するために重要であるが、注釈付きNHP脳MRIデータセットが不足しているため困難である。本稿では,人間の脳MRIデータから伝達される知識を活用するために,STU-Netとトランスファーラーニングを用いた新しいアプローチを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:52:54 GMT)
Toward Interpretable Sleep Stage Classification Using Cross-Modal Transformers [5.8]
本研究では,睡眠段階分類のためのトランスを用いたクロスモーダルトランスを提案する。本手法は,最先端の手法と比較して,パラメータ数とトレーニング時間を大幅に短縮する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:21 GMT)
Towards a Unified Query Plan Representation [5.7]
データベースシステムでは、クエリプランはクエリを実行するための一連の具体的な内部ステップである。複数のテストアプローチでは、クエリプランを使用してバグを見つける。統合されたクエリプラン表現により,これらの手法の実装が容易になることが期待できる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:53:34 GMT)
VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots [5.7]
本稿では,航空ロボティクスコースのための,オープンソースの知覚中心型ハードウェア・イン・ザ・ループ(HITL)フォトリアリスティックテストフレームワークであるVizFlytを紹介する。我々は,3Dガウススプラッティングを用いたリアルタイム・光実写型視覚センサの幻覚化のために,外部位置決めシステムからのポーズを利用する。これにより、障害物に衝突するリスクを伴わずに、自律的なアルゴリズムを空中ロボット上で無ストレスでテストすることができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:39:54 GMT)
Data-Driven Knowledge Transfer in Batch $Q^*$ Learning [5.7]
バッチ定常環境に集中して動的意思決定における知識伝達について検討する。本稿では,一般関数近似を用いたTransferred Fitted $Q$-Iterationアルゴリズムのフレームワークを提案する。 Q*$関数の最終学習誤差は、単一のタスクレートから大幅に改善されていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:39:42 GMT)
Automated detection of atomicity violations in large-scale systems [5.7]
我々は,大規模言語モデル (LLM) エージェントと静的解析を統合し,実世界のプログラムにおける原子性違反を検出するフレームワークであるCloverを提案する。 Cloverは92.3%/86.6%の精度/リコールを達成した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:13:29 GMT)
P2NIA: Privacy-Preserving Non-Iterative Auditing [5.6]
AI法の出現により、リスクの高いAIシステムの倫理的コンプライアンスを評価する必要性が高まっている。従来の監査手法は、プラットフォームのアプリケーションプログラミングインターフェース(API)に依存している。 P2NIAは,監査者とプラットフォーム双方の相互に有益なコラボレーションを提案する新しい監査手法である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:04:58 GMT)
AttentiveGRU: Recurrent Spatio-Temporal Modeling for Advanced Radar-Based BEV Object Detection [5.6]
鳥眼視(Bird's-eye view, BEV)は、先進的な3Dレーダーによる知覚システムにおいて重要である。本稿では,アテンラプティブ(AttenRUtive)について紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:10:47 GMT)
Impact of Data Duplication on Deep Neural Network-Based Image Classifiers: Robust vs. Standard Models [5.5]
トレーニングセット、特に言語モデルにおける重複したデータは、かなりの注目を集めています。本分析は, モデルトレーニングの効率に悪影響を及ぼす要因として, 重複画像の存在が示唆された。重複サンプルが均一に選択されたとしても、重複量の増加は精度を著しく向上させるには至らない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:48:00 GMT)
SHIFT SNARE: Uncovering Secret Keys in FALCON via Single-Trace Analysis [5.4]
本稿では,FALCONに対する新規なシングルトレースサイドチャネル攻撃を提案する。我々は、FALCON鍵生成方式における離散ガウスサンプリング動作を目標とする。提案された攻撃はARM Cortex-M4マイクロコントローラに実装されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:03:24 GMT)
Generative Data Assimilation of Sparse Weather Station Observations at Kilometer Scales [5.4]
そこで本研究では,現実的に複雑な1kmスケールの気象条件下でのスコアベースデータ同化の実現可能性を示す。 40の気象観測所からの観測を取り入れることで、左の観測所で10%低いRMSEが達成される。ますます野心的な地域国家ジェネレータと、In situ、地上ベース、衛星リモートセンシングデータストリームの集合を組み合わす拡張を探求する時期だ。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:48:48 GMT)
Experiential Semantic Information and Brain Alignment: Are Multimodal Models Better than Language Models? [5.4]
計算言語学における一般的な仮定は、マルチモーダルモデルによって学習されたテキスト表現が言語のみのモデルよりも豊かで人間的なものであるということである。コントラッシブなマルチモーダルモデルからの単語表現と、それらが情報を取得する範囲における言語のみの表現を比較した。その結果,言語のみのモデルは両面でマルチモーダルモデルよりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:28:38 GMT)
Assessing the Role of Datasets in the Generalization of Motion Deblurring Methods to Real Images [5.4]
本稿では, 単純で効果的なモデルに基づいて, シャープ/ブルーのイメージペアを生成するための効率的な手続き手法を提案する。これにより、現実的なブラー特性を模倣する、無限に多様なトレーニングペアを生成することができる。実写映像のブルーリングにおける最終課題に対して,より優れた一般化性能を観察した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:22:09 GMT)
DELTA: Decomposed Efficient Long-Term Robot Task Planning using Large Language Models [5.4]
大規模言語モデル(LLM)は多くの研究分野に革命をもたらした。膨大な知識の収集にもかかわらず、大きな言語モデルは幻覚やドメイン情報の欠落によって実現不可能な計画を生成する可能性がある。我々は,新しいLLMインフォームドタスク計画手法であるDELTAを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:33:53 GMT)
Exposing the Ghost in the Transformer: Abnormal Detection for Large Language Models via Hidden State Forensics [5.4]
重要なアプリケーションにおける大規模言語モデル(LLM)は、重大な信頼性とセキュリティリスクを導入している。これらの脆弱性は悪意あるアクターによって武器化され、不正アクセス、広範囲にわたる誤報、システムの完全性を侵害した。本研究では,LLMの異常な挙動を隠蔽法で検出する手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:58:14 GMT)
QSViT: A Methodology for Quantizing Spiking Vision Transformers [5.3]
ビジョントランスフォーマー(ViT)ベースのモデルでは、ビジョンベースのAIタスクにおける最先端のパフォーマンス(精度など)が示されている。しかし、リソースに制約のある組み込みAIシステムにおいて、その能力を実現することは、その固有の大きなメモリフットプリントのために困難である。本稿では,SViTモデルを体系的な量子化戦略により圧縮する新しい設計手法であるQSViTを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:34:46 GMT)
Enabling Efficient Processing of Spiking Neural Networks with On-Chip Learning on Commodity Neuromorphic Processors for Edge AI Systems [5.3]
ニューロモルフィックプロセッサ上のスパイキングニューラルネットワーク(SNN)アルゴリズムは、超低消費電力/エネルギーAI計算を提供する。本稿では,コモディティニューロモルフィックプロセッサ上での効率的なSNN処理を実現するための設計手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:52:03 GMT)
Mixing Time of Open Quantum Systems via Hypocoercivity [5.3]
オープン量子系の混合時間を推定するための既存のアプローチは、しばしばリンドブラディアン発生器のスペクトルギャップ推定に依存する。本研究では,ハミルトニアン系と散逸系系を別々に扱う開量子系の混合時間を推定する理論的枠組みを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:33:53 GMT)
Exploring Multidimensional Checkworthiness: Designing AI-assisted Claim Prioritization for Human Fact-checkers [5.2]
我々は,AIによるクレーム優先順位付けのプロトタイプを開発し,クレームの優先順位付けにファクトチェッカーが多次元のチェック価値のある要素をどのように利用するかを探究する。我々は、階層的な優先順位付け戦略のファクトチェッカーが暗黙的に使用していることを発見し、彼らのワークフローの過小評価された側面を明らかにした。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:19:22 GMT)
DropGaussian: Structural Regularization for Sparse-view Gaussian Splatting [5.2]
本稿では,DropGaussianと呼ばれる3次元ガウススプラッティングの簡易な変更による事前自由化手法を提案する。具体的には、トレーニングプロセス中にランダムにガウスをドロップアウトで除去し、非除外ガウスがより大きな勾配を持つようにします。このような単純な操作は、オーバーフィッティング問題を効果的に軽減し、新規なビュー合成の品質を高める。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:23:34 GMT)
Introducing Repository Stability [5.2]
障害後の平衡に戻るためのリポジトリ活動能力であるリポジトリの安定性を理解するためのフレームワークを導入する。このフレームワークは,コミットパターン,イシュー解決,プルリクエスト処理,コミュニティの関与という4つの指標を通じて,安定性を定量化する。このフレームワークは制御理論の概念を現代の協調ソフトウェア開発と橋渡しし、将来の経験的検証の基礎を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:47:29 GMT)
Class-Dependent Perturbation Effects in Evaluating Time Series Attributions [5.1]
以前見過ごされたクラス依存効果を特徴属性の指標で示す。解析の結果,摂動に基づく評価は,本質的な属性品質よりも,特定のモデル行動を反映する可能性が示唆された。本稿では,これらの効果の評価と評価を支援するために,クラス認識型ペナルティ用語を用いた評価フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:19:41 GMT)
GaussianRoom: Improving 3D Gaussian Splatting with SDF Guidance and Monocular Cues for Indoor Scene Reconstruction [5.1]
本稿では,SDFと3DGSを統合し,正確な幾何再構成とリアルタイムレンダリングを行う統合最適化フレームワークを提案する。本手法は, 表面再構成と新しいビュー合成の両面において, 最先端の性能を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:49:10 GMT)
Lean Formalization of Generalization Error Bound by Rademacher Complexity [5.1]
一般化誤差は、与えられたトレーニングデータにおける学習マシンのパフォーマンスと、目に見えないテストデータとのギャップを定量化する。我々はLean 4定理証明器において、ラデマッハ複雑性を用いて一般化誤差を定式化する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:26:31 GMT)
Reducing Formal Context Extraction: A Newly Proposed Framework from Big Corpora [5.0]
本研究では,自由テキストから概念階層を抽出する際の形式的文脈を削減する枠組みを提案する。我々は、WordNetベースの手法と周波数ベースの手法のハイブリッドを用いて、形式的文脈のサイズを小さくすることで、これを実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:24:07 GMT)
A Proposed Hybrid Recommender System for Tourism Industry in Iraq Using Evolutionary Apriori and K-means Algorithms [5.0]
本研究では,進化的AprioriとK-meansクラスタリングアルゴリズムを組み合わせたハイブリッドレコメンデーションシステムを提案する。このシステムは、ユーザの好みやコンテキスト情報に合わせて、パーソナライズされたレコメンデーションと観光地のクラスタを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:28:13 GMT)
Efficient State Estimation of a Networked FlipIt Model [5.0]
攻撃が伝播するネットワークと、ネットワークの真の状態のノイズ信号を提供する侵入検知システムと、コンピュータのサブセットをいつでも掃除できるディフェンダーの能力を用いて、コンピュータネットワーク上での感染拡大を調査する。ブールカルマンフィルタは、攻撃防御力学とノイズ観測から隠れた真の状態を推定することにより、最適推定問題を解くために用いられる。本稿では,疫病モデル文献に触発された平均場推定手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:13:56 GMT)
On the Robustness of Agentic Function Calling [5.0]
大規模言語モデル(LLM)は、タスクのための特定のツールを呼び出すことができる機能呼び出し(FC)機能を備えた、自律的なエージェントとしてますます機能している。本稿では,2つの重要な領域においてFCのロバスト性を評価するベンチマークを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:48:26 GMT)
PhyT2V: LLM-Guided Iterative Self-Refinement for Physics-Grounded Text-to-Video Generation [5.0]
我々は、現在のT2Vモデルによるビデオ生成能力をアウト・オブ・ディストリビューション領域に拡張する、データに依存しない新しいT2V技術であるPhyT2Vを提案する。実験の結果,PhyT2Vは既存のT2Vモデルと実世界の物理規則との適合性を2.3倍改善し,T2Vプロンプトエンハンサーに比べて35%改善した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:33:55 GMT)
Optimal generalisation and learning transition in extensive-width shallow neural networks near interpolation [5.0]
教師が指導する2層ニューラルネットワークを用いた教師型学習モデルについて考察する。任意の活性化関数に対するネットワークのベイズ最適一般化誤差を近似する有効な理論を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:32:05 GMT)
Domain Adaptation Under MNAR Missingness [5.0]
現在のドメイン適応法は、ミス・アット・ランダム(MAR)の欠失メカニズムに制限されている。妥当な仮定の下では、MNAR欠落の問題は計算問題に還元できることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:03:56 GMT)
BounTCHA: A CAPTCHA Utilizing Boundary Identification in Guided Generative AI-extended Videos [4.9]
ボットは、既存のCAPTCHAシステムの多くをバイパスし、Webアプリケーションに重大なセキュリティ上の脅威を生じさせている。ビデオのトランジションやディスラプションにおける境界に対する人間の認識を活用するCAPTCHA機構であるBounTCHAの設計と実装を行う。我々は,境界同定における人間の時間偏差データ収集のためのプロトタイプを開発し,実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:18:58 GMT)
GameVibe: A Multimodal Affective Game Corpus [4.8]
本稿では,マルチモーダル・オーディオ視覚刺激による感性コーパスであるGameVibeについて紹介する。コーパスは30のゲームにまたがって公開されている様々なゲームプレイセッションのビデオで構成されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:14:18 GMT)
Remember, but also, Forget: Bridging Myopic and Perfect Recall Fairness with Past-Discounting [4.8]
マルチエージェント設定における動的リソース割り当ては、時間とともに公平さとバランスをとる必要があることが多い。人間の公正判断は時間的距離とともに進化するという行動的洞察に触発され,過去の分散メカニズムを取り入れた時間的公正のための新しい枠組みを導入する。本稿では, 付加的・平均的ユーティリティ・コンテキストにおけるディスカウント・リコール・フェアネスの定式化について詳述し, そのメリットを実例で説明するとともに, バランスよくスケーラブルな資源配分戦略を設計する上での意義について論じる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:42:17 GMT)
Challenges of Interaction in Optimizing Mixed Categorical-Continuous Variables [4.7]
CatCMAは混合カテゴリー連続変数を最適化する手法として提案されている。 CatCMAで特に問題となる2種類の変数相互作用を同定する。本稿では,温かい開始戦略とハイパー表現手法の2つのアルゴリズム成分を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:31:54 GMT)
GS_DravidianLangTech@2025: Women Targeted Abusive Texts Detection on Social Media [4.6]
虐待的スピーチ(Abusive speech)とは、弱い個人やグループに対する憎悪を和らげたり、扇動したりすることを目的としたコミュニケーションのこと。本稿では,ソーシャルメディアプラットフォーム上で女性をターゲットとした乱用テキストの検出に焦点をあてる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:00:07 GMT)
MSSFC-Net:Enhancing Building Interpretation with Multi-Scale Spatial-Spectral Feature Collaboration [4.5]
リモートセンシング画像からの解釈を構築するには、主に2つの基本的なタスクがある。リモートセンシング画像における共同ビルディング抽出と変更検出のためのマルチスケール空間スペクトル特徴協調型デュアルタスクネットワーク(MSSFC-Net)を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:10:23 GMT)
Highway to Hull: An Algorithm for Solving the General Matrix Code Equivalence Problem [4.5]
行列符号同値問題は、2つの行列空間 $mathcalC,mathcalDsubset mathbbF_qmtimes n$ of dimension $k$ で与えられる。本稿では,一般の場合の問題を解くアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:39:31 GMT)
PharMolixFM: All-Atom Foundation Models for Molecular Modeling and Generation [4.4]
我々は全原子基盤モデルを構築するための統一フレームワークであるPharMolixFMを提案する。我々のフレームワークは、最先端のマルチモーダル生成モデルを用いた3つの変種を含む。 PharMolixFM-Diffはタンパク質-小分子ドッキングにおける競合予測精度を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:12:44 GMT)
Phase-shifted remote photoplethysmography for estimating heart rate and blood pressure from facial video [4.4]
心拍数と血圧は、心臓血管系のモニタリングにとって重要な生体情報である。本論文では,心拍数と血圧を推定する視覚的手法を提案する。本論文では,2段階の深層学習フレームワークを,BP-NetとBBP-Netで構成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:04:22 GMT)
Large-Scale Multi-omic Biosequence Transformers for Modeling Protein-Nucleic Acid Interactions [4.4]
我々は,これまでで最大のオープンソースマルチオミック基盤モデルについて紹介する。これらのマルチオミクスモデルは、様々な単一オミクス分布間の結合表現を学習可能であることを示す。また,MOMを微調整して,タンパク質-核酸相互作用タスクの最先端結果が得られることを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:10:17 GMT)
Prompting Forgetting: Unlearning in GANs via Textual Guidance [4.4]
本稿では,テキストプロンプトのみを用いて,事前学習されたGANから概念を選択的に解放する新しいフレームワークであるText-to-Unlearnを提案する。我々のアプローチは、追加のデータセットや教師付き微調整を必要とせずに、未学習プロセスをガイドする。私たちの知る限り、Text-to-Unlearnは、GANのための最初のクロスプラットフォームなアンラーニングフレームワークです。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:18:40 GMT)
AutoML Benchmark with shorter time constraints and early stopping [4.4]
Automated Machine Learning (AutoML)は、データ上に機械学習(ML)モデルを自動的に構築する。 AutoML Benchmark (AMLB)は、104タスクにわたる1時間と4時間の時間予算を使用してAutoMLフレームワークを評価することを提案した。この研究は、ベンチマークで使用される全体的な計算を減らし、より少ない時間制約と早期停止の使用という2つの方法を検討する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:22:15 GMT)
OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery [4.3]
建築特性は空間データ基盤において重要な役割を担い、エネルギーシミュレーション、リスク評価、環境モデリングなどの応用を支援する。近年の進歩により、リモートセンシングとストリートレベルの画像を用いた客観的建物属性の抽出とタグ付けが可能になった。この研究は,クラウドソースデータを活用したオープンなフレームワークであるOpenFACADESを導入して,そのギャップを埋めるものである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:20:13 GMT)
GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS [4.3]
自律型GISの概念を詳述するとともに,その5つの目標,5レベルの自律性,5つのコア機能,3つの運用規模を定義する枠組みを提案する。我々は,4つの概念実証GISエージェントを用いて,自律型GISがデータ検索,空間解析,マップ作成を行う方法を示した。本稿は、GISが従来のものから自律的な理由づけ、導出、革新、先進的なソリューションを超えて世界的課題を推し進める未来を構想する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:58:17 GMT)
CellVTA: Enhancing Vision Foundation Models for Accurate Cell Segmentation and Classification [4.3]
本稿では,セルインスタンス分割のための視覚基盤モデルの性能を向上させる新しい手法であるCell Vision Transformer with Adapterを提案する。提案手法は,ViTのコアアーキテクチャを保存し,事前学習した基礎モデルとのシームレスな統合を保証する。実験の結果,CellVTAはCoNICデータセットで0.538 mPQ,PanNukeデータセットで0.506 mPQを達成した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:36:46 GMT)
Spingarn's Method and Progressive Decoupling Beyond Elicitable Monotonicity [4.3]
我々は、ある非単調な環境下での一般局所収束解析を開発する。緩和パラメータを各部分空間の非単調性に結びつける条件下で収束性を証明する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:26:01 GMT)
ParallelFlow: Parallelizing Linear Transformers via Flow Discretization [4.3]
行列値状態空間モデル(SSM)を用いた線形注意モデル解析のための理論的枠組みを提案する。我々のアプローチであるParallel Flowsは、時間的ダイナミクスを実装制約から体系的に分離する視点を提供します。具体的応用として、最近の理論的進歩によって動機付けられた一般化された低ランク設定でDeltaNetを解析する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:34:07 GMT)
Universal Structure of Computing Moments for Exact Quantum Dynamics: Application to Arbitrary System-Bath Couplings [4.3]
オープン量子系における相関関数の高次モーメントの計算方法を提案する。我々の発見は、複雑なオープン量子系に対する正確な力学への有望な道のりを示唆している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:58:55 GMT)
Coinductive Proofs of Regular Expression Equivalence in Zero Knowledge [4.2]
Crepeは正規表現同値証明を符号化する最初のプロトコルである。 PSPACE完全問題をターゲットにした最初のZKプロトコルも導入する。クレープは、それぞれ数秒で大きな証明を検証できる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:25:34 GMT)
Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales [4.2]
拡散モデルの量子化は、計算コストとメモリ帯域幅の使用量を削減するために近年研究されている。テキスト・ツー・イメージ生成タスクでは、Winogradによる8ビット完全量子化拡散モデルにより、ほぼロスレスな品質が得られる。画像分類では,最先端のWinograd PTQ 法を 1.62% と 2.56% で上回っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:31:42 GMT)
FSSUWNet: Mitigating the Fragility of Pre-trained Models with Feature Enhancement for Few-Shot Semantic Segmentation in Underwater Images [4.2]
Few-Shot Semantic (FSS)は、最近データスカースドメインで進歩している。既存のFSS法は水中環境への一般化に苦慮することが多い。機能強化を伴う水中画像のためのFSSフレームワークFSSUWNetを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:09:15 GMT)
Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users [4.1]
主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:54:33 GMT)
How Well do LLMs Compress Their Own Chain-of-Thought? A Token Complexity Approach [4.1]
推論長とモデル性能の関係について,最初の系統的研究を行った。このトレードオフは、非常に明確な推論チェーンにまたがって持続することを示す。提案手法は, 理論的な限界から遠く離れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:41:36 GMT)
Causal Models for Growing Networks [4.1]
まず、96個の因果有向非巡回グラフ(DAG)モデルをノード対上で列挙する。次に、ノード境界化の下で閉じた祖先集合を持つ21のクラスに分割する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:52:24 GMT)
FDDet: Frequency-Decoupling for Boundary Refinement in Temporal Action Detection [4.0]
大規模な事前訓練されたビデオエンコーダは、背景の乱雑さと無関係なセマンティクスを導入し、コンテキストの混乱と境界に繋がる。本稿では,事前学習したモデルから得られた雑音のセマンティクスをフィルタリングすることで,行動識別性を向上させる周波数対応デカップリングネットワークを提案する。本手法は時間的行動検出ベンチマークにおける最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:57:37 GMT)
NeuRadar: Neural Radiance Fields for Automotive Radar Point Clouds [4.0]
我々は、レーダー点雲、カメラ画像、ライダー点雲を共同で生成するNeuRadarについて紹介する。レーダNeRFのさらなる開発を促進するため,NeuRadarのソースコードをリリースする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:50:19 GMT)
Deep learning for state estimation of commercial sodium-ion batteries using partial charging profiles: validation with a multi-temperature ageing dataset [3.9]
実験では、実験室の2つの電池モジュールとともに、53個の単細胞を4つの温度で収集した。部分充電プロファイルを用いて,SOC,キャパシティ,SOHを同時に予測することができた。 SOCは0.998ドル,SOHは0.997ドルであった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:28:13 GMT)
A Conformal Risk Control Framework for Granular Word Assessment and Uncertainty Calibration of CLIPScore Quality Estimates [3.9]
本稿では,CLIPScore分布の生成と校正のための簡易かつ効果的な戦略を提案する。提案手法は,所望のリスクレベルに適合した形式的保証を提供しながら,単語の一致を効果的に検出する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:25:00 GMT)
Convergence of Decentralized Actor-Critic Algorithm in General-sum Markov Games [3.9]
一般的なマルコフゲームにおける学習アルゴリズムの特性について検討する。特に,各エージェントがアクター批判学習を動的に採用する分散アルゴリズムに着目した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:36:00 GMT)
Neural Approaches to SAT Solving: Design Choices and Interpretability [3.9]
本稿では,ブール充足可能性問題に適用したグラフニューラルネットワークの包括的評価を行う。我々は、いくつかの訓練改善、特に、新しい最寄りの課題監督手法を導入する。ニューラルネットワーク更新を繰り返す可変クラスグラフ表現の適合性について実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:31:01 GMT)
TOBUGraph: Knowledge Graph-Based Retrieval for Enhanced LLM Performance Beyond RAG [3.9]
TOBUGraphは、構造化されていないデータから知識グラフを構築するグラフベースの検索フレームワークである。構造化された知識とデータ間の多様な関係を抽出し、RAGのテキストとテキストの類似性を超えた。 ToBUGraphの有効性を実証する。TOBUは、個人記憶の組織化と検索のための実世界のアプリケーションである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:03:15 GMT)
Individualized Policy Evaluation and Learning under Clustered Network Interference [3.9]
本稿では,クラスタ化されたネットワーク干渉下での最適個別処理規則(ITR)の評価と学習の問題点について考察する。 ITRの実証性能を評価するための推定器を提案する。学習ITRに対する有限サンプル残差を導出し、効率的な評価推定器の使用により学習ポリシーの性能が向上することを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:20:32 GMT)
Learned Image Compression and Restoration for Digital Pathology [3.7]
デジタル病理画像は医療診断において重要な役割を担っているが、その超高解像度と大きなファイルサイズは、ストレージ、トランスミッション、リアルタイム可視化に重大な課題をもたらす。スライド画像全体(WSI)に特化して設計された新しいディープラーニングベースの画像圧縮フレームワークCLERICを提案する。 CLERICは学習可能なリフトスキームと高度な畳み込み技術を統合し、重要な病理情報を保存しながら圧縮効率を向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:06:51 GMT)
Denoising guarantees for optimized sampling schemes in compressed sensing [3.6]
本研究では,計測ノイズによる誤差が,測定回数の増加とともに消失することを示す理論的保証を提供する。すべての結果は、低次元部分空間の和集合に含まれる前の集合に当てはまる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:04:03 GMT)
Independent and Decentralized Learning in Markov Potential Games [3.5]
マルチエージェント強化学習ダイナミクスについて検討し、無限水平割引マルコフポテンシャルゲームにおけるその挙動を解析する。我々は、プレイヤーがゲームパラメータを知らない、コミュニケーションやコーディネートができない、独立的で分散的な設定に焦点を当てる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:38:18 GMT)
Explainable Bayesian Optimization [3.5]
TNTRulesは、BOレコメンデーションのグローバルとローカルの両方の説明を提供する新しいアルゴリズムである。我々は、確立されたXAI指標(正正性、完全性、コンパクト性)を用いてTNTRulesを評価し、適応されたベースライン手法と比較した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:10:09 GMT)
Comparative Explanations: Explanation Guided Decision Making for Human-in-the-Loop Preference Selection [3.5]
本稿では,MOLONE(Multi-Output LOcal Narrative Explanation)を紹介する。 MOLONEは、PBO(Human-in-the-loop Preference Bayesian Optimization)における選好選択を高めるために設計された新しい比較説明法である。 MOLONEは、より効率的な選択肢の同定を容易にすることにより、ループ内シナリオの収束を著しく促進することを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:23:54 GMT)
Uncovering the Limitations of Query Performance Prediction: Failures, Insights, and Implications for Selective Query Processing [3.5]
本稿では,最先端QPP(NQC,UQC)の総合評価を行う。我々は、多様なスパースローダ(BM25、DFree、クエリ拡張なし)とハイブリッドまたは高密度(SPLADE、ColBert)と多様なテストコレクションROBUST、GOV2、WT10G、MS MARCOを使用します。結果は予測器の精度に有意なばらつきを示し, コレクションを主要因とし, 次にランク付けを行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:18:21 GMT)
MaLAware: Automating the Comprehension of Malicious Software Behaviours using Large Language Models (LLMs) [3.4]
MaLAwareは、生のマルウェアデータを人間可読な記述に変換するツールである。 MALAwareは、Cuckoo Sandboxの生成したレポートを処理し、悪性度を相関させ、簡潔な要約を生成する。評価では,人間によるマルウェアの行動記述データセットを基礎的真理として用いた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:27:17 GMT)
Bridging conformal prediction and scenario optimization [3.4]
制約違反の確率について,適切なスコア関数と予測器マップを選択して,よく知られた境界を回復する方法を示す。この結果は,共形予測とシナリオ最適化の理論的橋渡しとなる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:22:46 GMT)
Causal Dynamic Variational Autoencoder for Counterfactual Regression in Longitudinal Data [3.4]
時間とともに治療効果を推定することは、精密医療、疫学、経済、マーケティングなど多くの現実世界の応用において重要である。我々は、観測されていないリスク要因、すなわち、結果の順序だけに影響を与える調整変数を仮定することで、異なる視点を取る。我々は、時間変化効果と未観測の調整変数によって生じる課題に対処する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:40:24 GMT)
Archival Faces: Detection of Faces in Digitized Historical Documents [3.3]
現在の顔検出器は、50:90%のIoUで約24%のmAPしか達成していない。この研究は、デジタル化された歴史新聞の2.2kの新しい画像を含む、手動で注釈付きドメイン特化データセットを導入している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:10:45 GMT)
Modelling bounded rational decision-making through Wasserstein constraints [3.3]
情報制約処理による有界な合理的意思決定をモデル化することは、原則化されたアプローチを提供する。既存のアプローチは一般にエントロピー(Entropy)、Kulback-Leibler分散(Kullback-Leibler divergence)、相互情報(Mutual Information)に基づいている。ワッサーシュタイン距離を利用した有界有理RLエージェントをモデル化するための代替手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:19:34 GMT)
Suite-IN++: A FlexiWear BodyNet Integrating Global and Local Motion Features from Apple Suite for Robust Inertial Navigation [3.3]
Suite-IN++は、フレキシウェアボディーネットベースの歩行者ローカライゼーションのためのディープラーニングフレームワークである。それは、各デバイスのデータの信頼性に基づいてグローバルな機能を融合して、全体の動きの傾向を捉えている。位置決め精度とロバスト性に優れ、実生活の歩行者追跡シナリオにおいて最先端のモデルよりも大幅に優れる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:40:52 GMT)
Science Autonomy using Machine Learning for Astrobiology [3.3]
近年、人工知能(AI)と機械学習(ML)は、迅速なデータ処理、高度なパターン認識、高度な洞察抽出を可能にする宇宙ミッションに欠かせないものとなっている。これらのツールは、複雑な生物の背景から生物のパターンを区別しなければならない宇宙生物学の応用において特に有用である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:20:18 GMT)
Fine-Grained Behavior and Lane Constraints Guided Trajectory Prediction Method [3.3]
本稿では,行動意図認識と車線制約モデリングを統合した新しいデュアルストリームアーキテクチャBLNetを提案する。我々のネットワークは、既存の直接回帰とゴールベースアルゴリズムよりも大きな性能向上を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:15:11 GMT)
Intrinsic-feature-guided 3D Object Detection [3.3]
本稿では,テンプレート支援機能強化モジュールを用いた本態性誘導型3次元物体検出手法を提案する。提案手法は,前景オブジェクトと背景オブジェクトの特徴差を高めるために設計されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:54:06 GMT)
Reducing Smoothness with Expressive Memory Enhanced Hierarchical Graph Neural Networks [3.2]
階層的変種は、複数の解像度にわたる時系列を分析することで、明確な利点をもたらす。階層モデルにおける重要な課題は、フォワードまたは後方通過中の情報損失である。本稿では、動的サイズのメモリバッファ変数を導入し、以前に見た情報を格納する階層グラフフローネットワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:03:41 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2]
外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。 ECAは、規制承認の有効な証拠を提供することができる。 ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:43:41 GMT)
Sparse identification of nonlinear dynamics and Koopman operators with Shallow Recurrent Decoder Networks [3.1]
本稿では, 簡易な実装, 効率的, 堅牢な性能で, センサとモデル識別の問題を共同で解決する手法を提案する。 SINDy-SHREDはGated Recurrent Unitsを使用してスパースセンサー計測と浅いネットワークデコーダをモデル化し、潜在状態空間からフルタイムフィールドを再構築する。本研究では, 乱流, 海面温度の実環境センサ計測, 直接ビデオデータなどのPDEデータに関する系統的研究を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:15:58 GMT)
Lattice Based Crypto breaks in a Superposition of Spacetimes [3.1]
量子重力理論において仮定された時空の重ね合わせの計算的含意について検討する。格子ベースの暗号スキームのセキュリティは、時空の重畳に基づく計算モデルで妥協される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:08:20 GMT)
AI Judges in Design: Statistical Perspectives on Achieving Human Expert Equivalence With Vision-Language Models [3.1]
本稿では、AI審査員のレーティングが人間の専門家のレーティングと一致するかどうかを判断する厳密な統計枠組みを提案する。この枠組みを,VLMに基づく4人の審査員を主要な設計基準で評価するケーススタディに適用する。その結果,トップパフォーマンスのAI審査員は,一意性や描画品質に関する専門家レベルの合意を達成できることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:20:29 GMT)
On-device Sora: Enabling Training-Free Diffusion-based Text-to-Video Generation for Mobile Devices [3.0]
In-device Soraは拡散型オンデバイス・テキスト・ビデオ・ジェネレーションのための最初のモデルフリー・トレーニング・ソリューションである。また,iPhone 15 ProでオンデバイスSoraを実装し,実験結果から高品質な動画を生成可能であることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:33:18 GMT)
Operator Learning with Domain Decomposition for Geometry Generalization in PDE Solving [3.0]
任意のジオメトリ上でPDEを解くための局所言語フレームワークであるドメイン分解を用いた演算子学習を提案する。この枠組みの下で、反復的スキーム textitSchwarz Inference (SNI) を考案する。このスキームは問題領域をより小さなジオメトリーに分割することができ、そこでは局所的な問題をニューラル演算子で解くことができる。種々の境界条件を持ついくつかの代表的PDEに対して広範な実験を行い、目覚ましい幾何学的一般化を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:00:43 GMT)
Digitally Supported Analysis of Spontaneous Speech (DigiSpon): Benchmarking NLP-Supported Language Sample Analysis of Swiss Children's Speech [3.0]
商用大規模言語モデル(LLM)をベースとしない自然言語処理(NLP)手法を活用するアプローチを提案する。本研究の目的は,言語障害をより効率的に診断する上で,言語病理医を支援するための最適な手法を見出すことである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:32:38 GMT)
Initial Conditions from Galaxies: Machine-Learning Subgrid Correction to Standard Reconstruction [3.0]
本研究では,近年のハロや銀河から原始密度を復元するハイブリッド手法を提案する。フルボリュームの分割されたサブグリッドの小さな補正を学習するために、ディープラーニングモデルを訓練する。提案手法は,大規模精度を犠牲にすることなく,非線形性とバイアスを頑健に捕捉する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:09:35 GMT)
Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective [3.0]
近隣の t-SNE や UMAP などの埋め込み法は広く用いられているが、誤解を招く視覚的アーティファクトを導入することがある。 LOO-mapは,個々の点から入力空間全体への埋め込みマップを拡張するフレームワークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:20:44 GMT)
Optimizing Posterior Samples for Bayesian Optimization via Rootfinding [2.9]
我々は,グローバルなルートフィンディングに基づく後方サンプルの効率的な大域的最適化手法を提案する。注目すべきは、各集合から 1 点しか持たなくても、大域的最適度は大抵の場合発見されることである。提案手法は,エントロピー探索の変種など,他の後部サンプルベース獲得関数の性能も向上する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:53:30 GMT)
Integrated LLM-Based Intrusion Detection with Secure Slicing xApp for Securing O-RAN-Enabled Wireless Network Deployments [2.9]
Open Radio Access Network (O-RAN) アーキテクチャは、オープン性、柔軟性、インテリジェントなクローズループ最適化を促進することで、通信を再構築している。本研究では,接続されたUEの時間的トラフィックパターンに基づいて,大規模言語モデル(LLM)を用いてセキュリティレコメンデーションを生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:45:07 GMT)
Machine Vision-Based Assessment of Fall Color Changes and its Relationship with Leaf Nitrogen Concentration [2.9]
本研究は, 葉の色変化と葉の窒素含量との相関を定量化するための機械ビジョンに基づくシステムについて検討した。画像データセットは2021年秋から2023年秋の5週間にわたって、地上の車両をベースとした立体視センサーを用いて商業用果樹園で収集された。葉の窒素濃度が低い木は、高い窒素濃度の木よりも早く黄色に変化した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:39:32 GMT)
Nonparametric spectral density estimation using interactive mechanisms under local differential privacy [2.9]
本稿では,1つの共分散係数を推定し,スペクトル密度を一定周波数で推定し,スペクトル密度関数全体を推定する3つのタスクに対する対話型プライバシ機構を提案する。提案手法は2段階のプロセスによりより高速な速度を達成し,まずラプラス機構をトランケートされた値に適用し,次に前者の民営化標本を用いて時系列における依存機構の知識を得る。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:52:50 GMT)
PROVGEN: A Privacy-Preserving Approach for Outcome Validation in Genomic Research [2.8]
本稿では,ゲノムデータセット共有のためのプライバシ保護手法であるPROVGENを紹介する。我々のアプローチはゲノムデータをバイナリ空間にエンコードし、2段階のプロセスを適用する。提案手法は, GWAS結果の誤り検出において, 既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:51:30 GMT)
Detecting and Mitigating Bias in LLMs through Knowledge Graph-Augmented Training [2.8]
本研究では,大規模言語モデルにおけるバイアスを軽減する新しい手法として,知識グラフ強化訓練(KGAT)について検討する。バイアスアセスメントのためのパブリックデータセットには、Gender Shades、Bias in Bios、FairFaceがある。また、バイアス付き関連を補正するためのターゲット緩和戦略も実施し、バイアス付きアウトプットの大幅な低下とバイアス指標の改善につながった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:27:50 GMT)
Super-Heisenberg scaling in a triple point criticality [2.8]
我々は,三点付近の終点に接近して励起を抑え,指数関数的超ハイゼンベルクスケーリングへと導く,断熱的進化プロトコルを開発した。このスケーリング挙動は、コヒーレンス時間に制限された実験を推定する実用的なパラメーターにおいて非常に有用である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:55:08 GMT)
Towards Responsible and Trustworthy Educational Data Mining: Comparing Symbolic, Sub-Symbolic, and Neural-Symbolic AI Methods [2.8]
本研究は、一般化可能性、解釈可能性の観点から、象徴的、サブシンボル的、ニューラルシンボル的AI(NSAI)を評価する。シンボルとサブシンボリックの手法は、バランスの取れたデータに対してうまく機能するが、バランスの取れていないデータセットの低いパフォーマーを特定するのに苦労していることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:14:11 GMT)
To center or not to center? Hyperspectral data vs. quantum covariance matrices [2.8]
量子状態にデータを埋め込むのに必要な$L2$正規化が、データ中心化にどのように影響するかを示す。意外なことに,主成分分析により低下した問題における分類性能は影響を受けていない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:23:01 GMT)
Light-cone feature selection in methane hyperspectral images [2.8]
本研究は,HSIを用いたメタン検出および局在化のための量子機械学習における光コーン特徴選択の適用に焦点を当てた。提案手法は,特徴選択と分類精度を高めるために量子法を利用する。これは、環境モニタリングのためのリモートセンシングデータ分析を改善するための量子機械学習の可能性を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:51:39 GMT)
ExMAG: Learning of Maximally Ancestral Graphs [2.7]
本稿では,最大祖先グラフを学習するためのスコアベース学習アルゴリズムを提案する。提案手法は,25変数までの小型・中規模の合成インスタンスに適用した場合,より正確な結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:35:52 GMT)
Without Paired Labeled Data: An End-to-End Self-Supervised Paradigm for UAV-View Geo-Localization [2.7]
UAV-View Geo-Localization (UVGL) は、無人航空機(UAV)の正確な位置決めを実現するために、GPSタグ付き衛星画像を取得することを目的としている。既存の手法は、教師あり学習のための事前ペア付きUAVサテライト画像に大きく依存している。本稿では,これらの制限を克服するために,エンドツーエンドの自己教師付きUVGL手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:44:00 GMT)
Synthesized Annotation Guidelines are Knowledge-Lite Boosters for Clinical Information Extraction [2.7]
本稿では,LLMの知識要約とテキスト生成能力を抽出し,ガイドラインを合成する自己改善手法を提案する。 2012 i2b2 EVENT, 2012 i2b2 TIMEX, 2014 i2b2, 2018 n2c2では25.86%, 4.36%, 0.20%, 7.75%の厳格なF1スコアが得られた。 LLMを合成したガイドラインは、ほとんどのタスクで1.15%から4.14%の人書きのガイドラインよりも同等または優れたパフォーマンスを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:59:04 GMT)
Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding [2.7]
現実のシナリオは、しばしば受信者の信念の形成と意思決定に影響を与える隠された変数を含む。我々はこれをシーケンシャルな意思決定問題として概念化し、送信側と受信側が複数のラウンドで対話する。このシナリオを部分観測可能なマルコフ決定プロセス (POMDP) として再構成することにより、受信者の信念と観測不能な共同創設者の両方のダイナミクスに関する不完全な情報をキャプチャする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:50:32 GMT)
NeuraLUT-Assemble: Hardware-aware Assembling of Sub-Neural Networks for Efficient LUT Inference [2.7]
ルックアップテーブル(LUT)を活用したNN(Efficient Neural Network)は、新興AIアプリケーションにおいて大きな可能性を示している。既存のLUTベースの設計では、入力幅のLUTリソースの指数的スケーリングによって制限されたニューロンが要求するファンインが大きいため、精度が低下する。我々は、これらの制限に対処する新しいフレームワークであるNeuraLUT-Assembleを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:52:38 GMT)
Chinese Grammatical Error Correction: A Survey [2.7]
中国語の文法的誤り訂正(CGEC)は自然言語処理において重要な課題である。 CGECは、第二言語 (L2) とネイティブ (L1) の両方における自動筆記支援の需要の増加に対処している。本調査は、データセット、アノテーションスキーム、評価手法、システム進歩など、CGEC研究の総合的なレビューを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:14:50 GMT)
LOCO-EPI: Leave-one-chromosome-out (LOCO) as a benchmarking paradigm for deep learning based prediction of enhancer-promoter interactions [2.7]
本稿では,EPI(Enhancer-Promoter Interactions, Enhancer-Promoter Interactions)予測のための,より徹底的なトレーニングおよびテストパラダイムを提案する。ランダムスプリッティング環境での学習およびテストにおいて高い精度を実現するディープラーニングアルゴリズムは,LOCO設定下での大幅な性能低下を示す。また, ヌクレオチド配列のk-mer特徴を融合するEPI予測のための新しいハイブリッドディープニューラルネットワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:20:15 GMT)
Artificial Intelligence and Deep Learning Algorithms for Epigenetic Sequence Analysis: A Review for Epigeneticists and AI Experts [2.5]
エピジェネティックス(英: Epigenetics)は、遺伝子配列を変えることなく遺伝子の発現を変化させる機構を包含する。遺伝子調節と発現の変化は、癌や先天性変形などの様々な疾患や疾患の形で現れる。機械学習と人工知能(AI)のアプローチは、エピジェネティックな表現表現への変換に広く用いられている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:02:34 GMT)
Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics [2.5]
大規模言語モデル(LLM)は、数学的推論タスクにおいて顕著な進歩を示している。大規模言語モデル(LLM)の最近の進歩は、数学的推論タスクの顕著な進歩を示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:10:10 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5]
シーケンシャルレコメンデーションモデルに非イテムページを組み込む方法を示す。我々は、一般的なシーケンシャルレコメンデータモデルを適用して、非itemページを統合する。その結果,非イテムページは貴重な情報源であることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:03:12 GMT)
Agentic Multimodal AI for Hyperpersonalized B2B and B2C Advertising in Competitive Markets: An AI-Driven Competitive Advertising Framework [2.4]
化学業界では、AIによって発見された物質がイノベーションを加速させるが、商業的成功は市場採用に繋がる。我々は,B2BおよびB2C市場において,自律的かつ個人性の高い広告のための多言語多目的AIフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:37:02 GMT)
IR2: Information Regularization for Information Retrieval [2.3]
本稿では,情報検索のための情報正規化手法IR2について述べる。実験結果から,我々の正則化手法は,検討したタスクにおいて,従来の合成クエリ生成手法より優れているだけでなく,コストを最大50%削減できることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:20:47 GMT)
Entanglement recycling in probabilistic port-based teleportation [2.3]
本研究では,1ラウンドの確率的ポートベーステレポーテーション後,資源状態の絡み合った再資源化について検討した。最適化されたリソース状態の場合、プロトコルの性能をマルチポートベースのテレポーテーションと比較する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:20:44 GMT)
Preconditioned Additive Gaussian Processes with Fourier Acceleration [2.3]
本稿では,カーネル行列とその導関数の乗算において,ほぼ線形な複雑性を実現するための行列フリー手法を提案する。高次元問題に対処するために,加法的カーネルアプローチを提案する。各サブカーネルは低次の特徴相互作用をキャプチャし、NFFT法の効率的な適用を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:14:06 GMT)
Safety and Security Risk Mitigation in Satellite Missions via Attack-Fault-Defense Trees [2.3]
本研究は,アルゼンチンの航空宇宙専門のミッションクリティカルシステム企業であるAscentio Technologiesの事例研究である。主な焦点は、現在同社が開発している衛星プロジェクトのためのGround Segmentだ。本稿では,アタックツリー,フォールトツリー,防御機構を統一モデルに統合したアタック・フォールト・ディフェンス・ツリー・フレームワークの適用について述べる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:24:43 GMT)
A Decade of Deep Learning for Remote Sensing Spatiotemporal Fusion: Advances, Challenges, and Opportunities [2.2]
深層学習はリモートセンシングSTFに革命をもたらした。本稿では,過去10年間のリモートセンシングSTFにおけるDL開発を概観的にレビューする。既存の研究における大きな課題について論じ、将来有望な研究基準を特定する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:30:48 GMT)
Graph Classification and Radiomics Signature for Identification of Tuberculous Meningitis [2.2]
結核性髄膜炎 (TBM) は結核菌による重症脳感染症である。本研究の目的は,T1-weighted (T1w) non-contrast Magnetic Resonance Imaging (MRI) を用いたTBM患者の分類である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:28:39 GMT)
Feature Subset Weighting for Distance-based Supervised Learning through Choquet Integration [2.2]
本稿では,遠隔教師あり学習のための単調測度を用いた特徴量重み付けを提案する。チョーケ積分は、これらの重みを包含する距離計量を定義するために用いられる。提案手法は, 重複・強相関の付加により, 距離が影響を受けないことを確実にするものである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:23:01 GMT)
Posterior Covariance Structures in Gaussian Processes [2.1]
帯域幅パラメータと観測の空間分布が後部共分散にどのように影響するかを示す。絶対余剰共分散場を効率的に測定するいくつかの推定器を提案する。我々は、理論的な発見とその実践的応用を説明するために、幅広い実験を行っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:42:10 GMT)
Towards a Trustworthy Anomaly Detection for Critical Applications through Approximated Partial AUC Loss [2.1]
2値分類器は、偽陽性率(FPR)を最小化しつつ、真陽性率(TPR)が100%に達するのを防ぐAUC ROC曲線の特定の範囲を最適化するために訓練される。その結果、TPRは6つのデータセットで平均20.43%のFPRで92.52%向上し、他の最先端の方法と比較して12.2%のFPRコストで4.3%改善した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:27:35 GMT)
A Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human-Robot Interaction [2.1]
本稿では,対話状態のグラフベース表現に基づく人間-ロボット間相互作用の新しい対話モデルを提案する。ユーザの発話に応答するために使用されるニューラルネットワークモデルは、シンプルだが効果的なグラフ・トゥ・テキスト機構に依存している。提案手法はヒューマノイドロボットを用いたユーザスタディにより実験的に評価される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:39:05 GMT)
Quantum computing of chirality imbalance in SU(2) gauge theory [2.1]
我々は1+1次元のSU(2)非アベリアゲージ理論におけるキラル凝縮の研究のために変分量子アルゴリズムを実装した。古典的および実際の量子ハードウェア上の量子シミュレーションによる結果は、格子ハミルトンの正確な対角化とよく一致している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:08:58 GMT)
LLM-Assisted Proactive Threat Intelligence for Automated Reasoning [2.0]
本研究は、リアルタイムサイバーセキュリティ脅威の検出と応答を強化する新しいアプローチを提案する。我々は,大規模言語モデル (LLM) とレトリーバル拡張生成システム (RAG) を連続的な脅威知能フィードに統合する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:19:33 GMT)
News is More than a Collection of Facts: Moral Frame Preserving News Summarization [2.0]
本稿では,AIによるニュース要約におけるモラル・フレーミングの保存について検討する。本稿では、ジャーナリストが意図的に用いたり、特定の道徳的な言葉を報告したりする直感を活用するアプローチを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:08:24 GMT)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9]
構造因果モデルの枠組みにおける反実的推論の限界について検討する。低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:57:37 GMT)
TDBench: Benchmarking Vision-Language Models in Understanding Top-Down Images [1.9]
TDBenchは、トップダウン画像理解におけるVLM(Vision-Language Models)の包括的なベンチマークである。画像理解の10つの評価次元にまたがる視覚的質問応答対で構成されている。現実のシナリオでは一般的に発生するが、探索は少ない4つのケーススタディを実行します。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:01:13 GMT)
ResKoopNet: Learning Koopman Representations for Complex Dynamics with Spectral Residuals [1.9]
クープマン作用素のスペクトル成分を近似する既存の方法はしばしば理論上の制約に悩まされる。本稿では、スペクトル残差を明示的に最小化し、クープマン固有ペアを計算する新しい手法であるResKoopNetを紹介する。物理系および生体系の実験は、既存の手法と比較してスペクトル近似におけるResKoopNetの優れた精度を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:41:00 GMT)
Phaedrus: Predicting Dynamic Application Behavior with Lightweight Generative Models and LLMs [1.8]
Phaedrusは、さまざまな実行インスタンスにわたる動的プログラムの振る舞いを予測するように設計された、新しいテキストコンパイラ支援のディープラーニングフレームワークである。実験の結果,textitPhaedrus は WPP 関数のプロファイルサイズを最大107倍に削減できることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:33:05 GMT)
IHC-LLMiner: Automated extraction of tumour immunohistochemical profiles from PubMed abstracts using large language models [1.8]
本研究では,自動パイプライン IHC-LLMiner を用いて,PubMed の抽象化からIHC-腫瘍プロファイルを抽出する。最高のパフォーマンスモデルである"Gemma-2 finetuned"は91.5%の精度でF1スコアは91.4である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:58:07 GMT)
Temporal and Semantic Evaluation Metrics for Foundation Models in Post-Hoc Analysis of Robotic Sub-tasks [1.8]
本稿では,トラジェクトリデータを時間的境界と自然言語に基づく記述サブタスクに分解するフレームワークを提案する。我々のフレームワークは、全軌道を構成する低レベルのサブタスクに対して、時間ベースの記述と言語ベースの記述の両方を提供する。この尺度は2つのサブタスク分解の間の言語記述の時間的アライメントと意味的忠実度を測定する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:50:12 GMT)
Enhancing 3T BOLD fMRI SNR using Unpaired 7T Data with Schrödinger Bridge Diffusion [1.8]
ほとんどの研究は、空間分解能が低く、時間とSNRが低い3T MRIシステムに依存している。異なる対象データセットから7Tと3TのfMRIデータを整列する新しいフレームワークを提案する。次に、3TデータのSNRを高めるために、未ペアのBrain Disk Schr"odinger Bridge拡散モデルを適用する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:41:24 GMT)
SVInvNet: A Densely Connected Encoder-Decoder Architecture for Seismic Velocity Inversion [1.8]
本研究では,地震波速度インバージョン問題に対する深層学習に基づくアプローチを提案する。我々の地震波速度インバージョンネットワーク(SVInvNet)は、高密度ブロックで強化されたマルチコネクションエンコーダデコーダ構造を含む新しいアーキテクチャを導入している。トレーニングと試験のために,多層, 欠陥, 逆塩ドームのカテゴリを含む多様な地震波速度モデルを構築した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:44:26 GMT)
Informed Greedy Algorithm for Scalable Bayesian Network Fusion via Minimum Cut Analysis [1.7]
本稿では,ベイジアンネットワーク(BN)の構造融合のためのGreedy Min-Cut Bayesian Consensus (GMCBC)アルゴリズムを提案する。この方法は、ネットワークの複雑さを制御しながら、本質的な依存関係を保持するように設計されている。従来の融合アプローチの限界に対処し、しばしば過度に複雑なモデルに繋がる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:47:33 GMT)
Addressing pitfalls in implicit unobserved confounding synthesis using explicit block hierarchical ancestral sampling [1.7]
現状のプロトコルには、因果モデルの完全な空間からのアンバイアスサンプリングを妨げる2つの異なる問題があることを示す。本研究では, ブロック階層的な基底真理因果グラフの生成を生かした, 観測不能な共起に対する明示的モデリング手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:19:11 GMT)
Input Resolution Downsizing as a Compression Technique for Vision Deep Learning Systems [1.7]
入力分解能の低下が分類とセマンティックセグメンテーションの両方のタスク、およびコンブネットとトランスフォーマーベースのアーキテクチャに与える影響について検討する。標準ベンチマークによる実験結果から,本手法の可能性を強調し,計算とメモリの要求を大幅に低減し,競争性能を向上する。本研究は,視覚応用のためのモデル圧縮技術の広い視野において,入力分解能の低減が実現可能かつ有望な方向であることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:34:57 GMT)
Exploiting Distribution Constraints for Scalable and Efficient Image Retrieval [1.7]
最先端の画像検索システムは、データセットごとに特定のニューラルネットワークをトレーニングする。オフザシェルフのファンデーションモデルは、データセット固有のモデルに匹敵するパフォーマンスを達成するには不足している。本稿では,基本モデルの性能を著しく向上するAE-SVC(Strong Variance Constraints)を用いたオートエンコーダを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:45:37 GMT)
Global explainability of a deep abstaining classifier [1.7]
我々は,実世界のマルチタスク畳み込みニューラルネットワーク (MTCNN) を用いた深部吸収分類器 (DAC) の組織学的予測タスクにおいて,エラー源を特徴付けるグローバルな説明可能性法を提案する。本分類法は1億4400万件の手書き検査で評価され,各報告の癌部位, サブサイト, 組織学, 側方性, 行動の同時予測を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:34:10 GMT)
Diffusion models for probabilistic precipitation generation from atmospheric variables [1.6]
地球系モデル(ESM)では、降水は明示的には解決されず、パラメータ化によって表される。本稿では,条件付き拡散モデルとUNetアーキテクチャを統合した生成機械学習に基づく新しい手法を提案する。従来のパラメータ化とは異なり、我々のフレームワークは効率的にアンサンブル予測を生成し、降水の不確実性を把握し、手作業による微調整を必要としない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:21:31 GMT)
Data-Driven Safety Verification using Barrier Certificates and Matrix Zonotopes [1.6]
ノイズの多いデータから直接システムの安全性を検証するための,データ駆動型安全性検証フレームワークを提案する。 1つの信頼できないモデルを信頼するのではなく、観測されたデータと整合する一連のモデルを構築します。このモデル集合は行列ゾノトープを用いてコンパクトに表現され、効率的な計算と不確実性の伝播を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:46:42 GMT)
A Dataset of the Representatives Elected in France During the Fifth Republic [1.6]
このデータベースは、フランスにおける政治的表現の進化を分析するための前例のない資源となっている。フランスが選出した代表者の縦断的な見解を提供することで、このデータベースは第5共和政の制度的安定性の研究を促進する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:09:35 GMT)
A YOLO-Based Semi-Automated Labeling Approach to Improve Fault Detection Efficiency in Railroad Videos [1.6]
本研究は, 鉄道ビデオにおけるラベリング過程の合理化と故障検出精度の向上を目的とした半自動ラベリング手法を提案する。手動ラベル付きデータの小さなセットでプロセスを開始することで、各サイクルの出力を用いて、モデル精度を向上させるために、我々のアプローチは反復的にYOLOモデルを訓練する。モデル予測の修正を容易にするため, YOLOの検出データを編集可能なテキストファイルとしてエクスポートするシステムを開発した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:50:30 GMT)
Energy Weighted Learning Progress Guided Interleaved Multi-Task Learning [1.6]
機械学習における「連続学習」は、獲得した知識を保存しながら新しい情報を学ぶことを目的としている。本稿では,その「学習の進歩」とエネルギー消費に基づいてタスクをインターリーブする手法を提案する。機械学習の観点から、我々のアプローチはマルチタスク学習システムと見なすことができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:15:27 GMT)
Token embeddings violate the manifold hypothesis [1.6]
大規模言語モデルの入力領域であるトークン埋め込みの構造を解明する。本稿では,各トークンの近傍を適切に定義された信号と雑音の次元に分割した一般化および統計的に検証可能なモデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:40:12 GMT)
Envisioning an AI-Enhanced Mental Health Ecosystem [1.5]
ピアサポート、セルフヘルプ介入、プロアクティブモニタリング、データ駆動インサイトなど、さまざまなAIアプリケーションについて検討する。我々は、AIが人間のプロバイダを置き換えず、責任あるデプロイメントと評価を強調するハイブリッドエコシステムを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:11:58 GMT)
Efficient Annotator Reliablity Assessment with EffiARA [1.5]
EffiARAは、アノテーションタスクに必要なリソースの理解からアノテーション付きデータセットのコンパイルまで、アノテーションパイプライン全体をサポートするフレームワークである。このフレームワークの有効性は、アノテータ信頼度に基づくソフトラベル凝集とサンプル重み付けによる分類性能の向上と、アノテータ間の全体的な合意の増大という2つの先行研究によって支持されている。この作業は、EffiARA Pythonパッケージとそれに伴うwebtoolを導入し、システムに対してアクセス可能なグラフィカルユーザインターフェースを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:48:09 GMT)
Bright squeezed light in the kilohertz frequency band [1.5]
本稿では,多重雑音安定化方式により,新しい鮮やかなシャープ光発生方式を提案する。 1mWのショットノイズ限界よりはるかに低い技術的ノイズを持つレーザビームは、kHz〜MHz周波数範囲で実験的に実現される。私たちの知る限りでは、これはキロヘルツ帯を横断するミリワットオーダーの明るい絞り光の最初のデモンストレーションである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:26:06 GMT)
Introducing the Short-Time Fourier Kolmogorov Arnold Network: A Dynamic Graph CNN Approach for Tree Species Classification in 3D Point Clouds [1.5]
短時間フーリエ変換(STFT)を統合した新しいネットワークSTFT-KANを紹介する。データを用いて樹木種を分類するために,DGCNNの軽量バージョンであるliteDGCNNにSTFT-KANを実装した。実験の結果,STFT-KANは,モデルの複雑さと性能を効果的にバランスさせて,既存のKANモデルよりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:58:46 GMT)
Sim-is-More: Randomizing HW-NAS with Synthetic Devices [1.5]
既存のハードウェア対応NAS(HW-NAS)手法は、ターゲットデバイスを囲む正確な情報へのアクセスを前提としている。そこで我々は,まず,合成デバイスの分布についてアーキテクチャコントローラを学習し,そのコントローラを直接ターゲットデバイスに展開する2段階のHW-NASフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:15:46 GMT)
TheBlueScrubs-v1, a comprehensive curated medical dataset derived from the internet [1.4]
BlueScrubs-v1は、広範囲のインターネットコーパスから得られた2500億以上の医療トークンの収集されたデータセットである。各テキストには、医療関連性、精度、事実の詳細、安全性と倫理基準を含む3つのLCMベースの品質スコアが割り当てられている。このData Descriptorは、データセットの作成と検証について詳述し、医療AI研究の潜在的有用性について説明している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:25:19 GMT)
Lower Bounds on Pauli Manipulation Detection Codes [1.4]
パウリマニピュレーション検出(PMD)符号の低い値を示す。我々の下限は、PMD符号におけるエラーと冗長パラメータの最初のトレードオフを明らかにします。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:15:35 GMT)
Minimum Description Length of a Spectrum Variational Autoencoder: A Theory [1.4]
深層学習には最小記述長(MDL)が不可欠である。 MDLに基づく深部変分オートエンコーダ(VAE)の設計と評価のための新しい理論フレームワークを提案する。我々は、スペクトルVAEが、MDLが達成されたとき、最も適切な方法でデータ分布を理解すると主張している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:37:18 GMT)
ASP-based Multi-shot Reasoning via DLV2 with Incremental Grounding [1.4]
DLV2は知識表現と推論のためのAIツールである。 DLV2の反復的推論への進化から得られた新しい漸進的推論器を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:43:40 GMT)
Short-PHD: Detecting Short LLM-generated Text with Topological Data Analysis After Off-topic Content Insertion [1.4]
Short-PHDは、短いテキストに適したゼロショットLLM生成テキスト検出法である。 Short-PHDは、短いテキストに対する以前のPHD法の推定を安定化する。公開データセットと生成データセットの両方の実験結果は、Short-PHDが既存のゼロショットメソッドより優れていることを示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:26:49 GMT)
Do LLMs Surpass Encoders for Biomedical NER? [1.3]
生物医学的実体認識において,大規模言語モデルが優れているかを検討した。以上の結果から,LLMはFスコアの2-8%で最良エンコーダモデルより2-8%優れていた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:16:13 GMT)
TenAd: A Tensor-based Low-rank Black Box Adversarial Attack for Video Classification [1.3]
textbfTenAdは低ランクの敵対攻撃であり、ビデオを4階テンソルとして表現することで、ビデオデータの多次元特性を活用する。提案手法は,既存のブラックボックス攻撃に対して,成功率,クエリ効率,摂動障害などの点で優れる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:35:28 GMT)
CGKN: A Deep Learning Framework for Modeling Complex Dynamical Systems and Efficient Data Assimilation [1.3]
正確な予測と効率的なDAを同時に提供するために設計されたディープラーニングフレームワークを導入する。条件付きガウスコオプマンネットワーク(CGKN)は、一般非線形系を条件付きガウス構造を持つ非線形神経微分方程式に変換する。本研究では, 強い非線形および非ガウス乱流系に対するCGKNの有効性を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:41:10 GMT)
Enhancing stroke disease classification through machine learning models via a novel voting system by feature selection techniques [1.2]
心臓病は世界中で致死率と死亡率の主要な原因である。我々は,心臓病の分類を高度化するための特徴選択技術を備えた新しい投票システムを開発した。 XGBoostは、99%の精度、F1スコア、98%のリコール、100%のROC AUCを達成した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:16:49 GMT)
Automated Factual Benchmarking for In-Car Conversational Systems using Large Language Models [1.2]
本稿では,車内対話システムの自動実写ベンチマークのためのLCM手法を提案する。我々は,5つのLCMに基づく手法で方法論をインスタンス化し,合意の強化と幻覚の最小化のために,アンサンブル技術と多様なペルソナを活用する。その結果, GPT-4と入力出力プロンプトの組み合わせは, 専門家による評価で90%以上精度が高いことがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:25:30 GMT)
Frustrated Bose ladder with extended range density-density interaction [1.1]
リング交換相互作用により2脚はしご上のボソンがフラストレーションを受けると、解離性d波ボース液(DBL)を安定化させることができる。我々は、拡張されたハバード相互作用がDBL相に与える影響を分析する。以上の結果から, 密度密度相互作用とラング・ブロッキングの影響を明らかにすることにより, フラストレーションボソンの物理に関する新たな知見が得られた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:13:06 GMT)
R2DN: Scalable Parameterization of Contracting and Lipschitz Recurrent Deep Networks [1.1]
Robust Recurrent Deep Network(R2DN)は、マシンラーニングとデータ駆動制御のための堅牢なリカレントニューラルネットワークのスケーラブルなパラメータ化である。線形時間不変系と1-LipschitzディープフィードフォワードネットワークのフィードバックとしてR2DNを構築する。トレーニングと推論はどちらも、同じようなテストセットのパフォーマンスで桁違いに高速で、モデル表現性に関してトレーニングと推論の時間がより好適にスケールしていることが分かりました。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:37:43 GMT)
Uncertainty Propagation in XAI: A Comparison of Analytical and Empirical Estimators [1.1]
説明可能なAI(XAI)の不確実性を理解することは、信頼の構築に不可欠である。本稿では,XAIにおける不確実性を定量化し,解釈するための統一的な枠組みを提案する。分析的および実証的な説明分散の推定値を用いて、説明の不確かさが説明に与える影響を評価する体系的な手段を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:06:31 GMT)
ResNLS: An Improved Model for Stock Price Forecasting [1.1]
我々は、隣接する株価間の依存関係を強調することで、株価予測を改善するハイブリッドモデルを導入する。提案するモデルであるResNLSは、主にResNetとLSTMの2つのニューラルアーキテクチャで構成されている。実験の結果,過去5日間の終値データを入力として使用する場合,モデルの性能(ResNLS-5)は他の入力と比較して最適であることが判明した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:20:56 GMT)
Spatiotemporal Attention Learning Framework for Event-Driven Object Recognition [1.0]
イベントベースの視覚センサは、位置、極性、情報を含むスパースイベントストリームとして、局所ピクセルレベルの強度変化をキャプチャする。本稿では、CBAM(Contemporalal Block Attention Module)により強化されたVARGGネットワークを利用した、イベントベースのオブジェクト認識のための新しい学習フレームワークを提案する。提案手法は,従来のVGGモデルと比較してパラメータ数を2.3%削減しつつ,最先端のResNet手法に匹敵する性能を実現する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:37:54 GMT)
Divergence Inequalities with Applications in Ergodic Theory [1.0]
2次微分可能な$f$-divergencesに対する$chi2$-divergencesという観点から、ピンスカーの不等式と一般境界の簡単な方法を確立する。多くの$f$-divergencesに対して、時間同質マルコフ連鎖の収縮率は、$chi2$-divergenceの入力依存収縮係数によって特徴づけられる。これらの結果は、効率的な計算の保証がないにもかかわらず、量子情報理論におけるPetz $f$-divergencesに拡張する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:03:19 GMT)
Scalable Safe Multi-Agent Reinforcement Learning for Multi-Agent System [1.0]
報酬形成のみに依存する既存のマルチエージェント強化学習(MARL)アルゴリズムは、安全性を確保するのに有効ではない。本稿では,MARL手法の安全性とスケーラビリティを高めるために,スケーラブルセーフMARL(Scalable Safe MARL)を提案する。 SS-MARLは,ベースラインに比べて最適性と安全性のトレードオフが良好であることを示し,そのスケーラビリティは多数のエージェントを持つシナリオにおいて,最新の手法よりも著しく優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:59:50 GMT)
Grade Guard: A Smart System for Short Answer Automated Grading [1.0]
グレードガードは、ニュアンスまたは部分的に正しい回答を評価するためのフレームワークである。 Indecisiveness Score (IS) を計算し、予測されたグレードの不確かさを反映する。また、最適化されたIndecisiveness Score(IS)を生成し、精度を高めるためにグレードの合理性を生成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:45:44 GMT)
Krutrim LLM: A Novel Tokenization Strategy for Multilingual Indic Languages with Petabyte-Scale Data Processing [1.0]
我々は,多言語Indic大言語モデル構築のためのデータ準備のための新しいアプローチを開発する。われわれの厳密なデータ取得は、Common Crawl、Indic Book、ニュース記事、Wikipediaなど、オープンソースとプロプライエタリなソースにまたがっている。 Indic言語毎に、冗長で低品質なテキストコンテンツを効果的に除去するカスタムプリプロセッシングパイプラインを設計する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:16:34 GMT)
Training Frozen Feature Pyramid DINOv2 for Eyelid Measurements with Infinite Encoding and Orthogonal Regularization [0.9]
眼のパラメータの正確な測定は、骨形成診断において重要であるが、手動、非一貫性の方法によって制限されている。本研究は、SE-ResNet、EfficientNet、DINOv2といったディープラーニングモデルを用いて、スマートフォンで取得した画像を用いて、これらの測定を自動化する。 DINOv2は、特にモバイルデプロイメントに理想的な凍結条件下で、優れたスケーラビリティと堅牢性を示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:06:08 GMT)
1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization [0.9]
特に、パラメータ化されたマルコフ決定過程をインスタンス化するときに状態空間は極端に大きくなる。我々は,そのような巨大なMDPに対して合理的な政策を得るための学習に基づくアプローチを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:08:39 GMT)
Curriculum Design of Competitive Programming: a Contest-based Approach [0.9]
本稿では,現実的なコンテストシナリオを形式的アセスメントに明示的に組み込んだカリキュラム設計へのコンテストベースのアプローチを提案する。本稿では,学生の観察能力の体系的発達をめざして構成されたパーデュー大学におけるそのようなコースの設計と実践について述べる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:25:05 GMT)
TWICE: What Advantages Can Low-Resource Domain-Specific Embedding Model Bring? -- A Case Study on Korea Financial Texts [0.9]
FinMTEBのような既存のベンチマークは、主に高リソース言語向けに設計されている。韓国金融ドメインの新しいベンチマークであるKorFinMTEBを紹介する。実験結果から,FinMTEBの翻訳版ではモデルが頑健に動作する一方で,KorFinMTEB上での性能は微妙に重要な相違点を明らかにした。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:39:12 GMT)
Medical large language models are easily distracted [0.8]
大規模言語モデル(LLM)は医学を変革する可能性を持っているが、実際の臨床シナリオには、パフォーマンスを妨げる余分な情報が含まれている。 MedDistractQAは,実世界の気晴らしをシミュレートしたUSMLEスタイルの質問を用いたベンチマークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:34:01 GMT)
Mind the GAP: Glimpse-based Active Perception improves generalization and sample efficiency of visual reasoning [0.8]
視覚関係を理解する人間の能力は、AIシステムよりもはるかに優れている。 Glimpse-based Active Perception (GAP) システムを開発した。その結果,GAPは即時的な視覚内容を超えた視覚関係の抽出に不可欠であることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:43:55 GMT)
Machine Learning assisted noise classification with Quantum Key Distribution protocols [0.7]
異なる雑音を考慮した量子鍵分布方式で生成された量子ビット誤り率(QBER)を考察する。本プロトコルは、2つの異なるシナリオを仮定して高精度に量子ノイズを分類する。提案手法は,非常に単純化された量子プロトコルから生成されたデータの古典的なポスト処理に基づいている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:30:47 GMT)
Knowledge-Base based Semantic Image Transmission Using CLIP [0.7]
本稿では,画像伝送のための知識ベース(KB)支援型セマンティックコミュニケーションフレームワークを提案する。提案システムはセマンティック・アウェア・コミュニケーションシステムのための新しい評価パラダイムを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:53:54 GMT)
Brain Network Classification Based on Graph Contrastive Learning and Graph Transformer [0.7]
本稿では,グラフコントラスト学習をグラフ変換器と統合したPHGCL-DDGformerという新しいモデルを提案する。実世界のデータセットによる実験結果から、PHGCL-DDGformerモデルは、脳ネットワーク分類タスクにおける既存の最先端のアプローチよりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:26:03 GMT)
Logical perspectives on learning statistical objects [0.7]
集合 X 上の関数の基底クラス'' の学習可能性と基底クラスから派生した統計関数の学習可能性の関係を考察する。例えば、関数のファミリーの学習性は、クラス内の関数をその分布の下で期待するものにマッピングする関数のファミリーの学習性を意味することを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:34:54 GMT)
Advancements in Multimodal Differential Evolution: A Comprehensive Review and Future Perspectives [0.7]
マルチモーダル最適化は、関数の複数の大域的および局所的最適化を識別することを含み、探索空間内の多様な最適解に関する貴重な洞察を提供する。微分進化(DE)は連続したパラメータ空間に対して強力で汎用的である。マルチモーダル最適化のためのDECの最近の進歩は、ニッチ手法、パラメータ適応、機械学習を含む他のアルゴリズムとのハイブリダイゼーション、および様々な領域にわたる応用に焦点を当てている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:30:07 GMT)
Aligning Diffusion Model with Problem Constraints for Trajectory Optimization [0.7]
本稿では,拡散モデルと問題固有の制約を明示的に整合させる新しい手法を提案する。私たちのアプローチは、Dynamic Data-Driven Application Systems(DDDAS)フレームワークとの統合に適しています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:46:05 GMT)
Calibration Strategies for Robust Causal Estimation: Theoretical and Empirical Insights on Propensity Score Based Estimators [0.7]
推定と校正のためのデータの分割は、確率スコアに基づく推定器の性能に重大な影響を及ぼす。提案手法は,確率スコア推定のためのキャリブレーション手法の最近の進歩を延長し,挑戦的な設定における確率スコアの堅牢性を向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:59:50 GMT)
The study of non-complete-ring positron emission tomography (PET) detection method [0.6]
本論文では,不完全リングPETスキャナのための粗大な再構成フレームワークを提案する。パブリックおよびインハウスの脳PETデータセットに対する実験結果から,提案手法が既存手法より有意に優れていることが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:05:32 GMT)
GKAN: Explainable Diagnosis of Alzheimer's Disease Using Graph Neural Network with Kolmogorov-Arnold Networks [0.6]
本稿では,Kolmogorov-Arnold Networks (KAN) を Graph Convolutional Networks (GCN) に統合し,診断精度と解釈可能性の向上を図る。 GCN-KANは、アルツハイマー病(AD)に関連する主要な脳領域の解釈可能な洞察を提供しながら、従来のGCNを4-8%の精度で上回るこのアプローチは、早期AD診断のための堅牢で説明可能なツールを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:31:00 GMT)
Making the quantum world accessible to young learners through Quantum Picturalism: An experimental study [0.6]
量子ピクチュラリズム(Quantum Picturalism, QPic)は、全ての量子力学の完全な図式形式である。このフレームワークは、絡み合い、測定、混合状態量子力学といった重要な概念を教える新しい方法として、若い学習者にとって特に有利である。その重要性は、量子情報科学(QIST)のような複雑な分野を高校レベルで導入できることにある。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:54:35 GMT)
Zeno-effect Computation: Opportunities and Challenges [0.6]
我々は、立方体を直接ではなく3つの状態系に基づいて構成するので、立方体は状態の1つを投影した後に残ることができる。測定や散逸的ゼノ効果によって排他的に定義された設定がフラストレーションを許さない、という大きな課題がある。我々は、例えば、光学的設定でしばしば行われるような、利得と損失を含む、この課題を克服する手法について議論する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:06:34 GMT)
Predicting Field Experiments with Large Language Models [0.6]
本研究では,フィールド実験結果の予測を自動生成するフレームワークを提案し,評価する。この枠組みを著名な経済学文献から抽出した319の実験に適用すると、顕著な予測精度は78%となる。この歪みは、性別の違い、民族性、社会的規範など、いくつかの要因に起因している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:14:35 GMT)
Statistically Testing Training Data for Unwanted Error Patterns using Rule-Oriented Regression [0.6]
本稿では,欠陥に対するトレーニングデータをテストし,その後の機械学習モデルのトレーニングのための信頼性の高い基盤構造を確立する方法を提案する。我々の手法は、テスト条件'をデータ内のパターンを記述する条件とすることで、従来の統計的テストの能力を拡張します。デモと実験のためのオープンソース実装を提供しています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:34:59 GMT)
Operating two exchange-only qubits in parallel [0.6]
線形配置で6個の量子ドットからなる2つの交換専用量子ビットの並列動作を示す。また,iSWAPゲートとPauliスピンブロッキングリードアウト方式の実験実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:12:31 GMT)
MambaPEFT: Exploring Parameter-Efficient Fine-Tuning for Mamba [0.6]
ステートスペースモデル(SSM)ベースのモデルであるMambaは、トランスフォーマーの代替として注目されている。 Mambaに適用した場合のトランスフォーマーに対する既存のPEFT法の有効性について検討する。本研究では,マンバの固有構造を利用した新しいPEFT法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:41:31 GMT)
Deep Learning Model Predictive Control for Deep Brain Stimulation in Parkinson's Disease [0.6]
パーキンソン病(PD)に対するDBSのためのデータ駆動計算アルゴリズムを提案する。ベータバンド・アクティビティ・レスポンスのシミュレーションモデルを用いたテストでは、トラッキングエラーと制御アクティビティの両方で20%以上を達成する。提案した制御戦略は、CLDBSを標的としたPDや他の疾患の治療に応用可能な、一般化可能なデータ駆動技術を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:16:49 GMT)
Unveiling Hybrid Cyclomatic Complexity: A Comprehensive Analysis and Evaluation as an Integral Feature in Automatic Defect Prediction Models [0.5]
本稿では,新しい複雑性指標であるHybrid Cyclomatic Complexity(HCC)の解析と,欠陥予測モデルの特徴としての有効性について述べる。 HCCメトリックとその2つのコンポーネントの比較研究、継承された複雑性とオブジェクト指向の文脈におけるクラスの実際の複雑さについて述べる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:07:17 GMT)
WaveFormer: A 3D Transformer with Wavelet-Driven Feature Representation for Efficient Medical Image Segmentation [0.5]
医用画像用3D変換器のWaveFormerについて紹介する。それは人間の視覚認識システムのトップダウンメカニズムにインスパイアされている。グローバルコンテキストと高周波の詳細の両方を保存し、重いサンプリング層を効率的なウェーブレットベースの要約と再構成に置き換える。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:13:23 GMT)
FsPONER: Few-shot Prompt Optimization for Named Entity Recognition in Domain-specific Scenarios [0.5]
FsPONERは、少数ショットプロンプトを最適化するための新しいアプローチであり、ドメイン固有のNERデータセットの性能を評価する。 FsPONERは、ランダムサンプリングとTF-IDFとの組み合わせに基づく3つのショット選択法で構成されている。データ不足を考慮した実世界のシナリオでは、TF-IDFを用いたFsPONERは、F1スコアで約10%の微調整モデルを上回っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:19:16 GMT)
Unfair Learning: GenAI Exceptionalism and Copyright Law [0.5]
GenAIの公正な使用を支持する法的・実質的な議論はすべて、人間にも等しく適用される、と論じている。つまり、人間が著作権の著作物に再び費用を払う必要はないということだ。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:49:39 GMT)
Putting GenAI on Notice: GenAI Exceptionalism and Contract Law [0.5]
スクレーピングは、ウェブサイトページのコピーを作成するコード(スクレイピングボット)を使って行われる。ウェブサイトのサービス規約でスクラップを禁止している1つの方法は、条件がいつ強制可能かは必ずしも明確ではないため、緩やかに強制される。本論文は, スクレーピングとは何か, エンティティがどのように行うのか, ウェブサイトのサービス規約が強制可能であるのか, および, ウェブサイト所有者がスクレーピングの結果としてどのような損害を被るかを説明することによって, 混乱を解消することを目的としている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:58:02 GMT)
FlowSeries: Anomaly Detection in Financial Transaction Flows [0.5]
WeirdFlowsは、不正なトランザクションや非コンプライアンスエージェントを検出するためのトップダウン検索パイプラインである。 Intesa Sanpaolo(ISP)銀行のデータセットからWerdFlowsを評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:23:27 GMT)
Diversity Methods for Improving Convergence and Accuracy of Quantum Error Correction Decoders Through Hardware Emulation [0.5]
本稿では,ソフトウェアモデルの代わりに実際のハードウェアを用いて,量子誤り訂正デコーダの評価を行うハードウェアエミュレータを提案する。エミュレータは、150MHzで動作する1つのFPGAデバイスで、20日で1013ドルの異なるエラーパターンを探索することができる。 Intel Core i9に128GBのRAMを搭載した最適化されたC++ソフトウェアは、同様の結果を得るのに1年以上かかる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:04:27 GMT)
When Persuasion Overrides Truth in Multi-Agent LLM Debates: Introducing a Confidence-Weighted Persuasion Override Rate (CW-POR) [0.5]
多くの実世界のシナリオでは、1つの大言語モデル(LLM)が矛盾する主張に遭遇する可能性がある。 1つのLCMベースのエージェントは、TruthfulQAから現実的な回答を提供し、もう1つのエージェントは、虚偽を積極的に擁護し、同じアーキテクチャが裁判官として機能する。信頼度重み付き説得率(CW-POR)を導入し、裁判官がどの程度の頻度で騙されるかだけでなく、その誤った選択をいかに強く信じるかを捉える。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:45:02 GMT)
Provably-Safe Neural Network Training Using Hybrid Zonotope Reachability Analysis [0.5]
安全クリティカルな制御アプリケーションにおいて、ニューラルネットワークの制約を強制することは困難である。本稿では,線形整列単位(ReLU)非線形性を持つニューラルネットワークに対して,非アボジン入力セットの正確な画像化を促進する手法を提案する。安全クリティカルシステムへの非アボジン入力のための前方不変ニューラルネットワークコントローラをトレーニングすることにより,本手法の実用性を実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:01:48 GMT)
Contextuality of Quantum Error-Correcting Codes [0.4]
我々は、Abramsky--Brandenburgerの層理論フレームワークとKirby--Loveの木のアプローチから、パウリ測度集合の部分的閉包に対する文脈性の定義の同値性を証明する。共通ゲートセットを許容する安定化器符号間のコードスイッチングのプロトコルは、強い文脈的である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:30:51 GMT)
Characterizing and exploiting cross-talk effect in SPAD arrays for two-photon interference [0.4]
我々はクロストーク効果を特徴付け、LinoSPAD2カメラのハンベリー・ブラウン・ツイツ効果と比較する。クロストーク効果を利用した検出器のタイミング校正手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:54:33 GMT)
Quantum Galilei group as quantum reference frame transformations [0.4]
ガリレイ群の量子変形によって生成される量子参照フレーム変換と変換の対応性を示す。その結果、量子参照フレームの状態が半古典状態の量子重ね合わせにある場合、量子参照フレーム変換が物理的に関係していることを示すことができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:25:58 GMT)
Multi-objective Combinatorial Methodology for Nuclear Reactor Site Assessment: A Case Study for the United States [0.4]
高い資本コストは原子力発電所にとって依然として課題である。ブラウンフィールドのサイトは前もって開発あるいは未使用の土地であり、もう一つの魅力的な代替手段であった。本研究では,米国における3万件以上のNPPサイトを評価するために,新たな多目的最適化手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:49:55 GMT)
Leveraging LLMs for User Stories in AI Systems: UStAI Dataset [0.4]
大きな言語モデル(LLM)は、人間の生成したテキストに代わる有望な代替手段として浮上している。本稿では,学術論文の要約に基づいて,LLMを用いたAIシステムにおけるユーザストーリ生成の可能性について検討する。分析の結果,LLMは様々な利害関係者のニーズに触発されたユーザストーリーを生成できることがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:03:40 GMT)
Improved Round-by-round Soundness IOPs via Reed-Muller Codes [0.4]
IOPP (interactive Oracle proof of Near of Trivariate Reed-Muller codes) を提案する。私たちのIOPPには、ラウンドバイラウンドのサウンドネス、$O(lambda)$クエリ、$O(loglog d)$ラウンド、$O(d)$長さがあります。具体的には、Reed-Muller符号に近接生成器を与え、IOP構成におけるより体系的な「側条件処理方法」を示し、[Arnon, Chiesa, Fenzi, Yogev]のコンパイル手順を一般化する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:56:37 GMT)
DeformTime: Capturing Variable Dependencies with Deformable Attention for Time Series Forecasting [0.3]
入力空間から相関時間パターンを捕捉しようとするニューラルネットワークアーキテクチャであるDeformTimeを提案する。これまでに確立されたベンチマークを用いて,6つのMTSデータセットに関する広範な実験を行った。その結果,DeformTimeはMSS予測タスクの大部分にわたる従来の競合手法と比較して精度が向上することがわかった。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:18:46 GMT)
Robust LiDAR-Camera Calibration with 2D Gaussian Splatting [0.3]
LiDARとカメラデータを統合するための重要な最初のステップは、LiDARカメラシステムの校正である。既存のキャリブレーション手法の多くは、複雑な手動操作を含む補助対象オブジェクトに依存している。幾何学的制約を用いたLiDARカメラの外部パラメータを推定するキャリブレーション手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:19:26 GMT)
The Computational Complexity of Circuit Discovery for Inner Interpretability [0.3]
我々は古典的およびパラメータ化された計算複雑性理論を用いて回路発見を研究する。私たちの発見は、難しい複雑さの風景を明らかにします。このフレームワークは、解釈可能性クエリの範囲と限界を理解するのに役立ちます。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:16:47 GMT)
Wavelet correlation noise analysis for qubit operation variable time series [0.3]
量子特性は空間と時間における非自明な相関の対象となる。スピン量子ビット実験の工学的進歩は大量のデータを生成する。天体物理学、金融学、気候科学などの分野では、ウェーブレットに基づく手法を用いてデータ分析を強化する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 08:53:37 GMT)
Enhancing Biologically Inspired Hierarchical Temporal Memory with Hardware-Accelerated Reflex Memory [0.3]
本稿では,1次推論の処理を高速化するために,スピナルコルドの動作機構にインスパイアされたReflex Memory(RM)ブロックを提案する。 RMとHTMの統合は、繰り返し情報をより効率的に処理するAccelerated Hierarchical Temporal Memory (AHTM)と呼ばれるシステムを形成する。元のアルゴリズムであるAHTMと比較して、AHTMは最大7.55倍の推論を加速し、H-AHTMは10.10倍の高速化でさらに性能を向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:40:12 GMT)
Personality-Driven Decision-Making in LLM-Based Autonomous Agents [0.3]
本研究では,人格特性がタスク選択にどう影響するかを計測し,評価する手法を提案する。以上の結果から,OCEAN属性に整合したタスク選択パターンが明らかとなり,プロアクティブサイバー防御戦略において,高い信頼性の認知エージェントを設計できる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:36:28 GMT)
Neural Pruning for 3D Scene Reconstruction: Efficient NeRF Acceleration [0.3]
本稿では,これらの問題に対処するための戦略としてニューラルプルーニングについて検討する。我々は,一様サンプリング,重要度に基づく手法,コアセットに基づく手法などのプルーニング手法を比較し,モデルサイズを削減し,トレーニングを高速化する。その結果,コアセット駆動プルーニングはモデルサイズを50%削減し,トレーニングでは35%の高速化を実現し,精度はわずかに低下した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:38:57 GMT)
The Material Contracts Corpus [0.3]
マテリアル・コントラクト・コーポレーション(Material Contracts Corpus、MCC)は、2000年から2023年にかけて、米国証券取引委員会(SEC)が公開企業から100万件以上の契約を申請したデータセットである。 MCCは契約設計と法的言語に関する実証的研究を促進し、AIベースの法律ツールの開発を支援している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:06:04 GMT)
Quantum algorithms for optimizers [0.2]
この講義ノートは量子アルゴリズムのPh.D.レベルのコースのためのものである。応用数学者や技術者向けに開発されており、以前の量子力学の背景を必要としない。このコースの主なトピックは、厳密な計算モデルの導入に加えて、入出力モデル、量子探索、量子勾配アルゴリズム、行列演算アルゴリズム、半定値最適化のためのミラー降下フレームワークである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:11:57 GMT)
Scraping the Shadows: Deep Learning Breakthroughs in Dark Web Intelligence [0.2]
我々はダークネット市場(DNMs)からデータを抽出するフレームワークを開発する。我々は,3つの最先端な名前付きエンティティ認識(NER)モデルの適用性を評価する。我々は、モデルをトレーニングし、微調整し、評価するために使用する、新しい注釈付きデータセットを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:12:19 GMT)
LLMs4SchemaDiscovery: A Human-in-the-Loop Workflow for Scientific Schema Mining with Large Language Models [0.2]
従来のスキーママイニングは半構造化データに依存しており、スケーラビリティを制限している。本稿では,大規模な言語モデルと人間のフィードバックを組み合わせてスキーマ抽出を自動化・洗練する新しいツールであるスキーママイナーを紹介する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:03:33 GMT)
Multi-Task Neural Architecture Search Using Architecture Embedding and Transfer Rank [0.2]
マルチタスクニューラルアーキテクチャサーチ(NAS)は、異なるタスク間でアーキテクチャ知識の伝達を可能にする。我々は、トランスファー効率を高めるために、進化的クロスタスクNASアルゴリズムであるKTNASを提案する。実験の結果、KTNASは探索効率と下流タスク性能においてピアマルチタスクNASアルゴリズムより優れていた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:23:11 GMT)
Attainability of quantum state discrimination bounds with collective measurements on finite copies [0.2]
いくつかの簡単な量子ビット例において、未知状態の任意の数のコピーに対してヘルストローム境界に対する解析式を求める。また、M-コピーヘルストローム境界を飽和させるために必要な条件についても検討する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:06:05 GMT)
Lightweight Deep Models for Dermatological Disease Detection: A Study on Instance Selection and Channel Optimization [0.2]
本稿では,分類段階の品質向上のために,DermaMNISTデータセットを前処理する手法を提案する。その結果,ResNetと類似したモデルの性能を得るため,ニューラルネットワークトレーニングのインスタンス数を削減した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:47:57 GMT)
Towards a Decentralised Application-Centric Orchestration Framework in the Cloud-Edge Continuum [0.2]
リソース管理ソリューションは、リソース発見、最適化、アプリケーションのデプロイ、ライフサイクル管理といったタスクを自動化し、管理することで、重要な役割を担います。本稿ではSwarmchestrateを紹介します。Swarmsの自己組織化原則にインスパイアされた、分散化されたアプリケーション中心のオーケストレーションフレームワークです。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:11:39 GMT)
WISE-TTT:Worldwide Information Segmentation Enhancement [0.2]
WISE-TTTは,テスト時間トレーニング(TTT)機構とトランスフォーマーアーキテクチャを併用した,協調設計による相乗的アーキテクチャである。 TTT層は、過去の時間データを圧縮し、世界情報を含む隠蔽状態を生成する。グローバルな情報がセグメンテーションのパフォーマンスに重大な影響を及ぼすという,最初の体系的な証拠を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:08:02 GMT)
Are uncloneable proof and advice states strictly necessary? [0.1]
我々は、QMA、BQP/qpoly、FEQP/qpolyといった言語が、不可能な量子証明とアドバイスを必要とすることを示す。われわれはQMAを、不可能な証明しか持たない言語と定義している。また、Aaronson、Buhrman、Kretschmerによって使われている言語が、厳密に拘束不能なFEQP/qpolyであるようなオラクルを使わずに示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:34:11 GMT)
Classical and mixed classical-quantum systems from van Hove's unitary representation of contact transformations [0.1]
我々はヒルベルト空間における古典力学の新しい定式化を開発する。古典力学との整合性については、波動関数の位相を固定する制約を課さなければならない。定式化は量子二レベル系の測定に適用される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:32:54 GMT)
New care pathways for supporting transitional care from hospitals to home using AI and personalized digital assistance [0.1]
本稿では,欧州の伝統的なケア経路とモノのインターネット,人工知能,デジタル支援技術の統合について概説する。移行ケアにおける現在のギャップを特定し、ケアパスを強化するための技術マッピングを定義する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:37:36 GMT)
SCFANet: Style Distribution Constraint Feature Alignment Network For Pathological Staining Translation [0.1]
SCFANet(Style Distribution Constraint Feature Alignment Network) SCFANetはStyle Distribution Constrainer(SDC)とFeature Alignment Learning(FAL)の2つの革新的なモジュールを組み込んでいる。我々のSCFANetモデルは既存の手法より優れており、H&E画像の正確なIHC画像への変換を実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:29:53 GMT)
Repetitions are not all alike: distinct mechanisms sustain repetition in language models [0.1]
反復配列は様々なタスクや状況下で出現し、複数の要因によって駆動される可能性がある。言語モデル (LM) の内部動作を2つの条件下で検討し, 繰り返しを行う。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:16:11 GMT)
GLiNER-biomed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition [0.1]
GLiNER-biomedは、バイオメディカルNERに特化されたジェネリストモデルと軽量モデル(GLiNER)のドメイン適応スイートである。従来の手法とは対照的に、GLiNERは任意のエンティティ型を推論するために自然言語記述を使用し、ゼロショット認識を可能にする。いくつかのバイオメディカルデータセットの評価では、GLiNERのバイオバイオームは、ゼロショットと少数ショットの両方のシナリオにおいて、最先端のGLiNERモデルより優れていることが示されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:40:50 GMT)
Machine Learning Prediction of Cardiovascular Risk in Type 1 Diabetes Mellitus Using Radiomics Features from Multimodal Retinal Images [0.1]
胸部レチノグラフィ,光コヒーレンス断層撮影,OCT血管造影画像から放射線学的特徴を抽出した。 OCT+ OCTAメトリクスと眼データを組み合わせた放射能は、全身的なデータ入力なしでAUC(0.89$pm$ 0.02)を達成した。これらの結果から,マルチモーダル網膜画像から得られた放射線学的特徴は,CVリスクラベルの識別・分類に有用であることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:25:38 GMT)
Charge and Spin Sharpening Transitions on Dynamical Quantum Trees [0.0]
U(1)およびSU(2)対称性に従うモニタリングされた量子木における絡み合いとシャープニング遷移について検討した。その結果, エンタングルメント/パーフィケーションおよびシャープニング遷移は, 異なる測定速度で総じて起こることがわかった。 SU(2)の場合、ファジィ位相は汎用的であり、鋭い位相は最大測定率の限界においてのみ可能である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:38:18 GMT)
α-Ta (111) Thin Films for Qubit Applications: A Study of Thickness Dependence and Universal Scaling [0.0]
α-Ta薄膜は、c面サファイア基板上にスパッタエピタキシーにより成長した超薄膜(2nm)から厚膜(250nm)まで幅広い。 X線回折法による薄膜の格子定数と成長方向の抽出 α-Ta(111)表面上の酸化過程の密度汎関数理論シミュレーション
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:01:01 GMT)
rPPG-SysDiaGAN: Systolic-Diastolic Feature Localization in rPPG Using Generative Adversarial Network with Multi-Domain Discriminator [0.0]
本稿では,ジェネレーティブ・アドプレクティブ・ネットワークを用いた新しい深層学習アーキテクチャを提案する。識別器は、4つの損失関数を統合する:ノイズによる局所最小値への分散損失、可変長の配列とアライメントによって誘導される局所最小値に対処する動的時間損失、所望の周波数領域における均一な分布を保証するスペーサ性損失、PSG信号の収縮期と拡張期の間の時間間隔。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:20:27 GMT)
n-dimensional non-commutative GUP quantization and application to the Bianchi I model [0.0]
擬似配置変数で表される構成空間において,ある時点でピークに達したウェーブパケットのダイナミックスを示す。この選好は、2つの量子論において波のパケットによって示される異なる行動力学から生じる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:08:39 GMT)
ffstruc2vec: Flat, Flexible and Scalable Learning of Node Representations from Structural Identities [0.0]
本稿では、構造的アイデンティティを保持するノード埋め込みベクトルを学習するためのスケーラブルなディープラーニングフレームワークffstruc2vecを紹介する。フラットで効率的なアーキテクチャは、さまざまなタイプの構造パターンをキャプチャする際の高い柔軟性を可能にし、さまざまなダウンストリームアプリケーションタスクへの広範な適応性を可能にします。提案手法は, 多様な教師なしタスク, 教師なしタスクにまたがる既存手法を, 実用アプリケーションにおいて著しく上回っている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:47:16 GMT)
Zero-Shot Visual Concept Blending Without Text Guidance [0.0]
視覚概念ブレンディング」は、複数の参照画像の特徴をソース画像に転送するきめ細かい制御を提供する。本手法は, テクスチャ, 形状, 動き, スタイル, 抽象的な概念変換の柔軟な伝達を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:19:44 GMT)
Visually Image Encryption and Compression Using a CNN-Based Auto Encoder [0.0]
本稿では,デジタル画像の機密性を確保するための視覚暗号化手法を提案する。使用するモデルは、畳み込みニューラルネットワーク(CNN)を用いたオートエンコーダに基づく。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:43:36 GMT)
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data [0.0]
本研究では,SIGLIPとGemma-3bアーキテクチャを併用したVLM(Vision-Language Model)を提案する。 VLMは胸部X線からの視覚データを臨床コンテキストと組み合わせて、詳細なコンテキスト認識診断レポートを生成する。結石,空洞,結節などの急性TBの病態は,高い精度とリコールで検出された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:41:57 GMT)
View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis [0.0]
異常検出アプローチは一般的に教師なしであり、期待状態から逸脱を検出することで機能する。本稿では,2つの画像から異常を検出するScene Anomaly Detection (Scene AD)の問題を紹介する。逆蒸留異常検出法を改良し,Scene ADに取り組む新しいネットワークOmniADを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:59:21 GMT)
VNJPTranslate: A comprehensive pipeline for Vietnamese-Japanese translation [0.0]
VNJPTranslateは、Vi-Ja翻訳タスクに体系的に対処するために設計されたパイプラインである。コーパス分析によって特定される挑戦的なセグメントに対して、Chain-of-specificallyプロンプトを備えた高度なLLMを使用して、ターゲットデータ拡張戦略を特徴とする。我々は,実用的で高性能な翻訳システムを構築するために,効率的な微調整技術を採用している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:38:25 GMT)
Using complex prompts to identify fine-grained biases in image generation through ChatGPT-4o [0.0]
バイアスの2つの次元は、大きなAIモデルの研究を通して明らかにすることができる。トレーニングデータやAIの製品に偏りがあるだけでなく、社会にも偏りがある。画像生成AIに複雑なプロンプトを使ってバイアスのどちらの次元を調査できるかを簡単に議論する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:17:35 GMT)
Uncertainty quantification for data-driven weather models [0.0]
本研究では,現在最先端の決定論的データ駆動気象モデルであるPangu-Weatherから確率的天気予報を生成するための不確実性定量化手法について検討・比較する。具体的には,摂動によるアンサンブル予測を初期条件と比較し,予測の不確実性を定量化する手法を提案する。欧州における選択された気象変数の中距離予測のケーススタディにおいて,不確実な定量化手法を用いてパング・ウェザーモデルを用いて得られた確率的予測は,有望な結果を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:33:23 GMT)
Transductive One-Shot Learning Meet Subspace Decomposition [0.0]
ワンショット学習は、1つのラベル付き画像に基づいて、新しく導入され、目に見えないクラスを認識するために、事前訓練されたモデルを適用することに焦点を当てる。本稿では,サブスペースの分解を利用して,サポートセット内のラベル付き画像とクエリセット内のラベルなし画像からの情報を活用するための,トランスダクティブなワンショット学習手法を提案する。提案手法は,1つのラベル付き画像から新しいクラスに効果的に一般化することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:00:16 GMT)
Towards a Blockchain and Opportunistic Edge Driven Metaverse of Everything [0.0]
The Metaverse of Everything (MoE)は、Metaverseの概念とInternet of Everything (IoE)を融合したプラットフォームである。 MoEは生成されたデータと仮想エンティティを統合し、相互接続されたコンポーネントの広範なネットワークを作成する。研究者や企業が将来のサイバーレジリエンス・オパチュニストのMoEを構築するための主な課題を概説している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:40:58 GMT)
Towards Adaptive AI Governance: Comparative Insights from the U.S., EU, and Asia [0.0]
本研究は、米国(米国)、欧州連合(EU)、アジアにおけるAIトレンドの比較分析を行う。生成AI、倫理的監視、産業応用の3つの重要な側面に焦点を当てている。米国は最小限の規制制約で市場主導のイノベーションを優先し、EUは倫理的保護を強調する予防的リスクベースのフレームワークを施行し、アジアは規制の監督と迅速な展開のバランスをとる国家主導のAI戦略を採用している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:05:47 GMT)
Toward QCD on Quantum Computer: Orbifold Lattice Approach [0.0]
座標基底で単純なトランケートされたハミルトニアンを記述する方法を示す。基本表現における SU(3) ゲージ群変数とクォークは、qubit 上で簡単に実装可能であることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:51:35 GMT)
Time-Series Forecasting via Topological Information Supervised Framework with Efficient Topological Feature Learning [0.0]
トポロジカルデータ分析(TDA)は、複雑なデータ構造から意味のある特徴を抽出する強力なツールとして登場した。その成功にもかかわらず、TDAと時系列予測の統合は未定である。本研究では,ニューラルネットワークとCGANを利用して合成トポロジ的特徴を生成するトポロジカル情報監視(TIS)予測フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:34:55 GMT)
The quantum Newman-Moore model in a longitudinal field [0.0]
量子ニューマン・ムーアモデル (quantum Newman-Moore model) または量子三角プラケットモデル (quantum triangular plaquette model, qTPM) を縦場 (qTPMz) の存在下で研究する。我々はqTPMzの基底状態相図が翻訳対称性を破る様々なフラストレーション相を含むことを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:43:27 GMT)
Stochastic Reservoir Computers [0.0]
貯水池計算では、貯水池のコンピュータ全体の異なる状態の数は、貯水池のハードウェアのサイズに比例して指数関数的にスケールすることができる。ショットノイズは貯水池計算の性能に限界があるが,ノイズの影響が小さい場合,類似のハードウェアを持つ貯水池コンピュータに比べて性能が大幅に向上した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:16:35 GMT)
Statistical entropy of quantum systems [0.0]
第一部分系の平均フォン・ノイマン(VN)エントロピーが$mathbbE(Ssb_VN)=ln(D_1)+O(D_2)$であることを示す。この発見は、VNエントロピーとより大きな熱化量子系内のサブシステムの熱力学的エントロピー(TH)エントロピーの等価性を示すことから、重要な意味を持つ。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:21:03 GMT)
Spin models from nonlinear cellular automata [0.0]
我々は1D小細胞オートマトンの研究を非線形規則に拡張する。逆場の付加による量子ゆらぎを含むことにより、基底状態の量子相と相転移を研究する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:47:01 GMT)
Spectral decomposition of field operators and causal measurement in quantum field theory [0.0]
我々は、ボゾン場の量子論における場の作用素のスペクトル分解を構築する。この分解を用いて、フィールドオブザーバブルの測定を実装した量子演算の族を構成する。さらに、これらの量子演算が超音速信号に繋がらず、ソーキンの意味での量子場の計測が可能であることを示している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:08:56 GMT)
Spectral Normalization and Voigt-Reuss net: A universal approach to microstructure-property forecasting with physical guarantees [0.0]
設計プロセスにおける重要なステップは、効果的な機械的、熱的、あるいは一般的には弾性特性の迅速な評価である。古典的なシミュレーションに基づくアプローチは、例えば有限要素やFFTベースの解法を使うが、かなりの計算資源を必要とする。本稿では,これらの境界を優先的に適用するスペクトル正規化手法を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:21:57 GMT)
Spectral Architecture Search for Neural Networks [0.0]
本稿では,層間転送行列のスペクトル特性を利用した新しいアーキテクチャ探索プロトコルを提案する。提案手法は, 最小限の表現率を有する自己創出型アーキテクチャで, 調査対象のタスクを処理可能であることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:14:30 GMT)
Solving the Traveling Salesman Problem via Different Quantum Computing Architectures [0.0]
我々は、トラベルセールスマン問題(TSP)解決への新興フォトニックおよび量子コンピューティングアーキテクチャの適用について研究する。ゲートベースの量子コンピュータはシミュレーションで小さなTSPインスタンスの正確な結果を示した。 Isingベースのアーキテクチャでは、より大きな問題サイズのスケーラビリティが向上している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:40:23 GMT)
Signatures of Enhanced Superconducting Properties in Niobium Cavities [0.0]
Nbキャビティにおける異常周波数ディップのシステマティックな観察を報告する。このディップの大きさは、RF表面抵抗、表面近傍の不純物分布、および$T_mathrmc$と強く相関する。 RF電流による温度依存性表面抵抗の低下は, 周波数差, コヒーレンスピーク高さ, および, 温度依存性の表面抵抗の低下は, 最小でも有限の障害で起こることを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:50:11 GMT)
Semantic Mastery: Enhancing LLMs with Advanced Natural Language Understanding [0.0]
本稿では,より高度なNLU技術を用いて,大規模言語モデル(LLM)を進化させる最先端の方法論について論じる。我々は、構造化知識グラフ、検索強化生成(RAG)、および人間レベルの理解とモデルにマッチする微調整戦略の利用を分析する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:12:04 GMT)
Semantic Learning for Molecular Communication in Internet of Bio-Nano Things [0.0]
本稿では,タスク指向分子通信を最適化するエンドツーエンドのセマンティックラーニングフレームワークを提案する。提案フレームワークはディープエンコーダ・デコーダアーキテクチャを用いて,セマンティックな特徴を効率的に抽出,定量化し,デコードする。実験により,提案するセマンティック・フレームワークは従来のJPEG圧縮と比較して診断精度を少なくとも25%向上することが示された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:32:08 GMT)
Scaling Up Resonate-and-Fire Networks for Fast Deep Learning [0.0]
スパイキングニューラルネットワーク(SNN)は、イベントベースのセンサデータのニューロモルフィック処理において、有望な計算パラダイムを提供する。 RFニューロンは、その生物学的妥当性、複雑な力学、計算の単純さを訴える。我々は、S5モデルに基づくRFニューロンからなる新しいSSM層であるS5-RFを紹介する。 S5-RFは、RFネットワークを最大4つの層を持つディープSNNに初めてスケールし、78.8%の技術的結果が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:30:55 GMT)
Scalable noise characterization of syndrome-extraction circuits with averaged circuit eigenvalue sampling [0.0]
本稿では,量子誤り訂正符号のシンドローム抽出回路を特徴付けるために,スケーラブルなノイズ特徴化プロトコルを開発した。以上の結果から,ノイズの詳細な特徴付け手法は短期量子デバイスに拡張可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:18:09 GMT)
SViQA: A Unified Speech-Vision Multimodal Model for Textless Visual Question Answering [0.0]
テキストの書き起こしなしに音声質問を処理する統合音声ビジョンモデルであるSViQAを紹介する。 LLaVAアーキテクチャに基づいて、我々のフレームワークは2つの重要なイノベーションを通じて聴覚と視覚のモダリティを橋渡しします。 SBVQAベンチマークの大規模な実験結果は、提案したSViQAの最先端性能を実証している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:15:32 GMT)
Role of Riemannian geometry in double-bracket quantum imaginary-time evolution [0.0]
ダブルブラケット量子想像時間進化(Double-bracket quantum imaginary-time evolution、DB-QITE)は、エネルギーコスト関数の最も急勾配方向のステップをコヒーレントに実装する量子アルゴリズムである。我々はDB-QITEの数値シミュレーションを行い、そのようなサドル点付近の遷移のシグネチャを記述する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:01 GMT)
Revolutionizing Fractional Calculus with Neural Networks: Voronovskaya-Damasclin Theory for Next-Generation AI Systems [0.0]
この研究は、対称性と双曲型摂動関数によって活性化されるニューラルネットワーク演算子に対する厳密な収束率を導入する。古典近似理論をカプトー微分を通じて分数計算に拡張する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:03:00 GMT)
Review of "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality" [0.0]
This is a review of Frank Lad's book "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality"。 This is a review of Frank Lad's book "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality"。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:42:11 GMT)
Resolving the Exploration-Exploitation Dilemma in Evolutionary Algorithms: A Novel Human-Centered Framework [0.0]
アルゴリズム設計における探索-探索のジレンマに対する体系的な解決には、探索と搾取に関して独立して調整された制御が必要である。本稿では,(1)と(2)の具体化を外部変数(検索空間制御)で実現するHCTPS(Human-Centered Two-Phase Search)フレームワークを提案する。我々は,HCTPSが,EAs固有の収束機構を乱すことなく,検索空間のカバー範囲において,現在のアプローチをはるかに上回っていることを証明した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:55:35 GMT)
Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems [0.0]
この論文は、インダス・バレーの台本とチベット・李回廊の地図システムとの間の潜在的な歴史的つながりを調べるために、詳細な人類学的枠組みとともにCNN-Transformerのハイブリッドアーキテクチャを用いている。チベット・李回廊の文字は、青銅器時代(10.2%-10.9%)や原エラマイト(7.6%-8.7%)に比べて、インダス文字(61.7%-63.5%)の約6倍の視覚的類似性を示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:56:42 GMT)
Repeater-Based Quantum Communication Protocol: Maximizing Teleportation Fidelity with Minimal Entanglement [0.0]
任意の中間セグメントにおけるある種のノイズ状態に対するより効率的なプロトコルを提案する。提案手法は, 終端状態のノイズが増大しても, テレポーテーションの忠実度を高める。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:09:02 GMT)
Refined Quantum Algorithms for Principal Component Analysis and Solving Linear System [0.0]
主成分分析と線形方程式の解法のための2つの主要な量子アルゴリズムの洗練されたバージョンを概説する。提案手法は,従来の量子アルゴリズムや量子化アルゴリズムよりも指数関数的に高速である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:23:54 GMT)
Recent advances in the electromagnetic interactions of Dirac and Weyl particles [0.0]
ディラック粒子は、電磁四ポテンシャル場と磁場の広い範囲で同じ量子状態を占有できることを示す。ワイル粒子は外部電磁場がなくても局所状態を形成することができる。我々は、ワイルフェルミオンを利用して、前例のない100ペタビット/秒の速度で情報の流れを調節する革新的な装置を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:28:19 GMT)
Random feature-based double Vovk-Azoury-Warmuth algorithm for online multi-kernel learning [0.0]
再生カーネルヒルベルト空間(RKHS)における最小二乗回帰のための新しいマルチカーネル学習アルゴリズムVAW$2$を導入する。 VAW$2$は、ランダムフーリエ特徴量に基づく関数近似とVovk-Azoury-Warmuth (VAW) 法を2段階の手順で活用する。理論的解析により、ランダムな特徴の数が$T1/2$となるとき、人工的ランダム性に関して予想される$O(T1/2ln T)$の後悔境界が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:53:42 GMT)
Quantum memory based on concatenating surface codes and quantum Hamming codes [0.0]
本研究では,量子ハミング符号と曲面符号の結合を量子メモリとして検討する。エラーしきい値が高く、原則として表面コードのしきい値まで押し上げることができる。エラーを抑える利点は、中間スケールの量子メモリに現れ始めます。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:30:56 GMT)
Quantum computation of a quasiparticle band structure with the quantum-selected configuration interaction [0.0]
本稿では,量子部分空間展開法(QSE)と量子選択構成相互作用法(QSCI)を組み合わせて準粒子バンド構造を計算するハイブリッド手法を提案する。 IBM量子プロセッサ上で16量子ビットを用いたシリコンの準粒子バンド構造の量子計算を実演する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:25:19 GMT)
Quantum cellular automata and categorical dualities of spin chains [0.0]
スピン鎖上の対称性を反映する局所作用素の代数間の有界なスプレッド同型である圏双対について検討する。双対性に関する根本的な問題は、量子セルオートマトンに拡張できるかどうかである。ドップリッヒ=ハーグ=ロバーツ双加群の機械を用いた拡張問題の解を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:59:25 GMT)
Quantum Resetting Protocols Based on Synchronizing Words [0.0]
量子同期語に基づく新しいリセットプロトコルを提案する。本稿では,このプロトコルを実現し,量子コンピュータ上で実装可能な量子回路を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:23:21 GMT)
Propaganda is all you need [0.0]
政治的指向的なアライメントは、LLMの埋め込み空間に非常に強い影響を与える。社会政治的アプローチをとることで、ほとんどの大きなLLMはマルクス主義哲学が「支配的なイデオロギー」と呼ぶものと一致していると仮定できる。このような偏見は、社会的一様性のための新しい、または、変装した過激主義の見解を人々の間で引き寄せることによって、社会的変化に大きな影響を及ぼす可能性がある。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:54:05 GMT)
Probing the dichotomy between Yu-Shiba-Rusinov and Majorana bound states via conductance, quantum noise and $Δ_T$ noise [0.0]
一次元金属/スピンフリップ/金属/絶縁体/超伝導接合におけるマヨナ境界状態(MBS)からYSR状態を分析する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:55:31 GMT)
Predicting Movie Production Years through Facial Recognition of Actors with Machine Learning [0.0]
本研究では、機械学習アルゴリズムを用いて俳優を特定し、映画からランダムに撮影された画像から俳優の年齢を抽出する。アラブ映画から撮影された画像の使用には、一様でない照明、俳優のための異なる複数のポーズ、俳優や俳優のグループとの複数の要素などが含まれる。ロジスティック回帰モデルは、トレーニングフェーズにおける他のモデルと比較して最高のパフォーマンスを示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:46:05 GMT)
Predicting Dynamics from Flows of the Eigenstate Thermalization Hypothesis [0.0]
統計ヤコビ近似(SJA)と呼ばれる手法を導入し,固有状態熱化仮説(ETH)を更新する。 SJAは、ETHアンザッツの様々な形状因子に対する積分微分フロー方程式を生成する。摂動ハミルトニアンの熱状態におけるクエンチダイナミクスとオートコレレータを予測する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:02 GMT)
Pre-Floquet states facilitating coherent subharmonic response of periodically driven many-body systems [0.0]
本研究では,外部周期駆動力を受ける多ボソン系のコヒーレントなサブハーモニック動作を示す。高次サブハーモニック応答でさえ体系的に設計でき、実験的に観察できると論じられている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:33:11 GMT)
Performative Drift Resistant Classification Using Generative Domain Adversarial Networks [0.0]
本稿では,GDAN(Generative Domain Adversarial Network)について紹介する。 GDANを用いて、入力データのドメイン不変表現を生成し、生成ネットワークを使用して、実行的ドリフトの効果を逆転させる。ドリフト抵抗性分類を提供するGDANの能力を実証的に評価した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:12:34 GMT)
Patient-specific prediction of glioblastoma growth via reduced order modeling and neural networks [0.0]
本稿では,GBL成長の数学的モデルに対する概念実証を行い,リアルタイム予測と患者固有のパラメータ同定を可能にする。ニューラルネットワークサロゲートは、腫瘍の進化からモデルパラメータへの逆マッピングを学習し、計算速度を著しく向上させる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:23:52 GMT)
Optimizing Spatio-Temporal Information Processing in Spiking Neural Networks via Unconstrained Leaky Integrate-and-Fire Neurons and Hybrid Coding [0.0]
スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)と比較してエネルギー効率が高い SNNは、時間情報を処理する能力という重要な特徴を持っている。本稿では,時間ステップの異なるUnconstrained Integrate-and-Fire(ULIF)ニューロンモデルを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:04:23 GMT)
Open, Small, Rigmarole -- Evaluating Llama 3.2 3B's Feedback for Programming Exercises [0.0]
大規模言語モデル(LLM)は、ここ数年で広範囲にわたる研究の対象となっている。本研究は,LLM Llama 3.2(3B)のオープンで軽量なLLM Llamaのフィードバック特性について検討する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:24:39 GMT)
Nonequilibrium Universality of a Squeezing Phase Transition [0.0]
ハイゼンベルクに特徴的な位相と部分集合位相の遷移を見出した。本研究は, 低温原子, 分子, ライドバーグプラットフォームにおける量子センシングおよび量子シミュレーションへの応用の可能性を考慮した新しい動的相転移を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:13:40 GMT)
Non-Equilibrating a Black Hole with Inhomogeneous Quantum Quench [0.0]
1+1)次元共形場理論における量子クエンチ過程について検討する。 M"obius Hamiltonian によるクエンチでは、物理量の永遠周期的な振動が発見された。我々のクエンチ装置は、低温状態を作り出す方法や、ブラックホールの形成と蒸発過程をシミュレートする手段として使用することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:02:14 GMT)
Noise-tolerant public-key quantum money from a classical oracle [0.0]
公開鍵設定において、耐雑音性を実現する方法について初めて示す。この方式の紙幣は、共役符号化状態を作成し、標準基底ベクトルを置換するユニタリを適用することで鋳造される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:38:01 GMT)
No-go theorem for environment-assisted invariance in non-unitary dynamics [0.0]
本研究は,非単体操作では,環境支援による断熱的ショートカットが達成できないことを示す。また,外部浴槽にCFTが結合した場合,AdS/CFTにおける永遠ブラックホールの静的状態が侵害されることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:54:31 GMT)
No Free Lunch with Guardrails [0.0]
我々は,現行のガードレールが実用性を維持しつつ誤用を効果的に防ぐかどうかを評価する。調査の結果,ガードレール付き無料ランチは存在せず,セキュリティ強化がしばしばユーザビリティの犠牲となることが確認された。ユーザビリティを維持しつつリスクを最小限に抑える優れたガードレールを設計するための青写真を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:46:54 GMT)
New intertwining operators for the Calogero model [0.0]
我々は、結合定数の固定値と整数値に対して相互作用する粒子の数をエンハングする「新しい垂直」インタツツイン器を構築する。副生成物として、非対称リウヴィル積分の新しい基底が標準対称積分と関連して現れる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:34:46 GMT)
NCAP: Scene Text Image Super-Resolution with Non-CAtegorical Prior [0.0]
Scene Text Image Super- resolution (STISR) は低解像度画像の解像度と画質を向上させる。 TPのような明示的なカテゴリーの先行は、誤ってSTISRに悪影響を及ぼす可能性がある。事前訓練された認識器は、低解像度画像とのTP闘争を発生させるのに使われた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:14:07 GMT)
Multimodal LLMs for OCR, OCR Post-Correction, and Named Entity Recognition in Historical Documents [0.0]
我々は,マルチモーダル大規模言語モデル (mLLM) が研究者の歴史的文書の書き起こしにどう役立つかを検討する。我々は,mLLMと従来のOCRモデルの両方の既製の転写精度をベンチマークした。我々はまず,mLLMを用いたOCR出力のマルチモーダル後補正を導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 04:21:34 GMT)
Multilingual Performance of a Multimodal Artificial Intelligence System on Multisubject Physics Concept Inventories [0.0]
大規模言語モデルに基づく人工知能システム GPT-4o の多言語・多モーダル性能について検討する。私たちは、複数の言語と主題カテゴリにまたがる様々な物理概念の在庫を使用します。結果より, 被験者ごとのパフォーマンスの変動が示唆され, 実験室のスキルが最も弱いことが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:02:28 GMT)
Multi-copy activation of genuine multipartite entanglement in continuous-variable systems [0.0]
真のマルチパート・エンタングルメント(GME)のマルチコピー・アクティベーションは、2つの分離可能だが完全に分離不能な状態の複数のコピーがGMEを示す現象である。 GME-activatable non-Gaussian state の例を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:18:47 GMT)
Multi-Agent LLM Judge: automatic personalized LLM judge design for evaluating natural language generation applications [0.0]
大規模言語モデル(LLM)は、さまざまなドメインにまたがって素晴らしいパフォーマンスを示しているが、ドメイン固有の知識の不足、バイアス、幻覚といった問題に直面している。単語重複やテキスト埋め込みに依存する従来の評価手法は、動的でオープンなテキスト生成を評価するのに必要なニュアンスドセマンティック情報を取得するには不十分である。本稿では,様々な自然言語生成アプリケーション向けにパーソナライズされたLLM判断器を自動設計する動的マルチエージェントシステムを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:36:56 GMT)
Modified Hellmann Feynman Theorem [0.0]
我々は有名なヘルマン・ファインマン理論(HFT)を概観する。 HFT の修正形式を導出し、PT の破壊と破壊の両相、さらには理論の例外的な点においても良好である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 05:31:30 GMT)
Measurement Induced Dynamics and Trace Preserving Replica Cutoffs [0.0]
本稿では、複製量子系の測定誘起力学において生じる無限階層問題に対処する一般的な手法を提案する。提案手法では, トモグラフィー的手法を用いて低次レプリカ状態から高次レプリカ状態を推定する。これにより、単一レプリカシステムの力学が正しく標準リンドブラッド進化に還元されることが保証される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:20:42 GMT)
Linked Array Tree: A Constant-Time Search Structure for Big Data [0.0]
Linked Array Tree (LAT) は、検索、挿入、削除操作の時間的複雑さを実現するために設計された新しいデータ構造である。 LATの低メモリオーバーヘッドとポインタ重構造の回避は、大規模かつ集中的なワークロードに適しています。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:15:55 GMT)
Leveraging Joint Predictive Embedding and Bayesian Inference in Graph Self Supervised Learning [0.0]
グラフ表現学習は、ノード分類やリンク予測といったタスクの基盤として登場した。現在の自己教師付き学習(SSL)手法は、計算の非効率性、対照的な目的への依存、表現の崩壊といった課題に直面している。本稿では,意味情報と構造情報を保存しながら,対照的な目的と負のサンプリングを排除したグラフSSLのための新しい結合埋め込み予測フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:40:01 GMT)
Leveraging GANs For Active Appearance Models Optimized Model Fitting [0.0]
Active Outearance Models (AAM) は、画像に変形可能なモデルを適用するための確立された技術である。 AAMフィッティングプロセスがGAN(Generative Adversarial Network)の恩恵を受けるかどうかを検討する。我々は、GAN拡張フレームワーク用のU-NetベースジェネレータとPatchGAN識別器を用いて、装着時の外観モデルを洗練する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:12:07 GMT)
Learning by gaming, coding and making with EDUMING: A new approach to utilising atypical digital games for learning [0.0]
本稿では、EDUMINGの概念を用いて、デジタル学習ゲームの開発を簡単にするための新しい方法を提案する。ゲームベースの学習のような概念と確立された概念の主な違いは、ゲームが閉じられず、受動的に消費されることである。この研究は、コンセプトの実践的なテストに対する最初の経験的アプローチとして意図されている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:02:18 GMT)
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems [0.0]
本稿では,新しい大規模言語モデル (LLM) によるエージェントフレームワークを提案する。動的に進化する知識を活用することで、クエリを反復的に洗練し、文脈的証拠をフィルタリングする。提案システムは、更新されたコンテキストの競合的および協調的な共有をサポートする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:21:15 GMT)
It costs nothing to teleport information into a black hole [0.0]
最近発見されたブラックホールのデコヒーレンス現象は、量子情報を任意のエネルギーコストでブラックホールにテレポートする方法を説明します。ランダウアーの原理に従って、ゼロではない最小エネルギーコストは、外界からの情報とノイズの純消去がある場合や、ゼロビット'がブラックホールに送られるときのみ現れる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:00 GMT)
Integrating Fourier Neural Operators with Diffusion Models to improve Spectral Representation of Synthetic Earthquake Ground Motion Response [0.0]
原子炉施設は、強震動による動的負荷に耐えるように設計されなければならない。本研究では,人工地動を生成するためのAI物理に基づくアプローチを提案する。以上の結果から,このような手法が生成した人工地震計の現実性を高めることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:08:09 GMT)
Innovative LSGTime Model for Crime Spatiotemporal Prediction Based on MindSpore Framework [0.0]
本稿では,Long Short-Term Memory(LSTM)とGated Recurrent Unit(RU)とMultiheadparse Self-attentionメカニズムを統合した犯罪時空間予測モデルLGSTimeを提案する。統合モデルは、複雑な時間的データを扱うために、それぞれのテクニックの強みを活用する。 CNNモデルと比較して、Mean Squared Error(MSE)、Mean Absolute Error(MAE)、Root Mean Squared Error(RMSE)の2.8%、1.9%、および1.4%のパフォーマンス向上を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:50:20 GMT)
Industrially fabricated single-electron quantum dots in Si/Si-Ge heterostructures [0.0]
本稿では,ヘテロ構造をベースとしたスピン量子ビットデバイスと産業用CMOS技術との互換性について報告する。 Infineonの200mm生産ラインで製造されたSi/Si-Ge量子ドットデバイスを、制限された熱予算内に備えている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:53:59 GMT)
Improving error suppression with noise-aware decoding [0.0]
雑音認識復号法は, 符号の誤り抑制係数を増大させ, 符号距離の指数的に増大する論理誤差率を減少させることを示した。以上の結果から,これらのノイズ特性化実験は,超伝導量子コンピュータにおいて数秒で行うことが可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:19:40 GMT)
Improving Mapper's Robustness by Varying Resolution According to Lens-Space Density [0.0]
本研究では,意味空間全体にわたる単一解像度スケールの仮定を除去するMapperアルゴリズムの修正を提案する。我々の研究は、モース型関数の像中の密度(レンズ空間密度)が広く変化するデータセットによって動機付けられている。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:21:04 GMT)
Identifying Predictions That Influence the Future: Detecting Performative Concept Drift in Data Streams [0.0]
本稿では,データストリームにおける潜在的な性能的概念的ドリフトを特定することを目的とした,新しいタイプのドリフト検出タスクを提案する。 CheckerBoard Performative Drift Detection (CB-PDD) と呼ばれる最初のドリフト検出手法を提案する。その結果,CB-PDDは高い有効性,偽検出率の低下,内在的ドリフトに対するレジリエンス,半合成データセットにおける実行的ドリフトを効果的に検出する能力を示した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:59:58 GMT)
Hybrid interfaces at the single quantum level in fluorescent molecules [0.0]
複数の外部レーザー源が単一の蛍光分子の振動状態を制御している。定常状態は振動の両モード性を示し、非古典的な振動子猫状態の統計的混合をもたらす。この研究は、電子、光子、振動のハイブリッドな絡み合った状態を作るための最適量子ツールボックスとしての分子の役割を評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:56:04 GMT)
Holistic analysis on the sustainability of Federated Learning across AI product lifecycle [0.0]
フェデレートラーニング(FL)というAIの分散的アプローチ Cross-Silo FLは、クライアントが生データではなくモデル更新を共有できるようにするため、プライバシが向上する。モデルトレーニングのエネルギー消費とコストはクロスサイロ・フェデレート・ラーニングと同等である。フェデレートラーニング。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:58:38 GMT)
High-Field NMR Enhanced Sensitivity via Nuclear Spin Locking with NV Centers [0.0]
ダイヤモンド中の窒素空孔(NV)中心のような固体欠陥は、周囲温度でのNMRセンシングに利用されている。標準マイクロ波(MW)ベースのセンシング技術により、NVセンターは高速メガヘルツラーモアを高速で追跡するのに苦労した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:15:54 GMT)
Hard-constraining Neumann boundary conditions in physics-informed neural networks via Fourier feature embeddings [0.0]
物理インフォームドニューラルネットワーク(PINN)における強制約ニューマン境界条件に対する新しいアプローチを提案する。本手法では,ニューマン境界条件を直接ニューラルネットワークのアーキテクチャに組み込むために,特定のフーリエ特徴埋め込みを用いる。拡散問題に対する実験により提案手法の有効性を実証し,提案手法は既存のハードコントラスト法や古典的なPINNよりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:10:46 GMT)
HRET: A Self-Evolving LLM Evaluation Toolkit for Korean [0.0]
本稿では,韓国のLLMに特化したオープンソースの自己進化評価フレームワークであるHRET Haerae Evaluation Toolkitを紹介する。 HRETは、ログベースのスコアリング、正確なマッチング、言語不整合のペナル化、LCM-as-a-Judgeアセスメントなど、さまざまな評価手法を統一する。 HRETは、継続的進化のための自動パイプラインにより、再現性、公正、透明な韓国のNLP研究のための堅牢な基盤を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:37:16 GMT)
Gravitational entropy is observer-dependent [0.0]
観測者が果たす役割の適切な説明は、与えられた時空部分領域における可観測体のフォン・ノイマン代数を促進する。可能なオブザーバが多数存在する設定を考慮し、これを正確にする。関連するエントロピーを半古典的体系で計算する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:12:44 GMT)
Gradient-free Continual Learning [0.0]
連続学習(CL)は、破滅的な忘れを経験することなく、シーケンシャルなタスクでニューラルネットワークを訓練する上で、根本的な課題となる。伝統的に、CLの主要なアプローチは勾配に基づく最適化であり、ネットワークパラメータの更新は勾配降下(SGD)またはその変種を用いて行われる。このような場合、過去のデータには勾配情報がないため、制御されていないパラメータが変化し、その結果、以前に学習したタスクをひどく忘れてしまう。我々は、勾配のない最適化手法が、従来の勾配に基づく連続学習手法に代わる堅牢な代替手段を提供することができるという仮説を探求する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:18:59 GMT)
Global Framework for Emulation of Nuclear Calculations [0.0]
本研究では,初期多体計算とベイズニューラルネットワークを組み合わせた階層的枠組みを構築した。我々は、酸素同位体連鎖を用いた開発をベンチマークし、地上エネルギーと核電荷半径の正確な結果を得る。我々の枠組みは、核力を記述する低エネルギー定数に対して、核結合エネルギーと電荷半径のグローバル感度解析を可能にする。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 21:54:07 GMT)
Gazeau-Klauder coherent states for a harmonic position-dependent mass [0.0]
この系を記述するシュレーディンガー型方程式を解くことで固有系を導出する。この系に対するガゼウ・クラウダーのコヒーレントな状態を構築する。これらの状態の統計的性質を計算し分析する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 19:53:24 GMT)
Gaussian entropic optimal transport: Schrödinger bridges and the Sinkhorn algorithm [0.0]
エントロピー最適輸送問題は、最適輸送問題の正規化版である。これらの問題はシンクホーンアルゴリズム(反復比例フィッティング法)を用いて一般的に解決される。より一般的な設定では、シンクホーン反復は非線形条件/共役変換に基づいており、正確な有限次元解は計算できない。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:20:04 GMT)
Gaussian Formalism: Joint Measurement for Heisenberg's Uncertainty Relation for Errors by Squeezed Coherent States [0.0]
我々の関節計測は, 位置と運動量の投射的測定とを円滑に補間することを示す。射影測定の極限の場合、LT不確実性関係は自明な 0 = 0 となる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:15:13 GMT)
GRU-AUNet: A Domain Adaptation Framework for Contactless Fingerprint Presentation Attack Detection [0.0]
本稿では,Swin TransformerベースのUNetアーキテクチャとGRU強化アテンション機構を統合したドメイン適応手法であるGRU-AUNetを紹介する。 GRU-AUNetはプレゼンテーション攻撃に対する堅牢なレジリエンスを示し、平均BPCERは0.09%、APCERは1.2%に達した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:02:41 GMT)
Fluctuation-Induced Bistability of Fermionic Atoms Coupled to a Dissipative Cavity [0.0]
光格子を受けるフェルミオン原子の定常相図について検討し,光子損失を伴う微細な光学キャビティに結合した。自己組織相への遷移はポンプ強度の臨界値で起こる。驚くべきことに、さらに大きなポンプ強度では、キャビティフィールドと原子の2つの自己組織化された安定解が生まれ、不安定性の存在を示唆する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:47:31 GMT)
Flow Matching on Lie Groups [0.0]
Flow Matching (FM) は最近のジェネレーティブモデリング手法である。私たちは、$mathfrakX_$からサンプルを流すことで、$mathfrakX_$からサンプルの仕方を学ぶことを目指しています。我々は、代わりに線分に対して指数曲線を代入することでリー群上のFMに一般化する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:35:46 GMT)
Flash normalization: fast normalization for LLMs [0.0]
RMSNormはLlama、Mistral、OpenELMなど多くのLLMで使われている。この記事では、RMSNormの正確な実装であるFlashNormについて詳述する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:19:22 GMT)
Fault-tolerant correction-ready encoding of the [[7,1,3]] Steane code on a 2D grid [0.0]
本研究では,2次元グリッド上のSteane符号のゼロ論理状態をフォールトトレラントに作成するための様々な補正可能な符号化手法について検討する。数個のFrag-Bridge量子ビットによるパリティチェック符号化は、誤り率を低くすることで、検証ベースの符号化よりも優れていることを示す。驚くべきことに、リソース集約型のSteaneエラー補正と比較して、この低オーバーヘッド法は、ノイズの多い設定で実用的に有利である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:30 GMT)
FUSION: Frequency-guided Underwater Spatial Image recOnstructioN [0.0]
水中画像は、色歪み、可視性低下、波長依存性の減衰と散乱による構造的詳細の喪失など、深刻な劣化に悩まされている。既存の拡張手法は主に空間領域処理に重点を置いており、グローバルな色分布と長距離依存を捉える周波数領域の可能性を無視している。本稿では,空間領域情報と周波数領域情報を併用した2領域深層学習フレームワーク「フュージョン」を提案する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:16:19 GMT)
Exploring Personalized Federated Learning Architectures for Violence Detection in Surveillance Videos [0.0]
都市監視システムにおける暴力的事件を検出するという課題は、ビデオデータの輝かしく多様な性質によって複雑化されている。本稿では,これらの問題に対処するために,フェデレート・パーソナライズド・ラーニング(Federated Personalized Learning)を用いたターゲット・アプローチを提案する。本手法は学習モデルを各監視ノードのユニークなデータ特性に適応させ,監視ビデオデータの異種性および非IID特性を効果的に管理する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 14:47:14 GMT)
Explainable post-training bias mitigation with distribution-based fairness metrics [0.0]
人口統計学的に盲目で説明可能なモデルを生成するために,分布に基づく公平性制約を用いた新しい最適化フレームワークを開発した。我々のフレームワークは勾配勾配に基づいており、広範囲のモデルタイプに適用できる。我々は、これまでの研究に基づいて、我々の手法と互換性のある、解釈可能なグローバルバイアスメトリクスの幅広いクラスを設計する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:22:25 GMT)
Exact full-RSB SAT/UNSAT transition in infinitely wide two-layer neural networks [0.0]
我々は,典型的な状態の重なり合いの有無にかかわらず,グラディエントDescentはキャパシティに到達できないことを示す。この発見は勾配に基づくアルゴリズムが極めて非定型な状態に偏っていることを示唆している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:50:00 GMT)
Evaluating machine learning models for predicting pesticides toxicity to honey bees [0.0]
ApisToxは、ミツバチに対する化学毒性を実験的に検証した最も包括的なデータセットである。分子指紋,グラフカーネル,グラフニューラルネットワークなど,さまざまな機械学習アプローチを用いてApisToxを評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:57:14 GMT)
Entanglement-verified time distribution in a metropolitan network [0.0]
本稿では,テレコム波長における量子ドットが生成する絡み合った光子対と相関した光子対を利用した量子クロック同期の新たな手法を実験的に実証する。我々は、絡み合った光子間のタイトな時間相関を利用して、数十ピコ秒の同期精度を実現する。その結果、実世界の量子ネットワークにおける安全な時間同期と量子鍵分布のための共有リソースとして、量子ドット生成の絡み合ったペアの可能性を強調した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:57:11 GMT)
Entanglement and Optimal Timing in Discriminating Quantum Dynamical Processes [0.0]
2つの開量子力学過程を最適に区別する問題に対処する。この問題は、異なる時間依存チャネルの集合から引き出された2つの量子チャネルを区別できる最適時間を特定することで解決される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:57:52 GMT)
Enhancing Negation Awareness in Universal Text Embeddings: A Data-efficient and Computational-efficient Approach [0.0]
否定は自然言語推論や知覚分析といった自然言語処理タスクにおいて重要な役割を果たしている。近年のユニバーサルテキスト埋め込みの進歩は、様々なタスクにおけるコンテキストテキスト埋め込みよりも優れた性能を示している。一般的な評価ベンチマークのバイアスのため、これらのモデルの否定意識能力は依然として不明である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 09:39:57 GMT)
Emotion estimation from video footage with LSTM [0.0]
本稿では,ライブラリMediaPipeが生成したブレンド・サップを処理するLSTMモデルを提案し,顔の表情から主感情を推定する。このモデルはFER2013データセットに基づいてトレーニングされ、71%の精度と62%のf1スコアを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:11:09 GMT)
Efficient n-body simulations using physics informed graph neural networks [0.0]
本稿では,様々な天体物理シナリオからデータセットを生成するために,跳躍型シミュレーションエンジンを実装した。カスタム設計のGNNは、高精度で粒子加速を予測するために訓練されている。提案手法は,従来のシミュレーション手法に比べて約17%の速度向上を実現している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:23:34 GMT)
Effect-driven interpretation: Functors for natural language composition [0.0]
人間の言語も同様に、純粋な価値と不純なプロセスの付与と引き抜きを中心に組織されている、と我々は主張する。自然言語合成のエレガントで明快な分析を支援するために,コンピュータサイエンスからの記述技術をどのように活用できるかを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 00:46:01 GMT)
Double-bracket algorithm for quantum signal processing without post-selection [0.0]
量子信号処理(QSP)は、様々な量子アルゴリズムにおいて基本的なプリミティブである。汎用性にも拘わらず、QSPを実装するためのすべての体系的なプロトコルがポストセレクションに依存している。我々は、補助量子ビットもポストセレクションも必要としないエルミート行列のQSP変換を実装するための新しい公式を導入する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:04 GMT)
Double commutator method for a two band Bose-Einstein condensate: superfluid density of a flat band superfluid [0.0]
超流動密度と正規密度の和が f-sum 則の重みに等しいことを証明している。平面バンドBose-Einstein Condensate(BEC)の超流動密度について検討する。その結果,超流動密度は音速と圧縮率の二乗の積と直接比例していることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 22:04:38 GMT)
Diffusion-model approach to flavor models: A case study for $S_4^\prime$ modular flavor model [0.0]
本稿では,拡散モデルを用いて,一般的なフレーバーモデルにおける実験的制約のあるパラメータを探索する手法を提案する。我々は,自由パラメータを生成対象として扱うことにより,クォーク質量,CKM行列,Jarlskog不変量を再現するニューラルネットワークを構築した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:29:03 GMT)
Did ChatGPT or Copilot use alter the style of internet news headlines? A time series regression analysis [0.0]
ChatGPTやCopilotといった先進的な大規模言語モデル(LLM)のリリースは、テキストの作成方法を変えつつある。本研究は,この2つのLLMのリリースが,ニュースサイトにおける見出しやリンクの書き方の変化と一致したかどうかを考察した。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 06:56:57 GMT)
Detection of Anomalous Vehicular Traffic and Sensor Failures Using Data Clustering Techniques [0.0]
本研究では,高速道路センサからの交通流データの解析にクラスタリング手法を用いる。複数のクラスタリング手法、すなわちパーティショニングと階層的手法を、様々な時系列表現と類似度尺度と組み合わせて検討する。本手法は高速道路センサのリアルタイムデータに適用し,異なるクラスタリングフレームワークが交通パターン認識に与える影響を評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:09:39 GMT)
Detecting Financial Fraud with Hybrid Deep Learning: A Mix-of-Experts Approach to Sequential and Anomalous Patterns [0.0]
本研究では、Mixture of Experts(MoE)フレームワークとRecurrent Neural Networks(RNN)、Transformer Encoders、Autoencodersを統合したクレジットカード不正検出用ハイブリッドアーキテクチャを提案する。 MoEフレームワークは専門家の予測責任を動的に割り当て、適応的で文脈に敏感な意思決定を可能にする。提案するハイブリッドシステムは、ますます洗練された詐欺パターンを検出するために、スケーラブルでモジュラーで規制対応のアプローチを提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:47:18 GMT)
Design, Implementation and Practical Energy-Efficiency Evaluation of a Blockchain Based Academic Credential Verification System for Low-Power Nodes [0.0]
教育システムは広範な文書や書類を管理しており、人的ミスや、外交官、証明書、その他の資格証明書の改ざんなどの不正行為や詐欺に繋がることがある。本稿では、CPUブロックチェーンにデプロイされたスマートコントラクトがサポートする分散アプリケーションを通じて、学術記録の記録と検証を目的としたソリューションを提案する。提案手法は,従来のProof-of-Workコンセンサスプロトコルと新しいProof-of-Authority(PoA)プロトコルとを比較し,性能とエネルギー効率の両面で評価する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:18:58 GMT)
Deformations of the symmetric subspace of qubit chains [0.0]
対称部分空間の変形を群構造 $mathcalU_q(mathfraksu(2))$ の変形として提示する。対称部分空間の変形は、各スピンの内積の局所的な変形に対応し、対称性からの離脱を位置依存的な内積に符号化することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:59:29 GMT)
Cryptographic tests of the python's lunch conjecture [0.0]
絡み合いのくさびは、局所的には存在するが、CFTサブリージョンへの世界最小の面を含んでいない場合もあり、この場合、ピソンの昼食を含んでいると言われている。我々は、適切なCFTサブリージョン間の相互情報は、ランチの幾何学に関連した領域差によって線形に下降していると論じる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 16:56:24 GMT)
Covariant photon current [0.0]
標準ラグランジアンは、単一光子のローレンツとゲージ不変理論を得るために第二量子化される。連続性方程式は、物質源電流を伝送路内の伝搬を記述する非吸収項に分離することによって一般化される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:59:16 GMT)
Covariant decomposable maps on C*-algebras and quantum dynamics [0.0]
我々は $mathbbM_n (mathbbC)$ 上の写像の演算子和表現の特定の特徴を与える。量子力学への接続は、D-可分量子進化系列の共分散のための十分かつ必要な条件を特定することによって確立される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 20:32:52 GMT)
Conversations with Data: How Data Journalism Affects Online Comments in the New York Times [0.0]
本研究では、データジャーナリズム(DJ)がオンラインコメントにどのように影響するかを、データとのユーザインタラクションのケーススタディとして検討する。コーパスは2014年から2022年までの6,400のストーリーと、DJや他のニューヨーク・タイムズのコメントセクションで構成されている。その結果,DJはユーザ間の対話性が高いことが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 07:41:09 GMT)
Conditional Variable Flow Matching: Transforming Conditional Densities with Amortized Conditional Optimal Transport [0.0]
本研究では,連続条件変数間のアモート化を伴う条件分布の変換を学習するフレームワークを提案する。特に、メイン変数とコンディショニング変数の同時サンプル条件付きフローは、条件付きワッサースタイン距離と損失再重み付けカーネル条件付き最適輸送とを併せ持つ。 CVFMは、離散的かつ連続的な条件付きマッピングベンチマーク、画像から画像へのドメイン転送、製造過程における材料内部構造の時間的進化をモデル化するなど、ますます困難な問題群で実証する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 02:30:12 GMT)
Complex magnetic exchange, anisotropy and skyrmionic textures in two-dimensional FeXZ$_{2}$ (\textit{X} = Nb, Ta and \textit{Z} = S, Se, Te) ferromagnets [0.0]
ファンデルワールス金属系として知られるFeNbTe$_2$は、最近再合成され、強磁性秩序を示すことが示されている。本研究では, 第一原理密度汎関数理論 (DFT) を用いて, FeNbTe$_2$とその関連化合物の磁気的性質について深い知見を提供する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:53:55 GMT)
CodingTeachLLM: Empowering LLM's Coding Ability via AST Prior Knowledge [0.0]
我々は,コーディング学習用に設計された大規模言語モデル(LLM)であるCodingTeachLLMを紹介する。本モデルは,学習知識の構造的分解と漸進的指導によるアウトプットを実現する。当社のモデルは,オープンソースモデルと比較して,コード能力の最先端性も達成している。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:53:53 GMT)
Cellular automata in $d$ dimensions and ground states of spin models in $(d+1)$ dimensions [0.0]
我々は、$d$次元セルオートマトン(CA)の軌跡を用いて、$(d+1)$次元古典スピンモデルの基底状態を決定する方法を示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:45:22 GMT)
Catastrophic Forgetting in LLMs: A Comparative Analysis Across Language Tasks [0.0]
大規模言語モデル(LLM)は、かなり高度な自然言語処理(NLP)を持つ本研究では,主要なNLUタスクに対する各種オープンソースLLMの連続的な微調整について検討する。以上の結果から,Phi-3.5-miniのようなモデルでは,強い学習能力を維持しつつ,最小限の忘れを生じさせることが示唆された。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 23:06:55 GMT)
CNOT-Optimal Clifford Synthesis as SAT [0.0]
2量子CNOTゲートのようなノイズゲートの最小化は、実用的な計算に不可欠である。我々は、CNOTカウントの最適性を保証するために、クリフォード回路上でのみ、一定の正規形式で網羅的な探索を提案する。実験では、我々の符号化は、ランダムなクリフォード回路における既存のSATアプローチよりも大幅に優れていた。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:35:58 GMT)
CAPE: Connectivity-Aware Path Enforcement Loss for Curvilinear Structure Delineation [0.0]
CAPE(Connectivity-Aware Path Enforcement)はセグメンテーションマップから得られるグラフの接続性を強化するために設計された新しい損失関数である。本稿では,CAPEがトポロジ認識の指標を大幅に改善し,最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:03:52 GMT)
Bi-Grid Reconstruction for Image Anomaly Detection [0.0]
本稿では,textbfGRAD: Bi-textbfGrid textbfReconstruction for Image textbfAnomaly textbfDetectionを紹介する。 2つの連続格子を用いて、正常な視点と異常な視点の両方から異常検出を強化する。全体的な精度と微妙な違いを識別し、既存の方法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:06:38 GMT)
Automated Feature Labeling with Token-Space Gradient Descent [0.0]
本稿では,トークン空間における勾配勾配勾配を用いた特徴ラベル作成手法を提案する。概念実証実験は、解釈可能な単一トークンラベルへの収束が成功したことを示す。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:04:19 GMT)
Automated Explanation of Machine Learning Models of Footballing Actions in Words [0.0]
サッカーにおけるショットのための単語化(大規模言語モデルを活用した新しいアプローチ)の構築方法を示す。具体的には、まず、ロジスティック回帰を用いた期待目標モデルを構築します。次に、この回帰モデルの共係数を用いて、因子(距離、角度、防御圧など)がモデルの予測にどのように寄与するかを記述する文を書く。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:18:22 GMT)
Asymptotic errors in adiabatic evolution [0.0]
量子力学における断熱定理は、系がハミルトニアンの離散固有状態にあり、ハミルトニアンが任意の時間にゆっくり進化すると、系は進化したハミルトニアンの対応する固有状態に留まることを意味する。本稿では,ハミルトニアンの進化が遅いが,任意に遅くないときに生じる,断続的な結果に対する補正の2つのレギュレーションを同定する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 11:18:03 GMT)
Artificial Geographically Weighted Neural Network: A Novel Framework for Spatial Analysis with Geographically Weighted Layers [0.0]
AGWNNは、複雑な非線形空間関係を捉えるために、地理的に重み付けされた技術とニューラルネットワークを統合する新しいフレームワークである。 AGWNNの性能を厳格に評価するために、シミュレーションデータセットと実世界のケーススタディの両方を用いて包括的な実験を行った。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 01:48:46 GMT)
Aplicação de Large Language Models na Análise e Síntese de Documentos Jurídicos: Uma Revisão de Literatura [0.0]
大規模言語モデル (LLMs) は、法的文書の分析と合成を最適化するためにますます使われている。本研究の目的は,LLMに適用された技術の現状を法的文脈で把握するために,系統的な文献レビューを行うことである。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:34:00 GMT)
Analyzing homogenous and heterogeneous multi-server queues via neural networks [0.0]
我々は,シングルステイトンマルチサーバシステムにおいて,顧客数の定常分布を予測するために,機械学習アプローチを用いる。システム内の顧客数の定常分布を、$GI/GI_i/2$キューで予測するのは私たちだけです。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 12:30:18 GMT)
Adaptive Low Light Enhancement via Joint Global-Local Illumination Adjustment [0.0]
低照度画像における局所的な露光の不整合に対処する新しい明るさ適応型拡張フレームワークを提案する。提案手法は,最先端のアルゴリズムと比較して,定量的,定性的な結果が得られる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 03:46:28 GMT)
Accelerating drug discovery with Artificial: a whole-lab orchestration and scheduling system for self-driving labs [0.0]
自動運転ラボは、自動化されたAI誘導の実験を可能にすることで、薬物発見を変革している。しかし、複雑なオーケストレーション、さまざまな楽器とAIモデルの統合、データの効率的な管理といった課題に直面している。人工知能は、包括的なオーケストレーションとスケジューリングシステムでこれらの問題に対処する。ラボの操作を統一し、自動化し、AIによる意思決定を統合する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:22:50 GMT)
AI-Powered Bayesian Inference [0.0]
ジェネレーティブ・人工知能(GAI)は、社会が知識の獲得についてどう考えるかを変えるインフレクティブ・ポイントを提唱している。 GAIは意思決定に対して完全に信頼できないが、意思決定パイプラインに統合可能な貴重な情報を提供することもある。与えられたプロンプトに対する可変回答を利用して、AI予測の確実性を反映した事前分布を構築することができる。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 15:27:51 GMT)
AI Regulation and Capitalist Growth: Balancing Innovation, Ethics, and Global Governance [0.0]
ルールと監視は、信頼の構築と公衆の保護によって長期的な成長を促進するのか、それともイノベーションと自由な企業を制限するのか? 本稿では、AI規制と資本主義的理想のバランスについて検討し、AI駆動アプリケーションにおけるAIデータプライバシに対する異なるアプローチがイノベーションにどのように影響するかに焦点を当てる。我々の分析は、過去の前例、現在のアメリカの規制の状況、経済予測、法的課題、そして最近のAI政策のケーススタディを合成する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:59:02 GMT)
A stochastic gradient descent algorithm with random search directions [0.0]
ランダムな探索方向を持つ勾配降下アルゴリズムを新たに開発する。ステップベクトルを減らしたこれらのアルゴリズムのほぼ確実に収束を確立する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 13:10:07 GMT)
A minimal Introduction to Quantum Computing [0.0]
本稿では,プログラマや機械学習技術者,データサイエンティストなど,コンピュータプロフェッショナルに適した量子コンピューティングの紹介を紹介する。我々のアプローチは、QCの基礎となる物理を抽象化し、チューリングマシンのような計算モデルとしてフレーム化する。基礎状態、量子ゲート、テンソル積などの基本的な概念を導入し、量子計算の構成要素がどのように形成されるかを説明する。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 17:33:28 GMT)
A Novel Approach to Reduce Derivative Costs in Variational Quantum Algorithms [0.0]
QNDM(Quantum Non-Demolition Measurement)は、量子可観測体の勾配やヘッセンを効率的に推定する。コスト関数の導関数を評価する際に、QNDMアプローチはより効率的である。本研究の重要な成果は,補充材料として提供されたPythonにおけるQNDM法の実装である。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 10:20:18 GMT)
A Deterministic Model of Free Will [0.0]
2つの概念に基づいて自由意志の決定論的モデルを開発する。人間には自由意志があるが、決定論はそうではない。このモデルは、量子物理学実験における自由選択の基礎的な問題を研究するために応用される。
論文参考訳（メタデータ） (Tue, 01 Apr 2025 18:00:36 GMT)