VTON 360: High-Fidelity Virtual Try-On from Any Viewing Direction [92.6] VTON(Virtual Try-On)は、電子商取引とファッションデザインにおける革新的技術であり、個人における衣服のリアルなデジタル視覚化を可能にする。
VTON 360は、任意のビューレンダリングをサポートする高忠実度VTONを実現するためのオープンな課題に対処する新しい3次元VTON法である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:08:48 GMT)
Bridging Textual-Collaborative Gap through Semantic Codes for Sequential Recommendation [91.1] CoCoRecは、シーケンシャルレコメンデーションのための新しいコードベースのテキストおよび協調的セマンティックフュージョン法である。
ベクトル量子化手法を用いて,多視点テキスト埋め込みから細粒度セマンティックコードを生成する。
テキスト・コラボレーティブ・セマンティクスの融合をさらに促進するために,最適化戦略を導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:54:44 GMT)
Learning a Fast Mixing Exogenous Block MDP using a Single Trajectory [87.6] STEELは、単一軌道から外因性ブロックマルコフ決定過程の制御可能なダイナミクスを学習するための、最初の証明可能なサンプル効率アルゴリズムである。
我々は,STEELが正解であり,サンプル効率が良いことを証明し,STEELを2つの玩具問題で実証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:32:34 GMT)
Nonlinearity-driven Topology via Spontaneous Symmetry Breaking [79.2] パラメトリック駆動型量子共振器の連鎖は、弱い近傍-ケル間相互作用によってのみ結合される。
トポロジーはカーの非線形性の構造によって決定され、非自明なバルク境界対応をもたらす。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:20:45 GMT)
A Survey on Deep Learning based Time Series Analysis with Frequency Transformation [75.6] 周波数変換(FT)は、時系列解析における最先端の精度と効率を高めるために、ディープラーニングモデルにますます取り入れられている。
この新興分野における注目の高まりと研究の高まりにもかかわらず、現在、FTを用いたディープラーニングベースの時系列モデルの体系的レビューと詳細な分析が欠如している。
本稿では,FTを用いた深層学習に基づく時系列解析における最近の研究成果を体系的に研究し,要約する総合的なレビューを紹介する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:49:06 GMT)
Thrust: Adaptively Propels Large Language Models with External Knowledge [69.5] 大規模事前学習言語モデル(PTLM)は、モデルパラメータの豊富な知識を符号化する。
PTLMの固有の知識は不透明または静的であり、外部の知識を必要とする。
本稿では,外部知識のインスタンスレベル適応推進(IAPEK)を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:14:13 GMT)
Pyramidal Flow Matching for Efficient Video Generative Modeling [67.0] この研究は、統合ピラミッドフローマッチングアルゴリズムを導入している。
元々の装飾軌道をピラミッドの一連の段階として犠牲にしており、最終段階のみが完全な解像度で機能している。
フレームワーク全体はエンドツーエンドで最適化でき、単一の統合Diffusion Transformer (DiT) を使用する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:37:07 GMT)
Variance-Dependent Regret Lower Bounds for Contextual Bandits [65.9] これは従来の$tildeO(dsqrtK)$ regret bound to $tildeO(dsqrtsum_k=1Ksigma_k2)$で改善されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:09:36 GMT)
UniMamba: Unified Spatial-Channel Representation Learning with Group-Efficient Mamba for LiDAR-based 3D Object Detection [64.7] LiDAR 3D検出の最近の進歩は、ポイントクラウド空間からグローバルな依存関係をキャプチャするTransformerベースのフレームワークの有効性を示している。
トランスフォーマーのかなりの数の3Dボクセルと二次的な複雑さのため、トランスフォーマーに供給する前に複数のシーケンスがグループ化され、受容野が制限される。
2次元視覚タスクの分野で達成された状態空間モデル(SSM)の印象的な性能に触発されて、我々は新しい統一マンバ(UniMamba)を提案する。
特に、UniMambaブロックは、主にローカリティモデリング、Zオーダーシリアライゼーション、局所グローバルシーケンシャルアグリゲータで構成されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:22:31 GMT)
Hydra-NeXt: Robust Closed-Loop Driving with Open-Loop Training [64.2] Hydra-NeXtは、軌道予測、制御予測、軌道修正ネットワークを一つのモデルに統合する、新しいマルチブランチ計画フレームワークである。
Hydra-NeXt は22.98 DS と 17.49 SR を上回り、自動運転の大幅な進歩を示している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:42:27 GMT)
Brain Tumor Classification on MRI in Light of Molecular Markers [61.8] 1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:50:23 GMT)
Compose Your Aesthetics: Empowering Text-to-Image Models with the Principles of Art [61.3] 本稿では,ユーザが特定した美学をT2I生成出力と整合させることを目的とした,美学アライメントの新しい課題を提案する。
アートワークが美学にアプローチするための貴重な視点を提供する方法にインスパイアされた私たちは、構成的枠組みのアーティストが採用する視覚的美学を定式化した。
我々は,T2I DMが,ユーザが特定したPoA条件により10の合成制御を効果的に提供することを実証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:58:09 GMT)
Prosody-Enhanced Acoustic Pre-training and Acoustic-Disentangled Prosody Adapting for Movie Dubbing [60.4] 高精度な韻律アライメントで高品質なダビング生成を実現するために,音響プロソディディスト2段法を提案する。
我々は、異なる映画における視覚領域シフトの影響を低減するために、ドメイン内感情分析モジュールを組み込んだ。
提案手法は,2つのベンチマークにおける最先端モデルに対して良好に機能する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:25:57 GMT)
Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [56.6] 最適な学習速度は、モデルパラメータとデータサイズの両方とのパワー-法則関係に従うが、最適なバッチサイズは、主にデータサイズでスケールする。
この研究は、Mixture-of-Expertsモデルや高密度トランスなど、異なるモデル形状と構造を統一する最初の研究である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:09:54 GMT)
VLMs Play StarCraft II: A Benchmark and Multimodal Decision Method [56.1] VLM-Attentionは、人工エージェントの知覚と人間のゲームプレイ体験を協調するマルチモーダル環境である。
基礎モデルを用いたVLMベースのエージェントは、明示的な訓練をすることなく複雑な戦術的操作を実行できることを示す。
この研究は、人間と協調したStarCraft IIエージェントを開発するための基盤を確立し、マルチモーダルゲームAIの幅広い研究課題を前進させる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:54:05 GMT)
From Demonstrations to Rewards: Alignment Without Explicit Human Preferences [56.0] 本稿では,逆強化学習原理に基づく学習アライメントの新たな視点を提案する。
大規模な選好データに頼る代わりに、デモデータから報酬モデルを直接学習する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:53:46 GMT)
QDM: Quadtree-Based Region-Adaptive Sparse Diffusion Models for Efficient Image Super-Resolution [54.7] 領域適応拡散フレームワークであるQuadtree Diffusion Model (QDM)を提案する。
低品質入力から派生したクワッドツリーで拡散を誘導することにより、QDMは葉ノードで表現されるキー領域を特定する。
実験は、QDMが様々な画像タイプ、特に医用画像における高分解能SRタスクにおいて有効であることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:50:30 GMT)
LAPIG: Language Guided Projector Image Generation with Surface Adaptation and Stylization [54.3] LAPIGはユーザテキストプロンプトを入力として、プロジェクタを使って表面スタイルを変換することを目的としている。
投影面適応(PSA)は補償可能な表面スタイリングを生成する。
生成した画像は、視覚的に表面の形状を楽しませるために投影される。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:31:04 GMT)
Lean-STaR: Learning to Interleave Thinking and Proving [53.9] 証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:25:58 GMT)
On Tractable $Φ$-Equilibria in Non-Concave Games [53.2] 非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:35:26 GMT)
EndoChat: Grounded Multimodal Large Language Model for Endoscopic Surgery [53.0] 手術シーン理解における対話のパラダイムやサブタスクに対処するために,EndoChatを導入する。
本モデルは,5つの対話パラダイムと8つの手術シーン理解タスクにまたがって,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:35:48 GMT)
SPOC: Spatially-Progressing Object State Change Segmentation in Video [52.7] 本稿では,空間的に進行するオブジェクト状態変化セグメンテーションタスクを紹介する。
目標は、アクション可能なオブジェクトと変換されるオブジェクトのピクセルレベルの領域をセグメント化することです。
本研究は,ロボットエージェントに役立てるために,活動進行の追跡に有用であることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:48:54 GMT)
Information-Guided Identification of Training Data Imprint in (Proprietary) Large Language Models [52.4] 情報誘導プローブを用いて,プロプライエタリな大規模言語モデル (LLM) で知られているトレーニングデータを識別する方法を示す。
我々の研究は、重要な観察の上に成り立っている: 高次数テキストパスは、暗記プローブにとって良い検索材料である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:19:15 GMT)
Improving Autoregressive Visual Generation with Cluster-Oriented Token Prediction [52.1] IARは、LLMベースのビジュアル生成モデルのトレーニング効率と生成品質を向上させる改良された自動回帰ビジュアル生成方法である。
提案手法は,モデルのトレーニング効率と性能を100Mから1.4Bに継続的に向上させ,同じFIDを達成しながらトレーニング時間を半減させる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:31:42 GMT)
GDRNPP: A Geometry-guided and Fully Learning-based Object Pose Estimator [51.9] 剛体物体の6次元ポーズ推定はコンピュータビジョンにおける長年の課題である。
近年、ディープラーニングの出現は、信頼できる6Dポーズを予測するための畳み込みニューラルネットワーク(CNN)の可能性を明らかにしている。
本稿では,完全学習型オブジェクトポーズ推定器を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:14:21 GMT)
The Journey Matters: Average Parameter Count over Pre-training Unifies Sparse and Dense Scaling Laws [51.6] 本稿では,大規模言語モデルに対する最適スパース事前学習構成の体系的検討を行う。
総トレーニング計算の25%でプルーニングを開始し、75%で終了すると、ほぼ最適の最終評価損失が得られることがわかった。
本稿では,事前学習よりも平均パラメータ数を使用するように,チンチラスケーリング法を修正した新しいスケーリング法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:31:09 GMT)
Efficient and Privacy-Preserved Link Prediction via Condensed Graphs [49.9] 本稿では,HyDROtextsuperscript+について紹介する。
提案手法は,従来のネットワーク上でのリンク予測と比較して,約20*高速なトレーニングを実現し,ストレージ要求を452*削減する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:54:04 GMT)
DPCS: Path Tracing-Based Differentiable Projector-Camera Systems [49.7] ProCamのプロジェクタカメラシステム(ProCams)シミュレーションは、プロカメラの物理的プロジェクタ・アンド・キャプチャ・プロセスと関連するシーンパラメータをモデル化することを目的としている。
最近の進歩は、プロジェクト・アンド・キャプチャプロセスを学ぶためにエンドツーエンドのニューラルネットワークを使用している。
本稿では,新しい経路追従型微分可能プロジェクタカメラシステム(DPCS)を導入し,微分可能なProCamsシミュレーション手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:31:18 GMT)
A Bubble-Cluster Federated Learning Framework for Privacy-Preserving Demand Forecasting on Heterogeneous Retail Data [47.7] フェデレートラーニングにより、小売店はプライバシを維持しながら需要予測のためのモデルパラメータを共有できる。
本稿では,販売予測に適した新しいクラスタリングベースのフェデレーション学習フレームワークであるBubble-Cluster Federated Learning (BFL)を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:07:54 GMT)
V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception [47.6] V2X-Radarは、4Dレーダを特徴とする世界初の大規模実世界のマルチモーダルデータセットである。
データセットは20KのLiDARフレーム、40Kのカメライメージ、20Kの4Dレーダデータで構成され、5つのカテゴリに350Kの注釈付きボックスが含まれている。
様々な研究領域をサポートするために, 協調認識のためのV2X-Radar-C, 路面認識のためのV2X-Radar-I, 単車知覚のためのV2X-Radar-Vを確立した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:06:12 GMT)
Forecasting Open-Weight AI Model Growth on HuggingFace [46.3] 科学文献における引用力学と平行して構築する手法として,オープンウェイトモデルの影響を定量的に評価する枠組みを提案する。
オープンウェイトモデルの細調整モデルの累積数を追跡するために,Wangらによって導入された3つの重要なパラメータ-即時性,長寿命性,相対的適合性を用いて,科学的引用に適応する。
提案手法は,オープンウェイトモデル導入の多様な軌跡を効果的に捉えることが可能であり,ほとんどのモデルでは,ユニークなパターンや急激な使用感を示すアウトリーチが適している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:08:05 GMT)
DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life [46.1] 日常生活で遭遇した1,360の道徳的ジレンマのデータセットであるDailyDilemmasを提示する。
それぞれのジレンマは、影響された当事者と、それぞれの行動に関する関連する人間の価値の2つの可能な行動を示す。
我々は社会学、心理学、哲学に触発された5つの理論的枠組みのレンズを通して価値を分析する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:54:40 GMT)
GenVDM: Generating Vector Displacement Maps From a Single Image [44.8] VDM(Vector Displacement Map)の作成法について紹介する。
1つの入力画像が与えられた場合、まずマルチビューの正規写像を生成し、次に新しい再構成パイプラインを通して正規写像からVDMを再構成する。
また、3DオブジェクトからVDMを抽出する効率的なアルゴリズムを提案し、最初の学術的VDMデータセットを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:39:25 GMT)
PLM: Efficient Peripheral Language Models Hardware-Co-Designed for Ubiquitous Computing [43.2] 我々は、モデルアーキテクチャとエッジシステムの制約を協調的に最適化する共同設計プロセスを通じて開発された、周辺言語モデルであるPLMを紹介する。
PLMはMulti-head Latent Attentionメカニズムを採用し、正方形ReLUアクティベーション機能を採用してスパーシティを促進し、ピークメモリフットプリントを減少させる。
評価の結果, PLMは, 公開されているデータに基づいて訓練された既存の小言語モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:11:17 GMT)
NSF-SciFy: Mining the NSF Awards Database for Scientific Claims [43.1] NSF-SciFyは,国立科学財団(NSF)のデータベースから科学クレームを抽出する大規模データセットである。
出版が効力を持つ前に、研究ライフサイクルの初期段階でクレームを捉えます。
提案では,既存の科学的主張と実証研究の意図を区別する新たな課題も紹介する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:25:43 GMT)
Is Less More? Exploring Token Condensation as Training-free Test-time Adaptation [43.1] 対照的に、CLIP(Contrastive Language- Image Pretraining)は、一般化可能な画像表現の学習において優れているが、特定のデータセットのゼロショット推論では不足することが多い。
テスト時間適応(TTA)は、正規化レイヤやコンテキストプロンプトなどのコンポーネントを調整することでこの問題を軽減するが、通常は大きなバッチサイズと広範な拡張を必要とする。
本稿では,TCA(Token Condensation as Adaptation)を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:01:31 GMT)
VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search [42.6] 視覚言語モデルは多くの知覚に焦点を当てたタスクにおいて大きな進歩を遂げた。
しかし、高品質で多様なトレーニングデータがないため、推論に焦点を絞ったタスクの進歩は依然として限られている。
複数の分野にまたがる多種多様な高品質なデータセットを作成するために、VisualWebInstructを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:09:17 GMT)
Towards Learning High-Precision Least Squares Algorithms with Sequence Models [42.2] ソフトマックス変換器は高い精度の乗算を行うのに苦労していることを示す。
既存のアーキテクチャやトレーニング手順に存在する制限を特定します。
われわれは初めて、機械の精度に近い訓練を行う能力を実証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:25:11 GMT)
Recognition-Synergistic Scene Text Editing [41.9] シーンテキスト編集は、スタイルの一貫性を維持しながらシーンイメージ内のテキスト内容を変更することを目的としている。
従来の方法では、ソースイメージからスタイルとコンテンツを明示的に切り離し、ターゲットコンテンツとスタイルを融合することでこれを実現している。
本稿では,テキスト認識の本質的な相乗効果を完全に活用した新しいアプローチである認識-Synergistic Scene Text Editing (RS-STE)を紹介する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:39:50 GMT)
Mark Your LLM: Detecting the Misuse of Open-Source Large Language Models via Watermarking [41.0] 本研究は,オープンソースの大規模言語モデル(LLM)における2つの誤用シナリオを定義する。
本稿では,これらの文脈における推論時透かし蒸留とバックドア透かしの適用について検討する。
実験の結果, 後方透かしはIP Violationを効果的に検出でき, 推論時透かし蒸留はどちらのシナリオにも適用可能であることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:03:47 GMT)
Benchmarking Large Language Models via Random Variables [40.7] 近年の研究では、現在の数学ベンチマークの信頼性が懸念されている。
本稿では,Random Variablesによる大規模言語モデルを数学的推論でベンチマークするフレームワークであるRV-Benchを提案する。
以上の結果から,LSMは出現したデータドメインと"見えない"データドメインの習熟度に不整合を示すことが示唆された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:20:49 GMT)
Towards a Design Guideline for RPA Evaluation: A Survey of Large Language Model-Based Role-Playing Agents [40.2] ロールプレイングエージェント(Role-Playing Agent、RPA)は、様々なタスクにおいて人間のような振る舞いをシミュレートするLLMエージェントの一種である。
RPAの評価は多様なタスク要件とエージェント設計のために難しい。
本稿では, LLM に基づく RPA のためのエビデンスベース, 動作可能, 汎用的な評価設計ガイドラインを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:09:44 GMT)
2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification [40.1] 画像の2次元空間構造を組み込んだ新しい2次元選択型SSMフレームワークである2DMambaを提案する。
WSI分類と生存分析のための10の公開データセットの実験では、2DMambaはAUCで2.48%、F1スコアで3.11%、精度で2.47%、Cインデックスで5.52%改善している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:54:10 GMT)
Diffusion Dynamics Models with Generative State Estimation for Cloth Manipulation [39.7] 本稿では,知覚と動的モデリングの両方に対する拡散に基づく生成手法を提案する。
標準布メッシュと動的モデリングを用いて, 疎RGB-D観測から全布状態の再構築を行った。
我々のフレームワークは実際のロボットシステム上で布の折り畳みをうまく実行します。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:34:26 GMT)
ReBot: Scaling Robot Learning with Real-to-Sim-to-Real Robotic Video Synthesis [39.5] ReBotは、実際のロボットデータセットをスケーリングするための、新しいリアル・トゥ・シミュレート・トゥ・リアルのアプローチである。
ReBotは視覚言語アクション(VLA)モデルの性能とロバスト性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:47:25 GMT)
DiffGAP: A Lightweight Diffusion Module in Contrastive Space for Bridging Cross-Model Gap [38.5] DiffGAPは、軽量な生成モジュールをコントラスト空間に組み込んだ新しいアプローチである。
VGGSoundとAudioCapsのデータセットによる実験結果から,DiffGAPはビデオ/テキスト・オーディオ生成および検索タスクの性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:24:09 GMT)
TGB-Seq Benchmark: Challenging Temporal GNNs with Complex Sequential Dynamics [38.5] この問題に触発されて、逐次ダイナミクス付き時間グラフベンチマーク(TGB-Seq)を導入する。
TGB-Seqは、eコマースインタラクション、映画評価、ビジネスレビュー、ソーシャルネットワーク、引用ネットワーク、Webリンクネットワークなど、さまざまな領域にまたがる大規模な実世界のデータセットで構成されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:05:10 GMT)
Impact of Data Patterns on Biotype identification Using Machine Learning [38.3] 本研究では, 合成脳形態計測データを用いて, アルゴリズム性能に対するデータパターンの寄与について検討した。
SuStaInは17以上の変数を持つデータセットの処理に失敗し、計算の非効率性を強調した。
SmileGANとSurrealGANは、変数ベースの疾患パターンを識別する他のアルゴリズムよりも優れているが、これらのパターンは個々のレベルの分類を提供することができなかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:44:00 GMT)
VaLiD: Mitigating the Hallucination of Large Vision Language Models by Visual Layer Fusion Contrastive Decoding [38.2] LVLM(Large Vision-Language Models)はマルチモーダルタスク推論において顕著な機能を示す。
彼らはしばしば、幻覚として知られる視覚的内容が正確に反映されていないように思われる応答を生成する。
近年のアプローチでは、推論段階における復号化戦略を調整することで幻覚を緩和するための訓練不要な手法が導入されている。
textbfVisutextbfal textbfLayer Fustextbfion textbfD
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:22:18 GMT)
Permute-and-Flip: An optimally stable and watermarkable decoder for LLMs [38.0] 本稿では,Permute-and-Flip(PF)デコーダと呼ばれる新しいデコーダを提案する。
PFデコーダは標準サンプリングデコーダと同様の安定性を有する。
サンプリングよりも品質と安定性のトレードオフが最大で2倍向上している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:11:55 GMT)
WAVE: Weight Templates for Adaptive Initialization of Variable-sized Models [38.0] WAVEは変数サイズのモデルを初期化するための新しいアプローチである。
WAVEでは、サイズ固有のウェイトスケーラとともに、共有サイズに依存しないウェイトテンプレートを採用している。
WAVEは様々な深さと幅のモデルの初期化において最先端の性能を達成する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:21:38 GMT)
Towards An Efficient LLM Training Paradigm for CTR Prediction [37.2] 大型言語モデル(LLM)は従来のクリックスルーレート(CTR)予測手法よりも大幅に優れている。
CTR予測のためにLLMを訓練するために、既存の研究の多くは'sliding-window'パラダイムを採用している。
本稿では,動的ターゲット分離(Dynamic Target isolation, DTI)と呼ばれる新たなトレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:45:21 GMT)
Point-Cache: Test-time Dynamic and Hierarchical Cache for Robust and Generalizable Point Cloud Analysis [36.9] 本稿では,ポイントクラウド認識モデルを用いて,テスト時の分散シフトを処理できる汎用的なソリューションを提案する。
オンラインテストサンプルの重要な手がかりをキャプチャする階層型キャッシュモデルであるPoint-Cacheを開発した。
Point-Cacheは、完全にトレーニング不要であるため、ゼロショット推論に匹敵する効率で動作する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:13:23 GMT)
CHAIN: Enhancing Generalization in Data-Efficient GANs via lipsCHitz continuity constrAIned Normalization [36.2] GAN(Generative Adversarial Networks)は画像生成を著しく進歩させるが、その性能は豊富なトレーニングデータに大きく依存する。
限られたデータを持つシナリオでは、GANは差別者の過度な適合と不安定なトレーニングに苦労することが多い。
我々は、従来の中心ステップをゼロ平均正規化に置き換え、スケーリングステップでリプシッツ連続性制約を統合するCHAINを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:11:42 GMT)
Intrinsic and Extrinsic Factor Disentanglement for Recommendation in Various Context Scenarios [35.7] レコメンデーションシステムでは、ユーザー行動のパターンは異なる文脈で大きく変化する可能性がある。
これは、ユーザの行動は、ユーザの嗜好を反映する内在的要因と、異なる文脈で異なる可能性のある外部インセンティブを反映する外在的要因の2つのタイプによって共同で決定されるためである。
本稿では,様々な文脈を考慮した外在的要因と内在的要因を同時に区別する一般的なフレームワークである内在的・外在的遠近的勧告(IEDR)モデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:18:53 GMT)
Learning Dual-Domain Multi-Scale Representations for Single Image Deraining [35.2] DMSR(Dual-Domain Multi-Scale Representation Network)を提案する。
鍵となる考え方は、外部ドメインと内部ドメインの両方から並列に多重スケールの表現を活用することである。
本モデルでは,6つのベンチマークデータセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:45:33 GMT)
PanDA: Towards Panoramic Depth Anything with Unlabeled Panoramas and Mobius Spatial Augmentation [35.2] 本論文では,パンダと呼ばれるパノラマ深度基礎モデルを学習するための半教師付き学習フレームワークを提案する。
PanDAは、室内および屋外のパノラマデータセットを用いた共同トレーニングを通じて、DAMを微調整して教師モデルを学ぶ。
実験により、PanDAは様々な場面で顕著なゼロショット能力を示すことが示された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:07:43 GMT)
JailGuard: A Universal Detection Framework for LLM Prompt-based Attacks [35.0] JailGuardは、テキストおよび画像モダリティ間のプロンプトベースの攻撃を普遍的に検出するフレームワークである。
攻撃は本来、良心的な攻撃よりも頑丈ではないという原則に基づいて行われる。
テキストと画像の入力で86.14%/82.90%の最高の検出精度を達成し、最先端の手法を11.81%-25.73%、12.20%-21.40%向上させた。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:49:45 GMT)
Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars [34.9] Snapmoji(スナップモジ)は、自撮り写真からアニマタブルでデュアルスティル化されたアバターを瞬時に生成するアバター生成システムである。
GDA適応は3Dデータを用いた大規模ガウスモデルで事前訓練される。
Snapmojiは、わずか0.9秒で自撮りからアバターへの変換を実現し、モバイルデバイス上のリアルタイムインタラクションを毎秒30から40フレームでサポートする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:16:52 GMT)
CREAM: Consistency Regularized Self-Rewarding Language Models [34.3] 自己回帰型大規模言語モデル (LLM) は, 優先データに対する人間のアノテーションを必要とせずに, LLM-as-a-Judge を用いてアライメント性能を向上させることに成功した。
しかし、報酬とランキングの正確性は保証されていないため、精度の高い報酬と高品質な選好データを保証するのに不可欠である。
本稿では,各イテレーション間の報酬の整合性を活用し,自己回帰訓練を規則化する一貫性正規化sElf-rewarding lAnguage Model(CREAM)を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:45:39 GMT)
Can LLMs be Good Graph Judger for Knowledge Graph Construction? [34.0] 本稿では,上記の課題に対処するための知識グラフ構築フレームワークであるGraphJudgerを提案する。
提案手法には,エンティティ中心の反復的テキスト記述,知識認識型指導チューニング,グラフ判断の3つの革新的なモジュールが導入されている。
2つの一般的なテキストグラフペアデータセットと1つのドメイン固有のテキストグラフペアデータセットによる実験は、ベースライン法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:49:45 GMT)
From Laboratory to Real World: A New Benchmark Towards Privacy-Preserved Visible-Infrared Person Re-Identification [32.6] 現実世界の監視コンテキストでは、データは複数のデバイス/エンティティに分散され、プライバシとオーナシップの懸念が高まる。
実世界のアプリケーションにVI-ReIDを近づけるベンチマークであるL2RWを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:56:29 GMT)
TACO: Taming Diffusion for in-the-wild Video Amodal Completion [32.5] 本稿では,ビデオ全体を通して一貫したオブジェクトを生成することを目的とした,ビデオ・アモーダル・コンプリート(VAC)の課題に取り組む。
本稿では,事前学習したビデオ拡散モデルを利用した条件付き拡散モデルTACOを提案する。
TACOの汎用性は、インターネットから広範囲のWildビデオと、自律運転で一般的に使用される多様な未確認データセットで実証する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:47:45 GMT)
Data Driven Decision Making with Time Series and Spatio-temporal Data [32.4] このチュートリアルは「データ分析-決定」の全体的パラダイムに焦点を当てている。
まず時系列と時空間データの基礎を紹介する。
次に,データ品質の向上を目的としたデータガバナンス手法について議論する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:44:08 GMT)
Your Text Encoder Can Be An Object-Level Watermarking Controller [31.0] T2I遅延拡散モデル(LDM)の透かし画像に対する新しいアプローチを提案する。
テキストトークンの微調整だけで$W_*$を埋め込むことで、選択したオブジェクトや画像の一部に透かしを有効にし、従来のフルイメージの透かしよりも高い柔軟性を提供します。
提案手法では,99%のビット精度(48$bits)を実現し,モデルパラメータの105倍の削減を実現した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:35:39 GMT)
RePerformer: Immersive Human-centric Volumetric Videos from Playback to Photoreal Reperformance [30.7] RePerformerは、高忠実度人間中心のボリュームビデオの再生と再生を統一する新しい表現である。
再性能向上のために,意味認識型アライメントモジュールを開発し,運動ガウスに変形伝達を適用した。
RePerformerの堅牢性と有効性を検証する実験。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:50:18 GMT)
K-Sort Arena: Efficient and Reliable Benchmarking for Generative Models via K-wise Human Preferences [30.7] モデル比較でユーザー投票を集めるArenaプラットフォームは、モデルと人間の好みをランク付けすることができる。
我々はK-Sort Arenaを紹介した。K-Sort Arenaは、画像とビデオがテキストよりも知覚的直感性が高いという重要な洞察に基づく、効率的で信頼性の高いプラットフォームである。
我々の実験では、K-Sort Arenaは広く使われているELOアルゴリズムと比較して16.3倍高速収束を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:06:37 GMT)
ChronosX: Adapting Pretrained Time Series Models with Exogenous Variables [30.7] 本稿では,事前学習した時系列予測モデルに共変量を統合する新しい手法を提案する。
提案手法は,モジュールブロックによる事前学習予測モデルに共変量情報を組み込む。
本手法は,合成データと実データの両方の評価において,事前学習されたモデルに共変量情報を効果的に組み込むことで,既存のベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:34:19 GMT)
WonderVerse: Extendable 3D Scene Generation with Video Generative Models [28.0] 拡張可能な3Dシーンを生成するフレームワークであるWonderVerseを紹介する。
WonderVerseは、ビデオ生成基盤モデルに埋め込まれた強力な世界レベルの事前情報を活用する。
様々な3D再構成手法と互換性があり、効率的かつ高品質な生成を可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:20:05 GMT)
An LLM-Integrated Framework for Completion, Management, and Tracing of STPA [27.9] システム理論プロセス分析(System-Theoretic Process Analysis)は、この分野における比較的最近の発展を示す。
我々は,大規模言語モデル(LLM)をベースとした複数の自動化されたビルドAモデルに,無償でオープンソースソフトウェアフレームワークを導入している。
要求技術者と研究者が構築した実世界Aモデルに対して,本手法を実験的に検証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:31:13 GMT)
Bi-Criteria Optimization for Combinatorial Bandits: Sublinear Regret and Constraint Violation under Bandit Feedback [27.6] マルチアームバンディット(CMAB)におけるビクテリア最適化について検討した。
本稿では,離散二線形オフライン近似アルゴリズムをサブ線形後悔と累積制約違反保証を伴うオンラインアルゴリズムに変換する汎用フレームワークを提案する。
これらのアプリケーションは、オフライン保証をランディットフィードバックの下でオンラインの双基準最適化に適応する際のフレームワークの幅広いユーティリティを強調している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:52:27 GMT)
PaNDaS: Learnable Deformation Modeling with Localized Control [27.5] 我々は3次元表面メッシュの局所的な制御を可能にする点レベルで変形を学習することを提案する。
本手法は, 変形を形状の特定部分に多目的に制限することができる。
形状復元における最先端の精度と局所性を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:15:14 GMT)
Unsupervised Disentanglement of Content and Style via Variance-Invariance Constraints [26.5] 観察のシーケンスから歪んだ内容やスタイルの表現を効果的に学習する教師なしの方法。
このような帰納バイアスをエンコーダ・デコーダアーキテクチャに統合し、V3に因んでメソッドを命名する。
実験の結果,V3は複数の領域やモダリティにまたがる音色を呈し,絡み合ったコンテンツやスタイル表現の学習に成功した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:44:35 GMT)
An AI-driven multimodal smart home platform for continuous monitoring and intelligent assistance in post-stroke patients [26.4] 術後患者の在宅リハビリテーションを継続するためのスマートホームプラットフォームを提案する。
足底圧インソールは、最大94%の精度で運動回復段階に分類し、歩行パターンの定量的な追跡を可能にする。
ヘッドマウント型視線追跡モジュールは、認知評価と家庭用機器のハンズフリー制御をサポートする。
組込み大言語モデル(LLM)エージェントであるAuto-Careは、リアルタイムの介入を提供するために、マルチモーダルデータを継続的に解釈する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:44:16 GMT)
Details Enhancement in Unsigned Distance Field Learning for High-fidelity 3D Surface Reconstruction [26.4] 本稿では,通常のアライメントとSIRENネットワークを統合したDEUDF学習を提案する。
計算結果から,DEUDFは既存のUDF学習法よりも精度と再現面の品質が優れていることが示された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:27:18 GMT)
Second Order Bounds for Contextual Bandits with Function Approximation [26.1] まず、時間軸の平方根ではなく、測定分散の総和の平方根でスケーリングの残差を満足するアルゴリズムを開発する。
これらの境界は文脈線形問題において2階境界を導出する既存の手法を一般化する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:53:31 GMT)
AlphaNet: Scaling Up Local Frame-based Atomistic Interatomic Potential [24.9] AlphaNetは、原子系の局所的なフレームベースの同変モデルである。
原子環境を符号化し、表現能力を高め、エネルギーと力の予測における技術精度の状態を達成している。
精度、効率、転送可能性の相乗効果は、AlphaNetをマルチスケール現象をシミュレートするための変換ツールとして位置づけている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:32:22 GMT)
DecompDreamer: Advancing Structured 3D Asset Generation with Multi-Object Decomposition and Gaussian Splatting [24.7] DecompDreamerは高品質な3D合成を生成するために設計されたトレーニングルーチンである。
シーンを構成されたコンポーネントとその関係に分解する。
オブジェクトの絡み合いが優れている複雑な3D組成物を効果的に生成する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:37:25 GMT)
Effective and Efficient Cross-City Traffic Knowledge Transfer A Privacy-Preserving Perspective [24.4] 我々は、効果的で、効率的で、プライバシーに配慮したクロスシティ交通知識伝達フレームワークであるFedTTを提案する。
FedTTは、トラフィックデータドメインを、データ豊富な都市からデータ少ない都市に変換する。
4つの実生活データセットを用いた実験は、FedTTが14の最先端ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:26:24 GMT)
FA-BARF: Frequency Adapted Bundle-Adjusting Neural Radiance Fields [24.2] 本稿では,周波数適応型空間低域通過フィルタの時間的低域通過フィルタに代えて,周波数適応型バンドル調整放射場(FA-BARF)を提案する。
FA-BARFは、オブジェクト中心のシーンにほとんど摂動を伴わない共同最適化プロセスを加速し、未知のカメラポーズで現実世界のシーンを復元できることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:22:34 GMT)
Unlock the Power of Unlabeled Data in Language Driving Model [23.6] 我々は,従来の最先端手法よりも優れたシーン質問応答を駆動する強力な言語駆動モデル(LDM)を構築した。
LDMはラベル付きデータに制限のある44.85%のパフォーマンスを達成し、ラベル付きデータを使用すると54.27%まで増加し、完全なデータセットでトレーニングされたモデルはDriveLMベンチマークで60.68%に達した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:25:33 GMT)
Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models [23.4] Low-Rank Adaption (LoRA)は、大規模言語モデルに対してコスト効率の良い微調整ソリューションを提供する。
しかし、LoRAのメモリフットプリントは、主にオリジナルのモデルパラメータに支配されている。
メモリ効率のよいLoRA学習手法であるLoRAMを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:12:52 GMT)
Tailor: An Integrated Text-Driven CG-Ready Human and Garment Generation System [23.4] Tailorは、高忠実でカスタマイズ可能な3D人間をシミュレーション可能な衣服で生成する、テキストとアバターの統合システムである。
まず、テキスト記述をパラメータ化された体形に解釈するために、大きな言語モデルを用いる。
次に,新しい幾何学的損失を伴ってトポロジ保存を開発し,身体の幾何学に正確に適応する。
対称的な局所的な注意機構を持つ拡張されたテクスチャ拡散モジュールは、ビューの一貫性とフォトリアリスティックな詳細の両方を保証する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:58:02 GMT)
Universal Speech Token Learning via Low-Bitrate Neural Codec and Pretrained Representations [23.1] 本稿では,2種類のトークンを統一し,音声のすべての意味をカプセル化する普遍的な音声トークン学習UniCodecを提案する。
低ビットレートのニューラルは、グローバルスケールとローカルスケールでこのような非交叉離散表現を学習するために利用され、自己教師付き学習特徴から知識を抽出する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:50:43 GMT)
A Speech-to-Video Synthesis Approach Using Spatio-Temporal Diffusion for Vocal Tract MRI [22.9] 音声信号から声道の視覚を生成するための音声・ビデオ生成フレームワークを提案する。
本フレームワークは,まずRT-/cine-MRIシーケンスと音声サンプルを前処理し,時間的アライメントを実現する。
合成ビデオにおける声道運動の解析と比較により,健常者および舌癌患者の声道運動に関する枠組みについて検討した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:12:50 GMT)
Semantic-Supervised Spatial-Temporal Fusion for LiDAR-based 3D Object Detection [22.9] LiDARをベースとした3Dオブジェクト検出は,LiDAR点の特異性に起因する重要な課題を呈している。
本研究では,物体の動きによる空間的不整合を緩和する新たな融合モジュールを提案する。
また,ポイントワイドなセマンティックラベルを注入することで,疎LiDARデータを充実させるセマンティックインジェクション法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:23:19 GMT)
Ferret: An Efficient Online Continual Learning Framework under Varying Memory Constraints [22.3] Ferretはオンライン連続学習(OCL)アルゴリズムのオンライン精度を高めるために設計された包括的なフレームワークである。
Ferretは、繰り返し勾配補正アルゴリズムと組み合わせて、きめ細かいパイプライン戦略を採用している。
実験ではフェレットの顕著な効率が示され、最大3.7$times$低いメモリオーバーヘッドを実現した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:58:38 GMT)
E-SAM: Training-Free Segment Every Entity Model [22.3] 特有なES能力を示す新しいトレーニングフリーフレームワークであるE-SAMを紹介する。
E-SAMは、以前のESメソッドと比較して最先端のパフォーマンスを実現し、ベンチマークメトリクスで+30.1で大幅に改善されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:41:33 GMT)
Shadow Art Kanji: Inverse Rendering Application [22.2] このプロジェクトでは,漢字に類似した影を映し出す3Dモデルの構築を目指している。
芸術表現と計算技法を組み合わせることを目的としており、これらの日本語の文字を影を通して視覚化するための正確かつ効率的なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:46:41 GMT)
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model [22.1] トークンレベルの勾配分析を用いて、専門家の矛盾するトークンを識別する。
次に、現在の専門家から他の専門家へのルーティングに矛盾するトークンを促進するように調整された正規化損失を追加します。
本手法は,多種多様な視覚・言語モデルのためのプラグインとして機能する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:59:43 GMT)
Reflect-DiT: Inference-Time Scaling for Text-to-Image Diffusion Transformers via In-Context Reflection [21.7] そこで本研究では,テキストから画像への拡散変換をインコンテキスト機能付きで行うことで,Nのベスト・オブ・Nサンプリングに代わる手法を提案する。
我々は,Reflect-DiTがベースモデルとしてSANA-1.0-1.6Bを用いてGenEvalベンチマーク(+0.19)の性能を向上させることを示す。
GenEvalでは新しい最先端スコア0.81を達成し、1プロンプト当たり20サンプルしか生成せず、以前の最高スコア0.80を上回った。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:58:12 GMT)
CHOrD: Generation of Collision-Free, House-Scale, and Organized Digital Twins for 3D Indoor Scenes with Controllable Floor Plans and Optimal Layouts [21.6] 室内3次元シーンをスケーラブルに合成するための新しいフレームワークであるCHOrDを紹介する。
ChorDは家庭規模の、衝突のない、階層的に構成された屋内デジタル双生児を作る。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:05:10 GMT)
Improving LLM-based Document-level Machine Translation with Multi-Knowledge Fusion [21.5] 本稿では、文書要約とエンティティ翻訳の両方を含む複数の知識源を組み込むことにより、拡張されたアプローチを提案する。
提案手法は,ベースライン上での0.8,0.6,0.4 COMETのスコアを,余分な知識を伴わずに平均的に改善する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:18:45 GMT)
Adaptive Label Correction for Robust Medical Image Segmentation with Noisy Labels [21.1] 本稿では,雑音ラベルによる堅牢な医用画像分割のための平均教師に基づく適応ラベル補正フレームワークを提案する。
適応ラベルリファインメント機構は、複数の外乱バージョン間での差異を動的にキャプチャし、重み付けし、ノイズラベルの品質を高める。
また、サンプルレベルの不確実性に基づくラベル選択アルゴリズムを導入し、ネットワーク更新に高信頼なサンプルを優先順位付けする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:03:01 GMT)
VisTW: Benchmarking Vision-Language Models for Traditional Chinese in Taiwan [20.9] 本稿では,従来の中国語における視覚言語モデル(VLM)の総合評価ベンチマークを提案する。
評価スイートは,VisTW-MCQとVisTW-Dialogueの2つの相補的なコンポーネントを含む。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:32:58 GMT)
One-Shot Real-to-Sim via End-to-End Differentiable Simulation and Rendering [20.9] これらの特性を共同で識別できる新しい剛体オブジェクト表現を導入する。
本手法では, 格子型外見場と相まって, 新たな微分可能な点ベース幾何表現を用いる。
本研究では,ロボットのアクションシーケンスのみから,シミュレーションとレンダリング可能な世界モデルの両方を学習可能であることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:36:34 GMT)
Sparse Decomposition of Graph Neural Networks [20.8] 本稿では,集約中に含まれるノード数を削減する手法を提案する。
線形変換された特徴の重み付け和を用いてノード表現の近似を学習し、スパース分解によりこれを実現できる。
提案手法は推論高速化のために設計された他のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:38:30 GMT)
Towards Sustainable NLP: Insights from Benchmarking Inference Energy in Large Language Models [20.7] 大きな言語モデル(LLM)は、その例外的な生成能力と汎用性によって、ますます認識されている。
本研究では,幅広いNLPタスクを対象としたLLM推論エネルギーの総合的なベンチマークを行う。
量子化と最適なバッチサイズは、目的のプロンプトフレーズとともに、エネルギー使用量を大幅に削減できることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:28:13 GMT)
Integrating Chain-of-Thought for Multimodal Alignment: A Study on 3D Vision-Language Learning [20.6] CoT(Chain-of-Thought)推論は自然言語処理において有効であることが証明されているが、マルチモーダルアライメントでは未探索である。
本研究では,構造的推論をアライメントトレーニングに組み込むことで,3次元視覚支援学習への統合について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:59:54 GMT)
SPRINT: Script-agnostic Structure Recognition in Tables [20.4] 表構造認識(TSR)は、情報検索、テーブル再構築、文書理解など、さまざまな下流業務に不可欠である。
言語に依存しないセル配置予測としてTSRを提案し,表にSPRINT, スクリプトに依存しない構造認識を導入する。
我々は、PubTabNet、FinTabNet、PubTables-1Mを含むベンチマークTSRデータセットのパフォーマンスを実験的に評価した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:43:53 GMT)
ExGes: Expressive Human Motion Retrieval and Modulation for Audio-Driven Gesture Synthesis [20.4] ExGesはジェスチャ合成のための新しい検索強化拡散フレームワークである。
ExGesはFr'teche Distanceを6.2%減らし、EMAGEよりも5.3%減らした。
また、ユーザスタディでは、自然性および意味的関連性に対して71.3%の好意を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:31:47 GMT)
SteerX: Creating Any Camera-Free 3D and 4D Scenes with Geometric Steering [20.3] SteerXは、シーン再構成を生成プロセスに統合するゼロショット推論時ステアリング手法である。
ポーズフリーフィードフォワードシーン再構成モデルを用いて、3D/4Dシーン生成のための幾何学的報酬関数を2つ導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:20:08 GMT)
S2O: Static to Openable Enhancement for Articulated 3D Objects [20.3] 本稿では,静的な3次元オブジェクトを静的なオブジェクトから生成するS2Oタスクを紹介する。
我々の研究は、ロボット操作とAIタスクを具体化するインタラクティブな3Dオブジェクトを効率的に作成することを可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:13:28 GMT)
Auditing Differential Privacy in the Black-Box Setting [20.0] 我々は,型Iと型IIのエラーを明確に定義し,共形推論に基づく監査機構を提案する。
提案手法は最小限の仮定でI型エラー率を強く制御する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:34:40 GMT)
Edit Away and My Face Will not Stay: Personal Biometric Defense against Malicious Generative Editing [19.9] FaceLockは、敵の摂動を最適化して生体情報を破壊または著しく変更する、ポートレート保護の新しいアプローチである。
我々の研究はバイオメトリック・ディフェンスを推進し、画像編集におけるプライバシー保護の実践の基礎を定めている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:11:37 GMT)
A Practical Review of Mechanistic Interpretability for Transformer-Based Language Models [19.5] 機械的解釈可能性(MI)は、その内部計算をリバースエンジニアリングすることでニューラルネットワークモデルを理解しようとする、新たな解釈可能性のサブフィールドである。
タスク中心の観点から総合的な調査を行い、MI研究質問やタスクの分類を整理する。
分類学における各課題に対する技術,評価方法,重要な知見とともに,MIにおける研究の基本的対象について概説する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:12:40 GMT)
Sub-nanometer measuring ellipticity of a suspended optical nanowaveguides based on nondegenerate mechanical modes [19.1] ナノ導波路の非退化固有の曲げ力学的モードは、材料の力学的性質と構造的整合性に関する洞察を与える。
テーパ型光ファイバ(TOF)は2つの非退化内在性曲げ力学的モード(IFMM)を支持できる
楕円型TOFの非退化IFMMは、量子光学、原子物理学、センシング、光通信、マイクロナノメカニクスなどの分野におけるナノスケール構造とベクトル測定の研究のための新しい経路を提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:10:18 GMT)
LIAM: Multimodal Transformer for Language Instructions, Images, Actions and Semantic Maps [18.6] 言語,イメージ,アクション,マップの入力に基づいて,アクションの書き起こしを予測するエンド・ツー・エンドのモデルであるLIAMを提案する。
国内タスクのシミュレータ生成ベンチマークであるALFREDデータセットを用いて,本手法の評価を行った。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:54:06 GMT)
Drop-Upcycling: Training Sparse Mixture of Experts with Partial Re-initialization [18.3] エキスパートの混合(MoE)アーキテクチャは、同等のキャパシティの密度の高いモデルと比較して、トレーニングと推論のコストを著しく削減します。
アップサイクリング(Upcycling)は、トレーニング済みの高密度モデルを使用してMoEモデルを初期化し、トレーニングするアプローチである。
ドロップアップサイクルは、事前訓練された高密度モデルの知識を活用しながら、重量の一部を統計的に再出発させるという、一見矛盾する2つのアプローチを組み合わせたものである。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:50:33 GMT)
Seeing Sarcasm Through Different Eyes: Analyzing Multimodal Sarcasm Perception in Large Vision-Language Models [18.2] 本稿では,既存のマルチモーダルサルカムデータセット上で,システマティックに設計されたプロンプトを用いた分析フレームワークを提案する。
以上の結果より,LVLMと同一モデル内における顕著な相違が認められた。
これらの結果は、サルカズムの主観性を強調することによってバイナリラベリングパラダイムに挑戦する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:10:25 GMT)
Towards Vision Zero: The Accid3nD Dataset [18.1] 我々は、異なる天候と照明条件下での現実の高速道路事故の収集であるAccid3nDデータセットを提示する。
データセットには4台の道路カメラから記録された111,945個のラベル付きフレームと25HzのLiDARが含まれている。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出モデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:42:16 GMT)
On Minimizing Adversarial Counterfactual Error in Adversarial RL [18.0] 敵の騒音は、安全クリティカルなシナリオにおいて重大なリスクを生じさせる。
我々は,ACoE(Adversarial Counterfactual Error)と呼ばれる新しい目標を導入する。
本手法は, 対向RL問題に対処するための最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:16:19 GMT)
DiffAD: A Unified Diffusion Modeling Approach for Autonomous Driving [17.9] 本稿では,条件付き画像生成タスクとして自律運転を再定義する拡散確率モデルであるDiffADを紹介する。
不均一な目標を統一された鳥眼ビュー(BEV)に固定し、その潜伏分布をモデル化することにより、DiffADは様々な駆動目標を統一する。
逆プロセスは生成したBEV画像を反復的に洗練し、より堅牢で現実的な運転行動をもたらす。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:23:35 GMT)
Reasoning Elicitation in Language Models via Counterfactual Feedback [17.9] 事実と反事実の質問において精度のバランスをとる新しい指標を導出する。
本稿では,より優れた推論機構を実現するための微調整手法を提案する。
各種現実シナリオにおける微調整言語モデルの性能評価を行った。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:40:04 GMT)
EFC++: Elastic Feature Consolidation with Prototype Re-balancing for Cold Start Exemplar-free Incremental Learning [17.8] 高品質なバックボーンを学習する最初のタスクでは、不十分なデータが利用可能である、難しいコールドスタートシナリオについて検討する。
これは、高い塑性を必要とするため、EFCILにとって特に困難である。
本稿では,従来の課題に強く関連する方向のドリフトを規則化し,特徴表現を統一する効果的な手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:14:29 GMT)
A Survey on Federated Fine-tuning of Large Language Models [17.8] Federated Learning(FL)は、データプライバシを確保しながら協調的なモデル適応を可能にする、有望なアプローチを提供する。
まず,Large Language Models (LLMs) とFLの両方の歴史的進化を,関連する事前調査を要約しながら追跡する。
次に、既存のパラメータ効率細調整法(PEFT)について広範な研究を行い、FLにおける適用可能性について検討する。
最後に、重要なオープン課題を特定し、今後のFedLLMの進歩を推進するための有望な研究方針を概説する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:52:10 GMT)
O-TPT: Orthogonality Constraints for Calibrating Test-time Prompt Tuning in Vision-Language Models [17.6] 視覚言語モデル(VLM)のテスト時プロンプトチューニングは、微調整なしでラベルのないデータで学習できることから注目されている。
結果として得られたモデルはキャリブレーションの低さを示す傾向にあり、これらのモデルの信頼性と信頼性に疑問を呈する。
我々は、学習可能なプロンプトに対応するテキストの特徴に直交制約を導入する、O-TPTと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:45:54 GMT)
LAVCap: LLM-based Audio-Visual Captioning using Optimal Transport [16.1] LAVCapは大型言語モデル(LLM)ベースの音声視覚キャプションフレームワークである。
視覚情報とオーディオを統合し、音声キャプション性能を向上させる。
既存のAudioCapsデータセットの最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:38:50 GMT)
Instrument-Splatting: Controllable Photorealistic Reconstruction of Surgical Instruments Using Gaussian Splatting [15.5] Real2Simは、外科的人工知能(AI)と自律性の急速な発展により、ますます重要になりつつある。
本稿では3次元ガウススプラッティングを応用した新しいReal2Sim法であるInstrument-Splattingを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:17:30 GMT)
Learning Extremely High Density Crowds as Active Matters [15.4] 高密度の群衆分析と予測は、コンピュータビジョンにおける長年のトピックである。
高品質なデータと複雑な群集のダイナミクスが欠如していることから、それは非常に難しいことで知られている。
我々は,個人を追跡できない,あるいは頭を数えるのが難しい,品質の低いビデオから学ぶことを目的とした,新たなアプローチを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:14:26 GMT)
ROS-SAM: High-Quality Interactive Segmentation for Remote Sensing Moving Object [14.9] 小さなオブジェクトサイズ、あいまいな特徴、限定的な一般化は、現在のメソッドがこの目標を達成するのを難しくする。
本稿では,多様なリモートセンシングデータにまたがる一般化を維持しつつ,高品質な対話的セグメンテーションを実現する手法であるROS-SAMを提案する。
ROS-SAM は,1) SAM の一般化能力を維持しながらドメイン適応の効率化を実現する LoRA-based fine-tuning,2) 抽出した特徴の識別性向上のためのディープネットワーク層の拡張,3) マスクデコーダの局所境界詳細とグローバルコンテキストの統合による高品質セグメンテーションマスクの生成という,3つの重要なイノベーションに基づいて構築されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:10:09 GMT)
HInter: Exposing Hidden Intersectional Bias in Large Language Models [14.8] 大規模言語モデル(LLM)は、特定の個人に対する差別、特に複数の属性(交叉バイアス)によって特徴づけられるものを表現することができる。
LLMにおける交叉バイアスを自動的に検出するために,変異解析,依存性解析,およびオラクルを組み合わせたテスト手法であるHInterを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:10:38 GMT)
V-Stylist: Video Stylization via Collaboration and Reflection of MLLM Agents [14.6] ビデオスタイリングのための汎用マルチエージェントシステムであるV-Stylistを導入する。
V-Stylistは、ビデオスタイリスト、スタイルスタイリスト、スタイルアーティストの3つの主要な役割を持つ体系的なワークフローである。
例えば、V-Stylist は FRESCO と ControlVideo をそれぞれ 6.05% と 4.51% で上回っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:37:31 GMT)
Revisiting Training-Inference Trigger Intensity in Backdoor Attacks [14.4] トレーニング推論トリガのミスマッチは,2つの実践シナリオにおける攻撃を促進できることを示す。
これらの新たな洞察は、さまざまなバックドア攻撃、モデル、データセット、タスク、(デジタル/物理)ドメインにまたがって一般化可能であることが検証されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:07:00 GMT)
DynaGSLAM: Real-Time Gaussian-Splatting SLAM for Online Rendering, Tracking, Motion Predictions of Moving Objects in Dynamic Scenes [14.3] 高速なオンラインGSレンダリング, トラッキング, 動画像の動的シーンにおける移動物体の動作予測を実現する, 初のリアルタイムGS-SLAM "DynaGSLAM'" を提案する。
我々のDynaGSLAMは3つの動的実データセット上でSOTA静的および"Anti'' dynamic GS-SLAMより優れている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:20:14 GMT)
RCDN: Towards Robust Camera-Insensitivity Collaborative Perception via Dynamic Feature-based 3D Neural Modeling [14.0] 我々は、新しい堅牢なカメラ非感受性問題、すなわち、失敗したカメラの視点によって引き起こされる問題を克服する方法を導入する。
本稿では,ロバストカメラ非感度協調認識システムであるRCDNと,新しい動的特徴に基づく3Dニューラルモデリング機構を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:27:08 GMT)
DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.8] DALL-Mは、コンテキスト合成データを生成することで、臨床データセットを強化するフレームワークである。
構造化された患者データと、放射線学レポートやドメイン固有のリソースから抽出された文脈的知識を統合する。
大規模言語モデル(LLM)を用いて、既存の臨床特徴に対する文脈合成値と、全く新しい臨床的特徴を生成する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:25:38 GMT)
PIPO: Pipelined Offloading for Efficient Inference on Consumer Devices [13.8] 我々は、消費者デバイス上で効率的な推論を行うための、パイプラインオフロード(PIPO)と呼ばれる新しいフレームワークを提案する。
PIPOは、推論のための高効率なスケジューリングを実現するために、最適化されたデータ転送と計算を補完するきめ細かいオフロードパイプラインを設計する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:48:38 GMT)
Revisiting Backdoor Attacks on Time Series Classification in the Frequency Domain [13.8] 時系列分類(TSC)は現代のウェブアプリケーションの基盤となっている。
ディープニューラルネットワーク(DNN)は、臨界領域におけるTSCモデルの性能を大幅に向上させた。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:08:44 GMT)
Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances [13.7] 大規模なテキスト・ツー・イメージモデルは、編集中に埋め込まれた透かしを歪め、著作権保護に挑戦する。
We introduced W-Bench, a first comprehensive benchmark designed to evaluate the robustness of watermarking method。
本稿では,様々な画像編集技術に対するロバスト性を大幅に向上させる透かし手法であるVINEを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:23:29 GMT)
WeShap: Weak Supervision Source Evaluation with Shapley Values [13.7] 弱監督源の平均貢献度を定量化する評価指標としてWeShap値を導入する。
動的プログラミングを用いて,WeShap値の効率的な計算を行う。
その結果,下流モデルの精度は5.0ポイント向上した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:02:59 GMT)
PredicateFix: Repairing Static Analysis Alerts with Bridging Predicates [13.7] 本稿では,警告のキーワードを自動検索するアルゴリズムを提案する。
次に、PredicateFixをRAGパイプラインとして構築し、CodeQLコードチェッカーによってフラグ付けされたアラートを修正する。
PredicateFixは正しい修理の数を27.1% 72.5%増加させ、他のベースラインRAGアプローチよりも大幅に上回っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:09:04 GMT)
Prototype-Based Image Prompting for Weakly Supervised Histopathological Image Segmentation [13.6] 画素レベルのアノテーションのコストが高いため,画像レベルのラベル付き画像セグメント化の弱さが注目されている。
クラスアクティベーションマップ(CAM)を用いた伝統的な手法は、しばしば最も差別的な領域のみをハイライトする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:55:31 GMT)
Mammo-Clustering: A Multi-views Tri-level Information Fusion Context Clustering Framework for Localization and Classification in Mammography [13.6] マンモグラフィー画像は通常、非常に高解像度で、病変はごく小さな領域のみを占める。
ニューラルネットワークのダウンサンプリングは、マイクロ石灰化や微妙な構造が失われることを容易に引き起こす。
本稿では,三重情報融合を用いたコンテキストクラスタリングネットワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:30:53 GMT)
Is Pre-training Applicable to the Decoder for Dense Prediction? [13.5] これは、3つの革新的な設計を通じて"事前訓練されたエンコーダ$times$プレトレーニングされたデコーダ"のコラボレーションを促進する。
事前トレーニングされたエンコーダと事前トレーニングされたデコーダを単純に結合することで、$times$Netは自身を非常に有望なアプローチと区別する。
合理化された設計にもかかわらず、$times$Netはモノクロ深度推定やセマンティックセグメンテーションといったタスクにおいて高度なメソッドよりも優れている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:38:39 GMT)
FedTilt: Towards Multi-Level Fairness-Preserving and Robust Federated Learning [12.7] textttFedTiltは、複数レベルの公正性を保ち、外れ値に対して堅牢な新しいFLである。
傾き値のチューニングが2段階の公平性を実現し、持続的なアウトレーラを緩和できることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:57:23 GMT)
Toward a Human-Centered AI-assisted Colonoscopy System in Australia [12.5] 現在の開発は機械学習モデルのパフォーマンスを優先し、ユーザインターフェース設計、ワークフロー統合、全体的なユーザエクスペリエンスの重要な側面を見越している。
AIの可能性を最大限に実現するために、HCIコミュニティは、ユーザ中心の設計を擁護し、これらのシステムを確実に使用し、内科医の専門知識をサポートし、患者の成果を高める必要がある。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:36:48 GMT)
L-WISE: Boosting Human Visual Category Learning Through Model-Based Image Selection and Enhancement [12.5] 画像の摂動は、人間が真実のクラスを正確に報告する能力を高めることができることを示す。
本研究では,人間の視覚的学習を,テスト時に人間の分類精度を向上させる方法で強化することを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:26:48 GMT)
Critical Influence of Overparameterization on Sharpness-aware Minimization [12.3] 本研究は,シャープネス認識最小化(SAM)がオーバーパラメータ化に影響を及ぼすことを示す。
この効果は, ラベルノイズやスパシティなど, 実用的な環境下では特に顕著である。
また、パラメータ化の超越がSAMがSGDと比較してより均一なヘッセンモーメントでミニマを達成するのにどう役立つかについての洞察も提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:30:49 GMT)
Stochastic Primal-Dual Three Operator Splitting Algorithm with Extension to Equivariant Regularization-by-Denoising [12.2] 本稿では,凸3成分最適化問題のクラスを解くために,TOS-SPDHG法を提案する。
エルゴディック$O (1/K)$収束率を示す理論的収束解析を行い,逆問題の画像化におけるアプローチの有効性を実証する。
また,事前学習したディープデノナイジングネットワークを先行として活用するために,レギュラー化・バイ・デノナイジングフレームワークを利用するTOS-SPDHG-REDとTOS-SPDHG-eREDを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:42:16 GMT)
MambaMIC: An Efficient Baseline for Microscopic Image Classification with State Space Models [12.2] 本研究では,顕微鏡画像分類(MIC)タスクのための視覚バックボーンであるMambaMICを提案する。
具体的には,MambaMIC Blockというローカル・グローバルなデュアルブランチアグリゲーションモジュールを紹介する。
局所的な分岐では、局所的な畳み込みを用いて画素類似性を捉え、局所的な画素の忘れと知覚の増強を緩和する。
グローバルブランチでは、SSMはグローバル依存関係を抽出し、Locally Aware Enhanced Filterはチャネルの冗長性とローカルピクセルの忘れを低減します。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:18:57 GMT)
Bayesian Optimization by Kernel Regression and Density-based Exploration [12.1] 本稿では,カーネル回帰と密度に基づく探索(BOKE)アルゴリズムによるベイズ最適化を提案する。
BOKEは、効率的な関数近似、探索のためのカーネル密度にカーネル回帰を使用し、それらを信頼境界基準に統合して最適化プロセスの導出を行う。
我々は,BOKEがガウスのプロセスベース手法と競合するだけでなく,計算効率も優れていることを示した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:45:50 GMT)
SFDM: Robust Decomposition of Geometry and Reflectance for Realistic Face Rendering from Sparse-view Images [11.9] スパースビュー画像から顔の特徴を分解・再構成する新しい2段階技術を提案する。
顔の特徴をRGB色から分離する試みとして, 形状, 拡散反射率, 分光反射率について検討した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:51:12 GMT)
PSGait: Multimodal Gait Recognition using Parsing Skeleton [11.9] 本研究では,野生における歩行の正確な認識を実現するために,Parsing Skeletonという新しい歩行表現を提案する。
また,新しい解析スケルトンに基づく歩行認識フレームワークPSGaitを提案し,解析スケルトンとシルエットを入力として利用する。
プラグアンドプレイ方式として、PSGaitは様々な歩行認識モデルで最大10.9%のランク1精度向上を実現している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:38:47 GMT)
ITVTON: Virtual Try-On Diffusion Transformer Based on Integrated Image and Text [11.9] 画像品質を向上させるためにDiffusion Transformer (DiT) をジェネレータとして利用する ITVTON を導入する。
ITVTONは、空間チャネルに沿って衣服や人物画像を縫い合わせることにより、衣服と人物の相互作用を改善する。
単一拡散変圧器(Single-DiT)ブロック内の注意パラメータに対する訓練を制約する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:12:59 GMT)
Learn2Synth: Learning Optimal Data Synthesis using Hypergradients for Brain Image Segmentation [11.8] 合成によるドメインランダム化は、入力画像の領域に関してバイアスのないネットワークをトレーニングするための強力な戦略である。
本稿では,少数の実ラベル付きデータを用いて合成パラメータを学習する新しい手法であるLearner2 Synthを紹介する。
我々は,セグメンテーションネットワークの性能を向上させる方法で合成画像を強化するためのパラメトリックおよび非パラメトリック戦略を開発した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:14:51 GMT)
Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models [11.6] RLHFにおける生成と学習の分離を提案する。
オンラインDPOは、政治以外のデータに対して最も堅牢である。
非同期トレーニングは、オンラインだが非政治的なRLHFという未調査の制度に依存している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:43:19 GMT)
Design of an Expression Recognition Solution Employing the Global Channel-Spatial Attention Mechanism [11.5] 本稿では,ABAW(Affective Behavior Analysis in the Wild)コンペティションについて紹介する。
音声と画像の特徴処理を強化するため,大域的チャネル,空間的アテンション,中央値,空間的アテンションが向上するチャネルアテンションを提案する。
第6回ABAWコンペティションの表情認識タスクでは,オフィシャル検証において優れた結果を得た。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:59:34 GMT)
Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder [11.4] 我々は,事前学習した拡散モデルにおける細粒度多属性制御を実現するために設計された,新しいプラグイン・アンド・プレイモジュールであるAttribute (Att) Adapterを紹介する。
Att-Adapterは柔軟性があり、トレーニングのためにペア化された合成データを必要としない。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:06:34 GMT)
Distributed Speculative Inference (DSI): Speculation Parallelism for Provably Faster Lossless Language Model Inference [11.3] 本稿では,分散投機推論(DSI)を導入し,投機推論(SI)よりも確実に高速な新しい推論アルゴリズムを提案する。
DSIはフリーズ言語モデル(LM)で動作し、トレーニングやアーキテクチャの変更を必要としない。
シミュレーションの結果,DSI は SI よりも 1.29-1.92 倍高速であることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:52:03 GMT)
You Only Click Once: Single Point Weakly Supervised 3D Instance Segmentation for Autonomous Driving [11.3] YoCoフレームワークは、最小限の粗いクリックアノテーションを使用して、3Dの擬似ラベルを生成する。
時間的および空間的なラベル更新モジュールは、信頼できる更新ラベルを生成するように設計されている。
疑似ラベルを高信頼・高IoU予測に置き換えたIoU誘導拡張モジュールを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:46:30 GMT)
SFMNet: Sparse Focal Modulation for 3D Object Detection [11.2] SFMNetは、スパース畳み込みの効率と長距離依存をモデル化する能力を組み合わせた、新しい3次元スパース検出器である。
そこで本研究では,自律走行データセットの最先端性能について述べる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:40:58 GMT)
Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.2] 本稿では,ラベルのセマンティクスとメタラベルの精巧化を活用して,複数ラベルの質問分類を検索する新手法RR2QCを紹介する。
実験の結果,RR2QCはPrecision@KとF1スコアの既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:31:43 GMT)
Unveiling Inefficiencies in LLM-Generated Code: Toward a Comprehensive Taxonomy [11.2] 大きな言語モデル(LLM)は、将来性のある結果を伴う自動コード生成に広く採用されている。
以前の研究では、LLM生成コードを評価し、冗長性、保守性に乏しい、最適以下のパフォーマンスなど、さまざまな品質の問題を特定していた。
この研究は、コードLLMの改善、コード生成の品質と効率の向上も導くことができる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:59:36 GMT)
Automating the loop in traffic incident management on highway [11.0] 本稿では,大規模言語モデル(LLM)を交通事故管理のための意思決定支援システムに統合することにより,意思決定を支援する革新的なソリューションを提案する。
本稿では,(1)自然言語相互作用の柔軟性と最適化手法の堅牢性を両立するLLM+最適化ハイブリッド,(2)LLM機能のみを用いた意思決定を自律的に生成するフルLLMアプローチを提案する。
実験結果から,両手法が有望性を示す一方で,LLM+最適化ソリューションは信頼性が優れ,重要なアプリケーションに特に適していることが示唆された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:22:13 GMT)
Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis [10.7] 既存のプライバシー評価は、しばしばメトリクスや弱いメンバーシップ推論攻撃(MIA)に依存している。
本研究では,拡散に基づく合成に関する厳密なMIA研究を行い,画像モデル用に設計された最先端の攻撃がこの環境で失敗することを明らかにする。
本手法は,ライトウェイト駆動方式で実装され,手動最適化の必要性をなくし,メンバーシップシグナルを効果的に学習する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:13:27 GMT)
TFHE-Coder: Evaluating LLM-agentic Fully Homomorphic Encryption Code Generation [10.6] TFHE (Homomorphic Encryption over the Torus) は、復号化せずにデータを暗号化する。
マシンラーニングのプライバシ保護、セキュアなマルチパーティ計算、プライベートブロックチェーントランザクション、セキュアな医療診断といった可能性にもかかわらず、暗号化の複雑さとユーザビリティの問題により、その採用は制限されている。
この研究は、TFHEコード生成の最初のベンチマークを確立し、ドメイン固有のフィードバックで拡張されたLLMが、FHEコード生成の専門的ギャップを埋める方法を示している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:57:44 GMT)
Federated Cubic Regularized Newton Learning with Sparsification-amplified Differential Privacy [10.4] そこで我々は,DP-FCRN (differially Private Federated Cubic Regularized Newton) というフェデレーション学習アルゴリズムを導入する。
2次手法を活用することにより,本アルゴリズムは1次手法に比べてイテレーションの複雑さを小さくする。
また、プライバシーを確保するために、局所的な計算中にノイズの摂動も取り入れる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:45:25 GMT)
3D Student Splatting and Scooping [10.1] 3D Gaussian Splatting (3DGS)は、新しいビュー合成のための新しいフレームワークを提供し、ニューラルレンダリングと関連するアプリケーションに関する新しい研究の波をスパイクさせた。
フレキシブルな学生のt分布からなる新しい混合モデルを提案する。
より良い表現力を提供する場合、SSSは学習に新たな課題をもたらす。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:33:29 GMT)
Is Multi-Agent Debate (MAD) the Silver Bullet? An Empirical Analysis of MAD in Code Summarization and Translation [10.0] マルチエージェント・ディベート (MAD) システムは,大規模言語モデル (LLM) 間の構造化された議論を可能にする
MADは、役割特異的なエージェント、動的相互作用、構造化された意思決定を通じて、散発的な思考を促進する。
本研究では,2つのソフトウェア工学(SE)タスクにおけるMADの有効性について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:30:37 GMT)
Breaking the Box: Enhancing Remote Sensing Image Segmentation with Freehand Sketches [9.7] この研究は3つの重要な貢献を通じて、リモートセンシング画像のためのゼロショットインタラクティブセグメンテーションを前進させる。
まず、スケッチに基づく新しいプロンプト手法を提案し、従来のポイントやボックスのプロンプトを越えながら、直感的にオブジェクトのアウトライン化を可能にする。
第2に、人間のスケッチとリモートセンシング画像とをペアリングする最初のデータセットを導入し、将来の研究のためのベンチマークを設定します。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:21:37 GMT)
Multi-Agent Systems Execute Arbitrary Malicious Code [9.2] 敵コンテンツは、システム内の制御と通信をハイジャックして、安全でないエージェントや機能を呼び出すことができることを示す。
直接的または間接的なプロンプト注入の影響を受けないエージェントであっても,制御フローハイジャック攻撃が成功することを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:16:08 GMT)
Towards Optimal Offline Reinforcement Learning [9.1] 本研究では,長期平均報酬目標を用いたオフライン強化学習問題について検討する。
任意の固定的な行動ポリシーによって生成される状態-作用対はマルコフ連鎖に従う。
我々は、この大きな偏差原理の速度関数を用いて、未知の状態-作用-次の状態分布に対する不確実性集合を構築する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:41:55 GMT)
Robust Isolation Forest using Soft Sparse Random Projection and Valley Emphasis Method [9.1] アイフォレスト (iForest) は、異常がほとんど異なると仮定して、効果的に異常を検出するために設計された、教師なしの異常検出アルゴリズムである。
さまざまな研究がiForestの強化を目指しているが、結果のアルゴリズムはデータセット間での大幅なパフォーマンス格差をしばしば示していた。
これらの課題に対処するために、Robust iForest (RiForest)を紹介します。
RiForestは、ソフトスパースランダムプロジェクションによって得られた既存の特徴とランダムなハイパープレーンの両方を活用して、データセットに依存しない異常検出のための優れた分割特徴を特定する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:08:50 GMT)
Consider What Humans Consider: Optimizing Commit Message Leveraging Contexts Considered By Human [8.7] コミットメッセージはソフトウェア開発において不可欠であり、メンテナンスタスクと開発者間のコミュニケーションをサポートする。
本稿では,大規模言語モデルと検索に基づく最適化を活用して,人間によるメッセージの書き起こしを最適化するCommit Message Optimization (CMO)を提案する。
CMOは、より合理的、包括的、表現的なコミットメッセージを生成し、最先端のCMGメソッドと人間のメッセージの40.3%から78.4%を上回っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:10:02 GMT)
Evaluating the Capability of Large-scale Language Models on Chinese Grammatical Error Correction Task [8.7] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて顕著な能力を示している。
本報告では,中国語の文法的誤り訂正タスクにおける大規模言語モデルの性能について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:21:32 GMT)
Bench2FreeAD: A Benchmark for Vision-based End-to-end Navigation in Unstructured Robotic Environments [8.3] 現在のエンド・ツー・エンド(E2E)自動運転アルゴリズムのほとんどは、構造化された輸送シナリオにおいて標準車両上に構築されている。
本稿では,非構造道路環境におけるE2Eロボットナビゲーションについて検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:46:49 GMT)
AgentDroid: A Multi-Agent Framework for Detecting Fraudulent Android Applications [8.1] AgentDroidは、マルチモーダル分析とマルチエージェントシステムに基づく、Androidの不正なアプリケーション検出のための新しいフレームワークである。
Androidアプリケーションを処理し、分析のために一連のマルチモーダルデータを抽出する。
本フレームワークは91.7%,F1スコア91.68%の精度を実現し,ベースライン法よりも検出精度が向上した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:07:43 GMT)
MT-RewardTree: A Comprehensive Framework for Advancing LLM-Based Machine Translation via Reward Modeling [8.0] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)の複雑な推論タスクに成功している。
しかし, 機械翻訳(MT)への応用は, 体系的手法や評価ベンチマークが欠如しているため, 未検討のままである。
我々は,プロセス報酬モデルの構築,評価,デプロイを行う包括的なフレームワークであるtextbfMT-RewardTreeを紹介した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:04:51 GMT)
Linearly Homomorphic Signature with Tight Security on Lattice [7.9] 本稿では,選択メッセージアタック(EUF-CMA)下での生存不能に対する厳密なセキュリティを実現する,格子ベースの線形同型シグネチャスキームを構築する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:25:44 GMT)
Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes [7.8] 本稿では,RAG(Chain-of-Thought)とRAG(Retrieval Augmented Generation)を組み合わせたRAG(Retrieval Augmented Generation)の2つの方法を紹介する。
フィラデルフィア小児病院の5,980件のPhenopacket由来のノート,255件の文献ベースの物語,220件の内科的臨床ノートなど,まれな疾患データセットに対するこれらのアプローチを評価した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:57:31 GMT)
TLUE: A Tibetan Language Understanding Evaluation Benchmark [7.7] チベット語は700万人以上の人々が話しているが、大きな言語モデルの開発と評価は無視されている。
我々は,チベット語におけるLLMの能力を評価するための,最初の大規模ベンチマークであるTLUE(A Tibetan Language Understanding Evaluation Benchmark)を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:54:25 GMT)
End-to-End Edge AI Service Provisioning Framework in 6G ORAN [7.7] 本稿では,O-RAN rAppsとしてデプロイされたLarge Language Model (LLM)エージェントを活用する,新しいエッジAIおよびネットワークサービスオーケストレーションフレームワークを提案する。
提案システムでは,ユーザのユースケース記述をデプロイ可能なAIサービスと対応するネットワーク構成に変換することで,インタラクティブかつ直感的なオーケストレーションを可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:48:50 GMT)
Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.3] 本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。
その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。
本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:03:50 GMT)
ICCO: Learning an Instruction-conditioned Coordinator for Language-guided Task-aligned Multi-robot Control [7.3] 言語誘導型マルチロボットシステムにおける協調性を高めるための命令記述コーディネータ(ICCO)を提案する。
ICCOはコーディネータエージェントと複数のローカルエージェントで構成されており、そこでコーディネータはタスク指向と一貫性の命令を生成する。
学習目標に一貫性向上用語を加えて、指示とロボット行動の相互情報を最大化する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:03:20 GMT)
All or None: Identifiable Linear Properties of Next-token Predictors in Language Modeling [7.3] 言語モデル間の線形特性のユビキティに関する説明として,識別可能性を分析した。
適切な条件下では、これらの線形特性が分布等価な次トーケン予測器を全てあるいは全く持たないことを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:30:45 GMT)
Value Gradients with Action Adaptive Search Trees in Continuous (PO)MDPs [7.2] POMDPを連続的な状態、行動、観察空間で解決することは、現実のモビリティやロボティクスアプリケーションにおける自律的な計画の鍵となる。
我々は、兄弟のアクションブランチ間で価値情報を共有できる新しい値推定用多重重要サンプリングツリーを定式化する。
第2に,遷移確率に基づくオンラインサンプリングによる値勾配計算手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:51:06 GMT)
Deep Reinforcement Learning for Long-Short Portfolio Optimization [7.1] 本稿では,実際の取引ルールに適合する短売制のポートフォリオ管理フレームワークであるDeep Reinforcement Learning (DRL)を構築した。
鍵となるイノベーションは、長期にわたるトランザクションの動的進化を考慮に入れた、継続的取引における包括的な短期販売メカニズムの開発である。
従来のアプローチと比較して、このモデルはリスク調整されたリターンを向上し、最大損失を低減します。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:27:19 GMT)
TetrisLock: Quantum Circuit Split Compilation with Interlocking Patterns [7.0] 量子コンピューティングにおいて、量子回路は量子アルゴリズムの基本的な表現である。
本稿では,量子回路難読化のための分割コンパイル法であるTetrisLockを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:41:24 GMT)
Minuscule Cell Detection in AS-OCT Images with Progressive Field-of-View Focusing [6.8] 前部ぶどう膜炎の目印は、眼前室に炎症性細胞が存在することである。
近年の取り組みは、手動による細胞検出をコンピュータビジョンの自動化に置き換えることを目指している。
そこで我々は,段階的視野集中戦略による極小細胞検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:13:00 GMT)
Optimizing Attention with Mirror Descent: Generalized Max-Margin Token Selection [6.8] アルゴリズムは、$ell_p$-normの目的を持つハードマージンSVMに収束することを示す。
具体的には、これらのアルゴリズムは、$ell_p$-normの目的を持つ一般化されたハードマージンSVMに収束することを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:41:09 GMT)
Learning Physics-Consistent Material Behavior from Dynamic Displacements [6.7] 境界力情報を持たない変形材料からのみ物理-一貫性関係を学習するための機械学習手法を提案する。
我々は、ノイズのかなりのレベルに対して頑健であり、データ解像度の増大とともに基礎的な真実に収束することを実証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:47:06 GMT)
Gaussian and Non-Gaussian Universality of Data Augmentation [6.5] 単純なサロゲートを用いて,データの増大が推定値の分散や分布の制限にどのように影響するかを定量化する。
データの増大は、経験的予測リスクのような見積もりの不確実性を減らすよりも増加する可能性がある。
主理論ツールとして、ブロック依存に対するリンデバーグの手法の適応を開発する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:33:49 GMT)
Hierarchical Evolutionary Optimization with Predictive Modeling for Stable Delay-Constrained Routing in Vehicular Networks [6.4] Vehicular Ad Hoc Networks (VANETs) はインテリジェントトランスポートシステムの基盤であり、車両とインフラ間のリアルタイム通信を促進する。
本稿では,車載ネットワークにおける遅延制約付きルーティングのための階層的進化最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:51:06 GMT)
A Comprehensive Survey on Knowledge Distillation [6.4] 知識蒸留(KD)は、上記の問題に対処するために提案された顕著な手法の1つである。
本研究は, 蒸留源, 蒸留方法, 蒸留アルゴリズム, 蒸留の応用, 既存の方法との比較など, さまざまな側面からKDをレビューすることを含む。
本調査では, 拡散モデルのKD, 3次元入力, 基礎モデル, 変圧器, LLMなどの重要なサブカテゴリについて検討した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:48:29 GMT)
Cognitive Activation and Chaotic Dynamics in Large Language Models: A Quasi-Lyapunov Analysis of Reasoning Mechanisms [6.4] 本稿では,大規模言語モデルの推論機構の本質を明らかにする「認知活性化理論」を提案する。
実験により、モデルの情報の蓄積は非線形指数法則に従っており、Multilayer Perceptron (MLP) は最終的な出力においてより高い割合を占めることが示された。
本研究は, LLMの推論の解釈可能性に関するカオス理論の枠組みを提供し, モデル設計における創造性と信頼性のバランスをとるための潜在的経路を明らかにする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:15:10 GMT)
MARTSIA: Safeguarding Data Confidentiality in Blockchain-Driven Process Execution [6.3] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、ユーザ定義ポリシーと認証宣言属性を組み合わせることで、メッセージ部分レベルでの詳細な読み取りアクセス制御を提供する。
このアーキテクチャは、パブリックブロックチェーン固有の透明性と、機密性の高いアプリケーションに必要なプライバシとを効果的にバランスさせる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:23:23 GMT)
The Lucie-7B LLM and the Lucie Training Dataset: Open resources for multilingual language generation [6.2] 本稿では,Lucie TrainingデータセットとLucie-7Bの基礎モデルを紹介する。
Lucie Trainingデータセットは、フランス語を中心としたテキストコーパスの多言語コレクションである。
Lucie-7Bの基礎モデルは、フランス語と英語で同等のデータ量で訓練されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:20:45 GMT)
STiL: Semi-supervised Tabular-Image Learning for Comprehensive Task-Relevant Information Exploration in Multimodal Classification [6.1] マルチモーダル画像タブラル学習は注目されているが,ラベル付きデータに制限があるため,課題に直面している。
ラベル付きデータとラベルなしデータを組み合わせたセミ教師付き学習(SemiSL)は、有望なソリューションを提供する。
タスク関連情報を包括的に探索することで、モダリティ情報ギャップに対処する新しいセミSLフレームワークであるSTiLを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:31:28 GMT)
Weighted Graph Structure Learning with Attention Denoising for Node Classification [6.0] ノード分類を改善するためにエッジウェイト対応グラフ構造学習法(EWGSL)を提案する。
EWGSLは、ノードの特徴とエッジ重みを組み込むために、グラフアテンションネットワークにおける注意係数を再定義することでノード分類を改善する。
EWGSLは、最高のベースラインと比較して平均17.8%のマイクロF1改善がある。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:54:27 GMT)
Research on Large Language Model Cross-Cloud Privacy Protection and Collaborative Training based on Federated Learning [5.9] 大規模言語モデル(LLM)とクラウドコンピューティングの普及により、クロスクラウドモデルのデプロイメントとトレーニングのプライバシ保護とデータセキュリティに対する懸念が高まっている。
フェデレート学習に基づく分散クラウド間のトレーニングにおいて、プライバシ保護コラボレーションを可能にするとともに、これらの問題を解決するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:44:50 GMT)
Adaptive Fault Tolerance Mechanisms of Large Language Models in Cloud Computing Environments [5.9] 本研究では,クラウドコンピューティングシナリオにおける大規模言語モデルの信頼性と可用性を確保するため,新しい適応型耐故障機構を提案する。
チェックポイント、冗長性、状態遷移といった既知のフォールトトレラントメカニズムに基づいて構築され、動的リソース割り当てとリアルタイムパフォーマンスメトリクスに基づく障害予測が導入されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:45:33 GMT)
Resilience of Rademacher chaos of low degree [5.3] ラデマッハカオスのレジリエンスは、カオスが持続できる敵のサインフリップの最大数である。
我々はRadecherカオスの弾力性に関する確率的低バウンド保証を提供する。
次数2のラデマッハカオスと次数2のラデマッハカオスは,同じ概念的枠組みで確立されているが,大きな違いがある。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:59:02 GMT)
Hilbert Space Fragmentation and Subspace Scar Time-Crystallinity in Driven Homogeneous Central-Spin Models [5.3] 我々は、周期的に蹴られたハミルトンのストロボスコピックな非平衡量子力学について、均一な中心スピン相互作用を含む研究を行った。
Floquet-Krylov部分空間による離散時間変換対称性の破れにより、新しいタイプの時間結晶を導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:50:48 GMT)
Multi-output Classification for Compound Fault Diagnosis in Motor under Partially Labeled Target Domain [5.2] 本研究では,断層診断における領域適応のための新しいマルチアウトプット分類(MOC)フレームワークを提案する。
従来のマルチクラス分類(MCC)アプローチとは異なり、MOCフレームワークは個々の故障の重症度を独立に分類し、診断精度を向上する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:15:10 GMT)
Evaluation-Time Policy Switching for Offline Reinforcement Learning [5.1] オフライン強化学習(RL)では、環境からのインタラクションのデータセットを固定してタスクを最適に解決する方法を学ぶ。
オンライン学習のための多くの非政治アルゴリズムは、オフライン環境において、行動の分布の振る舞いを過大評価する傾向にある。
既存のオフラインRLアルゴリズムは、ポリシの制約やバリュー関数の変更といったテクニックを採用して、個々のデータセットのパフォーマンス向上を実現している。
我々は、行動改善のための純粋な非政治的RLエージェントの挙動を動的に結合するポリシー切替技術と、近くにとどまる行動的クローニング(BC)エージェントを導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:12:16 GMT)
EHNet: An Efficient Hybrid Network for Crowd Counting and Localization [5.1] 単一画像内のマルチスケールの群集分布は、群集数え作業における根本的な課題である。
EHNet(Efficient Hybrid Network)は,効率的なクラウドカウントとローカライゼーションのための新しいフレームワークである。
4つのベンチマークデータセットの実験結果は、EHNetが計算オーバーヘッドを減らして競合性能を達成することを示した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:18:47 GMT)
Identifying the impact of local connectivity patterns on dynamics in excitatory-inhibitory networks [4.9] 接続の特定のパターンである連鎖モチーフが、他のペアのモチーフよりも支配的な固有モチーフに強い影響を与えることを示す。
連鎖モチーフの過剰表現は、阻害支配ネットワークにおいて強い正の固有値を誘導する。
これらの知見は、オプトジェネティックな摂動に対する応答を計測し、皮質回路の動的構造を推測する実験の解釈に直接的な意味を持つ。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:59:15 GMT)
Robust and Efficient Adversarial Defense in SNNs via Image Purification and Joint Detection [4.9] Spiking Neural Networks(SNN)は、神経科学と機械学習のギャップを埋めることを目的としている。
SNNは畳み込みニューラルネットワークのような敵の攻撃に弱い。
本稿では,SNNの堅牢性を高めるための生物学的にインスパイアされた手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:06:12 GMT)
STAY Diffusion: Styled Layout Diffusion Model for Diverse Layout-to-Image Generation [4.8] 本稿では,写真リアルな画像を生成する拡散モデルを提案し,シーン内のスタイリングされたオブジェクトのきめ細かい制御を実現する。
提案手法は,各レイアウトのグローバルな条件と,重み変調のための自己教師付きセマンティックマップを学習する。
オブジェクトの関係を捉えるためのグローバル条件とイメージ特徴をクロスコンディションするために、新しいスタイルマスク注意(SM Attention)も導入された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:36:24 GMT)
VeriMind: Agentic LLM for Automated Verilog Generation with a Novel Evaluation Metric [4.6] We propose VeriMind, a agentic LLM framework for Verilog code generation。
本稿では,従来のpass@k測度とARC(Average Refinement Cycles)を組み合わせた新しい評価手法を提案する。
様々なハードウェア設計タスクの実験結果によると、我々のアプローチはpass@kメトリックで最大8.3%、pass@ARCメトリックで最大8.1%向上した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:43:06 GMT)
Hoi2Anomaly: An Explainable Anomaly Detection Approach Guided by Human-Object Interaction [4.5] 本稿では, 異常の正確な識別と局所化を目的とした, Hoi2 Anomaly と呼ばれる新しい異常検出手法を提案する。
提案手法は,Human-object Interaction (HOI) ペアからなるマルチモーダル・インストラクション・チューニング・データセットを異常なシナリオで構築することを含む。
実験結果は,Hoi2Anomalyが既存の生成的アプローチを精度と説明可能性の観点から上回っていることを示している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:44:22 GMT)
A Multi-Task Learning Approach to Linear Multivariate Forecasting [4.4] 最近の最先端の研究はディバイソン間の相互関係を無視し、それぞれのディバイソンでモデルを用いている。
本稿では,多変量予測をマルチタスク学習問題とみなし,予測の分析を容易にすることを提案する。
我々は,強いベースラインと比較して,挑戦的なベンチマークに対するアプローチを評価する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:39:16 GMT)
A Comparative Study of Quantum Optimization Techniques for Solving Combinatorial Optimization Benchmark Problems [4.3] 本稿では,NP-hard問題に対する量子最適化手法の評価を目的とした,包括的なベンチマークフレームワークを提案する。
本フレームワークは,多次元クナップサック問題(MDKP),最大独立集合(MIS),二次割当問題(QAP),市場シェア問題(MSP)など,主要な課題に重点を置いている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:02:22 GMT)
Improving Pareto Set Learning for Expensive Multi-objective Optimization via Stein Variational Hypernetworks [4.1] 重大多目的最適化問題(EMOP)は、目的関数の評価にコストがかかる実世界のシナリオでは一般的である。
本稿では,Stein Variational Gradient Descent (SVGD) を Hypernetworks に統合した SVH-PSL という新しい手法を提案する。
本手法は, 解空間を滑らかにするために粒子を集合的に移動させることにより, フラグメント化サロゲートモデルと擬似局所最適化の問題に対処する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:28:06 GMT)
Revisiting Gradient Descent: A Dual-Weight Method for Improved Learning [4.0] 本稿では、各ニューロンの重みベクトルを2つの異なる部分に分解することで、ニューラルネットワークで学習するための新しいフレームワークを提案する。
この分解によって一般化が促進され、特にトレーニングデータが疎かでノイズの多い場合、過度に適合することを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:32:47 GMT)
Support Collapse of Deep Gaussian Processes with Polynomial Kernels for a Wide Regime of Hyperparameters [4.0] 我々は、カーネルを持つディープガウス過程が引き起こす前者を解析する。
比較的小さな深さであっても、そのような深いガウス過程の中で平均的な効果が生じることを観察する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:29:45 GMT)
Probabilistic Forecasting for Dynamical Systems with Missing or Imperfect Data [3.7] 本研究では,一点予測よりも将来の状態を分布として推定する確率予測のバリエーションを紹介する。
気象ベンチデータセットを含む様々な力学系において,その有効性を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:09:39 GMT)
Toward Foundation Models for Online Complex Event Detection in CPS-IoT: A Case Study [3.7] 複雑なイベント(CE)は、CPS-IoTアプリケーションにおいて重要な役割を担い、高いレベルの意思決定を可能にする。
既存のモデルでは、CE検出に必要な長期的な推論が欠如している。
本研究は,長期的推論が可能なCPS-IoT基盤モデルのケーススタディとしてCE検出について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:39:01 GMT)
Exploration of VLMs for Driver Monitoring Systems Applications [3.6] 近年,新たなディープラーニングモデル,特にLarge Language Models(LLM)とVision-Language Models(VLM)の進展が見られた。
本稿では,ドライバモニタリングシステム(DMS)におけるVLMの実装について述べる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:37:36 GMT)
Handling Weak Complementary Relationships for Audio-Visual Emotion Recognition [3.6] ゲート型アテンション機構を用いて、弱い相補関係に適応できるフレキシブルな音声-視覚融合モデルを提案する。
提案したモデルは、挑戦的なAffwild2データセットで評価され、最先端の融合アプローチよりも大幅に優れている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:03:20 GMT)
Internet of Things-Based Smart Precision Farming in Soilless Agriculture: Opportunities and Challenges for Global Food Security [3.5] 世界人口の急激な増加と耕作可能な土地の継続的な減少は、食料安全保障に重大な脅威をもたらす。
土壌のない農業、例えばヒドロポニックス、エアロポニックス、アクアポニックスは持続可能なソリューションを提供する。
本稿は、IoTベースの土壌のない農業の機会と課題について考察する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:40:32 GMT)
Optimizing Multi-Scale Representations to Detect Effect Heterogeneity Using Earth Observation and Computer Vision: Applications to Two Anti-Poverty RCTs [3.4] マルチスケール表現 コンカニネーションは任意の単一スケールEOベースのCATE推定アルゴリズムをマルチスケールに変換する。
CATE推定パイプライン上でのマルチスケール表現結合の性能をベンチマークする。
その結果,マルチスケール表現結合は,EOに基づくCATE推定におけるディープラーニングモデルの性能を向上させることが示唆された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:26:10 GMT)
Interval Estimation of Coefficients in Penalized Regression Models of Insurance Data [3.3] ツイーディー指数分散ファミリーは、保険の損失をモデル化するために多くの人々の間で人気がある。
内在変数を記述する最も重要な特徴の信頼性(推論)を得るためには、しばしば重要である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:57:51 GMT)
Goal-Oriented Source Coding using LDPC Codes for Compressed-Domain Image Classification [3.3] 本稿では,低密度パリティチェック(LDPC)符号をエントロピー符号化の代替手法として使用することを検討した。
LDPC符号の構造的性質は、分類のようなタスクのためのディープラーニングモデルによりより効果的に活用できると仮定される。
MNIST、Fashion-MNIST、CIFARといったデータセットの実験では、LDPCコードは分類タスクにおいてHuffmanとArithmeticのコーディングを上回っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:52:09 GMT)
Suzuki Type Estimates for Exponentiated Sums and Generalized Lie-Trotter Formulas in Banach Algebras [3.2] ここでは、バナッハ代数内のヨルダン積を利用して、リー・トロッター積公式の2つの誤差推定を行う。
また、2つの一般化されたリー・トロッター公式を導入し、2つの明示的な推定式を提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:51:47 GMT)
reAnalyst: Scalable Annotation of Reverse Engineering Activities [3.0] reAnalystはリバースエンジニアリング(RE)プラクティスの研究を促進するために設計されたフレームワークである。
reAnalystは、スクリーンショット、キーストローク、アクティブプロセス、その他の種類のデータのツールに依存しないデータ収集を統合することで、従来のRE研究の限界を克服することを目指している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:37:58 GMT)
Almost sure convergence rates of stochastic gradient methods under gradient domination [3.0] 大域的および局所的な勾配支配特性は、強い凸性のより現実的な置き換えであることが示されている。
収束率 $f(X_n)-f*in obig(n-frac14beta-1+epsilonbig)$ は勾配降下の最終反復である。
教師付き学習と強化学習の両方において,本研究結果をトレーニングタスクに適用する方法を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:22:36 GMT)
A Novel Double Pruning method for Imbalanced Data using Information Entropy and Roulette Wheel Selection for Breast Cancer Diagnosis [2.9] SMOTEBoost法はデータセットのバランスをとるために合成データを生成するが、決定境界付近で重要な重複する領域を見落としてしまう可能性がある。
本稿では,SMOTEBoostの拡張版であるRE-SMOTEBoostを提案する。
情報エントロピーに基づくフィルタリング機構を組み込んで、ノイズや境界ケースを低減し、生成されたデータの品質を向上させる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:34:15 GMT)
Generating a Biometrically Unique and Realistic Iris Database [2.8] 本稿では,オープンソースの拡散フレームワーク内で拡散モデルをトレーニングすることにより,現実的,生体的,不特定なカラー虹彩画像のデータベースを作成する方法について述べる。
我々は,これらの基準を比較的容易に達成するための拡散ネットワークの有用性を強調し,アイリスデータベース生成やプレゼンテーションアタックセキュリティの文脈でのさらなる研究を保証している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:28:25 GMT)
Large Language Models can Achieve Social Balance [2.8] 社会的バランスは、集団が肯定的な相互作用の1つの派閥になるか、あるいは2つ以上の対立的な派閥に分けられるかを規定する。
我々は,大規模言語モデル群(LLM)を考察し,連続的な相互作用の後,どのように社会的バランスを達成できるかを考察する。
社会的バランスの達成は (i) 相互作用の種類, (ii) エージェントが仲間からホモフィリーか影響か, (iii) 人口規模に依存していることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:10:55 GMT)
Leveraging Motion Information for Better Self-Supervised Video Correspondence Learning [2.7] 我々は,効率的な自己教師型ビデオ対応学習フレームワークを開発した。
まず、ビデオ中の物体の動的動きをキャプチャーすることを強調するモーションエンハンスメントエンジンを設計する。
さらに,画素間対応情報に対するフレキシブルサンプリング戦略を導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:25:40 GMT)
Training-Free Mitigation of Adversarial Attacks on Deep Learning-Based MRI Reconstruction [2.6] 本稿では,MRI再建モデルに対する逆行性攻撃を再訓練せずに軽減するための新しいアプローチを提案する。
提案手法は,異なるデータセット間での対向摂動の影響を著しく低減することを示す。
我々はこの緩和手法を、盲点設定と適応攻撃設定の2つの重要な実践シナリオに拡張する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:50:19 GMT)
Token-Level Uncertainty-Aware Objective for Language Model Post-Training [2.6] 我々は,因果言語モデリングにおけるトークンレベルの不確実性を,(1)マスクされた最大可能性(MLE),(2)自己蒸留の2種類の訓練目標に結びつける。
マスクMLEは, 難治性の軽減に有効であり, トークンレベルの自動カリキュラム学習技術として有効であることを示す。
しかし、マスクされたMLEは過度に適合する傾向があり、アウト・オブ・ディストリビューションタスクのパフォーマンスを向上または維持するために自己蒸留正則化が必要である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 00:32:14 GMT)
A State Alignment-Centric Approach to Federated System Identification: The FedAlign Framework [2.5] ローカルワーカーはステートスペースモデル(SSM)を等価表現で学習できるが、動的には異なる。
FedAlignは、局所的なSSMの状態表現を調整するために類似性変換行列を利用することで、この問題を克服する。
我々は、FedAlignがFedAvgより優れ、より高速に収束し、グローバルSSMの安定性を改善していることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:43:54 GMT)
SagaLLM: Context Management, Validation, and Transaction Guarantees for Multi-Agent LLM Planning [2.5] SagaLLMは構造化マルチエージェントフレームワークで、現在のLLMアプローチの4つの基本的な制限に対処する。
特別なコンテキスト管理エージェントと検証プロトコルを実装することで、SagaLLMは複雑な計画プロセスを通して重要な制約と状態情報を保持する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:43:03 GMT)
Quantum Simulations of Chemical Reactions: Achieving Accuracy with NISQ Devices [2.5] 現在のノイズ中間スケール量子(NISQ)時代には、変分量子ソルバ(VQE)を用いて量子ビットを用いて分子をシミュレートし、分子特性を計算する。
しかしながら、VQEアルゴリズムを用いて反応エネルギーを計算するために反応をシミュレートする化学は、ベンチマーク計算化学法と比較してまだ化学精度に達していない。
本研究では,分子の基底状態と励起状態の両方の既約表現を取り入れ,化学反応を研究するための異なる活性空間の定義を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:16:22 GMT)
Alternating minimization for square root principal component pursuit [2.4] 平方根主成分探索(SRPCP)問題を解くための効率的なアルゴリズムを開発した。
具体的には、各反復が閉形式最適解を楽しむサブプロブレムを含む、チューニング不要な交互最小化(AltMin)アルゴリズムを提案する。
我々は,AltMin法をさらに加速するために,核ノルムの変分定式化とブラー・モンティロ分解に基づく手法を導入する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:20:27 GMT)
Entropy-regularized Gradient Estimators for Approximate Bayesian Inference [2.4] 本稿では,Kulback-Leibler分散系の勾配流を近似することにより,ベイズ後部を推定し,多様なサンプルを生成する。
本研究は, モデルベース強化学習における手法の性能評価と有効性を検討するために, 分類タスクに関する経験的評価を行う。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:30:46 GMT)
Exploring Robustness of Image Recognition Models on Hardware Accelerators [2.4] MutateNNは、画像認識モデルの堅牢性を調べるために、差分テストと突然変異テストの両方の要素を利用するツールである。
画像認識領域は、7つの確立されたDNNモデルに突然変異試験を適用し、6つの異なるカテゴリの21の突然変異を導入し、画像認識領域に焦点をあてる。
その結果, 層修飾, 算術型, 入力に関連する変異が全体のモデル性能(最大99.8%)に深刻な影響を及ぼすか, あるいはモデルクラッシュを引き起こした。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:15:10 GMT)
Electromagnetic Side-Channel Analysis of PRESENT Lightweight Cipher [2.3] サイドチャネルの脆弱性は、暗号的に保護されたデバイスに対する脅威が増大する。
本研究では,相関攻撃モデルを用いたPreSENTのEM側チャネルロバスト性について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:09:23 GMT)
ReDefining Code Comprehension: Function Naming as a Mechanism for Evaluating Code Comprehension [2.3] コード理解スキルの評価には「平易な英語で説明する」(EiPE)質問が広く用いられている。
Code Generation Based Grading (CGBG)のような最近のアプローチでは、大きな言語モデルを利用してコードを生成する。
本稿では,学生が関数名を生成する手法を提案し,実装の詳細よりも関数の目的を強調する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:22:14 GMT)
Counting the Trees in the Forest: Evaluating Prompt Segmentation for Classifying Code Comprehension Level [2.3] 本稿では,平易な英語の質問に対する説明文に対する理解度を自動的に評価する新しい手法を提案する。
本研究では,Large Language Model (LLM) を用いて,学生の記述とコードの両方を分割し,各行を個別に記述するか否か(多くのセグメント),あるいはコード全体を決定することを目的とする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:57:38 GMT)
ShieldNN: A Provably Safe NN Filter for Unsafe NN Controllers [2.2] 我々は、KBM(Kinematic Bicycle Model)のための新しいクローズドフォーム制御バリア関数(CBF)と関連するコントローラシールドを開発する。
ShieldNNは、非アフィンKBMダイナミクスと直接、ステアリングとベロシティの制約について検討している。
実験により,ShieldNNは複数の障害物が存在する場合のRLトレーニングエピソードの完了率を劇的に向上させることを示した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:11:57 GMT)
Eval-PPO: Building an Efficient Threat Evaluator Using Proximal Policy Optimization [2.2] 本研究では,脅威評価問題を強化学習課題として再定義する。
Eval-PPOは、多次元敵の特徴と友好的なユニットの状態情報を体系的な訓練を通じて統合する。
ルールベースの手法と比較して、Eval-PPOは平均成功率を大幅に改善し、17.84%の上昇を示した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:49:06 GMT)
Learning Color Equivariant Representations [2.0] 色変化に同値なグループ畳み込みニューラルネットワーク(GCNN)を導入する。
GCNNは、2次元と3次元の回転群からスケールのような半群への様々な幾何学的変換のために設計されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:52:28 GMT)
Mixed-feature Logistic Regression Robust to Distribution Shifts [2.0] 本研究では,データ分布の対角的実現に対して最善を尽くすモデルを求めるロジスティック回帰問題について検討する。
本稿では,既製の最適化解法に統合可能なグラフベースの解法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:31:16 GMT)
Agentic Search Engine for Real-Time IoT Data [1.9] IoT(Internet of Things)によって、さまざまなデバイスがインターネット上で通信できるようになったが、IoTシステムの断片化によって、シームレスなデータ共有とコーディネート管理が制限された。
本稿では,IoT環境に適したリアルタイム検索エンジンであるIoT Agentic Search Engine(IoT-ASE)について述べる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:46:17 GMT)
Changing Base Without Losing Pace: A GPU-Efficient Alternative to MatMul in DNNs [1.9] ディープニューラルネットワーク(DNN)における行列乗算に対するより安価な代替バイリニア演算子を提案する。
STLで線状層を置換し,スクラッチからトレーニングし,FLOPの因子x2.7を0.5倍の精度で減少させることを示した。
Slim Pajamaデータセット上のSTL層でTinyLlama citetinyllama24を微調整すると、x2.2 FLOPのスピードアップが後者のx1.7と比べて2:4と同等の精度が得られる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:31:36 GMT)
Cracking the PUMA Challenge in 24 Hours with CellViT++ and nnU-Net [1.9] 進行性メラノーマ(PUMA)における核と組織の分節化は、メラノーマの病理組織学における組織分節化と核検出を改善することを目的としている。
このパイプラインは、核検出のためのCellViT++と組織セグメンテーションのためのnnU-Netの2つのモデルを組み合わせる。
その結果,Diceスコアが0.750,ベースラインスコアが0.629,Diceスコアが0.629を上回った。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:46:35 GMT)
Context-aware Multimodal AI Reveals Hidden Pathways in Five Centuries of Art Evolution [1.8] 最先端の生成AI、特に安定拡散を使って、500年の西洋絵画を分析します。
以上の結果から,形式的要素よりも芸術的期間,様式,個人芸術家の文脈的情報の違いが明らかとなった。
我々の生成実験は、将来的な文脈を歴史的美術品に浸透させ、美術品の進化軌道を再現することに成功している。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:45:04 GMT)
A unified framework of unitarily residual measures for quantifying dissipation [1.7] 本稿では,量子力学の非単位成分を分離して散逸を定量化するためのフレームワークを提案する。
我々の結果は、オープン量子系における散逸を定量化する強力なツールを提供し、量子熱力学の理解を深める。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:59:14 GMT)
Proof-Driven Clause Learning in Neural Network Verification [1.6] 衝突駆動クロース学習(CDCL)を用いたDNN検証器のスケーラビリティ向上のためのアプローチを提案する。
本論文では,UNSAT証明を用いた競合項の導出のための新しいアルゴリズムを提案する。
複数のベンチマークによる実装評価の結果,類似した手法による2X--3Xの改良が示唆された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:05:15 GMT)
Threefold model for AI Readiness: A Case Study with Finnish Healthcare SMEs [1.6] 本研究では、フィンランドの医療中小企業におけるAI導入について、6つの医療技術企業との半構造化インタビューを通して検討する。
AI-curious(AIを探索する)、AI-emcepting(AIを統合する)、AI-catering(AIソリューションを提供する)の3つのAIエンゲージメントカテゴリを特定します。
提案した3倍モデルでは,規制の複雑さ,専門知識のギャップ,財務上の制約など,重要な採用障壁が強調されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:37:29 GMT)
Truncated Kernel Stochastic Gradient Descent on Spheres [1.5] 球面高調波の構造に着想を得て,T-カーネルSGDアルゴリズムを提案する。
TカーネルSGDは、球面データフィッティングのための最小二乗損失関数を有する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:59:16 GMT)
Generator-Based Fuzzers with Type-Based Targeted Mutation [1.5] 以前の研究では、カバレッジ誘導型ファジィザは静的解析、テイント解析、制約解法を混合してこの問題に対処していた。
本稿では,Java GBFの文字列検索とともに,型ベースの突然変異を導入する。
ベースラインのGBFツールと比較すると、アプリケーションカバレッジは平均20%改善しており、サードパーティのコードを含めると、より大きく改善されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:28:12 GMT)
3D Gaussian Splatting against Moving Objects for High-Fidelity Street Scene Reconstruction [1.3] 本稿では,ダイナミックストリートシーン再構築のための新しい3次元ガウス点分布法を提案する。
提案手法では,高忠実度な静的シーンを保存しながらオブジェクトの移動を除去する。
実験により, 大規模動的環境における再現性の向上, レンダリング性能の向上, 適応性の向上が示された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:41:59 GMT)
Language Models for Automated Classification of Brain MRI Reports and Growth Chart Generation [1.2] 我々は、脳MRIの報告を正常または異常と分類するために、微調整言語モデル(LM)を開発した。
また、通常のレポート分類のための主要なLMであるGemini 1.5-Proの推論機能についても検討する。
我々のLMは、ラジオロジーレポートのスケーラブルな分析を提供し、大規模なデータセットにおける脳MRIの自動分類を可能にします。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:59:44 GMT)
Floquet Engineering Clock Transitions in Magnetic Molecules [1.2] 磁気分子のフラケット工学を時間周期磁場を用いて研究する。
低ライジングエネルギーレベルの顕著な連続的なチューニング性を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:33:14 GMT)
Genicious: Contextual Few-shot Prompting for Insights Discovery [1.1] Geniciousは、コンテキストの少ないプロンプトを活用するエンドツーエンドツールである。
我々は、文脈的に数発のプロンプトを活用するエンドツーエンドツールを開発し、レイテンシ、精度、スケーラビリティの点で優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:27:59 GMT)
Enhancing Facial Expression Recognition through Dual-Direction Attention Mixed Feature Networks and CLIP: Application to 8th ABAW Challenge [1.0] CVPR 2025における第8回ABAWチャレンジへの貢献について紹介する。
我々は3つの独立した課題として、原子価-覚醒推定、感情認識、顔行動単位検出に取り組む。
提案手法では,Dual-Direction Attention Mixed Feature Network(DDAMFN)を3つのタスクすべてに活用し,提案するベースラインを超える結果を得る。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:03:03 GMT)
Quantum-enhanced quickest change detection of transmission loss [1.0] 光通信路における突然の損失増加は、悪意のあるワイヤタッパーや、自由空間チャネルにおける亀裂天候や光ファイバーにおける意図しない屈曲などの良質な理由によって引き起こされる。
位相変調されたコヒーレント状態パルスに少量のスキューズを加えることで、通信速度に影響を与えることなく、チャネル損失の検出を変更できるホモダイン検出受信機の感度を劇的に向上させることができることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:18:43 GMT)
No LLM is Free From Bias: A Comprehensive Study of Bias Evaluation in Large Language models [1.0] 大規模言語モデル(LLM)は、異なる自然言語理解と生成タスクの性能を高めている。
LLMは様々なタスクにおける最先端のパフォーマンスを破っているが、トレーニングデータに存在する様々な形式のバイアスを反映していることが多い。
物理特性から社会経済的カテゴリに至るまで,様々なバイアスをカバーできる代表的LCMを用いて,ベンチマークを統一的に評価する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:58:14 GMT)
Maritime Mission Planning for Unmanned Surface Vessel using Large Language Model [0.9] 本稿では,Large Language Models (LLM) を用いた新しいミッションプランニングフレームワークを提案する。
LLMは、自然言語のコマンドを理解し、シンボリック推論を実行し、状況の変化に合わせて柔軟に調整する能力に長けている。
提案手法では,LLMを海洋計画に統合し,高レベルの人的指示と実行可能な計画とのギャップを埋める。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:41:55 GMT)
Can LLMs Reason About Program Semantics? A Comprehensive Evaluation of LLMs on Formal Specification Inference [0.9] 大規模言語モデル(LLM)は、プログラミングタスクの自動化にますます使われています。
本稿では,プログラム意味論におけるLLMの推論能力を評価するためのベンチマークであるFormalBenchを紹介する。
このベンチマークを用いて、一貫した仕様と完全な仕様を合成するLLMの能力を評価した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:45:06 GMT)
Graph Topic Modeling for Documents with Spatial or Covariate Dependencies [0.9] 文書レベルのメタデータをトピックモデリングに組み込むという課題に対処する。
高速グラフ正規化反復特異値分解に基づく新しい推定器を提案する。
合成データセットと実世界の3つのコーパスに関する包括的実験により,本モデルの有効性を検証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 05:35:26 GMT)
Anomalous current-electric field characteristics in transport through a nanoelectromechanical systems [0.9] まず、ナノエレクトロメカニカルシステム(NEMS)による輸送のための完全な量子力学的アプローチを確立する。
低バイアスで異常な電流-電界特性がみられ、電流は上昇する電界とともに減少する。
メカニカル・ムーブメントとクーロン・ブロッキングの複合効果から,この挙動が生じることが明らかとなった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:28:34 GMT)
GenOSIL: Generalized Optimal and Safe Robot Control using Parameter-Conditioned Imitation Learning [0.9] 我々は環境パラメータをポリシー学習に明示的に組み込んだ新しい模倣学習フレームワークGenOSILを提案する。
環境をブラックボックスとして扱う従来の方法とは異なり、GenOSILは可変オートエンコーダ(VAE)を使用して測定可能な安全性パラメータを符号化している。
我々は,Franka Emika Panda(フランカ・エミカ・パンダ)マニピュレータ(Franka Emika Panda(フランカ・エミカ・パンダ)マニピュレータ(Franka Panda)を開発した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 19:52:16 GMT)
Asymptotic Analysis of Two-Layer Neural Networks after One Gradient Step under Gaussian Mixtures Data with Structure [0.8] 本研究では,構造データに基づく2層ニューラルネットワーク(NN)の学習と一般化性能について検討した。
特定の条件下では,高次モデルが非線形ニューラルネットワークと等価であることを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:54:27 GMT)
Closing the Chain: How to reduce your risk of being SolarWinds, Log4j, or XZ Utils [0.8] SolarWinds、Log4j、XZ Utils攻撃で使用される攻撃テクニックをフレームワークタスクの緩和にマップする。
最も高いスコアを持つ3つの緩和タスクは、ロールベースのアクセス制御、システム監視、バウンダリ保護である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:22:09 GMT)
From ML to LLM: Evaluating the Robustness of Phishing Webpage Detection Models against Adversarial Attacks [0.8] フィッシング攻撃は、ユーザーを騙して機密情報を盗もうとする。
現在の検出ソリューションは、敵の攻撃に対して脆弱なままである。
我々は,多様なフィッシング機能を正当なWebページに埋め込むことで,逆フィッシングWebページを生成するツールを開発した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:39:42 GMT)
Salient Temporal Encoding for Dynamic Scene Graph Generation [0.8] 本稿では,時間関連オブジェクトペア間のみに時間的接続を選択的に構築する新しい時空間シーングラフ生成手法を提案する。
結果として、スパースで明示的な時間表現により、Scene Graph Detectionにおいて、強いシーングラフ生成ベースラインを最大4.4%改善することができる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 08:01:36 GMT)
Gun Detection Using Combined Human Pose and Weapon Appearance [0.7] 深層学習技術を用いて,人間のポーズ推定と武器の外観認識を統合した新しいアプローチを提案する。
身体に焦点をあてた従来の研究とは異なり、我々の方法は姿勢と武器の存在を共同で分析する。
本研究の目的は、銃器検知システムの精度と信頼性の向上であり、リスクの高い地域での公衆安全と脅威軽減の強化に寄与することである。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:57:35 GMT)
Circuit Design based on Feature Similarity for Quantum Generative Modeling [0.7] 本稿では、データセットの特徴間の類似度に基づいて拡張回路を設計するためのメートル法に基づく拡張を提案する。
提案手法は,限られた資源で回路を設計しながら帰納的バイアスを発生させる手段を提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:45:22 GMT)
DG-PPU: Dynamical Graphs based Post-processing of Point Clouds extracted from Knee Ultrasounds [0.7] 膝全置換術(TKA)を施行した患者は、膝蓋大腿関節不安定(PFJ)から生じる非特異的な膝痛を経験することが多い。
PFJ運動の追跡は、CTやMRIのような静的な画像モダリティは視野や金属の人工物干渉によって制限されるため困難である。
我々は,超音波スキャンから抽出した点雲の3次元登録を用いて,パテラー追跡とPFJ運動の正確な可視化を実現することを目的とする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:11:15 GMT)
Real-Time Manipulation Action Recognition with a Factorized Graph Sequence Encoder [0.6] 本稿では、リアルタイムに実行し、時間次元を効果的にスケールする新しいファクトリズグラフシーケンスネットワークを提案する。
グラフレベルの埋め込みをより集中的に抽出するための単純なプール操作であるハンドプール操作も導入する。
F1-macroスコアは14.3%,5.6%向上した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:58:25 GMT)
Strongly-anharmonic gateless gatemon qubits based on InAs/Al 2D heterostructure [0.6] InAs/Al2Dヘテロ構造に基づくゲートモンデバイスにおける高調波効果について検討した。
半整数フラックスのスイートスポットでは,100%を超える不調和性が日常的に達成できることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:00:41 GMT)
Automatic Characterization of Fluxonium Superconducting Qubits Parameters with Deep Transfer Learning [0.6] 固体系では、個々の量子ビットのパラメータはシステム全体によって異なる。
最近の超伝導量子ビット、例えばフラキソニウムや0-π量子ビットは、より改良された忠実度演算を提供するが、より複雑な物理的およびスペクトル構造を示す。
本稿では,フラキソニウム量子ビットパラメータの自動的かつ高精度な評価のための機械学習(ML)手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:51:16 GMT)
The "recognition," "belief," and "action" regarding conspiracy theories: An empirical study using large-scale samples from Japan and the United States [0.6] 我々は、それぞれの段階で関与を促進する重要な社会的、政治的、経済的要因を特定します。
認識は、誰が信仰に移行するかを決定する重要な入り口となる。
実証的な行動は、政治的に強い配偶者を持つ若く高水準の個人の間でより一般的である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:10:58 GMT)
Evaluation of Intra-operative Patient-specific Methods for Point Cloud Completion for Minimally Invasive Liver Interventions [0.6] そこで本研究では,6つの最先端クラウド補完法について検討し,肝外科手術における最適補修法について検討する。
肝部分表面から肝点雲を完結させるための患者固有のアプローチに焦点をあて, 正準ポーズ, 非正準ポーズ, 雑音を伴う正準ポーズの3例について検討した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:47:24 GMT)
Integration of Explainable AI Techniques with Large Language Models for Enhanced Interpretability for Sentiment Analysis [0.5] 大規模言語モデル(LLM)による感情分析における解釈可能性の重要性
本研究では,LLMを埋め込み層,エンコーダ,デコーダ,アテンション層などのコンポーネントに分解することでSHAP(Shapley Additive Explanations)を適用する手法を提案する。
この方法はStanford Sentiment Treebank (SST-2)データセットを用いて評価され、異なる文が異なる層にどのように影響するかを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:37:54 GMT)
Unified Modeling Language Code Generation from Diagram Images Using Multimodal Large Language Models [0.4] 本稿では,大規模マルチモーダル言語モデルを用いたコードの自動生成手法を提案する。
ドメイン適応型MM-LLMはコード生成自動化のために動作し、最高のモデルではシーケンスダイアグラム上でBLEUとSSIMスコア0.779と0.942を達成した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 23:20:26 GMT)
Generative AI in Agriculture: Creating Image Datasets Using DALL.E's Advanced Large Language Model Capabilities [0.4] テキスト・ツー・イメージと画像・ツー・イメージ(変分)の両手法を用いた研究
画像対画像生成は、テキスト対画像法よりも平均PSNRが5.78%増加し、画像の明瞭度と品質が向上した。
また,画像から画像までの手法を用いて生成した画像は,テキストから画像へのアプローチで生成した画像よりも現実的であった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:13:08 GMT)
From Eye to Mind: brain2text Decoding Reveals the Neural Mechanisms of Visual Semantic Processing [0.3] 自然画像のテキスト記述にfMRI信号を直接デコードすることで、パラダイムシフトを導入する。
視覚的入力なしで訓練された新しいディープラーニングモデルは、最先端のセマンティックデコーディング性能を実現する。
神経解剖学的には、MT+、腹側視皮質、下頭頂皮質などの高次視覚領域が重要な役割を担っている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:28:02 GMT)
LLM & HPC:Benchmarking DeepSeek's Performance in High-Performance Computing Tasks [0.2] 大規模言語モデル(LLM)は、ソフトウェア工学の幅広い分野に適用されている。
本稿では,最近のLLMであるDeepSeekがHPCベンチマークコードの生成にどの程度優れているかを評価する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:42:54 GMT)
Exchange-Coupled Spins for Robust High-Temperature Qubits [0.1] 本研究では, エンサンブルスピン量子ビット(E-qubit)からなる隣接するスピン間のハイゼンベルク交換相互作用が固有誤差緩和器として作用し, 高温でもゲート忠実度を増大させることを示す。
また、E-qubitsのコヒーレンス特性について検討し、E-qubitのコヒーレンス時間がアンサンブル内のスピンの数とともに線形に延びていることを見出した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:14:56 GMT)
Unlocking Learning Potentials: The Transformative Effect of Generative AI in Education Across Grade Levels [0.0] 生成的人工知能(GAI)は、教育分野において顕著な急上昇をもたらした。
本稿では,6つの重要領域(LIPSAL)の4つの学年におけるGAIが学生に与える影響について検討した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:16:43 GMT)
Unified evolutionary optimization for high-fidelity spin qubit operations [0.0] 我々は,6ドット半導体量子プロセッサ上でのグローバル最適化駆動自動校正ルーチンを開発した。
タスク固有のコスト関数を調整し、各操作の基本物理に基づいてパラメータをチューニングすることにより、読み出し、シャットリング、シングルキュービット量子ゲートを最適化する。
勾配のない閉ループアルゴリズムの柔軟性は、様々な量子ビット機能にまたがるシームレスな応用を可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:49:34 GMT)
Twin-Polaritons: Classical versus Quantum Features in Polaritonic Spectra [0.0] 双極子(ツインポラリトン)は,通常の一次共振性ポラリトン分裂を超越した,新しい特徴を報告した。
この発見は、古典的な手法を用いて量子的特徴をチューニングする新しいメカニズムを明らかにし、分極性系の基本的な性質に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:43:40 GMT)
Tunable N-level EIT: Deterministic Generation of Optical States with Negative Wigner Function [0.0] 強い光非線形性は、特にフォトニック量子状態の生成において、様々な技術の鍵となる。
本研究では, 高温のルビジウム蒸気を励起する光周波数コムにより生成したNレベルEITスキームを提案し, 実証する。
NレベルEITは、ポストセレクションを必要とせず、フォトニック量子状態の直接生成を可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:18:50 GMT)
The Strategic Imperative for Healthcare Organizations to Build Proprietary Foundation Models [0.0] 本稿では,医療機関が独自基盤モデルを開発するための戦略的義務を包括的に分析する。
医療データ表現のドメイン固有の要件、医療固有の重要なデータ主権とガバナンスの考察、プロプライエタリなAIインフラによって提供される戦略的競争上の優位性、および患者ケアと組織運用のための医療固有の基盤モデルの変革の可能性について検討する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:01:44 GMT)
The Status Quo and Future of AI-TPACK for Mathematics Teacher Education Students: A Case Study in Chinese Universities [0.0] 技術教育コンテンツ知識(AI-TPack)とAIの統合の熟練度を示すために,数学教師教育学生(MTES)の必要性が高まっている。
本稿では,中国におけるMTES用AI-TPackの現状を初めて明らかにし,AI-TPackに対する特定の要因の影響を研究する専用のSEMを設計し,今後の発展についていくつかの提案を行った。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:04:14 GMT)
Testing the Coherent State Description of Radiation Fields [0.0] 放射場の量子力学的特性を探索する共振型高調波検出器の統計量に基づく簡易な定量的基準を提案する。
特に、与えられた体が最大古典的であるというnull仮説をテストするための実践的な手段を提供し、コヒーレント状態によって正確に記述される。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:04:09 GMT)
Temporally Consistent Mitral Annulus Measurements from Sparse Annotations in Echocardiographic Videos [0.0] 隣接フレーム間の時間的一貫性を強制する自己教師付き損失項を導入する。
解剖学的に欠落したランドマークの認識を改善するために,現実的な視野拡大を取り入れた。
平均絶対MAPSE誤差は1.81$pm$ 0.14 mm、アンラスサイズ誤差は2.46$pm$ 0.31 mm、ランドマークローカライゼーション誤差は2.48$pm$ 0.07 mmである。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:26:44 GMT)
Spline refinement with differentiable rendering [0.0] スプラインリファインメントのための訓練不要な微分可能レンダリング手法を提案する。
本手法は,高信頼性とサブピクセル精度を実現する。
完全に教師されていないため、この方法は人気のあるアクティブな輪郭モデルの代替となる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:42:41 GMT)
Spin orientation by electric current in altermagnets [0.0] マグネット内の電流の流れは、サンプル内で均質な電子スピン配向を形成する。
反磁性体で発生した伝導電子のスピンと$d$波のスピン-モーメント結合は、現在の大きさで二次的である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:48:01 GMT)
Solvable entanglement dynamics in quantum circuits with generalized space-time duality [0.0] 蹴りアイシングモデルの非平衡ダイナミクスを1+1$次元で研究する。
局所性によって許容される最大速度の半分の線形成長から、飽和を伴う絡み合い成長から、広大だが極小エントロピーまで、豊富な現象論が見つかる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:23:49 GMT)
Simultaneous inference for generalized linear models with unmeasured confounders [0.0] 本稿では,構造を利用して線形射影を3つの重要な段階に統合する,統一的な統計的推定と推測の枠組みを提案する。
サンプルおよび応答サイズとして$z$-testsの効果的なType-Iエラー制御が無限大に近づくことを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:59:11 GMT)
Scaling up to Problem Sizes: An Environmental Life Cycle Assessment of Quantum Computing [0.0] 本稿は、特定のスケーリング条件下での量子コンピュータと量子エラー訂正符号の環境上の優位性を、利用時間がいかに促進するかを示す。
その結果、量子エラー補正ハードウェアは、100個の論理量子ビットを達成するのに必要な多数の電子部品のために、環境に重大な影響を与えることが強調された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:03:10 GMT)
Sagnac interferometer-based noise-free superresolution using phase-controlled quantum erasers [0.0] サニャック干渉計を用いた超分解能は、干渉計で避けられない環境騒音を解決するために提案される。
空間光変調器が位相制御量子消光器の役割を引き継ぎ、線形光学に基づく複雑性問題を解決する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:54:52 GMT)
REdiSplats: Ray Tracing for Editable Gaussian Splatting [0.0] レイトレーシングとメッシュによるフラットな3Dガウス表現を用いたREdiSplatsを紹介する。
実際、メッシュによってパラメータ化された平坦なガウス分布を用いてシーンをモデル化する。
BlenderやNvdiffrastといった3Dツールを使ってモデルをレンダリングすることで、既存のすべての3Dグラフィックス技術と統合することが可能になる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 22:42:21 GMT)
RECSIP: REpeated Clustering of Scores Improving the Precision [0.0] 本稿では,repeated Clustering of Scores Improving the Precision (RECSIP)を紹介する。
RECSIPは大規模言語モデル(LLM)の精度向上に重点を置いており、複数のモデルを並列に問い合わせ、応答のスコア付けとクラスタ化を行い、応答に対する信頼性を高める。
GPT-4o, Claude, Gemini モデルを用いたベンチマーク MMLU-Pro による基準実装の評価では, 使用済みモデルと比較して総合的に5.8% の増加が見られた。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:36:32 GMT)
Quantum Thermodynamics on a limit cycle [0.0] 我々は、ゼロ温度での協調共鳴蛍光に基づく周期量子時計を考える。
制限周期における量子相拡散が周期の変動につながることを示す。
エネルギーの散逸が増加すると、量子系におけるクロックの品質は向上し、完全に検証される。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:55:57 GMT)
Probing Topological Anderson Transition in Quasiperiodic Photonic Lattices via Chiral Displacement and Wavelength Tuning [0.0] フォトニックSu-Schrieffer-Heeger格子における準周期的細胞間結合障害に起因するトポロジカルアンダーソン転移について報告する。
準周期的な強度が変化するにつれて、システムは自明な位相から位相的な位相への再帰的な遷移を示す。
従来の光トポロジカルエッジモードの検出とは異なり、光の輸送からの平均キラル変位を測定する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:07:57 GMT)
Probabilistic Graph Circuits: Deep Generative Models for Tractable Probabilistic Inference over Graphs [0.0] 本稿では,(任意部分)グラフに対する正確かつ効率的な確率的推論を提供する,抽出可能なDGMの枠組みを提案する。
グラフの置換不変な設定において、正確性と効率性の両立は困難である。
我々は、本質的に不変であり、これらの2つの要件を満たすPGCを、低表現力で設計する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 15:01:53 GMT)
Privacy Ethics Alignment in AI (PEA-AI): A Stakeholder-Centric Based Framework for Ethcial AI [0.0] 本研究は,3つの主要な利害関係者グループ間でのプライバシー上の懸念の進展について検討する。
若いユーザーは自律性とデジタルの自由を強調する。
親と教育者は、規制監督とAIリテラシープログラムを提唱する。
AI専門家は倫理システム設計と技術効率のバランスを優先する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:42:45 GMT)
Niobium Air Bridges as a Low-Loss Component for Superconducting Quantum Hardware [0.0] 超伝導量子プロセッサのスケールアップには、リードアウトと制御ラインのための高ルーティング密度が必要である。
超伝導膜としてのアルミニウム硬質マスクとニオブをベースとしたエアブリッジの普遍的減圧加工プロセスを提案し,実証する。
複数のニオブエアブリッジを中心導体に組み込んだ超伝導CPW共振器を作製した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:36:00 GMT)
Medifact at PerAnsSumm 2025: Leveraging Lightweight Models for Perspective-Specific Summarization of Clinical Q&A Forums [0.0] PerAnsSumm 2025の課題は、パースペクティブを意識した医療回答の要約に焦点を当てている。
本研究では、Snorkel-BART-SVMパイプラインを使用して、オープンな医療コミュニティの質問回答の分類と要約を行う、数ショットの学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:36:02 GMT)
Machine Learning-Based Model for Postoperative Stroke Prediction in Coronary Artery Disease [0.0] 本研究では,術後脳卒中リスクを評価するための高度な機械学習予測モデルを開発し,評価することを目的とする。
データセットには70%のトレーニングと30%のテストがあり、数値は正規化され、カテゴリ変数は1ホットエンコードされた。
ロジスティック回帰、XGBoost、SVM、CatBoostは予測モデルに使われ、SHAP分析は各変数のストロークリスクを評価した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 02:50:32 GMT)
Large Language Models in Legislative Content Analysis: A Dataset from the Polish Parliament [0.0] この研究は、法律分野、特にポーランド語におけるNLPの発展に寄与している。
一般的にアクセス可能なデータでさえ、立法内容分析に活用できることが実証されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:10:20 GMT)
Irreversibility of Linear Maps in terms of Subjectivity & Geometry [0.0] 古典物理学と量子物理学の両方において、不可逆過程は状態空間を収縮する写像によって記述される。
ベイズ推定では、情報の喪失は、参照先の選択によって、初期状態の遡及がますます影響される。
この測度は、可逆性に関する他の有益性指標とコヒーレントであり、また、物理的に注目すべき情報幾何測度と結合した単調性を持つことを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:44:47 GMT)
Interpretation Gaps in LLM-Assisted Comprehension of Privacy Documents [0.0] 本稿では,大規模言語モデル(LLM)を用いて複雑なプライバシポリシからデータプラクティスの簡易解釈を得る際のギャップについて考察する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:43:13 GMT)
Integrating Product Coefficients for Improved 3D LiDAR Data Classification [0.0] 分類過程の付加的な特徴として,測度理論から導かれる理論量である積係数を導入する。
その結果, 製品係数を特徴集合に組み込むことで, 分類精度が著しく向上することが示唆された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:25:38 GMT)
Insights into Schizophrenia: Leveraging Machine Learning for Early Identification via EEG, ERP, and Demographic Attributes [0.0] この研究は、統合失調症患者と健康管理の区別を目的とした機械学習(ML)分類器を提案する。
脳波(EEG)データから抽出された特徴を用いており、特に事象関連電位(ERP)と特定の人口統計学的変数に焦点を当てている。
このデータセットは、健康的な32のコントロールと49の統合失調症患者を含む、81人の参加者のデータで構成されている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 09:36:34 GMT)
Indistinguishable Single Photons from Nanowire Quantum Dots in the Telecom O-Band [0.0] テレコム波長におけるナノワイヤ量子ドットにおける高純度かつ識別不能な単一光子生成を示す。
結果は、ナノワイヤ量子ドットがフォトニック量子応用のためのテレコム単一光子の有望な源である可能性を強調した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 12:52:55 GMT)
Human Digital Twins in Personalized Healthcare: An Overview and Future Perspectives [0.0] デジタル双生児(Digital twins、DT)は、よりパーソナライズされ、積極的に、インテリジェントな医療介入を行うために医療を再定義する。
人間のデジタル双生児(HDT)という新しい概念は、従来の医療システムに革命をもたらす可能性を秘めている。
HDTは、分子、生理、感情、ライフスタイルの変化を継続的に反映する動的な仮想モデルを通じて、人間の身体の物理的実体を反映する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:35:27 GMT)
Generalized Knill-Laflamme Theorem for Families of Isoclinic Subspaces [0.0] 量子誤り訂正符号は、最近、等クリニック部分空間のファミリーのサブクラスを定義することが示されている。
クニル・ラフラム理論(Knill-Laflamme Theorem)は、量子誤差の補正の理論におけるセミナルな結果である。
ここでは、Knill-Laflamme結果の一般化バージョンと、同型部分空間のすべての族に適用可能な条件を示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 16:47:51 GMT)
Flows on convex polytopes [0.0] 実次元ポリトープが単位球に同型であることを示し、我々のアプローチは球上で定義された流れを利用し、元のポリトープにマッピングする。
本実験は, メタボリックフラックス解析の応用から着想を得て, 競合密度推定, サンプリング精度, 高速トレーニング, 推論時間の実現を実証した。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:45:12 GMT)
Exploring the Strongly-Interacting Regime of Effective Multi-Body Interactions in a Trapped Ultracold Atom System [0.0] 深部光学格子に密閉された超低温ボソンからなる数体システムについて検討した。
強く相互作用する状態における少数原子系の挙動を実験的に明らかにする。
この研究は、強く相互作用する少数のシステムをより深く理解するための重要なステップです。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 06:49:44 GMT)
Exploring Non-Markovianity in Ergodic Channels: Measuring Memory Retention through Ergotropy [0.0] 我々は、量子エルゴードチャネルと呼ばれるユニークな固定点を持つ量子演算のクラスを導入し、特徴付ける。
固定点が受動状態である場合、チャネルは熱力学的に重要な意味を持つエルゴトロピーダイナミクスを示す。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:44:02 GMT)
Ethical AI for Young Digital Citizens: A Call to Action on Privacy Governance [0.0] 若者が利用するデジタルプラットフォームにおける人工知能の急速な拡張は、プライバシ、自律性、データ保護に関する大きな課題を生み出している。
AI駆動のパーソナライゼーションは、ユーザエクスペリエンスの向上を提供するが、しばしば明確な倫理的境界なしに動作し、若いユーザはデータエクスプロイトやアルゴリズム上のバイアスに弱いままである。
本稿では、青少年中心のプライバシ保護、透過的なデータプラクティス、規制監督を保証する構造化されたフレームワークを提唱する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 01:35:56 GMT)
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification [0.0] 本研究では, 変圧器アーキテクチャの構造化プルーニングと量子化手法に着目し, 最適化手法の体系的研究を行う。
実験の結果,静的量子化は分類性能を維持しながらエネルギー消費量を29.14%削減し,L1プルーニングは最小精度で推論速度を63%向上させることがわかった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 03:46:53 GMT)
Dynamical formulation of low-frequency scattering in two and three dimensions [0.0] 一次元における散乱の理論は、効果的な非単位量子系に対する時間進化作用素の言葉で表すことができる。
2次元と3次元では、進化作用素から散乱器の散乱特性を抽出する定常散乱の同様の定式化が存在する。
我々は、低周波散乱振幅の明示的な式を求め、その効果を、正確に解ける散乱問題のクラスの研究で検証し、低周波散乱法を考案する際の応用を概説する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 11:22:59 GMT)
Designing quantum error correction codes for practical spin qudit [0.0] 本稿では,スピン量子に基づく誤り訂正可能な量子メモリの性能を定量的に解析する。
我々は電場ゆらぎもノイズ源として考慮すべきであると主張する。
電界摂動と磁場の同時補償が可能なマルチスピン量子ビットに基づく誤り訂正符号の符号化/復号方式について述べる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:57:06 GMT)
Cross-Modal Diffusion for Biomechanical Dynamical Systems Through Local Manifold Alignment [0.0] 本稿では,相互に協調した生体力学的運動生成のための拡散フレームワークを提案する。
それぞれのモダリティを,共振子力学系の相補的な観測として扱うことにより,各拡散段階における潜在表現を一致させる。
我々のアプローチは、ローカル時間ウィンドウの$X$と$Y$が、基礎となる動的システムの同じフェーズを表しているという事実に動機づけられている。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 17:44:03 GMT)
Comparing Human Expertise and Large Language Models Embeddings in Content Validity Assessment of Personality Tests [0.0] 本研究では,大規模言語モデル(LLM)の心理測定器の内容妥当性評価への応用について検討する。
人間の専門的評価と高度なLCMの両方を用いて,意味的項目・構成的アライメントの精度を比較した。
その結果、人間とAIのアプローチの強みと限界が明らかになりました。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 10:54:35 GMT)
Challenges in Plane Symmetry: From Theory to Perception [0.0] 平面装飾は 4つの原始的な幾何学的操作の組み合わせで 基地ユニットを繰り返すことで作られます
群論によれば、これらの4つの幾何学的操作の異なる組み合わせは異なる対称性群をもたらす。
本稿では, 観念実験の結果から, 観念した参加者の認識する対称性が, 理論の定式化と一致しないことが明らかとなった。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 07:30:28 GMT)
Bounds on a Wavefunction Overlap with Hamiltonian Eigen-states: Performance Guarantees for the Quantum Phase Estimation Algorithm [0.0] 近似波動関数とハミルトニアン系の目標固有状態との重なりを推定することは、量子位相推定の効率性に不可欠である。
我々は、ハミルトンパワーの期待値と目標固有エネルギー上の有界値を用いて、この重なり合い上の上界と下界を導出する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 18:24:12 GMT)
Automation and Feature Selection Enhancement with Reinforcement Learning (RL) [0.0] 決定木と統合された強化学習は、特徴知識、状態表現、選択効率を向上させる。
モンテカルロをベースとした単エージェント特徴選択法である強化特徴選択(MCRFS)は計算負担を軽減する。
機能とインスタンスをまとめて選択し、それら間のインタラクションをキャプチャする、デュアルエージェントのRLフレームワークも導入された。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:30:55 GMT)
Aristotle's Original Idea: For and Against Logic in the era of AI [0.0] アリストテレスは論理学の父として一般に受け入れられている。
AIの時代において、この論理の父性という称号は、新たな重要性を持つ。
私たちは、これがAIと科学の理解を深める助けになるかどうか尋ねる。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 14:55:52 GMT)
Applications of Large Language Model Reasoning in Feature Generation [0.0] 大規模言語モデル(LLM)は、その技術推論能力を通じて自然言語処理に革命をもたらした。
本稿では,LLM推論手法の収束と,機械学習タスクの機能生成について考察する。
本論文は、金融、医療、テキスト分析など、さまざまな分野にまたがるLLMベースの特徴生成手法を分類する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 04:18:01 GMT)
An Efficient Deep Learning-Based Approach to Automating Invoice Document Validation [0.0] 本稿では,文書レイアウト解析とオブジェクト検出技術を用いて,機械による請求書の検証を自動化することを提案する。
本稿では,手動で注釈付き実世界の請求書と複数基準検証プロセスからなる新しいデータセットを提案する。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 21:33:00 GMT)
A Physics-Constrained Neural Differential Equation Framework for Data-Driven Snowpack Simulation [0.0] 本稿では,パラメータ化のための物理制約付きニューラル微分方程式フレームワークを提案する。
降雪深は9%の中央値誤差で予測され、ナッシュサトクリフ効果は幅広い雪の気候で0.94以上である。
アプローチの構造は、物理的制約の満足度を保証し、モデルのトレーニング中にこれらの制約を許容し、パラメータ化のさらなる再トレーニングなしに異なる時間分解におけるモデリングを可能にする。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 20:11:16 GMT)
A Logic of Uncertain Interpretation [0.0] 我々は「不確実な解釈」を推論するための論理的枠組みを導入する。
2つの主要な応用について検討する: ある種の「エンターテイメント」をキャプチャーするための新しい意味論と「エビデンシャルに支持された」信念という保守的な概念である。
論文参考訳(メタデータ) (Sat, 15 Mar 2025 13:40:51 GMT)