The Amazon Nova Family of Models: Technical Report and Model Card [380.6] Amazon Novaは、フロンティアインテリジェンスと業界主導の価格パフォーマンスを提供する、新しい世代のファンデーションモデルである。
Amazon Nova Proは、さまざまなタスクに最適な精度、スピード、コストの組み合わせを備えた、高機能なマルチモーダルモデルである。
Amazon Nova Liteは低コストのマルチモーダルモデルで、画像、ビデオ、ドキュメント、テキストを高速に処理できる。
Amazon Nova Microはテキストのみのモデルで、低レイテンシのレスポンスを極めて低コストで提供します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:18:49 GMT)
Seeing World Dynamics in a Nutshell [132.8] NutWorldはモノクロ動画をダイナミックな3D表現に変換するフレームワークである。
我々は,NutWorldがリアルタイムにダウンストリームアプリケーションを実現しつつ,高忠実度ビデオ再構成品質を実現することを実証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:29:41 GMT)
SketchYourSeg: Mask-Free Subjective Image Segmentation via Freehand Sketches [116.2] SketchYourSegは、主観的なイメージセグメンテーションのための強力なクエリモダリティとして、フリーハンドスケッチを確立している。
我々の評価は、様々なベンチマークで既存のアプローチよりも優れた性能を示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:44:42 GMT)
SuperBPE: Space Travel for Language Models [112.6] 我々は、単純なプリトークン化カリキュラムをバイトペア符号化(BPE)アルゴリズムに組み込んだ「スーパーワード」トークンライザ「SuperBPE」を導入する。
SuperBPEは、固定されたテキストを符号化し、平均してBPEよりもトークンが最大33%少ない。
我々のモデルは、30の下流タスクにわたるBPEベースラインに対して平均+4.0%の絶対的な改善を達成している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:53:23 GMT)
Exploring 3D Activity Reasoning and Planning: From Implicit Human Intentions to Route-Aware Planning [103.2] そこで本研究では,暗黙的な指示から意図した活動を推論し,ステップ間の経路や計画を伴うステップに分解する,新しい3Dタスクである3Dアクティビティ推論と計画を提案する。
まずReasonPlan3Dという,多種多様な3Dシーンを多種多様な暗黙の指示でカバーする大規模ベンチマークを構築した。
第二に、複数のステップにまたがってコンテキスト整合性を持つプログレッシブプラン生成を導入する新しいフレームワークを設計する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:33:58 GMT)
Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation [98.9] この研究は、合成データによるスケーリングを再考し、データ中心の観点からビデオLLMの開発に焦点を当てる。
本研究では,純粋なテキスト命令データからビデオライクなサンプルを合成するSparrowというデータ拡張手法を提案する。
提案手法は,多くのサンプルを用いてトレーニングしたベースラインに匹敵する,あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:33:00 GMT)
InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.8] InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:39:06 GMT)
Why Do Multi-Agent LLM Systems Fail? [91.4] 我々は、150以上のタスクにまたがる5つの人気のあるマルチエージェントシステム(MAS)フレームワークを分析し、6つの専門家のアノテータを含む。
そこで本研究では,14種類の障害モードを特定し,様々なMASフレームワークに適用可能な包括的分類法を提案する。
これらのきめ細かい障害モードは、(i)仕様とシステム設計の失敗、(ii)エージェント間のミスアライメント、(iii)タスク検証と終了の3つのカテゴリに分けられます。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:04:38 GMT)
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation [90.8] 超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。
本稿では,拡散型SRモデルの1つであるResShiftの新しい蒸留法であるRSDを提案する。
本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:44:08 GMT)
Training Neural Networks as Recognizers of Formal Languages [87.1] ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:51:27 GMT)
UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7] 見えないオブジェクトのポーズ推定方法はCADモデルや複数の参照ビューに依存することが多い。
参照取得を簡略化するために,未提示のRGB-D参照画像を用いて未確認オブジェクトのポーズを推定することを目的とする。
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:54:18 GMT)
R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization [86.3] そこで本稿では,MLLMの自己改善を支援するオンライン強化学習フレームワークを提案する。
StepGRPOは、Step-wise Reasoning Accuracy Reward (StepRAR)とStep-wise Reasoning Validity Reward (StepRVR)の2つの新しいルールベースの推論報酬を導入した。
提案するStepGRPOでは,ステップバイステップ推論に優れた機能を持つMLLMのシリーズであるR1-VLを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:51:44 GMT)
BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing [86.3] BlobCtrlは、確率的ブロブベースの表現を使用して要素レベルの生成と編集を統合するフレームワークである。
提案手法は,空間的位置,意味的内容,アイデンティティ情報を効果的に分離し,表現する。
実験の結果、BlobCtrlは計算効率を保ちながら、様々な要素レベルの操作タスクに優れていた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:05 GMT)
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion [86.3] 3DTopia-XLは,既存の手法の限界を克服するために設計された,スケーラブルなネイティブな3D生成モデルである。
3DTopia-XLは、新しいプリミティブベースの3D表現であるPrimXを利用して、詳細な形状、アルベド、マテリアルフィールドをコンパクトなテンソル形式にエンコードする。
その上で, 1) 原始的パッチ圧縮, 2) および潜在的原始的拡散を含む拡散変換器(DiT)に基づく生成フレームワークを提案する。
我々は,3DTopia-XLが既存の手法よりも高い性能を示すことを示すために,広範囲な定性的,定量的な実験を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:20:02 GMT)
UniHOPE: A Unified Approach for Hand-Only and Hand-Object Pose Estimation [82.9] 既存のメソッドは、オブジェクトと対話する素手または手に焦点を当てて、特殊化されている。
他のシナリオに適用しても、どちらのメソッドも柔軟にシナリオとパフォーマンスの低下を処理できません。
汎用的な3次元手動ポーズ推定のための統一的なアプローチであるUniHOPEを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:46:43 GMT)
Chain-of-Probe: Examining the Necessity and Accuracy of CoT Step-by-Step [81.5] モデル推論における心の変化を探索する手法を提案する。
心的変化のパターンを解析することにより,モデルの推論の正しさを検証した。
我々の検証では、最終回答では正しいが、多くの応答が推論プロセスに誤りを含んでいることが明らかになった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:04:48 GMT)
ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis [80.3] より関連性の高いツールの組み合わせをサンプリングするためのグラフベースのサンプリング戦略と、コヒーレントな対話の合成を導く計画を作成するための計画生成戦略を提案する。
ツールフローで生成した8000の合成対話を用いてLLaMA-3.1-8BにSFTを適用した。
その結果,GPT-4に匹敵するツールコール性能が得られた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:00:52 GMT)
ML-SpecQD: Multi-Level Speculative Decoding with Quantized Drafts [79.6] 16ビットモデル推論の精度を犠牲にすることなくLSM推論を高速化する手法として、投機復号法(SD)が登場した。
MXFP4Weight-Only-Quantization (WOQ)は、単にBF16ターゲットモデルの重みをMXFP4に直接キャストするだけなので、MXFP4モデルをプラグアンドプレイ方式でドラフトとして使用することを提案する。
私たちのプラグアンドプレイソリューションでは,BF16ベースラインの最大2倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:38:45 GMT)
Decouple to Reconstruct: High Quality UHD Restoration via Active Feature Disentanglement and Reversible Fusion [77.1] 超高精細画像復元(UHD)は、高解像度のため、しばしば計算ボトルネックや情報損失に直面している。
本稿では,より難解な劣化情報を潜時空間に符号化しながら,容易に復元可能な背景情報を破棄する制御付き微分遠絡型VAEを提案する。
提案手法は,UHD画像復元の精度を向上し,UHD画像復元の6つの課題を1Mパラメータのみで実現し,VAEモデルにおける情報損失問題を効果的に軽減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:55:18 GMT)
UncTrack: Reliable Visual Object Tracking with Uncertainty-Aware Prototype Memory Network [76.0] UncTrackは、標的位置の不確実性を予測する新しい不確実性対応トランスフォーマーである。
本手法は実験における他の最先端手法よりも優れる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:33:16 GMT)
When Should We Orchestrate Multiple Agents? [74.3] 人間と人工の両方の複数のエージェント間の相互作用を編成する戦略は、パフォーマンスを過大評価し、オーケストレーションのコストを過小評価する。
推論コストや可用性制約といった現実的な条件下でエージェントを編成するフレームワークを設計する。
我々は,エージェント間の性能差やコスト差がある場合にのみ,オーケストレーションが有効であることを理論的に示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:26:07 GMT)
Scaling Large Language Model-based Multi-Agent Collaboration [72.9] 近年の大規模言語モデル駆動型自律エージェントのブレークスルーにより、複数エージェントのコラボレーションが集団的推論を通じて各個人を上回ることが判明している。
本研究は、協調剤の連続的な添加が同様の利益をもたらすかどうかを考察する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:22:42 GMT)
Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds [72.8] 本稿では,音声・視覚的事象知覚領域に対するモデルに依存しないアプローチを提案する。
我々のアプローチには、よりリッチなマルチモーダル相互作用を維持するためのスコアレベル融合技術が含まれている。
また,音声・視覚イベント知覚のための学習自由なオープン語彙ベースラインも提示する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:06:48 GMT)
AR-1-to-3: Single Image to Consistent 3D Object Generation via Next-View Prediction [71.3] 拡散モデルに基づく新しい次世代予測パラダイムAR-1-to-3を提案する。
提案手法は,生成したビューと入力ビューとの整合性を大幅に改善し,高忠実度3Dアセットを生成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:39:10 GMT)
Hydra-MDP++: Advancing End-to-End Driving via Expert-Guided Hydra-Distillation [71.1] Hydra-MDP++は,マルチヘッドデコーダを備えた新しい知識蒸留フレームワークである。
このフレームワークには、交通光コンプライアンス(TL)、車線維持能力(LK)、快適性(EC)など、拡張された評価指標が組み込まれている。
Hydra-MDP++は、これらのコンポーネントをNAVSIMの91.0%のドライブスコアと統合することで、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:58:09 GMT)
Learning Program Behavioral Models from Synthesized Input-Output Pairs [71.0] 本稿では,ニューラルマシン翻訳アルゴリズムを用いて,入力/出力動作からモデルを学習するフレームワークであるModelizerを紹介する。
Modelizerはオリジナルのプログラムをモックし、95.4%の精度でBLEUスコアは0.98で、現実世界のアプリケーションのモックには0.04の標準エラーがある。
プログラムの出力がプログラムの振舞いのあらゆる側面となるため、これらのモデルのいくつかの応用を予想する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:04:06 GMT)
GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting [70.8] GuardSplatは、3DGS資産をウォーターマークするための革新的で効率的なフレームワークである。
Message Embeddingモジュールは、元の3D構造を保持しながら、各3DガウスのSH機能にメッセージをシームレスに埋め込む。
反歪メッセージ抽出モジュールは、様々な歪みに対する堅牢性を改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:33:17 GMT)
SSCR: Iterative Language-Based Image Editing via Self-Supervised Counterfactual Reasoning [69.9] 反復言語ベースの画像編集(IL-BIE)タスクは、段階的に画像を編集するための反復的な命令に従う。
データ不足は、命令ベースの変更前後の大規模な画像のサンプル収集が困難であるため、ILBIEにとって重要な問題である。
本稿では,データ不足を克服する対実的思考を取り入れたセルフスーパービジョンの対実的推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:55:12 GMT)
Optimizing ML Training with Metagradient Descent [69.9] モデルトレーニングによる勾配というメタグラディエントを,大規模に効率的に計算するアルゴリズムを導入する。
次に、メタグラディエントを用いた効果的な最適化を可能にする「滑らかなモデルトレーニング」フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:18:24 GMT)
Clustering is back: Reaching state-of-the-art LiDAR instance segmentation without training [69.3] 本研究は, セマンティックラベルのみを用いて, 競合するパノプティクスのセグメンテーションを実現できることを示す。
本手法は完全に説明可能であり,学習やパラメータチューニングは不要である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:12:08 GMT)
LangDA: Building Context-Awareness via Language for Domain Adaptive Semantic Segmentation [69.1] セマンティックセグメンテーションのための教師なしドメイン適応は、ラベルに富んだソースドメインからラベルのないターゲットドメインに知識を伝達することを目的としている。
LangDAは、VLM生成シーン記述を通じてオブジェクト間のコンテキスト関係を学習することで、これらの課題に対処する。
LangDAは新しい最先端を3つのDASSベンチマークで設定し、既存の手法を2.6%、1.4%、および3.9%で上回っている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:33:28 GMT)
Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.4] 単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:08:03 GMT)
Triad: Empowering LMM-based Anomaly Detection with Vision Expert-guided Visual Tokenizer and Manufacturing Process [68.0] LLaVAモデルのAnyRes構造を変更し、既存のIADモデルによって同定された潜在的な異常領域をLMMに提供します。
欠陥の発生が製造プロセスと密接に関連していることを考えると,製造駆動型IADパラダイムを提案する。
本稿では、エキスパート誘導型領域トークン化と製造プロセスを組み合わせたLMMに基づく新しい手法であるTriadを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:56:57 GMT)
A Multi-Power Law for Loss Curve Prediction Across Learning Rate Schedules [67.9] 本稿では,大規模言語モデルの事前学習損失が,学習率の異なるスケジュール下でどのように進展するかを示す経験則を提案する。
提案法は,学習率の総和に基づく電力法則と,学習率減衰による損失低減効果を考慮した電力法とを併用した多大電力法である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:36:45 GMT)
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.1] そこで,Dual Point Maps (DualPM) では,同じ画像から一対の点マップを抽出し,一対の点マップをオブジェクト上の3D位置と関連付け,一対の点マップを静止時の標準バージョンに関連付ける。
3次元再構成と3次元ポーズ推定がDualPMの予測に比例することを示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:42:59 GMT)
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images [66.8] Amodal3Rは、部分的な観測から3Dオブジェクトを再構成するために設計された条件付き3D生成モデルである。
実際のシーンに隠蔽物が存在する場合でも、完全な3Dオブジェクトを復元することを学ぶ。
2次元アモーダルコンプリートと3次元再構成とを独立に行う既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:01 GMT)
Aligned Probing: Relating Toxic Behavior and Model Internals [66.5] 言語モデル(LM)の振る舞いを協調する新しい解釈可能性フレームワークであるアライメント・プロブリングを導入する。
本フレームワークを用いて,20以上のOLMo,Llama,Mistralモデルについて検討した。
以上の結果から,LMは,特に下層において,入力およびその後の出力の毒性レベルに関する情報を強くエンコードしていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:23:50 GMT)
Grounded Chain-of-Thought for Multimodal Large Language Models [66.0] 我々は,GCoT(Gunded Chain-of-Thought)と呼ばれるマルチモーダル大規模言語モデル(MLLM)の新しい学習タスクを提案する。
GCoTは、MLLMが関連する視覚的手がかりを段階的に認識し、グラウンド化するのを支援し、グラウンド化座標による正しい解を直感的に予測する。
この作業を容易にするために,5,033画像に対して24,022 GCoT例からなるマルチモーダルグラウンドド・チェーン・オブ・ソート(MM-GCoT)と呼ばれるデータセットを慎重に設計し,構築する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:07:47 GMT)
Counterfactual Vision-and-Language Navigation via Adversarial Path Sampling [66.0] VLN(Vision-and-Language Navigation)は、エージェントが目標を達成するために3D環境を移動する方法を決定するタスクである。
VLNタスクの問題点の1つは、対話型環境において、人間に注釈を付けた指示で十分なナビゲーションパスを収集することは困難であるため、データの不足である。
本稿では,低品質な拡張データではなく,効果的な条件を考慮可能な,対向駆動の反実的推論モデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:53:11 GMT)
WideRange4D: Enabling High-Quality 4D Reconstruction with Wide-Range Movements and Scenes [65.8] そこで本研究では,新しい4D再構成ベンチマークであるWideRange4Dを提案する。
このベンチマークには、空間変動が大きいリッチな4Dシーンデータが含まれており、より包括的な4D生成手法の生成能力を評価できる。
また,様々な複雑な4Dシーン再構成タスクに対して,安定かつ高品質な4D結果を生成する新しい4D再構成手法であるProgress4Dを導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:18 GMT)
Escaping Plato's Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes [65.6] 画像分類における解釈可能性とロバスト性を統一する新しい方向であるCAVE(Concept Aware Volumes for Explanations)を紹介する。
本研究では,既存の3次元認識型分類器をボリューム表現から抽出した概念で拡張することで,本質的に解釈可能かつ堅牢な分類器を設計する。
解釈可能性のための定量的メトリクスの配列において、説明可能なAI文献全体にわたる異なる概念ベースのアプローチと比較し、CAVEが画像間で一貫して使用されるよく構築された概念を発見し、優れたロバスト性を実現していることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:55:15 GMT)
Self-Supervised Z-Slice Augmentation for 3D Bio-Imaging via Knowledge Distillation [65.5] ZAugNetは、生物画像のz分解能を高めるための高速で正確で自己教師型のディープラーニング手法である。
連続スライス間の非線形距離を実行することで、ZAugNetは各イテレーションで分解能を効果的に倍にする。
ZAugNet+は任意の距離で連続的な予測を可能にする拡張版である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:52:46 GMT)
MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0] 本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:09:42 GMT)
Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.9] Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:10:45 GMT)
MeshPad: Interactive Sketch-Conditioned Artist-Designed Mesh Generation and Editing [64.8] MeshPadは、スケッチ入力から3Dメッシュを生成するジェネレーティブなアプローチである。
我々は、メッシュの領域の"削除"に編集を分解し、新しいメッシュ幾何学の"追加"に続き、一貫した編集を可能にすることに重点を置いている。
提案手法は,メッシュ三角形の追加と削除のために,大規模なTransformerモデルを利用した三角形列に基づくメッシュ表現に基づいている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:08:48 GMT)
TuBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning [63.5] 多言語大言語モデル(LLM)に対する言語間バックドア攻撃は未調査である。
本研究は, 教育指導データが有毒でない言語に対して, 教育指導データの有毒化がアウトプットに与える影響について検討した。
本手法は,mT5 や GPT-4o などのモデルにおいて,高い攻撃成功率を示し,12言語中7言語以上で90%以上を突破した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:09:29 GMT)
TimeZero: Temporal Video Grounding with Reasoning-Guided LVLM [63.1] 時間的ビデオグラウンド(TVG)タスク用に設計された推論誘導型LVLMであるTimeZeroを紹介する。
TimeZeroはこの課題に取り組み、推論プロセスを拡張して、強化学習のみを通じて、モデルがビデオ言語との関係について推論できるようにする。
我々は2つのベンチマークで実験を行い、TimeZeroはCharades-STA上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:04:20 GMT)
Reinforcement learning with combinatorial actions for coupled restless bandits [62.9] 提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。
我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:59:28 GMT)
FlexWorld: Progressively Expanding 3D Scenes for Flexiable-View Synthesis [61.8] 単一イメージからフレキシブルな3Dシーンを生成するためのフレームワークであるFlexWorldを紹介します。
我々のV2Vモデルは、大きなカメラポーズのバリエーションの下で、新しいビューを生成することができる。
その上でFlexWorldは新しい3Dコンテンツを徐々に生成し、グローバルなシーンに統合します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:18:38 GMT)
Web Artifact Attacks Disrupt Vision Language Models [61.6] 視覚言語モデル(VLM)は、大規模で軽量にキュレートされたWebデータセットに基づいて訓練されている。
意味概念と無関係な視覚信号の間に意図しない相関関係を学習する。
これまでの研究は、これらの相関関係をモデル予測を操作するための攻撃ベクトルとして武器化してきた。
非マッチングテキストとグラフィカル要素の両方を使ってモデルを誤解させる新しい操作クラスである、アーティファクトベースのアタックを紹介します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:59:29 GMT)
TextInVision: Text and Prompt Complexity Driven Visual Text Generation Benchmark [61.4] 既存の拡散ベースのテキスト・ツー・イメージモデルは、しばしば画像に正確にテキストを埋め込むのに苦労する。
本研究では,画像に視覚テキストを統合する拡散モデルの有効性を評価するために,大規模で,かつ,迅速な複雑性駆動型ベンチマークであるTextInVisionを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:36:31 GMT)
DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding [61.3] 人間の専門家は、ドメイン知識を活用して知覚的特徴を洗練することによって、きめ細かい視覚的識別に長けている。
現在のMLLM(Multimodal Large Language Models)は、推論を視覚的知覚に統合するのに苦労している。
本稿では,認知的視覚能力を強化したMLLMであるDeepPerceptionを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:06:34 GMT)
Decoupled Graph Energy-based Model for Node Out-of-Distribution Detection on Heterophilic Graphs [61.2] グラフ学習におけるノードのOOD検出は未探索のままである。
GNNSafeは、最先端の性能を持つグラフ領域にエネルギーベースの検出を適用した。
本稿では,学習過程をノード表現のためのトポロジ情報を利用するグラフエンコーダと,遅延空間で動作するエネルギーヘッドの2つの部分に分解するDeGEMを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:23:08 GMT)
DimOL: Dimensional Awareness as A New 'Dimension' in Operator Learning [60.6] 本稿では,DimOL(Dimension-aware Operator Learning)を紹介し,次元解析から洞察を得る。
DimOLを実装するために,FNOおよびTransformerベースのPDEソルバにシームレスに統合可能なProdLayerを提案する。
経験的に、DimOLモデルはPDEデータセット内で最大48%のパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:54:47 GMT)
Open3DBench: Open-Source Benchmark for 3D-IC Backend Implementation and PPA Evaluation [60.0] これはOpen-flow-scriptsフレームワーク上に構築されたオープンソースの3D-ICバックエンド実装ベンチマークである。
Open3DBenchは、3D EDAメソッドを評価するための標準化された再現可能なプラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:59:00 GMT)
Cream of the Crop: Harvesting Rich, Scalable and Transferable Multi-Modal Data for Instruction Fine-Tuning [59.6] 我々は、堅牢で効率的なマルチモーダル・インストラクショナルデータを収集する。
インタラクションスタイルを多様性指標とし、マルチモーダルリッチなスタイルラーを用いてデータインストラクションパターンを識別する。
14のマルチモーダルベンチマークによって検証された10以上の実験環境において、ランダムサンプリング、ベースライン戦略、最先端の選択方法に対する一貫した改善を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:11:22 GMT)
EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.3] イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。
本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。
動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。
最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:12:39 GMT)
Computation Mechanism Behind LLM Position Generalization [59.0] 大規模言語モデル(LLM)は、テキストの位置を扱う際の柔軟性を示す。
彼らは位置摂動のあるテキストを理解し、より長いテキストに一般化することができる。
この研究は言語現象とLLMの計算機構を結びつける。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:47:37 GMT)
On the Consistency of Video Large Language Models in Temporal Comprehension [58.0] ビデオ大言語モデル(Video-LLMs)は、時間的に言語クエリを解析し、ビデオモーメントを検索することができる。
予測整合性 - 時間的根拠の堅牢性と信頼性を示す重要な指標である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:21:38 GMT)
HIS-GPT: Towards 3D Human-In-Scene Multimodal Understanding [57.8] 具体的エージェントに対するヒューマン・イン・シーン・サーチ・アンサーリング(HIS-QA)のためのヒューマン・イン・シーン・理解のベンチマークのための新しいタスクを提案する。
HIS-QAは、エージェントが人間の状態や行動を理解し、周囲の環境を判断し、シーン内の人間関連の質問に答えることを要求する。
広帯域でのHIS理解を体系的に評価するマルチモーダル・ベンチマークであるHIS-Benchを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:10:50 GMT)
Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis [57.7] 最近の画像生成方式は、凍結した画像トークン化器に依存した事前構築された潜在空間における画像分布を典型的に捉えている。
本稿では,遅延空間構築を容易にするための新しいプラグ・アンド・プレイ・トークンライザ・トレーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:54:40 GMT)
Reliable and Efficient Amortized Model-based Evaluation [57.6] 幅広いベンチマークの平均スコアは、実際に言語モデルを使用することをガイドするシグナルを提供する。
コストを下げるための一般的な試みは、ベンチマークのサブセットの平均スコアを計算することである。
このアプローチは、平均スコアがベンチマークサブセットの質問の難しさと合わさったため、信頼性の低いLM性能をしばしば引き起こす。
我々は、その内容から質問難度を予測するモデルを訓練し、信頼性のある測定をコストのごく一部で行えるようにした。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:15:02 GMT)
MicroVQA: A Multimodal Reasoning Benchmark for Microscopy-Based Scientific Research [57.6] MicroVQA は、生物学の専門家が様々な顕微鏡のモードでキュレートした 1,042 の多重選択質問 (MCQ) から構成される。
最先端のMLLMのベンチマークでは、ピーク性能は53%であった。
チェーン・オブ・シント・レスポンスのエキスパート分析では、知覚エラーが最も頻繁であり、続いて知識エラー、そして過一般化エラーが続く。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:33:10 GMT)
BigDocs: An Open Dataset for Training Multimodal Models on Document and Code Tasks [57.6] 我々は,30タスクにわたる750万のマルチモーダルドキュメントからなる高品質なオープンアクセスデータセットであるBigDocs-7.5Mを紹介した。
BigDocs-Benchも導入しています。
実験の結果,BigDocs-Bench を用いたトレーニングでは,クローズドソース GPT-4o よりも平均性能が 25.8% 向上していることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:32:24 GMT)
Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [57.0] 拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:44:45 GMT)
Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [56.4] 本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:45:52 GMT)
Continual Unlearning for Foundational Text-to-Image Models without Generalization Erosion [56.4] 本研究は,基本生成モデルから複数の特定の概念を対象とする除去を可能にする新しいパラダイムである連続的アンラーニングを導入する。
本稿では,望ましくない概念の生成を選択的に解き放つような一般化エロージョン(DUGE)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:17:16 GMT)
STORM: A Spatio-Temporal Factor Model Based on Dual Vector Quantized Variational Autoencoders for Financial Trading [55.0] 金融取引では、ファクターモデルが資産の価格設定や過大なリターンの獲得に広く利用されている。
双対ベクトル量子化変分オートエンコーダを用いた時空間ファクトラーモデルSTORMを提案する。
ストームは時間的および空間的な視点からストックの特徴を抽出し、これらの特徴を微細で意味的なレベルで融合し整列させ、その要素を多次元の埋め込みとして表現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:30:03 GMT)
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model [54.6] 単一大規模言語モデルに自動回帰および拡散ポリシーをシームレスに統合する統合フレームワークであるHybridVLAを紹介する。
このレシピにより、これらの2種類の行動予測は互いに強化するだけでなく、異なるタスクにまたがる様々なパフォーマンスを示す。
実験では、HybridVLAは様々なシミュレーションや実世界のタスクにまたがって、最先端のVLA手法よりも優れている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:44:28 GMT)
Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning [53.8] 本稿では、画像入力を重要な推論段階に移行する戦略であるTake-Allong Visual Conditioning (TVC)を提案する。
TVCは、推論を通して視覚的なコンポーネントへの注意を維持するのに役立つ。
提案手法は,5つの数学的推論ベンチマークにおいて,最先端の性能を平均で達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:45:12 GMT)
Exact Computation of Any-Order Shapley Interactions for Graph Neural Networks [53.1] 共有インタラクション(SI)は、複数のノード間のノードのコントリビューションとインタラクションを定量化する。
GNNアーキテクチャを利用して、ノード埋め込みにおける相互作用の構造がグラフ予測のために保存されていることを示す。
任意の順序SIを正確に計算するための効率的なアプローチであるGraphSHAP-IQを導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:46:45 GMT)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.9] 拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
これらの課題に対処するための影響関数フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:47:39 GMT)
Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models [52.9] 本稿では,ER-APTと呼ばれる進化型領域逆アプティブチューニング手法を提案する。
各トレーニングイテレーションでは、まず従来の勾配法を用いてAEを生成する。
次に、AEsを最適化するために、選択、突然変異、交差を含む遺伝的進化機構を適用する。
最終進化型AEは、従来の単点対向的な高速チューニングの代わりに、地域ベースの対向最適化を実現するために用いられる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:08:47 GMT)
In-Context Learning Enables Robot Action Prediction in LLMs [52.3] 本稿では,ロボットの動作を直接予測する,オフザシェルフテキストのみの大規模言語モデルを実現するフレームワークであるRoboPromptを紹介する。
RoboPromptは、シミュレーションおよび実世界の設定において、ゼロショットとICLベースラインよりもパフォーマンスが向上している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:43:54 GMT)
Unified Autoregressive Visual Generation and Understanding with Continuous Tokens [52.2] We present UniFluid, a unified autoregressive framework for joint visual generation and understanding。
我々の統合自己回帰アーキテクチャはマルチモーダル画像とテキスト入力を処理し、テキストの離散トークンと画像の連続トークンを生成する。
画像生成と理解タスクの間には本質的にトレードオフがあることに気付きましたが、注意深く調整されたトレーニングレシピによって互いに改善できるようになりました。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:30 GMT)
In-Context Linear Regression Demystified: Training Dynamics and Mechanistic Interpretability of Multi-Head Softmax Attention [52.2] 本研究では,マルチヘッド型ソフトマックスアテンションモデルを用いて,線形データを用いたコンテキスト内学習を行う方法について検討する。
この結果から,学習内容の学習能力は,そのアーキテクチャと基礎となるデータ分布の集約的効果として,訓練されたトランスフォーマーから出現することが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:00:49 GMT)
Bayesian Test-Time Adaptation for Vision-Language Models [51.9] CLIPのような事前訓練された視覚言語モデルによるテスト時適応は、新しい、潜在的に配布外テストデータにモデルを適応させることを目的としている。
我々は、クラス埋め込みを継続的に更新して妥当性を適応させる新しいアプローチ、textbfBayesian textbfClass textbfAdaptation (BCA)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:59:16 GMT)
Omnia de EgoTempo: Benchmarking Temporal Understanding of Multi-Modal LLMs in Egocentric Videos [51.9] EgoTempoは、エゴセントリックドメインにおける時間的理解を評価するために設計されたデータセットである。
本稿では,ベンチマークにおける最先端のマルチモーダル言語モデル (MLLM) が,テキストやフレームのみを入力として,驚くほど高い性能を実現していることを示す。
EgoTempoがこの分野の新たな研究を触媒し、時間的ダイナミクスの複雑さをよりよく捉えたモデルに刺激を与えることを期待している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:50:36 GMT)
Dense Policy: Bidirectional Autoregressive Learning of Actions [51.6] 本稿では,行動予測における自己回帰的政策の新たなパラダイムを確立するために,Dense Policyと呼ばれる双方向拡張学習手法を提案する。
軽量なエンコーダのみのアーキテクチャを使用して、アクションシーケンスを初期単一フレームからターゲットシーケンスへ粗い方法で反復的に展開する。
実験により、我々の密集した政策は自己回帰学習能力に優れており、既存の全体的生成ポリシーを超越できることが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:28:08 GMT)
A Coefficient Makes SVRG Effective [51.4] SVRG (Variance Reduced Gradient) は理論的に説得力のある最適化手法である。
本研究では,実世界のニューラルネットワークを最適化するSVRGの可能性を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:14:58 GMT)
MetaScale: Test-Time Scaling with Evolving Meta-Thoughts [51.4] 実験の結果、MetaScaleは標準推論アプローチよりも一貫して優れています。
METASCALEは、サンプリング予算を増やしてより効果的にスケールし、より構造化された専門家レベルのレスポンスを生成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:54 GMT)
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation [51.3] 単一の入力ビデオから同期化されたマルチビュービデオを生成するための統合フレームワークであるReangle-A-Videoを紹介する。
提案手法は,多視点映像生成タスクをビデオ間翻訳として再設計し,公開画像とビデオ拡散先行情報を活用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:01:59 GMT)
ViSpeak: Visual Instruction Feedback in Streaming Videos [51.0] 本稿では,視覚的インストラクションフィードバック(Visual Instruction Feedback)という新しいタスクを提案する。
我々は,様々なストリーミングビデオ理解ベンチマークにおいて,GPT-4oレベルの性能を持つSOTAストリーミングビデオ理解LMMであるViSpeakモデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:05:31 GMT)
Mind the Gap: Confidence Discrepancy Can Guide Federated Semi-Supervised Learning Across Pseudo-Mismatch [50.6] Federated Semi-Supervised Learning (FSSL)は、ラベル付きデータに制限のあるクライアント間でラベル付きデータを活用して、強力な一般化能力を持つグローバルモデルをトレーニングすることを目的としている。
ほとんどのFSSL手法は擬似ラベルによる整合正則化に依存しており、局所的またはグローバルなモデルからの予測を監督信号としてハード擬似ラベルに変換する。
擬似ラベルの品質は、フェデレーション学習の本質的な側面であるデータ不均一性によって大きく劣化していることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:41:51 GMT)
Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [49.8] 本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバヘッドの最大60%削減,システム遅延の50%削減を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:37:22 GMT)
Privacy-Preserving Biometric Verification with Handwritten Random Digit String [49.8] 手書き認証は、何十年もの間、安定したアイデンティティ認証方法として存在してきた。
しかし、この技術は、署名などの手書きバイオメトリックスに個人情報が組み込まれているため、潜在的なプライバシー侵害のリスクがある。
プライバシ保護による手書き文字の検証にRandom Digit String (RDS) を用いることを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:47:25 GMT)
VITED: Video Temporal Evidence Distillation [49.4] そこで我々は,チェーン・オブ・エビデンス推論による複雑なビデオ質問応答について検討した。
モデルは、固定数のフレームを均一にサンプリングするため、多段階の推論に苦労する。
本稿では,既存のビデオQAデータセットをエビデンス・アソシエーション・チェーンで拡張するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:30:02 GMT)
E-Values Expand the Scope of Conformal Prediction [49.2] コンフォーマル予測は、分布のない不確実性定量化のための強力なフレームワークである。
本稿では,共形e-predictionと呼ばれる電子値に基づく代替手法について検討する。
E値は、p値では達成できない重要な利点を提供し、新しい理論的および実用的能力を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:54:30 GMT)
Verification Learning: Make Unsupervised Neuro-Symbolic System Feasible [49.1] 本稿では,Nesyにおけるラベルに基づく推論プロセスをラベルのない検証プロセスに変換する,新しい学習パラダイムであるVerification Learning(VL)を紹介する。
VLは、ラベルのないデータと、現在の予測が規則に準拠しているかどうかを検証する関数にのみ依存することにより、優れた学習結果を得る。
提案するフレームワークは,追加,ソート,マッチ,チェスなど,教師なしのタスクによって検証され,それぞれが大幅な性能向上と効率向上を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:28:58 GMT)
NeuSG: Neural Implicit Surface Reconstruction with 3D Gaussian Splatting Guidance [48.7] 本稿では,3次元ガウススプラッティングから高精細な表面を復元する神経暗黙的表面再構成パイプラインを提案する。
3Dガウススプラッティングの利点は、詳細な構造を持つ高密度の点雲を生成することができることである。
我々は3次元ガウスを極端に薄くすることで、表面に近い中心を引っ張るスケール正則化器を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:09:49 GMT)
When Can You Get Away with Low Memory Adam? [48.3] 我々は、$textitSlimAdam$がAdamのパフォーマンスと安定性にマッチし、合計2回目で98%のコストを節約できることを示します。
code for $textitSlimAdam$はhttps://github.com/dayal-kalra/low-Memory-adamで入手できる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:55:25 GMT)
Seeing the Future, Perceiving the Future: A Unified Driving World Model for Future Generation and Perception [47.7] 将来的なシーン生成と認識をシームレスに単一のフレームワークに統合する,運転世界モデルUniFutureを提案する。
我々のアプローチは、将来の外観(すなわちRGB画像)と幾何学(すなわち深さ)を共同でモデル化し、コヒーレントな予測を保証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:50 GMT)
DreamLayer: Simultaneous Multi-Layer Generation via Diffusion Mode [47.3] 複数の画像層をコヒーレントなテキスト駆動で生成できるフレームワークであるDreamLayerを紹介する。
透過的なフォアグラウンド層とバックグラウンド層の関係を明示的にモデル化することで、DreamLayerは層間接続を構築する。
実験とユーザスタディにより、DreamLayerはよりコヒーレントで整合したレイヤを生成することが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:34:11 GMT)
Precise Localization of Memories: A Fine-grained Neuron-level Knowledge Editing Technique for LLMs [47.1] 本研究では、成功率に影響を与えることなく、局所性を改善するための微粒なニューロンレベルの知識編集(FiNE)手法を提案する。
フィードフォワードネットワーク内の特定のニューロンを正確に識別し、修正することにより、FiNEは知識のローカライゼーションと編集を大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:34:41 GMT)
Beyond Any-Shot Adaptation: Predicting Optimization Outcome for Robustness Gains without Extra Pay [46.9] 本稿では,タスク空間と適応リスクランドスケープを橋渡しするフレームワークとして,モデル予測タスクサンプリング(MPTS)を紹介する。
MPTSは、エピソード最適化プロセスの特徴付けに生成モデルを使用し、後部推論によりタスク固有の適応リスクを予測する。
MPTSはゼロショット、少数ショット、教師付き微調整設定にシームレスに統合される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:16:23 GMT)
Valley: Video Assistant with Large Language model Enhanced abilitY [46.9] ビデオ理解の強化と指示追従機能を実現するために設計された,マルチモーダル基盤モデルであるValleyを紹介する。
我々の実験は、バレーが効果的なビデオアシスタントとして機能し、複雑なビデオ理解のシナリオを単純化する可能性を実証している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:51:51 GMT)
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning [46.7] 本稿では,Q-Learning(ACL-QL)における適応保守レベル(Adaptive Conservative Level in Q-Learning, ACL-QL)を提案する。
ACL-QLは、各状態-作用ペアに対する保守的なレベルの適応的な制御を可能にする。
理論解析により,2つの学習可能な適応重み関数を用いて各遷移の保守レベルを制御する新しいアルゴリズム ACL-QL を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:25:26 GMT)
Micro Text Classification Based on Balanced Positive-Unlabeled Learning [46.4] 現実世界のテキスト分類タスクでは、負のテキストは最小の負のコンテンツを含むことが多い。
マクロレベルでは、粗粒の正と負のサンプルの相似性が高いため、負のテキストの区別が難しい。
マイクロレベルでは、問題は極度のクラス不均衡ときめ細かいラベルの欠如に起因している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:42:27 GMT)
Using the Tools of Cognitive Science to Understand Large Language Models at Different Levels of Analysis [46.1] 認知科学で開発された手法は、大きな言語モデルを理解するのに役立つと論じる。
本稿では,これらの手法をMarrの3つの解析レベルに基づいて適用するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:33:54 GMT)
CLIP's Visual Embedding Projector is a Few-shot Cornucopia [45.9] 最適化のために'external'パラメータを追加することなく、数ショットのCLIP適応のための代替手法を導入する。
視覚の埋め込みプロジェクション行列を微調整するだけで、すべてのベースラインよりも優れたパフォーマンスが得られることが分かりました。
この単純なアプローチはProLIPと呼ばれ、11個の数ショットの分類ベンチマーク、数ショットのクロスデータセットエンコーダ転送、ドメインの一般化、ベース・ツー・ニューなクラス一般化に最先端のパフォーマンスをもたらす。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:52:55 GMT)
A Survey on Knowledge-Oriented Retrieval-Augmented Generation [45.7] 近年,RAG (Retrieval-Augmented Generation) が注目されている。
RAGは大規模検索システムと生成モデルを組み合わせる。
動的外部知識を用いた生成モデルの強化など,RAGの重要な特徴について論じる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:24:11 GMT)
Topological transitions in quantum jump dynamics: Hidden exceptional points [45.6] 例外点(EP)と関連した現象とその応用が広く研究されている。
計測された3レベル系を考慮し、数え上げ場の関数と見なされるリンドブラディアン固有値に複数のEPを求める。
これらのEPは、異なるトポロジカルクラス間の遷移を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:30:47 GMT)
REPA: Russian Error Types Annotation for Evaluating Text Generation and Judgment Capabilities [45.0] 我々は、ロシア語で大言語モデルを審査員として使用する枠組みを評価した。
人選好に基づく3つの評価システムを用いて, エラータイプ別に6つの生成LDMをランク付けする。
以上の結果から,LLM判定におけるロシア語と英語の差が顕著であった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:15:16 GMT)
Matrix phase-space representations in quantum optics [45.0] 行列量子位相空間分布を導入する。
これらは射影による量子位相空間表現の概念を大域対称性変数の密度行列に拡張する。
提案手法と比較し, サンプリング誤差が1000以上の要因で改善されることを実証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:33:14 GMT)
Harnessing electron motion for global spin qubit control [45.0] シリコンスピン量子ビットは、スケーラブルな量子コンピュータを構築するための有望な候補である。
マイクロ波制御信号を各キュービットに ローカルに送信することは 課題です
提案手法を用いることで,最先端技術と比較して,単一ビットの忠実度を最大100倍に向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:02:56 GMT)
Causal Feature Learning in the Social Sciences [45.0] 本稿では、因果的特徴学習(CFL)の理論的枠組みを拡張する。
実証的に、CFLを様々な社会科学データセットに適用し、下流モデリングタスクにおいて、CFL由来のマクロステートが従来のマイクロステートとどのように比較されるかを評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:43:00 GMT)
TablePilot; Recommending Human-Preferred Tabular Data Analysis with Large Language Models [44.4] 大規模言語モデルを活用する先駆的なデータ分析フレームワークであるTablePilotを,包括的で優れた分析結果を自律的に生成する。
このフレームワークは、分析準備と分析最適化に重要な設計を取り入れ、精度を向上する。
また,レコメンデーション品質を向上し,ヒトの嗜好に適合する新しい手法であるRec-Alignを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:16:59 GMT)
IRIS: Inverse Rendering of Indoor Scenes from Low Dynamic Range Images [43.8] 逆レンダリングは、撮像された画像から3次元幾何学、表面物質、照明を復元しようとする。
そこで本研究では,物理ベース素材を復元する逆レンダリングフレームワークであるIRISを紹介する。
我々は、実世界のシーンと合成シーンのアプローチを評価し、最先端の手法と比較した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:16:19 GMT)
Deep Learning Advancements in Anomaly Detection: A Comprehensive Survey [43.8] データセットが複雑化するにつれて、従来の異常検出手法は複雑なパターンを捉えるのに苦労する。
ディープラーニングにより、ADメソッドはより強力で適応可能になり、高次元および非構造化データを扱う能力が改善された。
このレビューは、既存の文献のギャップを埋め、深層学習を用いたAD技術の向上を目指す研究者や実践者にとって貴重な情報源となる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:04:48 GMT)
PDMX: A Large-Scale Public Domain MusicXML Dataset for Symbolic Music Processing [43.6] PDMX: スコア共有フォーラムMuseScoreから収集した250万以上のパブリックドメイン MusicXML スコアからなる大規模なオープンソースデータセット。
このデータセットは、私たちの知識にとって最大の著作権のないシンボリック音楽データセットです。
我々は、PDMXの異なる代表部分集合が下流モデルにおける異なる挙動にどのように寄与するかを評価するマルチトラック音楽生成実験を行う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:08:29 GMT)
Towards Better Sample Efficiency in Multi-Agent Reinforcement Learning via Exploration [42.8] 多エージェント強化学習は、チームベースの環境における協調行動の学習において有望である。
本稿では,TiZeroにおける自己監督型内因性報酬とランダムネットワーク蒸留ボーナスの2つの方法を提案する。
この結果から, ランダムネットワーク蒸留は, 当初のTiZeroと比較して, トレーニングサンプル効率を18.8%向上させることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:32:28 GMT)
Neural Edge Histogram Descriptors for Underwater Acoustic Target Recognition [42.2] この研究は、もともと画像分類のために開発されたニューラルエッジヒストグラム記述子(NEHD)法に適応し、受動的ソナー信号を分類する。
統計的および構造的テクスチャの特徴を包括的に評価し、それらの組み合わせが大きな事前学習モデルとの競合性能を達成することを示す。
提案したNEHDベースのアプローチは、水中目標認識のための軽量で効率的なソリューションを提供し、精度を維持しながら計算コストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:57:05 GMT)
Deep Self-Supervised Disturbance Mapping with the OPERA Sentinel-1 Radiometric Terrain Corrected SAR Backscatter Product [41.9] 地表面の乱れのマッピングは、災害対応、資源と生態系の管理、気候適応の取り組みを支援する。
合成開口レーダ(SAR)は、気象や照明条件に関わらず、地上の連続した時系列画像を提供する、外乱マッピングのための貴重なツールである。
NASAのRemote Sensing Analysis (OPERA)プロジェクトは2023年10月にSentinel-1 (RTC-S1)データセットからほぼグローバルな測地線補正SAR後方散乱器をリリースした。
本研究では,地表面の乱れを体系的に解析するために,この新たなデータセットを利用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:49:43 GMT)
MSWAL: 3D Multi-class Segmentation of Whole Abdominal Lesions Dataset [41.7] 我々は,全腹部病変データセットの最初の3次元マルチクラスであるMSWALを紹介する。
MSWALは、胆石、腎臓石、肝腫瘍、腎臓腫瘍、膵癌、肝嚢胞、腎臓嚢胞など、様々な一般的な病変のカバー範囲を広げている。
Inception nnU-Netは、インセプションモジュールとnnU-Netアーキテクチャを効果的に統合し、異なるフィールドから情報を抽出する新しいセグメンテーションフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:31:25 GMT)
Progressive Human Motion Generation Based on Text and Few Motion Frames [41.0] Text-Frame-to-Motion (TF2M) の生成タスクは、テキストから動きを生成することを目的としており、与えられたフレームはほとんどない。
本稿では,不確実性の低いフレームから動きを段階的に生成する新しいプログレッシブモーション生成法を提案する。
我々のPMGは、既存のT2M生成方法よりも、1フレームでも大きなマージンで優れています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:45:06 GMT)
Prof. Robot: Differentiable Robot Rendering Without Static and Self-Collisions [40.2] 本稿では, ロボット衝突分類器の学習を通じて, 衝突に対する身体的意識を組み込むことにより, これまでの取り組みに新たな改善を加える。
これにより、ロボット自体と同様に、静的で非操作可能な環境との衝突を避けるアクションの最適化が可能になる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:17:10 GMT)
Redefining <Creative> in Dictionary: Towards an Enhanced Semantic Understanding of Creative Generation [39.9] Creative'' は人間と拡散モデルの両方にとって本質的に抽象的な概念である。
現在の手法は、創造的な効果を達成するために参照プロンプトやイメージに大きく依存している。
CreTokを紹介します。これは、新しいトークンであるtexttCreTok>として、創造性を再定義することで、拡散モデルにメタ創造性をもたらすものです。
コードはhttps://github.com/fu-feng/CreTok.comで公開される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:33:07 GMT)
Cross-Domain Knowledge Transfer for Underwater Acoustic Classification Using Pre-trained Models [39.9] 本研究では,事前学習型Audio Neural Networks(PANNs)とImageNet事前学習型モデルを比較した。
また, 受動的ソナー分類において, ImageNet事前学習モデルの方が若干優れていた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:33:19 GMT)
An Information Criterion for Controlled Disentanglement of Multimodal Data [39.6] マルチモーダル表現学習は、複数のモーダルに固有の情報を関連付けて分解しようとする。
Disentangled Self-Supervised Learning (DisentangledSSL)は、非角表現を学習するための新しい自己教師型アプローチである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:27:27 GMT)
3DAxisPrompt: Promoting the 3D Grounding and Reasoning in GPT-4o [39.5] 本稿では3DAxisPromptと呼ばれる新しい視覚的プロンプト手法を導入し,実写シーンにおけるMLLMの3次元理解能力を実現する。
MLLMは3DAxisPromptの助けを借りて、現実のシナリオにおける物体の3D位置を効果的に知覚できることを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:57:05 GMT)
AG-VPReID: A Challenging Large-Scale Benchmark for Aerial-Ground Video-based Person Re-Identification [39.4] 我々は,地上ビデオに基づく人物識別(ReID)のための大規模データセット AG-VPReID を紹介する。
このデータセットは6,632人の被験者、32,321のトラックレット、960万フレーム以上をドローン(高度15-120m)、CCTV、ウェアラブルカメラで捉えている。
本稿では,3つの補完ストリームからなるエンドツーエンドフレームワーク AG-VPReID-Net を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:07:25 GMT)
SparseAlign: A Fully Sparse Framework for Cooperative Object Detection [39.0] 完全スパースフレームワークであるSparseAlignを、拡張されたスパース3Dバックボーン、クエリベースの時間文脈学習モジュール、スパース機能に特化された堅牢な検出ヘッドの3つの主要な特徴で設計する。
我々のフレームワークは、その拡張性にも拘わらず、通信帯域幅の少ない技術よりも優れています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:38:53 GMT)
From Zero to Detail: Deconstructing Ultra-High-Definition Image Restoration from Progressive Spectral Perspective [38.9] ERRは、ゼロ周波増幅器(ZFE)、低周波復元器(LFR)、高周波精製器(HFR)の3つの共同サブネットワークからなる。
具体的には、ZFEはグローバルな事前情報を統合してグローバルマッピングを学習し、LFRは低周波情報を復元し、粗い内容の再構成を強調する。
HFRは、我々の設計した周波数窓付きコルモゴロフアーノルドネットワーク(FW-KAN)を用いてテクスチャやディテールを洗練し、高品質な画像復元を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:39:51 GMT)
Code-Driven Inductive Synthesis: Enhancing Reasoning Abilities of Large Language Models with Sequences [38.8] 大規模言語モデルにおける帰納的推論について検討する。
帰納的推論データのソースとして数列を用いる。
シーケンス合成データパイプラインを構築し、トレーニングデータセットCodeSeqを作成します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:33:26 GMT)
Top General Performance = Top Domain Performance? DomainCodeBench: A Multi-domain Code Generation Benchmark [38.1] DomainCodeBenchは、12のソフトウェアアプリケーションドメインと15のプログラミング言語にわたる大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
トップ・ジェネラル・ドメイン・モデルは特定のアプリケーション・ドメインで一貫して排他的でないことが分かりました。
ドメイン固有の知識による拡張プロンプトは、パフォーマンスを約38.17%向上させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:13 GMT)
Investigation of Time-Frequency Feature Combinations with Histogram Layer Time Delay Neural Networks [38.0] 音声信号を時間周波数表現に変換する手法は、性能に大きな影響を及ぼす。
この研究は、ヒストグラム層時間遅延ニューラルネットワークにおいて、異なる時間周波数特徴の組み合わせを使用することによる性能への影響を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:21:40 GMT)
HiDe-LLaVA: Hierarchical Decoupling for Continual Instruction Tuning of Multimodal Large Language Model [37.9] MLLM(Multimodal Large Language Model)の改良には,インストラクションチューニングが広く用いられている。
現実のシナリオで可能なすべての命令データセットを同時に収集することは不可能である。
本稿では,CKA(Centered Kernel Alignment)の類似性に基づくタスク固有拡張およびタスク一般融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:56:03 GMT)
GIFT: Generated Indoor video frames for Texture-less point tracking [37.8] 本研究では,3次元物体のテクスチャ強度を評価する指標を提案する。
GIFTは、1800の屋内ビデオシーケンスとリッチアノテーションからなる、難しい合成ベンチマークである。
グラウンド真理点を任意に割り当てる既存のデータセットとは異なり、GIFTは分類された対象オブジェクトにグラウンド真理を正確に固定する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:58:33 GMT)
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering [37.5] ニューラルネットワークや3次元ガウスアンを使わずに,適応的なスパースボクセル上での合成プロセスを組み込んだ効率的な放射場描画アルゴリズムを提案する。
提案手法は,従来の神経フリーなボクセルモデルを4dbPSNR以上と10倍FPS以上のスピードアップにより改善する。
我々のボクセル表現は、ボリュームフュージョンやVoxel Pooling、マーチングキューブといったグリッドベースの3D処理技術とシームレスに互換性がある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:23:56 GMT)
Do you understand epistemic uncertainty? Think again! Rigorous frequentist epistemic uncertainty estimation in regression [37.4] 我々は、初期出力を追加入力として返送することで条件予測を生成するモデルを訓練する。
本手法は,モデルの先行回答に条件付けされた場合の予測応答の変化を観察することにより,モデル不確かさの厳密な測定を可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:54:57 GMT)
Unlearning or Obfuscating? Jogging the Memory of Unlearned LLMs via Benign Relearning [37.1] LLMにおけるアンラーニングに対する既存のアプローチは、単純な$textitbenign再ラーニング攻撃の影響を受けやすいことを示す。
小さく、潜在的にゆるやかに関連付けられたデータのみにアクセスすることで、未学習モデルのメモリを'ジョグ'して、未学習の影響を逆転させることができることが分かりました。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:46:49 GMT)
Multi-modal Time Series Analysis: A Tutorial and Survey [36.9] マルチモーダル時系列分析はデータマイニングにおいて顕著な研究領域となっている。
しかし、マルチモーダル時系列の効果的な解析は、データの不均一性、モダリティギャップ、不整合、固有ノイズによって妨げられる。
マルチモーダル時系列法の最近の進歩は、クロスモーダル相互作用を通じて、マルチモーダルコンテキストを利用した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:30:02 GMT)
Frame-wise Conditioning Adaptation for Fine-Tuning Diffusion Models in Text-to-Video Prediction [36.8] テキストビデオ予測(英: text-video prediction、TVP)は、後続のビデオフレームを生成するモデルを必要とする下流のビデオ生成タスクである。
フレームワイドコンディショニング適応 (FCA) をラベル付けした適応型戦略を提案する。
我々は、初期フレームを余剰条件として組み込んだT2Vモデルを微調整するためにFCAを使用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:06:21 GMT)
DietGlance: Dietary Monitoring and Personalized Analysis at a Glance with Knowledge-Empowered AI Assistant [36.8] 本稿では,日常の食生活を自動的に監視し,知識ソースからパーソナライズされた分析を行うシステムであるDietGlanceを紹介する。
DietGlanceはまず、眼鏡を使ってマルチモーダル入力から摂取エピソードを検出し、消費されているさまざまな料理のプライバシー保護食の画像をキャプチャする。
推定食品とこれらの画像からの消費量に基づいて、栄養分析とパーソナライズされた食生活の提案も提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:13:54 GMT)
Beyond Role-Based Surgical Domain Modeling: Generalizable Re-Identification in the Operating Room [36.7] 本稿では,各チームメンバーの独特の動きパターンと身体的特徴を特徴付ける,スタッフ中心のモデリング手法を提案する。
我々は3次元点雲の列を符号化して形状と各個人固有の動きパターンを抽出する一般化可能な再同定フレームワークを開発した。
本手法は, 現実的な臨床データに対して86.19%の精度を達成し, 異なる環境間での移動時の75.27%の精度を維持した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:30:26 GMT)
The Disagreement Problem in Explainable Machine Learning: A Practitioner's Perspective [36.4] 説明可能な機械学習における不一致問題について検討する。
まずデータサイエンティストにインタビューを行い、説明の相違点を理解する。
そして、このフレームワークを利用して、4つの実世界のデータセットで厳密な経験分析を行います。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:00:52 GMT)
Crab: A Unified Audio-Visual Scene Understanding Model with Explicit Cooperation [36.4] 本研究では,データとモデルの両方の観点から,明示的なタスク間協調を実現する統一学習手法を提案する。
提案手法は,複数のタスクにおける既存の統合音声-視覚モデルを上回るだけでなく,特定のタスクにおいて,最も特殊なモデルよりも優れる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:19:03 GMT)
The Narrow Gate: Localized Image-Text Communication in Vision-Language Models [36.3] 本研究では,視覚言語モデルが画像理解タスクをどのように扱うかを検討する。
マルチモーダルな出力を持つモデルでは、画像とテキストの埋め込みは残留ストリーム内でより分離される。
対照的に、画像生成とテキスト生成のために訓練されたモデルは、視覚情報の狭いゲートとして機能する単一のトークンに依存する傾向がある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:59:29 GMT)
Do Vision Models Develop Human-Like Progressive Difficulty Understanding? [36.3] 我々は,これらのモデルがそのパターンに従うかどうかを,画像分類と研究の課題として検討する。
我々はGREに似た適応テストを作成し、現在の画像のラウンドにおけるモデルの性能が次のラウンドでテスト画像を決定する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:02:53 GMT)
Concept-as-Tree: Synthetic Data is All You Need for VLM Personalization [34.6] コンセプト・アズ・トレー(CaT)は木構造としての概念を表し、正と負のサンプルのデータ生成を可能にする。
十分に設計されたデータフィルタリング戦略により、当社のCaTフレームワークは、生成されたデータの品質を保証できます。
この研究は、VLMパーソナライズのための制御可能な初めての合成データパイプラインである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:55:01 GMT)
PAUSE: Low-Latency and Privacy-Aware Active User Selection for Federated Learning [34.4] フェデレートラーニング(FL)は、エッジデバイスが、潜在的にプライベートなデータを共有することなく、機械学習モデルを協調的にトレーニングすることを可能にする。
FLには2つの重要な課題がある。第一に、時間とともにプライバシーの漏洩が蓄積され、第二に、通信のレイテンシである。
本稿では,アクティブユーザ選択によるプライバシー漏洩と通信遅延の蓄積を共同で解決する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:50:35 GMT)
Video Depth without Video Models [34.1] ビデオ深度推定は、各フレームに濃密な深度を推定することにより、単眼のビデオクリップを3Dに引き上げる。
単一画像潜在拡散モデル(LDM)を最先端のビデオ深度推定器にする方法を示す。
このモデルはRollingDepthと呼ばれ、(i)シングルイメージのLCMから派生したマルチフレーム深度推定器と、非常に短いビデオスニペットを深度スニペットにマッピングする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:43:52 GMT)
MonoCT: Overcoming Monocular 3D Detection Domain Shift with Consistent Teacher Models [33.9] 我々は,自己監督のための高精度な擬似ラベルを生成する,新しい教師なしドメイン適応手法,MonoCTを導入する。
6つのベンチマークの実験において、MonoCTは既存のSOTAドメイン適応法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:59:41 GMT)
Demonstration of a Tunable Non-Hermitian Nonlinear Microwave Dimer [33.7] 位相非相反ホッピングダイナミクスを正確に実装するために,波長可変で非エルミタン,非線形マイクロ波ダイマーを導入する。
我々の結果は、センシングや合成フォトニック材料からニューロモルフィックコンピューティングや量子ネットワークまで、様々な分野に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:49:19 GMT)
INPROVF: Leveraging Large Language Models to Repair High-level Robot Controllers from Assumption Violations [33.7] INPROVFは、大型言語モデル(LLM)と高レベルのロボットコントローラの修理プロセスを高速化するフォーマルな手法を組み合わせた自動フレームワークである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:08:36 GMT)
SNPL: Simultaneous Policy Learning and Evaluation for Safe Multi-Objective Policy Improvement [33.6] 効果的なデジタル介入を設計するために、実験者はオフラインデータを用いて複数の目的をバランスさせる決定ポリシーを学ぶという課題に直面している。
信頼できるレコメンデーションを提供するためには、実験者は目標とガードレールの結果の望ましい変化を満たすポリシーを識別するだけでなく、これらのポリシーが引き起こす変化に関する確率的保証を提供する必要がある。
本稿では,これらの課題に対処するために,アルゴリズム安定性の概念を活用する新しいアプローチであるSNPL(Safe Noisy Policy Learning)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:53:53 GMT)
Measuring In-Context Computation Complexity via Hidden State Prediction [33.5] ニューラルネットワークモデルが将来の隠れ状態を予測する能力は、タスクの直感的な面白さと相関していることを示す。
本稿では,各ステップで得られた新しい情報を測定するための,新しい学習予測手法を提案する。
提案手法は, 文脈内で学習した形式言語の記述長, 数学的推論問題の複雑さ, 自己生成推論連鎖の正確性を予測する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:56:14 GMT)
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning [33.4] VideoMindは、ビデオ理解のための新しいビデオ言語エージェントである。
ビデオの時間的推論に不可欠な機能を特定し,ロールベースのエージェントワークフローを開発する。
軽量なLoRAアダプタによるシームレスなロールスイッチングを実現する新しいChain-of-LoRA戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:33 GMT)
Improving Complex Reasoning with Dynamic Prompt Corruption: A soft prompt Optimization Approach [33.3] 複雑な推論タスクにおいてソフトプロンプトをうまく活用するために,textbfDynamic textbfPrompt textbfCorruption (DPC) という新しい手法を提案する。
まず、Dynamic Triggerはソフトプロンプトの影響を測定し、有益か有害かを特定する。
次に、動的破壊は、推論プロセスに干渉するキートークンを選択的にマスキングすることにより、ソフトプロンプトの負の効果を緩和する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:20:48 GMT)
IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning [33.2] Segment Anything Model (SAM) は例外的な一般化とゼロショット機能を示した。
我々はSAMに基づくIMDPrompterと呼ばれるクロスビュープロンプト学習パラダイムを開発した。
IMDPrompterは手動によるガイダンスに依存しなくなり、自動検出とローカライゼーションが可能になった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:53:55 GMT)
MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning [33.1] 合成ゼロショット学習(CZSL)は、合成から意味的プリミティブ(属性とオブジェクト)を学ぶことを目的としている。
我々は,22,838の画像と17,627の合成を包括的および代表的属性アノテーションで包含する多属性合成データセットを提案する。
MACに基づいて,より深い意味理解と高度な属性関連を必要とする多属性合成ゼロショット学習を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:51:43 GMT)
Semi-Supervised Teacher-Reference-Student Architecture for Action Quality Assessment [33.0] アクション品質評価(AQA)手法は、完全に教師付き学習のための大量のラベルアノテーションを必要とすることが多い。
本稿では,大量のラベルのないデータを活用することで,AQAタスクのより良い評価に利用できる新しい半教師付き手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:12:47 GMT)
Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings [32.8] 我々は、異なる人間のテンプレート間でモデルを識別できるスキルベースのベンチマークを導入する。
4つのテンプレートと4つのT2Iモデルにまたがって人間の評価を収集し、合計100Kのアノテーションを作成します。
既存の指標よりも人間の評価と相関した新しいQAベースの自動評価指標を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:53:14 GMT)
DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models [32.7] FLUXモデル上に構築されたトレーニング不要のアプローチであるDreamRendererを紹介します。
DreamRendererでは、バウンディングボックスやマスクを通じて各インスタンスのコンテンツを制御することができる。
1)Hard Text Attribute BindingのためのBridge Image Tokens – 複製された画像トークンをブリッジトークンとして使用することで,テキストデータのみに事前トレーニングされたT5テキストの埋め込みが,ジョイントアテンション中の各インスタンスの適切な視覚属性をバインドする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:30:16 GMT)
CoDet-M4: Detecting Machine-Generated Code in Multi-Lingual, Multi-Generator and Multi-Domain Settings [32.7] 大規模言語モデル(LLM)はコード生成に革命をもたらし、プログラミングを驚くほどの効率で自動化した。
これらの進歩はプログラミングのスキル、倫理、評価の整合性に挑戦し、説明責任と標準を維持するのに欠かせないLCM生成コードを検出する。
複数のプログラミング言語、コードジェネレータ、ドメインにまたがる人間とLLMで書かれたコードを区別できるフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:41:37 GMT)
SyncDiff: Diffusion-based Talking Head Synthesis with Bottlenecked Temporal Visual Prior for Improved Synchronization [32.2] トーキングヘッド合成(トーキングヘッドシンセシス)は、与えられた音声トラックと一致する顔の動きを再構成する。
近年の研究では, この課題に対して, GANベースおよび拡散ベースモデルによりSOTA(State-of-the-art)性能が達成されている。
本稿では,情報ボトルネックとAVHuBERTから抽出した顔インフォーマティブ音声特徴を有する時間的ポーズフレームを用いて,拡散モデルを改善するための簡易かつ効果的なSyncDiffを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:58:53 GMT)
A Semantic-based Optimization Approach for Repairing LLMs: Case Study on Code Generation [32.2] ulAnalytical ulRepair(textscSTAR)に対するulSemantic ulTargetingを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:59:42 GMT)
The Silent Assistant: NoiseQuery as Implicit Guidance for Goal-Driven Image Generation [31.6] 本稿では,テキストプロンプトなどの明示的なユーザ定義入力を補完する暗黙のガイダンスとして,一致したガウスノイズを活用することを提案する。
NoiseQueryはきめ細かい制御を可能にし、ハイレベルなセマンティクスや低レベルなビジュアル属性よりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:01:35 GMT)
Entropic Matching for Expectation Propagation of Markov Jump Processes [31.4] 我々はマルコフジャンププロセスのための新しい、引き込み可能な潜在推論スキームを提案する。
我々のアプローチは、よく知られた予測伝搬アルゴリズムに組み込むことができるエントロピーマッチングフレームワークに基づいている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:52:50 GMT)
MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Portrait Few-Step Synthesis [31.2] 本稿では,バニラDMDにおけるトレーニングメモリ不足問題とトレーニング崩壊問題の両方を軽減するために,W2SVD(Weak-to-Strong Video Distillation)を提案する。
実験的に示されたように、W2SVD は標準の Euler, LCM, DMD を超え、1/4ステップのビデオ合成において FID/FVD と VBench の 28 ステップ標準サンプリングも上回っている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:58:27 GMT)
Iterative Predictor-Critic Code Decoding for Real-World Image Dehazing [30.8] IPC-Dehaze と略して、実世界の画像デハジングのための新しい反復予測-臨界符号デコーディングフレームワークを提案する。
提案手法では,前回のイテレーションで得られた高品質なコードを用いて,その後のイテレーションにおけるコード予測器の予測を導く。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:18:35 GMT)
Learning from Imperfect Demonstrations with Self-Supervision for Robotic Manipulation [30.8] 現在の模倣学習(IL)は通常不完全なデータを破棄し、成功した専門家データにのみ焦点をあてる。
本稿では、専門家と不完全なデータを組み合わせた自己監督データフィルタリングフレームワーク(SSDF)を導入し、故障したトラジェクトリセグメントの品質スコアを計算する。
SSDFは、高品質な不完全なデータでトレーニングデータセットを正確に拡張し、すべてのロボット操作タスクの成功率を改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:17:11 GMT)
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration [30.8] LVLM(Large Vision-Language Models)は、視覚的理解と言語生成の融合において大きな進歩を遂げている。
この成功にもかかわらず、LVLMのトレーニングデータは、データ分布が極めて不均衡であるLong-Tail (LT)問題に悩まされている。
DSの段階では,Denoising Diffusion Probabilistic Models(DDPM)と不足した画像を利用して,表現不足の部分を補う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:01:09 GMT)
RGBAvatar: Reduced Gaussian Blendshapes for Online Modeling of Head Avatars [30.6] 本報告では,RGBアバター (Reduceed Gaussian Blendshapes Avatar, RGBAvatar, RGBAvatar, RGBAvatar) を用いて, 頭部アバターをオンザフライで再現するのに十分な速度で再構築する方法を提案する。
提案手法は, 3次元MMパラメータを, 合成により縮小したブレンドシェープ重みにマッピングし, コンパクトなブレンドシェープ基底に導いた。
本研究では,オフライン設定に匹敵する品質を確保しつつ,リアルタイムに映像ストリームとして画像を再構築し,直接オンザフライで再現できるローカル・グローバル・サンプリング・ストラテジーを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:31:21 GMT)
Video-Guided Foley Sound Generation with Multimodal Controls [30.5] MultiFoleyは、ビデオ誘導音声生成用に設計されたモデルである。
テキスト、オーディオ、ビデオによるマルチモーダルコンディショニングをサポートする。
私たちのモデルの重要な新規性は、低音質のインターネットビデオデータセットを共同でトレーニングすることにあります。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:44:37 GMT)
Unlock Pose Diversity: Accurate and Efficient Implicit Keypoint-based Spatiotemporal Diffusion for Audio-driven Talking Portrait [30.5] 教師なし暗黙的3D鍵点と時間拡散モデルを組み合わせた最初のフレームワークであるKDTalkerを提案する。
KDTalkerは顔情報密度に適応し、様々な頭部ポーズをモデル化し、柔軟に顔の詳細をキャプチャする拡散プロセスを可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:18:31 GMT)
Matching Skeleton-based Activity Representations with Heterogeneous Signals for HAR [30.4] SKELARは骨格データから活動表現を事前訓練し、それらを異種HAR信号とマッチングする新しいフレームワークである。
SKELARは、フルショットと少数ショットの両方で最先端のパフォーマンスを達成する。
また,SKELARは合成骨格データを効果的に活用して,骨格収集を伴わないシナリオでの利用を拡張できることも実証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:43:06 GMT)
Multi-Granularity Class Prototype Topology Distillation for Class-Incremental Source-Free Unsupervised Domain Adaptation [29.6] クラスインクリメンタルソースフリーの非教師なしドメイン適応問題には2つの課題がある。
本稿では,GROTOアルゴリズムを提案する。GROTOアルゴリズムは,ソース知識をクラス増分対象領域に効果的に転送する。
提案手法は,3つの公開データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:35:16 GMT)
Enhancing LLM Reasoning with Iterative DPO: A Comprehensive Empirical Investigation [29.6] DPO(Direct Preference Optimization)は、大規模言語モデル(LLM)のための強化学習(RL)に代わる費用効率の良い代替手段である。
粗いフィルタ付き1ラウンドのDPOが数学的推論性能を大幅に向上させることを示す。
単純な検証可能な報奨により,計算オーバーヘッドを大幅に低減したRLレベルの性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:28:25 GMT)
DLPO: Towards a Robust, Efficient, and Generalizable Prompt Optimization Framework from a Deep-Learning Perspective [29.5] 大規模言語モデル(LLM)は、よく設計されたプロンプトによって、様々なタスクで顕著に成功している。
最近の研究では、自動的なプロンプト最適化を有望な解決策として検討している。
これらの努力にもかかわらず、既存の手法は、堅牢性、効率性、一般化において重要な課題に直面している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:42:51 GMT)
Swiss Army Knife: Synergizing Biases in Knowledge from Vision Foundation Models for Multi-Task Learning [29.3] ビジョン・ファンデーション・モデル (VFM) は、多くの下流タスクにおいて卓越した性能を示した。
それら固有の表現バイアスのため、VFMは異なる視覚タスクにまたがる利点と欠点を示す。
本稿では,VFM 委員会からの知識を適応的に蒸留し,マルチタスク学習を強化する,新規で汎用性の高い "Swiss Army Knife" (SAK) ソリューションを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:47:41 GMT)
Low-loss Nb on Si superconducting resonators from a dual-use spintronics deposition chamber and with acid-free post-processing [29.2] 磁気不純物は超伝導を劣化させることが知られている。
これまで磁性材料に用いられてきた物理的蒸着室は超伝導共振器の製造に利用できる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:37:37 GMT)
Population Transformer: Learning Population-level Representations of Neural Activity [29.2] 本稿では,大規模なニューラル記録の任意のアンサンブルのための集団レベルの符号を学習する自己教師型フレームワークを提案する。
我々は、ニューラルネットワークの時系列データ、すなわち、被験者とデータセット間のスパースと可変電極分布でモデルをスケーリングする際の重要な課題に対処する。
マルチチャネルの頭蓋内データの復号化と解釈性を改善するために,事前訓練したPopTもリリースしています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:10 GMT)
Towards Zero-Shot Anomaly Detection and Reasoning with Multimodal Large Language Models [29.1] Zero-Shot Anomaly Detection (ZSAD)はADパラダイムである。
本稿では,ZSAD と推論のための視覚アシスタントである Anomaly-OneVision (Anomaly-OV) を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:11:04 GMT)
Learning Visual Hierarchies in Hyperbolic Space for Image Retrieval [28.4] ユーザ定義のマルチレベル複雑な視覚階層を,明示的な階層ラベルを必要とせずに,双曲空間にエンコードする学習パラダイムを導入する。
実験により,階層的検索タスクの大幅な改善が示され,視覚的階層を捉える上でのモデルの有効性が示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:13:45 GMT)
Lifting the Veil on Visual Information Flow in MLLMs: Unlocking Pathways to Faster Inference [28.2] マルチモーダル大規模言語モデル(MLLM)は、事前訓練された視覚エンコーダの視覚的特徴を大規模言語モデルに統合することにより、視覚言語タスクの性能を向上させる。
MLLMがどのように処理し、どのように視覚情報を利用するかは、まだ不明である。
階層型モダリティ・アウェア・プルーニング(HiMAP, Hierarchical Modality-Aware Pruning)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:31:23 GMT)
ClearSight: Visual Signal Enhancement for Object Hallucination Mitigation in Multimodal Large language Models [28.2] マルチモーダル大言語モデル(MLLM)におけるオブジェクト幻覚を軽減するために、コントラストデコーディング戦略が広く用いられている。
モデル中層における視覚信号に注意を向けるプラグイン・アンド・プレイ技術であるVisual Amplification Fusion (VAF)を提案する。
VAFは、生成された出力のコヒーレンスと精度を維持しながら、推論速度に影響を与えることなく、様々なMLLMの幻覚を著しく低減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:30:40 GMT)
R3-Avatar: Record and Retrieve Temporal Codebook for Reconstructing Photorealistic Human Avatars [28.1] R3-アバターは、人間のアバターがアニマタブルで高忠実なレンダリング品質を持つことができないことを克服する。
我々は,新しいポーズの劣化を軽減しつつ,新しい視点から高忠実なレンダリングを実現する「レコーディ・リトリーブ・リコンストラクション」戦略を採用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:38:13 GMT)
Online Signature Verification based on the Lagrange formulation with 2D and 3D robotic models [28.0] 本稿では,オンライン署名のダイナミクスに基づく機能セットを提案する。
新たな特徴はラグランジュの定式化を通じて推測され、2次元および3次元ロボットアームモデルのための一般化座標とトルクのシーケンスを得る。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:56:43 GMT)
DehazeMamba: SAR-guided Optical Remote Sensing Image Dehazing with Adaptive State Space Model [27.8] DehazeMambaはプログレッシブ・ヘイズ・デカップリング・フュージョン・ストラテジー上に構築された新規なSAR誘導脱ヘイズ・ネットワークである。
提案手法は,光-SAR差分解析によるヘイズ影響領域を動的に同定するHPDMと,特徴量評価に基づく2段階融合プロセスによるドメインシフトを緩和するプログレッシブ・フュージョン・モジュール (PFM) である。
大規模な実験により、DehazeMambaは最先端の手法を著しく上回り、PSNRの0.73dB改善と下流タスクの大幅な強化を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:25:05 GMT)
SeeAction: Towards Reverse Engineering How-What-Where of HCI Actions from Screencasts for UI Automation [27.6] 本研究では,11個のコマンドと11個のウィジェットを認識可能なディープラーニングベースのコンピュータビジョンモデルを提案する。
7260のビデオアクションペアによる大規模なデータセットをラベル付けし、Word、Zoom、Firefox、Photoshop、Windows 10の設定とのインタラクションを記録します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:07:38 GMT)
AUTV: Creating Underwater Video Datasets with Pixel-wise Annotations [27.6] AUTVは,海洋ビデオデータをピクセル単位のアノテーションで合成するフレームワークである。
2つのビデオデータセットを構築することで、このフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:18:20 GMT)
Tensor Networks Meet Neural Networks: A Survey and Future Perspectives [27.6] テンソルニューラルネットワーク(TNN)とニューラルネットワーク(NN)は2つの基本的なデータモデリングアプローチである。
TNは指数的な数の次元を複雑さに変換することによって、大規模テンソルの次元性の呪いを解決する。
NNは、コンピュータビジョン、自然言語処理、ロボット工学の研究など、様々な応用において優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:33:59 GMT)
AVHBench: A Cross-Modal Hallucination Benchmark for Audio-Visual Large Language Models [27.4] AVHBenchは、音声視覚モデルの知覚と理解能力を評価するために設計された最初の総合的なベンチマークである。
以上の結果から,既存のLLMはモダリティ間の相互相互作用による幻覚に苦慮していることが明らかとなった。
AVHBenchを用いた簡単なトレーニングは幻覚に対する聴覚的LLMの堅牢性を向上させることを実証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:14:35 GMT)
Scale Efficient Training for Large Datasets [27.3] 低値サンプルを除去するために、SeTaはまずランダムプルーニングを行い、余剰サンプルを除去し、残りのサンプルを損失によって測定された学習困難に応じてクラスタ化する。
SeTaは、性能を維持したり改善したりしながら、トレーニングコストを最大50%削減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:13:43 GMT)
Harnessing Frequency Spectrum Insights for Image Copyright Protection Against Diffusion Models [26.8] 本稿では,拡散生成画像がトレーニングデータの統計的特性を忠実に保存していることを示す。
emphCoprGuardは、許可されていない画像の使用を防ぐための堅牢な周波数領域透かしフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:58:14 GMT)
3D Hierarchical Panoptic Segmentation in Real Orchard Environments Across Different Sensors [26.8] 本研究では, 異なるセンサから得られた3次元データに基づいて, リンゴ果樹の階層的パノプティックセグメンテーションの問題に対処する新しいアプローチを提案する。
本手法では, セマンティックセグメンテーション, 幹と果実のインスタンスセグメンテーション, 植物のインスタンスセグメンテーションを同時に行うことができる。
私たちのデータセットは、地上レーザースキャナーから、さまざまなロボットプラットフォームに搭載されたRGB-Dカメラまで、さまざまなセンサーを備えた本物のリンゴ果樹園のボンで記録されています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:59:20 GMT)
Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent Alignment [26.4] 音声-視覚的手がかりに基づく聴覚オブジェクトの正確な位置決めは、音声-視覚的セグメンテーションの中核的な目的である。
本稿では,AMAモジュールとUEモジュールの2つの主要コンポーネントを持つ新しいフレームワークを提案する。
AMAは、複数のグループ内で音声と視覚の相互作用を実行し、オーディオキューに対する応答性に基づいて、グループ機能をコンパクトな表現に集約する。
UEは空間情報と時間情報を統合し、音状態の頻繁な変化に起因する高不確かさ領域を識別する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:48:22 GMT)
Dynamic Derivation and Elimination: Audio Visual Segmentation with Enhanced Audio Semantics [26.4] 本稿では,動的導出・除去(DDESeg: Dynamic Derivation and Elimination)を提案する。
DDESegは、特徴混乱を軽減するため、混合音声信号の意味内容を再構成する。
マッチングの難しさを軽減するために,識別的特徴学習モジュールを導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:38:05 GMT)
Agents Play Thousands of 3D Video Games [26.3] 我々は、何千もの3Dビデオゲームをプレイできる人工知能エージェントを開発するための新しいフレームワーク、Portalを提示する。
意思決定問題を言語モデリングタスクに変換することで,大規模言語モデル(LLM)を利用して行動木を生成する。
当社のフレームワークでは,ルールベースのノードとニューラルネットワークコンポーネントを組み合わせたハイブリッドポリシ構造を導入し,高レベルの戦略的推論と高精度な低レベル制御を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:42:34 GMT)
MAP: Evaluation and Multi-Agent Enhancement of Large Language Models for Inpatient Pathways [26.0] 入院経路は包括的患者情報に基づく複雑な臨床診断を必要とする。
3つの臨床薬品を併用した多段階入院経路(MAP)フレームワークを提案する。
LLM HuatuoGPT2-13Bと比較して診断精度は25.10%向上した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:14:28 GMT)
ChainHOI: Joint-based Kinematic Chain Modeling for Human-Object Interaction Generation [25.8] ChainHOIはテキスト駆動型ヒューマンオブジェクトインタラクション生成の新しいアプローチである。
結合鎖と運動鎖の両方のレベルでの相互作用を明示的にモデル化する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:55:34 GMT)
3D Human Interaction Generation: A Survey [25.7] 3Dヒューマンインタラクション生成は、人間と対話的な実体の間の動的かつ文脈的に関連する相互作用を生成することに焦点を当てる。
近年,3次元モデル表現法,モーションキャプチャ技術,生成モデルが発展し,この分野への関心が高まっている。
この領域の急速な進歩にもかかわらず、人間の運動生成における自然性の必要性と人間と対話的な実体との正確な相互作用が課題である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:47:33 GMT)
Forget Vectors at Play: Universal Input Perturbations Driving Machine Unlearning in Image Classification [25.7] マシン・アンラーニング(MU)は、既に訓練されたモデルから不要な特定のデータの影響を消そうとする。
本研究では,新しい入力ベースの観点からMU問題にアプローチする。
我々は,能動的入力に基づく非学習戦略の存在を実演する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:46:48 GMT)
Rewards Are Enough for Fast Photo-Realistic Text-to-image Generation [25.3] 正規化報酬による新しい条件生成手法であるR0を導入する。
我々は、R0を用いて、最先端の数ステップのテキスト・ツー・イメージ生成モデルを訓練する。
本研究は,従来の拡散後学習と条件生成の知恵に挑戦するものである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:21:43 GMT)
Efficient Learning With Sine-Activated Low-rank Matrices [25.1] 低ランク分解過程に正弦波関数を統合する新しい理論枠組みを提案する。
提案手法は,視覚変換器(ViT),Large Language Models(LLMs),NeRF(Neural Radiance Fields),および3次元形状モデリング(3D shape modelling)において,既存の低ランクモデルに対するプラグインとして証明されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:11:01 GMT)
MoManipVLA: Transferring Vision-language-action Models for General Mobile Manipulation [24.7] 固定ベース操作のトレーニング済みVLAモデルをモバイル操作に転送するための,MoManipVLAという効率的なポリシー適応フレームワークを提案する。
具体的には、事前学習されたVLAモデルを用いて、高い一般化能力を持つエンドエフェクタのウェイポイントを生成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:52 GMT)
DivCon-NeRF: Generating Augmented Rays with Diversity and Consistency for Few-shot View Synthesis [24.6] 多様性と一貫性を両立させるDivCon-NeRFを提案する。
DivCon-NeRFは、内面拡大を導入することにより、様々な視点の角度と距離をランダム化する。
Blender, LLFF, DTUデータセット上での最先端性能を実現し, フローターと視覚歪みを大幅に低減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:59:34 GMT)
An Optimization Framework for Differentially Private Sparse Fine-Tuning [24.5] 差分的プライベート勾配降下(DP-SGD)は、差分プライバシー(DP)の下でのトレーニングおよび微調整ニューラルネットワークのゴールドスタンダードであると考えられている。
最近の研究によると、プライベートな微調整はモデルの重量のごく一部に過ぎず、残りの重量を固定し続けることで性能が向上する。
本研究では,DP下でのニューラルネットワークのスパース微調整のための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:05:05 GMT)
VasTSD: Learning 3D Vascular Tree-state Space Diffusion Model for Angiography Synthesis [24.5] 本研究では,3次元非血管造影ボリュームから血管造影を合成する3次元血管系木-状態空間拡散モデルであるVasTSDを提案する。
事前訓練された視覚埋め込み装置を用いて血管状態空間の表現を構築し、複数のモードにわたる血管構造の一貫したモデリングを可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:53:38 GMT)
Faithfulness of LLM Self-Explanations for Commonsense Tasks: Larger Is Better, and Instruction-Tuning Allows Trade-Offs but Not Pareto Dominance [24.1] 8家系62モデルを対象に包括的反実的忠実度分析を行った。
観察された忠実性の相違は、しばしば冗長性の説明に起因していると考えられる。
本分析では,命令チューニング,冗長性,およびモデル決定プロセスの忠実な表現とのニュアンスな関係を強調した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:39 GMT)
MoDec-GS: Global-to-Local Motion Decomposition and Temporal Interval Adjustment for Compact Dynamic 3D Gaussian Splatting [24.0] MoDecGSは、複雑な動きを伴う挑戦的なシナリオにおいて、新しいビューを再構築するためのメモリ効率のよいフレームワークである。
MoDecGSは、現実のダイナミックビデオから動的3Dガウスのための最先端の手法よりも平均70%のモデルサイズ削減を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:09:50 GMT)
Humanoid Policy ~ Human Policy [23.9] 人間行動変換器(HAT)と呼ばれる人-人-人-行動政策を訓練する。
HATのステートアクション空間は、人間とヒューマノイドロボットの両方に統一されており、ロボットのアクションに微分的に再ターゲットすることができる。
人間のデータは,HATの一般化と堅牢性の両方を改善し,データ収集効率を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:09 GMT)
VideoScan: Enabling Efficient Streaming Video Understanding via Frame-level Semantic Carriers [23.5] VideoScanは、リアルタイムビデオインタラクションのための効率的な視覚言語モデル(VLM)推論フレームワークである。
VideoScanでは、各フレームを表すために単一のセマンティックキャリアトークンを使用している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:09:39 GMT)
A Comprehensive Survey on Visual Concept Mining in Text-to-image Diffusion Models [23.5] 本稿では,既存の研究を,概念学習,概念消去,概念分解,概念結合の4つの重要な領域に分類する。
我々は、この重要かつ興味深い分野を前進させるために、重要な課題を特定し、今後の研究方向性を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:51:56 GMT)
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach [23.5] 本研究では,物理ロボットを用いた実環境におけるヌンペプソデスのナビゲーションエピソードに関する大規模実験を行った。
エンドツーエンドのトレーニングから生じる推論のタイプを分析します。
本稿では,エージェントが学習した値関数が長期計画に関連があることをポストホック分析で示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:35:32 GMT)
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding [23.0] 本稿では,視覚意味論理探索のパラダイムの下で選択を再構成する意味論的検索フレームワークを提案する。
提案手法は,キーフレーム選択の指標を手動でアノテートしたベンチマーク上で,新たなSOTA性能を確立する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:07:34 GMT)
ProDiF: Protecting Domain-Invariant Features to Secure Pre-Trained Models Against Extraction [23.0] *ProDiF**は、ターゲットの重量空間操作を利用して、抽出攻撃に対して事前訓練されたモデルを保護する新しいフレームワークである。
双方向最適化により、適応的な微調整攻撃に対するレジリエンスが保証される。
この研究は、事前訓練されたモデルに対する包括的保護を提供し、モデルセキュリティに対する新しいアプローチとして重量空間操作の可能性を強調している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:37:42 GMT)
Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering [22.9] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を大幅に向上させることが示されている。
我々は、音声理解と推論において、特に音声質問応答(AQA)タスクに焦点を当てた一連のRL探索を行う。
実験ではMMAU Test-miniベンチマークで最先端の性能を示し,64.5%の精度を実現した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:20:29 GMT)
Zero-Knowledge Proof-Based Consensus for Blockchain-Secured Federated Learning [22.9] フェデレートラーニング(FL)は、複数の参加者が共同で機械学習モデルをトレーニングすることを可能にする。
ほとんどのブロックチェーンでセキュアなFLシステムは、従来のコンセンサス機構に依存している。
本稿では,ZKPoT(Zero-Knowledge Proof of Training)の新たなコンセンサス機構を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:13:10 GMT)
On the Byzantine-Resilience of Distillation-Based Federated Learning [22.8] ビザンチン環境下でのフェデレートラーニング(FL)アルゴリズムの性能について検討した。
KDをベースとしたFLアルゴリズムは極めて弾力性があり、ビザンチンクライアントが学習プロセスにどのように影響するかを分析する。
KDに基づくFLアルゴリズムのビザンチンレジリエンスを向上させる新しい防御法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:08:19 GMT)
TriDF: Triplane-Accelerated Density Fields for Few-Shot Remote Sensing Novel View Synthesis [22.7] TriDFは、3つの入力ビューからの高速リモートセンシングNVSのための効率的なハイブリッド3D表現である。
本手法は,色と体積密度情報を分離し,計算負担を軽減するために独立にモデル化する。
複数のリモートセンシングシーンにわたる総合的な実験により、ハイブリッド表現が30倍の速度向上を達成することが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:25:39 GMT)
$φ$-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation [22.6] インタイム最適化は計算をスケールし、効果的なパフォーマンスのための意図的な推論ステップを導出する。
我々は、デコード戦略を事前サンプリングとして、シミュレーションされた将来のステップを利用して、大域的に最適なステップ推定を得る。
実験では、$phi$-Decodingはパフォーマンスと効率の両方において、強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:38:33 GMT)
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation [22.5] Infinite Mobilityは、手続き生成による高忠実度調音オブジェクトの新しい手法である。
我々の合成データは、生成モデルのトレーニングデータとして利用でき、次のステップのスケールアップを可能にします。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:53:56 GMT)
Island-Based Evolutionary Computation with Diverse Surrogates and Adaptive Knowledge Transfer for High-Dimensional Data-Driven Optimization [22.4] 本稿ではDSKT-DDEAというオフラインデータ駆動進化アルゴリズムを提案する。
我々のアルゴリズムは、1000次元の問題について最先端のDDEAと競合する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:35:59 GMT)
NVR: Vector Runahead on NPUs for Sparse Memory Access [22.3] スパースDNNワークロードにおけるキャッシュミス問題に対処するために,NPUに適したプリフェッチ機構であるNPU Vector Runahead(NVR)を提案する。
NVRは汎用プロセッサのSOTAプリフェッチに比べて平均90%のキャッシュミス削減を実現している。
評価の結果、16KBのキャッシュを拡張すれば、L2キャッシュサイズを同じ量に増やすよりもパフォーマンスが5倍向上することがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:31:46 GMT)
Convex Formulations for Training Two-Layer ReLU Neural Networks [21.9] 非層NPハード最適化問題は、機械学習モデルにとって不可欠である。
有限幅2つのニューラルネットワークで解ける半定緩和を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:56:35 GMT)
Nonconvex Stochastic Optimization under Heavy-Tailed Noises: Optimal Convergence without Gradient Clipping [21.9] 重み付き雑音下での最初の収束を提供するが、切断はしない。
また、テールインデックス$mathfrakp$が事前に不明な場合には、最初の$mathcalO(Tfrac1-mathfrakp3mathfrakp-2)$収束率も設定する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:23:21 GMT)
How Good is my Histopathology Vision-Language Foundation Model? A Holistic Benchmark [21.5] 組織学的視覚言語基礎モデル(VLM)は、下流の様々なタスクにまたがる性能と一般化性の向上により人気を博している。
既存の病理組織学のベンチマークのほとんどは、患者のデータプライバシーによる部分的な可用性だけでなく、臨床、臓器、取得機器の多様性の観点からも、一過性のものであるか制限されている。
HistoVLは、クラス名と多様な病理学的記述を組み込んだ、最大11種類の取得ツールとキャプションを用いて取得した画像からなる、完全にオープンソースな総合ベンチマークである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:45:22 GMT)
TFDM: Time-Variant Frequency-Based Point Cloud Diffusion with Mamba [20.9] 拡散モデルは現在、様々な生成タスクに対して印象的なパフォーマンスを示している。
画像拡散に関する最近の研究は,マンバ(状態空間モデル)の強みを強調している
本稿では,2つの遅延Mambaブロック(DM-Block)と時間変動周波数エンコーダ(TF-Encoder)を含む新しい拡散フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:00:14 GMT)
SafeSlice: Enabling SLA-Compliant O-RAN Slicing via Safe Deep Reinforcement Learning [20.3] 深部強化学習(DRL)に基づくスライシングポリシは、オープン無線アクセスネットワーク(O-RAN)などの物理システムにおいて課題に直面している。
これらのポリシーは、サービスレベル合意(SLA)の遵守を保証するための安全保証を欠いていることが多い。
我々は,O-RANスライスにおける累積(軌道方向)および瞬時(状態方向)の遅延制約に対処するSafeSliceを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:41:49 GMT)
Long-Video Audio Synthesis with Multi-Agent Collaboration [20.3] LVAS-Agentは、協調的な役割を通じてプロのダビングをエミュレートする新しいフレームワークである。
提案手法は,シーンセグメンテーション,スクリプト生成,音響設計,音声合成の4段階に分割する。
中心的なイノベーションには、シーン/スクリプトの洗練のための議論の補正機構や、時間-意味的アライメントのための世代-検索ループが含まれる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:48:37 GMT)
AutoEval: Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks [20.1] 本稿では,大規模言語モデル (LLM) 評価を形式的タスクに拡張するための新しいベンチマークである AutoEval を提案する。
AutoEvalは最初のベンチマークパラダイムであり、人間のラベルなしでLLMの客観的評価をスケールするのに必要ないくつかの重要な利点を提供している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:03:16 GMT)
TAPE: Tailored Posterior Difference for Auditing of Machine Unlearning [20.0] 本稿では,TAPE(TAilored Posterior diffErence)法を提案する。
TAPEは未学習の影モデルを素早く構築することで未学習の後方差を模倣する。
我々は、未学習後の違いのプライベート情報を抽出し、評価するために、リコンストラクタモデルを訓練する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:51:45 GMT)
Argument Summarization and its Evaluation in the Era of Large Language Models [19.9] 大規模言語モデル(LLM)は、Argument Summarization(ArgSum)を含む様々な自然言語生成(NLG)タスクに革命をもたらした。
本稿では,ArgSum への最先端 LLM の統合について検討し,その評価を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:25:48 GMT)
TinyR1-32B-Preview: Boosting Accuracy with Branch-Merge Distillation [19.9] 本稿では, モデル圧縮を2相で促進するブランチ・マージ蒸留法を提案する。
我々は,DeepSeek-R1を教師とし,DeepSeek-R1-Distill-Qwen-32Bを学生として蒸留アプローチを検証する。
合併したTinyR1-32B-Previewは、複数のベンチマークでDeepSeek-R1-Distill-Qwen-32Bを上回った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:36:30 GMT)
Does the Appearance of Autonomous Conversational Robots Affect User Spoken Behaviors in Real-World Conference Interactions? [19.9] 人型アンドロイド ERICA と人型でないヒューマノイド TELECO を比較した。
その結果,ERICAと対話する場合により複雑な構文を取り入れた。
我々は,ロボットがより構造化され,より流動的なユーザ音声を引き出すように設計することで,人間とのコミュニケーションの整合性を高めることができると結論付けた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:20:30 GMT)
PASTA: Part-Aware Sketch-to-3D Shape Generation with Text-Aligned Prior [19.6] PASTAは、ユーザスケッチと3D形状生成のためのテキスト記述をシームレスに統合する柔軟なアプローチである。
鍵となる考え方は、スケッチのセマンティック表現を強化するために、視覚言語モデルからのテキスト埋め込みを使用することである。
ISG-Netは、細かな詳細を処理するIndivGCNと、これらの詳細を部品に集約してオブジェクトの構造を洗練するPartGCNという2つのタイプのグラフ畳み込みネットワークを採用している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:31:09 GMT)
Enhancing Job Salary Prediction with Disentangled Composition Effect Modeling: A Neural Prototyping Approach [19.5] 雇用スキルが給与にどのような影響を及ぼすかを理解することは 競争力のある給与制度による採用の促進と 給与期待の調整に不可欠です
そこで本稿では,bftextLGDESetNet という,新しい説明可能なセットベースニューラルプロトタイピング手法を提案する。
本手法は,給与予測における現状ベースラインよりも優れた性能を実現するとともに,給与影響パターンに関する説明可能な洞察を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:36:07 GMT)
Learning to Inference Adaptively for Multimodal Large Language Models [19.5] AdaLLaVA(アダプティブ・推論・フレームワーク)を導入し,MLLM内での演算の再構成を学習する。
質問応答、推論、幻覚を含むベンチマークで実験を行う。
以上の結果から,AdaLLaVAは入力レイテンシの予算に効果的に準拠し,実行時の精度やレイテンシのトレードオフが変化することがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:35:28 GMT)
ShapeShifter: 3D Variations Using Multiscale and Sparse Point-Voxel Diffusion [19.3] 本稿では,単一参照モデルに基づいて形状変化を合成する新しい3次元生成モデルであるShapeShifterを提案する。
その結果, 従来のSDF法よりも, 入力の細部をより正確に把握し, より汎用的な表面形状を処理できることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:06:19 GMT)
Collapse or Thrive? Perils and Promises of Synthetic Data in a Self-Generating World [19.3] 生成機械学習モデルは、以前のモデルによって生成されたデータを含むWebスケールデータセットで事前訓練される。
先行研究の中には、ウェブが合成データに圧倒されているため、"モデル崩壊"を警告するものもある。
本稿では,3つの生成モデルタスクセットにまたがるデータ(トレーニング・ワークフロー)の3つの使い方について実験を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:14:46 GMT)
MoMa: A Modular Deep Learning Framework for Material Property Prediction [19.3] MoMaはModular framework for Materialsで、まず様々なタスクで特殊なモジュールを訓練し、その後、各下流シナリオに合わせた相乗的モジュールを適応的に構成する。
17のデータセットに対する評価は、最強のベースラインよりも14%の平均的な改善で、MoMaの優位性を示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:33:30 GMT)
Overview of the NTCIR-18 Automatic Evaluation of LLMs (AEOLLM) Task [18.8] 本稿では,タスクの背景,データセット,評価尺度,評価結果について述べる。
今年は4チームから48回実施した。本稿では,タスクの背景,データセット,評価尺度,評価結果について述べる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:42:34 GMT)
Can Reasoning Models Reason about Hardware? An Agentic HLS Perspective [18.8] OpenAI o3-mini と DeepSeek-R1 は Chain-of-Thought (CoT) を通じて推論を強化している
本稿では, LLM の推論が高レベル合成(HLS)設計空間探索と最適化の課題に対処できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:21:39 GMT)
Interpretable Unsupervised Joint Denoising and Enhancement for Real-World low-light Scenarios [18.6] 本稿では,現実のシナリオに適した,解釈可能でゼロ参照のジョイント denoising と低照度拡張フレームワークを提案する。
提案手法は,照明レベルと騒音レベルが異なるペアサブイメージに基づくトレーニング戦略を導出する。
バックボーンネットワークの設計において、暗黙の劣化表現機構によって導かれる網膜分解ネットワークを開発する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:08:52 GMT)
LAGA: Layered 3D Avatar Generation and Customization via Gaussian Splatting [18.6] LAGA(Layered Gaussian Avatar)は、多彩な衣服で高忠実で分解可能なアバターを作成できるフレームワークである。
衣料品をアバターから切り離すことで,アバターを衣服レベルで安定的に編集することを可能にする。
提案手法は, 従来の3次元衣料人体生成手法を超越した手法である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:12:15 GMT)
GuideDog: A Real-World Egocentric Multimodal Dataset for Blind and Low-Vision Accessibility-Aware Guidance [18.5] 視力低下と低視力(BLV)による世界22億人にとって、モビリティは依然として重要な課題である。
本稿では,22K画像記述ペアを含む新しいアクセシビリティ対応ガイドデータセットである GuideDogを紹介する。
また818個のサンプルのサブセットである GuideDogQA も開発した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:43:40 GMT)
GeoMask3D: Geometrically Informed Mask Selection for Self-Supervised Point Cloud Learning in 3D [18.3] ポイントクラウドのための自己教師型学習に先駆的なアプローチを導入する。
我々は、Masked Autosの効率を高めるためにGeoMask3D(GM3D)と呼ばれる幾何学的に情報を得たマスク選択戦略を採用した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:35:35 GMT)
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation [18.3] 我々は,意味的セグメンテーションモデルを事前学習することで特徴学習を強化するために,大規模雑音ラベル付きデータの可能性を探る。
従来の事前トレーニングアプローチとは異なり、CromSSは大量のノイズと簡単に得られるラベルを活用して、機能学習を改善している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:26:04 GMT)
Believing is Seeing: Unobserved Object Detection using Generative Models [17.9] 本研究では,2次元・2.5次元・3次元観測対象検出の新しい課題を紹介する。
我々は,この課題に対処するために,最先端の事前学習型生成モデルを適用した。
直接観察されていない物体の存在を推測するために使用できることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:56:24 GMT)
FiVE: A Fine-grained Video Editing Benchmark for Evaluating Emerging Diffusion and Rectified Flow Models [17.8] 本稿では,新たな拡散モデルと修正フローモデルを評価するための微細ビデオ編集ベンチマークFiVEを紹介する。
私たちのベンチマークには、74の現実世界のビデオと26の生成されたビデオが含まれており、6つのきめ細かい編集タイプ、420のオブジェクトレベルの編集プロンプトペア、およびそれに対応するマスクが含まれている。
本研究では, 背景保存, テキスト・ビデオの類似性, 時間的一貫性, 映像品質, ランタイムの5つの指標を用いて, 拡散に基づく5つの手法と2つのRFベースの編集手法をFiVEベンチマークで評価した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:47:41 GMT)
Other Vehicle Trajectories Are Also Needed: A Driving World Model Unifies Ego-Other Vehicle Trajectories in Video Latent Space [17.8] 本稿では,EOT-WMという駆動型世界モデルを提案する。
モデルは、自作の軌跡で見えない運転シーンを予測することもできる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:07:46 GMT)
Efficient Imitation Under Misspecification [17.7] 我々は,新たな構造条件,報酬に依存しないポリシ完全性を導入し,対話型ILアルゴリズムに十分であることを示す。
本稿では,対話型ILアルゴリズムのサンプル効率をさらに向上するために,オフラインデータの追加手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:35:55 GMT)
Efficient Multimodal 3D Object Detector via Instance-Level Contrastive Distillation [17.6] 提案したICDフレームワークとCLFM(Cross Linear Attention Fusion Module)を組み込んだ高速かつ効果的なマルチモーダル3Dオブジェクト検出器を提案する。
我々の3Dオブジェクト検出器は、より優れた効率を実現しつつ、最先端(SOTA)手法より優れています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:26:11 GMT)
Test-Time Domain Generalization via Universe Learning: A Multi-Graph Matching Approach for Medical Image Segmentation [17.5] テスト時間適応(TTA)は、未ラベルのテストデータを用いて学習モデルを調整する。
形態情報を導入し,マルチグラフマッチングに基づくフレームワークを提案する。
本手法は,2つの医用画像セグメンテーションベンチマークにおいて,他の最先端手法よりも優れている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:11:11 GMT)
Towards Efficient Mixture of Experts: A Holistic Study of Compression Techniques [17.4] 本稿では,Mixture of Expertsの圧縮技術に関する総合的研究を行い,効率性とスケーラビリティを両立させる。
我々は,全MoE層を除去するLayer Dropと,トランスフォーマーブロックを除去するBlock Dropを提案する。
また、個々の専門家を圧縮してパフォーマンスをさらに向上させ、Expert Trimmingとシームレスに統合できるExpert Slimmingを紹介します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:18:42 GMT)
Efficient Motion-Aware Video MLLM [17.4] 本稿では,圧縮されたビデオ構造を入力として利用する,効率的な動き認識ビデオMLLMであるEMAを紹介する。
本稿では,圧縮ビデオストリーム中のGOPユニット内の空間情報と動き情報を融合し,コンパクトで情報的な視覚トークンを生成する動き認識型GOPエンコーダを提案する。
また,4つの動作タイプにわたる動作理解を評価するベンチマークであるMotionBenchを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:20:05 GMT)
xLSTM 7B: A Recurrent LLM for Fast and Efficient Inference [17.3] 推論速度は、Large Language Models(LLM)の最も重要な特性の1つである。
我々は、xLSTMのアーキテクチャ上の利点と、高速で効率的な推論のためのターゲット最適化を組み合わせた7ビリオンパラメータLLMであるxLSTM 7Bを紹介する。
本研究は,xLSTM 7Bを高速かつ高効率な7B LLMとして確立し,大量のテスト時間計算を必要とするタスクに対するソリューションを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:54:55 GMT)
Timing the Match: A Deep Reinforcement Learning Approach for Ride-Hailing and Ride-Pooling Services [17.1] 本稿では、リアルタイムシステム条件に基づいていつマッチングを行うかを決定するために、深層強化学習(RL)を用いた適応型ライドマッチング戦略を提案する。
本手法は,システム状態の評価を継続的に行い,全乗客待ち時間を最小化するタイミングでマッチングを実行する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:07:58 GMT)
Mixed-granularity Implicit Representation for Continuous Hyperspectral Compressive Reconstruction [17.0] 本研究では,暗黙的ニューラル表現を用いた連続型ハイパースペクトル画像再構成法を提案する。
暗黙的な神経表現を活用することで、MGIRフレームワークは任意の望まれる空間スペクトル分解能の再構成を可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:37:42 GMT)
Align and Distill: Unifying and Improving Domain Adaptive Object Detection [16.9] ドメイン適応オブジェクト検出(DAOD)手法は近年,この問題に対処する上で大きな成果を上げている。
過去の結果を疑問視し、さらなる進歩を妨げるような、システムベンチマークの落とし穴を特定します。
ベンチマークと実装の統一フレームワークAlign and Distill(ALDI)を導入することで、これらの問題に対処する。
新しいベンチマークデータセットであるCFC-DAODは、さまざまな実世界のデータの評価を可能にし、(4)最先端の結果を大きなマージンで達成する新しいメソッドALDI++である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:18:16 GMT)
Finite Samples for Shallow Neural Networks [16.8] 本稿では, 様々な非線形活性化関数を持つ2層非既約浅層ネットワークを有限標本で同定する能力について検討する。
有限標本は任意の既約ReLU浅層ネットワークの同定に不十分であることを示す。
我々は,2層非既約浅層解析網の回復を可能にする有限サンプルを構築した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:24:31 GMT)
TraSCE: Trajectory Steering for Concept Erasure [16.8] テキスト・ツー・イメージ拡散モデルでは,NSFW(No-safe-for-work)画像のような有害なコンテンツを生成することが示されている。
本稿では, 拡散経路を有害な物質の発生から遠ざけるためのTraSCEを提案する。
提案手法は,有害なコンテンツを除去するための様々なベンチマークにおいて,最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:37:35 GMT)
Classifier-Free Guidance inside the Attraction Basin May Cause Memorization [16.8] 拡散モデルは、トレーニングデータから画像を正確に再現する傾向がある。
記憶された画像は、画質が高く、条件付け機構によく適合している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:50:58 GMT)
Federated Learning with Domain Shift Eraser [16.7] フェデレーテッド・ラーニング(FL)は、デバイスを離れることなくコラボレーティブ・ラーニングのための有望なテクニックとして浮上している。
本稿では,FDSE(Federated Domain Shift Eraser)という新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:10:31 GMT)
A Survey on Human Interaction Motion Generation [16.6] 人間は、他の人間、物体、環境との相互作用によって定義される世界に住む。
インタラクティブなムーブメントは、私たちの環境との関係を伝え、私たちが現実世界をどのように認識し、コミュニケーションしているかを実証します。
デジタルシステムにおけるこれらのインタラクションの動作を複製することは、ロボティクス、バーチャルリアリティ、アニメーションの応用において重要なトピックとして浮上している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:55:10 GMT)
Safeguarding LLM Embeddings in End-Cloud Collaboration via Entropy-Driven Perturbation [16.4] EntroGuardはエントロピー駆動の埋め込みプライバシー保護手法である。
エンドツーエンドのコラボレーションにおいて、検索精度を維持しながら、テキスト埋め込みのプライバシを保護することができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:58:05 GMT)
UniReg: Foundation Model for Controllable Medical Image Registration [16.2] 学習に基づく登録アプローチは、様々な臨床シナリオにおける一般化性に欠ける。
医用画像登録のための対話型基礎モデルである textbfUniReg を提案する。
我々の重要な革新は、条件付き変形場推定によって達成される多様な登録シナリオのための統一されたフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:55:01 GMT)
Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models [16.2] 人工知能(AI)技術の急速な進歩により、エッジと端末デバイスへのAIモデルの展開が増加している。
この調査は、オンデバイスAIモデルの現状、技術的な課題、今後のトレンドを包括的に調査する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:37:33 GMT)
Asynchronous Predictive Counterfactual Regret Minimization$^+$ Algorithm in Solving Extensive-Form Games [16.1] 予測的 CFR$+$ (PCFR$+$) は特に強力で、非常に高速な経験的収束率を達成する。
そこで我々は,ステップサイズの適応的非同期化を用いた新しい変種 Asynchronous PCFR$+$ (APCFR$+$) を提案する。
APCFR$+$がロバスト性を高める理由を理論的に示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:07:38 GMT)
WildSeg3D: Segment Any 3D Objects in the Wild from 2D Images [16.1] 多様な環境にまたがる任意の3Dオブジェクトのセグメンテーションを可能にする効率的なアプローチであるWildSeg3Dを紹介する。
このフィードフォワードアプローチの重要な課題は、複数の2次元ビューにまたがる3Dアライメントエラーの蓄積である。
また,リアルタイム対話型セグメンテーションのための動的グローバルアライニング(DGA)とマルチビューグループマッピング(MGM)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:30:29 GMT)
OptiPMB: Enhancing 3D Multi-Object Tracking with Optimized Poisson Multi-Bernoulli Filtering [16.0] 最適化されたPoisson Multi-Bernoulliフィルタを用いた新しい RFS ベースの 3D MOT 法であるOptiPMB を提案する。
OptiPMBは,最先端手法と比較して,トラッキング精度が優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:24:26 GMT)
Spiking Transformer:Introducing Accurate Addition-Only Spiking Self-Attention for Transformer [15.9] スパイキングニューラルネットワークは、従来のニューラルネットワークに代わる有望なエネルギー効率の代替として登場した。
本稿では,A$2$OS$2$Aの精度付加型スパイク自己注意について紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:17:00 GMT)
ThinkPatterns-21k: A Systematic Study on the Impact of Thinking Patterns in LLMs [15.8] モデル性能に対する様々な思考タイプの影響を包括的に分析する。
本稿では,21kの命令-応答対からなる学習データセットであるThinkPatterns-21kを紹介する。
1) より小さなモデル (30Bパラメータ) は構造化思考パターンの大部分の恩恵を受けられる一方で, 分解のような構造化思考を持つモデル (32B) は性能を低下させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:29:04 GMT)
Program Synthesis Dialog Agents for Interactive Decision-Making [15.8] 本研究では,インタラクティブな意思決定を通じて,社会的利益の機会に対するユーザの適性を決定するための新しいベンチマークであるBeNYfitsを提案する。
実験の結果, GPT-4o は ReAct-style chain-of- Thought を用いて35.7 F1 しか得点できなかった。
我々のエージェントであるProADAは、ほぼ同じ数のダイアログターンを維持しながら、F1スコアを55.6に改善します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:13:03 GMT)
A3E: Aligned and Augmented Adversarial Ensemble for Accurate, Robust and Privacy-Preserving EEG Decoding [15.6] EEGベースの脳コンピュータインタフェース(BCI)は、脳と外部デバイス間の直接通信を可能にする。
EEGベースのBCIは、データ不足と個人差、敵対的脆弱性、データプライバシという、現実世界のアプリケーションで少なくとも3つの大きな課題に直面しています。
EEGベースのBCIにおける3つの大きな課題が同時に対処できるのは今回が初めてであり、現実のBCIにおけるEEGデコーディングの実践性を大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:11:54 GMT)
VeriContaminated: Assessing LLM-Driven Verilog Coding for Data Contamination [15.5] 大規模言語モデル(LLM)はコード生成に革命をもたらし、様々な確立されたベンチマークフレームワークで例外的な結果を得た。
しかし、データ汚染に関する懸念は、これらの評価の有効性に関する疑問を提起する。
我々は、Verilogコード生成のための最先端(SOTA)評価フレームワークを解析する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:26:49 GMT)
Highly Efficient Direct Analytics on Semantic-aware Time Series Data Compression [15.1] 本稿では,SHRINK圧縮アルゴリズムにより圧縮された時系列データを直接解析する手法を提案する。
このアプローチは、さまざまなIoTアプリケーションに対して、信頼性が高く、高速な外れ値検出分析を提供します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:58:22 GMT)
Learning of Patch-Based Smooth-Plus-Sparse Models for Image Reconstruction [14.9] 最適化を二段階問題として定式化する。
我々は,デノナイズ,超高分解能,圧縮型磁気共鳴イメージングの手法について検討した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:32:12 GMT)
Prospects for Mitigating Spectral Variability in Tropical Species Classification Using Self-Supervised Learning [14.9] 本稿では, 自己監督学習(SSL)を用いて, 生物多様性に強く, 種識別に関係のあるスペクトル特徴を符号化することを提案する。
40種の熱帯種を分類すると、これらの特徴は、スペクトルの変動性に対する頑健さを10点精度で比較することで、典型的な反射率生成物よりも優れていることが示されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:32:47 GMT)
Motivations, Challenges, Best Practices, and Benefits for Bots and Conversational Agents in Software Engineering: A Multivocal Literature Review [14.8] 私たちは、ボットを特徴付けるための分類と、ソフトウェアエンジニアリングに採用する上での一連の課題の提供を目指しています。
目的を達成するため,多言語文献のレビューを行い,研究と実践者の文献のレビューを行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:16:36 GMT)
VeriLeaky: Navigating IP Protection vs Utility in Fine-Tuning for LLM-Driven Verilog Coding [14.7] 大規模言語モデル(LLMs)は、コーディングにおいて大きな可能性を秘めているが、Verilogのようなニッチな言語には、キュレートされたデータによる微調整(FT)が不可欠である。
FTの知的財産権(IP)を使用すると、LLM推論によってFTデータがリークされるため、深刻なリスクが生じる。
本研究は,FTに対して有効かつ最小限に破壊的な新しい戦略の必要性を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:38:03 GMT)
Sparse Autoencoders Reveal Universal Feature Spaces Across Large Language Models [14.6] 特徴普遍性を実証することで、潜在表現に関する発見が複数のモデルにまたがって一般化される。
辞書学習(Dictionary Learning)と呼ばれる手法を用いて、LSMの活性化を個々の特徴に対応するニューロンにまたがるより解釈可能な空間に変換する。
実験により,SAE特徴空間の様々な LLM における顕著な類似性が明らかとなり,特徴普遍性を示す新たな証拠が得られた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:31:46 GMT)
Error bounds for composite quantum hypothesis testing and a new characterization of the weighted Kubo-Ando geometric means [14.4] 可換の場合、状態の重み付けされた幾何学的手段を考えると、仮説当たりの2つの状態がこのアプローチに最適であることを示す。
また、2つの量子チャネルの重み付けされたKubo-Ando幾何学的手段の類似した最適性を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:06:27 GMT)
A Generalist Hanabi Agent [14.3] 従来のマルチエージェント強化学習(MARL)システムは、反復的な相互作用を通じて協調戦略を開発することができる。
MARLシステムは、訓練されたもの以外のどんな環境でもうまく機能しない。
これは人気のある2対5のカードゲームであるハナビベンチマークで特に見られる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:25:15 GMT)
STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans [14.1] 私たちは、人間の脳が連続性と特殊性を利用するという事実にインスピレーションを受けています。
私たちは、人間の脳が連続性と特殊性を利用するという事実にインスピレーションを受けています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:22:00 GMT)
Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.1] 空間スペクトル変換器(LESS ViT)
一 クローネッカーの低次元空間的及びスペクトル的注意成分の積を通して高次元空間的注意を近似するLESS注意ブロック
二 それぞれのパッチの空間的・スペクトル的連続性及び物理的特性を両立させる連続位置チャネル埋め込み層
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:42:19 GMT)
A Model Stealing Attack Against Multi-Exit Networks [14.0] モデルユーティリティと出力戦略の両方を抽出するために,マルチエグジットネットワークに対する最初の盗難攻撃を提案する。
複数のマルチエグジットネットワークとベンチマークデータセットにわたる実験において、本手法は被害者モデルに最も近い精度と効率を常に達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:56:01 GMT)
Versatile Physics-based Character Control with Hybrid Latent Representation [13.9] 本稿では,物理シミュレーションによる人物の動作前処理を効果的に活用する多目的潜在表現を提案する。
我々のモデルは、非常に表現力の高い自然運動を持つスパース目標条件を強く満足する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:45:51 GMT)
Valid Text-to-SQL Generation with Unification-based DeepStochLog [13.8] 本稿では,統一に基づく定節文法を用いた構文制約とスキーマ制約を課すニューロシンボリック・フレームワークを提案する。
私たちのフレームワークは、自然言語理解能力を活用するために、言語モデルに対する双方向インターフェースも構築しています。
この作業は、統一ベースの文法で言語モデルを拡張するための最初のステップである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:21:10 GMT)
Stabilization Analysis and Mode Recognition of Kerosene Supersonic Combustion: A Deep Learning Approach Based on Res-CNN-beta-VAE [13.7] スクラムジェットエンジンは 超音速車両の 重要な推進システムです
燃料噴射、乱流燃焼、空力効果の複雑な相互作用は、スクラムジェットエンジンの燃焼安定性を確保するために重要である。
本研究は,Residual Contemporalal Neural Network-beta-volutional Autoencoder(Res-CNN-beta-VAE)モデルと教師なしクラスタリング(K-means)を併用した,新たな学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:00:01 GMT)
Federated Mixture-of-Expert for Non-Overlapped Cross-Domain Sequential Recommendation [13.7] 我々は、他のドメインモデルパラメータチェックポイントのみを利用することで、ターゲットドメイン予測精度を高める方法について論じる。
本稿では,フェデレート学習の観点から,非オーバーラップ型クロスドメインシーケンシャルレコメンデーションシナリオを探索するFMoE-CDSRを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:12:37 GMT)
MM-Spatial: Exploring 3D Spatial Understanding in Multimodal LLMs [13.7] MLLM(Multimodal large language model)は、2次元の視覚的理解に優れるが、3次元空間を推論する能力には限界がある。
本研究では,1)新しい教師付き微調整データセットの導入,2)屋内シーンに焦点を当てた新しい評価ベンチマークを導入するために,オープンセットアノテーションを用いた大規模高品質3Dシーンデータを活用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:34:22 GMT)
Enhancing accuracy of uncertainty estimation in appearance-based gaze tracking with probabilistic evaluation and calibration [13.6] 外見に基づく視線追跡の不確実性は、信頼性の高い下流アプリケーションを保証するために重要である。
現在の不確実性認識アプローチでは、トレーニングデータセット内の分布に従って不確実性を取得する確率論的モデルを採用している。
トレーニングされたモデルの不確かさを推定する際のバイアスを軽減するために,確率校正に基づく補正戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:23:20 GMT)
GraphRouter: A Graph-based Router for LLM Selections [13.5] 我々は,Large Language Models (LLMs) の選択を強化するため,グラフと呼ばれる新しい帰納的グラフフレームワークを導入する。
エッジ予測メカニズムを通じて、グラフは潜在的なエッジの属性(LLM応答の効果とコスト)を予測でき、最適化された推奨が可能になる。
実験では、Graphは既存のルータを大幅に上回り、12.3%の最小パフォーマンス向上を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:08:47 GMT)
Efficient Action-Constrained Reinforcement Learning via Acceptance-Rejection Method and Augmented MDPs [13.4] 行動制約強化学習(ACRL)は、行動制約違反をゼロとする制御ポリシーを学習するための一般的なフレームワークである。
本稿では、標準制約のないRL法をACRLに適用できる汎用的で効率的なフレームワークを提案する。
提案手法は,現状のACRL法よりも高速なトレーニング,制約満足度の向上,アクション推論時間の短縮を実現している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:41:43 GMT)
Modelling Child Learning and Parsing of Long-range Syntactic Dependencies [13.4] 本研究は,言語表現性nmenaを学習するために,確率論的児童言語習得モデルを開発する。
モデルは実子指向音声のコーパスに基づいて訓練され、各発話は意味表現として論理形式とペアリングされる。
訓練後、モデルは与えられた発話の意味のペアに対して正しいパースツリーと単語の意味を推論することができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:24:39 GMT)
A Multi-Stage Framework with Taxonomy-Guided Reasoning for Occupation Classification Using Large Language Models [13.4] 大規模な言語モデル(LLM)は、その豊富な世界知識とコンテキスト内学習能力によって約束される。
そこで本研究では,推測,検索,再評価の段階からなる多段階フレームワークを提案する。
以上の結果から,既存のLCM法よりも優れたフレームワークであることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:44:50 GMT)
Beyond the Individual: A Community-Engaged Framework for Ethical Online Community Research [13.3] 本稿では,オンラインコミュニティ研究のコミュニティレベルの損害と利益について検討する。
研究者はコミュニティの主たる目的とより直接的に関わるべきだと考えた。
我々は、倫理的オンラインコミュニティ研究のためのFACTORS(Functions for Action with Communities: teaching, Overseeing, Reciprocating, and Sustaining)フレームワークを提示する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:19:10 GMT)
Efficient Transfer Learning for Video-language Foundation Models [13.2] テキスト表現と視覚表現のアライメントを高めるために,パラメータ効率のよいマルチモーダルパティッシャ・テンポラル・アダプタ (MSTA) を提案する。
我々は,ゼロショット転送,少数ショット学習,ベース・ツー・ノーベル一般化,完全テンポラル学習という4つの課題にまたがるアプローチの有効性を評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:44:59 GMT)
TSCMamba: Mamba Meets Multi-View Learning for Time Series Classification [13.1] シフト等分散のような特性を持つパターンを捉えるための新しい多視点手法を提案する。
提案手法は, スペクトル, 時間, 局所, グローバルな特徴を含む多様な特徴を統合して, TSCのリッチで相補的な文脈を得る。
提案手法では,TSCモデルよりも平均精度が4.01-6.45%,7.93%向上した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:40:41 GMT)
User Preference Meets Pareto-Optimality in Multi-Objective Bayesian Optimization [13.1] PUB-MOBO(Presistal-utility- Balanced MOBO)を提案する。
PUB-MOBOは、ユーティリティベースのMOBOとローカルなマルチ段階の降下を組み合わせ、ユーザの好むソリューションをほぼパレート最適に洗練する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:25:17 GMT)
Dual-Domain Homogeneous Fusion with Cross-Modal Mamba and Progressive Decoder for 3D Object Detection [12.8] LiDARと同質なBEV領域における画像特徴の融合は、自律運転における3次元物体検出に人気がある。
しかし、このパラダイムは過剰な特徴圧縮によって制約される。
本稿では,これらの制約を克服するためのDual-Domain Homogeneous Fusion Network (DDHFusion)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:33:08 GMT)
A Survey on Transformer Context Extension: Approaches and Evaluation [12.7] Transformer に基づく大規模言語モデル (LLM) は自然言語処理 (NLP) に広く応用されている。
しかし、長いコンテキストのシナリオでは、いくつかの問題によりLLMの性能は低下する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:44:09 GMT)
ShuffleGate: An Efficient and Self-Polarizing Feature Selection Method for Large-Scale Deep Models in Industry [12.7] ShuffleGateはインスタンス間ですべての機能を同時にシャッフルする。
モデルを再トレーニングすることなく、適切に分離された重要なスコアを生成し、パフォーマンスを見積もることができます。
様々なシナリオで、Bilibiliの検索モデルの日々のイテレーションにうまく統合されています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:35:52 GMT)
VQ-SGen: A Vector Quantized Stroke Representation for Creative Sketch Generation [12.5] VQ-SGenは高品質なクリエイティブスケッチ生成のための新しいアルゴリズムである。
細かなスケッチ生成のためのベクトル量子化(VQ)ストローク表現を提案する。
提案手法はCreativeSketchデータセット上の既存の最先端技術を上回る。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:19:45 GMT)
MirrorGuard: Adaptive Defense Against Jailbreaks via Entropy-Guided Mirror Crafting [12.3] 大規模な言語モデルをジェイルブレイク攻撃から守ることは、安全なデプロイメントを保証する上で不可欠である。
動的かつ適応的な防御を実現するための「ミラー」の概念を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:41:29 GMT)
Improving Generalization of Universal Adversarial Perturbation via Dynamic Maximin Optimization [12.3] 深部ニューラルネットワーク(DNN)は、普遍的対向摂動(UAP)に影響を受けやすい
我々は,様々な最適モデル-データペア間でUAPを最適化することを目的とした,動的最大値最適化戦略を導入する。
ImageNetデータセットの実験では、提案されたDM-UAPが、クロスサンプルの普遍性とクロスモデル転送性の両方を著しく強化することを示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:01:37 GMT)
A Framework to Assess Multilingual Vulnerabilities of LLMs [12.2] 大規模言語モデル(LLM)は、複数の言語での理解や応答を含む幅広い機能を獲得している。
本稿では,LLMの多言語脆弱性を自動的に評価するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:39:44 GMT)
Secure On-Device Video OOD Detection Without Backpropagation [12.2] アウト・オブ・ディストリビューション(OOD)検出は、自律運転や診断などの安全クリティカルなアプリケーションにおいて、機械学習モデルの信頼性を確保するために重要である。
デバイス側のバックプロパゲーションを必要とせず,デバイス上でのOOD検出を効率的に行うセキュアなクラウドデバイスコラボレーションフレームワークSecDOODを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:44:00 GMT)
Prompt Flow Integrity to Prevent Privilege Escalation in LLM Agents [12.1] 大きな言語モデル(LLM)は、強力なLLMエージェントを作成するプラグインと組み合わせられる。
LLMの動作は、ユーザまたはプラグインのデータから自然言語のプロンプトによって実行時に決定される。
LLMエージェントの特権エスカレーションを防止するために,PFI(Prompt Flow Integrity)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:27:57 GMT)
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection [12.0] 大型視覚言語モデル(LVLM)は、しばしば物体幻覚(OH)に悩まされる。
本論文では,安全でない部分空間に基づいてモデルの重みを編集する効率的な方法を提案する。
実験により,提案手法は,余分な推論コストを伴わずに,異なるLVLMファミリー間でOHを効果的に緩和できることが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:05:34 GMT)
BRIGHT-VO: Brightness-Guided Hybrid Transformer for Visual Odometry with Multi-modality Refinement Module [11.9] 視覚計測(VO)は、自律運転、ロボットナビゲーション、その他の関連するタスクにおいて重要な役割を果たす。
本稿では,トランスフォーマーアーキテクチャに基づく新しいVOモデルであるBrightVOを紹介し,フロントエンドの視覚的特徴抽出を行う。
ポーズグラフ最適化を用いて、このモジュールは、エラーを減らし、精度とロバスト性の両方を改善するために、ポーズ推定を反復的に洗練する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:49:51 GMT)
RAG-RL: Advancing Retrieval-Augmented Generation via RL and Curriculum Learning [11.9] 本稿では、検索強化生成(RAG)設定に特化して訓練された最初の推論言語モデル(RLM)であるRAG-RLを紹介する。
RAG-RLは、より強力な回答生成モデルにより、検索された情報のより大きなセット内で関連するコンテキストを識別できることを実証する。
強化学習(RL)後学習プロセスにおけるカリキュラム設計は,モデル性能向上のための強力なアプローチであることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:53:42 GMT)
Analyzing sequential activity and travel decisions with interpretable deep inverse reinforcement learning [11.8] 本稿では,行動トラバー決定過程を解析するための解釈可能なDIRLフレームワークを提案する。
提案手法は,活動トラバー行動の報酬と政策関数を推定するために,逆IRLアプローチに適応する。
実世界の旅行調査データを分析したところ、2つの重要な領域で有望な結果が得られた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:54:02 GMT)
A General Adaptive Dual-level Weighting Mechanism for Remote Sensing Pansharpening [11.8] リモートセンシングの深層学習法は 急速に進歩しています
多くの既存手法は特徴の不均一性と冗長性を完全に活用するのに苦労している。
これらの課題に対処するために、一般適応二重レベル重み付け機構(ADWM)を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:24:00 GMT)
L2HCount:Generalizing Crowd Counting from Low to High Crowd Density via Density Simulation [11.8] 低密度のシーンから高密度のシーンに関連するパターンを学習する低密度から高密度の一般化フレームワーク(L2HCount)を提案する。
4つの挑戦的なデータセットの実験は、L2HCountの有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:49:09 GMT)
Towards AI-assisted Academic Writing [11.8] 本稿では,引用推薦や紹介文を含むAI支援学術書記システムの構成要素について述べる。
このシステムは、ユーザの現在のドキュメントコンテキストを考慮し、関連する提案を提供することによって、引用を推奨する。
先行研究に対する研究の貢献を前提として、構造化された手法による導入を創出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:30:17 GMT)
Proportional Aggregation of Preferences for Sequential Decision Making [11.7] 投票者の選好を適度に決定する問題について検討する。
各ラウンドにおいて、決定ルールは、各投票者が承認した選択肢のどれかを報告する一連の選択肢から決定を選ばなければならない。
3つの魅力的な投票規則がこのスタイルの公理を満たすことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:25:48 GMT)
Language-guided Open-world Video Anomaly Detection [11.7] ビデオ異常検出モデルは、期待から外れた異常を検出することを目的としている。
既存の方法では、異常の定義は不変であり、したがって開世界に適用できないと仮定している。
本稿では,ユーザが提案する自然言語を推論時にガイド付き検出できる,可変定義を持つ新しいオープンワールドVADパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:31:19 GMT)
GKG-LLM: A Unified Framework for Generalized Knowledge Graph Construction [11.6] 一般化知識グラフを構築するための統一的なフレームワークを提案する。
まず、3種類のグラフにまたがる29のデータセットで15のサブタスクからデータを収集する。
そこで我々は,3種類のグラフからの知識を大規模言語モデルに反復的に注入することにより,3段階のカリキュラム学習微調整フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:41:34 GMT)
SeisRDT: Latent Diffusion Model Based On Representation Learning For Seismic Data Interpolation And Reconstruction [11.5] 地理的、物理的、経済的要因などの制限のため、収集された地震データは、しばしば痕跡を欠いている。
従来の地震データ再構成手法は、多数の経験的パラメータを選択し、大規模な連続的欠落トレースを扱うのに苦労する課題に直面している。
地震データ再構成のための表現学習を利用した潜時拡散変換器を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:16:35 GMT)
MulSMo: Multimodal Stylized Motion Generation by Bidirectional Control Flow [11.5] 既存の方法では、情報は通常、スタイルからコンテンツへのみ流れ、スタイルとコンテンツの間に衝突を引き起こす可能性がある。
この作業では、スタイルとコンテンツの間に双方向の制御フローを構築し、そのスタイルをコンテンツに向けて調整します。
我々は、文や画像を含む複数のモダリティに1つのモダリティ、すなわちスタイル運動から、コントラスト学習を通じてスタイル化されたモーション生成を拡張する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:18:23 GMT)
Estimating stationary mass, frequency by frequency [11.5] 我々は、任意の$alpha$-mixingプロセスの定常分布によって配置される確率質量を推定する問題を考える。
総変分距離におけるこの確率ベクトルを推定し、$n$の普遍的一貫性を示す。
混合配列の自然自己正規化統計量の濃度不等式を含む補完ツールを開発し、関連する問題に対する推定器の設計と解析に独立して有用であることを示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:24:21 GMT)
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning [11.5] ClusCompは圧縮パラダイムで、重み行列をコードブックにまとめ、ブロック単位で微調整する。
ClusCompは、A6000-48GBのGPU上で70B LLMの圧縮と微調整をサポートする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:52:16 GMT)
Classroom-Inspired Multi-Mentor Distillation with Adaptive Learning Strategies [11.2] 教室環境にインスパイアされた新しい多面的知識蒸留フレームワークであるClassroomKDを提案する。
本フレームワークは,各データサンプルの有効性に基づいて,多様なメンターの指導戦略を動的に選択し,適応する。
その結果,メンターの選択と指導に対する動的かつ適応的なアプローチは,より効果的な知識伝達につながることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:23:58 GMT)
NuPlanQA: A Large-Scale Dataset and Benchmark for Multi-View Driving Scene Understanding in Multi-Modal Large Language Models [11.2] シーン理解のためのマルチビュー・マルチモーダル評価ベンチマークであるNuPlanQA-Evalを紹介する。
また,NuPlanQA-1Mは,実世界の視覚的質問応答(VQA)ペア100万個からなる大規模データセットである。
評価の結果,エゴ中心の視点から,既存のMLLMがシーン特有の知覚と空間的推論を駆動する上で直面する重要な課題が明らかになった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:12:39 GMT)
SED-MVS: Segmentation-Driven and Edge-Aligned Deformation Multi-View Stereo with Depth Restoration and Occlusion Constraint [11.2] SED-MVSは、セグメント化駆動およびエッジ整合のパッチ変形に対して、単光分割と多軌道拡散戦略を採用する。
具体的には、予想外のエッジスキッピングを防止するために、まず、パッチ変形をガイドするディープエッジガイダンスとしてSAM2を使用し、その後、パッチがディープエッジに包括的に整合していることを保証するマルチ軌道拡散戦略を用いる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:07:44 GMT)
Generative Gaussian Splatting: Generating 3D Scenes with Video Diffusion Priors [11.2] GGS(Generative Gaussian Splatting)は、3D表現と事前学習された遅延ビデオ拡散モデルを統合する新しい手法である。
本研究では,シーン合成のための2つの共通ベンチマークデータセットであるRealEstate10KとScanNet+について検討した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:24:04 GMT)
The Limits of Differential Privacy in Online Learning [11.1] DP,純DP,近似DPの3種類の制約を分離する証拠を提示する。
まず、近似DPではオンライン学習可能であるが、適応的逆数設定では純粋DPではオンライン学習できない仮説クラスについて述べる。
そして、どんなオンライン学習者でも、ほぼ全ての仮説クラスに対して無限の誤りを犯さなければならないことを証明します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:43:14 GMT)
Improved Bounds for Pure Private Agnostic Learning: Item-Level and User-Level Privacy [11.1] 学習プロセスの実践を反映したフレームワークである無知モデルで純粋にプライベートな学習を研究する。
項目レベル(各ユーザが1つの例にコントリビュートする場所)とユーザレベル(各ユーザが複数の例にコントリビュートする場所)のプライバシについて検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:19:11 GMT)
Active Learning with Context Sampling and One-vs-Rest Entropy for Semantic Segmentation [11.1] マルチクラスのセマンティックセグメンテーションは、コンピュータビジョンにおける画期的な課題である。
アクティブラーニング(AL)は、戦略的にアノテーションのデータポイントを選択することで、この課題を軽減する。
マルチクラスセマンティックセグメンテーション用に設計されたパッチベースのAL手法であるOREALを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:35:34 GMT)
EmT: A Novel Transformer for Generalized Cross-subject EEG Emotion Recognition [11.0] 感情トランス(EmT)と呼ばれる新しいトランスモデルを導入する。
EmTは、一般化されたクロスオブジェクトEEG感情分類と回帰タスクの両方において優れているように設計されている。
4つの公開データセットの実験により、EmTは脳波の感情分類と回帰タスクの両方のベースラインメソッドよりも高い結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:22:04 GMT)
MAP: Multi-user Personalization with Collaborative LLM-powered Agents [11.0] 本稿では,リフレクション,分析,フィードバックの3段階からなるマルチユーザパーソナライズのためのユーザ中心ワークフローを提案する。
textbfMulti-textbfAgent system for multi-user textbfPersonalization -- MAPはこのワークフローを運用する。
ユーザ調査では、MAPの有効性とコンフリクト解決のユーザビリティを強調しながら、解決の検証と失敗管理におけるユーザの関与の重要性を強調した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:52:10 GMT)
Graph Generative Models Evaluation with Masked Autoencoder [11.0] 本稿では,グラフマスク付きオートエンコーダを用いてグラフ生成モデル評価のためのグラフ特徴を効果的に抽出する手法を提案する。
我々は,グラフに関する広範な実験を行い,提案手法よりも信頼性と有効性を実証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:23:21 GMT)
nvBench 2.0: A Benchmark for Natural Language to Visualization under Ambiguity [10.9] 曖昧なシナリオでNL2VISシステムを評価するために設計された新しいベンチマークであるnvBench 2.0を紹介する。
nvBench 2.0には7,878の自然言語クエリと24,076の視覚化が含まれている。
また,nvBench 2.0をベースとしたLLMモデルであるStep-NL2VISを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:20:11 GMT)
Aligning Vision to Language: Text-Free Multimodal Knowledge Graph Construction for Enhanced LLMs Reasoning [10.8] LLM(Large Language Models)におけるマルチモーダル推論は、不完全な知識と幻覚に苦しむ。
本稿では,マルチモーダルな知識グラフを構築するための新しいアプローチであるVaLiK(Vision-Align-to-Language Integrated Knowledge Graph)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:31:14 GMT)
To Trust or Not to Trust? Enhancing Large Language Models' Situated Faithfulness to External Contexts [10.7] 大規模言語モデル(LLM)は、検索強化世代(RAG)など、外部コンテキストで拡張されることが多い。
正しいコンテキストと間違ったコンテキストの両方を提供する場合、オープンソースモデルとプロプライエタリモデルの両方が、外部情報に過度に依存する傾向にあることを示す。
自己ガイド型信頼推論(SCR)とルールベース信頼推論(RCR)の2つのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:47:58 GMT)
DeGauss: Dynamic-Static Decomposition with Gaussian Splatting for Distractor-free 3D Reconstruction [10.7] デガウス(DeGauss)は,非結合型動的静的ガウススプラッティング設計に基づく動的シーン再構築のための自己教師型フレームワークである。
DeGaussは、カジュアルなイメージコレクションから、長くてダイナミックなエゴセントリックなビデオまで、幅広い現実世界のシナリオをしっかりと一般化している。
NeRF-on-the-go, ADT, AEA, Hot3D, EPIC-Fields などのベンチマーク実験では,DeGauss が既存のメソッドを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:53:04 GMT)
AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction [10.7] AugMapNetは、潜伏したBEV表現を大幅に強化する新しいテクニックである。
nuScenesとArgoverse2データセットの実験では、ベクトル化されたマップ予測性能が大幅に改善された。
遅延BEVグリッドの詳細な解析により、AugMapNetのより構造化された遅延空間が確認できる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:55:32 GMT)
Training Video Foundation Models with NVIDIA NeMo [10.6] NVIDIA NeMoを使ったスケーラブルでオープンソースのVFMトレーニングパイプラインを提示する。
我々は、効率的なVFMトレーニングと推論のためのベストプラクティスを強調した総合的なパフォーマンス分析を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:19:12 GMT)
Exploiting Edited Large Language Models as General Scientific Optimizers [10.5] 大規模言語モデル(LLM)は、科学的シナリオにおける数学的最適化において広く採用されている。
概念的に単純で汎用的な二段階最適化手法,すなわち textbf General textbfScientific textbfOptimizers (GSO) を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:40:49 GMT)
Debiased Nonparametric Regression for Statistical Inference and Distributionally Robustness [10.5] 本研究では,スムーズな非パラメトリック回帰推定器のためのモデルフリーデバイアス法を提案する。
緩やかな条件下で, 点方向および均一なリスク収束と滑らかさを満足する偏バイアス推定器を得る。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:59:48 GMT)
Exploring ReAct Prompting for Task-Oriented Dialogue: Insights and Shortcomings [10.5] 大規模言語モデル(LLM)は、構造化されていない会話における印象的な能力のために大きな人気を得た。
タスク指向対話(TOD)を行うLLMの指導にReAct戦略を適用した。
我々はReAct-LLM(ReAct-LLM)をシミュレーションと実ユーザの両方で評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:01:21 GMT)
A Tale of Single-channel Electroencephalogram: Devices, Datasets, Signal Processing, Applications, and Future Directions [10.4] 単一チャネル脳波(英: Single- Channel Electroencephalogram、EEG)は、脳活動を監視するための費用効率が高く、快適で非侵襲的な方法である。
本稿では,開発動向,デバイス,データセット,信号処理方法,最近の応用,今後の方向性について論じる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:13:30 GMT)
A Generically Contrastive Spatiotemporal Representation Enhancement for 3D Skeleton Action Recognition [10.4] 本稿では, 比較時空間表現拡張(CSRE)フレームワークを提案する。
具体的には、その表現を空間的特徴と時間的特徴に分解し、微細な動きパターンを探索する。
潜伏したデータ分布を明示的に活用するために、コントラスト学習に注意的特徴を用いて、クロスシーケンスセマンティックリレーションをモデル化する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:45:27 GMT)
Random Forest Autoencoders for Guided Representation Learning [10.0] 本稿では,サンプル外拡張のためのニューラルネットワークフレームワークRF-PHATEを紹介する。
RF-PHATEのカーネルベースの拡張は、RFPHATEの標準拡張を含む既存の方法よりも優れている。
RF-AEはカーネルの選択に対して堅牢であり、任意のカーネルベースの次元減少法に一般化する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:18:37 GMT)
ReLU Neural Networks with Linear Layers are Biased Towards Single- and Multi-Index Models [10.0] この原稿は、2層以上の深さのニューラルネットワークによって学習された関数の性質が予測にどのように影響するかを考察している。
我々のフレームワークは、すべて同じキャパシティを持つが表現コストが異なる、様々な深さのネットワーク群を考慮に入れている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:39:20 GMT)
Free-form language-based robotic reasoning and grasping [9.9] VLM(Vision-Language Models)は、テキストと画像の両方で顕著な推論能力を示している。
本稿では,事前学習されたVLMの世界の知識を活用して,人間の指示や物体空間配置を推論する新しい手法FreeGraspを提案する。
提案手法は,すべてのオブジェクトをキーポイントとして検出し,これらのキーポイントを用いて画像上のマークをアノテートし,GPT-4oのゼロショット空間推論を促進する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:41:16 GMT)
Adams Bashforth Moulton Solver for Inversion and Editing in Rectified Flow [9.6] 既存の数値解法は高速サンプリングと高精度解のトレードオフに直面している。
本稿では,Adams-Bashforth-Moulton(ABM)予測器・コレクタ法を用いて,整流モデルにおけるODE解の精度を向上させることを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:17:33 GMT)
Fast alignment of heterogeneous images in sliced Wasserstein distance [9.5] 最適な輸送量に基づく異種画像の整列を高速に行うアルゴリズムを提案する。
提案手法は,高速フーリエ法とスライスされた確率測定値のロバスト性を組み合わせた手法である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:26:54 GMT)
Don't Judge Before You CLIP: A Unified Approach for Perceptual Tasks [9.4] 本稿では,CLIPを先行として活用する複数の知覚タスクを解決するための統合フレームワークを提案する。
私たちのアプローチは、CLIPが人間の判断とよく相関していることを示す最近の認知的知見に基づいている。
提案手法は, (i) 画像記憶可能性予測, (ii) 非参照画像品質評価, (iii) 視覚的感情分析の3つの課題に対して評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:15:31 GMT)
Quantum Dynamics Simulation of the Advection-Diffusion Equation [9.3] 対流拡散方程式は超伝導量子コンピュータ上でいくつかの量子アルゴリズムを用いてシミュレートされる。
3つの定式化は、トロッター化、(2)変分量子時間進化(VarQTE)、(3)適応変分量子力学シミュレーション(AVQDS)である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:31:34 GMT)
GenStereo: Towards Open-World Generation of Stereo Images and Unsupervised Matching [9.3] GenStereoは、ステレオ画像生成への拡散ベースのアプローチである。
視認の視覚的品質と整合の幾何学的精度を両立させる。
当社のフレームワークは,高品質なステレオ画像生成を実現しつつ,複雑なハードウェアセットアップの必要性を排除している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:19:28 GMT)
FLEX: A Framework for Learning Robot-Agnostic Force-based Skills Involving Sustained Contact Object Manipulation [9.3] 本稿では,力空間におけるオブジェクト中心の操作ポリシーを学習するための新しいフレームワークを提案する。
提案手法は, 動作空間を単純化し, 不要な探索を低減し, シミュレーションオーバーヘッドを低減させる。
評価の結果,本手法はベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:49:47 GMT)
TransDiff: Diffusion-Based Method for Manipulating Transparent Objects Using a Single RGB-D Image [9.2] デスクトップ上での材料に依存しない物体の把握を実現するため,単一ビューのRGB-D-based depth completion frameworkであるTransDiffを提案する。
我々は,RGB画像から抽出した特徴(セグメンテーション,エッジマップ,正規マップなど)を,深度マップ生成プロセスの条件として活用する。
提案手法は,ランダムな深度分布を深度マップに変換する反復的復調過程を学習し,初期改良された深度情報を用いて導出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:29:37 GMT)
Orthogonal Constrained Minimization with Tensor $\ell_{2,p}$ Regularization for HSI Denoising and Destriping [9.2] ハイパースペクトル画像(HSI)は、ガウスノイズ、デッドライン、ストライプなどの混合ノイズによって汚染されることが多い。
我々は,NLTL2pと呼ばれるHSIデノベーションとデトリップのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:13:43 GMT)
SMPR: A structure-enhanced multimodal drug-disease prediction model for drug repositioning and cold start [9.1] 本稿では,構造強化型マルチモーダル関係予測モデル(SMRP)を提案する。
SMRPは薬物のSMILE構造に基づいており、Mol2VEC法を用いて薬物の埋め込み表現を生成する。
利用者の使いやすさを軽減するため、SMPRは構造的類似性に基づいたコールドスタートインタフェースも提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:59:20 GMT)
SensorLLM: Aligning Large Language Models with Motion Sensors for Human Activity Recognition [9.1] 本稿では,Large Language Models(LLM)がセンサデータからHAR(Human Activity Recognition)を実現するためのフレームワークであるSensorLLMを紹介する。
SensorLLMは、各センサチャネルに特別なトークンを導入するSensor-Language Alignmentステージを通じて制限に対処する。
その後のタスク・アウェア・チューニングの段階では、HAR分類のモデルを洗練し、最先端の手法に適合または超越した性能を達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:28:43 GMT)
Mitigating KV Cache Competition to Enhance User Experience in LLM Inference [9.0] KVキャッシュ競合を緩和するシステムであるCacheOPTを提案する。
要求の出力長を推定し、要求到着率に基づいて調整された、高い特定の確率で偏差をバウンドする。
リクエストが割り当てられる前にKVCを積極的に割り当て、プリエンプションを防ぐためにKVCをグローバルに予約する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:38:29 GMT)
AccelGen: Heterogeneous SLO-Guaranteed High-Throughput LLM Inference Serving for Diverse Applications [9.0] 多様なアプリケーションに対して異種SLOを保証する高スループット推論サービスであるAccelGenを提案する。
トレース実実験により、AccelGenは1.42-11.21倍のスループット、1.43-13.71倍の高出力、37-90%のSLO達成、そして1.61-12.22倍の応答遅延を達成した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:47:43 GMT)
Imputation Strategies Under Clinical Presence: Impact on Algorithmic Fairness [9.0] 我々は、機械学習がデータおよびデータから欠落するものにおけるバイアスを補強するリスクを論じる。
医療の欠如に対処する方法は、アルゴリズムの公正性に有害な影響を与える可能性がある。
提案手法は,命令の選択を実証的に導くためのフレームワークと,それに伴う報告フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:15:24 GMT)
Quantum EigenGame for excited state calculation [9.0] 我々は、$0textth$-orderアプローチと量子コンピュータのためのEigenGameアルゴリズムを拡張した。
その結果、量子固有Gameを使うことで、デフレステップを必要とせずに、与えられたハミルトンの励起状態に収束できることを示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:48:40 GMT)
Unfair Utilities and First Steps Towards Improving Them [8.8] 情報フェアネスの価値を定義し、この基準に違反したユーティリティ関数を使わないよう提案する。
この原理は,情報フェアネスの価値を満足するように,これらのユーティリティ機能を変更することを示唆している。
我々は、情報の公平さの価値が認められない直感的に公正な政策を知らない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:29:31 GMT)
Impact of Road Infrastructure and Traffic Scenarios on E-scooterists' Riding and Gaze Behavior [8.8] 本研究は,道路の安全性とユーザエクスペリエンスを向上させるために,道路インフラ,交通シナリオ,および電動スクーターの乗り心地と視線行動の関係について検討する。
各種道路レイアウトおよび交通シナリオを対象とした,電子スクータ,視線パターン,固定測度,頭部運動データを用いた自然史的研究を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:00:26 GMT)
Critical dynamics and its interferometry in the one-dimensional p-wave-paired Aubry-André-Harper model [8.7] 一次元の準周期的なp波対を持つオーブリー・アンドルー・ハーパー模型の臨界ダイナミクスに焦点をあてる。
2つの台地は, 片方向およびラウンドトリップのクエンチプロトコルを用いて, 適度なクエンチ速度を持つ臨界ダイナミクスに本質的に影響を及ぼす。
2つのKZサブレジムの旋回点を定量的に決定するために、首の位置がどのように使用できるかを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:52:46 GMT)
Structure-Activation Synergy: A Dual Efficiency Framework for Parameter-Memory Optimized Transfer Learning [8.6] 本稿では、パラメータとメモリの二重最適化を実現する革新的なフレームワークであるStructure-Activation Synergy(S2A)を提案する。
我々は、S2Aの優れた効率を示し、GPUメモリ消費を75%削減し(平均4.2削減)、フル微調整精度の98.7%を維持し、わずか0.9%の調整可能なパラメータしか持たない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:50:29 GMT)
HoloGest: Decoupled Diffusion and Motion Priors for Generating Holisticly Expressive Co-speech Gestures [8.5] HoleGestは、高品質で表現力のある共同音声ジェスチャーの自動生成のための、新しいニューラルネットワークフレームワークである。
本システムでは,音声依存度が低く,モーション依存度が高く,より安定した大域的動作と詳細な指の動きが可能である。
我々のモデルは、没入感のあるユーザー体験を提供するために、真実に近い現実主義のレベルを達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:42:31 GMT)
Gaussian On-the-Fly Splatting: A Progressive Framework for Robust Near Real-Time 3DGS Optimization [8.4] 画像キャプチャ中にほぼリアルタイムで3DGSの最適化を可能にするフレームワークであるOn-the-Fly GSを導入する。
各画像が到着すると、そのポーズとスパースポイントはオンザフライのSfMを介して更新され、新しく最適化されたガウスは直ちに3DGSフィールドに統合される。
複数のベンチマークデータセットの実験では、On-the-Fly GSはトレーニング時間を大幅に短縮し、レンダリングロスを最小限に抑えて、新しいイメージを数秒で最適化している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:47:58 GMT)
A non-relativistic theory of quantum mechanics with local modulus symmetry [8.4] 我々は局所弾性対称性に基づく量子力学の非相対論的理論を構築した。
量子計量関数と呼ばれる新しい実および正の関数は波動関数の複素共役に付随する。
膨張する宇宙において、これらの理論的特徴は、従来の量子力学とニュートン重力の予測から逸脱する新しい効果を生み出す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:08:08 GMT)
Pose as a Modality: A Psychology-Inspired Network for Personality Recognition with a New Multimodal Dataset [8.3] フルボディのポーズデータを組み込んだ新しいデータセットを開発した。
MFA(Multimodal Feature Awareness)、Multimodal Feature Interaction(MFI)、サイコロジーインフォームド・モダリティ相関損失(PIMC損失)の3つの主要なモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:21:33 GMT)
Deep learning assisted high resolution microscopy image processing for phase segmentation in functional composite materials [8.0] 本研究は、トレーニングされたU-Netセグメンテーションモデルを用いて、生高分解能電子顕微鏡(TEM)画像から成分と位相セグメンテーションを検出する新しいワークフローを提案する。
開発したモデルでは、成分の検出と位相セグメンテーションの迅速化が可能であり、広範囲なTEM画像の精査に伴う時間的・認知的要求を低減できる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:50:22 GMT)
What Does It Mean to Be a Transformer? Insights from a Theoretical Hessian Analysis [8.0] トランスフォーマーと他のアーキテクチャを区別する点について、基本的な理解を提供する。
この結果から,トランスフォーマーにおける様々なアーキテクチャと最適化の選択は,その非線形な依存関係に遡ることができることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:32:06 GMT)
Redefining non-IID Data in Federated Learning for Computer Vision Tasks: Migrating from Labels to Embeddings for Task-Specific Data Distributions [8.0] Federated Learning (FL)は、分散機械学習(ML)におけるパラダイムシフトを表す。
現在のFLの性能はラベル/クラス分布スキューに頼って過大評価されている。
トレーニング済みのディープニューラルネットワークを利用することで、各ビジョンタスクのレンズを通してタスク固有のデータ不均一性を定義する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:16:53 GMT)
Booster: Tackling Harmful Fine-tuning for Large Language Models via Attenuating Harmful Perturbation [7.9] 有害な微調整攻撃は、大規模言語モデルの微調整・アズ・ア・サービスに対して深刻な安全上の懸念をもたらす。
本稿では,モデル重量に対する有害な摂動がアライメント破壊の原因となる可能性が示唆された。
有害な摂動の負の影響を軽減するために,Boosterと呼ばれるアライメントステージソリューションを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:17:16 GMT)
KVShare: Semantic-Aware Key-Value Cache Sharing for Efficient Large Language Model Inference [7.9] KVShareは、セマンティックな類似性に基づくマルチユーザキーバリュー(KV)キャッシュ共有技術である。
LLM(Large Language Models)とMLLM(Multimodal Large Language Models)の推論効率を向上させるように設計されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:43:35 GMT)
Augmented Invertible Koopman Autoencoder for long-term time series forecasting [7.9] そこで我々は,Augmented Invertible Koopman AutoEncoder (AIKAE) を神経オートエンコーダに基づく新しい実装として提案する。
本稿では,衛星画像時系列の長期時系列予測実験によるAIKAEの関連性を示すとともに,大局的な見返り窓に基づく予測を含むベンチマークを行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:40:50 GMT)
Challenges and recommendations for Electronic Health Records data extraction and preparation for dynamic prediction modelling in hospitalized patients -- a practical guide [7.9] モデル開発前の段階で遭遇した40以上の課題を特定します。
これらの課題は、コホート定義、結果定義、機能エンジニアリング、データクリーニングの4つのカテゴリに分けられる。
この包括的リストは、データ抽出エンジニアと研究者のための実践的なガイドとして機能し、ベストプラクティスを促進し、臨床環境での動的予測モデルの品質と実際の適用性を改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:29:33 GMT)
Dynamical Mode Recognition of Turbulent Flames in a Swirl-stabilized Annular Combustor by a Time-series Learning Approach [7.8] 本研究では, 環状燃焼系における動的モードを効果的に認識するために, 双方向長短期メモリ変動オートエンコーダBi-LSTM-VAEモデルを提案する。
具体的には、スワール安定化環状燃焼器からの16の圧力信号を利用して、複雑なダイナミクスを低次元の潜在空間にマッピングする。
潜時変動分布の解析により, 広範囲の同値比, 予混合燃料, 空気質量流量に対応するパターンが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:55:01 GMT)
MFP-CLIP: Exploring the Efficacy of Multi-Form Prompts for Zero-Shot Industrial Anomaly Detection [7.8] ゼロショット異常検出のためのマルチフォームプロンプトの有効性を探索する新しいプロンプトベースのCLIPフレームワークを提案する。
画像中のオブジェクトをよりよく表現するために、画像からテキストへのプロンプト(I2TP)機構を用いる。
欠陥を正確に特定するために,マスクプロンプト(MP)モジュールを導入し,潜在的な異常領域に焦点をあてる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:18:55 GMT)
U2AD: Uncertainty-based Unsupervised Anomaly Detection Framework for Detecting T2 Hyperintensity in MRI Spinal Cord [7.8] 脊髄MR画像におけるT2過強度は、変性頚髄症などの病態において重要なバイオマーカーである。
深層学習法は病変検出の可能性を示してきたが、ほとんどの教師付きアプローチは大きな注釈付きデータセットに大きく依存している。
本稿では,これらの制約に対処するため,不確実性に基づくunsupervised Anomaly DetectionフレームワークであるU2ADを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:33:32 GMT)
Superalignment with Dynamic Human Values [7.7] アライメントの2つの主要な課題は、1)スケーラブルな監視、2)人間の価値の動的な性質を説明することである。
複雑なタスクをサブタスクに分解するために、人間レベルのガイダンスに相応しいように、超人的推論モデルを訓練する新しいアルゴリズムフレームワークのロードマップをスケッチする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:15:17 GMT)
Fine-tuning can Help Detect Pretraining Data from Large Language Models [7.7] 現在のメソッドでは、PerplexityやMin-k%といったスコアリング関数を設計することで、メンバと非メンバを区別している。
本研究では,FSD(Fun-Tuned Score Deviation)と呼ばれる新しい手法を提案する。
特に、同じ領域内の少数の未確認データを微調整した後、電流スコアの偏差距離を測定することを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:29:05 GMT)
Synthesizing Interpretable Control Policies through Large Language Model Guided Search [7.7] Pythonのような標準言語のプログラムとしてコントロールポリシを表現しています。
シミュレーションで候補コントローラを評価し,事前学習したLLMを用いてそれらを進化させる。
本手法は,カップタスクにおける振り子の振り上げとボールの解釈可能な制御ポリシの合成への応用を通して述べる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:49:35 GMT)
CAT-3DGS Pro: A New Benchmark for Efficient 3DGS Compression [7.5] 3D Gaussian Splatting (3DGS) は新規なビュー合成の可能性を示した。
伝送および/またはストレージアプリケーションのための3DGS表現の速度歪み最適化圧縮を実現することは、依然として課題である。
圧縮性能と計算効率を両立させるCAT-3DGSの強化版であるCAT-3DGS Proを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:45:10 GMT)
Pairwise Similarity Regularization for Semi-supervised Graph Medical Image Segmentation [7.5] 半教師型医用画像分割のためのペアワイズ類似性正規化(PaSR)に基づくグラフネットワーク機能アライメント手法を提案する。
PaSRは、特徴グラフの対構造的類似性において整合性を維持することにより、異なる領域における画像のグラフ構造を整列させる。
実験部分は3つの医用画像セグメンテーションベンチマークデータセットで検証され、その結果は各種メトリクスの高度な手法よりも改善された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:14:36 GMT)
Privacy-Aware RAG: Secure and Isolated Knowledge Retrieval [7.4] 本稿では,RAGシステムを不正アクセスやデータ漏洩から保護するための高度な暗号化手法を提案する。
当社のアプローチでは、ストレージに先立ってテキストコンテンツとそれに対応する埋め込みの両方を暗号化し、すべてのデータがセキュアに暗号化されていることを保証します。
以上の結果から,RAGシステムの設計と展開に高度な暗号化技術を統合することにより,プライバシー保護を効果的に強化できることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:45:05 GMT)
LR$^2$Bench: Evaluating Long-chain Reflective Reasoning Capabilities of Large Language Models via Constraint Satisfaction Problems [7.4] 我々はLong-chain Reflective Reasoning capabilities of Large Language Models (LLMs)を評価するために設計された新しいベンチマークLR$2$Benchを紹介する。
実験結果から,DeepSeek-R1やOpenAI o1-previewのような先進的な推論モデルでさえ,LR$2$Benchのタスクと競合することが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:36:01 GMT)
Rethinking Image Evaluation in Super-Resolution [7.3] SR性能は低品質のGTによってモデル間で一貫して影響を受けられることを示す。
画像対の相対的品質差を測定する新しい知覚品質指標である相対品質指標(RQI)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:25:48 GMT)
High-entropy Advantage in Neural Networks' Generalizability [7.2] 本稿では、ニューラルネットワークにエントロピーの概念を導入し、それを仮想物理系として再認識する。
ニューラルネットワークのエントロピーランドスケープを,4つの異なる機械学習タスクのトレーニング損失とテスト精度(あるいは損失)の関数として構築する。
以上の結果から,高エントロピー状態は古典的訓練によって到達した状態よりも優れていた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:16:25 GMT)
Gradient Extrapolation for Debiased Representation Learning [7.2] GERNE(Gradient Extrapolation for Debiased Representation Learning)は、未知の属性トレーニングケースと未知の属性トレーニングケースの両方において、バイアス付き表現を学習するように設計されている。
GERNEは、ERM、reweighting、resamplingといったメソッドをデバイアスする一般的なフレームワークとして機能し、特別なケースとして示される。
提案手法は5つのビジョンと1つのNLPベンチマークで検証され、最先端のベースライン手法と比較して競争力があり、しばしば優れた性能を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:48:57 GMT)
LLM Test Generation via Iterative Hybrid Program Analysis [7.1] Pantaは、コードを分析し、テストケースを構築する際に、人間が従う反復的なプロセスをエミュレートするテクニックである。
オープンソースプロジェクトのサイクロマティックな複雑性の高いクラスで実施した経験的評価は,Pantaが26%,ブランチカバレッジが23%向上したことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:10:38 GMT)
UCF-Crime-DVS: A Novel Event-Based Dataset for Video Anomaly Detection with Spiking Neural Networks [7.1] ダイナミックビジョンセンサー(DVS)は、視覚情報を非常に高いダイナミックレンジと時間分解能を持つ離散イベントとして捉えている。
このリッチなダイナミックな情報を監視分野に導入するために、最初のDVSビデオ異常検出ベンチマークであるUCF-Crime-DVSを作成しました。
この新しいデータモダリティをフル活用するために、マルチスケールスパイキング融合ネットワーク(MSF)は、スパイキングニューラルネットワーク(SNN)に基づいて設計されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:11:26 GMT)
PANDORA: Diffusion Policy Learning for Dexterous Robotic Piano Playing [7.0] 本稿では,ロボットピアノ演奏のための新しい拡散型ポリシー学習フレームワークであるPANDORAについて述べる。
提案手法では,FILMに基づくグローバルコンディショニングにより拡張された条件付きU-Netアーキテクチャを用いて,ノイズの多い動作シーケンスをスムーズな高次元トラジェクトリに繰り返し分解する。
本研究では,タスク固有精度,音声の忠実度,および大規模言語モデル(LLM)オラクルからの高レベルな意味フィードバックを組み込んだ複合報酬関数を設計する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:22:34 GMT)
Assessing the Robustness of LLM-based NLP Software via Automated Testing [7.0] 本稿では,AutOmated Robustness Testing frAmework, AORTAを紹介する。
本稿では,アダプティブビームサーチ (Adaptive Beam Search) と呼ばれる AORTA 内における LLM ベースのソフトウェアの新しいテスト手法を提案する。
ABSはLLMの広範な特徴空間に合わせて調整されており、適応ビーム幅とバックトラック機能により試験効率を向上させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:42:06 GMT)
Probabilistic Shielding for Safe Reinforcement Learning [6.9] 現実のシナリオでは、強化学習(RL)エージェントはトレーニング時間を含む安全な振る舞いをしなければならない。
我々は,Safe RLの厳密な保証を享受する,スケーラブルな新しい手法を提案する。
当社のアプローチは、トレーニングやテスト時にエージェントが安全であることを保証する厳格な公式な安全保証を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:26:39 GMT)
Generative AI for Software Architecture. Applications, Trends, Challenges, and Future Directions [6.9] 我々は、ソフトウェアアーキテクチャにおけるGenAIの使用、合理化、コンテキスト、ユーザビリティ、および将来の課題を体系的に総合することを目指している。
アーキテクチャ決定支援とアーキテクチャ再構築のためのGenAIの導入について検討した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:49:30 GMT)
Leveraging Large Language Models for Collective Decision-Making [6.9] ミーティングのスケジューリング、コラボレーション、プロジェクト計画など、さまざまな作業コンテキストにおいて、集合的な意思決定は不可欠だが、しばしば困難である。
本稿では,Large Language Models (LLMs) を利用して,対話の管理と個人の好みのバランスをとることによって,グループ意思決定を容易にするシステムを提案する。
本システムの目的は,各メンバーの会話から個人の好みを抽出し,メンバーの好みを満たす選択肢を提案することである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:50:13 GMT)
LLM-Match: An Open-Sourced Patient Matching Model Based on Large Language Models and Retrieval-Augmented Generation [6.9] 患者マッチングとは、患者を適切な臨床試験に結びつけるプロセスであり、医療記録を正確に識別し、治験適格基準と整合させることである。
LLM-Matchは、細調整されたオープンソースの大規模言語モデルを活用する、患者マッチングのための新しいフレームワークである。
我々は、オープンソースモデルを用いて、n2c2、SIGIR、TREC 2021、TREC 2022の4つのオープンデータセットで評価し、TrialGPT、Zero-Shot、GPT-4ベースのクローズドモデルと比較した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:31:55 GMT)
A Survey of State of the Art Large Vision Language Models: Alignment, Benchmark, Evaluations and Challenges [6.7] マルチモーダル視覚言語モデル (VLM) は、機械が視覚とテキストの両方のモダリティを通して世界を知覚し、推論することを可能にする。
研究の急速な進歩と研究の普及にもかかわらず、VLMに関する既存の研究に関する総合的な調査は特に欠落している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:24:48 GMT)
C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales [6.7] 我々は、注目に基づく画像超解像モデルの最適化のための新しいフレームワーク、textbfC2D-ISRを提案する。
このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。
さらに,既存のアテンションベースネットワーク構造を用いて階層符号化機構を一般化する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:52:18 GMT)
A Principled Framework for Evaluating on Typologically Diverse Languages [6.7] 本稿では,多種多様言語を選択するための言語サンプリングフレームワークを提案する。
我々の体系的手法は、NLPの従来の方法よりも、型論的に多様な言語選択を一貫して取り出すことがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:19:14 GMT)
Learning-based 3D Reconstruction in Autonomous Driving: A Comprehensive Survey [6.7] 学習に基づく3D再構成は、自律運転におけるトランスフォーメーション技術として登場した。
我々は,近年の学習に基づく3D再構成の進歩を,多視点で詳細に分析する。
開発動向と既存の課題は、自律運転における学習に基づく3D再構築の文脈で要約される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:56:03 GMT)
HiMTok: Learning Hierarchical Mask Tokens for Image Segmentation with Large Multimodal Model [6.6] 最大32個のトークンを持つセグメンテーションマスクを表すHiMTok(Hierarchical Mask Tokenizer)を提案する。
HiMTokは、コンパクトで粗いマスク表現を可能にし、次世代の予測パラダイムとよく一致している。
分割と視覚能力の進歩的な学習のための3段階のトレーニングレシピを開発し,階層的なマスクロスを特徴とし,より効果的な粗い学習を行う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:29:08 GMT)
ProtoDepth: Unsupervised Continual Depth Completion with Prototypes [6.6] ProtoDepthは、教師なし深度補完の継続学習のためのプロトタイプベースのアプローチである。
凍結事前学習モデルの潜伏した特徴を新しい領域に適応させるプロトタイプセットを学習することで、忘れることに対処する。
ProtoDepthをベンチマークデータセットシーケンスで評価し、ベースラインと比較して、屋内では52.2%、屋外では53.2%の差を小さくする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:25:49 GMT)
Goal2Story: A Multi-Agent Fleet based on Privately Enabled sLLMs for Impacting Mapping on Requirements Elicitation [6.5] Goal2Storyは、Impact Mapping(IM)フレームワークを採用したマルチエージェントのフリートであり、単にゴール駆動REにコスト効率のよいsLLMを使用するだけである。
StorySeekデータセットには、対応する目標とプロジェクトコンテキスト情報を備えた1,000以上のユーザストーリ(US)が含まれている。
評価のために,FHR(Factality Hit Rate)とQuACE(Quality And Consistency Evaluation)の2つの指標を提案した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:31:20 GMT)
AI-driven Automation of End-to-end Assessment of Suturing Expertise [6.5] 我々は、サチューリングエキスパートズ(EASE)のエンドツーエンド評価を自動化するAIベースのアプローチを提案する。
EASEは、縫合に関するきめ細かいスキルアセスメントを提供し、実践可能な洞察とともに、訓練生に自身の適性に対する客観的な評価を提供する。
AIベースのアプローチは、モデル推論中に最小限のリソースでリアルタイムスコア予測を可能にすることで、この問題を解決する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:28:02 GMT)
Evaluating Programming Language Confusion [6.5] コードのための大規模言語モデル(Code LLM)は、ソフトウェア工学において大きな注目を集めている。
これらのモデルは、プログラミング概念の理解、アルゴリズムの実装、さらには異なるプログラミング言語のブリッジ化において、顕著な能力を示してきた。
これらの進歩にもかかわらず、コードLLMは、意図しない言語でコードを生成するために、しばしばプログラミング言語の混乱に苦しむ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:14:15 GMT)
Analyzing Swimming Performance Using Drone Captured Aerial Videos [6.4] 本稿では,移動型UAVを用いたスイマー追跡手法を提案する。
提案システムは、高解像度カメラを備えたUAVを用いて、スイマーの空中映像を撮影する。
映像はコンピュータビジョンアルゴリズムを用いて処理され、スイマーの位置と動きを抽出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:38:44 GMT)
Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model [6.4] 大規模言語モデル(LLM)には、多様な言語関連タスクを処理できる機能がある。
大規模言語モデル(LLM)における継続的な学習は、LLMを新しいタスクに継続的に適応させることを目的としている。
本稿では,これらの課題に対処するため,ASR(Analytic Subspace Routing)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:40:46 GMT)
A Reinforcement Learning-Driven Transformer GAN for Molecular Generation [6.4] 本研究では,これらの課題に対処するために,トランスフォーマーをベースとした新しい離散GANフレームワークであるRL-MolGANを紹介する。
従来のTransformerとは異なり、RL-MolGANは最初のデコーダ-then-encoder構造を利用して、$denovo$と足場ベースの設計の両方から薬物のような分子を生成する。
さらに、RL-MolGANは強化学習(RL)とモンテカルロ木探索(MCTS)技術を統合し、GANトレーニングの安定性を高め、生成分子の化学的性質を最適化する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:06:10 GMT)
Treble Counterfactual VLMs: A Causal Approach to Hallucination [6.4] VisionLanguage Models (VLM) には、画像キャプション、視覚的質問応答、推論といった高度なマルチモーダルタスクがある。
視覚的文脈やプロンプトと矛盾しない幻覚出力をしばしば生成する。
既存の研究では、幻覚は統計的バイアス、言語優先、偏見のある特徴学習と結びついているが、構造的な因果理解は欠如している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:11:52 GMT)
A Comprehensive Survey on Multi-Agent Cooperative Decision-Making: Scenarios, Approaches, Challenges and Perspectives [6.3] 多エージェント協調意思決定は、複数のエージェントが協力して、確立されたタスクを完了し、特定の目的を達成する。
これらの技術は、自律運転、ドローンナビゲーション、災害救助、シミュレートされた軍事的対立といった現実のシナリオに広く応用されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:45:46 GMT)
Quantifying the Reliability of Predictions in Detection Transformers: Object-Level Calibration and Image-Level Uncertainty [6.2] 実際には、DETRは画像に存在するオブジェクトの実際の数よりはるかに多い数百の予測を生成する。
これらすべての予測を信頼し、使用できますか?
我々は、同じ画像内の異なる予測がどのように異なる役割を果たすかを示す実証的な証拠を示し、その結果、信頼性のレベルが異なることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:35:23 GMT)
LEAVS: An LLM-based Labeler for Abdominal CT Supervision [6.2] LEAVSは腹部ビジョン・スーパービジョンのための大きな言語モデルである。
腹部X線検査では,9例の腹部臓器に7種類の異常が認められた。
腹腔内臓器のいくつかの異常型を抽出し、平均F1スコアは0.89であり、競合するラベルや人間よりも著しく優れている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:09:22 GMT)
Towards Scalable Modeling of Compressed Videos for Efficient Action Recognition [6.2] 提案するハイブリッドなエンドツーエンドフレームワークは,3つの重要な概念にまたがって学習を分解し,推論コストを先行技術に対して330倍に削減する。
実験により,本手法は最先端のビデオ認識性能を実現する軽量なアーキテクチャを実現することが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:13:48 GMT)
Novel AI-Based Quantification of Breast Arterial Calcification to Predict Cardiovascular Risk [6.2] マンモグラフィー検査における動脈石灰化(BAC)は、心血管疾患のリスクのある女性を同定することができる。
トランスフォーマーベースのニューラルネットワークは、マンモグラムのスクリーニングにおいてBACの重症度(BACを含まない、軽度、中度、重度)を定量化した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:38:17 GMT)
Stereo Event-based, 6-DOF Pose Tracking for Uncooperative Spacecraft [6.2] イベントカメラには、高ダイナミックレンジ、高時間分解能、低消費電力などの多くの利点がある。
ステレオイベントカメラを用いた非協調宇宙船のラインベースポーズトラッキング手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:51:00 GMT)
XChainDataGen: A Cross-Chain Dataset Generation Framework [6.1] 本稿では,ブロックチェーンからクロスチェーンデータを抽出し,クロスチェーントランザクション(cctx)のデータセットを生成するツールであるXChainDataGenを提案する。
XChainDataGenを使用して、2024年の最後の7ヶ月で11のブロックチェーン上にデプロイされた5つのクロスチェーンプロトコルから、35GB以上のデータを抽出しました。
クロスチェーントークン転送で28億米ドル以上を移動した11,285,753個のcctxを同定した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:39:43 GMT)
Diffusion Suction Grasping with Large-Scale Parcel Dataset [6.1] 提案するParcel-Suction-Datasetは,4億1000万の高精度な吸引把握ポーズを備えた,25万の散布シーンを含む大規模合成データセットである。
このデータセットは、最適吸引グリップの効率的な生成を可能にする新しい幾何サンプリングアルゴリズムによって生成される。
また、条件生成タスクとして、吸引把握予測を再構成する革新的なフレームワークであるDiffusion-Suctionを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:26:36 GMT)
Prompting Medical Large Vision-Language Models to Diagnose Pathologies by Visual Question Answering [6.1] 本稿では,幻覚を減らし,VQA性能を向上させるMLVLMの2つのプロンプト戦略を提案する。
MIMIC-CXR-JPGおよびChexpertデータセットを用いて検討したところ,診断精度は有意に向上した。
POPE測定値に基づいて、既存のLVLMの偽陰性予測を効果的に抑制し、リコールを約0.07改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:27:45 GMT)
AI Companies Should Report Pre- and Post-Mitigation Safety Evaluations [6.0] フロンティアAI企業は、事前および後安全評価の両方を報告すべきである。
両段階におけるモデルの評価は、政策立案者に、配備、アクセス、安全基準を規制するための重要な証拠を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:56:43 GMT)
Riemannian Laplace Approximation with the Fisher Metric [6.0] ラプラスの手法は、目標密度とガウス分布をそのモードで近似する。
複雑なターゲットと有限データ後部では、しばしば近似が粗すぎる。
我々は、無限データの範囲内で正確である2つの代替変種を開発する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:02:56 GMT)
Hybrid Work in Agile Software Development: Recurring Meetings [5.9] 本研究では,大規模アジャイル環境でのハイブリットワークにおけるミーティングの組織化と実施について検討する。
この調査から得られた重要な洞察は、アジャイルソフトウェア開発におけるさまざまなタイプのミーティングは、主に現場または遠隔で組織化されるべきである、ということだ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:58:06 GMT)
Quantum-Enhanced LLM Efficient Fine Tuning [5.9] Low-Rank Adaptation (LoRA)は、事前訓練された言語モデルの効率的な微調整を可能にする。
低ランク表現能力は複雑なタスクや高ランク依存設定で制約される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:59:26 GMT)
BASED: Bundle-Adjusting Surgical Endoscopic Dynamic Video Reconstruction using Neural Radiance Fields [5.8] 内視鏡的映像から変形可能なシーンを再現することは,多くの応用において重要である。
我々の研究は、シーンの3D暗黙的表現を学習するために、NeRF(Neural Radiance Fields)アプローチを採用しています。
本稿では,ロボット手術の内視鏡的手術シーンについて述べる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:24:04 GMT)
A Circular Construction Product Ontology for End-of-Life Decision-Making [5.7] Circular Construction Product Ontology (CCPO)は、EoL意思決定における意味とデータの課題を克服するために設計されたフレームワークである。
異なるデータを統一された製品に集約することで、CCPOは自動EoLレコメンデーションを可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:28:08 GMT)
Spectrally-Corrected and Regularized QDA Classifier for Spiked Covariance Model [5.7] 二次判別分析(QDA)は分類問題において広く用いられている手法である。
SR-QDAと呼ばれるスペクトル補正と正則化技術を利用した新しいQDA手法を提案する。
その結果, SR-QDAは特に中等度・高次元の状況において, 極めて良好に機能することが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:21:03 GMT)
Are Metrics Enough? Guidelines for Communicating and Visualizing Predictive Models to Subject Matter Experts [5.7] 本稿では,コミュニケーションのギャップを理解するために,課題の専門家とデータ科学者の双方による反復的研究について述べる。
モデルの強みと弱みを伝達するための共通媒体として可視化を利用する一連のコミュニケーションガイドラインを導出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:19:41 GMT)
Sightation Counts: Leveraging Sighted User Feedback in Building a BLV-aligned Dataset of Diagram Descriptions [5.7] 視覚言語モデル(VLM)が生み出す図形記述(ダイアグラム記述)を評価することを求める。
Sightationは、5kのダイアグラムと137kのサンプルからなるダイアグラム記述データセットのコレクションで、完成、選好、検索、質問応答、推論トレーニングの目的でリリースします。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:52:46 GMT)
Beyond Propagation of Chaos: A Stochastic Algorithm for Mean Field Optimization [5.7] 2-ワッサーシュタイン空間の勾配流は、確率分布よりも関数を最適化するために広く用いられている。
アルゴリズムの出力は、無限粒子極限に類似した条件下での最適分布に収束することを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:37:53 GMT)
BLIA: Detect model memorization in binary classification model through passive Label Inference attack [5.6] 本稿では,2つの新しいラベル推論攻撃(BLIA)による二項分類モデルのラベル記憶について検討する。
カナリア」と呼ばれる制御されたサブセットのラベルの50%を意図的に反転させることで、2つの条件下でのラベル記憶の程度を評価する。
ラベルDPの様々な程度の適用にもかかわらず、提案された攻撃は一貫して50%以上の成功率を達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:15:47 GMT)
HICD: Hallucination-Inducing via Attention Dispersion for Contrastive Decoding to Mitigate Hallucinations in Large Language Models [5.6] 大規模言語モデル(LLM)は、しばしば幻覚を生成し、文脈的に不正確または事実的に不正確な出力を生成する。
我々は,幻覚を緩和する対照的な復号法として,幻覚を誘導する新しい手法HICDを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:17:28 GMT)
All You Need to Know About Training Image Retrieval Models [5.5] 我々は、これらの要因のそれぞれが取得精度に与える影響を理解するために、数万のトレーニングを実行します。
また、複数のデータセットにまたがるベストプラクティスを見つけます。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:50:34 GMT)
ASMR: Adaptive Skeleton-Mesh Rigging and Skinning via 2D Generative Prior [5.4] 骨格運動データを用いた文字メッシュの自動リギングとスキンニングのための新しい手法を提案する。
提案手法は,メッシュサイズと比率に応じて最適な骨格を予測し,メッシュスケルトン構成のスキンウェイトを定義する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:59:02 GMT)
Scalable Robust Quantum Control for Semiconductor Spin Qubits with Always-on Couplings [5.4] 常に結合する半導体スピン量子ビット系における高忠実ゲート動作を可能にする頑健な量子制御フレームワークを実証する。
提案手法は, 高オン/オフ比チューナブルカプラを必要とせず, 静的結合雑音と時間依存クロストークの両方を抑制する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:03:31 GMT)
Job Shop Scheduling Benchmark: Environments and Instances for Learning and Non-learning Methods [5.4] ジョブショップスケジューリング問題は、ジョブショップ設定におけるタスクのルーティングとシークエンシングに対処する。
本稿では,ジョブショップスケジューリング問題の統一実装とその解法について紹介する。
私たちのプラットフォームは、古典的なジョブショップ(JSP)、フローショップ(FSP)、フレキシブルジョブショップ(FJSP)、アセンブリジョブショップ(AJSP)をサポートしています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:18:45 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [5.4] 本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。
道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:07:59 GMT)
Beyond RGB: Adaptive Parallel Processing for RAW Object Detection [5.4] Raw Adaptation Module (RAM)は、従来の画像信号処理(ISP)を置き換えるために設計されたモジュールである。
提案手法はRGBに基づく手法より優れており,様々なRAW画像データセットにまたがって最先端の結果が得られる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:36:49 GMT)
ArtFormer: Controllable Generation of Diverse 3D Articulated Objects [5.3] 本稿では,3次元調音物体のモデリングと条件生成のための新しい枠組みを提案する。
トークンのツリーとして記述されたオブジェクトをパラメータ化し、トランスフォーマーを用いてオブジェクトの高レベルな幾何コードとその運動的関係を生成する。
提案手法により,高品質な形状と部品数の異なる多種多様なオブジェクトの生成が可能となる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:22:54 GMT)
Long-VMNet: Accelerating Long-Form Video Understanding via Fixed Memory [5.3] Long-Video Memory Network、Long-VMNetは、新しいビデオ理解手法である。
Long-VMNetは、識別トークンを識別するニューラルサンプリングを利用することにより、効率の向上を実現している。
本研究では,Rest-ADLデータセットを用いて,長文ビデオ検索と回答のための推論時間を18~75倍改善したことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:25:41 GMT)
Explainable Differential Privacy-Hyperdimensional Computing for Balancing Privacy and Transparency in Additive Manufacturing Monitoring [5.3] 本稿では,DP-HDフレームワークについて紹介する。
DP-HDはDPノイズレベルを正確に調整し、プライバシーと性能の最適なバランスを確保する。
医療、金融サービス、政府データ管理など、プライバシに敏感な分野において、より広範な応用を約束している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:17:59 GMT)
Beemo: Benchmark of Expert-edited Machine-generated Outputs [5.2] エキスパートによる機械生成出力(Beemo)のベンチマーク
本稿では,エキスパート編集機械生成出力(Beemo)のベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:05:36 GMT)
Integrating AI for Human-Centric Breast Cancer Diagnostics: A Multi-Scale and Multi-View Swin Transformer Framework [5.2] この論文は、乳癌の診断を強化するためのヒューマン・センターワークフローにおけるAIの統合に焦点を当てている。
診断の堅牢性と精度を高めるハイブリッド・マルチスケール・マルチビューSwin Transformerベースのフレームワーク(MSMV-Swin)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:48:56 GMT)
Quantum error detection in qubit-resonator star architecture [5.1] 恒星トポロジー超伝導QPUにおける2つの論理量子ビットを符号化する。
我々は、すべての基数論理状態に対して96パーセント以上の論理状態の忠実度を測定する。
提案したQPU構成は、キュービット数効率の良いQECコードを可能にするために使用できる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:55:25 GMT)
Subgroup Performance of a Commercial Digital Breast Tomosynthesis Model for Breast Cancer Detection [5.1] 本研究では,163,449検診大振り返りコホートにおけるLunit INSIGHTモデルの粒度評価を行った。
成績は人口統計学的に良好であったが,非浸潤性癌では有意に低い成績を示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:17:36 GMT)
On Local Posterior Structure in Deep Ensembles [5.0] BNN(DE)の深いアンサンブルは校正を改善することが知られている。
アンサンブルが十分に大きくなると、DESは配信内データでD-BNNを一貫して上回ります。
最後のコントリビューションとして、このトピックに関するさらなる研究を促進するために、トレーニングされたモデルの大規模なプールをオープンソースにしています。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:41:39 GMT)
Leveraging Deep Neural Networks for Aspect-Based Sentiment Classification [5.0] EEGCNは、構文グラフを処理するときに機能の整合性を維持することにより、パフォーマンスを向上させる。
双方向長短期メモリ(Bi-LSTM)ネットワークと自己注意型トランスフォーマを併用し,テキストエンコーディングを効果的に行う。
4つのベンチマークデータセットの大規模な評価とアブレーション研究は、EEGCNがアスペクトベースの感情分析を著しく強化することを示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:19:20 GMT)
Evaluating the Instruction-following Abilities of Language Models using Knowledge Tasks [4.9] 我々は,知識と指示の相互作用について検討し,LLMが単純な回答修正命令に従うのに苦労していることを観察する。
テキスト操作や数値処理,リスト操作,インタプリタ命令など,単純な命令のセットを適用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:45:15 GMT)
Visually Wired NFTs: Exploring the Role of Inspiration in Non-Fungible Tokens [4.9] この研究は、視覚変換器とグラフベースのモデリングを利用して、NFT間の視覚的なインスピレーション現象を長年研究してきた。
私たちの目標は、視覚インスピレーションネットワークを形成する主な構造特性の公開、視覚インスピレーションとアセットパフォーマンスの相互関係の調査、インスピレーションプロセスに対する暗号の影響の調査です。
インスピレーションの広汎さが視覚的特徴空間の一時的な飽和、インスピレーションとインスピレーションの2分断が財務成績に及ぼす影響、市場とインスピレーションの波による本質的な自己調節機構の解明につながった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:07:22 GMT)
Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text [4.9] WhosAIは、与えられた入力テキストが人間かAIによって生成されたかを予測するために設計された3重ネットワークコントラスト学習フレームワークである。
提案するフレームワークは,チューリングテストとオーサリングの両タスクにおいて,優れた結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:19:05 GMT)
Image Intrinsic Scale Assessment: Bridging the Gap Between Quality and Resolution [4.9] 画像内在性尺度 (IIS) は,画像が最も知覚される品質を示す最大規模の尺度である。
人的判断に基づいてIISを主観的に測定・予測する画像固有スケールアセスメント(IISA)タスクを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:32:40 GMT)
DeepDiveAI: Identifying AI Related Documents in Large Scale Literature Data [4.9] 本稿では,大規模文献データベースからAI関連文書を自動的に分類する手法を提案する。
データセット構築アプローチは、専門家の知識と高度なモデルの能力を統合する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:46:22 GMT)
Do Unit Proofs Work? An Empirical Study of Compositional Bounded Model Checking for Memory Safety Verification [4.8] メモリ安全性の欠陥は、ソフトウェアの信頼性に大きな脅威をもたらし、サイバー攻撃、停電、クラッシュを可能にします。
これらのリスクを軽減するため、組織はコンポジション境界モデルチェック(BMC)を採用し、ユニット証明を使用してメモリ安全性を正式に検証する。
しかし、ユニットテストを作成する方法は組織によって異なり、同じプロジェクト内で一貫性がないため、エラーや欠陥が失われる。
本研究は,メモリ安全性検証のためのユニット証明に関する最初の実証的研究である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:55:12 GMT)
ROMA: a Read-Only-Memory-based Accelerator for QLoRA-based On-Device LLM [4.8] ROMAは、ROMを量子化されたベースモデルとLoRA重みとKVキャッシュに使用するハイブリッドストレージアーキテクチャである。
LoRAモジュールは、ベースモデルのアップデートを必要とせずに、新しいデータに適応する柔軟性を提供する。
ROMAは、4ビットの3Bと2ビットの8B LLaMAモデルを完全にオンチップで保存することができ、外部メモリを必要とせずに2万トークン/秒を超える顕著な生成速度を達成することができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:44:17 GMT)
The Best Time for an Update: Risk-Sensitive Minimization of Age-Based Metrics [4.8] 送信されたデータ品質を定量化する方法は、情報時代(AoI)、情報検索時代(QAoI)、不正確な情報時代(AoII)である。
我々は,これらのメトリクスを,送信機がプロセスを監視して受信機にステータス更新を送信するポイント・ツー・ポイント無線通信システムとして検討する。
不安定なシステム状態などの合併症を引き起こす高年齢計量値の固有のリスクのため,リスク状態という新しい概念を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:39:25 GMT)
Distributed Black-box Attack: Do Not Overestimate Black-box Attacks [4.8] ブラックボックスの敵攻撃は、モデル構造や重みにアクセスできることなく、画像分類モデルを騙すことができる。
最近の研究によると、攻撃の成功率は95%以上で、クエリは1000に満たない。
我々の研究は、ブラックボックス攻撃が研究論文で提案されているように、クラウドAPIに対して効果的ではないことを示唆している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:22:14 GMT)
Towards Resource-Efficient Compound AI Systems [4.7] 複合AIシステムは、モデル、レトリバー、外部ツールなどの複数の相互作用コンポーネントを統合する。
現在の実装は、アプリケーションロジックと実行の詳細の密結合によって、非効率なリソース利用に悩まされています。
本稿では、動的スケジューリングとリソース認識意思決定のための宣言型ワークフロープログラミングモデルと適応型ランタイムシステムを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:14:48 GMT)
Subjective Face Transform using Human First Impressions [4.7] この研究は生成モデルを用いて、認識属性を変更する顔画像に意味論的に意味のある編集を見つける。
我々は、実際の顔と合成顔のトレーニングを行い、予測モデルと人間の評価を用いてドメイン内画像とドメイン外画像の評価を行う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:40:34 GMT)
TNCSE: Tensor's Norm Constraints for Unsupervised Contrastive Learning of Sentence Embeddings [4.6] 本稿では,新しい文埋め込み表現フレームワーク TNCSE を提案する。
我々は,7つの意味的テキスト類似性タスクを評価し,TNCSEと派生モデルが現在最先端のアプローチであることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:14:42 GMT)
An Online Integrated Development Environment for Automated Programming Assessment Systems [4.6] 本研究は,オンラインIDEの要件を抽出し,定義することで,プログラミング教育の分野に貢献する。
新しいオンラインIDEのユーザビリティをTechnology Acceptance Model (TAM)を用いて評価し,27人の初等生からフィードバックを得た。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:50:51 GMT)
Mitigating Cross-Modal Distraction and Ensuring Geometric Feasibility via Affordance-Guided, Self-Consistent MLLMs for Food Preparation Task Planning [4.5] 食品準備作業計画のためのコンテキスト内学習によるMLLM(Multimodal Large Language Models)について検討する。
クロスモーダルな散逸と幾何学的実現可能性の2つの主要な課題を識別する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:01:02 GMT)
Can Language Models Follow Multiple Turns of Entangled Instructions? [4.4] 現実世界のシナリオは、秘密のプライバシ、個人の好み、優先順位付けなど、時間とともに複数の命令をまたいだ一貫性を必要とする。
本研究は,多方向命令処理における大規模言語モデルの能力について,系統的研究を行った。
我々は,Human-in-the-loopアプローチを用いて,約1.1Kの高品質なマルチターン会話を用いたMultiTurnInstructを構築した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:31:37 GMT)
On the Convergence of Monte Carlo UCB for Random-Length Episodic MDPs [4.4] モンテカルロ UCB における Q 関数は最適 Q 関数にほぼ確実に収束することを示す。
この結果の直接的な結論は、すべての有限ホライゾン MDP に対してほぼ確実に収束するということである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:29:03 GMT)
Advanced computer vision for extracting georeferenced vehicle trajectories from drone imagery [4.4] 本稿では,高高度ドローン画像からジオレファレンス車両軌跡を抽出する枠組みを提案する。
研究は韓国のソンド国際事業地区で行われた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:25:50 GMT)
QPRAC: Towards Secure and Practical PRAC-based Rowhammer Mitigation using Priority Queues [4.3] JEDECは、DDR5と将来のDRAMのためのPer Row Activation Counting (PRAC)フレームワークを導入した。
PRACはローハンマー攻撃の全体的緩和を可能にする。
本稿では,PRACフレームワークを使用した最初のセキュアでスケーラブルで実用的なRowHammerソリューションを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:03:50 GMT)
Bridging Neural and Symbolic Representations with Transitional Dictionary Learning [4.3] 本稿では,記号的知識を暗黙的に学習できる新しいトランジショナル辞書学習(TDL)フレームワークを提案する。
本稿では,期待最大化法(EM)アルゴリズムで学習した辞書を用いて,入力を視覚部分へ分解するゲーム理論拡散モデルを提案する。
3つの抽象的な合成視覚オブジェクトデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:44:57 GMT)
Lifelong Reinforcement Learning with Similarity-Driven Weighting by Large Models [4.3] 学習過程を制御するために,大規模言語モデル生成動的関数を利用する新しいフレームワークSDWを提案する。
SDWの中核は、タスク類似性関数と重み計算関数という、大きなモデルによって事前に生成される2つの関数にある。
Atari と MiniHack のシーケンシャルタスクに対する実験結果から,SDW が既存の長寿命強化学習法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:36:16 GMT)
SOSecure: Safer Code Generation with RAG and StackOverflow Discussions [4.3] 大規模言語モデル(LLM)は、コードの自動生成に広く使われている。
頻繁に更新される事前トレーニングデータへの依存は、新たに発見された脆弱性やセキュリティ標準の進化に気付かないままである。
本稿では,LLM生成コードのセキュリティ向上のために,SO議論で見出されたセキュリティの総合的専門知識を活用する検索型拡張生成システムであるSOSecureを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:03:36 GMT)
Disentangling the Power Dynamics in Participatory Data Physicalisation [4.2] 参加型データ物理化は利害関係者間のデータ駆動決定をサポートする。
根底にある力力学の影響を受けており、抽出的参加、余剰化、排除といった問題に繋がる可能性がある。
本研究は、データ物理化と参加型データ可視化における責任をオープンに反映し、共有することを研究者や実践者に指導することで、フェミニストの研究課題を推し進めるものである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:22:26 GMT)
APF+: Boosting adaptive-potential function reinforcement learning methods with a W-shaped network for high-dimensional games [4.1] 本稿では,高次元のゲームフレームを低次元の埋め込みに投影する状態符号化手法により,適応ポテンシャル関数(APF)を拡張することを提案する。
また,20試合中,APF-WNet-DDQNはDDQN (14/20ゲーム) とAPF-STDIM-DDQN (13/20ゲーム) を上回った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:53:26 GMT)
Enhancing Circuit Trainability with Selective Gate Activation Strategy [4.1] ハイブリッド量子古典コンピューティングは、量子化学や機械学習といった様々な分野の課題に取り組むために、変分量子アルゴリズム(VQA)に大きく依存している。
VQAは、回路のトレーサビリティと表現性の間のバランスという限界に直面している。
本研究では,これらの課題に対する潜在的な解決策として,選択ゲートアクティベーション戦略について検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:10:35 GMT)
FaceQSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features [4.1] FaceQSORTと呼ばれる新しい多面追跡手法を提案する。
バイオメトリックと視覚的外観の特徴(同じ画像(顔)パッチから抽出される)を組み合わせて、関連付けを行う。
FaceQSORTは、検討されたシナリオにおいて最先端のトラッカーよりも優れていることが示されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:08:11 GMT)
Next-Scale Autoregressive Models are Zero-Shot Single-Image Object View Synthesizers [4.0] ArchonViewは,3Dレンダリングデータのみをスクラッチからトレーニングし,2D事前トレーニングを行わないにも関わらず,最先端のメソッドをはるかに上回る方法である。
また,従来の手法が失敗する難易度カメラにも頑健な性能を示し,拡散よりも推論速度が数倍高速であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:59:59 GMT)
Collaborative AI Enhances Image Understanding in Materials Science [4.0] Copilot for Real-world Experimental Scientist (CRESt)システムによって、研究者は会話型AIを通じて自律的な研究室を制御することができる。
我々は,ChatGPTモデルとGeminiモデルの相補的な強みを利用するマルチエージェント協調機構を統合することにより,CREStを強化した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:44:30 GMT)
Metric properties of partial and robust Gromov-Wasserstein distances [3.9] グロモフ=ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は、最適な輸送のアイデアに基づいて、メトリクスの族を定義する。
GW距離は本質的に外れ音に敏感であり、部分的マッチングに対応できない。
我々の新しい距離は真の測度を定義し、それらがGW距離と同じ位相を誘導し、摂動にさらなる堅牢性をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:15:01 GMT)
InsightDrive: Insight Scene Representation for End-to-End Autonomous Driving [3.9] 我々はInsightDriveと呼ばれる新しいエンドツーエンドの自動運転手法を提案する。
言語誘導されたシーン表現によって知覚を整理する。
実験では、InsightDriveはエンドツーエンドの自動運転において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:52:32 GMT)
FedSDP: Explainable Differential Privacy in Federated Learning via Shapley Values [3.9] フェデレートラーニング(FL)は、参加者がトレーニングで協力しながらデータをローカルに保存することを可能にするが、プライバシ攻撃に弱いままである。
本稿では,プライバシコントリビューションに基づくノイズ注入を誘導するプライバシ保護機構であるFedSDPを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:14:19 GMT)
Fire and Smoke Datasets in 20 Years: An In-depth Review [3.9] 火と煙の現象は、自然環境、生態系、世界経済、さらには人間の生活や野生生物に重大な脅威をもたらす。
早期発見、リアルタイム監視、火災の全体的な影響を最小化するための効果的な戦略を実現するための、より高度で高度な技術が求められている。
これらのシステムは、検出や監視など、さまざまなタスクのための熟練した機械学習(ML)メソッドを作成するために、適切に高品質な火と煙のデータが利用可能であることに大きく依存している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:08:02 GMT)
DTGBrepGen: A Novel B-rep Generative Model through Decoupling Topology and Geometry [3.9] 幾何学モデルの境界表現(B-rep)はCADの基本形式である
B-rep生成のための新しいトポロジ・ジオメトリ・デカップリングフレームワークDTGBrepGenを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:34:14 GMT)
Could AI Leapfrog the Web? Evidence from Teachers in Sierra Leone [3.8] 平均Web検索結果はAIレスポンスの3,107倍のデータを消費する。
教師は、AIの反応をWeb検索結果よりも関連性があり、役に立つ、そして正しいと評価する。
これらの結果は、AI駆動のソリューションが低接続領域の情報ギャップを効果的に橋渡しすることができることを示唆している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:14:56 GMT)
Reward Adaptation Via Q-Manipulation [3.8] 本稿では、学習エージェントが1つまたは複数の既存行動に基づいて目標報酬関数に適応する問題である報酬適応(RA)に対する新しい解決策を提案する。
我々の研究は、Q-関数の操作によるRAに対する新しいアプローチを表している。
Q-Manipulation (Q-M) と呼ばれる手法について述べる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:42:54 GMT)
Hypergraph $p$-Laplacian regularization on point clouds for data interpolation [3.8] ハイパーグラフはデータの高次関係をモデル化するために広く使われている。
点クラウド上の$varepsilon_n$-ballハイパーグラフと$k_n$-nearest 近傍ハイパーグラフを定義する。
半教師付き環境でのハイパーグラフ$p$-ラプラシアン正則化と$p$-ラプラシアン正則化の間の変分一貫性を証明した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:57:22 GMT)
ACT360: An Efficient 360-Degree Action Detection and Summarization Framework for Mission-Critical Training and Debriefing [3.8] ACT360は、360度ビデオと機械学習を利用して、自動アクション検出と構造化リーフを行うシステムである。
ACT360は、拡張されたYou Only Watch Once (YOWO)モデルである360YOWOを統合し、空間的注意と等方形認識畳み込み(EAC)によりパノラマビデオの歪みを緩和する。
55のラベル付き360度ビデオの公開データセットに対して,我々のアプローチを検証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:12:36 GMT)
Laplace-Net: Learning Dynamical Systems with External Forcing [3.7] ラプラスネット(Laplace-Net)は、強制学習と遅延認識システムのための、分離された、解けないニューラルネットワークフレームワークである。
Laplace-Netは、新しい強制信号に対して、システムが迅速に再訓練または微調整されるため、転送可能性を促進する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:31:12 GMT)
Realization of fermionic Laughlin state on a quantum processor [3.7] 我々は、IonQ の Aria-1 トラップイオン量子コンピュータ上で nu = 1/3 フェルミオンラウリン状態を示す。
相関ホールやカイラルエッジモードを含むラウリン状態を特徴付けるキーオブザーバブルを抽出する。
この研究は、物質固有の位相秩序をシミュレートするスケーラブルな量子フレームワークを確立する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:41:27 GMT)
Sable: a Performant, Efficient and Scalable Sequence Model for MARL [3.7] 我々は、MARLに高性能で、メモリ効率が高く、スケーラブルなシーケンスモデリングアプローチであるSableを紹介した。
SableはRetentive Networksの保持機構に適応して、マルチエージェント観測の計算的に効率的な処理を実現する。
我々は、Sableが既存の最先端メソッドを多種多様なタスクで大幅に上回っていることを実証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:39:11 GMT)
CompMarkGS: Robust Watermarking for Compression 3D Gaussian Splatting [3.7] 3DGSは数百万のガウシアンに依存しており、ギガバイトのストレージ、効率的な転送とストレージは圧縮を必要とする。
既存の3DGS透かし法は量子化に基づく圧縮に弱いため、しばしば埋め込み透かしが失われる。
本研究では,モデル圧縮後の透かしの堅牢性を保証し,高いレンダリング品質を維持しつつ,新しい透かし方式を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:32:15 GMT)
Robot Policy Transfer with Online Demonstrations: An Active Reinforcement Learning Approach [3.6] 本稿では,オンライン・デモテーションを用いたポリシ・トランスファーについて紹介する。
本手法は, 多様な環境特性にまたがる政策伝達を含む8つのロボットシナリオで評価する。
その結果, 本手法は, 平均成功率, サンプル効率において, 全ベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:47:42 GMT)
Higher-form anomaly and long-range entanglement of mixed states [3.6] 開量子系では、高次の対称性の異常と、そのような対称性を持つ任意の混合状態の長距離絡み合いを関連付ける。
我々は, (2+1)-D において, 異常に強い 1-形式対称性を持つ状態が長距離二部交絡を示すことを証明した。
我々は、高次元の混合状態に対する高形式異常と長距離多部絡みの接続を予想する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:01:17 GMT)
Analyst Reports and Stock Performance: Evidence from the Chinese Market [3.5] 本稿では、自然言語処理(NLP)を用いてテキスト情報を抽出し、定量化し、ストックパフォーマンスを予測する。
中国のアナリストの広範なデータセットを用いて、中国語のテキストにカスタマイズされたBERTディープラーニングモデルを用いて、この研究はレポートの感情を肯定的、中立的、否定的なものに分類する。
この結果は、株価のボラティリティ、過剰なリターン、取引量に対するこの指標の予測能力を強調している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:49:49 GMT)
Improving Geometric Consistency for 360-Degree Neural Radiance Fields in Indoor Scenarios [3.5] フォトリアリスティックレンダリングと新しいビュー合成は、人間とコンピュータのインタラクションタスクにおいて重要な役割を果たす。
NeRFは大規模で低テクスチャな地域でしばしば苦労し、「フローター」として知られる曇りのアーティファクトを生み出している。
困難で低機能な領域におけるレンダリング品質を向上させるために,新しい奥行き損失関数を導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:30:48 GMT)
Enhancing zero-shot learning in medical imaging: integrating clip with advanced techniques for improved chest x-ray analysis [3.5] CLIP(Contrastive Language- Image Pre-Training)をMomentum Contrast(MoCo)と統合することにより、医用画像におけるゼロショット学習の強化に向けた既存のアプローチを拡張した。
本手法は, クラス不均衡データセットとラベルなしデータセットによる課題に対処し, 肺病変の検出精度の向上を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:59:34 GMT)
Non-Destructive Detection of Sub-Micron Imperceptible Scratches On Laser Chips Based On Consistent Texture Entropy Recursive Optimization Semi-Supervised Network [3.5] 認識不能な傷でも、レーザーチップの性能と寿命は著しく低下する。
サブミクロンレベルのスクラッチは、ラベル付きデータセットの欠如によって合成された従来の方法では検出が困難である。
本稿では,一貫したテクスチャエントロピー反復最適化半教師ネットワークであるTexRecNetを紹介する。
75.6%の精度と74.8%のリコールで、従来のUnetよりも8.5%、33.6%改善している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:48:48 GMT)
A super-resolution reconstruction method for lightweight building images based on an expanding feature modulation network [3.4] 本研究では,Dilated Contextual Feature Modulation Network (DCFMN) を用いた画像超解像の軽量化手法を提案する。
DCFMNは、拡張分離可能な変調ユニットと局所特徴拡張モジュールを統合する。
このアプローチは、長距離依存関係のモデリングにおいて、既存の軽量超解像ネットワークの制限を効果的に解決する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:54:26 GMT)
MaskSDM with Shapley values to improve flexibility, robustness, and explainability in species distribution modeling [3.4] 種分布モデル(SDM)は生物多様性の研究、保全計画、生態ニッチモデリングにおいて重要な役割を担っている。
マスク付きトレーニング戦略を用いてフレキシブルな予測器選択を可能にする,新しいディープラーニングベースのSDMであるMaskSDMを紹介する。
我々はグローバルなsPlotOpenデータセット上でMaskSDMを評価し,12,738種の分布をモデル化した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:02:28 GMT)
ConfuGuard: Using Metadata to Detect Active and Stealthy Package Confusion Attacks Accurately and at Scale [3.3] ConfuGuardは、パッケージの混乱による脅威に対処するために設計されたソリューションである。
本稿では,前パッケージ混同データから得られた良性信号の最初の経験的分析について述べる。
3つから6つのソフトウェアパッケージレジストリのサポートを拡張し、パッケージメタデータを活用して良質なパッケージを識別します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:57:16 GMT)
Scalable and Interpretable Verification of Image-based Neural Network Controllers for Autonomous Vehicles [3.3] 自動運転車のイメージベースニューラルネットワークコントローラは、高次元入力、計算不効率、説明可能性の欠如にしばしば苦労する。
本稿では,変分オートエンコーダ(VAE)を利用して高次元画像を低次元で説明可能な潜在空間に符号化するフレームワークであるSEVINを提案する。
我々は,SEVINが制御動作に関する説明可能な洞察を提供しながら,効率的でスケーラブルな検証を実現することを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:01:53 GMT)
Learning from Synchronization: Self-Supervised Uncalibrated Multi-View Person Association in Challenging Scenes [3.2] アノテーションを使わずに自己管理型多視点人物アソシエーションアプローチであるSelf-MVAを提案する。
具体的には,エンコーダ・デコーダモデルと自己教師型プレテキストタスクからなる自己教師型学習フレームワークを提案する。
提案手法は、既存の教師なしおよび教師なしのアプローチを超越して、最先端の成果を達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:48:56 GMT)
cantnlp@DravidianLangTech2025: A Bag-of-Sounds Approach to Multimodal Hate Speech Detection [3.2] 変換メル分光法を用いて音声(音声)データに基づいてヘイトスピーチ検出システムを訓練する。
本研究は,マルチモーダルヘイトスピーチ検出システムの開発において,テキストと音声(オーディオ)データの両方を使用することが可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:56:18 GMT)
Adaptive Transformer Attention and Multi-Scale Fusion for Spine 3D Segmentation [3.2] 本研究では,改良SwinUNETRに基づく脊椎の3次元セマンティックセマンティックセグメンテーション法を提案する。
本稿では, 脊椎画像の複雑な解剖構造に着目し, 特徴抽出能力を高めるため, マルチスケール融合機構を提案する。
実験結果から,3次元CNN,3次元U-Net,3次元U-Net + Transformerと比較して,本研究のモデルは大幅に改善された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:27:43 GMT)
Chain of Evidences and Evidence to Generate: Prompting for Context Grounded and Retrieval Augmented Reasoning [3.1] チェイン・オブ・エビデンス(CoE)とエビデンス・トゥ・ジェネレーション(E2G)は2つのユニークな戦略に基づいて構築されている。
根拠のない推論の主張の代わりに、我々の革新的なアプローチは「意思決定の証拠」の力を利用する。
我々のフレームワークは、様々な知識集約的推論および生成タスクにおいて、常に顕著な結果を達成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:35:11 GMT)
In-context Learning vs. Instruction Tuning: The Case of Small and Multilingual Language Models [3.1] マルチリンガルモデルと小型モデルを含むシナリオは、性能の劣化したICL命令をもたらすことを示す。
本研究の目的は,現在の指導方法の長所と短所の理解を深めることである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:32:53 GMT)
Video Super-Resolution: All You Need is a Video Diffusion Model [3.1] 本稿ではDiffusion Posterior Samplingフレームワークに基づく汎用ビデオ超解像アルゴリズムを提案する。
実世界の物理を学習する強力なモデルは、先行知識として様々な動きパターンを容易に扱うことができると論じる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:09:02 GMT)
WMINet: A Wheel-Mounted Inertial Learning Approach For Mobile-Robot Positioning [2.9] 我々はWMINETを車輪搭載型慣性深度学習手法として提案し,その慣性センサのみに基づいて移動ロボットの位置を推定する。
そこで本研究では,車載アプローチと移動ロボットの周期軌道駆動という,慣性ドリフトを減らすための2つの一般的な実践的手法をマージする。
我々のアプローチは最先端のアプローチよりも66%改善した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:43:46 GMT)
Harnessing Test-time Adaptation for NLU tasks Involving Dialects of English [2.9] テスト時間適応(TTA)はラベル付きデータセットを使わずにモデルを一般化する優れた手法である。
我々は、方言NLPにおいて最も有名なTTA技法の1つであるSHOTを探索する。
その結果,ラベル付きデータセットが利用できない場合,SHOTは有効な手法であることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:40:06 GMT)
Dynamic Relation Inference via Verb Embeddings [2.8] 我々は画像から関係推論の分野を推し進めるための洞察と実践的手法を提供する。
本研究では,COCOデータセットを付加した動的リレーショナル推論(DRIVE)と,対象-関連オブジェクト三重項と対応する画像を用いた微構造CLIPと,関係検出を改善するための新たな損失関数を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:24:27 GMT)
Experiments with Optimal Model Trees [2.8] 我々は,世界規模で最適なモデル木が,非常に小さな木と競合する精度を達成できることを示した。
また、古典的最適かつ優雅に成長した決定木、ランダムな森林、およびサポートベクターマシンと比較した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:03:47 GMT)
QG from SymQRG: AdS$_3$/CFT$_2$ Correspondence as Topological Symmetry-Preserving Quantum RG Flow [2.8] 摂動的でないRGフローは、より高次元の$textitSymTFT$の量子パス積分として表現できることを示す。
それぞれの2次元CFTに対して、Wheeler-DeWitt方程式が自然に非摂動制約として現れるSymTFTの対応する基底状態を特定する。
我々は,非摂動性AdS/CFT対応が,位相ホログラフィーの$textitmaximal$形式であることを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:12:16 GMT)
Bitcoin Battle: Burning Bitcoin for Geopolitical Fun and Profit [2.8] この研究は、ロシア情報サービスにリンクされたビットコインアドレスの取引活動を実験的に分析し、7ビットコイン(BTC)以上を清算した。
当社の調査は、サイバー脅威情報ソースとロシア情報機関の裁判所文書が特定した入力アドレスに関連付けられたBitcoin Scriptの運用コードを含むトランザクション出力の異常が観察されたことから始まります。
この分析は、国家のサイバーアクターによる大規模なBitcoin不正使用に関する最初の実証研究の1つである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:55:59 GMT)
Neonpool: Reimagining cryptocurrency transaction pools for lightweight clients and IoT devices [2.5] Neonpoolは、ブルームフィルタを用いた革新的なトランザクションプール最適化である。
99.99%以上の精度でトランザクションを検証および転送し、ハードフォークを必要としない。
Neonpoolは、軽量暗号クライアントや、ブラウザ、システムオンチップ、モバイル、IoTデバイスなどのリソース制限されたデバイスに理想的だ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:37:50 GMT)
Macroscopic Particle Transport in Dissipative Long-Range Bosonic Systems [2.5] オープン量子系に対する一般化された最適輸送理論を開発する。
最適輸送は, 単体損失か多体損失かによって, 根本的な違いを示すことを示す。
一定期間に一定数の粒子を輸送する確率を1体損失で上界に導出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:38:10 GMT)
Historic Scripts to Modern Vision: A Novel Dataset and A VLM Framework for Transliteration of Modi Script to Devanagari [2.5] 中世インドでは、マラティア語はモディ文字を用いて書かれた。
約4000万件の文書が不調で、まだ翻訳されていない。
私たちの作品は、手書きのモディ文字から手書きのデヴァナガリ文字への直訳を初めて行った作品です。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:07:29 GMT)
OKRA: an Explainable, Heterogeneous, Multi-Stakeholder Job Recommender System [2.4] 本稿では,グラフニューラルネットワークを用いた新規なマルチステークホルダジョブレコメンデーションシステムを提案する。
提案手法は,候補側と企業側の両方のレコメンデーションを提供することができる。
2つのデータセットに対するnDCGの点から、OKRAは6つのベースラインよりも大幅に性能が良いことがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:12:51 GMT)
Spin contrast, finite temperature, and and noise in matter-wave interferometer [2.4] 有限温度補正とスピン依存・非依存ノイズが物質波干渉計のコントラストにどのように影響するかを示す。
我々は、Stern-Gerlach型でマクロ的な量子重ね合わせを生成する装置について検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:04:32 GMT)
Human-Centric Video Anomaly Detection Through Spatio-Temporal Pose Tokenization and Transformer [2.3] ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要な課題である。
人間中心のVADは、人間の振る舞いのバリエーション、データの潜在的なバイアス、および人間の被写体に関連するプライバシーに関する懸念など、さらなる複雑さに直面している。
近年の進歩は、プライバシの懸念を緩和し、外観バイアスを低減し、背景干渉を最小限に抑えるために、人間のポーズを高レベルな特徴として活用するポーズベースのVADに焦点を当てている。
本稿では,人間中心のポーズに基づくVADに特化して設計された,新しいトランスフォーマーベースのアーキテクチャであるSPARTAを紹介する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:05:49 GMT)
Permutation Learning with Only N Parameters: From SoftSort to Self-Organizing Gaussians [2.3] Gumbel-Sinkhorn 法は全置換行列を決定するために N のパラメータを必要とする。
SoftSortは、微分可能な1Dソートを可能にするが、多次元データと複雑な置換による課題に直面している。
そこで本研究では,Nパラメータのみを用いて置換を学習し,記憶コストを大幅に削減する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:55:55 GMT)
Who Wrote This? Identifying Machine vs Human-Generated Text in Hausa [2.3] ハウサで人間と機械が生成するコンテンツを区別できる最初の大規模検出器を開発した。
AfriXLMRは99.23%、F1スコア99.21%で最高性能を達成した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:13:37 GMT)
Non-Bloch edge dynamics of non-Hermitian lattices [2.3] 非エルミート格子の縁付近の波動の時間発展について検討する。
非エルミート皮膚効果は、波を端まで局在させる傾向がある。
我々の研究は、非エルミート格子のリアルタイムエッジダイナミクスを特徴づけるためのコヒーレント理論を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:22:35 GMT)
Quantum algorithms for simulating systems coupled to bosonic modes using a hybrid resonator-qubit quantum computer [2.3] 計算要素としてマイクロ波共振器を用いて従来の超伝導量子ビットを増大させることにより,複合系を解くための量子アルゴリズムについて議論する。
典型的なモデルに対して効率的なアルゴリズムを導出し、線形オーバーヘッドを伴うシミュレーションの実現可能なスケーリングを可能にするデバイス接続を提案する。
その結果,商用量子プラットフォーム上での計算共振器を含む最初のディジタル量子シミュレーションが得られた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:57:53 GMT)
A Linearized Alternating Direction Multiplier Method for Federated Matrix Completion Problems [2.2] マトリックス補完は、パーソナライズされた医療、電子商取引、レコメンデーションシステム、ソーシャルネットワーク分析における幅広い応用で欠落したデータを予測するための基本となる。
伝統的な行列補完アプローチは典型的には集中型データストレージを前提としている。
フェデレートされた行列補完問題の解法としてtextttFedMC-ADMM を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:57:06 GMT)
MusicLIME: Explainable Multimodal Music Understanding [2.1] マルチモーダル音楽モデル用に設計されたモデルに依存しない特徴重要度説明法であるMusicLIMEを紹介する。
MusicLIMEは、音声と歌詞の機能がどのように相互作用し、予測に寄与するかを明らかにし、モデルの意思決定の全体像を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:21:48 GMT)
AI-Driven Rapid Identification of Bacterial and Fungal Pathogens in Blood Smears of Septic Patients [2.1] 従来の微生物学的手法は時間がかかり高価である。
深層学習アルゴリズムを用いて14種の細菌と3種の酵母様菌を同定した。
The highest value were obtained for Cutibacterium acnes, Enterococcus faecium, Stenotrophomonas maltophilia and Nakaseomyces glabratus。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:02:49 GMT)
Scalable Runtime Architecture for Data-driven, Hybrid HPC and ML Workflow Applications [2.1] 従来のHPCと新しいML方法論を組み合わせたハイブリッドは、科学計算を変革している。
本稿では、RADICAL-Pilotを拡張し、サービスベースの実行によりAI-out-HPCをサポートするスケーラブルランタイムシステムのアーキテクチャと実装について述べる。
予備実験の結果,本手法はアーキテクチャ上のオーバーヘッドを最小限に抑えながら,ローカルおよびリモートHPC/クラウドリソース間でMLモデルの同時実行を管理することを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:21:48 GMT)
Securing Virtual Reality Experiences: Unveiling and Tackling Cybersickness Attacks with Explainable AI [2.1] 我々は、サイバーシックネス攻撃(サイバーシックネス攻撃)と呼ばれる新しいタイプのVR攻撃を提示し、サイバーシックネス緩和の引き金となる。
本稿では,この攻撃を検出するための,XAI誘導型サイバーシック攻撃検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:49:51 GMT)
Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life [2.0] 本稿では,リチウムイオン電池のRULを予測するために,ディープラーニングモデルと組み合わせた生存分析に基づくフレームワークを提案する。
これらのモデルは、生の時系列バッテリーデータを、電圧、電流、内部抵抗などの重要な劣化指標を含む生存データに変換する。
我々のモデルは10倍のクロスバリデーションを用いてテストされ、一般化可能性を確保し、オーバーフィッティングを最小限に抑える。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:49:34 GMT)
P-SpikeSSM: Harnessing Probabilistic Spiking State Space Models for Long-Range Dependency Tasks [2.0] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わる計算効率が高く生物学的に妥当な代替品として提案されている。
長距離依存タスクのためのスケーラブルな確率的スパイク学習フレームワークを開発した。
我々のモデルは、様々な長距離依存タスクにまたがるSNNモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:02:29 GMT)
Semidefinite programming relaxations and debiasing for MAXCUT-based clustering [2.0] 2つのガウス分布を$mathbbRp$で混合して引き出す小さなデータサンプルを$n$で分割する問題を考察する。
グラフ上の最大カットを求めるように定式化された整数二次プログラムの半定値プログラミング緩和を用いる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:24:42 GMT)
Follow-the-Regularized-Leader with Adversarial Constraints [1.9] 制約付きオンライン凸最適化(COCO)は、標準オンライン凸最適化(OCO)フレームワークの一般化と見なすことができる。
私たちは、後悔と累積的制約違反の両方に縛られる最適な$O(sqrtT)$を得ることができることを初めて示します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:51:16 GMT)
A representational framework for learning and encoding structurally enriched trajectories in complex agent environments [1.9] 人工知能エージェントが最適な決定を行い、それらを異なるドメインやタスクに一般化する能力は、複雑なシナリオで妥協される。
この問題に対処する方法の1つは、世界の効率的な表現を学習することと、エージェントのアクションがそれらにどのように影響するかに焦点を当てている。
本稿では,エージェントのオントロジーを強化し,タスク実行のより微妙なビューを提供するために,トラジェクトリの伝統化を拡張することを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:04:27 GMT)
MMLNB: Multi-Modal Learning for Neuroblastoma Subtyping Classification Assisted with Textual Description Generation [1.9] MMLNBは、病理画像と生成されたテキスト記述を統合して、分類精度と解釈可能性を向上させるマルチモーダル学習モデルである。
本研究は,神経芽腫サブタイプ分類における信頼性と解釈可能性を高める,スケーラブルなAI駆動型デジタル病理フレームワークを作成する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:38:46 GMT)
OW-Rep: Open World Object Detection with Instance Representation Learning [1.9] Open World Object Detection (OWOD)は、見えないオブジェクトクラスが出現する現実的なシナリオに対処する。
OWODフレームワークを拡張して、未知のオブジェクトを共同で検出し、セマンティックにリッチなインスタンス埋め込みを学ぶ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:24:20 GMT)
Accelerating large-scale linear algebra using variational quantum imaginary time evolution [1.8] 変動量子想像時間進化アルゴリズム(VarQITE)に基づくグラフ分割問題に対する量子的アプローチを提案する。
我々は、Ansysの産業用ソフトウェアLSDYNAの生産ワークフローにVarQITEアルゴリズムを統合することにより、有限要素問題を高速化するハイブリッド量子/古典的パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:52:25 GMT)
Gain-modified emission dynamics between two quantum emitters in a plasmonic gain cavity system [1.8] 線形ゲイン媒体における2つの量子エミッタ(2レベルシステム)間のゲイン修飾放出ダイナミクスの理論について述べる。
我々は、損失のみ媒質中の2つのエミッタに現れる通常のレートをいかに利得が変更するかを明確に示すボルン・マルコフのマスター方程式を導出した。
改良された崩壊ダイナミクス,励起励起励起,および絡み合いエントロピーとスペクトル放出について検討した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:02:38 GMT)
DynSTG-Mamba: Dynamic Spatio-Temporal Graph Mamba with Cross-Graph Knowledge Distillation for Gait Disorders Recognition [1.8] DynTG-Mambaは、DF-STGNNとSTG-Mambaを組み合わせてモーションモデリングを強化する新しいフレームワークである。
DF-STGNNは、骨格関節と時間的相互作用を適応的に調整する動的空間フィルタを組み込んでいる。
マンバの拡張であるSTG-Mambaは、計算コストを削減しつつ、状態の継続的な伝播を保証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:26:47 GMT)
Hybrid quantum network for sensing in the acoustic frequency range [1.7] 量子光学センシングの適用性は、しばしば利用可能なフォトニック量子源の固定波長によって制限される。
ここでは、広帯域光スペクトルに適用可能な量子状態処理を行うことにより、広帯域量子センシングのための新しいツールを示す。
その他の応用としては、連続可変量子リピータや分散量子センシングがある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:56:22 GMT)
MedLoRD: A Medical Low-Resource Diffusion Model for High-Resolution 3D CT Image Synthesis [1.7] MedLoRDは,計算資源制約環境向けに設計された生成拡散モデルである。
MedLoRDは512$times$512$times$256までの高次元医療ボリュームを生成することができる。
冠動脈CT(Corary Computed Tomography Angiography)や肺CT(Lung Computed Tomography)データセットなど,複数のモードで評価されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:22:49 GMT)
Mitigating Spectral Bias in Neural Operators via High-Frequency Scaling for Physical Systems [1.7] 本稿では、畳み込み型ニューラル演算子におけるスペクトルバイアスを軽減するために、高周波スケーリング(HFS)と呼ばれる新しい手法を提案する。
単相および二相流問題におけるスペクトルバイアスを緩和することにより予測精度を向上する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:08:47 GMT)
Investigating the effect of CPT in lateral spreading prediction using Explainable AI [1.6] 土壌挙動型指数 (Ic) と正規化コーン抵抗 (qc1Ncs) の200個のCPTプロファイルを10個の潜伏特性に圧縮するために, オートエンコーダを用いた。
次に,2011年クライストチャーチ地震における横方向の拡散現象を予測するために,抽出した潜伏特性を用いてXGBoostモデルを訓練する。
潜在CPTを用いたモデルは、従来のCPTメトリクスやCPTデータがないモデルよりも優れており、精度は83%以上である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:22:15 GMT)
Doubly-polylog-time-overhead fault-tolerant quantum computation by a polylog-time parallel minimum-weight perfect matching decoder [1.6] 従来のポリログ空間のオーバヘッドを維持しつつ,2倍のポリログ時間オーバヘッドを実現するプロトコルを開発した。
本プロトコルは, このデコーダを, シングルショットデコーダを組み込んだトポロジカル・コードプロトコルと統合し, 効率的な抽出を行う。
その結果, 従来のポリログ・タイム・オーバヘッドバリアを越え, 低オーバヘッドFTQCの新たなフロンティアを開拓できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:00:04 GMT)
A classical proof of quantum knowledge for multi-prover interactive proof systems [1.6] 知識証明(PoK)において、検証者は、証明者が特権情報を持っていることを確信する。
1つの古典的検証器と2つの量子証明器の設定において、PoKの概念を拡張し、局所ハミルトン問題に対する非局所ゲームに対するPoK特性を示す。
我々の結果は、自己テストの新たな形態と見なすことができ、そこでは、事前共有された絡み合った状態と証明者の戦略の証明に加えて、検証者は局所的な量子状態の証明も行う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:16:22 GMT)
An Analysis of Safety Guarantees in Multi-Task Bayesian Optimization [1.5] 本稿では,ベイズ最適化フレームワークへの追加情報ソースの統合について述べる。
これらの情報ソース間の相互依存性は未知の相関行列を用いてモデル化される。
最適化プロセス全体を通して制約満足度を維持するために、一様誤差境界をどのように調整する必要があるかを検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:10:28 GMT)
PrETi: Predicting Execution Time in Early Stage with LLVM and Machine Learning [1.5] Pretiは、開発の初期段階でソフトウェアの実行時間を予測するためのフレームワークです。
Preti は平均絶対パーセンテージ誤差 (APE) を 11.98% で達成し、最先端の手法を超越している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:32:26 GMT)
Statistical Inference for Weighted Sample Average Approximation in Contextual Stochastic Optimization [1.5] 文脈最適化は、共変量による文脈情報を含む不確実性の下での意思決定のためのフレームワークを提供する。
まず、問題を正確に解けるときの最適値のwSAA推定に対する中心極限定理を確立する。
次に,計算予算制約による現実シナリオを調査し,サンプルサイズが大きくなるにつれて,統計的精度と計算コストの基本的なトレードオフを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:31:56 GMT)
Bayesian Kernel Regression for Functional Data [1.5] 教師付き学習では、予測される出力変数はしばしば関数として表現される。
カーネル手法に基づく関数出力回帰モデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:28:27 GMT)
Comparative Analysis of Advanced AI-based Object Detection Models for Pavement Marking Quality Assessment during Daytime [1.4] 本稿では,You Only Look Once (YOLO) モデルを用いて,昼間の舗装のマーキング品質を検出することに焦点を当てた。
YOLOv8m、YOLOv8n、YOLOv8xの3種類が使用された。
その結果, YOLOv8nは精度と計算効率のバランスが良いことがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:29:40 GMT)
FedVSR: Towards Model-Agnostic Federated Learning in Video Super-Resolution [1.4] ビデオ超解像(VSR)は、解像度の低い入力から高解像度の映像を再構成し、細部を復元し、視覚的明瞭度を向上させる。
ディープラーニングベースのVSR手法は印象的な結果を得るが、その集中的な性質は深刻なプライバシー上の懸念を引き起こす。
本稿では,VSRのための新しい,アーキテクチャに依存しない,ステートレスなFLフレームワークであるFedVSR1を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:05:24 GMT)
Classification of power quality events in the transmission grid: comparative evaluation of different machine learning models [1.4] 本稿では、パワークオリティイベントの分類のための機械学習モデルの比較評価結果について述べる。
最も優れた結果を得るモデルは、トルコ電力伝送システムのための大規模電力品質およびグリッド監視システムのイベント分類モジュールに統合される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:02:31 GMT)
Training Large Neural Networks With Low-Dimensional Error Feedback [1.4] ディープニューラルネットワークのトレーニングは通常、高次元エラー信号のバックプロパゲーションに依存している。
本稿では,低次元誤り信号が効果的な学習に十分であることを示す。
タスク次元の順序における最小誤差次元でさえ、従来のバックプロパゲーションと同等の性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:41:58 GMT)
Cohort-attention Evaluation Metric against Tied Data: Studying Performance of Classification Models in Cancer Detection [1.4] 本稿では,これらの課題に対処するコホート・アテンション評価指標(CAT)フレームワークを提案する。
CATは患者レベルの評価、エントロピーに基づく分布重み付け、コホート重み付けの感度と特異性を導入している。
このアプローチは予測信頼性、公正性、解釈可能性を高め、AI駆動型医療スクリーニングモデルの堅牢な評価方法を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:50:40 GMT)
A Convex formulation for linear discriminant analysis [1.3] 本稿では,Convex Linear Discriminant Analysis (ConvexLDA) と呼ばれるディメンタリティ低減手法を提案する。
その結果,ConvexLDAは,高次元の生物学的データや画像データセットなどにおいて,LDA(Lyly linear discriminant analysis)に基づくいくつかの手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:17:49 GMT)
SRBB-Based Quantum State Preparation [1.3] 近似量子状態準備問題に対するスケーラブルなアルゴリズムを提案する。
このアルゴリズムはSRBB(Standard Recursive Block Basis)に基づく変分量子回路を用いる。
所望の量子状態は、スケーラブルな量子ニューラルネットワークによって近似される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:51:07 GMT)
Automatic quality control in multi-centric fetal brain MRI super-resolution reconstruction [1.3] 胎児脳MRIの超解像再構成(SRR)ボリュームの自動品質管理に着目する。
本稿では,100以上の画像品質指標を抽出し,画像品質スコアを予測する機械学習手法FetMRQC$_SR$を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:05:34 GMT)
MIXPINN: Mixed-Material Simulations by Physics-Informed Neural Network [1.3] 従来の有限要素法(FEM)に基づくシミュレーションは計算コストが高く、リアルタイムシナリオでは実用的ではない。
混合材料シミュレーションのための物理インフォームドグラフニューラルネットワーク(GNN)フレームワークMIXPINNを紹介する。
バイオメカニカル構造のグラフベース表現を活用することで、MIXPINNはFEM生成データから高忠実度変形を学習し、サブミリ秒精度でリアルタイムな推論を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:48:29 GMT)
PoseSyn: Synthesizing Diverse 3D Pose Data from In-the-Wild 2D Data [1.3] PoseSynは、野生の2Dポーズデータセットから多様な3Dポーズイメージペアに変換する、新しいデータ合成フレームワークである。
挑戦的なポーズと外観に合わせた人間のアニメーションモデルを通じて現実的な3Dトレーニングデータを生成することで、PoseSynはさまざまな3Dポーズ推定器の精度を最大14%向上させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:28:35 GMT)
Dynamic-Dark SLAM: RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes [1.3] RGBとサーマルカメラを併用した協調MPTシステムを提案する。
評価実験により、Tトラッカーは明るいシーンと暗いシーンの両方で顕著な性能を発揮することが示された。
この研究は、動的ダークSLAMに向けた重要な第一歩であり、個人の効果的な認識、理解、再構築を可能にする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:05:21 GMT)
OpenTable data with multi-criteria ratings [1.2] OpenTable.comからクロールされたOpenTableデータセットをリリースしました。
このデータセットは、マルチ基準レコメンデーションのためのベンチマークデータセットとみなすことができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:02:56 GMT)
Engineering Bosonic Codes with Quantum Lattice Gates [1.2] ボソニック符号は、1つの連続可変ボソニックシステムで量子情報の符号化と保護にハードウェア効率のよいアプローチを提供する。
量子格子ゲートと呼ばれる1種類のゲート要素からなる新しい普遍量子ゲートセットを導入し、フォールトトレラント量子コンピューティングのためのボソニックコードステートを設計する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:01:33 GMT)
Learning Spatially Adaptive $\ell_1$-Norms Weights for Convolutional Synthesis Regularization [1.2] 我々は、事前学習された畳み込みフィルタのファミリーを考察し、スパース特徴写像に適用された空間的に変化するパラメータを深くパラメータ化して推定する。
提案手法は,後者の手法で視覚的,定量的に比較可能な結果が得られ,同時に高い解釈が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:38:39 GMT)
MAME: Multidimensional Adaptive Metamer Exploration with Human Perceptual Feedback [1.1] 機能的アライメントを探索するための広く採用されているアプローチは、人間とモデルの両方のメタマーを特定することである。
本稿では,ヒトメタマー空間の高次元直接探索を可能にする多次元適応メタマー探索フレームワークを提案する。
我々のフレームワークは、神経科学における解釈可能なAIの開発と脳機能の理解に寄与する可能性がある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:23:04 GMT)
Edgeworth Expansion for Semi-hard Triplet Loss [1.1] We developed a higher-order analysis for the semi-hard triplet loss using the Edgeworth expansion。
提案手法は,損失挙動に対するマージンパラメータと基礎となるデータ分布の歪度の影響を定量的に評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:46:10 GMT)
Strain Problems got you in a Twist? Try StrainRelief: A Quantum-Accurate Tool for Ligand Strain Calculations [1.1] リガンドひずみエネルギーは構造に基づく小分子ドラッグデザインの重要な構成要素である。
ひずみエネルギーを高精度に計算するツールを提案する。
本研究では, DFT に対するひずみエネルギー差を 1.4 kcal/mol 以内と推定し, 代替NP よりも精度が高いことを示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:33:52 GMT)
A deep graph model for the signed interaction prediction in biological network [1.0] 生物学的ネットワークにおける署名された相互作用の予測は、薬物のメカニズムを理解し、薬物の再利用を促進するために重要である。
textbfRGCNTDは、極性(活性化、阻害など)と非極性(結合、影響など)の両方を予測できるように設計されている。
我々は,新たな評価指標である textitAUCtextsubscriptpolarity と textitCP@500 を導入し,相互作用型を識別するモデルの能力を評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:54:17 GMT)
Fed-Joint: Joint Modeling of Nonlinear Degradation Signals and Failure Events for Remaining Useful Life Prediction using Federated Learning [1.0] 非線形劣化信号と時間-障害データの連成モデリングを用いたRUL予測のための新しい予測フレームワークを提案する。
提案手法は, フェデレートされた多出力ガウスプロセスを用いて非パラメトリック劣化モデルを構築し, フェデレーションサバイバルモデルを用いて, サービス内機器の故障時間と確率を予測する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:34:34 GMT)
Open-Set Gait Recognition from Sparse mmWave Radar Point Clouds [1.0] スパースmmWaveレーダ点雲からの開集合ゲイト認識の問題に対処する。
これは、スパースポイントクラウドデータによるオープンセット歩行認識に対処する最初の作業である。
10人の被験者から5時間以上の計測結果が得られた最初の人間の歩行データセットであるmmGait10をリリースする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:06:08 GMT)
Non-asymptotic quantum communication on lossy transmission lines with memory [1.0] 非漸近量子シャノン理論は量子チャネルを介して量子情報を伝達する方法を解析する。
我々は、Toeplitz行列の特異値の新たな性質を証明し、有名なAvram-Parterの定理の収束率に縛られる誤差を与える。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:19:41 GMT)
Decoherence-induced self-dual criticality in topological states of matter [1.0] 混合状態における自己双対対称性(理論物理学の基本概念)の役割について論じる。
トーリック符号の2次元バルクからの電気的および磁気的渦のデコヒーレンスが、(1+1)Dの量子臨界混合状態を残すことができることを示す。
フェミオン相互作用や非干渉コヒーレント変形による不整合雑音による自己双対の明示的な破れは、RGクロスオーバーを誘導する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:56:32 GMT)
The probabilistic combinatorial attacks on atmospheric continuous-variable quantum secret sharing [1.0] 自由空間量子秘密共有チャネルの実用的セキュリティについて検討する。
本稿では,2点分布攻撃と一様分布攻撃を組み合わせた攻撃戦略を提案する。
その結果, CV-QSSとCV-QSSは中程度の強度乱流下では真の鍵速度を低下させるが, 数百のスケールで8kmの距離で安全なQSSを実現することができることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:43:13 GMT)
Leveraging Large Language Models for Code Translation and Software Development in Scientific Computing [1.0] 生成人工知能(GenAI)は、科学計算における生産性を変革する。
我々は、コード変換の効率的なプロセスを確立するために、プロンプトエンジニアリングとユーザ管理を組み合わせたCodeScribeというツールを開発した。
AIによるコード翻訳の課題にも対処し、科学計算における生産性向上のメリットを強調します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:38:43 GMT)
Capturing the Page Curve and Entanglement Dynamics of Black Holes in Quantum Computers [0.9] 量子コンピュータを用いて、量子ビット輸送モデルを用いてホーキング放射のエントロピーを調べる。
我々は,効率的なランダムユニタリ回路を用いて,ブラックホールのスクランブルダイナミクスの量子シミュレーションを実装した。
両エンタングルメントエントロピー測定プロトコルは数値シミュレーションにおいてR'enyiエントロピーを正確に推定するが、ランダム化測定プロトコルは、IBMの超伝導量子コンピュータにおけるスワップベースの多体干渉プロトコルよりも特に有利である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:12:40 GMT)
Invisible Labor: The Backbone of Open Source Software [0.9] OSS(Open Source Software)は、インターネットアクセスのある人なら誰でも閲覧可能、編集可能、共有可能なソフトウェアである。
我々はOSSコントリビュータにインタビューを行い、目に見えない労働貢献、リーダーシップの離脱、メンバシップの離職、持続可能性について質問した。
私たちは、見えない労働が優れたリーダーシップ、貢献者の転職を減らすこと、そして組織としてのプロジェクトに対する正当性を生み出すことに責任があることに気付きました。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:34:45 GMT)
Hoare meets Heisenberg: A Lightweight Logic for Quantum Programs [0.9] We show that Gottesman's semantics for Clifford circuits based on the Heisenberg representations gives up to a lightweight Hoare-like logic。
我々の応用には、(i)補助量子ビットを安全に配置できるかどうかを認証すること、(ii)所定の安定化器符号に対するゲートの正当性をチェックすること、(iv)計算後状態を含む。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:58:49 GMT)
Do Large Language Models Understand Performance Optimization? [0.9] 大規模言語モデル(LLM)は、コード補完、翻訳、最適化といったソフトウェア開発タスクのための強力なツールとして登場した。
本稿では,複数の重要なHPC計算モチーフを含むベンチマークスイートについて,最先端のLLMで最適化されたコードの性能を評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:30:23 GMT)
Compositional Models for Estimating Causal Effects [0.9] 構造系における個人レベルのポテンシャルと因果効果を推定するための構成的アプローチについて検討する。
構成的アプローチは、単位レベルの因果クエリをよりきめ細かいクエリに分解する。
観測データから因果効果を推定することの利点が示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:36:58 GMT)
Less Biased Noise Scale Estimation for Threshold-Robust RANSAC [0.9] 画像マッチングによる相対的なポーズを頑健に推定するためのゴールドスタンダードはRANSACである。
ノイズスケール推定法であるSIMFITを再検討し,ノイズスケール推定のバイアスを求める。
本稿では,SIMFIT++のマルチペア拡張を推定値のフィルタリングにより提案し,その結果を改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:57:29 GMT)
Parameter-free structure-texture image decomposition by unrolling [0.9] 本稿では,Low Patch Rankモデルに基づくニューラルネットワークLPR-NETを提案する。
合成画像の訓練にもかかわらず、数値実験により、自然画像に適用した場合にネットワークが適切に一般化できることが示されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:35:04 GMT)
Performance Analysis and Industry Deployment of Post-Quantum Cryptography Algorithms [0.9] NIST(National Institute of Standards and Technology)は、鍵交換とデジタル署名のための標準化されたPQCアルゴリズムとして、CRYSTALS-KyberとCRYSTALS-Dilithiumを選択した。
本研究は,暗号処理における実行時間をベンチマークすることで,これらのアルゴリズムの総合的な性能解析を行う。
その結果, Kyber と Dilithium は効率的な実行時間を実現し,RSA や ECDSA などの古典暗号方式を同等のセキュリティレベルで上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:06:03 GMT)
SQLCritic: Correcting Text-to-SQL Generation via Clause-wise Critic [0.8] 本稿では、構造化された実行フィードバックと、詳細な解釈可能な批評を提供する訓練された批評家エージェントを組み合わせる新しいアプローチを提案する。
この方法は、構文的誤りと意味的誤りの両方を効果的に識別し、修正し、精度と解釈可能性を高める。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:57:48 GMT)
Adaptive Deep Learning for Multiclass Breast Cancer Classification via Misprediction Risk Analysis [0.8] 早期発見は患者の予後を改善するのに不可欠である。
コンピュータ支援診断アプローチは乳がんの検出を著しく向上させた。
しかし、これらの手法は多クラス分類の課題に直面し、しばしば誤予測を引き起こす。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:25:28 GMT)
The x+y Floquet code: A simple example for topological quantum computation in the path integral approach [0.8] 我々は,その経路積分を$x+y$方向に$(x,y,z)$立方格子上にトラバースすることで,トリック符号位相に対する新しいフォールトトレラント回路を構築する。
フォールトトレラント回路に境界とコーナーを組み込む方法と、位相的に保護された論理ゲートを実行する方法を示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:06:09 GMT)
Life-inspired Interoceptive Artificial Intelligence for Autonomous and Adaptive Agents [0.8] 自律的な -- すなわち、ニーズに基づいて目標を選択する -- と適応性 -- は、絶え間なく変化する環境で生き残る — は、人工知能(AI)の聖杯だった。
ここでは、インターセプション(interoception)、すなわち、内部環境を監視して一定の範囲内に保持するプロセスに焦点を当てる。
インターセプションを備えたAIを開発するためには、内部環境を表す状態変数を外部環境から分解する必要がある。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:07:57 GMT)
Exploring the Potential of Bilevel Optimization for Calibrating Neural Networks [0.7] 現代のニューラルネットワークはキャリブレーションが不十分なため、予測された信頼性スコアは使用が難しい。
本稿では,二段階最適化の適用による信頼度推定と校正の改善について検討する。
モデルの予測信頼性スコアを改善するために、自己校正型バイレベルニューラルネットワークトレーニングアプローチが導入された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:34:55 GMT)
Enhanced Quantum Signal Control and Sensing Under Multicolored Noise via Generalized Filter Function Framework [0.7] 本稿では,雑音結合強度を調整可能な制御パラメータとして扱う一般化フィルタ機能フレームワークを提案する。
我々は、強い雑音下でシングルビットおよび2ビットゲートの忠実度が0.9999$となる帯域選択制御パルスを設計する。
本稿では,交流信号の量子センシングにおける信号対雑音比を最大10ドルdBの精度で選択的に拡張する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:15:02 GMT)
$\mathbb{Z}_2$-gauging and self-dualities of the $XX$ model and its cousins [0.6] 1次元の$XX$格子モデルとその従兄弟について運動量のレンズを通して検討し、$U(1)$対称性を巻き付ける。
我々は従兄弟の自己双対性($XX$モデルやLevin-Guモデルなど)を適切なゲージ手順で導出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:36:07 GMT)
Cross-Platform Benchmarking of the FHE Libraries: Novel Insights into SEAL and Openfhe [0.6] ホモモルフィック暗号化(HE)は、プライバシー問題に対処するための重要なソリューションとなっている。
本稿では2つの主要なHEライブラリであるSEALとOpenFHEを総合的に評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:37:14 GMT)
Stability of macroscopic spin ensembles against inhomogeneous dephasing [0.6] 非均質拡大下でのスピン猫状態のダイナミクスについて検討した。
小さな振幅では、奇異な猫状態は、猫の状態よりも不均質な嫌悪に敏感である。
我々の発見は、量子技術の進歩に重要な集合スピン状態の安定性に光を当てた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:33:31 GMT)
Robust Decision-Making Via Free Energy Minimization [0.6] DR-FREE(DR-FREE)は、自由エネルギー最小化によるエージェント決定機構に堅牢性を導入する自由エネルギーモデルである。
障害物で満たされたあいまいな環境を走行する実際のローバーを含む実験ベッド上でDR-FREEを評価する。
このマイルストーンは、マルチエージェント環境での展開と、おそらくより深いレベルで、自然エージェントが、ほとんど、あるいは全く訓練されていない状態でどのように生き残るかについて、生物学的にもっともらしい説明を求めることの両方に刺激を与えるかもしれない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:36:08 GMT)
Reshaping the Quantum Arrow of Time [0.5] 量子物理学において、時間矢印は系上で一連の測定が行われると現れる。
我々は、前方よりも後方に流れる時間とより整合したダイナミクスが得られる量子制御ツールを導入する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:07:22 GMT)
Global anomalies of Green's function zeros [0.5] 対称性を保ったルッティンガー曲面を記述したとされる非局所有効理論の大域的異常について検討する。
本稿では,大域的異常,バルク境界対応,可能相の制約について論じる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:40:30 GMT)
Simulating Raman Scattering Impairments with Depolarization Noise in Quantum-Classical Links [0.5] 偏光符号化された量子通信チャネルにおける自発ラマン散乱ノイズをモデル化する。
提案手法は, 量子ビット伝送, 絡み合い分布, テレポーテーションの実証に対して有効である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:30:01 GMT)
Preserving clusters and correlations: a dimensionality reduction method for exceptionally high global structure preservation [0.5] 本稿では,新しい次元還元法であるPCC(Creserving Clusters and correlations)を提案する。
PCCは、競争的局所構造(LS)保存を維持しながら、最先端のグローバル構造(GS)保存を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:48:02 GMT)
A Recipe for Improving Remote Sensing VLM Zero Shot Generalization [0.4] 本稿では,リモートセンシング基礎モデルのトレーニングのための2つの新しい画像キャプチャーデータセットを提案する。
最初のデータセットは、Google Mapsから抽出されたランドマークを使用して、Geminiによって生成されたキャプションと航空画像と衛星画像のペアである。
第2のデータセットは、リモートセンシングドメインのためにフィルタリングされたパブリックWebイメージとそれに対応するalt-textを利用する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:49:27 GMT)
Deep Belief Markov Models for POMDP Inference [0.4] この研究は、Deep Belief Markov Model (DBMM)と呼ばれる新しいディープラーニングベースのアーキテクチャを導入している。
DBMMは、部分観測可能なマルコフ決定プロセス(POMDP)における効率的なモデル式推論を提供する。
ベンチマーク問題におけるDBMMのモデル形式に依存しない推論能力を評価することにより,提案手法の有効性を評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:58:45 GMT)
A Comprehensive Overview and Comparative Analysis on Deep Learning Models: CNN, RNN, LSTM, GRU [0.4] ディープラーニングは機械学習(ML)と人工知能(AI)の強力なサブセットとして登場した
その影響は、音声認識、ヘルスケア、自動運転車、サイバーセキュリティ、予測分析など、さまざまな分野に及んでいる。
様々な問題や応用に取り組むために、いくつかのディープラーニングモデルが開発されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:18:52 GMT)
Neutrino Decoherence in \texorpdfstring{\(κ\)}{kappa}-Minkowski Quantum Spacetime: An Open Quantum Systems Paradigm [0.4] 量子時空のゆらぎはエネルギー依存のデコヒーレンス効果を誘導し、デコヒーレンスレートは$E-4$となる。
我々の結果は、量子時空変動がニュートリノ振動物理学に与える影響について光を当てた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:08:14 GMT)
Simulating methylamine using symmetry adapted qubit-excitation-based variational quantum eigensolver [0.4] 本稿では,様々な手法を組み合わせたVQEアルゴリズムの最適化手法を提案する。
最適最適化戦略は、26キュービットを用いて、メチルアミン分子をシミュレートする2キュービット演算数を600,000から約12,000に削減する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:33:27 GMT)
PERC: a suite of software tools for the curation of cryoEM data with application to simulation, modelling and machine learning [0.4] 構造生物学では、現在実験とシミュレーションされたデータセットのオープンリポジトリが多数存在する。
ここで紹介するツールは、既存のCryoEMデータセットの照合や、新しい合成CryoEMデータセットの作成に有用である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:07:56 GMT)
Mixed spin-boson coupling for qubit readout with suppressed residual shot-noise dephasing [0.4] ボソニックモードとスピンの2対の二次構造を混合したカップリングについて検討する。
この設定では、非ゼロカーシフトを維持しながら分散シフトを抑制することができる。
我々は、この構成を単純な玩具モデルで実証し、スピンの光子ショットノイズ強調に対する期待された改善を定量化し、Kerrシフトによる高速キュービット読み出しへのアプローチを説明する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:40:28 GMT)
Navigating Heat Exposure: Simulation of Route Planning Based on Visual Language Model Agents [0.3] 既存の方法は、熱ストレス下での個々の生理的変動と環境認識機構を考慮できない。
本稿では,新しい視覚言語モデル (VLM) 駆動型ペルソナ・パーセプション・プランニング・メモリフレームワークを提案する。
我々のフレームワークは非常に費用対効果が高く、シミュレーションのコストは0.006USD、ルート当たり47.81秒である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:49:46 GMT)
The Impact of Artificial Intelligence on Emergency Medicine: A Review of Recent Advances [0.3] 人工知能(AI)は、診断プロセスを強化し、患者の結果を改善することで、救急医療に革命をもたらす。
機械学習とディープラーニングは、複雑な画像データの解釈において重要な要素であり、迅速で正確な診断を提供し、従来の診断方法を超える可能性がある。
これらの進歩にもかかわらず、AIを臨床実践に統合することは、データのプライバシ、アルゴリズムバイアス、さまざまな設定にまたがる広範な検証の必要性といった課題を提示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:45:00 GMT)
Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment [0.2] 次活動予測(Next-active-Prediction:NAP)は、医師が治療計画を支援するための有望な手法として用いられる。
患者データの使用は、その知識集約性、高い変動性、医療データの不足など、多くの課題を生んでいる。
本稿では、グラフに符号化された知識を用いて、治療プロセスにおける次の活動の予測を改善し、説明する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:52:26 GMT)
Generative Modeling for Mathematical Discovery [0.2] そこで本研究では,その遺伝子アルゴリズムの新たな実装について述べる。
我々の目的は数学者への関心の例を作成することである。
機械学習や高性能コンピューティングリソースへのアクセスに関する専門知識は必要ない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:42:26 GMT)
Guarding Digital Privacy: Exploring User Profiling and Security Enhancements [0.1] この記事では、ユーザプロファイリングに関する知識の統合、さまざまなアプローチと関連する課題について検討する。
ユーザデータを共有している2つの企業のレンズと、インドで人気の高い18のAndroidアプリケーションの分析を通じて、この記事はプライバシーの脆弱性を明らかにしている。
本稿では,意思決定木とニューラルネットワークを用いた機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:56:46 GMT)
Rethinking model prototyping through the MedMNIST+ dataset collection [0.1] この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:01:18 GMT)
The Future of Data Science Education [0.1] バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:06:45 GMT)
Leveraging the Dynamics of Leadership in Group Recommendation Systems [0.1] グループレコメンデーションに新しいアプローチを導入し、特に共通の関心を共有する小グループに焦点をあてる。
グループ内の関係と信頼のダイナミクスを強調するレコメンデーションアルゴリズムを提案する。
この相互作用に焦点を当てたフレームワークは、最終的に推奨された選択によってグループ全体の満足度を高めることを目指している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:16:22 GMT)
ExChanGeAI: An End-to-End Platform and Efficient Foundation Model for Electrocardiogram Analysis and Fine-tuning [0.1] ExChanGeAIはWebベースのエンドツーエンドプラットフォームで、さまざまなフォーマット、前処理、可視化、カスタム機械学習の読み込みを合理化する。
このプラットフォームは、新しいオープンソースの心電図基礎モデルCardXとともに、ゼロからトレーニングするための最先端のディープラーニングモデルを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:58:52 GMT)
Locality and probability in relativistic quantum theories and hidden variables quantum theories [0.0] ローレンツ不変量と文脈理論は真に、すなわち決定論的(強いあるいは弱い)隠れ変数モデルを持つことは不可能であることを示す。
また、ベルの局所性の定義は非文脈性(あるいは強い決定論)と同値であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:23:52 GMT)
Lower bounding the MaxCut of high girth 3-regular graphs using the QAOA [0.0] 我々は MaxCut を、様々な$g$s に対して最小の girth $g$ の 3 つの正則グラフ上で研究する。
深さ$g geq 16$、深さ$p geq 7$の場合、QAOAは以前に知られていた下限を改善する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:58:43 GMT)
Uncovering Local Integrability in Quantum Many-Body Dynamics [0.0] 完全プログラマブル量子コンピュータの最大124量子ビットを用いて、1次元および2次元周期的に駆動されるスピン格子の局所保存則と積分性を明らかにする。
本研究は,大規模量子コンピュータにおける雑音実験から隠れ力学構造を抽出する多目的戦略を示すものである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:25:42 GMT)
YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions [0.0] 本研究は, YOLOv3から最新のYOLOv12への包括的実験評価である。
考慮すべき課題は、さまざまなオブジェクトサイズ、多様なアスペクト比、単一クラスの小さなオブジェクトである。
分析では各YOLOバージョンの特徴的長所と短所を強調した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:27:13 GMT)
What makes you an observer? [0.0] 経験的および理論的客観的科学は、関係にのみアクセスでき、実体の本質的な性質について何も明らかにしない。
典型的にはこれらの実体を「物質」と呼び、それらの性質が無関係であり、関係構造だけでは意識を含む全ての現象を説明できると仮定する。
この前提が正しければ、オブザーバーの脳内の記憶は外部世界とは何の関係も持たないだろうということを実証します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:15:13 GMT)
Vision-based automatic fruit counting with UAV [0.0] UAVを用いた自動果物カウントシステムを提案する。
そこで本手法では,RGBカメラからストリームを処理するビジョンアルゴリズムと,古典的な画像操作を用いた深度センサを用いる。
提案手法をシミュレーションで検証し,500回のミッションから平均87.27/100点を得た。
ICUAS 2024カンファレンスの一環として開催されたUAVコンペティションにも参加して,23チームからなるフィールドで6位を獲得し,決勝に進出しました。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:36:58 GMT)
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data [0.0] 本研究では,SIGLIPとGemma-3bアーキテクチャを併用したVLM(Vision-Language Model)を提案する。
VLMは胸部X線からの視覚データを臨床コンテキストと組み合わせて、詳細なコンテキスト認識診断レポートを生成する。
結石,空洞,結節などの急性TBの病態は,高い精度とリコールで検出された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:08:35 GMT)
Using 3D reconstruction from image motion to predict total leaf area in dwarf tomato plants [0.0] 総葉面積(TLA)の推定は,植物の成長,光合成活性,呼吸を評価する上で重要である。
伝統的な方法は、しばしば労働集約的であり、植物に損傷を与えるか、または茂みのあるキャノピーの複雑さを捕えるのに限られる。
本研究では,RGB画像からの連続的3次元再構成と機械学習を組み合わせた非破壊的手法の評価を行った。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:51:19 GMT)
Uncovering Utility Functions from Observed Outcomes [0.0] 本稿では,消費者の嗜好や実用性を決定する新しいアルゴリズムを提案する。
PEARLは、観測された消費者選択データを最も合理化するユーティリティ関数の表現を発見できる唯一のアルゴリズムである。
その結果、PEARLはノイズのない合成データとノイズの多い合成データの両方でベンチマークを上回ります。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:56:59 GMT)
Trade-off relations between measurement dependence and hidden information for factorizable hidden variable models [0.0] ベルの定理は、隠れ変数モデルフレームワーク内の基礎となる仮定の間のトレードオフ関係の観点から検討される。
本稿では,その分布を考慮した「隠蔽情報」という尺度を提案する。
また、この関係は分解可能なモデルによって実現される測度に必要かつ十分な条件を与えることも明らかにした。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:17:59 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0] 本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。
我々は、最小限の回路を識別するためにエッジパッチやオートエンコーダなどの解釈可能性技術を適用した。
私たちの研究は、解釈可能性技術の評価と進歩のための包括的なフレームワークを提供します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:47:50 GMT)
The Role of Legal Frameworks in Shaping Ethical Artificial Intelligence Use in Corporate Governance [0.0] 本稿では、企業統治における倫理的人工知能(AI)利用の形成における法的枠組みの進化的役割について考察する。
企業AIアプリケーションにおける透明性、説明責任、公正性の促進を目的とした、重要な法的および規制的なアプローチを探求する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:21:58 GMT)
The Empirical Impact of Reducing Symmetries on the Performance of Deep Ensembles and MoE [0.0] 深層アンサンブルとMixture of Experts(MoE)の性能に及ぼす対称性の低減の影響について検討する。
その結果、非対称ニューラルネットワーク上に構築されたディープアンサンブルは、アンサンブルサイズが大きくなるにつれて大幅に性能が向上することがわかった。
この実験では, 対称性の低下がMoEアーキテクチャとMoIEアーキテクチャの両方に影響を及ぼすかどうか, 決定的な証拠は得られない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:20:52 GMT)
The Birth of Quantum Mechanics: A Historical Study Through the Canonical Papers [0.0] 本稿では1900年から1927年にかけての量子力学理論の歴史的発展について考察する。
アインシュタインの光量子仮説の出現、ボーアの原子モデル、および区別不可能な粒子の統計的含意に従う。
古典量子論から現代量子力学への移行に特に重点を置いている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:26:50 GMT)
Synchronous vs Asynchronous Reinforcement Learning in a Real World Robot [0.0] 強化学習(RL)エージェントは、定期的に計算に高価な勾配更新を実行することで学習する。
急速に変化する環境では、学習エージェントの性能に応答時間の増加が有害となる可能性がある。
非同期RL法は、意思決定と勾配更新の計算を分離する。
実験の結果,エージェントはより高速に学習し,非同期RLでさらに多くのリターンを得ることができた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:24:39 GMT)
Symmetric channel verification for purifying noisy quantum channels [0.0] 本稿では、量子チャネルに固有の対称性を利用するチャネル浄化プロトコルである対称チャネル検証(SCV)を提案する。
SCVは量子チャネルの対称性破壊ノイズを検出し、補正することができる。
本プロトコルはハミルトニアンシミュレーション回路および位相推定回路に適用される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:37:32 GMT)
Sustainability Analysis Patterns for Process Mining and Process Modelling Approaches [0.0] 既存のSustainable BPMアプローチの主な課題の1つは、持続可能性への影響の健全な概念の欠如である。
本稿では、BPMの概念と既存の持続可能性分析手法の概念を統合する一連の持続可能性分析パターンについて述べる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:50:21 GMT)
Superdiffusion, normal diffusion and chaos in semiclassical Bose-Hubbard chains [0.0] 半古典的状態における1次元Bose-Hubbardモデルの2点相関関数の進化について検討する。
強い非可積分性については、系はホモジニアス状態に終わり、弱い非可積分性に対しては振動と不均一性が持続する。
我々は、超拡散状態は前熱化や熱化の前駆体ではなく、ボース・ハバード・ハミルトンの特別なスケーリング対称性に関連する新しい早期現象であると結論付けた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 21:44:23 GMT)
Study of Magnetic Field Resilient High Impedance High-Kinetic Inductance Superconducting Resonators [0.0] 窒化ニオブ (NbN) およびグラニュラーアルミニウム (grAl) 薄膜から作製した超伝導共振器を比較した。
磁場ゼロでは、grAl製共振器はNbNの共振器よりもQ_i$高い値を示す。
NbNは、ハイブリッド回路量子電気力学用途に優れた磁場レジリエンスを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:58:45 GMT)
Stabilizer Rényi Entropy and Conformal Field Theory [0.0] 本研究では,R'enyi entropy (SRE) の場理論的枠組みを$(1+1)$-dimensional many-body system で開発する。
本研究では,SREが境界条件変化演算子のスケーリング次元によって与えられる普遍係数で対数スケーリングを示すことを示す。
これらの結果は、量子多体系における非安定化器の普遍的特徴を理解するための場理論的アプローチを確立する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:00:02 GMT)
Stability and quasi-Periodicity of Many-Body Localized Dynamics [0.0] 多体局在(Multi-Body Localization、MBL)は、不規則鎖内の相互作用粒子が熱分解に失敗する現象である。
本稿では,不規則なハイゼンベルク連鎖におけるサブシステムの絡み合い進化における準周期的ダイナミクスを通して,MBLを同定する。
以上の結果から, 十分に強い障害の体制下では, 個々のサブシステムの絡み合い進化は熱力学的限界において準周期的のままであることが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:29:37 GMT)
SparseLUT: Sparse Connectivity Optimization for Lookup Table-based Deep Neural Networks [0.0] 本稿では,LUTベースのディープニューラルネットワーク(DNN)に適した接続中心トレーニング技術であるSparseLUTを紹介する。
実験の結果、ベンチマーク全体で一貫した精度の改善が見られ、MNISTは最大2.13%向上した。
これはハードウェアのオーバーヘッドを伴わずに実現され、LUTベースのDNNの最先端の結果が得られる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:21:54 GMT)
Single-photon-added coherent state based postselected weak measurement [0.0] SPACSをベースとしたポストセレクト弱測定は,従来の測定方法よりも精度が高いことを示す。
我々の研究は、光子統計に基づく量子精度測定の基本的な問題に対処する新しい方法を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:50:50 GMT)
Ship Detection in Remote Sensing Imagery for Arbitrarily Oriented Object Detection [0.0] 本研究では,海洋モニタリングや生態モニタリングなどの応用に適した,革新的な船舶検知システムを提案する。
YOLOv8と2つの高度なディープラーニングモデルであるU-Netを用いて、船舶検出精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:49:41 GMT)
SatDepth: A Novel Dataset for Satellite Image Matching [0.0] SatDepth'は,衛星画像のための画像マッチングフレームワークをトレーニングするために,高密度な地上真実対応を提供する新しいデータセットである。
我々は、我々のデータセットを使用して、既存の4つの画像マッチングフレームワークをベンチマークし、我々のデータセットでトレーニングされたモデルが、他のデータセットでトレーニングされたモデルよりも40%高い(最大40%の精度で)ことを確認するアブレーション調査を実施した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:14:13 GMT)
SAM2 for Image and Video Segmentation: A Comprehensive Survey [0.0] 画像とビデオのセグメンテーションは、医療、農業、産業検査、自動運転など幅広い分野で応用されているコンピュータビジョンの基本的なタスクである。
大規模ファンデーションモデルの出現により、SAM2はセグメンテーションタスクに最適化され、複雑なシナリオにおけるパフォーマンスが向上した。
本稿では,SAM2の映像・映像セグメンテーションへの応用を体系的に分析し,様々な分野での性能評価を行う。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:33:36 GMT)
Revival and instabilities of entanglement in monitoring maps with indefinite causal order [0.0] 本稿では,量子スイッチフレームワーク内の対象系における絡み合いの進化について検討する。
絡み合いの進化は環境条件や選択後の制御に非常に敏感である。
これらの知見は、環境障害の存在下での量子スイッチのレジリエンスに関する洞察を与える。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:02:55 GMT)
Reversing Hydrogen-Related Loss in $α$-Ta Thin Films for Quantum Device Fabrication [0.0] 製造中の水素吸収、特にネイティブオキシドを除去する場合は、マイクロ波損失を増大させることで性能を低下させることができる。
本研究では, 水素が10vol%のフッ化水素酸を3分以上曝露した場合に, $alpha$-Ta薄膜に侵入できることを実証した。
共振器の性能の低下は、非超伝導タンタル水和物の生成によって生じる可能性が高い。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:33:49 GMT)
Resolving space-time structures of quantum impurities with a numerically exact few-body algorithm [0.0] マクロな浴槽における量子不純物に対する数値的に正確なリアルタイム進化法を提案する。
活性軌道の数と関連する行列積状態結合次元がともに小さい値に飽和していることが示される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:24:46 GMT)
Renormalization of Schrödinger equation for potentials with inverse-square singularities: Generalized Trigonometric Pöschl-Teller model [0.0] 逆二乗特異点を示すポテンシャルを持つ一次元定常シュリンガー方程式のエネルギースペクトルの完全記述に必要な正規化手順を導入する。
また、三角測度 P"oschl-Teller ポテンシャルの範囲を広げて得られる特異対称二重井戸の特性についても検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:56:28 GMT)
Regulating Ai In Financial Services: Legal Frameworks And Compliance Challenges [0.0] 金融サービスにおける人工知能(AI)規制の進展状況について考察する。
不正検出からアルゴリズム取引まで、AI駆動のプロセスがいかに効率性を高め、重大なリスクをもたらすかを強調している。
この研究は、欧州連合、米国、英国などの主要な司法管轄区域における規制のアプローチを比較している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:29:09 GMT)
Recent developments in the generation of non-classical and entangled light states using intense laser-matter interactions [0.0] レーザー・マター相互作用における完全量子化手法を用いることで、高光子数非古典状態や絡み合い状態の発生につながることを示す。
これらの発見は、新しい量子非線形分光法の開発における重要なステップである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:48:04 GMT)
Realizing a Symmetry Protected Topological Phase in a Superconducting Circuit [0.0] 本稿では、Sine-Gordon(SG)量子場理論により、低エネルギー自由度を記述した超伝導量子回路を提案する。
好適に選択されたパラメータに対して、回路は離散$mathbbZ$対称性で保護された対称性保護位相(SPT)をホストする。
系の基底状態は2倍縮退し、局所的な自発対称性の破れを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:35:23 GMT)
Real-Time Multi-Object Tracking using YOLOv8 and SORT on a SoC FPGA [0.0] マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて最も重要な問題の一つである。
量子化YOLOv8検出器とSORT(Simple Online Realtime Tracker)トラッカーを用いた組込みMOTシステムを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:25:33 GMT)
Rayleigh-Taylor, Kelvin-Helmholtz and immiscible to miscible quenching instabilities in binary Bose-Einstein condensates [0.0] 本研究では,2次元の円箱に閉じ込められたルビジウム同位体8,5$Rb,8,7$Rbを考慮し,二元不和合体ボース・アインシュタイン凝縮体の3種類の不安定性について検討した。
RTおよびケルビン・ヘルムホルツ不安定型(KH)は強い摂動下で研究される。
数値シミュレーションにより、このような不安定なダイナミクスは、大きな渦発生と音波伝搬が支配的であることが示された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:02:44 GMT)
Rapfi: Distilling Efficient Neural Network for the Game of Gomoku [0.0] Rapfiは、限られた環境でCNNベースのエージェントより優れた効率の良いGomokuエージェントである。
ラプフィは520人中1位となり、2024年のゴモカップで優勝した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:53:57 GMT)
Ramsey-Borde atom interferometry with a thermal strontium beam for a compact optical clock [0.0] 熱原子線を用いたラムゼー・ボーデ干渉計に基づくシステムは、光学原子時計における技術ギャップを埋めるであろう。
我々は689nmの狭い1S0->3P1結合線を利用して、ストロンチウム原子を用いたRBIを実証した。
RBI信号の傾斜と蛍光検出ノイズを分析すると、4x10-14 / sqrttauの短期安定性が推定される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:32:13 GMT)
RainScaleGAN: a Conditional Generative Adversarial Network for Rainfall Downscaling [0.0] 降水ダウンスケーリングのための条件付き深層畳み込み生成適応ネットワーク(GAN)であるRainScaleGANを紹介する。
RainScaleGANの機能は、降水データセットの空間解像度を人工的に劣化させる完全モデル設定でテストされる。
開発したモデルでは,本研究で確認された降水量減少手法の1つに優れていた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:54:20 GMT)
Quantum weak values and the 'which way?' question [0.0] 不確実性原理は、量子系が旅行した2つの経路のどれかを決定することを禁ずる。
弱いポインタが同時に不正確なポインタであることを示し、個々の試行においてシステムによって取られた経路に関する情報が必然的に失われることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:30:35 GMT)
Quantum geometry of non-Hermitian systems [0.0] ベリー曲率は量子状態の幾何学の1つの側面を特徴づける。
非エルミート系では、波動パケット力学はベリー接続から非直交固有状態への一般化として表現できる用語によってリッチ化される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:00:10 GMT)
Quantum dots for quantum repeaters [0.0] 本稿では量子ドット(QD)に基づく量子リピータの分野の現状を概観する。
まず,III-VQDに基づく非古典的光子源の現状について概説する。
本稿では,その性能について考察し,多光子放出確率の低さや不明瞭さなどの臨界パラメータに従って評価する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:44:16 GMT)
Quantum bounds and device-independent security with rank-one qubit measurements [0.0] デバイス非依存(DI)量子プロトコルはベルの不等式違反を利用してセキュリティを確保したり、量子特性を認証する。
本研究では,DIシナリオにおけるランク1量子正の演算子評価尺度(POVM)の役割について検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:33:23 GMT)
Quantum Port: Gamification of quantum teleportation for public engagement [0.0] 量子論を分類量子力学(CQM)と呼ぶ。
本稿では,量子テレポーテーションの図式規則を量子ポートと呼ばれる量子カードゲームにゲーミフィケーションすることで,第2レベルの変換を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:39:10 GMT)
Predicting Space Tourism Demand Using Explainable AI [0.0] 本稿では,宇宙旅行需要予測の課題に対処するための,説明可能な信頼性の高い人工知能フレームワークを提案する。
本研究では,データにおける広範囲な依存関係を学習可能な,SpaceNetという新しい機械学習ネットワークを開発した。
調査の結果,旅行価格,年齢,年収,性別,死亡確率は,旅行希望の有無を決定する上で重要な特徴であることがわかった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:40:34 GMT)
Photon information efficiency limits in deep-space optical communications [0.0] フォトン情報効率(英: Photon Information efficiency、PIE)は、深宇宙のシナリオで達成可能なデータレートを特徴づける利点の1つである。
我々はパルス位置変調(PPM)のようなスケーラブルな変調フォーマットを仮定する理論的なPIE制限についてレビューする。
実際のPIE制限は、受信機に実装されたノイズ除去機構の有効性に依存する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:34:49 GMT)
Phases and dynamics of quantum droplets in the crossover to two-dimensions [0.0] クロスオーバー領域における超低温原子滴の力学を3次元から2次元に探索する。
主な発見の1つは, 負-正平均場相互作用から平均平均場相互作用への遷移によって, 液滴が大幅に拡張されることである。
クエンチに追従した異方性測地において,複雑なバルクおよび表面密度パターンを形成することが可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:17:15 GMT)
Pensez: Less Data, Better Reasoning -- Rethinking French LLM [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な機能を示した。
しかし、数学的推論や非英語言語のような専門分野における強力なパフォーマンスを達成するには、大規模なデータセットに対する広範なトレーニングが必要となることが多い。
本稿では,小規模で高品質なバイリンガル(英語-フランス語)データセットを戦略的に微調整する,対照的なアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:09:11 GMT)
Pareidolic Illusions of Meaning: ChatGPT, Pseudolaw and the Triumph of Form over Substance [0.0] 論文は、この2つの現象は、物質と内容の高次な形と外観の両方において、2つの基本的な特徴を共有しており、両者の利用者は、物質についての形式を日常的に間違えていると論じている。
どちらも概念的パリドリアの人間の傾向に依存しており、誤った入力から意味のある言語学的法的パターンを誤認識させる。
この論文は、ユーザーが十分な法的・技術的リテラシーを持っている場合に限り、両方の現象によって引き起こされる問題の解決策を明らかにするのに役立つと論じている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:15:41 GMT)
P1-KAN: an effective Kolmogorov-Arnold network with application to hydraulic valley optimization [0.0] 新しいコルモゴロフ・アルノルドネットワーク(KAN)は、高次元における潜在的に不規則な関数を近似するために提案されている。
精度と収束速度で多層パーセプトロンより優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:17:43 GMT)
Optimizing the frequency positioning of tunable couplers in a circuit QED processor to mitigate spectator effects on quantum operations [0.0] 超伝導量子プロセッサにおけるフラックスチューナブルカプラの周波数を実験的に最適化し、オブザーバトランモンの影響を最小限に抑える。
我々は,高忠実かつ低利得制御のZ$ゲートをカプラのみに一極性,高速断熱パルスで実現し,一般的なトランスモン様チューニング結合素子を適用した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:41:05 GMT)
Optimizing Ansatz Design in Quantum Generative Adversarial Networks Using Large Language Models [0.0] 本稿では,Large Language Models(LLMs)を活用して,量子生成逆数ネットワーク(qGANs)におけるアンサーゼの設計を改善するための新しいアプローチを提案する。
本手法では,回路深度とパラメータ数を低減しつつ,アンザッツ構造を反復的に洗練し,精度を向上する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:29:05 GMT)
Optimal Denoising in Score-Based Generative Models: The Role of Data Regularity [0.0] ハーフデノジングは十分な密度のフルデノジングよりも優れていることを示す。
フルデノジングは線型多様体仮説の下で次元性の呪いを軽減することができることを証明している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:22:14 GMT)
Optimal Conversion from Classical to Quantum Randomness via Quantum Chaos [0.0] 近年提案された「深熱化」パラダイムでは、システムAのランダム量子状態は、システムBの射影測定によって生成される。
このスキームでは、投影された状態アンサンブルのランダム性は、Bの測定時の結果の固有のランダム性から生じる。
一般カオス系の場合、この変換は古典エントロピーの各ビットがBに余分な量子ビットを加えるのと同じくらい多くの量子ランダム性を生成するという点で最適であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:14:54 GMT)
Online optimisation for dynamic electrical impedance tomography [0.0] 非線形時間離散逆問題に対する原始双対オンライン手法を提案する。
本手法を後悔理論を用いて解析し,流体中の物体のリアルタイムモニタリングにおいてその性能を実証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:09:47 GMT)
On the Convergence of a Federated Expectation-Maximization Algorithm [0.0] FMLR(Federated Mixture of $K$ Linear Regressions Model)の予測最大化(EM)アルゴリズムの収束率について検討する。
我々は、$Omega(sqrtK)$の信号対雑音比(SNR)を用いて、よく知られたEMアルゴリズムが、すべての規則の下で基底真理のミニマックス距離内に収束することを示す。
興味深いことに、クライアントの数がクライアント毎のデータポイント数に対して合理的に増加すると、EMアルゴリズムは収束するために一定回数の反復しか必要としない。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:15:58 GMT)
On some states minimizing uncertainty relations: A new look at these relations [0.0] 我々は、量子系の多くの状態が存在することを考察する。
これらの状態は、観測可能な$A$または$B$の固有状態ではない。
さらに、最も一般的な形の不確実性原理は2つの面を持つことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:06:39 GMT)
Not All Personas Are Worth It: Culture-Reflective Persona Data Augmentation [0.0] 韓国の文化的価値、行動、社会的なニュアンスを捉えるために設計された20万のペルソナからなるデータセットであるKoPersonaを紹介した。
様々な指標による総合的な評価は、KoPersonaの品質と韓国文化との関連性を検証している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:23:57 GMT)
Neural network-based Godunov corrections for approximate Riemann solvers using bi-fidelity learning [0.0] 教師付き学習を用いて訓練されたニューラルネットワークに基づく代理モデルを構築し、内部および外部保守状態変数を対応する正確なフラックスにマッピングする。
提案手法の性能は, 1次元および2次元偏微分方程式への応用を通じて実証される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:01:26 GMT)
Negative Currents in Fabry-Pérot Cavities are Caused by Interfering Paths [0.0] また,Fabry-P'erotキャビティ内の時間依存性電流は,時間依存性電圧が常に正であっても負に変化することを示した。
低温でのみ発生し、ラウンドトリップの数が異なるキャビティを通る経路間の干渉によって引き起こされる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:14:10 GMT)
Multi-Platform Teach-and-Repeat Navigation by Visual Place Recognition Based on Deep-Learned Local Features [0.0] この研究は、視覚的位置認識技術に基づくシステムに革新的な解決策をもたらす。
外観に基づくナビゲーション手法の実験的なテストのための新しい公開データセットが導入された。
結果は、新しいシステムがいくつかのテストシナリオで既存のメソッドより優れていることを確認した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:57:41 GMT)
Momentum-entangled two-photon interference for quantum-limited transverse-displacement estimation [0.0] 本研究では,光子の横モーメントの差分で増大する精度で横変位推定を行うことが可能であることを示す。
小さい変位だけの場合, 横モーメンタム分解検出器を必要とせず, 推定が可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:41:40 GMT)
Mind2: Mind-to-Mind Emotional Support System with Bidirectional Cognitive Discourse Analysis [0.0] 対話分析の観点から解釈可能なESコンテキストモデリングにアプローチするESフレームワークであるMind-to-Mind(Mind2)を提案する。
具体的には,動的な会話コンテキストの伝搬ウィンドウに従って,ES対話における認知談話分析を行う。
解釈可能性を高めるために、Mind2は、各話者が双方向性を持つ他の話者に対する信念を反映する詳細を優先する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:39:56 GMT)
March Madness Tournament Predictions Model: A Mathematical Modeling Approach [0.0] 本稿では,2013年以降のNCAAバスケットボールデータに基づいて,マーチマドネストーナメントの結果を予測するモデルを提案する。
このプロジェクトの枠組みは、関心のある4つの予測対象が調整された攻撃効率(ADJOE)、調整された防御効率(ADJDE)、パワーレーティング(Power Rating)、および2点ショットパーセンテージ( Two-point Shooting Percentage Allowed)であるFiveThrityEight NCAA March Madness予測モデルの単純化である。
トーナメントシミュレーションを開発し、実際のマーチマドネスブラケットと比較し、モデルの精度を決定する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:04:31 GMT)
Linear-Size Neural Network Representation of Piecewise Affine Functions in $\mathbb{R}^2$ [0.0] 任意の連続アフィン (CPA) 関数は、$mathbbR2tomathbb$ の ReLUtomathbb$ で表せる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:56:39 GMT)
Leveraging Joint Predictive Embedding and Bayesian Inference in Graph Self Supervised Learning [0.0] グラフ表現学習は、ノード分類やリンク予測といったタスクの基盤として登場した。
現在の自己教師付き学習(SSL)手法は、計算の非効率性、対照的な目的への依存、表現の崩壊といった課題に直面している。
本稿では,意味情報と構造情報を保存しながら,対照的な目的と負のサンプリングを排除したグラフSSLのための新しい結合埋め込み予測フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 08:45:19 GMT)
LLM-based speaker diarization correction: A generalizable approach [0.0] ダイアリゼーション補正のための大規模言語モデル(LLM)を後処理のステップとして使用することを検討した。
モデルがフィッシャーコーパスのホールドアウトデータセットと独立データセットのダイアリゼーション精度を向上させる能力を測定した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:34:07 GMT)
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems [0.0] 本稿では,新しい大規模言語モデル (LLM) によるエージェントフレームワークを提案する。
動的に進化する知識を活用することで、クエリを反復的に洗練し、文脈的証拠をフィルタリングする。
提案システムは、更新されたコンテキストの競合的および協調的な共有をサポートする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:27:02 GMT)
Investigating the contribution of terrain-following coordinates and conservation schemes in AI-driven precipitation forecasts [0.0] 本研究は, 地形追従座標と大域的質量・エネルギー保全スキームをAIWPモデルに統合する。
保存法は, ドライズルバイアスを低減させるのに対して, 地形追従座標を用いることで, 極端事象と降水強度スペクトルの推定が向上する。
この研究の解決策は、幅広いAIWPモデルに有効であり、大気領域の知識がAIWPモデルの開発にどのように役立つかについての洞察をもたらすことができる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:06:25 GMT)
Intra-neuronal attention within language models Relationships between activation and semantics [0.0] 本研究では,言語モデルにおけるパーセプトロン型ニューロンの神経内注意機能について検討した。
この研究の目的は、形式ニューロンがアクティベーションベースのセグメンテーションとカテゴリー的なセグメンテーションの同型関係をどの程度確立できるかを決定することである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:47:11 GMT)
Inteligencia Artificial para la conservación y uso sostenible de la biodiversidad, una visión desde Colombia (Artificial Intelligence for conservation and sustainable use of biodiversity, a view from Colombia) [0.0] 本論文は,コロンビアとネオトロピックに焦点をあてた視点から,この研究領域の範囲を分析することを目的としている。
本稿では,画像や記録からの自動種識別,種モデリング,シリコバイオプロスペクションなどの用途について紹介する。
また、現地の文脈におけるAIの責任と倫理的採用を促進する政策の開発に関する対話の場を開こうとしている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:47:05 GMT)
Immersive Virtual Reality Environments for Embodied Learning of Engineering Students [0.0] 本稿では,仮想実験室環境(VLE)の具体的学習に焦点を当てた新しい枠組みを提案する。
当社のフレームワークでは,Unity 3DとC#で開発されたイベント駆動の指向グラフベースのアーキテクチャを採用し,モジュール化とスケーラビリティを確保しています。
その結果、従来の非身体的VR法と比較して、学生の理解と保持が著しく改善し、テストスコアが顕著に増加した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 00:52:31 GMT)
Identifying Cooperative Personalities in Multi-agent Contexts through Personality Steering with Representation Engineering [0.0] 大規模言語モデル(LLM)は自律的な能力を獲得し、マルチエージェント設定での調整がますます重要になる。
Axelrod's Iterated Prisoner's Dilemma (IPD) トーナメントに触発された我々は、パーソナリティ特性がLDMの協力にどのように影響するかを探求する。
表現工学を用いて, LLMにおけるビッグファイブの特徴(例えば, 理解性, 良心性)を把握し, IPD意思決定への影響を解析する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:21:54 GMT)
How many simulations do we need for simulation-based inference in cosmology? [0.0] 現在利用可能な2000のシミュレーションを備えたQuijote Latin Hypercube(LH)のようなシミュレーションスイートは、汎用ニューラルネットワークが最適な状態に達するための十分なトレーニングデータを提供していないことを示す。
我々は、宇宙論における最大の公開シミュレーションデータセットであるBig Sobol Sequence(BSQ)を作成し、32,768ドルのLambda$CDM n-bodyシミュレーションにより、$Lambda$CDMパラメータ空間を均一にカバーしている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:21:39 GMT)
Halving transcription time: A fast, user-friendly and GDPR-compliant workflow to create AI-assisted transcripts for content analysis [0.0] 質的研究では、データ書き起こしは労働集約的で時間を要することが多い。
このプロセスの迅速化のために、人工知能(AI)を利用したワークフローを開発した。
このワークフロー内では、音声記録から最初の書き起こしを生成するために自動音声認識が使用される。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:33:39 GMT)
Gravitational Wave Effects on Radio Spectral Lines of Atomic Hydrogen: Hyperfine Splitting and Broadening Mechanisms [0.0] 我々は高励起リドベルク状態における基底状態超微細遷移と放射遷移に焦点を当てた。
以上の結果から,GWsは21cm線を改良し,超微細磁性体中のエネルギー変化を誘導することが明らかとなった。
電波再結合線(RRL)を生成する高励起状態の遷移の場合、GWの影響はスペクトル拡大として現れ、$mathrmHnalpha$$nu/nuDeltanu/sim n7omega2_mathrmgwh(t)$としてスケールする分数直線幅を持つ。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:44:12 GMT)
GFSNetwork: Differentiable Feature Selection via Gumbel-Sigmoid Relaxation [0.0] GFSNetworkは,Gumbel-Sigmoid サンプリングによる特徴選択を行うニューラルアーキテクチャである。
我々はGFSNetworkを一連の分類と回帰のベンチマークで評価し、最近の手法を一貫して上回っている。
実世界のメダゲノミクスデータセットに対する我々のアプローチを検証し,その実次元生物学的データの有効性を実証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:47:26 GMT)
Further Exploration of Precise Binding Energies from Physics Informed Machine Learning and the Development of a Practical Ensemble Model [0.0] 機械学習モデルに通知された16の新しい物理は、現代の質量モデルからのエネルギー残基の結合について訓練されている。
モデルはAME 2012データのサブセットでトレーニングされ、AME 2020データのサブセットで検証されている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:01:56 GMT)
Frustration-free free fermions and beyond [0.0] フラストレーションフリーハミルトニアンは、量子多体系を理解するための中心的なモデルを提供する。
我々はフラストレーションのないフェルミオン系のための一般的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:18:15 GMT)
From Light-Cone to Supersonic Propagation of Correlations by Competing Short- and Long-Range Couplings [0.0] 本研究では, 競合する短距離および大域のカップリングと多体量子系の相関関係の動的拡散について検討する。
結果が1次元と2次元と消散の有無の両方で成り立つことを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:48:36 GMT)
From Autonomous Agents to Integrated Systems, A New Paradigm: Orchestrated Distributed Intelligence [0.0] 我々は textbfOrchestrated Distributed Intelligence (ODI) の概念を導入する。
ODIは、AIを人間の専門知識と連動して働く結束的で組織化されたネットワークとして再認識する新しいパラダイムである。
我々の研究は、重要な理論的意味を概説し、将来の研究と企業イノベーションのための実践的なロードマップを提示します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 22:21:25 GMT)
Feature Extraction and Analysis for GPT-Generated Text [0.0] 本稿では,人書きテキストとGPT生成テキストの識別のための特徴抽出と解析に関する総合的研究を行う。
以上の結果から,人間とGPT生成したテキストは,特徴によって効果的に捉えられる異なる書体スタイルを示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:52:43 GMT)
Fault-tolerant Preparation of Distant Logical Bell Pair -- with application in the magic square game [0.0] 非局所ゲームにおける量子非局所性に対する低雑音の影響について検討する。
物理量子ビットと論理量子ビットを効率的に翻訳するためのインタフェース回路と論理エンタングルメントプロトコル(EPP)を導入する。
我々のフレームワークは、様々な量子エラー訂正符号(QECC)や実験プラットフォームに適用可能である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:24:49 GMT)
Exploring new variational quantum circuit ansatzes for solving $SU(2)$ matrix models [0.0] 我々は、texttTwoLocal と textttEvolvedOperatorAnsatz という2種類の量子回路が、人気のある textttEfficientSU2 回路より優れていることを示す。
本研究の結果は, textttTwoLocal と textttEvolvedOperatorAnsatz 量子回路の可能性を示すものである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:52:44 GMT)
Explaining the Unexplainable: A Systematic Review of Explainable AI in Finance [0.0] 本稿では、金融におけるXAI応用の変遷状況について概観する。
トピック・クラスタ、重要な研究、そして金融業界でよく使われる説明可能性戦略を見つける。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:37:42 GMT)
Explainable Dual-Attention Tabular Transformer for Soil Electrical Resistivity Prediction: A Decision Support Framework for High-Voltage Substation Construction [0.0] 本研究は, 土壌電気抵抗を予測できる新しい二重アテンション変圧器アーキテクチャを提案する。
提案アーキテクチャは,最近の技術モデルと比較して予測性能が優れている(平均絶対誤差0.63%)。
我々は、このモデルを実装するWebベースのアプリケーションを開発し、エンジニアにアクセシビリティな意思決定支援フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:30:32 GMT)
Exciton-polaritons and exciton localization from a first-principles interacting Green's function formalism [0.0] 本稿では,Bethe-Salpeter方程式(BSE)に基づくAb initio Green関数形式について述べる。
MgOおよび結晶性ペンタセンでは、この魅力的な相互作用はエキシトンボーアラジイを劇的に減少させる。
我々の計算は、ワルツ石CdSの実験的偏光子分散とよく一致している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 18:03:31 GMT)
Ethical Implications of AI in Data Collection: Balancing Innovation with Privacy [0.0] 本稿では,2023年から2024年にかけてのAIによるデータ収集の倫理的・法的意義について考察する。
欧州連合、米国、中国の規制アプローチを比較して、グローバルに調和したAIガバナンスフレームワークを構築する上での課題を強調している。
この記事では、AI開発のグローバルな性質に対処するために、アダプティブガバナンスと国際協力の必要性を強調している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 14:15:59 GMT)
Epidemic Forecasting with a Hybrid Deep Learning Method Using CNN LSTM With WOA GWO Optimization: Global COVID-19 Case Study [0.0] 本研究では,感染症の時系列予測を推し進める新たな深層学習フレームワークを提案する。
本フレームワークは6大陸24カ国の新型コロナウイルス19症例データに適用した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 04:41:26 GMT)
Enhanced frequency and temperature estimation by a $\mathcal{PT}$-symmetric quantum oscillator [0.0] 非エルミート寄与が周波数および温度推定に与える影響について検討した。
その結果,非エルミート寄与は,周波数および温度推定の促進に寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:17:04 GMT)
Enforcing Cybersecurity Constraints for LLM-driven Robot Agents for Online Transactions [0.0] 大規模言語モデル(LLM)をオンライントランザクションを実行するための自律ロボットエージェントに統合することは、重大なサイバーセキュリティ上の課題を引き起こす。
この研究は、データ漏洩、トランザクション詐欺、システム操作に関連するリスクを軽減するために、堅牢なサイバーセキュリティの制約を強制することを目的としている。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:01:10 GMT)
Enabling High-Frequency Trading with Near-Instant, Trustless Cross-Chain Transactions via Pre-Signing Adaptor Signatures [0.0] この白書では、中間通貨や中央集権的な信頼できる第三者の必要性を排除した原子スワッププロトコルを導入する。
ビットコインとスワップ間の取引時間を約15秒に短縮する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 01:15:33 GMT)
Emergence of Topological Non-Fermi Liquid Phases in a Modified Su-Schrieffer-Heeger Chain with Long-Range Interactions [0.0] 修正Su-Schrieffer-Heeger鎖モデルにおけるトポロジカル非フェルミ液相の出現について検討した。
本研究により, トポロジカル非フェルミ液体の理解と高温超伝導への可能性について検討した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:14:31 GMT)
Emergence of Light Cones in Long-range Interacting Spin Chains Is Due to Destructive Interference [0.0] この研究は、長距離相互作用を持つ量子系における局所性と創発的な光円錐の起源に関する新しい視点を示す。
このようなスピン鎖において、スピンが絡み合う量子効果の間の破壊的干渉により、効果的な絡み合い光円錐が出現するメカニズムを同定する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:41:14 GMT)
Efficient noise tailoring and detection of hypergraph states using Clifford circuits [0.0] 本研究は、ハイパーグラフ状態のノイズを調整・検出するための効率的なクリフォード回路ベーススキームを提案する。
我々は、クリフォード回路を介してノイズレートの畳み込み方程式を求め、この畳み込み方程式の非線形性とハイパーグラフ状態入力のクリフォード階層との間の接続を橋渡しする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:57:15 GMT)
Efficient Detection of Statistical RF Fields at High Magnetic Field with a Quantum Sensor [0.0] 核磁気共鳴分光法(NMR)は、化学、物質科学、神経科学など様々な分野で広く用いられている。
ダイヤモンド中の窒素空孔(NV)中心を用いたナノスケールNMR分光法は、単スピンレベルへの前例のない感度低下により、有望なプラットフォームとして登場した。
統計的発振信号の整合化によるコヒーレント平均化を実現するための2つのプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:06:51 GMT)
Economic Rationality under Specialization: Evidence of Decision Bias in AI Agents [0.0] この研究はさらに、バイオテクノロジーの専門家や経済学者のような専門的なエージェントを水平比較に取り入れている。
その結果、エージェントが専門分野により多くの労力を費やすと、意思決定行動は「合理性シフト」の傾向が強いことが示唆された。
対照的に、GPTやより一般化された基本エージェントは、複数のタスクにまたがるより安定で一貫した合理性を維持している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:09:57 GMT)
Early Detection of Forest Calamities in Homogeneous Stands -- Deep Learning Applied to Bark-Beetle Outbreaks [0.0] 本研究では,森林における異常検出のためのLong Short Term Memory (LSTM) Autoencoderに基づくディープラーニングアルゴリズムの可能性について検討した。
そこで本研究では,2018年から2024年末までの7年間にわたって,ドイツのテューリンゲンで純粋な発芽点をモニタリングした。
我々の最良のモデルでは、テストデータに対して87%の精度で検出を行い、非常に早い段階で全異常の61%を検出できた。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:28:15 GMT)
Dynamics of defects and interfaces for interacting quantum hard disks [0.0] 格子上の量子ハードディスク問題における欠陥と界面の性質について検討する。
このような摂動の下でも、欠陥やインターフェースの大規模なクラスは安定している。
本研究は,量子界面力学の安定性と非古典的挙動を示すものである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:12:43 GMT)
Deep Hedging of Green PPAs in Electricity Markets [0.0] グリーンPPAの取引は、エージェントがリスクや天候のリスクを抑えることを露呈する。
天候は取引不可能な実体であるので、この非常に複雑な環境でどのようにヘッジとリスク管理を行うかという疑問が浮かび上がってくる。
本稿では,機械学習手法を利用したヘッジ戦略構築のための'ディープヘッジ'フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:02:23 GMT)
Decomposition of a system in pseudo-Hermitian quantum mechanics [0.0] この研究は、下層の内積構造とは無関係に有限次元ヒルベルト空間のサブシステムを特定する一貫した方法の概要を述べる。
我々は、計量がテンソル積形式であるか否かに関係なく、すべての距離空間において部分系が十分に定義されることを示す。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:09:55 GMT)
Cryptographic tests of the python's lunch conjecture [0.0] 絡み合いのくさびは、局所的には存在するが、CFTサブリージョンへの世界最小の面を含んでいない場合もあり、この場合、ピソンの昼食を含んでいると言われている。
我々は、適切なCFTサブリージョン間の相互情報は、ランチの幾何学に関連した領域差によって線形に下降していると論じる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 05:04:50 GMT)
Convolutional neural network for early detection of lameness and irregularity in horses using an IMU sensor [0.0] 単慣性測定ユニット(IMU)と1次元畳み込みニューラルネットワーク(1D CNN)を用いたストライドレベルの分類システムを提案する。
提案システムは実世界の条件下でテストされ,90%のセッションレベルの精度を実現した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:05:01 GMT)
Comments on `Comment on Aurélien Drezet's defense of relational quantum mechanics' by Jay Lawrence, Marcin Markiewicz and Marek Źukowski [0.0] Jay Lawrence氏、Marcin Markiewicz氏、Marek 'Zukowski氏による最近のコメントに対して、以前の評価に対してRQMを擁護する作業について回答します。
我々は,著者らが提案した分析に反論し,我々の反論の残余のあいまいさを明らかにするために,過去の研究を言い換える。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:32:59 GMT)
Characterizing Gaussian quantum processes with Gaussian resources [0.0] 連続変数量子系における任意のガウス過程を完全に特徴づける手法を開発した。
この方法は効率が良く、$O(N2)$ステップだけが$N$モードシステムを特徴づける。
ヘテロダイン測定はガウス過程の再構成のためのホモダイン測定より優れていることが観察された。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:14:58 GMT)
Can Bohmian mechanics be considered complete? [0.0] ド・ブロイ・ボーム理論(de Broglie Bohm theory)、またはパイロット波理論(pilot-wave theory)およびボーム力学(bohmian mechanics)の原理を概観する。
この枠組みの中では、現在のボーム理論やおそらく量子力学自体の限界を克服するために、機械的アナロジーを利用するいくつかのアプローチについてレビューする。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:38:32 GMT)
Bounds on Lp errors in density ratio estimation via f-divergence loss functions [0.0] 密度比推定(DRE)は2つの確率分布の関係を捉える手法である。
$f$-divergence損失関数は、$f$-divergenceの変動表現から派生したもので、最先端のパフォーマンスを達成する上では、DREの標準選択となっている。
この研究は、$f$-divergence損失関数を通して$L_p$エラーの上と下の境界を導出することにより、DREに対する新たな理論的洞察を提供する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 03:01:25 GMT)
Bayesian Cox model with graph-structured variable selection priors for multi-omics biomarker identification [0.0] 本稿では,マルチオミクス特徴のスパース同定のために,グラフ構造選択を前提とした半パラメトリックベイズコックスモデルを提案する。
提案モデルにより, より信頼性が高く, 安定な変数選択や, 非初期生存予測が可能となることを示す。
The Cancer Genome Atlas Project の乳がん患者データに本モデルを適用した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 11:33:21 GMT)
Atyaephyra at SemEval-2025 Task 4: Low-Rank NPO [0.0] 我々は,LLMから未学習のセンシティブコンテンツに関するSemEval 2025共有タスクを提出する。
提案手法は、低ランク適応を用いた負の優先最適化を用いる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:59:19 GMT)
Atom-Field-Medium Interactions II: Covariance Matrix Dynamics for $N$ Harmonic Atoms in a Dielectric-Altered Quantum Field and Effects of Dielectric on Atom-Field Entanglement [0.0] 我々は、原子-体-ナトリウム相互作用を用いた構造層からなる多部開量子系の研究を継続する。
我々は、量子ランゲヴィン方程式を用いて、$N$系原子のidfの量子相関関数の共分散行列要素の時間発展を計算する。
結果にいくつかの特異な特徴と重要な技術的な問題を強調します。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 10:25:32 GMT)
Artificial Intelligence-Driven Prognostic Classification of COVID-19 Using Chest X-rays: A Deep Learning Approach [0.0] 本研究では,Chest X線画像を用いて,新型コロナウイルスの重症度(中・中・重症度)を分類するための高精度深層学習モデルを提案する。
平均精度は97%,特異性は99%,感度は87%,F1スコアは93.11%であった。
これらの結果は、実際の臨床応用におけるモデルの可能性を示している。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 15:27:21 GMT)
Are LLMs (Really) Ideological? An IRT-based Analysis and Alignment Tool for Perceived Socio-Economic Bias in LLMs [0.0] 大規模言語モデル(LLM)における社会経済的バイアスを検知・定量化するための項目応答理論(IRT)に基づくフレームワークを提案する。
IRTは項目の難易度を考慮し、イデオロギー的バイアス推定を改善する。
この実証的に検証されたフレームワークは、AIアライメントの研究を強化し、より公平なAIガバナンスを促進する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:20:09 GMT)
Approach to equilibrium in Markovian open quantum systems [0.0] 我々は、フォン・ノイマン・リンドブラッド方程式によって支配されるマルコフ開量子系の進化を研究する。
我々のゴールは、量子詳細バランス条件下での無限自由度系の平衡復帰性を証明することである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:04:19 GMT)
An interpretable approach to automating the assessment of biofouling in video footage [0.0] 国際船舶は、生物汚染管理の実践の証拠を提供することがますます義務付けられている。
活動が効果的であることの検証には、水中の水中映像を用いた検査が必要である。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:11:13 GMT)
An exact analytical solution for Dicke superradiance [0.0] 我々はディック超放射問題を再考し、すなわち、当初逆のN$同一の2レベル系のアンサンブルに対して密度演算子の時間発展を求める。
我々は、常に有効なコンパクトで計算が容易で完全に解析的な解と、進化の過程で$N$を導出する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 20:11:13 GMT)
Alpha-divergence loss function for neural density ratio estimation [0.0] 密度比推定(DRE)は2つの確率分布の関係を捉えるための基礎的な機械学習手法である。
既存の手法では、低ウンバウンド損失関数によるオーバーフィッティング、バイアス付きミニバッチ勾配、トレーニング損失勾配の消失、KL(Kullback-Leibler)分散損失関数に対する高いサンプル要求など、最適化上の課題に直面している。
本稿では,DREの新しい損失関数である$alpha$-divergence loss function(alpha$-Div)を提案する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 02:58:04 GMT)
Advancing Chronic Tuberculosis Diagnostics Using Vision-Language Models: A Multi modal Framework for Precision Analysis [0.0] Vision-Language Model (VLM)はヴィジュアルエンコーディングにViT(Vision Transformer)、臨床コンテキストを処理するためにトランスフォーマーベースのテキストエンコーダを使用する。
クロスモーダルアテンション機構は,画像の特徴をテキスト情報と整合させ,Gemma-3bデコーダは包括的診断レポートを生成する。
モデルは、重要な慢性TBの病態を検出するための高精度(44%)とリコール(44%)を示した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 13:49:29 GMT)
AdaSemiCD: An Adaptive Semi-Supervised Change Detection Method Based on Pseudo-Label Evaluation [0.0] 擬似ラベルの使用を改善するための適応型動的半教師付き学習手法であるAdaCDを提案し,学習過程を最適化する。
LEVIR-CD, WHU-CD, CDDデータセットによる実験結果から, 適応学習フレームワークの有効性と普遍性を検証した。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 07:28:26 GMT)
Action tube generation by person query matching for spatio-temporal action detection [0.0] 方法は、IoUベースのリンクやクリップ分割のような後処理ステップに頼ることなく、オリジナルビデオからアクションチューブを生成する。
提案手法では,各フレームに問合せに基づく検出(DETR)を適用し,同一人物をフレーム間でリンクするDETRクエリとマッチングする。
アクションクラスはQMMマッチングから得られたクエリのシーケンスを用いて予測され、単一のクリップよりも長いビデオから可変長の入力が可能になる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 09:26:06 GMT)
Acceleration without photon pair creation [0.0] 本稿では,非慣性参照フレームにおける量子化電磁場が一般相対性理論に違反することなくモデル化可能であることを示すために,最近導入された局所光子法を用いる。
休息と加速する観察者の唯一の違いは、それぞれが異なる世界線密度を経験していることである。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 19:00:57 GMT)
A probabilistic imaginary-time evolution quantum algorithm for advection-diffusion equation: Explicit gate-level implementation and comparisons to quantum linear system algorithms [0.0] 本稿では, 対流拡散反応方程式を解くための量子アルゴリズムを提案する。
提案アルゴリズムは,誤差境界への悪影響を犠牲にして,行列サイズに関する指数的高速化を実現する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 06:53:28 GMT)
A mathematical model for a universal digital quantum computer with an application to the Grover-Rudolph algorithm [0.0] 代数的確率論を用いた普遍デジタル量子計算のための新しいフレームワークを開発する。
量子回路を基本量子ゲートの有限列として定義する。
与えられた確率密度関数を近似する量子回路を設計する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 17:18:45 GMT)
A finite-sample bound for identifying partially observed linear switched systems from a single trajectory [0.0] 線形切替系に対するシステム同定アルゴリズムのパラメータ推定誤差に基づいて有限サンプル確率境界を導出する。
我々の境界は、真の系が二次安定性を示すという仮定の下で統計的整合性を保証する。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 23:02:22 GMT)
A deep cut into Split Federated Self-supervised Learning [0.0] 協調型自己教師型学習は、最近、高度に分散した環境で実現可能になった。
MocoSFLのような最先端の手法は、初期層のネットワーク分割に最適化されている。
MonAcoSFLを導入し、オンラインおよびモーメントクライアントモデルをトレーニング手順中に整列させる。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 16:59:40 GMT)
A Constructive Approach to Zauner's Conjecture via the Stark Conjectures [0.0] 複素等角線の構成を$mathbbCd$(SICPOVMsとしても知られる)に与え、Zauner がすべての d に対して存在を予想する。
この構成は、すべての次元 d > 3 においてワイル=ハイゼンベルク対称性を持つ SIC の仮定的に完備なリストを与える。
論文参考訳(メタデータ) (Mon, 17 Mar 2025 12:35:12 GMT)