You Only Debias Once: Towards Flexible Accuracy-Fairness Trade-offs at Inference Time [132.0] ディープニューラルネットワークは、様々なバイアス問題に悩まされがちで、高い意思決定のための応用を危うくしている。
推論時間におけるフレキシブルな精度-公正トレードオフを実現するために,You Only Debias Once (YODO)を提案する。
YODOは、モデル精度と公平性の間の柔軟なトレードオフを、超低オーバーヘッドで達成します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:50:55 GMT)
SOGS: Second-Order Anchor for Advanced 3D Gaussian Splatting [116.2] SOGSはアンカーベースの3D-GS技術であり、2階アンカーを導入し、優れたレンダリング品質とアンカー機能とモデルサイズを同時に削減する。
モデルサイズを小さくした新規なビュー合成において,SOGSが優れたレンダリング品質を実現することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:50:46 GMT)
G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.9] 本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:08:27 GMT)
Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.3] 第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:29:33 GMT)
Cut Your Losses in Large-Vocabulary Language Models [102.7] 我々は,全トークンのロジットをグローバルメモリに実体化することなく,クロスエントロピー損失を計算する手法であるカットクロスエントロピー(CCE)を提案する。
CCEはロスのメモリフットプリントを24GBから1MBに減らし、ヘッドのトレーニング時間のメモリ消費を28GBから1GBに短縮する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:08:54 GMT)
Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation [98.9] この研究は、合成データによるスケーリングを再考し、データ中心の観点からビデオLLMの開発に焦点を当てる。
本研究では,純粋なテキスト命令データからビデオライクなサンプルを合成するSparrowというデータ拡張手法を提案する。
提案手法は,多くのサンプルを用いてトレーニングしたベースラインに匹敵する,あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:44:34 GMT)
Towards Understanding Why FixMatch Generalizes Better Than Supervised Learning [97.2] 半教師付き学習(SSL)は、教師付き学習(SL)よりも大幅に一般化されている。
ディープニューラルネットワーク(DNN)に適用したFixMatchライクSSLで観測されたテスト精度向上のための最初の理論的正当性を示す。
分析フレームワークはFlexMatch、FreeMatch、Dash、SoftMatchといった他のFixMatchライクなSSLメソッドにも適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:40:53 GMT)
Every FLOP Counts: Scaling a 300B Mixture-of-Experts LING LLM without Premium GPUs [96.7] 2つの異なる大きさのMoE大言語モデル(LLM)を提示する。
Ling-Liteは168億のパラメータと275億のアクティベートパラメータを持ち、Ling-Plusは2900億のパラメータと288億のアクティベートパラメータを持っている。
本稿では,(1)モデルアーキテクチャとトレーニングプロセスの最適化,(2)トレーニング異常処理の洗練,(3)モデル評価効率の向上のための革新的な手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:21:21 GMT)
Why Vision Language Models Struggle with Visual Arithmetic? Towards Enhanced Chart and Geometry Understanding [94.6] 視覚言語モデル(VLM)はマルチモーダルタスクにおいて顕著な進歩を遂げた。
彼らはしばしば、オブジェクトのカウントや長さ比較のような一見単純な機能である視覚的算術に苦しむ。
我々は、ピアジェの認知発達理論に触発された新しいポストトレーニング戦略であるCogAlignを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:13:57 GMT)
BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.9] BRIGHTER - 28の異なる言語のマルチラベルデータセットのコレクション。
データ収集とアノテーションプロセスとこれらのデータセット構築の課題について説明する。
BRIGHTERデータセットは、テキストベースの感情認識のギャップを埋めるためのステップであることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:20:14 GMT)
On How Iterative Magnitude Pruning Discovers Local Receptive Fields in Fully Connected Neural Networks [92.7] イテレーティブ・マグニチュード・プルーニング(IMP)は、高性能にトレーニングできるスパース・コンボリューションワークを抽出する一般的な方法となっている。
近年の研究では、IMPを完全連結ニューラルネットワーク(FCN)に適用することで、局所受容野(RF)の出現につながることが示されている。
非ガウス的統計量(例えばシャープエッジ)を用いた合成画像のトレーニングは、FCNにおける局所RFの出現を促進するのに十分であることを示す結果から着想を得て、IMPが非ガウス的統計量のFCN表現を反復的に増加させるという仮説を立てた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:43:54 GMT)
Video Action Differencing [92.3] 我々は、同じアクションのビデオ間の微妙な違いを識別する新しいタスクである、ビデオアクションダイファレンス(VidDiff)を紹介する。
最初に、549のビデオペアを含むベンチマークデータセットであるVidDiffBenchを作成します。
我々の実験は、VidDiffBenchが最先端の大規模マルチモーダルモデルに重大な課題をもたらすことを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:18:32 GMT)
Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation [85.7] 本稿では,大規模言語モデルエージェントのための高品質なトレーニングトラジェクトリを合成するための原則的フレームワークを提案する。
このフレームワークは、関数シグネチャパスからクエリのシーケンスと実行可能な関数呼び出しへの自動的で反復的な変換に基づいている。
実験の結果,14BモデルであるMagnetic-14B-mDPOでは,BFCL-v3では68.01,ToolQueryでは73.30が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:13:07 GMT)
Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.4] 低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:44:46 GMT)
Safety Guardrails for LLM-Enabled Robots [82.0] 従来のロボット安全アプローチは、大規模言語モデル(LLM)の新たな脆弱性に対処しない
LLM対応ロボットの安全性を確保するための2段ガードレールアーキテクチャであるRoboGuardを提案する。
RoboGuardは、安全プランのパフォーマンスを損なうことなく、安全でないプランの実行を92%から2.5%以下に削減することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:01:56 GMT)
Inductive Moment Matching [81.0] Inductive Moment Matching (IMM) は1段階または数段階のサンプリングのための新しい生成モデルである。
IMMはImageNet-256x256上の拡散モデルを8ステップのみを用いて1.99 FIDで上回り、CIFAR-10上で1.98の最先端の2ステップFIDをスクラッチから訓練したモデルで達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:37:39 GMT)
Unbiased Region-Language Alignment for Open-Vocabulary Dense Prediction [80.7] 事前訓練された視覚言語モデル(VLM)は、印象的なゼロショット認識能力を示したが、それでも高密度予測タスクでは性能が劣っている。
提案するDenseVLMは,非バイアスの領域言語アライメントを,強力な事前学習型VLM表現から学習するためのフレームワークである。
DenseVLMは、オープン語彙オブジェクト検出および画像分割法において、元のVLMを直接置き換えることができることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:19:10 GMT)
Learning to Animate Images from A Few Videos to Portray Delicate Human Actions [80.6] ビデオ生成モデルは、人間の繊細なアクションを描写するビデオに静的イメージをアニメーション化するのに依然として苦労している。
本稿では,映像をアニメーション化し,微妙な人間の行動を表現するための学習課題について,少数のビデオを用いて検討する。
本研究では、他の動画の動画特徴とフレーム間の対応を利用して、モデルに映像の再構成を強制することで、一般化可能な動きパターンを学習するFLASHを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:32:16 GMT)
Local Policies Enable Zero-shot Long-horizon Manipulation [80.1] ManipGenを紹介します。これはsim2real転送のための新しいポリシーのクラスであるローカルポリシーを活用します。
ManipGenは、SayCan、OpenVLA、LLMTrajGen、VoxPoserといったSOTAアプローチを、50の現実世界操作タスクで36%、76%、62%、60%で上回っている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:54:50 GMT)
Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.6] テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。
本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:43:15 GMT)
SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection [76.2] 本研究では、7つの異なる言語族から30以上の言語をカバーし、テキストベースの感情検出に関する共有タスクを提示する。
データインスタンスは6つの感情クラスにマルチラベルされており、感情の強さに注釈を付けた11言語にデータセットが追加されている。
参加者は, (a) 単言語設定における感情ラベル, (b) 感情強度スコア, (c) 言語間設定における感情ラベルの3つのトラックでラベルを予測するように求められた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:49:31 GMT)
DiffSG: A Generative Solver for Network Optimization with Diffusion Model [75.3] 生成拡散モデルは、様々なクロスドメインアプリケーションで人気がある。
これらのモデルは複雑なネットワーク最適化問題に対処する上で有望である。
本稿では拡散モデルに基づく解生成という,拡散モデル生成のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:43:04 GMT)
Controllable 3D Outdoor Scene Generation via Scene Graphs [74.4] 本研究では,スパースシーングラフを高密度なBEV埋め込みマップに変換するインタラクティブシステムを開発した。
推論中は、ユーザーは簡単にシーングラフを作成したり変更したりして、大規模な屋外シーンを生成することができる。
実験結果から,提案手法は入力シーングラフと密に一致した高品質な3次元都市景観を連続的に生成することが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:26:08 GMT)
Scalable Image Tokenization with Index Backpropagation Quantization [74.2] インデックスバックプロパゲーション量子化(IBQ)は、すべてのコードブック埋め込みとビジュアルエンコーダの共同最適化のための新しいVQ手法である。
IBQは、ビジュアルトークンのスケーラブルなトレーニングを可能にし、初めて、高次元(256ドル)で高利用率の大規模コードブックを実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:01:48 GMT)
ReelWave: A Multi-Agent Framework Toward Professional Movie Sound Generation [72.2] 映画制作は、複数のシーンを通してよりリッチなコンテキストを提供する、生成的オーディオにとって重要な応用である。
本稿では,プロの映画制作プロセスに触発された音声生成のためのマルチエージェントフレームワークを提案する。
本フレームワークは,映画から抽出したビデオクリップから,よりリッチな音声生成のコンテキストを捉えることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:57:55 GMT)
R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model [70.8] 非SFT 2Bモデルのみを用いたマルチモーダル推論における創発的特性の再現に成功した最初の例を示す。
本モデルはCVBenchで59.47%の精度を達成し, ベースモデルを約30%, SFT設定を2%以上上回った。
さらに,RLとインストラクションモデルを用いてR1のような推論を行おうとする試みの失敗と知見を共有した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:52:08 GMT)
Fixing the RANSAC Stopping Criterion [69.6] この論文の主な貢献は、RANSACアルゴリズムに基づいて構築された事実上のシステムに長時間のエラーに対処することにある。
サンプリング確率の近似は、1981年にRANSACの適応的な停止をサポートするために論文によって導かれた。
正確な確率の計算の実装は驚くほど単純であるが、非常に効果的であり、幅広いコンピュータビジョンシステムに大きく影響する可能性がある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:18:54 GMT)
Dynamic Path Navigation for Motion Agents with LLM Reasoning [69.6] 大規模言語モデル(LLM)は、強力な一般化可能な推論と計画能力を示している。
本研究では,LLMのゼロショットナビゲーションと経路生成機能について,データセットの構築と評価プロトコルの提案により検討する。
このようなタスクが適切に構成されている場合、現代のLCMは、目標に到達するために生成された動きでナビゲーションを自律的に精錬しながら障害を回避するためのかなりの計画能力を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:39:09 GMT)
KwaiChat: A Large-Scale Video-Driven Multilingual Mixed-Type Dialogue Corpus [69.5] 本稿では,人間間ビデオ駆動型多言語混在型対話コーパスを提案する。
KwaiChatのコーパスには合計93,209の動画と246,080の対話があり、4つの対話タイプ、30のドメイン、4つの言語、13のトピックが含まれている。
KwaiChat上での 7 つの異なる LLM の解析により、GPT-4o が最高の性能を発揮するが、この状況では性能が良くないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:05:38 GMT)
Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model [69.1] Seedream 2.0は、中国語と英語のバイリンガル画像生成基盤モデルである。
中国語と英語の両方でテキストプロンプトを管理し、バイリンガル画像生成とテキストレンダリングをサポートする。
テキストエンコーダとして自己開発されたバイリンガルな大規模言語モデルと統合されており、大量のデータから直接ネイティブ知識を学習することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:58:33 GMT)
HybridReg: Robust 3D Point Cloud Registration with Hybrid Motions [69.0] HybridRegは、3Dポイントクラウド登録のための新しいアプローチで、ハイブリッドモーションを考慮に入れた不確実性マスクを学習する。
私たちの知る限りでは、HybridRegは、ロバストなポイントクラウド登録のためにハイブリッドモーションを利用する最初の作品です。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:01:32 GMT)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.4] 本稿では,VLAに基づくロボットシステムのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:57:07 GMT)
A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning [67.7] 事前訓練された視覚モデル(PVM)は現代のロボティクスの基本であるが、その最適構成は定かではない。
セマンティック・ボトルネックを導入してオブジェクト中心の表現を誘導する手法であるSlotMIMを開発した。
提案手法は,画像認識,シーン理解,ロボット学習評価において,従来の作業よりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:18:31 GMT)
Datasets, Documents, and Repetitions: The Practicalities of Unequal Data Quality [67.7] 各種計算予算およびデータフィルタリングと復号化によって生成された複数の事前学習データセットにおけるモデル性能について検討する。
トレーニングレシピに適切な修正を加えると、最大10エポックのアグレッシブフィルタデータセットを繰り返すことで、複数の計算予算のオーダーで1エポックの10倍のスーパーセットでのトレーニングを上回ります。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:51:17 GMT)
Dynamic Cross-Modal Feature Interaction Network for Hyperspectral and LiDAR Data Classification [66.6] ハイパースペクトル画像(HSI)とLiDARデータ共同分類は難しい課題である。
DCMNet(Dynamic Cross-Modal Feature Interaction Network)を提案する。
BSAB(Bilinear Spatial Attention Block)、BCAB(Bilinear Channel Attention Block)、ICB(Integration Convolutional Block)の3つの機能相互作用ブロックを導入している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:50:13 GMT)
Graph Foundation Models: Concepts, Opportunities and Challenges [66.4] ファンデーションモデルは、さまざまな人工知能アプリケーションにおいて重要なコンポーネントとして現れてきた。
一般化と適応における基礎モデルの能力は、グラフ機械学習研究者を動機付け、新しいグラフ学習パラダイムを開発する可能性について議論する。
本稿では,グラフ基礎モデル(GFM)の概念を紹介し,その重要な特徴と基礎技術について概説する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:14:30 GMT)
Learning Temporal Distances: Contrastive Successor Features Can Provide a Metric Structure for Decision-Making [66.3] 時間的距離は、計画、制御、強化学習のための多くのアルゴリズムの中心にある。
このような時間的距離を設定内で定義しようとする以前の試みは、重要な制限によって妨げられている。
比較学習によって学習された後継特徴が,三角形の不等式を満たす時間的距離を形成することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:33:32 GMT)
InferDPT: Privacy-Preserving Inference for Black-box Large Language Model [66.1] InferDPTは、ブラックボックスLSMのプライバシ保護推論のための最初の実用的なフレームワークである。
RANTEXTはInferDPTの摂動モジュールに組み込まれた新しい微分プライバシー機構である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:52:58 GMT)
Calling a Spade a Heart: Gaslighting Multimodal Large Language Models via Negation [65.9] 本稿では,様々なベンチマークにおいて最先端MLLMを体系的に評価する。
本稿では,MLLMの脆弱性を否定的議論に対して評価するために設計された,最初のベンチマークであるGaslightingBenchを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:50:13 GMT)
Non-Parametric Learning of Stochastic Differential Equations with Non-asymptotic Fast Rates of Convergence [65.6] 非線形微分方程式のドリフトと拡散係数の同定のための新しい非パラメトリック学習パラダイムを提案する。
鍵となる考え方は、基本的には、対応するフォッカー・プランク方程式のRKHSに基づく近似をそのような観測に適合させることである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:05:53 GMT)
VURF: A General-purpose Reasoning and Self-refinement Framework for Video Understanding [65.1] 本稿では,Large Language Models (LLM) の推論能力に基づくビデオ理解・推論フレームワーク (VURF) を提案する。
ビデオタスクのコンテキストにおいてLLMの実用性を拡張し,最小限のインプットとアウトプットのデモをコンテキストフレームワーク内で一般化する,新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:53:38 GMT)
Think Before You Segment: High-Quality Reasoning Segmentation with GPT Chain of Thoughts [64.9] ThinkFirstはトレーニング不要の推論セグメンテーションフレームワークである。
我々のアプローチでは、GPT-4oや他の強力なMLLMが画像の詳細なチェーン記述を生成することができる。
この要約された記述は、セグメンテーションプロセスを支援するために言語で指示されたセグメンテーションアシスタントに渡される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:26:11 GMT)
A Simple Approach to Unifying Diffusion-based Conditional Generation [63.4] 多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:45:51 GMT)
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment [63.2] VideoLifterは、ローカルからグローバルへの戦略を断片的に活用する、新しいビデオから3Dパイプラインである。
再建プロセスを大幅に加速し、訓練時間を82%以上削減し、現在のSOTA法よりも視覚的品質を向上した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:19:37 GMT)
Can Watermarking Large Language Models Prevent Copyrighted Text Generation and Hide Training Data? [62.7] 著作権文書の生成に対する抑止剤としての透かしの有効性について検討する。
我々は、透かしがメンバーシップ推論攻撃(MIA)の成功率に悪影響を及ぼすことを発見した。
透かしにおける最近のMIAの成功率を改善するための適応的手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:18:24 GMT)
MomentSeeker: A Comprehensive Benchmark and A Strong Baseline For Moment Retrieval Within Long Videos [62.0] 我々は、一般的な長時間ビデオモーメント検索タスクの処理において、検索モデルの性能を評価するベンチマークであるMomentSeekerを提案する。
平均で500秒を超える長いビデオが組み込まれており、長時間ビデオのモーメント検索に特化した最初のベンチマークとなっている。
幅広いタスクカテゴリ(Moment Search, Caption Alignment, Image-conditioned Moment Search, Video-conditioned Moment Searchなど)と多様なアプリケーションシナリオをカバーする。
さらに、MLLMベースのLVMRレトリバーを合成データ上に微調整し、ベンチマークで高い性能を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:34:20 GMT)
Brain Tumor Classification on MRI in Light of Molecular Markers [61.8] 1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:01:47 GMT)
ResMoE: Space-efficient Compression of Mixture of Experts LLMs via Residual Restoration [61.6] 複数現象言語モデルのバックボーンであるMixture-of-Experts (MoE) Transformerは、各入力トークンに対して少数のモデルパラメータのみをアクティベートすることで、空間性を利用する。
ResMoEは、Wasserstein Barycenterを利用した革新的なMoE近似フレームワークで、共通の専門家(バリセンターエキスパート)を抽出し、このバリセンターエキスパートと元の専門家の間の残差を近似する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:15:54 GMT)
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning [60.7] メタ強化学習(RL)問題としてテスト時間計算を最適化する問題を定式化する。
現状のモデルでは後悔を最小限に抑えることはできないが,結果0/1報酬RLと合わせて報酬ボーナスを最大化することで,それを実現できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:40:43 GMT)
FaceXFormer: A Unified Transformer for Facial Analysis [59.9] FaceXFormerは10の顔分析タスクを実行することができるエンドツーエンドの統一トランスフォーマーモデルである。
タスクには、顔解析、ランドマーク検出、ヘッドポーズ推定、属性予測、年齢、性別、人種推定が含まれる。
私たちは、FaceXFormerを10種類の多様な顔認識データセットでトレーニングし、特殊モデルとマルチタスクモデルの両方に対して評価する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:08:19 GMT)
Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.9] 本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:30:55 GMT)
Learning Decision Trees as Amortized Structure Inference [59.7] 本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。
提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:05:07 GMT)
Length-Controlled AlpacaEval: A Simple Way to Debias Automatic Evaluators [59.5] 自動評価におけるバイアスを制御するための簡単な回帰分析手法を提案する。
そこで本研究では,ALpacaEvalの長さバイアスの低減に焦点をあてる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:27:03 GMT)
Towards Open-Vocabulary Audio-Visual Event Localization [59.2] 本稿では,オープン語彙音声・視覚イベントのローカライズ問題を紹介する。
この問題は、音声・視覚イベントのローカライズと、推測時に見つからないデータの両方の明確なカテゴリの予測を必要とする。
OV-AVEBenchデータセットを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:30:09 GMT)
LLMs syntactically adapt their language use to their conversational partner [58.9] 人間の話者は会話中に言語の使用が互いに一致していることがよく観察されている。
大規模言語モデル(LLM)間の会話のコーパスを構築し、2つのLLMエージェントが会話が進むにつれて、より類似した構文的選択をするのを見つける。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:37:07 GMT)
DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs [58.5] DistiLLM-2は、教師の反応の可能性を同時に増加させ、生徒の反応を減少させる対照的なアプローチである。
実験の結果,DistiLLM-2は様々なタスクにまたがって高性能な学生モデルを構築するだけでなく,多様なアプリケーションをサポートすることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:51:32 GMT)
FedRand: Enhancing Privacy in Federated Learning with Randomized LoRA Subparameter Updates [58.2] フェデレートラーニング(FL)は、モデルを分散的にトレーニングするための広く使われているフレームワークである。
我々はFedRandフレームワークを提案し、クライアントパラメータの完全な集合を開示するのを避ける。
我々はFedRandがMIAに対するロバスト性を改善することを、関連するベースラインと比較して実証的に検証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:55:50 GMT)
MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning [57.0] 本稿では,大規模ルールベース強化学習(RL)をマルチモーダル推論に拡張したマルチモーダル推論モデルMM-Eurekaを提案する。
本研究は,マルチモーダル空間におけるDeepSeek-R1のようなテキストベースのRLシステムのキー特性を再現する。
命令調整モデルと事前学習モデルの両方が、教師付き微調整なしでルールベースRLにより強力なマルチモーダル推論能力を実現できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:23:12 GMT)
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer [56.8] 本稿では,ユーザフレンドリーなテキスト記述と静的参照画像から動的エフェクトを生成する,画像アニメーションとしてのVFX生成のための新しいパラダイムを提案する。
i) VFXは15の多様なエフェクトカテゴリにまたがる最初の高品質なVFXビデオデータセットで、テキストによる記述と時間制御のためのスタートエンドタイムスタンプと、(ii) Video Diffusion Transformerをベースとした制御可能なVFX生成フレームワークであるVFX Creatorである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:59:53 GMT)
Improving Pretraining Data Using Perplexity Correlations [56.4] 我々は,LLM学習を必要とせず,高品質な事前学習データを選択するフレームワークを提案する。
我々は,パープレキシティ-ベンチマーク相関の推定を中心に,データ選択のための新しい統計フレームワークを構築した。
提案手法は,DataComp-LMで見つかった最高のデータセレクタをマッチングしながら,各ベンチマークでDSIRより優れている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:56:18 GMT)
Token-Supervised Value Models for Enhancing Mathematical Problem-Solving Capabilities of Large Language Models [56.3] 既存の検証器はテスト時の木探索技術に準最適である。
トークン制御値モデル(TVM)を提案する。
TVMは各トークンに、正しい最終回答に達する確率を反映した確率を割り当てる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:24:29 GMT)
Painting with Words: Elevating Detailed Image Captioning with Benchmark and Alignment Learning [56.3] 我々はDeCapBenchと、詳細なキャプションタスク用に特別に設計された新しいメトリックであるDCScoreを紹介する。
DCScoreは、反応を最小の自己充足単位に分解することで、幻覚ときめ細かい包括性を評価する。
DeCapBenchは、視覚言語モデルの既存のベンチマークを上回り、記述タスクにおけるVLMアリーナの結果と高い相関を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:53:56 GMT)
Cross-platform Prediction of Depression Treatment Outcome Using Location Sensory Data on Smartphones [56.0] スマートフォンで受動的に収集した位置情報データを用いて治療結果を予測する。
その結果, 位置特徴とベースライン自己申告アンケートスコアは, F1得点を0.67点まで引き上げることが可能であり, 定期的な自己申告アンケートと同等であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:00:07 GMT)
LLaFEA: Frame-Event Complementary Fusion for Fine-Grained Spatiotemporal Understanding in LMMs [55.8] 大規模モデル(LMM)はシーン理解に優れるが、言語的表現と視覚的表現の微妙なアライメントのために微妙な時間的推論に苦慮する。
既存の方法は、フレームベースのビデオからテキストの位置と期間を視覚空間にマッピングするが、時間的調整を制限する時間的間隔に悩まされる。
LFEAを導入してイベントカメラを時間的に密集した認識とフレームイベント融合に活用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:30:30 GMT)
EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.8] EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:42:01 GMT)
Right Place, Right Time! Dynamizing Topological Graphs for Embodied Navigation [55.6] 身体的ナビゲーションのタスクは、探索中にシーンのトポロジカルグラフを構築することを伴うことが多い。
我々は、オブジェクト遷移グラフ(OTG)と呼ばれる静的トポロジカルグラフをダイナマイズするために、構造化されたオブジェクト遷移を導入する。
OTGは、人間の習慣にインスパイアされた構造化経路に従って、ポータブルターゲットをシミュレートする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:26:37 GMT)
QMambaBSR: Burst Image Super-Resolution with Query State Space Model [55.6] バースト超解像度は、複数のバースト低解像度フレームからサブピクセル情報を融合することにより、高画質でよりリッチな細部で高解像度の画像を再構成することを目的としている。
BusrtSRにおいて鍵となる課題は、高周波ノイズ障害を同時に抑制しつつ、ベースフレームの補完的なサブピクセルの詳細を抽出することである。
本稿では,Query State Space Model (QSSM) とAdaptive Up-Sampling Module (AdaUp) を組み合わせた新しいQuery Mamba Burst Super-Resolution (QMambaBSR) ネットワークを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:32:11 GMT)
Beyond the Edge of Function: Unraveling the Patterns of Type Recovery in Binary Code [55.5] 本稿では,バイナリコードの変数型を復元するフレームワークByteTRを提案する。
ByteTRは、関数間の変数伝搬の普遍性を考慮して、変数伝搬をトレースするためのプロシーダ間解析を行い、ゲートグラフニューラルネットワークを用いて、変数型回復のための長距離データフロー依存性をキャプチャする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:27:05 GMT)
GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.0] GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:50:32 GMT)
PE3R: Perception-Efficient 3D Reconstruction [54.7] Perception-Efficient 3D Reconstruction (PE3R) は、精度と効率の両立を図った新しいフレームワークである。
このフレームワークは3次元のセマンティックフィールド再構成において最小9倍のスピードアップを実現し、認識精度と再現精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:29:10 GMT)
SOYO: A Tuning-Free Approach for Video Style Morphing via Style-Adaptive Interpolation in Diffusion Models [54.6] 本稿では,ビデオスタイルモーフィングのための新しい拡散型フレームワークであるSOYOを紹介する。
本手法では, 微調整を伴わずに事前訓練したテキスト・画像拡散モデルを用い, 注意注入とAdaINを併用して構造的整合性を維持する。
ビデオフレーム間の調和を図るために,2種類の画像間の適応型サンプリングスケジューラを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:27:01 GMT)
FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset [54.5] FaceID-6Mは、600万の高品質テキストイメージペアを含む、最初の大規模なオープンソースのFaceIDデータセットである。
FaceID-6Mデータセットの有効性を示す実験を行った。
FaceIDカスタマイズコミュニティにおける研究を支援し、前進させるために、コード、データセット、モデルを公開しています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:14:47 GMT)
Should VLMs be Pre-trained with Image Data? [54.5] 画像とテキストデータの混在による事前学習により、モデルが視覚言語タスクでより良いパフォーマンスを発揮できることがわかった。
平均6つの多様なタスクにおいて、1Bモデルに対して、事前学習による視覚トークンの80%を導入すると、完全に事前訓練されたモデルに視覚トークンを導入するよりも平均2%改善されることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:58:19 GMT)
Interactive Tumor Progression Modeling via Sketch-Based Image Editing [54.5] 腫瘍進行編集のためのスケッチベース拡散モデルであるSkEditTumorを提案する。
スケッチを構造的先行として活用することにより,構造的整合性と視覚的リアリズムを維持しつつ,腫瘍領域の精密な修正を可能にする。
私たちのコントリビューションには、医用画像編集のための拡散モデルとスケッチの新たな統合、腫瘍進行の可視化のきめ細かい制御、複数のデータセットにわたる広範な検証などが含まれています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:04:19 GMT)
Cell as Point: One-Stage Framework for Efficient Cell Tracking [54.2] 本稿では,セルをポイントとして扱うことで細胞追跡を再現する新しいエンド・ツー・エンドのワンステージフレームワークを提案する。
従来の方法とは異なり、CAPは明示的な検出やセグメンテーションの必要性を排除し、代わりに1段階の配列の細胞を共同で追跡する。
CAPは有望な細胞追跡性能を示し、既存の方法の10倍から55倍効率が高い。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:22:26 GMT)
Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning [54.0] 我々は、報酬レンダリングとImitation from Observation (IfO)を統合した新しいフレームワークを提案する。
異なる方法でF距離をインスタンス化することにより、2つの理論的解析を導き、アクセシブルステート指向ポリシー規則化(ASOR)と呼ばれる実用的なアルゴリズムを開発する。
ASOR は、オフライン RL やオフライン RL など、様々なアプローチ RL に組み込まれる一般的なアドオンモジュールとして機能する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:50:20 GMT)
NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.8] 近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:02:57 GMT)
VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation [53.6] VidBotは、WildのモノクルなRGBのみの人間ビデオから学習した3Dアベイランスを使って、ゼロショットロボット操作を可能にするフレームワークである。
VidBotは、人間の日常的なビデオを利用してロボットの学習をよりスケーラブルにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:04:58 GMT)
An Analytics-Driven Approach to Enhancing Supply Chain Visibility with Graph Neural Networks and Federated Learning [52.8] 本稿では,フェデレートラーニング(FL)とグラフ畳み込みニューラルネットワーク(GCN)を統合して,サプライチェーンの可視性を高める手法を提案する。
FLは、生のデータ交換を必要とせず、情報共有を容易にすることで、国間での協調的なモデルトレーニングを可能にする。
GCNは、知識グラフ内の複雑なリレーショナルパターンをキャプチャするフレームワークを強化し、正確なリンク予測を可能にして、隠れたコネクションを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:15:45 GMT)
CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [52.6] COIR(Code Information Retrieval Benchmark)は、コード検索機能を評価するためのベンチマークである。
COIRは、厳密にキュレートされた10のコードデータセットで構成され、7つの異なるドメインにまたがる8つの特有の検索タスクにまたがる。
我々は,COIRを用いた9つの広く使用されている検索モデルを評価し,最先端システムにおいても,コード検索タスクの実行に重大な困難があることを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:48:30 GMT)
Approximate Size Targets Are Sufficient for Accurate Semantic Segmentation [52.2] 相対的なオブジェクトサイズ分布に近似するバイナリクラスタグを拡張することで、オフザシェルフアーキテクチャはセグメンテーション問題を解決することができる。
平均予測に対するゼロ回避KL偏差損失は、標準画素精度の監督に匹敵するセグメンテーション精度を生成する。
我々のアイデアはPASCAL VOC上で、近似オブジェクトサイズの人間のアノテーションを用いて検証されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:02:13 GMT)
TimeCAP: Learning to Contextualize, Augment, and Predict Time Series Events with Large Language Model Agents [52.1] TimeCAPは、時系列データのコンテキスト化ツールとしてLarge Language Models(LLM)を創造的に利用する時系列処理フレームワークである。
TimeCAPには2つの独立したLCMエージェントが組み込まれており、1つは時系列のコンテキストをキャプチャするテキスト要約を生成し、もう1つはより情報のある予測を行うためにこのリッチな要約を使用する。
実世界のデータセットによる実験結果から,TimeCAPは時系列イベント予測の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:15:20 GMT)
AnomalyPainter: Vision-Language-Diffusion Synergy for Zero-Shot Realistic and Diverse Industrial Anomaly Synthesis [52.1] AnomalyPainterはVision Language Large Model、Latent Diffusion Model、テクスチャライブラリTex-9Kを相乗化するフレームワークである。
Tex-9Kは75のカテゴリと8,792のテクスチャを含むプロ向けテクスチャライブラリである。
大規模な実験により、AnomalyPainterは現実主義、多様性、一般化において既存の手法より優れていることが示されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:35:35 GMT)
HACSurv: A Hierarchical Copula-Based Approach for Survival Analysis with Dependent Competing Risks [52.0] 本稿では,階層型アルキメデスコピュラス構造を学習する生存分析手法であるHACSurvを紹介する。
リスクと検閲の間の依存関係をキャプチャすることで、HACSurvは生存予測の精度を向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:00:06 GMT)
Quantizing Large Language Models for Code Generation: A Differentiated Replication [51.9] 大規模言語モデル(LLM)は、コード生成において印象的な能力を示しており、特に自然言語で記述された要求を自動的に実装する。
LLMはメモリ(そして結果として炭素)のフットプリントに重大な課題をもたらす。
LLM量子化の新しいフロンティアは4ビット精度であり、平均メモリフットプリントが70%減少する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:26:08 GMT)
WeGen: A Unified Model for Interactive Multimodal Generation as We Chat [51.8] マルチモーダル生成と理解を統合するモデルWeGenを紹介する。
より詳細な指示を省くために、創造性の高い多様な結果を生成することができる。
様々なビジュアル生成ベンチマークにおいて,最先端性能が達成されていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:12:53 GMT)
MRCEval: A Comprehensive, Challenging and Accessible Machine Reading Comprehension Benchmark [51.7] 我々は、理解を読むのに必要な重要な能力を分類する新しい分類法を導入する。
この分類に基づくMRCEvalは,大規模言語モデル(LLM)をサンプルジェネレータおよび選択判断器として活用するMRCベンチマークである。
MRCEvalは総合的で、挑戦的でアクセスしやすいベンチマークであり、13のRCスキルをカバーし、合計2.1Kの高品質なマルチチョイスの質問をカバーしている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:20:05 GMT)
AdaptSR: Low-Rank Adaptation for Efficient and Scalable Real-World Super-Resolution [50.6] AdaptSRは、現実世界のタスクにバイキュービックトレーニングされたSRモデルを効率的に再利用する低ランク適応フレームワークである。
実験の結果,AdaptSRはPSNRで最大4dB,実際のSRベンチマークで2%,GAN法と拡散型SR法より優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:03:18 GMT)
Geometric Retargeting: A Principled, Ultrafast Neural Hand Retargeting Algorithm [50.5] 遠隔操作のための超高速・原理的ハンドアルゴリズムGeoRTを紹介する。
GeoRTは、人間の指のキーポイントを1KHzでロボットの手のキーポイントに変換し、最先端のスピードと精度を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:10:21 GMT)
AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation [49.7] 本稿では,A2V(Video-to-Audio)生成とA2V(Audio-to-Video)生成のための統合フレームワークを提案する。
我々のフレームワークの鍵は、ビデオとオーディオの拡散モデル間の双方向情報交換を容易にするFusion Blockである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:30:39 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5] 実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:21:05 GMT)
Large Language Models Often Say One Thing and Do Another [49.2] 我々はWords and Deeds Consistency Test (WDCT)と呼ばれる新しい評価ベンチマークを開発した。
このベンチマークは、異なるドメインにわたる単語ベースの質問とdeedベースの質問の厳密な対応を確立する。
評価結果から,異なるLLMとドメイン間で単語と行為の矛盾が広範囲にあることが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:34:54 GMT)
Deep Convolutional Neural Networks for Short-Term Multi-Energy Demand Prediction of Integrated Energy Systems [49.2] 本稿では,多エネルギー消費予測のための畳み込みニューラルネットワーク(CNN)に基づく新しい6つの予測モデルを開発する。
これらのモデルは、新しい統合型電気・熱・ガスネットワークシステムに包括的に適用される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:05:46 GMT)
Enhancing Architecture Frameworks by Including Modern Stakeholders and their Views/Viewpoints [48.9] データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:01:15 GMT)
Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.9] MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:28:31 GMT)
SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model [48.5] ソーシャルメディア上で共有される合成画像は、広範囲の聴衆を誤解させ、デジタルコンテンツに対する信頼を損なう可能性がある。
ソーシャルメディア画像検出データセット(SID-Set)を紹介する。
本稿では,SIDA という画像深度検出,局所化,説明の枠組みを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:03:16 GMT)
Is the House Ready For Sleeptime? Generating and Evaluating Situational Queries for Embodied Question Answering [48.4] 本研究では,家庭環境における状況問合せ(S-EQA)による身体的質問回答の課題を提示し,解決する。
以前のEQAの作業とは異なり、状況的クエリでは、エージェントが複数のオブジェクト状態を正しく識別し、回答のために状態に関するコンセンサスに到達する必要がある。
本稿では, LLMの出力をラップして, 独自のコンセンサスクエリとそれに対応するコンセンサスオブジェクト情報を生成する新しいPrompt-Generate-Evaluateスキームを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:12:19 GMT)
Aligning Instance-Semantic Sparse Representation towards Unsupervised Object Segmentation and Shape Abstraction with Repeatable Primitives [48.2] 3Dオブジェクトの形状を理解するには、インスタンスとセマンティックセグメンテーションの結果から抽象化されたオブジェクト部品による形状表現が必要である。
セマンティック・アウェア・シェイプ表現のための一段階的、完全に教師なしのフレームワークを提案する。
このフレームワークは、高次元空間におけるオブジェクト部分のスパース表現と特徴アライメントを通じて、統合インスタンスのセグメンテーション、セマンティックセグメンテーション、形状抽象化を生成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:52:17 GMT)
10K is Enough: An Ultra-Lightweight Binarized Network for Infrared Small-Target Detection [48.1] バイナリ化されたニューラルネットワーク(BNN)は、モデル圧縮における例外的な効率によって区別される。
両立赤外小ターゲット検出ネットワーク(BiisNet)を提案する。
BiisNetは二項化畳み込みのコア操作を保存し、完全精度の機能をネットワークの情報フローに統合する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:26:22 GMT)
Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.9] 本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:24:19 GMT)
Combinatorial Optimization via LLM-driven Iterated Fine-tuning [47.7] 我々は,Large Language Models (LLMs) を利用して,柔軟で文脈に依存しない制約を最適化に統合する新しい方法を提案する。
本フレームワークは, 局所的制約と厳密なグローバル最適化とのバランスを, ベースラインサンプリング法よりも効率的に行う。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:58:18 GMT)
Hypergraph-Transformer (HGT) for Interactive Event Prediction in Laparoscopic and Robotic Surgery [47.5] 腹腔内ビデオから外科的ワークフローの重要なインタラクティブな側面を理解し,予測できる予測型ニューラルネットワークを提案する。
我々は,既存の手術用データセットとアプリケーションに対するアプローチを検証し,アクション・トリプレットの検出と予測を行った。
この結果は、非構造的な代替案と比較して、我々のアプローチの優位性を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:58:42 GMT)
Exploring Token-Level Augmentation in Vision Transformer for Semi-Supervised Semantic Segmentation [47.4] TokenMixは、視覚変換器を用いた半教師付きセマンティックセマンティックセグメンテーションのために特別に設計されたデータ拡張技術である。
本稿では,各ブランチが入力画像に画像と特徴拡張を適用したデュアルブランチフレームワークを提案する。
提案手法は, 精度が顕著に向上し, 最先端のアルゴリズムよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:48:54 GMT)
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control [47.3] ビデオのインペイントは、腐敗したビデオコンテンツを復元することを目的としている。
マスク付きビデオを処理するための新しいデュアルストリームパラダイムVideoPainterを提案する。
また,任意の長さの映像を描ける新しいターゲット領域ID再サンプリング手法も導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:56:32 GMT)
Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data [47.2] 2つの代替的な強制選択実験は視覚知覚文学で人気がある。
クラウドソースによる知覚距離モデルが登場し、三つ子間で画像を共有することはなく、ランキングが実現不可能になった。
両面分布を用いた2AFC実験において,基礎となる意思決定過程を統計的にモデル化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:42:55 GMT)
Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration [46.7] 大規模言語モデル(LLM)は、ターンバイターンの人間とAIのコラボレーションにおいて優れているが、リアルタイムの対話を必要とする同時タスクに苦労している。
本稿では,システム1とシステム2を統合した新しい言語エージェントフレームワークであるDPT-Agentを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:25:31 GMT)
Extending Lifetime of Embedded Systems by WebAssembly-based Functional Extensions Including Drivers [46.5] WebAssembly(Wasm)コンテナ内の周辺I/O操作を容易にするために設計されたフレームワークであるWasm-IOを紹介する。
プラットフォームに依存しない周辺構成をWasmバイナリ内に埋め込むための同期I/Oと手法について詳述する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:22:00 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [46.3] プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:50:44 GMT)
Diffusion Model-Based Image Editing: A Survey [46.2] 様々な画像生成や編集作業のための強力なツールとして,拡散モデルが登場している。
本稿では,画像編集のための拡散モデルを用いた既存手法の概要について述べる。
テキスト誘導画像編集アルゴリズムの性能を更に評価するために,系統的なベンチマークであるEditEvalを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:52:48 GMT)
A Light Perspective for 3D Object Detection [46.2] 本稿では,最先端のDeep Learning技術を特徴抽出に取り入れた新しい手法を提案する。
私たちのモデルであるNextBEVは、ResNet50やMobileNetV3といった既存の機能抽出ツールを超えています。
これらの軽量な提案を融合することにより、VoxelNetベースのモデルの精度を2.93%向上し、PointPillarベースのモデルのF1スコアを約20%改善しました。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:03:23 GMT)
Hierarchical Cross-Modal Alignment for Open-Vocabulary 3D Object Detection [45.7] Open-vocabulary 3D object Detection (OV-3DOD) は、閉じた集合を超えて新しいオブジェクトをローカライズし分類することを目的としている。
我々は,OV-3DODの局所オブジェクトとグローバルシーン情報を同時に学習するための階層型フレームワークHCMAを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:55:22 GMT)
Hierarchical Balance Packing: Towards Efficient Supervised Fine-tuning for Long-Context LLM [45.5] 長期コンテキスト大規模言語モデル(LLM)のトレーニングは、長期コンテキストと短コンテキストデータによるハイブリッドトレーニングが、ワークロードの不均衡につながることが多いため、難しい。
既存の作業では、主にデータパッキングを使用してこの問題を軽減するが、不均衡な注意計算や通信オーバーヘッドの無駄を考慮できない。
本稿では,これらの非効率性に対処する新しいバッチ構築法とトレーニングレシピを設計する階層的バランスパッキング(HBP)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:52:50 GMT)
Whiteness-based bilevel estimation of weighted TV parameter maps for image denoising [45.4] 劣化画像に対する重み付き全変量パラメータマップを推定するために,正規化残白度損失に基づく二段階最適化戦略を検討する。
教師付きおよび半教師付きアプローチは、(近似した)参照データおよび/またはノイズ等級に関する情報の事前知識に依存しているのに対し、提案手法は完全に教師なしである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:55:21 GMT)
TRCE: Towards Reliable Malicious Concept Erasure in Text-to-Image Diffusion Models [45.4] 近年のテキスト・画像拡散モデルの進歩により、フォトリアリスティックな画像生成が可能になったが、NSFW画像のような悪意のあるコンテンツを生成するリスクもある。
リスクを軽減するため,概念消去手法が研究され,モデルが特定の概念を学習しやすくする。
本稿では,2段階のコンセプト消去戦略を用いて,信頼性の高い消去と知識保存の効果的なトレードオフを実現するTRCEを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:37:53 GMT)
Large model enhanced computational ghost imaging [44.8] ゴーストイメージング(GI)は1次元バケット信号と2次元光場情報の高次相関による2次元画像再構成を実現する。
近年の研究では、深層学習(DL)がゴースト画像再構成の品質を大幅に向上させることができることが確認されている。
GILMの物理原理を取り入れた14億のパラメータを持つ最初の大規模画像モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:34:28 GMT)
Control Flow-Augmented Decompiler based on Large Language Model [44.6] 本稿では,従来のエンドツーエンド逆コンパイル手法を強化することを目的とした,新しいエンドツーエンド逆コンパイル LLM (CFADecLLM) を提案する。
公開データセットであるHumanevalとExebenchについて,4つの最適化レベルにわたって広範な実験を行った。
その結果,提案手法は既存の手法を複数の指標で比較し,その有効性と優越性を検証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:52:48 GMT)
VCA: Video Curious Agent for Long Video Understanding [44.2] VCAと呼ばれる自己探索機能を備えた好奇心駆動型ビデオエージェントを提案する。
VLM上に構築されたVCAは、ビデオセグメントを自律的にナビゲートし、複雑なビデオシーケンスの包括的な理解を効率的に構築する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:35:16 GMT)
CLAP: Unsupervised 3D Representation Learning for Fusion 3D Perception via Curvature Sampling and Prototype Learning [43.8] CLAPと呼ばれる画像と点雲の教師なし微分レンダリングに基づく事前学習手法を提案する。
本手法は、事前学習のためのより情報性の高い点/画素を選択するために、曲率サンプリングによる計算ハードルを克服する。
CLAPは従来のSOTA事前学習法と比較して最大100%性能向上を達成した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:54:25 GMT)
CineBrain: A Large-Scale Multi-Modal Brain Dataset During Naturalistic Audiovisual Narrative Processing [43.7] CineBrainは脳波とfMRIを同時記録した最初の大規模データセットである。
このユニークなデータセットに基づいて、革新的なマルチモーダルデコーディングフレームワークであるCineSyncを提案する。
脳波とfMRI信号を効果的に融合させ,複雑な視覚刺激の再現性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:39:43 GMT)
ProBench: Judging Multimodal Foundation Models on Open-ended Multi-domain Expert Tasks [43.5] ProBenchはプロの専門知識と高度な推論を必要とするオープンエンドのユーザクエリのベンチマークである。
10の分野と56のサブフィールドにまたがっており、科学、芸術、人文科学、コーディング、数学、創造的執筆などが含まれる。
ProBenchは、視覚知覚、テキスト理解、ドメイン知識、高度な推論において重要な課題を提示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:29:18 GMT)
Property Enhanced Instruction Tuning for Multi-task Molecule Generation with Large Language Models [43.4] 分子関連タスクのための大規模言語モデルを改善するための2段階のフレームワークPEITを提案する。
最初のステップでは、PEIT-GENと呼ばれるモデルを事前訓練するために、テキスト記述、SMILES、生化学的特性をマルチモーダル入力として使用します。
2番目のステップでは、既存のオープンソースLCMを合成データで微調整し、PEIT-LLMは分子キャプション、テキストベースの分子生成、分子特性予測、新たに提案したマルチ制約分子生成タスクを処理できる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:25:11 GMT)
Generative AI in Transportation Planning: A Survey [43.3] 我々は、交通計画においてGenAIを活用するための最初の包括的枠組みを提示する。
交通計画の観点から, 記述的, 予測的, 生成的, シミュレーション, 説明可能なタスクの自動化におけるGenAIの役割を検討する。
データ不足、説明可能性、バイアス軽減、ドメイン固有の評価フレームワークの開発など、重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:33:31 GMT)
SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents [42.7] 既存のベンチマークは主に重要な安全リスクを見落とし、パフォーマンスの計画に集中しています。
我々は,対話型シミュレーション環境におけるLLMエージェントの安全性を考慮したタスク計画のための最初のベンチマークであるSafeAgentBenchを提案する。
SafeAgentBenchは、(1)10の潜在的な危険と3つのタスクタイプをカバーするために厳格にキュレートされた750のタスクの実行可能な、多種多様で高品質なデータセット、(2)低レベルコントローラを備えた普遍的な実施環境であるSafeAgentEnvは、8つの最先端ベースラインに対して17のハイレベルアクションでマルチエージェント実行をサポートし、(3)実行とセマンティックの両方の観点から信頼性の高い評価方法である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:13:09 GMT)
MIBench: A Comprehensive Framework for Benchmarking Model Inversion Attack and Defense [42.6] Model Inversion (MI)攻撃は、ターゲットモデルの出力情報を活用して、プライバシに敏感なトレーニングデータを再構築することを目的としている。
我々は、モデル反転攻撃と防御の体系的評価のためのMIBenchという最初の実用的なベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:46:40 GMT)
Learning A Zero-shot Occupancy Network from Vision Foundation Models via Self-supervised Adaptation [42.0] 本研究は,2次元視覚基礎モデルと3次元タスクをブリッジする新しい手法を提案する。
視覚言語モデルのゼロショット機能を画像意味論に活用する。
我々は、再構成されたメートル法深度を用いて意味を3次元空間に投影し、3次元の監視を行う。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:54:40 GMT)
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking [41.9] ProTrackerは、ビデオ内の任意の点を正確かつ堅牢に追跡する新しいフレームワークである。
この設計は、グローバルな意味情報と時間的に認識される低レベル特徴を効果的に組み合わせている。
実験により、ProTrackerは最適化ベースのアプローチで最先端のパフォーマンスを得ることができた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:00:32 GMT)
AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning [41.4] 自動運転では、最近のエンド・ツー・エンドのモデルは計画性能を大幅に改善した。
視覚言語モデル(VLM)を自律運転に統合する研究もあるが、それらは通常、単純な教師付き微調整による事前訓練モデルに依存している。
本稿では、自律運転におけるVLMのためのRLおよび推論フレームワークであるAlphaDriveを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:59:42 GMT)
SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [41.3] モデル編集に基づく概念消去手法であるSPEEDを導入する。
SPEEDは、効率的かつ高忠実な概念消去を達成しつつ、保存前の既存の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:40:01 GMT)
PIED: Physics-Informed Experimental Design for Inverse Problems [41.2] この研究は、PINNを完全な差別化可能なアーキテクチャで利用し、ワンショットデプロイメントのためのIPの設計パラメータを継続的に最適化する、最初のフレームワークであるPIEDを提示する。
実証実験により,PIEDは実世界の実験データや雑音のシミュレーションデータにおいて,逆問題 (IP) の解法において,既存の実験設計法(ED)法よりも有意に優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:53:11 GMT)
VLRMBench: A Comprehensive and Challenging Benchmark for Vision-Language Reward Models [40.9] 視覚言語モデル(VLRM)は、推論プロセスにおいてますます重要になっている。
既存の視覚言語RM(VLRM)のベンチマークは、通常、その能力の1つの側面しか評価しない。
我々は、12,634の質問を含むVLRMBenchと呼ばれる包括的で挑戦的なベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:52:57 GMT)
ControlAR: Controllable Image Generation with Autoregressive Models [40.7] 自動回帰画像生成モデルに空間制御を統合するための効率的なフレームワークであるControlARを導入する。
ControlARは条件付き復号法を利用して、制御と画像トークンの融合によって条件付けられた次の画像トークンを生成する。
その結果,コントロールARは従来の制御可能な拡散モデルを上回ることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:33:37 GMT)
Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets [40.7] 合成データは、医療や金融などの分野におけるプライバシー強化技術(PET)として注目されている。
類似度に基づく手法は、トレーニングと合成データとの類似度のレベルを求めることを目的としている。
攻撃に基づく手法は、合成データセットに対する故意の攻撃を誘発する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:01:19 GMT)
A Survey on Point-of-Interest Recommendation: Models, Architectures, and Security [40.2] POI(Point-of-Interest)レコメンデーションシステムは、ユーザエクスペリエンスの充実、パーソナライズされたインタラクションの実現、デジタルランドスケープにおける意思決定プロセスの最適化に不可欠である。
従来のモデルから大規模言語モデルのような高度な技術への移行を体系的に検討する。
セキュリティの重要性の高まりに対処し、潜在的な脆弱性とプライバシ保護アプローチを調べます。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:57:32 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [40.0] 初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。
EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である
BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:34:24 GMT)
Heat-to-motion conversion for quantum active matter [39.6] 能動量子粒子のモデルを導入し、その性質について議論する。
活性粒子の量子的特徴は、運動と熱-運動変換の両方において現れる。
非平衡駆動下でのスピン軌道相互作用の組み合わせは、活性物質を冷たい原子ガスの領域に導く可能性がある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:08:05 GMT)
Vulnerabilities in AI-generated Image Detection: The Challenge of Adversarial Attacks [39.5] FPBAはブラックボックス攻撃を成功させることができるので、敵攻撃はAIGI検出器にとって真の脅威であることを示す。
我々はこの手法を周波数ベースのポストトレインベイズアタック (FPBA) と呼ぶ。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:54:28 GMT)
Temporal Triplane Transformers as Occupancy World Models [39.3] 我々はT$3$Formerと呼ばれる自動運転のための新しい4D占有型世界モデルを提案する。
T$3$Formerは、3Dのセマンティックな占有環境を効率的に圧縮するコンパクトな三面体表現を事前訓練する。
歴史的三葉機から多段階の時間運動の特徴を抽出し、次の三葉機の変化を反復的に予測するために自己回帰的アプローチを用いる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:50:23 GMT)
MIGA: Mutual Information-Guided Attack on Denoising Models for Semantic Manipulation [39.1] Mutual Information-Guided Attack (MIGA) は、ディープ・デノナイジング・モデルを直接攻撃するために設計された最初の手法である。
MIGAはデノイザーに知覚的にクリーンでセマンティックに変化した出力を生成するよう強制する。
以上の結果から,デノベーションモデルは必ずしも堅牢ではなく,現実のアプリケーションにセキュリティリスクをもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:26:34 GMT)
Efficiently Training Time-to-First-Spike Spiking Neural Networks from Scratch [39.1] スパイキングニューラルネットワーク(SNN)はエネルギー効率の良いニューロモルフィックハードウェアに適している。
Time-to-First-Spike(TTFS)コーディングは、ニューロン毎の1回のスパイクを使用し、極端に間隔とエネルギー効率を提供するが、スパース発射による不安定なトレーニングと低い精度に悩まされている。
本稿では,パラメータ正規化,トレーニング正規化,時間出力復号化,プール層再評価を取り入れたトレーニングフレームワークを提案する。
実験では、M上のTTFS SNNのトレーニングを安定化し、加速し、レイテンシを低減し、最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:08:32 GMT)
Presumed Cultural Identity: How Names Shape LLM Responses [38.8] アイデンティティのコア指標として名前を使うことは、複雑なアイデンティティの過剰な単純化につながる可能性がある。
名前は個人化にとって重要な情報である。
文化的推定値を測定することで、名前に関連付けられたバイアスについて検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:48:57 GMT)
Now you see me! A framework for obtaining class-relevant saliency maps [38.7] ニューラルネットワークが特定の予測に使用する入力特徴を理解するために、サリエンシマップが開発された。
広く使われているが、これらの手法は、分類のきっかけとなった特定の情報を特定するのに失敗した、過度に一般的な衛生マップをもたらすことが多い。
我々は、クラス間の属性を組み込んで、実際にクラス関連情報をキャプチャする有給マップに到達できるフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:59:57 GMT)
Skelite: Compact Neural Networks for Efficient Iterative Skeletonization [38.6] 骨格化は、その幾何学と位相をコンパクトに符号化した画像から薄い表現を抽出する。
学習可能なコンポーネントを用いて反復骨格化アルゴリズムを訓練するための新しいフレームワークを提案する。
提案手法は,トポロジ制約付きアルゴリズムの100倍の高速化を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:27:25 GMT)
Mask-Adapter: The Devil is in the Masks for Open-Vocabulary Segmentation [38.4] オープン語彙セグメンテーションにおいてこれらの課題に対処するための単純かつ効果的な手法であるMask-Adapterを導入する。
提案手法では,提案マスクを直接使用するのに対し,提案マスクから意味的アクティベーションマップを抽出する。
いくつかのゼロショットベンチマークに対する大規模な実験は、提案されたMask-Adapterの性能向上を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:14:22 GMT)
Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia [37.4] 東南アジア言語のための高品質で文化的に関連のあるデータを開発するためのオープンソースイニシアチブであるSEA-VLについて紹介する。
SEA諸国からのコントリビュータを巻き込むことで、SEA-VLはより優れた文化的妥当性と多様性を確保することを目指している。
我々は、既存のデータセットの50倍以上の文化関連画像128万枚を集めている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:54:52 GMT)
Revisiting RGBT Tracking Benchmarks from the Perspective of Modality Validity: A New Benchmark, Problem, and Solution [37.3] RGBT追跡は、夜間や悪天候などのマルチモーダル保証(MMW)シナリオにおける堅牢性から注目されている。
既存のベンチマークには、RGBと熱赤外(TIR)情報の両方が十分な品質である一般的なシナリオで収集されたビデオが含まれている。
本稿では,MMWのシナリオから,モーダリティの妥当性を考慮した新しいベンチマークであるMV-RGBTを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:06:33 GMT)
VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models [37.2] 本研究は、視覚言語モデル(VLM)による明示的・暗黙的な社会的偏見について検討する。
明示的偏見は意識的、意図的偏見を指し、暗黙的偏見は意識的に活動する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:42:30 GMT)
DirectTriGS: Triplane-based Gaussian Splatting Field Representation for 3D Generation [37.1] ガウススプラッティング(GS)を用いた3次元オブジェクト生成のための新しいフレームワークであるDirectTriGSを提案する。
提案した生成フレームワークは,テキスト・ツー・3Dタスクにおいて高品質な3Dオブジェクト形状とレンダリング結果を生成することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:05:38 GMT)
Group-robust Sample Reweighting for Subpopulation Shifts via Influence Functions [37.1] グループロバストサンプル再重み付け(GSR)は、まずグループ未ラベルデータから表現を学習する2段階の手法である。
GSRは理論的には健全で、実質的に軽量であり、人口移動に対する堅牢性を改善するのに効果的である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:34:18 GMT)
PGD-Imp: Rethinking and Unleashing Potential of Classic PGD with Dual Strategies for Imperceptible Adversarial Attacks [37.0] 知覚不能な敵対的攻撃は、最近研究の関心を惹きつけている。
本研究は、PGD(共通攻撃と古典攻撃)の可能性を解き放つための、単純かつ効果的な2つの戦略を提案する。
提案したPGD-Imp攻撃は,非目標シナリオと目標シナリオの両方に対して,認識不能な敵攻撃を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:26:21 GMT)
REF-VLM: Triplet-Based Referring Paradigm for Unified Visual Decoding [36.4] REF-VLMは、様々な視覚的デコーディングタスクの統一的なトレーニングのためのエンドツーエンドフレームワークである。
1億以上のマルチモーダル対話サンプルを含む大規模マルチタスクデータセットを構築した。
REF-VLMは様々な標準ベンチマークで他のMLLMよりも優れている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:59:14 GMT)
Performance-driven Constrained Optimal Auto-Tuner for MPC [36.1] MPCのための制約付き最適オートチューニングであるCOAT-MPCを提案する。
COAT-MPCは、パフォーマンスデータを収集し、その後続の信念を更新することによって学習する。
理論的にはCOAT-MPCを解析し,性能制約を任意に高い確率で満たすことを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:56:08 GMT)
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping [36.0] Diffusion Transformer (DiT) は画像生成モデルを構築する上で好まれる選択肢となっている。
DiTは純粋に、大きな言語モデルのようなスケーラビリティに優れたDiTをレンダリングするトランスフォーマーブロックのスタックで構成されている。
本稿では,これらの課題に対処するため,拡散変換に適したポストトレーニング量子化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:21:04 GMT)
Ideas in Inference-time Scaling can Benefit Generative Pre-training Algorithms [35.7] 推論ファーストの視点は、新しい生成事前学習アルゴリズムに刺激を与えることができると論じる。
本研究では,拡散モデルの予測過程における目標修正による制限への対処が,安定な単一段階アルゴリズムを実現する方法を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:27:30 GMT)
RepoST: Scalable Repository-Level Coding Environment Construction with Sandbox Testing [35.7] RepoSTは、トレーニングと評価の両方のために、リポジトリレベルのコード生成に対して実行フィードバックを提供する。
RepoST-Trainは,832リポジトリから7,415の関数を備えた,大規模なトレインセットである。
また、評価データセット、RepoST-Eval、ベンチマーク12のコード生成モデルも構築しています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:16:08 GMT)
ReLaX-VQA: Residual Fragment and Layer Stack Extraction for Enhancing Video Quality Assessment [35.0] ReLaX-VQAは、NRVQA(No-Reference Video Quality Assessment)モデルである。
これは、オリジナルの圧縮されていないビデオに言及することなく、多様なビデオコンテンツの品質を評価するという課題に対処することを目的としている。
NR-VQA法を一貫して上回り、平均Sスコアは0.8658、PLCCは0.8873である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:37:47 GMT)
MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning [34.9] LLM(Large Language Models)は、既存の医学的質問応答ベンチマークで素晴らしいパフォーマンスを示している。
MedAgentsBenchは、多段階の臨床推論、診断の定式化、および治療計画シナリオを必要とする医学的問題に焦点を当てたベンチマークである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:38:44 GMT)
TIDE : Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation [34.7] TIDE (Temporal-aware Sparse Autoencoders for Interpretable Diffusion transformErs) は,DiTアクティベーション層内の時間的再構築を段階的に促進する新しいフレームワークである。
TIDEはスパースオートエンコーダ(SAE)とスパースボトルネック層を使用して、解釈可能かつ階層的な特徴を抽出する。
提案手法は,1e-3の平均2乗誤差(MSE)とコサイン類似度(0.97。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:35:51 GMT)
Revealing Hidden Mechanisms of Cross-Country Content Moderation with Natural Language Processing [34.7] 我々は,既存のTwitter Stream Grabのコーパスを用いて,各国のコンテンツモデレーション決定について検討した。
われわれの実験では、検閲された投稿に、国や時間とともに興味深いパターンが浮かび上がっている。
コンテンツモデレーションにおけるLLMの有効性を評価する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:41:06 GMT)
Towards Quantifying Two-Mode Correlation Linewidths in Quantum Circuits [34.6] 本稿では,TWPAにおける2モード相関の線形幅の定量化を目的とする。
ウィンドウ効果や取得時間などのデータ取得や処理によって引き起こされる成果は,これらの相関関係の線形推定に与える影響を理解するために検討される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:51:40 GMT)
The Uncanny Valley: Exploring Adversarial Robustness from a Flatness Perspective [34.6] 損失面の平坦性は、一般化と正の相関を持つだけでなく、対向的堅牢性にも関係している。
本稿では,1層のパラメータに対する逆例と相対平坦度の関係を実証的に解析する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:47:37 GMT)
Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization [34.5] 本稿では, 既存の拡散式蒸留法に対する新しい枠組みを提案し, 生成ではなく拡散モデルを用いて選択する。
提案手法は,入力画像とテキストプロンプトに基づいて拡散モデルから発生するノイズを予測し,各ペアの損失を算出する。
この合理化フレームワークは単一段階の蒸留プロセスを実現するとともに,我々の手法が様々なメトリクスにわたって最先端の手法より優れていることを示す広範な実験を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:32:43 GMT)
XIFBench: Evaluating Large Language Models on Multilingual Instruction Following [34.2] 大規模言語モデル(LLM)は、様々なアプリケーションにまたがる優れた命令追従機能を示している。
XIFBenchは、LLMの多言語命令追従能力を評価するための制約ベースのベンチマークである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:07:52 GMT)
Dynamic Mixture of Experts: An Auto-Tuning Approach for Efficient Transformer Models [33.8] 本稿では,DynMoE(Dynamic Mixture of Experts)技術を紹介する。
DynMoEには、各トークンがアクティベートする専門家の数を自動的に決定できる新しいゲーティングメソッドが組み込まれている。
視覚・言語タスクのGMoEと視覚言語タスクのMoE-LLaVAとの競合性能を比較検討した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:17:56 GMT)
LatexBlend: Scaling Multi-concept Customized Generation with Latent Textual Blending [33.8] マルチコンセプトのカスタマイズ生成を効果的にスケールするための新しいフレームワークであるLaTexBlendを提案する。
LaTexBlendは単一の概念を表現し、複数の概念をラテントテクスチャ空間にブレンドする。
実験により、LaTexBlendは複数のカスタマイズされた概念を調和した構造と高い主観的忠実さで柔軟に統合できることが示されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:08:25 GMT)
DreamRelation: Relation-Centric Video Customization [33.7] ビデオのカスタマイズ(英: video customization)とは、2つの主題間のユーザー特定関係を描写したパーソナライズされたビデオを作成することを指す。
既存の手法では、被写体や動きをパーソナライズできるが、複雑なビデオのカスタマイズには苦戦している。
本稿では,DreamRelationを提案する。DreamRelationはビデオの小さな集合を捉え,デカップリング学習とダイナミックエンハンスメントという2つの重要なコンポーネントを活用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:58:03 GMT)
TriDi: Trilateral Diffusion of 3D Humans, Objects, and Interactions [33.6] 本稿では,3次元オブジェクト間相互作用(HOI)をモデル化するための最初の統一モデルを提案する。
我々は,新しい3方向拡散プロセスと同時に,人・物・相互作用のモダリティを生成する。
本稿では,TriDiをシーン群に適用し,人間と接触したデータセットのオブジェクトを生成し,オブジェクトの幾何学を一般化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:19:30 GMT)
Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models [33.5] 本稿では,視覚トークン化器のトレーニングにおいて,潜在空間と事前学習された視覚基盤モデルとの整合性を提案する。
提案するVA-VAEは遅延拡散モデルの再構成世代フロンティアを著しく拡張する。
私たちは、LightningDiTと呼ばれるトレーニング戦略とアーキテクチャ設計を改善した拡張DiTベースラインを構築します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:43:42 GMT)
VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs [33.2] 我々は、時相的に連続した$bftextStyle$表現であるVidStyleODEを提案し、$bftextStyle$とNeural-$bfODE$sをベースとした。
提案手法は,テキスト誘導による外観操作,モーション操作,画像アニメーション,映像外挿など,実映像における様々なアプリケーションを実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:48:02 GMT)
Spectral Representation for Causal Estimation with Hidden Confounders [33.1] 隠れた共同創設者が存在する場合の因果効果推定の問題に対処する。
本手法では,条件付き期待演算子の特異値分解とサドル点最適化問題を用いる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:20:19 GMT)
BEARCUBS: A benchmark for computer-using web agents [33.1] BEARCUBSは、WebエージェントがWebから事実情報を検索、閲覧、識別する能力を評価するために設計された111の情報検索質問のベンチマークである。
BEARCUBSを解くには、合成されたページやシミュレーションされたページではなく、ライブのWebコンテンツにアクセスする必要がある。
人間による研究では、BEARCUBSの質問は解決可能であるが、非自明(84.7%の正確性)であり、探索の非効率性とドメイン知識のギャップを共通の障害点として明らかにしている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:50:30 GMT)
Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning [33.0] マルチターンマルチモーダル対話データセットであるMDDiagを紹介する。
マルチモーダルグラウンドと推論機能を備えたMLLMであるDiagNoteについても紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:32:53 GMT)
Pushing the Limits of Sparsity: A Bag of Tricks for Extreme Pruning [32.9] ディープニューラルネットワークのプルーニングは、高密度ネットワークの性能の大部分を保ちながら、モデルサイズの削減に有効な手法である。
最近のスパース学習法では、95%や98%といった中等度の疎度レベルまで有望な性能を示している。
極端に間隔があっても精度が崩れることなくネットワークの連続的な学習を可能にする手法の集合を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:43:43 GMT)
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration [32.8] 本稿では,言語モデルを用いたRLの新しい計算フレームワークを提案する。
データ効率には必要ありませんが、フレームワーク内の任意のアルゴリズムのランタイムのバウンダリは低くなっています。
SpannerSamplingというアルゴリズムを導入し,事前学習したモデルが十分なカバレッジを享受するたびに,最適なデータ効率と計算効率を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:31:42 GMT)
Noise Mitigation in Single Microwave Photon Counting by Cascaded Quantum Measurements [32.7] 単一マイクロ波光子検出器(SMPD)が最近初めて実証された。
これらの検出器は量子制限増幅方式に対して大きな利点がある。
動作感度は5.9(6)時間10-23textW/sqrttextHz$は入力線内の熱光子によって制限される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:31:30 GMT)
LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL [32.7] テキストのみのデータによるマルチモーダル推論にルールベースのRLを適用するフレームワークである textbfmethod を提案する。
Qwen2.5-VL-Instruct-3Bの実験では、マルチモーダルおよびテキストのみのベンチマークにおいて、ベースラインよりも平均4.83%と4.5%の改善が達成されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:04:14 GMT)
Mitigating Preference Hacking in Policy Optimization with Pessimism [32.6] この研究は、人間からのフィードバック(RLHF)からの強化学習における過度な最適化の問題に取り組む。
RLHFは、Emphfixed preferenceデータセットに基づいてトレーニングされた報酬または選好モデルに依存しており、これらのモデルは、この選好データのサポート外の評価では信頼できない。
本稿では,不確実性に直面した悲観的手法を用いて,過度な最適化に確実に頑健なRLHFの新たな悲観的目的を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:13:19 GMT)
Personalized Recommendation Models in Federated Settings: A Survey [32.5] フェデレートされたレコメンデーションシステム(FedRecSys)は、プライバシを認識したレコメンデーションのための重要なソリューションとして登場した。
現在の研究は、伝統的なレコメンデーションアーキテクチャを連邦環境に適用することに集中している。
この分散化および非IIDデータ設定において、不均一な嗜好を捉えるのに欠かせないユーザパーソナライズモデリングは、まだ未検討である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:20:20 GMT)
Interactive Medical Image Analysis with Concept-based Similarity Reasoning [32.4] 概念ベースの類似推論ネットワーク(CSR)は、固有の概念解釈を備えたパッチレベルのプロトタイプを提供する。
CSRは3つのバイオメディカルデータセットで、最先端の解釈可能な手法を最大4.5%改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:52:47 GMT)
CAPT: Class-Aware Prompt Tuning for Federated Long-Tailed Learning with Vision-Language Model [32.4] Class-Aware Prompt Learning for Federated Long-tailed Learning (CAPT)は、訓練済みのVLMを活用して、データの不均一性と長い尾の分布を処理する新しいフレームワークである。
CAPTは、フェデレートされた長期学習シナリオにおいて、全体的な精度を損なうことなく、テールクラスのパフォーマンスを著しく改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:17:15 GMT)
You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data [32.2] 局所的な非IIDデータとグローバルな長期分布から生ずるデータ不均一性は、連邦学習(FL)における大きな課題である
弱い局所サンプルと強い局所サンプルの知識を蒸留し,表現学習を改善するためにFedYoYoを提案する。
我々は、FedYoYoが最先端の結果を達成し、グローバルな長期的設定の下で集中ロジット調整手法を5.4%超えたことを示します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:57:20 GMT)
Extracting Training Data from Unconditional Diffusion Models [32.2] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
本研究では,非条件のDPMからトレーニングデータを抽出するために,生成したデータに対する時間依存型トレーニングデータ抽出(SIDE)を代理条件として活用する新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:57:12 GMT)
Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment [32.1] 本稿では,自己回帰表現アライメント(ARRA, Autoregressive Representation Alignment)を提案する。
ARRAは、グローバルな視覚的アライメント損失とハイブリットトークンHYB>を介して、外部視覚モデルからの視覚的表現と隠れ状態のアライメントを行う。
コードとモデルがリリースされ、自動回帰画像生成が進められる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:49:28 GMT)
The Devil Is in the Details: Tackling Unimodal Spurious Correlations for Generalizable Multimodal Reward Models [31.8] マルチモーダル・リワードモデル(MM-RM)は,大規模言語モデル(LLM)と人間の嗜好の整合に不可欠である。
MM-RMは、不動の突発的相関に依存するため、アウト・オブ・ディストリビューションデータへの一般化に苦慮することが多い。
本稿では,この問題を動的にトレーニングサンプルを再重み付けすることで軽減する,ショートカット対応MM-RM学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:34:53 GMT)
Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [31.8] 大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。
本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:22:25 GMT)
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning [31.7] LVLM(Large Vision-Language Models)は通常、画像処理に限定された事前定義されたグリッドを使用する。
動的画像ピラミッド(DIP)を統合したテキスト誘導型トークンプルーニング手法を提案する。
提案手法は,同一データを用いた4つのデータセットにおける既存の高分解能戦略よりも優れる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:51:16 GMT)
The Distributional Reward Critic Framework for Reinforcement Learning Under Perturbed Rewards [31.6] 報酬信号は、強化学習におけるエージェントの望ましい振る舞いを定義する上で中心的な役割を果たす。
本稿では,トレーニング中の報酬分布と摂動を推定するための分配報酬批判フレームワークを提案する。
その結果、報奨環境下でRLを実行する能力の拡大と深化が図られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:30:07 GMT)
Intra-day Solar and Power Forecast for Optimization of Intraday Market Participation [31.4] 太陽光照射の予測により、太陽光発電(PV)発電とグリッド統合の信頼性が向上する。
本研究は, 長短期記憶(LSTM)モデルとBi-LSTMモデルを用いて, 6時間の地平線と10分間の分解能で太陽光照射を予測する。
LSTM予測は平均して時間分解能モデルを作成し、平均絶対誤差、ルート平均二乗誤差、正規化ルート平均二乗誤差、平均絶対二乗誤差を用いて評価した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:33:33 GMT)
PoisonedParrot: Subtle Data Poisoning Attacks to Elicit Copyright-Infringing Content from Large Language Models [31.4] PoisonedParrotは、著作権のあるコンテンツを生成するためにLLMを誘導する最初のステルスデータ中毒攻撃である。
その単純さにもかかわらず、PoisonedParrotは、著作権のあるコンテンツを識別可能な副作用なしで生成するモデルを作るのに驚くほど効果的だ。
われわれは著作権侵害攻撃を防ごうとする最初の試み、ParrotTrapを擁護する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:13:30 GMT)
Large Language Model Enhanced Recommender Systems: A Survey [31.3] 本稿では,Large Language Model (LLM) を利用したレコメンダシステム(RS)の強化を目的とした最新の研究成果について報告する。
我々は、LLMをオンラインシステムに組み込む動き、特に推論時にの使用を避けることで、この分野における重要な変化を識別する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:49:00 GMT)
Synchronized Video-to-Audio Generation via Mel Quantization-Continuum Decomposition [31.3] 我々はメルスペクトルを3種類の信号に分解し、量子化や連続性を利用する。
開発したV2X(V2X)予測器により,映像から効果的に予測できる。
そして、予測信号を再分解して制御ネットに入力し、テキスト反転設計を行い、音声生成プロセスを制御する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:04:03 GMT)
Correctness Learning: Deductive Verification Guided Learning for Human-AI Collaboration [31.3] 我々は,人間とAIの協調性を高めるために,正当性学習(CL)を提案する。
Clは、歴史的高品質のスキームから導出的な検証方法と洞察を統合する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:20:38 GMT)
Can Memory-Augmented Language Models Generalize on Reasoning-in-a-Haystack Tasks? [31.2] 本稿では,メモリ拡張型LLMアーキテクチャであるMemReasonerを提案する。
MemReasonerはエンドツーエンドでトレーニングされ、オプションで事実管理をサポートする。
シングルホップタスクと2ホップタスクの両方において,MemReasonerの強い一般化を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:48:53 GMT)
Balcony: A Lightweight Approach to Dynamic Inference of Generative Language Models [31.1] Balconyは深度に基づく動的推論のためのフレームワークである。
完全なモデルの性能を維持しつつ、異なる計算予算へのリアルタイム適応を可能にしている。
注目すべきことに、BalconyはFlextronやLayerskipのような最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:52:15 GMT)
MapQA: Open-domain Geospatial Question Answering on Map Data [31.0] MapQAは、質問に参照されるジオエンティティの問合せペアとジオメトリを提供する、新しいデータセットである。
3,154対のQAペアが9つの質問タイプにまたがって構成されており、近隣の推論やジオエンタリティタイプの識別など、地理空間的推論を必要とする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:37:22 GMT)
Visual and Text Prompt Segmentation: A Novel Multi-Model Framework for Remote Sensing [31.0] 本稿では,Grounding DINO,CLIP,SAMの強みを活かしたVTPSegパイプラインを提案する。
このパイプラインは,5つの一般的なリモートセンシング画像セグメンテーションデータセットを用いて,実験およびアブレーションによる検証を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:15:57 GMT)
FaceXBench: Evaluating Multimodal LLMs on Face Understanding [30.9] 複雑な顔理解タスクのMLLMを評価するためのベンチマークであるFaceXBenchを紹介する。
FaceXBenchには、25の公開データセットと新しく作成されたデータセットであるFaceXAPIから派生した5000のマルチモーダルな多重選択質問が含まれている。
2つのプロプライエタリなモデルとともに、26のオープンソースMLLMを広範囲に評価し、複雑な顔理解タスクにおけるユニークな課題を明らかにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:19:52 GMT)
LLaVA-RadZ: Can Multimodal Large Language Models Effectively Tackle Zero-shot Radiology Recognition? [30.8] マルチモーダル・大型モデル (MLLM) は視覚的理解と推論において例外的な能力を示した。
ゼロショット診断のためのフレームワークであるLLaVA-RadZを提案する。
大規模モデルの本質的な医学的知識を活用するためにドメイン知識集計モジュール(DKAM)を導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:05:40 GMT)
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios [30.8] テキスト画像超解像(SR)の拡散モデルの一般化能力向上を目的とした新しいフレームワークを提案する。
本稿では,様々な訓練段階における多様な画像型を取り入れ,収束を安定化し,一般化を改善するプログレッシブなデータサンプリング戦略を提案する。
実世界のデータセットを用いた実験により、我々のアプローチはよりリアルな視覚的外観を持つテキスト画像を生成するだけでなく、テキスト構造の精度も向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:16:19 GMT)
Is CLIP ideal? No. Can we fix it? Yes! [30.7] Contrastive Language-Image Pre-Trainingは、よく組織化されたセマンティクスでマルチモーダルな潜在空間を学習する一般的な方法である。
広い範囲のアプリケーションにもかかわらず、CLIPの潜伏空間は複雑な視覚とテキストの相互作用を扱うのに失敗することが知られている。
本稿では,CLIP様モデルの原理的,解釈可能な評価法として,コサイン類似度マップ(DCSM)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:42:04 GMT)
Toward Multi-Session Personalized Conversation: A Large-Scale Dataset and Hierarchical Tree Framework for Implicit Reasoning [30.5] 2500のサンプルを持つ大規模長期データセットであるImplexConvを紹介し、それぞれに約100の会話セッションを含む。
また,会話履歴を複数のレベルの要約に構造化する新しい階層木フレームワークであるTaciTreeを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:59:41 GMT)
GM-MoE: Low-Light Enhancement with Gated-Mechanism Mixture-of-Experts [30.5] 低照度化は、自動運転、3D再構成、リモートセンシング、監視など、幅広い用途に応用されている。
我々は,低照度画像強調のためのMixed-of-Expertsネットワークを導入した最初のフレームワークであるTextbfGated-Mechanism Mixture-of-Experts (GM-MoE)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:05:50 GMT)
Multi-Behavior Recommender Systems: A Survey [30.2] マルチビヘイビア・リコメンデータシステムは、多様なインタラクションを活用してレコメンデーション品質を高める。
提案手法の共通点と相違点に基づいて,既存のマルチビヘイビアレコメンデータシステムを体系的に分類する。
我々は,多行動レコメンデータシステムの推進に向けた将来的な方向性について論じる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:22:37 GMT)
How Data Inter-connectivity Shapes LLMs Unlearning: A Structural Unlearning Perspective [29.9] 既存のアプローチでは、忘れられるべきデータポイントは独立であり、接続性を無視していると仮定している。
構造データセットをコンパイルする手法であるPISTOLを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:33:53 GMT)
Scalable entanglement of nuclear spins mediated by electron exchange [29.8] 半導体における核の絡み合いの現在の実証は、核を共通の電子に結合することに頼っているが、これはスケーラブルな戦略ではない。
ここでは、シリコンデバイス内の2つのリン原子の核間の最大20ナノメートルの2ビット制御-Z論理演算を実証する。
核は、76 +/-5$%の忠実度と0.67 +/-0.05の一致でベル状態を準備し測定することによって絡み合っていることを証明した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:49:25 GMT)
Scaffold with Stochastic Gradients: New Analysis with Linear Speed-Up [29.6] 我々は,Scaffoldがステップサイズで高次項までのクライアント数の線形高速化を実現することを示す。
分析の結果,ScaffoldはFedAvgと同様,クライアント数の増加に伴って低下しない高次バイアスを保っていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:56:19 GMT)
Post-detection inference for sequential changepoint localization [29.4] 本研究では,データ依存停止時間まで観測したデータのみを用いて,変化点の局所化の問題について検討する。
まず、事前および変更後分布が知られていると仮定した場合に、未知の変更点に対する信頼セットを構築する。
そして、私たちのフレームワークを、事前および変更後のシナリオに拡張します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:20:58 GMT)
Linguistic Knowledge Transfer Learning for Speech Enhancement [29.2] 言語知識は、言語理解において重要な役割を果たす。
ほとんどの音声強調法は、雑音とクリーンな音声のマッピング関係を学習するために音響的特徴に依存している。
本稿では,言語知識をSEモデルに統合するクロスモーダル・ナレッジ・トランスファー(CMKT)学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:00:18 GMT)
Knowledge Bridger: Towards Training-free Missing Multi-modality Completion [29.1] 「知識ブリッジ」はモダリティに依存しないものであり、欠落したモダリティの生成とランキングを統合している。
一般領域と医療領域をまたいだ実験結果から,本手法は競合する手法よりも一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:45:52 GMT)
UniVAD: A Training-free Unified Model for Few-shot Visual Anomaly Detection [29.0] 本稿では,様々な領域にまたがる異常を検出できるVAD法であるUniVADを提案する。
UniVADは、これまで見つからなかったオブジェクトの異常を検出するために、テスト中の参照として通常のサンプルをほとんど必要としない。
産業、論理、医療の分野にまたがる9つのデータセットの実験を行い、UniVADが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:03:18 GMT)
Hier-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting [28.8] 本稿では,新しい階層型分類表現を特徴とする意味論的3次元ガウス分割SLAM法であるHier-SLAMを提案する。
我々の MethodName は、マッピングと追跡の精度の両方において、既存の高密度SLAM 法より優れており、2倍の演算高速化を実現している。
複雑な現実世界のシーンを500以上のセマンティッククラスで扱う能力を示し、その価値あるスケールアップ機能を強調している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:47:01 GMT)
Mastering Continual Reinforcement Learning through Fine-Grained Sparse Network Allocation and Dormant Neuron Exploration [28.8] 本稿では,細粒度配置戦略により塑性を向上させる新しい構造ベースアプローチであるSSDEを紹介する。
SSDEは、パラメータ空間をフォワードトランスファー(フリーズ)パラメータとタスク固有の(トレーニング可能な)パラメータに分解する。
CW10-v1 Continual Worldベンチマークの実験では、SSDEが最先端のパフォーマンスを達成し、95%の成功率に達した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:22:48 GMT)
Effective and Efficient Masked Image Generation Models [28.7] 実証的に、eMIGMはImageNet生成に強いパフォーマンスを示す。
eMIGMは最先端の連続拡散モデルに匹敵する性能を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:27:12 GMT)
Mitigating Domain Shift in Federated Learning via Intra- and Inter-Domain Prototypes [28.5] 本稿では,$textbfI$ntraドメインと$textbfI$nterドメインを組み込んだ新しいプロトタイプ学習手法I$2$PFLを紹介する。
そこで我々は,MixUpをベースとした拡張プロトタイプと機能アライメントを行い,局所領域内の多様性を捉え,局所的特徴の一般化を促進する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:01:38 GMT)
Robust Diffusion Models for Adversarial Purification [28.3] 拡散モデル(DM)に基づく対位法(AP)は、対位法トレーニング(AT)の最も強力な代替手段であることが示されている。
本稿では,事前訓練したDMとは独立に,敵対的指導を施した新しい頑健な逆過程を提案する。
この堅牢なガイダンスは、よりセマンティックなコンテンツを保持する純粋化された例を生成するだけでなく、DMの正確でロバストなトレードオフを軽減することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:02:42 GMT)
Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction [28.2] レーントポロジ抽出はマップレス自動運転における重要な認識課題である。
視覚言語基礎モデル(VLM)を用いたニューロシンボリック手法を提案する。
そこで我々はChameleonという高速低速ニューロシンボリックレーントポロジー抽出アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:02:35 GMT)
RAG-Enhanced Collaborative LLM Agents for Drug Discovery [28.0] CLADDは、薬物発見タスクに適した、検索増強世代(RAG)内蔵のエージェントシステムである。
汎用LLMやドメイン固有のLLM、そして従来のディープラーニングのアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:11:58 GMT)
IterPref: Focal Preference Learning for Code Generation via Iterative Debugging [28.0] We propose IterPref, a new preference alignment framework for Code LLMs。
IterPrefは明示的にエラー領域を特定し、対応するトークンを調整されたDPOアルゴリズムで調整する。
IterPrefはコード生成において大幅なパフォーマンス向上を実現し、BigCodeBenchのような課題を改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:08:16 GMT)
opXRD: Open Experimental Powder X-ray Diffraction Database [27.7] 粉末X線回折(pXRD)実験は材料構造解析の基盤となる。
機械学習は、自動的に粉末回折分析を行うことで、このボトルネックを解決することを約束する。
我々は,ラベル付きおよびラベルなし実験粉体回折図の公開とアクセスが容易なデータセットを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:35:46 GMT)
Motion Dreamer: Boundary Conditional Motion Reasoning for Physically Coherent Video Generation [27.7] 動作推論を視覚合成から明確に分離する2段階のフレームワークであるMotion Dreamerを紹介する。
提案手法では,部分的ユーザ定義動作の効果的な統合を可能にするスパース・ツー・デンス動作表現であるインスタンスフローを導入している。
実験により、モーションドリーマーは既存の手法よりも優れており、より優れた動きの可視性と視覚的リアリズムを実現していることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:43:03 GMT)
An Empirical Comparison of Cost Functions in Inductive Logic Programming [27.6] 最適仮説は、トレーニングデータに対する所定のコスト関数を最小化する。
我々は,7つの標準コスト関数に対する最適仮説を学習するために制約ベースのILPシステムを拡張した。
次に、これらの標準コスト関数の下で誘導される最適仮説の一般化誤差を経験的に比較する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:22:18 GMT)
DiagramQG: Concept-Focused Diagram Question Generation via Hierarchical Knowledge Integration [27.5] 我々は,8,372の図と19,475の質問を含むデータセットを構築した。
本稿では,図式質問生成のための階層的知識統合フレームワーク(HKI-DQG)を強力なベースラインとして提示する。
既存のVQGモデル,オープンソースおよびクローズドソースビジョン言語モデル,およびDiagramQGデータセット上でのHKI-DQGの性能を評価する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:48:31 GMT)
CustomContrast: A Multilevel Contrastive Perspective For Subject-Driven Text-to-Image Customization [27.1] 理想的な主観的表現は、相互差分的な視点、すなわち、主観的本質的属性と無関係な属性とを対照的な学習を通して分離することで達成できると主張する。
具体的には、マルチレベルコントラスト学習パラダイムとMFI(Multimodal Feature Injection)を含む新しいフレームワークであるCustomContrastを提案する。
広範囲な実験は、主題の類似性とテキスト制御性におけるCustomContrastの有効性を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:23:48 GMT)
Q-MARL: A quantum-inspired algorithm using neural message passing for large-scale multi-agent reinforcement learning [27.0] Q-MARLは完全に分散学習アーキテクチャである。
大規模なマルチエージェント強化学習シナリオをサポートする。
詳細な理論的分析は、改善と収束を証明している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:43:10 GMT)
TimeStep Master: Asymmetrical Mixture of Timestep LoRA Experts for Versatile and Efficient Diffusion Models in Vision [26.9] 本稿では、TSM(TimeStep Master)パラダイムを2つの重要な微調整ステージで導入する。
育成段階において、異なる時間間隔で拡散モデルを微調整するために異なるLoRAを適用する。これにより、異なるノイズレベルを効果的に捉えることができるTimeStep LoRAの専門家が生まれる。
組立段階では、マルチスケール間隔で専門家のコア・コンテキスト・コラボレーションを通じて、TimeStep LoRA専門家の非対称な混合物を設計する。
我々のTSMは、最高の間隔で専門家を通して効果的にノイズレベルをモデル化し、専門家の文脈を適応的に統合することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:03:30 GMT)
WISE: A World Knowledge-Informed Semantic Evaluation for Text-to-Image Generation [26.6] テキスト・ツー・フォームド・モデル(T2I)は高品質な芸術作品や視覚コンテンツを生成することができる。
我々は、$textbfWorld Knowledge incorporation$bfIntext $textbfSemantic $textbfE$valuationのために特別に設計された最初のベンチマークである$textbfWISEを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:47:53 GMT)
LEMMo-Plan: LLM-Enhanced Learning from Multi-Modal Demonstration for Planning Sequential Contact-Rich Manipulation Tasks [26.5] 本稿では,人間の実演から触覚情報や力覚情報を取り入れた文脈内学習フレームワークを提案する。
本稿では,各モダリティを総合的なタスクプランに順次統合するブートストラップ型推論パイプラインを提案する。
このタスクプランは、新しいタスク設定のプランニングのリファレンスとして使用される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:24:51 GMT)
Towards Million-Scale Adversarial Robustness Evaluation With Stronger Individual Attacks [26.4] 本稿では,ロジット空間ではなく,確率空間における対角的マージン・アタック(Probability Margin Attack, PMA)を提案する。
我々は、百万スケールのデータセットCC1Mを作成し、それを用いて、敵に訓練されたImageNetモデルの最初の百万スケールの対角ロバスト性評価を行う。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:39:40 GMT)
A Graph-based Verification Framework for Fact-Checking [25.9] ファクトチェックのためのグラフベースのフレームワークGraphFCを提案する。
この中核的な考え方に基づいて,ファクトチェックのためのグラフベースのフレームワークであるGraphFCを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:02:29 GMT)
How to Train Your Robots? The Impact of Demonstration Modality on Imitation Learning [25.8] 模倣学習は、ユーザが提供するデータを用いてロボットポリシーを学ぶための有望なアプローチである。
本研究は,体操教育,VRコントローラーを用いた遠隔操作,宇宙空間コントローラを用いた遠隔操作など,低コストな実証モダリティを比較した。
以上の結果から, 身体美学教育はロボットの制御において最も直感的に評価され, 最良下流学習性能のための清潔なデータを提供することがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:57:26 GMT)
Dream to Manipulate: Compositional World Models Empowering Robot Imitation Learning with Imagination [25.6] DreMaは、実世界の学習された明示的な表現とそのダイナミクスを使って、デジタル双生児を構築するための新しいアプローチである。
DreMaはタスク毎の1つの例から新しい物理タスクを学べることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:40:42 GMT)
SDFA: Structure Aware Discriminative Feature Aggregation for Efficient Human Fall Detection in Video [25.6] 高齢者は、姿勢の不安定さと健康の悪化により転倒するおそれがある。
低解像度ビデオから抽出した人間の骨格に基づく転倒検出モデルSDFAを提案する。
本モデルでは,共有高次元空間上に投影される統一関節および運動特徴を用いて,識別的構造変位と動きの傾向を捉える。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:46:00 GMT)
Modeling Human Skeleton Joint Dynamics for Fall Detection [25.6] ビデオストリームからのフォール検出は、プライバシー問題のために現実のアプリケーションにとって魅力的な選択肢ではない。
骨格関節のような体のキーポイントは、運動力学に関する重要な情報を伝えることができる。
本稿では,人間の骨格関節の時間的関節依存性とダイナミックスを利用して正確な転倒検出を行う,効率的なグラフ畳み込みネットワークモデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:35:56 GMT)
Towards Generalization of Tactile Image Generation: Reference-Free Evaluation in a Leakage-Free Setting [25.4] 触覚は人間の知覚に重要であり、コンピュータビジョン、ロボティクス、マルチモーダル学習の応用を支えている。
触覚データは入手が困難でコストがかかることが多いため、合成触覚画像の生成は、実世界の測定を拡大するためのスケーラブルなソリューションを提供する。
一般的なデータセットにおける重なり合うトレーニングとテストサンプルは、パフォーマンス指標を増大させ、触覚モデルの真の一般化可能性を見極めることを実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:37:22 GMT)
TDSM: Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition [25.3] ゼロショットスケルトンに基づくアクション認識では、見えないアクションを正確に予測するためには、スケルトン特徴とアクションラベルのテキスト特徴との整合が不可欠である。
本フレームワークは,スケルトン・テキストマッチング(TDSM)方式のトリプルト拡散として設計されており,スケルトンの特徴を逆拡散によるテキストプロンプトと整合させる。
識別力を高めるために,TDSMが不正確な3重項拡散(TD)損失を生じさせ,不正確な3重項拡散(TD)を推し進める。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:40:07 GMT)
Filter Images First, Generate Instructions Later: Pre-Instruction Data Selection for Visual Instruction Tuning [25.2] 本稿では,より実践的なデータ選択パラダイムであるPre-Instruction Data Selection(PreSel)を紹介する。
PreSelは、最も有益なラベルなしの画像を直接選択し、選択した画像に対してのみ命令を生成する。
たった15%のイメージに対して命令を生成することで、PreSelはLLaVA-1.5データセットとVision-FlanデータセットのフルデータVITに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:55:11 GMT)
Geometry-Aware Diffusion Models for Multiview Scene Inpainting [25.0] 我々は,異なる視点から捉えた入力画像の一部がマスクアウトされる3Dシーンのインペイントに焦点を当てた。
最近の研究は、生成モデルと3次元放射場を組み合わせることで、視点を越えて情報を融合することでこの問題に対処している。
本稿では,多視点一貫した塗装が可能な幾何認識条件生成モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:26:28 GMT)
AlphaNet: Scaling Up Local Frame-based Atomistic Interatomic Potential [24.9] 我々は,原子系の高精度かつ効率的なシミュレーションを実現するための,局所的フレームベース同変モデルであるAlphaNetを提案する。
欠陥グラフェン, フォルメート分解, ゼオライト, 表面反応など, さまざまなデータセットでAlphaNetの有効性を検証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:59:57 GMT)
Motion Anything: Any to Motion Generation [24.8] Motion Anythingはマルチモーダルモーション生成フレームワークである。
我々のモデルは、テキストや音楽を含む多モード条件を適応的に符号化し、制御性を向上させる。
Text-Motion-Danceデータセットは2,153対のテキスト、音楽、ダンスで構成されており、AIST++の2倍の大きさである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:04:31 GMT)
Right Reward Right Time for Federated Learning [24.7] フェデレートラーニングにおけるクリティカルラーニング期間(Critical Learning periods, CLP)とは、モデル所有者が所有するグローバルモデルの学習性能を恒久的に損なうような、低品質なコントリビューションの初期段階を指す。
我々は、特にCLPにおいて、クライアントの関与を促すために、R3T(Right Reward Right Time)と呼ばれるタイムアウェアインセンティブメカニズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:36:42 GMT)
Strategy Coopetition Explains the Emergence and Transience of In-Context Learning [24.6] インコンテキスト学習(ICL)は、トランスフォーマーモデルに現れる強力な能力であり、重み更新なしでコンテキストから学習することができる。
最近の研究は、長時間のトレーニング後に消失することがある過渡現象として緊急ICLを確立している。
本稿では、これらの重要な力学と相互作用を再現する最小限の数学的モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:13:09 GMT)
LLMIdxAdvis: Resource-Efficient Index Advisor Utilizing Large Language Model [24.6] 本研究では,大規模言語モデル(LLM)を用いた資源効率の指標アドバイザを提案する。
LLMは、インデックスレコメンデーションをシーケンス・ツー・シーケンスタスクとしてフレーム化し、ターゲットのワークロード、ストレージ制約、および対応するデータベース環境を入力として取り込む。
3つのOLAPと2つの実世界のベンチマークの実験によると、LLMIdxAdvisはランタイムを削減した競合インデックスレコメンデーションを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:01:24 GMT)
SeCap: Self-Calibrating and Adaptive Prompts for Cross-view Person Re-Identification in Aerial-Ground Networks [24.4] AGPReIDタスクのためのSeCap(Se-Calibrating and Adaptive Prompt)メソッドの設計と実装を行う。
SeCap は Prompt Re-calibration Module (PRM) に依存しており、入力に基づいてプロンプトを適応的に再校正する。
さらに,LAGPeRとG2APS-ReIDの2つの実世界の空中人物再収集データセットをコントリビュートする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:23:35 GMT)
HumanMM: Global Human Motion Recovery from Multi-shot Videos [24.3] 本稿では,複数のショット遷移を伴って,世界における長時間の人間の動きを再現する新しいフレームワークを提案する。
このような長時間の動作は、モーション生成やモーション理解といった応用に非常に有用である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:57:03 GMT)
Gemini Embedding: Generalizable Embeddings from Gemini [24.2] Googleの最も有能な大規模言語モデルであるGeminiのパワーを活用した、最先端の組み込みモデルであるGemini Embeddingを紹介した。
Gemini Embeddingは、ジェミニ固有の多言語およびコード理解機能を利用して、多数の言語にまたがるテキストに対する非常に一般化可能な埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:16:45 GMT)
HisTrackMap: Global Vectorized High-Definition Map Construction via History Map Tracking [24.2] ハイデフィニション(HD)マップは、自律運転システムのためのリッチで正確な環境情報を提供する。
クエリベースの検出フレームワークに依存する既存のメソッドは、一貫性のある時間的認識を維持するのに苦労することが多い。
本稿では,地図要素の履歴軌跡を時間的に追跡することで,新たなエンドツーエンド追跡フレームワークのグローバルマップ構築を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:44:43 GMT)
Blind Video Super-Resolution based on Implicit Kernels [24.2] Blind Super- resolution (BVSR) は、未知のシナリオにおいて低解像度の映像から高解像度の映像を生成することを目的とした低レベルのビジョンタスクである。
本稿では,暗黙的ニューラル表現によってパラメータ化されるマルチスケールカーネルを構成するImplicit Kernels(BVSR-IK)に基づく新しいモデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:01:32 GMT)
HOPE: A Memory-Based and Composition-Aware Framework for Zero-Shot Learning with Hopfield Network and Soft Mixture of Experts [24.2] そこで本稿では,Modern UnderlineHopfield NetworkとMixture Underlineof Underlineof Underline Exunderlineperts (HOPE)を組み合わせた新しいフレームワークを提案する。
提案手法は,MIT-StatesやUT-Zapposなど,いくつかのベンチマークにおいてSOTA性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:42:36 GMT)
BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis [24.1] 本稿では, テクスチャ化された幾何学的プリミティブに基づく新しいビュー合成手法として, BBSplat(Billboard Splatting)を提案する。
BBSplatはこのシーンを、学習可能なRGBテクスチャと、その形状を制御するアルファマップを備えた、最適化可能なテクスチャ化された平面プリミティブのセットとして表現している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:33:06 GMT)
DeFine: A Decomposed and Fine-Grained Annotated Dataset for Long-form Article Generation [24.1] DeFine(Decomposed and Fine-fine annotated dataset for long-form article generation)を紹介する。
DeFineは階層的な分解戦略とドメイン固有の知識とマルチレベルアノテーションの統合によって特徴付けられる。
実験結果から, テキスト品質, 特にトピックカバレッジ, 情報深度, 内容の忠実度が有意に向上した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:48:00 GMT)
Explainable XR: Understanding User Behaviors of XR Environments using LLM-assisted Analytics Framework [24.0] 多様なXR環境におけるユーザ動作を分析するためのエンドツーエンドフレームワークであるExplainable XRを提案する。
説明可能なXRは、AR、VR、MR、トランジッション、マルチユーザ共同アプリケーションシナリオといった、クロスプラットフォームを扱う際の課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:15:10 GMT)
Generalizable Imitation Learning Through Pre-Trained Representations [23.7] DVKは、リッチなトレーニング済みのVisual Transformerパッチレベルの埋め込みを活用して、デモを通して学習する際の一般化を向上する模倣学習アルゴリズムである。
我々の学習者は、外見の特徴をセマンティックな概念に関連付けられたグループにまとめ、幅広い外見のバリエーションやオブジェクトタイプにまたがる安定なキーポイントを形成することで世界を見る。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:57:28 GMT)
Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression [23.7] 我々は、クロスビュー学習を協調視認性セグメンテーションタスクとして再構成する新しい事前学習手法であるAlligat0Rを紹介する。
提案手法は,画像中の各ピクセルが第2画像において同一視可能であるか,無視されているか,視野外か(FOV)を予測する。
これをサポートするために,250万のイメージペアと高密度なコビジュアビリティアノテーションを備えた大規模データセットであるCube3を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:29:48 GMT)
C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation [23.6] C-DiffSETは、訓練済みの遅延拡散モデル(LDM)を自然画像で広く訓練したフレームワークである。
顕著なことに、事前訓練されたVAEエンコーダは、SAR入力のノイズレベルが異なる場合でも、同じ潜時空間でSARとEOの画像を整列する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:36:10 GMT)
AI for Just Work: Constructing Diverse Imaginations of AI beyond "Replacing Humans" [23.6] AIコミュニティは、通常、AI技術を開発するために"どのように"に焦点を当てるが、なぜ"なぜ"AIを開発するかについての完全なオープンな議論は欠如している。
AIの一般的なビジョンと目的に対する批判的な考察の欠如は、コミュニティを操作に脆弱にする可能性がある。
私たちは、AIの将来に対する私たちの一般的なビジョン、フレーム、マインドセットを描いている、AIの想像力について「なぜ」疑問に答える。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:03:55 GMT)
Identity Lock: Locking API Fine-tuned LLMs With Identity-based Wake Words [23.5] 本稿では、特定のIDベースのウェイクワードによってアクティベートされるまで、モデルのコア機能を制限する、IDロックと呼ばれる新しいメカニズムを提案する。
我々は、さまざまなドメインにまたがるさまざまなデータセットにわたって、IdentityLockの有効性を検証するための広範な実験を行っている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:59:07 GMT)
A Failure-Free and Efficient Discrete Laplace Distribution for Differential Privacy in MPC [23.4] MPC で保護された分散計算では、機密情報は MPC の参加者によって計算結果から推論されることがある。
本稿では,この機構をMPCを用いてセキュアに実現した上で,離散的かつ有界なLaplace型摂動機構を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:35:16 GMT)
Pure Exploration with Feedback Graphs [23.2] オンライン学習問題における純粋探索のサンプル複雑性について,フィードバックグラフを用いて検討した。
我々は、信頼を保った最良の行動を学ぶ際のサンプルの複雑さに基づいて、インスタンス固有の低い境界を導出する。
以上の結果から,サンプルの複雑性がキーグラフ依存量とどのようにスケールするかが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:11:59 GMT)
Nonstationary Time Series Forecasting via Unknown Distribution Adaptation [22.9] 環境が進化するにつれて、時間分布シフトは時系列予測性能を低下させる可能性がある。
均一分布シフトを仮定して定常成分と非定常成分をアンタングルする手法もあるが、分布変化が未知であることから現実的ではない。
非定常時系列予測のためのtextbfUnknown textbfDistribution textbfAdaptation (textbfUDA) モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:11:51 GMT)
VisRL: Intention-Driven Visual Perception via Reinforced Reasoning [22.9] 本稿では、意図駆動型視覚知覚の問題に強化学習(RL)を適用した最初のフレームワークであるVisRLを提案する。
中間焦点選択を試行錯誤によって最適化した内部決定として扱うことにより,コストのかかる領域アノテーションの必要性を解消する。
我々の実験は、VisRLが強いベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:49:35 GMT)
AdaFisher: Adaptive Second Order Optimization via Fisher Information [22.9] 第一次最適化法は、現在、深層ニューラルネットワーク(DNN)のトレーニングにおいて主流となっている。Adamのような企業は、トレーニング中に勾配の行列プレコンディショニングを利用することで、限られた曲率情報を取り入れている。
広範に使われている2階最適化アルゴリズムは、AdamやSGDのような一階最適化アルゴリズムよりも優れた収束特性を示す。
本稿では,適応勾配プレコンディショニングのためのフィッシャー情報行列の角角ブロッククロネッカー近似を利用する適応二階法であるEmphAdaFisherを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:42:22 GMT)
Quantifying Overfitting along the Regularization Path for Two-Part-Code MDL in Supervised Classification [22.8] バイナリ分類のための2部分符号最小記述長(MDL)学習規則の正規化曲線全体の完全な特徴付けを行う。
正規化パラメータ$lambda$とノイズレベルの関数として、最悪のケース制限エラーを正確に定量的に記述する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:25:45 GMT)
TiGer: Self-Supervised Purification for Time-evolving Graphs [22.7] TiGer (Time-evolving Graph purifier) は、時間進化グラフ用に明示的に設計された自己教師型手法である。
実験の結果,TiGerは最大10.2%の精度でノイズを除去し,ノード分類性能を最大5.3%向上した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:10:45 GMT)
CPAny: Couple With Any Encoder to Refer Multi-Object Tracking [22.7] Referring Multi-Object Trackingは、ビデオ内の自然言語表現によって指定されたターゲット軌跡をローカライズすることを目的としている。
既存のRMOT法は主に2つのパラダイム、すなわち1段階戦略と2段階戦略に従う。
2段階RMOTのための新しいエンコーダデコーダフレームワークであるCPAnyを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:38:42 GMT)
Learning Energy-Based Models by Self-normalising the Likelihood [22.4] エネルギーベースモデルを最大限に訓練することは、難解な正規化定数のために困難である。
伝統的な手法は、正規化定数の対数勾配を推定するために高価なマルコフ連鎖モンテカルロサンプリングに依存する。
本稿では,正規化定数を表す1つの学習可能なパラメータを新たに導入する,自己正規化ログ類似度(SNL)という新しい目的を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:01:49 GMT)
Lost-in-the-Middle in Long-Text Generation: Synthetic Dataset, Evaluation Framework, and Mitigation [22.1] 長文生成法は主に短い入力から長文を生成することに集中する。
入力が長くなるにつれて、既存の手法は必然的に「中途半端な」現象に遭遇する。
本研究では,重要で見過ごされているコンテンツを検索し,復元する検索型長文ライター(RAL-Writer)を開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:44:36 GMT)
Perception-as-Control: Fine-grained Controllable Image Animation with 3D-aware Motion Representation [21.9] 本稿では3D対応モーション表現を導入し,詳細な協調動作制御を実現するために,Perception-as-Controlと呼ばれる画像アニメーションフレームワークを提案する。
具体的には、参照画像から3D対応の動作表現を構築し、解釈されたユーザ命令に基づいて操作し、異なる視点から知覚する。
本フレームワークは,動作制御信号として知覚結果を活用することで,様々な動作関連ビデオ合成タスクを統一的かつ柔軟な方法でサポートできるようにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:46:31 GMT)
Sample Complexity of Nonparametric Closeness Testing for Continuous Distributions and Its Application to Causal Discovery with Hidden Confounding [21.8] 2つの多次元連続分布が同一であるか、少なくとも$epsilon$で異なるかを、非パラメトリックな仮定の下でKulback-Leibler分散の観点から識別するサンプルの複雑さを解析する。
我々の近接性テストは滑らか性仮定の下で最適なパラメトリックレートを達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:49:58 GMT)
Bridge Frame and Event: Common Spatiotemporal Fusion for High-Dynamic Scene Optical Flow [21.8] 本稿では,高ダイナミックなシーン光流に対するフレームとイベントのモダリティ間の新しい共通モダリティ融合を提案する。
運動融合では、フレームベースの動きは空間的に密度が高いが時間的に不連続な相関を持つのに対して、イベントベースの動きは疎いが時間的に連続的な相関を持つことがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:16:32 GMT)
Graphint: Graph-based Time Series Clustering Visualisation Tool [21.8] Graphintは、$k$-Graph方法論に基づいた革新的なシステムである。
堅牢な時系列クラスタリングアルゴリズムと、比較と解釈のための対話的なツールを統合する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:20:02 GMT)
HierDAMap: Towards Universal Domain Adaptive BEV Mapping via Hierarchical Perspective Priors [21.6] 本稿では,階層的な視点を持つ汎用かつ総合的なBEVドメイン適応フレームワークであるHierDAMapを提案する。
これらの先行とともに、HierDAはセマンティックガイドPseudo Supervision (SGPS)、動的認識コヒーレンス学習 (DACL)、クロスドメインフラストム混合 (CDFM) の3つの重要なコンポーネントから構成されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:04:45 GMT)
Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics [21.5] 本稿では、GZSLに対処するクロスドメインGZSLについて検討する。
大規模言語モデル(LLM)を付加した冗長クラスセマンティクスによる情報非対称性問題を考えると,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
MDASRは、冗長な意味空間と共通の特徴空間を効果的に整合させ、CDGZSLにおける情報の非対称性を緩和する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:35:20 GMT)
Federated Learning in NTNs: Design, Architecture and Challenges [21.4] 非地球ネットワーク(NTN)のアーキテクチャにおける分散階層学習(HFL)フレームワークを提案する。
我々は,地球低軌道(LEO)衛星と地上クライアントをFLトレーニングプロセスに統合し,静止軌道(GEO)衛星と中地球中軌道(MEO)衛星を中継機として利用する。
i)FLコンステレーションの分散化によるプライバシー向上、(ii)モデルの精度の向上、レイテンシのバランスを保ちながらトレーニング損失の低減、(iii)MEOおよびGEO衛星を利用したユビキタス接続によるFLシステムのスケーラビリティ向上、(iv)
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:53:45 GMT)
MPG-SAM 2: Adapting SAM 2 with Mask Priors and Global Context for Referring Video Object Segmentation [21.4] ビデオオブジェクトセグメンテーション(RVOS)の参照は、ビデオ内のオブジェクトをテキスト記述に従ってセグメントすることを目的としている。
Segment Anything Model 2 (SAM2)は、様々なビデオセグメンテーションタスクにおいて大きな効果を示している。
本稿では,これらの課題に対処する新しいRVOSフレームワークMPG-SAM 2を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:56:33 GMT)
Customized SAM 2 for Referring Remote Sensing Image Segmentation [21.4] 本稿では SAM 2 を RRSIS に適応させる新しいフレームワーク RS2-SAM 2 を提案する。
また,テキスト重み付き勾配差の計算により分割境界を最適化するために,テキスト誘導境界損失を導入する。
いくつかのRRSISベンチマークの実験結果は、RS2-SAM 2が最先端の性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:48:29 GMT)
Invisible Walls in Cities: Leveraging Large Language Models to Predict Urban Segregation Experience with Social Media Content [21.3] 本稿では,大規模言語モデルを用いてオンラインレビューマイニングを自動化し,セグレゲーション予測を提案する。
我々は,文化共鳴や魅力などの分離経験を示す重要な次元を捉えたコードブックを作成した。
我々のフレームワークは予測精度を大幅に改善し、R2は22.79%、MSEは9.33%低下した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:15:16 GMT)
Water Quality Data Imputation via A Fast Latent Factorization of Tensors with PID-based Optimizer [21.3] センサ故障による水質データには多くの欠落点がある。
グラディエントDescent (SGD) によるPID (LFT) の潜在因子化は, 効率的な計算法であることが証明された。
本稿では,この問題に対処するためのPID(FLFT)モデルについて提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:22:54 GMT)
Open-Vocabulary Online Semantic Mapping for SLAM [21.3] 本稿では,Open-Vocabulary Online 3Dセマンティックマッピングパイプラインを提案する。
提案するRGB-Dフレームの列から,CLIPベクトルを用いて記述した3次元セグメントを検出し,追跡する。
我々のOVOは、オフラインのベースラインよりも計算量やメモリフットプリントが大幅に少ない一方で、セグメンテーションの指標も優れている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:44:38 GMT)
Large Language Model Guided Progressive Feature Alignment for Multimodal UAV Object Detection [21.2] 既存のUAVオブジェクト検出手法は、しばしばモダリティ間の意味的ギャップの影響を見落としている。
本稿では,LPANet と呼ばれる,Large Language Model (LLM) ガイド付きプログレッシブ機能アライメントネットワークを提案する。
提案手法は,最先端のマルチモーダルUAVオブジェクト検出器よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:53:30 GMT)
XR-VLM: Cross-Relationship Modeling with Multi-part Prompts and Visual Features for Fine-Grained Recognition [21.0] XR-VLMは、相互関係をモデル化することによって微妙な違いを発見する新しいメカニズムである。
マルチパースペクティブな記述をキャプチャするマルチパート・プロンプト学習モジュールを開発した。
提案手法は,現在の最先端手法と比較して,大幅な改善を実現している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:58:05 GMT)
Automated Movie Generation via Multi-Agent CoT Planning [20.9] MovieAgentは、CoT(Multi-agent Chain of Thought)計画による自動映画生成である。
コヒーレントな物語を持つマルチシーンでマルチショットのロングフォームビデオを生成し、文字の一貫性、同期字幕、安定したオーディオを保証します。
複数のLLMエージェントを使用して、ディレクター、脚本家、ストーリーボードアーティスト、ロケーションマネージャの役割をシミュレートすることで、MovieAgentはプロダクションパイプラインを合理化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:33:27 GMT)
Process-Supervised LLM Recommenders via Flow-guided Tuning [20.9] フローガイドファインチューニングレコメンデータ(フローナー)
重要なイノベーションは、アイテムレベルの報酬を構成トークンの報酬に分解することだ。
メカニズムは 人気バイアスの緩和と 公平性向上を実現します
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:31:00 GMT)
Signed Graph Autoencoder for Explainable and Polarization-Aware Network Embeddings [20.8] 署名付きネットワーク用に設計されたSGAAE(Signed Graph Archetypal Autoencoder)フレームワーク。
SGAAEは、異なる極端プロファイル上でノードメンバシップを表現するノードレベル表現を抽出する。
モデルは、実世界の4つのデータセット間で署名付きリンク予測の異なるタスクで高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:02:47 GMT)
Cost-Aware Optimal Pairwise Pure Exploration [20.6] この研究は、純粋な探索を研究するための汎用的なフレームワークを導入し、標的となるアームペア間のペア関係を特定することに重点を置いている。
アーム固有のコストでペアで純粋な探索を行う一般的な枠組みの下では、性能の低い境界が導出される。
CAET(Cost-Aware Pairwise Exploration Task)と呼ばれる新しいアルゴリズムが提案されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:50:35 GMT)
EigenGS Representation: From Eigenspace to Gaussian Image Space [20.5] EigenGSは、固有空間と画像空間のガウス表現を接続する効率的な変換パイプラインである。
EigenGSは直接2次元ガウスフィッティングよりも優れた再現性が得られることを示す。
結果は,様々な解像度と多様なカテゴリを持つ画像に対して,EigenGSの有効性と一般化能力を強調した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:27:03 GMT)
V2Flow: Unifying Visual Tokenization and Large Language Model Vocabularies for Autoregressive Image Generation [20.4] 本稿では,高忠実度再構成が可能な離散的な視覚トークンを生成する新しいトークン化ツールV2Flowを提案する。
V2Flowは、既存の言語モデルの上に自動回帰ビジュアル生成を可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:12:50 GMT)
NeuroChat: A Neuroadaptive AI Chatbot for Customizing Learning Experiences [20.4] NeuroChatは、リアルタイムEEGベースのエンゲージメントトラッキングと生成AIを統合する、概念実証型ニューロアダプティブAIチューターである。
以上の結果から,NeuroChatは認知的・主観的エンゲージメントを高めるが,学習結果に即時的な影響は示さないことが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:57:20 GMT)
A Practical Review of Mechanistic Interpretability for Transformer-Based Language Models [19.5] 機械的解釈可能性(MI)は、その内部計算をリバースエンジニアリングすることでニューラルネットワークモデルを理解しようとする、新たな解釈可能性のサブフィールドである。
タスク中心の観点から総合的な調査を行い、MI研究質問やタスクの分類を整理する。
分類学における各課題に対する技術,評価方法,重要な知見とともに,MIにおける研究の基本的対象について概説する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:55:22 GMT)
Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Spatial Reasoning [19.4] 視覚言語モデル (VLM) は、幅広い下流タスクにおいて印象的なパフォーマンスを示している。
ほとんどのタスクは、2次元(2D)環境でのコア空間推論能力に依存している。
本稿では,合成データ生成を用いて視覚言語モデル(VLM)を3つの基本的な空間的能力で監視するフレームワークであるSparkleを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:01:59 GMT)
Assessing Uncertainty in Stock Returns: A Gaussian Mixture Distribution-Based Method [19.3] 中国株式市場における資産返却分布の複雑で時間的な性質を捉えるための新しい深層学習モデルを導入する。
提案手法は,スキューネスやヘビーテールなどの短期変動と,ストックリターンの非伝統的な特徴を効果的に特徴付ける。
より正確なボラティリティ予測を提供し、異なる資産に対するユニークなリスク洞察を提供し、それによってリターンの不確実性に対する理解を深める。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:20:56 GMT)
Robi Butler: Multimodal Remote Interaction with a Household Robot Assistant [19.3] Robi Butlerは、シームレスなマルチモーダル遠隔操作を可能にする家庭用ロボットアシスタントだ。
人間のユーザは、一人称ビューから環境を監視し、音声やテキストのコマンドを発行し、手指しジェスチャーでターゲットオブジェクトを指定できる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:00:08 GMT)
Discrete Diffusion Language Model for Efficient Text Summarization [19.3] 本稿では,トランスフォーマーのバックボーンが長いシーケンスを効果的に扱えるような,セマンティック・アウェア・ノーミング・プロセスを提案する。
提案手法は,Gigaword,CNN/DailyMail,Arxivの3つのベンチマーク要約データセットに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:45:53 GMT)
Subspace Representation Learning for Sparse Linear Arrays to Localize More Sources than Sensors: A Deep Learning Methodology [19.1] 我々はスパース線形アレイ(SLA)のサンプル共分散からコアレイ部分空間を推定する新しい手法を開発した。
このような表現を学習するために、所望部分空間と推定部分空間との分離を測る損失関数を提案する。
異なる次元の学習部分空間の計算は、新しいバッチサンプリング戦略によって高速化される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:57:50 GMT)
SplatFormer: Point Transformer for Robust 3D Gaussian Splatting [18.9] 3D Gaussian Splatting (3DGS) は、近ごろ光現実的再構成を変換し、高い視覚的忠実度とリアルタイム性能を実現した。
レンダリング品質は、テストビューがトレーニング中に使用されるカメラアングルから逸脱したときに著しく低下し、没入型自由視点レンダリングとナビゲーションのアプリケーションにとって大きな課題となった。
SplatFormerは,ガウススプラット上での操作に特化して設計された最初の点変換器モデルである。
我々のモデルは、非常に斬新なビュー下でのレンダリング品質を著しく改善し、これらの難易度シナリオにおける最先端のパフォーマンスを達成し、様々な3DGS正規化技術、スパースビュー合成に適したマルチシーンモデル、拡散を上回ります。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:37:42 GMT)
Versatile Multimodal Controls for Whole-Body Talking Human Animation [18.8] VersaAnimator(ヴァーサアニメーター)は、任意のポートレート画像から全身の会話人間を生成する多目的人体アニメーション手法である。
自然なスムーズな動作を促進するために,テンプレートビデオから抽出した2次元DWposesとVAEコードブックをリンクするコードプレイス翻訳モジュールを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:38:25 GMT)
An Imitative Reinforcement Learning Framework for Autonomous Dogfight [18.8] 無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:46:03 GMT)
On the Generalization of Representation Uncertainty in Earth Observation [18.7] 地球観測(EO)データにおける表現の不確実性の一般化について検討する。
自然画像上で事前訓練された不確実性とは異なり、EO-pretrainingは目に見えないEOドメイン、地理的な位置、ターゲットの粒度の強い一般化を示す。
本研究は,EOにおける表現の不確実性に関する議論を開始し,その強みと限界について考察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:04:50 GMT)
Text-to-Image Diffusion Models Cannot Count, and Prompt Refinement Cannot Help [18.7] T2ICountBenchは、最先端のテキスト・画像拡散モデルのカウント能力を厳格に評価するために設計された新しいベンチマークである。
評価の結果, 物体数の増加に伴い精度が著しく低下し, 全ての拡散モデルが正しい物体数を生成することができないことがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:28:18 GMT)
SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image [18.6] SDFitは、単一の画像から3Dオブジェクトのポーズと形状を復元するための最適化フレームワークである。
画像特徴量とmSDFのリッチな2D-3D対応を確立するために基礎モデルを用いており、第3に、形状とポーズを反復的に洗練するフィッティングパイプラインを開発している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:43:42 GMT)
Learning Nash Equilibrial Hamiltonian for Two-Player Collision-Avoiding Interactions [18.4] リスクに敏感な衝突回避インタラクションにおけるNash平衡ポリシの学習の問題点を考察する。
一般的な解法は、与えられたシステム状態と動作の平衡ハミルトニアンを近似するニューラルネットワークを学習することである。
本稿では、均衡政策のよりデータ効率の高い学習への2つの貢献を主張する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:52:30 GMT)
$\texttt{BATCLIP}$: Bimodal Online Test-Time Adaptation for CLIP [18.3] ゼロショットCLIPは、テスト時間中に一般的な画像の破損に対して堅牢性が欠如していることが示される。
一般的な画像破損に対するCLIPの堅牢性を改善するために設計された、bimodal $textbfonline$TTAメソッドである$textttBATCLIP$を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:10:48 GMT)
Graph-Dependent Regret Bounds in Multi-Armed Bandits with Interference [18.1] マルチアーム・バンディット(MAB)は、パーソナライズされたコンテンツの推薦から患者への治療の割り当てに至るまで、オンラインのシーケンシャルな意思決定に頻繁に使用される。
ネットワーク干渉下でのMAB問題について検討し、各ユニットの報酬はそれぞれの処理と近隣の処理に依存する。
本稿では, 干渉グラフの局所構造を用いて, 後悔を最小限に抑えるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:25:24 GMT)
SoundCTM: Unifying Score-based and Consistency Models for Full-band Text-to-Sound Generation [18.1] 我々はSoundCTM(Sound Consistency Trajectory Models)を紹介する。
SoundCTMは、高品質な1ドルの音生成と、決定論的サンプリングによる優れた音質のフレキシブルな遷移を可能にする。
生産レベル生成のために,我々はモデルを1Bのトレーニング可能なパラメータにスケールアップし,SoundCTM-DiT-1Bを音響コミュニティにおける最初の大規模蒸留モデルとした。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:51:47 GMT)
Onboard Terrain Classification via Stacked Intelligent Metasurface-Diffractive Deep Neural Networks from SAR Level-0 Raw Data [18.1] 本稿では,Sentinel-1 (S1) level-0 raw In-phase/Quadrature (IQ) data からリアルタイムな地形分類手法を提案する。
本手法は,次世代リモートセンシングタスクと軌道内処理ニーズのギャップを埋めることに役立ち,計算効率のよいリモートセンシングアプリケーションを実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:25:44 GMT)
Group Fairness in Multi-Task Reinforcement Learning [18.0] 強化学習(RL)におけるマルチタスク群フェアネスの新たな定式化について紹介する。
本論文では,複数のタスクにまたがる公正性制約を同時に実施する制約付き最適化アルゴリズムを提案する。
この結果から,提案アルゴリズムは,異なる階層群やタスクに対して,同等のリターンを維持しつつ,より小さなフェアネスギャップを達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:59:59 GMT)
Machine Against the RAG: Jamming Retrieval-Augmented Generation with Blocker Documents [18.0] Retrieval-augmented Generation (RAG) システムは、知識データベースから関連文書を検索することでクエリに応答する。
我々は、信頼できないコンテンツを持つデータベースで運用するRAGシステムが、私たちがジャミングと呼ぶサービス拒否攻撃に弱いことを実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:56:54 GMT)
FinTSBridge: A New Evaluation Suite for Real-world Financial Prediction with Advanced Time Series Models [17.9] 最先端の時系列予測モデルと金融資産価格を結びつける橋がまだ必要である。
ファイナンシャルドメインから3つのデータセットを構築し、最近の研究から10回の時系列予測モデルを選択した。
MSE と MAE に加えて msIC と msIR という新たな指標を開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:19:13 GMT)
RayFlow: Instance-Aware Diffusion Acceleration via Adaptive Flow Trajectories [17.9] 既存のアクセラレーション手法では、サンプルの品質、可制御性、あるいはトレーニングの複雑さを損なう。
これらの制限に対処する新しい拡散フレームワークであるRayFlowを提案する。
大規模な実験は、スピード、制御、トレーニング効率を改善した高品質な画像の生成におけるRayFlowの優位性を実証している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:20:52 GMT)
Diff3DS: Generating View-Consistent 3D Sketch via Differentiable Curve Rendering [17.9] 3Dスケッチは、オブジェクトやシーンの3D形状と構造を視覚的に表現するために広く使用されている。
Diff3DSは、ビュー一貫性のある3Dスケッチを生成するための、新しい差別化可能なフレームワークである。
我々のフレームワークは3Dスケッチと画像のドメインをブリッジし、3Dスケッチのエンドツーエンド最適化を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:33:10 GMT)
Neural Combinatorial Optimization via Preference Optimization [17.7] Preference Optimization for Combinatorial Optimization (POCO) は、目的値を介してソリューションの選好を利用する訓練パラダイムである。
POCOはアーキテクチャに依存しないため、既存のNCOモデルとの統合を可能にし、最適化の原則として好みの最適化を確立する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:45:30 GMT)
Towards Fine-Grained Video Question Answering [17.6] 本稿では,MOMA-QAデータセットについて述べる。
地上の真実のシーングラフと時間間隔アノテーションにより、MOMA-QAはきめ細かいビデオ理解のためのモデルを開発するのに最適である。
本稿では、シーングラフ予測器、効率的なフレーム検索器、時間的局所化と微粒化の関係理解のための事前学習された大規模言語モデルを含む、新しいビデオ言語モデルSGVLMを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:02:01 GMT)
SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models [17.5] 本稿では,タスク関連パラメータを選択的に保持し,推論オーバーヘッドを低減する訓練不要プルーニング手法であるSparse Expert Activation Pruning (SEAP)を紹介する。
実験の結果,SEAPは競争精度を維持しながら計算オーバーヘッドを著しく低減することがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:59:03 GMT)
GAGS: Granularity-Aware Feature Distillation for Language Gaussian Splatting [17.4] 近年,空間内の物体の複雑な意味的特性を正確に知覚する3次元オープン語彙シーン理解が注目されている。
GAGSは2次元CLIP機能を3次元ガウススプラッティングに蒸留し,任意の視点でレンダリングを行うためのオープン語彙クエリを実現するフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:37:13 GMT)
Towards Optimal Aggregation of Varying Range Dependencies in Haze Removal [17.3] ヘイズ除去は、ぼんやりとした入力から明確なイメージを復元することを目的としている。
既存の手法は、局所的な詳細保存のための短距離依存か、グローバルな文脈モデリングのための長距離依存のいずれかをキャプチャすることで、有意義な有効性を示している。
bfDehazeMaticは,2経路設計により短距離および長距離の依存関係を捕捉し,修復を改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:14:24 GMT)
Junior Software Developers' Perspectives on Adopting LLMs for Software Engineering: a Systematic Literature Review [17.2] 本稿では,ソフトウェア工学におけるLarge Language Model-based tools(LLM4SE)の概要について述べる。
キッチェンハムらによる56の初等研究のガイドラインに従って,系統的な文献レビューを行った。
研究の8.9%だけがジュニアソフトウェア開発者に明確な定義を提供しており、統一性はない。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:25:24 GMT)
Self-supervised Normality Learning and Divergence Vector-guided Model Merging for Zero-shot Congenital Heart Disease Detection in Fetal Ultrasound Videos [17.2] 先天性心疾患(CHD)は胎児死亡の原因の1つである。
希少な条件に対する大規模な実世界のデータセットの集中収集には、かなりの調整と資源が必要である。
データガバナンスルールは、サイト間のデータ共有をますます防止します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:27:15 GMT)
Fully First-Order Methods for Decentralized Bilevel Optimization [17.2] 本稿では,エージェントが隣人とのみ通信する分散二段階最適化(DSBO)に焦点を当てる。
本稿では,既存の作品に広く採用されている2次オラクルよりもはるかに安価な1次オラクルのみを必要とする新しいアルゴリズムである,分散グラディエントDescent and Ascent with Gradient Tracking (DSGDA-GT)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:38:11 GMT)
TimeMixer++: A General Time Series Pattern Machine for Universal Predictive Analysis [17.1] 時系列解析は多くのアプリケーションにおいて重要な役割を担い、予測、分類、異常検出、計算などのタスクをサポートする。
本研究では,高機能な表現とパターン抽出機能を通じて,幅広い時系列タスクを最適化するモデルである時系列パターンマシン(TSPM)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:37:38 GMT)
Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation [17.1] LiDARポイントクラウド上でのオブジェクトセグメンテーション(MOS)の移動は、自動運転車のような自律システムにとって不可欠である。
自己教師付き事前学習法であるtextbfTemporal textbfOverlapping textbfPtemporalrediction (textbfTOP)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:44:11 GMT)
BUCA: A Binary Classification Approach to Unsupervised Commonsense Question Answering [17.1] 非教師付きコモンセンス推論(UCR)は、コモンセンス推論データセットの構築が高価であるため、ますます人気が高まっている。
本稿では、下流の複数選択質問応答タスクを、その妥当性に応じて全ての候補回答をランク付けすることで、より単純な二分分類タスクに変換することを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:28:29 GMT)
Towards Large Language Models that Benefit for All: Benchmarking Group Fairness in Reward Models [17.0] 大規模言語モデル(LLM)は、ますます強力で、人間のユーザにとってアクセスしやすくなっている。
多様な人口集団、すなわちグループフェアネスの公平性を保証することは、批判的な倫理的関心事である。
この研究は、学習した報酬モデルのグループフェアネスをベンチマークする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:39:39 GMT)
Intelligent Framework for Human-Robot Collaboration: Safety, Dynamic Ergonomics, and Adaptive Decision-Making [17.0] 産業環境への協調ロボットの統合により生産性が向上したが、オペレーターの安全性と人間工学に関する課題も強調された。
本稿では、高度な視覚認識技術、リアルタイムエルゴノミクスモニタリング、およびビヘイビアツリーに基づく適応的意思決定を統合した革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:43:07 GMT)
On The Role of Prompt Construction In Enhancing Efficacy and Efficiency of LLM-Based Tabular Data Generation [16.8] 本稿では, エキスパート誘導, LLM誘導, ノベル・マッピングの3つのプロプライエタリ・コンストラクションプロトコルについて検討する。
文脈に富んだプロンプトは、データ生成の品質とトレーニング効率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:52:25 GMT)
Training Domain Draft Models for Speculative Decoding: Best Practices and Insights [16.7] ドメイン固有のターゲットモデルに投機的復号化を適用すると、ドメインシフトによってジェネリックドラフトモデルの受理率が大幅に低下する。
白箱蒸留法と黒箱蒸留法を比較し,各種データアクセシビリティーシナリオにおける有効性を検討した。
合成データによって、ドラフトモデルを効果的に整合させ、過去のユーザクエリのトレーニング性能の80%から93%を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:40:25 GMT)
When Selection Meets Intervention: Additional Complexities in Causal Discovery [16.6] 介入研究では、被験者が実験に選択的に登録されるが、見落とされがちな選択バイアスに対処する。
我々は、観察された世界(介入が適用される)と反現実世界(介入が適用されていないときに選択が発生する)の両方を明示的に説明するグラフィカルモデルを導入する。
因果関係を同定し,同値クラスへの選択機構を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:22:38 GMT)
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving [16.6] GoalFlowは高品質なマルチモーダル軌道を生成するためのエンドツーエンドの自動運転手法である。
生成過程を制約し、高品質でマルチモーダルな軌道を生成する。
GoalFlowは最先端のパフォーマンスを実現し、自律運転のための堅牢なマルチモーダル軌道を提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:04:44 GMT)
Byzantine-tolerant distributed learning of finite mixture models [16.6] 本稿では、DFMR(Distance Filtered Mixture Reduction)を提案する。
DFMR(DFMR)は、Byzantine Tolerant adaptation of Mixture Reduction (MR)であり、計算効率が良く統計的に聞こえる。
我々はDFMRの理論的正当性を示し、その最適収束率と大域的最大推定値との等価性を証明した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:31:36 GMT)
Semantic Communications with Computer Vision Sensing for Edge Video Transmission [16.6] 意味コミュニケーション(SC)は、意味レベルで情報を抽出し、圧縮することで解決する。
従来のSC方式は、エッジビデオにおける静的フレームの繰り返し伝送により非効率に直面する。
エッジビデオ伝送のためのコンピュータビジョンセンシングフレームワークを用いたSCを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:34:22 GMT)
LossAgent: Towards Any Optimization Objectives for Image Processing with LLM Agents [16.5] LossAgentは、低レベル画像処理の最適化目的を、異なる実用アプリケーションで実現することを目的としている。
本稿では,損失エージェントとして強力な大規模言語モデル (LLM) を導入する。
提案したLossAgentの有効性と適用性を示すために,3つの典型的な低レベル画像処理タスクと複数の最適化目標の実験を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:01:01 GMT)
Accessing the Effect of Phyllotaxy and Planting Density on Light Use Efficiency in Field-Grown Maize using 3D Reconstructions [16.3] 本研究では,光合成能動放射(PAR)モデルを用いて実生トウモロコシの3次元再構成を行った。
本フレームワークを用いて,キャノピー配向,植物および行間隔,および行方向がPARインターセプションに与える影響を詳細に解析した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:32:44 GMT)
Multimodal Human-AI Synergy for Medical Imaging Quality Control: A Hybrid Intelligence Framework with Adaptive Dataset Curation and Closed-Loop Evaluation [16.2] 画像品質評価における大規模言語モデル (LLM) の評価と標準化の報告を行う。
Gemini 2.0-Flash は CXR タスクの Macro F1 スコアを90点達成し、強力な一般化を示したが、細かい性能は制限された。
DeepSeek-R1はCTで62.23%のリコール率で評価され、他のモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:16:18 GMT)
UC-MOA: Utility-Conditioned Multi-Objective Alignment for Distributional Pareto-Optimality [15.5] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の価値を整合させる基盤となっている。
既存のアプローチは、人間の好みの多次元、分布的なニュアンスを捉えるのに苦労している。
本稿では,これらの制約を克服する新しいフレームワークであるUtility-Conditioned Multi-Objective Alignment (UC-MOA)を紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:52:42 GMT)
Adaptive Methods through the Lens of SDEs: Theoretical Insights on the Role of Noise [15.5] 本研究は, SignSGD, RMSprop(W), Adam(W) という適応適応型の新しいSDEを紹介する。
これらのSDEは、これらを定量的に正確に記述し、適応性、曲率ノイズ、勾配の間の複雑な関係を照らすのに役立つ。
私たちのアプローチは、ベストプラクティスや新しいスケーリングルールに関する貴重な洞察を提供できると考えています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:28:01 GMT)
TH-Bench: Evaluating Evading Attacks via Humanizing AI Text on Machine-Generated Text Detectors [15.5] 我々は、MGT検出器に対する回避攻撃を評価するための最初の総合的なベンチマークであるTH-Benchを紹介する。
TH-Benchは、有効性、テキスト品質、計算オーバーヘッドの3つの重要な側面にわたる攻撃を評価する。
以上の結果から,3次元に1回の攻撃が及ばないことが判明した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:55:05 GMT)
EAZY: Eliminating Hallucinations in LVLMs by Zeroing out Hallucinatory Image Tokens [15.5] LVLM(Large Vision-Language Models)は、まだオブジェクト幻覚の課題に直面している。
我々の研究は、画像入力源に焦点を移し、特定の画像トークンが幻覚にどのように貢献するかを調べる。
本稿では,幻覚器画像トークンをゼロにすることで,hAllucinationsを自動的に識別し,除去する新しい学習自由化手法EAZYを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:53:39 GMT)
Assessing the Macro and Micro Effects of Random Seeds on Fine-Tuning Large Language Models [15.5] GLUEおよびSuperGLUEベンチマークを用いて,ランダムシードが大規模言語モデル(LLM)に与える影響を系統的に評価した。
本実験は, 微調整および評価において, ランダム種子の注意深い検討の必要性を浮き彫りにして, マクロレベルとマイクロレベルの両方で有意なばらつきを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:42:04 GMT)
Uncovering Cross-Domain Recommendation Ability of Large Language Models [15.4] Cross-Domain Recommendation (CDR)は、高リソースドメインからの知識を転送することで、低リソースドメインにおけるアイテム検索を強化することを目指している。
提案するLCM4CDRは,ユーザの購入履歴シーケンスをソースドメインから活用することで,コンテキスト認識型プロンプトを構築する新しいCDRパイプラインである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:32:55 GMT)
Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark [15.4] 航空と地上の協力は、UAVの空中視界と地上の車両の局部的な観測を統合することで、有望な解決策を提供する。
本稿では,3つの重要な貢献を通じて,地上3次元協調認識のための包括的ソリューションを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:00:07 GMT)
E2ED^2:Direct Mapping from Noise to Data for Enhanced Diffusion Models [15.3] 拡散モデルは、視覚的生成モデリングにおけるデファクト・プライマリ・パラダイムとして確立されてきた。
最終生成サンプルから初期雑音への直接最適化を実現する新しいエンドツーエンド学習パラダイムを提案する。
Fr'eche't Inception Distance (FID) と CLIP のスコアは,サンプリングステップが少なくても大幅に向上する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:46:17 GMT)
SGD with memory: fundamental properties and stochastic acceleration [15.3] 非確率設定では、損失収束$L_tsim C_Lt-xiの最適指数$xi$は、平滑なGDの倍である。
メモリ1のアルゴリズムでは、安定性を維持しながら、任意に$C_L$を小さくすることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:02:15 GMT)
Look Inside for More: Internal Spatial Modality Perception for 3D Anomaly Detection [15.2] 内部の空間的モダリティ知覚(ISMP)は、内部の視点から特徴表現を十分に探求するために提案される。
提案手法は,Real3D-ADベンチマークを用いて,オブジェクトレベルのAUROCと画素レベルのAUROCをそれぞれ3.2%,13.1%改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:25:59 GMT)
Fabrication and Characterization of Impedance-transformed Josephson Parametric Amplifier [15.2] インピーダンス駆動型ジョセフソンパラメトリック増幅器(IMPA)を作製するキャパシタ誘電体層を作成するための二重層レジストリフトオフ法を提案する。
実験によって得られたIMPAは、10(14)dBを超える利得を持つ950(600)MHz以上の瞬時帯域幅を実現し、-115dBmの飽和入力パワーと量子制限ノイズに近い。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:31:45 GMT)
Enhancing Retrieval for ESGLLM via ESG-CID -- A Disclosure Content Index Finetuning Dataset for Mapping GRI and ESRS [15.2] 気候変動は、組織のプラクティスにおける透明性と説明責任の必要性を増している。
Global Reporting Initiative(GRI)やEuropean Sustainability Reporting Standards(ESRS)といったフレームワークはESGレポートの標準化を目指している。
企業報告スタイルにおけるESG文書の相当な長さと可変性のため、包括的なレポートの生成は依然として困難である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:07:33 GMT)
Plug-and-Play Posterior Sampling under Mismatched Measurement and Prior Models [15.1] 後方サンプリングは、逆問題を解決するための強力なベイズ的アプローチであることが示されている。
近年,モンテカルロサンプリングの有望な手法として,プラグ・アンド・プレイアンプレイのランゲヴィンアルゴリズムが登場している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:04:14 GMT)
ElasticDiffusion: Training-free Arbitrary Size Image Generation through Global-Local Content Separation [15.1] ElasticDiffusionは、事前訓練されたテキストと画像の拡散モデルが様々なサイズで画像を生成することができる、トレーニング不要のデコード手法である。
実験と定性的な結果から,マルチディフュージョンと安定ディフュージョンの標準デコード戦略と比較して,アスペクト比における画像コヒーレンス品質が優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:56:21 GMT)
Social Bias Benchmark for Generation: A Comparison of Generation and QA-Based Evaluations [15.0] 本稿では,Bias Benchmark for Generation (BBG) を提案する。
10大言語モデル(LLM)における中性世代と偏り世代の発生確率を計測する。
また,長大なストーリー生成評価結果と複数選択BBQ評価結果を比較し,両手法が矛盾する結果をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:06:47 GMT)
Cite Before You Speak: Enhancing Context-Response Grounding in E-commerce Conversational LLM-Agents [15.0] In-context Learning(ICL)とMulti-UX-Inference(MUI)を利用した「引用体験」を実現する。
この引用生成パラダイムを組み込むことで,実世界のデータに対するLLM応答の基底化が13.83%向上することが実証された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:47:04 GMT)
Are We Truly Forgetting? A Critical Re-examination of Machine Unlearning Evaluation Protocols [15.0] 我々は,大規模シナリオ下での未学習モデルの表現に基づく評価を用いた新しい包括的評価を行う。
我々の分析によると、現在の最先端の未学習アプローチは、未学習モデルの表現品質を完全に低下させるか、または完全に低下させる。
本稿では,下流のタスククラスと意味的類似性を示す,移動学習の観点からの新たなアンラーニング評価手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:11:34 GMT)
Reflection-Window Decoding: Text Generation with Selective Refinement [14.9] 大規模言語モデル(LLM)におけるテキスト生成の自己回帰復号化は、生成されたコンテンツの洗練や修正を行うための内蔵機構が欠如しているため、本質的には準最適である。
本稿では, すべり反射窓と舗装基準を組み込んだ手法を提案し, 復号化が進むにつれて, 改良と生成を相互に行なえるようにした。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:34:32 GMT)
ZeroSumEval: An Extensible Framework For Scaling LLM Evaluation with Inter-Model Competition [14.8] ZeroSumEvalは,大規模言語モデル(LLM)のための動的かつ競争的かつ進化的な評価フレームワークである。
ZeroSumEvalには、セキュリティ上の課題(Capture the Flag)、古典的なボードゲーム(chs)、知識テスト(MathQuiz)など、さまざまな種類のゲームが含まれている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:54:27 GMT)
Diagnostic-free onboard battery health assessment [14.6] 動作測定の一部を解釈可能な機械学習モデルと組み合わせて利用することで、バッテリーの早期かつオンボードな健康診断を可能にします。
我々はエンコーダ・デコーダアーキテクチャに機械的制約を組み込んで、物理的に解釈可能な潜在空間における電極状態の抽出を行う。
動作条件の異なる422セルからなる3つのバッテリサイクルデータセットに適用することで,このモデルフレームワークの汎用性を実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:32:27 GMT)
Is My Text in Your AI Model? Gradient-based Membership Inference Test applied to LLMs [14.6] MINTは、与えられたデータが機械学習モデルのトレーニングに使用されたかどうかを決定する一般的なアプローチである。
本研究は自然言語処理分野への応用に焦点を当てている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:32:56 GMT)
CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting [14.6] CoT-Driveは,大規模言語モデル(LLM)とチェーン・オブ・シークレット(CoT)プロンプト手法を活用することで,動き予測を強化する新しい手法である。
我々は,LLMの高度なシーン理解能力を軽量言語モデル(LM)に効果的に伝達する,教師による知識蒸留戦略を導入する。
本稿では,文脈固有の意味アノテーションを生成するための軽量なLMを微調整するための2つのシーン記述データセットであるHighway-TextとUrban-Textを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:17:38 GMT)
From Reusing to Forecasting: Accelerating Diffusion Models with TaylorSeers [14.4] Diffusion Transformers (DiT) は高忠実度画像とビデオ合成に革命をもたらしたが、リアルタイムアプリケーションでは計算要求は禁じられている。
機能キャッシングは、前のタイムステップで機能をキャッシュし、次のタイムステップでそれらを再利用することで、拡散モデルを加速するために提案されている。
我々はTaylorSeerを提案する。これはまず、将来の時間ステップにおける拡散モデルの特徴を、過去の時間ステップにおけるそれらの値に基づいて予測できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:09:42 GMT)
State Frequency Estimation for Anomaly Detection [14.3] SEQUENTは、状態マシンの状態訪問頻度を使用して、そのスコアリングを動的に適応して異常検出を行う。
我々は,3つの公開データセット上でのネットワーク異常検出におけるSEQUENTの有効性を評価する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:19:15 GMT)
MGNiceNet: Unified Monocular Geometric Scene Understanding [14.2] 単図形幾何学的シーン理解は、パノプティクスのセグメンテーションと自己教師付き深度推定を組み合わせたものである。
本稿では,汎視的セグメンテーションと自己教師型深度推定にリンクされたカーネルの定式化を利用する統一的なアプローチMGNiceNetを紹介する。
我々のモデルは、他のリアルタイム手法と比較して最先端の結果を示し、計算に要求される手法とのギャップを埋める。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:37:59 GMT)
WcDT: World-centric Diffusion Transformer for Traffic Scene Generation [14.2] 本稿では,拡散確率モデルと変圧器の相補的強度を利用して,自律走行軌道生成のための新しい手法を提案する。
提案するフレームワークは,WcDT(World-Centric Diffusion Transformer)と呼ばれ,軌道生成過程全体を最適化する。
提案手法は,現実的かつ多様な軌道を生成する上で,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:32:41 GMT)
GraphEdit: Large Language Models for Graph Structure Learning [14.2] グラフ構造学習(GSL)は、グラフ構造データ中のノード間の固有の依存関係と相互作用をキャプチャすることに焦点を当てている。
既存のGSL法は、監督信号として明示的なグラフ構造情報に大きく依存している。
グラフ構造化データの複雑なノード関係を学習するために,大規模言語モデル(LLM)を利用したグラフ編集を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:04:39 GMT)
Learning to Localize Leakage of Cryptographic Sensitive Variables [14.0] 本研究では,異なる時点に記録された測定値による相対的漏洩量を決定するための,原理的深層学習フレームワークを開発する。
この情報は、暗号ハードウェア設計者にとって、ハードウェアリークの理由を理解する上で貴重なものだ。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:42:30 GMT)
Learning a Unified Degradation-aware Representation Model for Multi-modal Image Fusion [13.9] All-in-One Degradation-Aware Fusion Models (ADFM)は、ソース画像からの劣化を軽減し、高品質の融合画像を生成することで複雑なシーンに対処する。
メインストリームADFMは、しばしば高度に合成されたマルチモーダル・マルチクオリティ・イメージを監督に頼り、クロスモーダルおよび希少な劣化シナリオにおけるその有効性を制限している。
本稿では、赤外線と可視画像融合のための学習駆動統一表現モデルLUREについて述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:16:36 GMT)
MADS: Multi-Attribute Document Supervision for Zero-Shot Image Classification [13.9] ゼロショット学習は、見知らぬクラスでモデルを訓練し、知識伝達によって見えないクラスを認識することを目的としている。
近年の研究では、百科事典の文書が有用な補助情報を提供することが明らかになっている。
本稿では,文書収集段階とモデル学習段階の両方においてノイズを除去する新しい多属性文書管理フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:16:30 GMT)
Recovering Partially Corrupted Major Objects through Tri-modality Based Image Completion [13.8] 拡散モデルは画像補完タスクに広く採用されている。
永続的な課題は、損傷した領域でオブジェクトが部分的にあいまいになったときに発生するが、残りの部分はバックグラウンドでまだ見える。
そこで我々は,新しい視覚支援によるテキストベースの指導を補足する,カジュアルスケッチを提案する。
このスケッチは重要な構造的手がかりを提供し、生成モデルは既存の背景とシームレスに統合されたオブジェクト構造を生成することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:34:31 GMT)
Language Models Fail to Introspect About Their Knowledge of Language [13.7] 我々は,21のオープンソース言語モデルを対象とした創発的イントロスペクションを体系的に検討する。
モデルがメタ言語的刺激に対する応答を、内部知識を忠実に反映しているかどうかを評価する。
本稿では,モデルが入力した応答が自身の文字列の確率を予測する度合いという,新しいイントロスペクション尺度を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:33:14 GMT)
Structure-guided Deep Multi-View Clustering [13.6] 深いマルチビュークラスタリングは、クラスタリング性能を改善するために、複数のビューから豊富な情報を活用することを目指している。
既存のクラスタリング手法の多くは、多視点構造情報の完全なマイニングを無視することが多い。
構造誘導型深層多視点クラスタリングモデルを提案し,多視点データの分布を探索する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:49:58 GMT)
ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA [13.4] ReAgentは、明示的なバックトラッキング機構を備えた可逆的なマルチエージェント協調フレームワークである。
提案システムでは,誤り検出と修正が可能で,より堅牢で解釈可能なQA結果が得られる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:56:46 GMT)
Measuring directional bias amplification in image captions using predictability [13.4] MLデータセットのバイアス増幅を測定するために,DPAC(Directional Predictability Amplification in Captioning)を提案する。
DPACはキャプションの方向バイアス増幅を測定し、データセットバイアスをよりよく推定し、攻撃モデルに敏感でない。
COCOキャプションデータセットを用いた実験は, DPACがキャプションのバイアス増幅測定において最も信頼性の高い指標であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:50:58 GMT)
Quantifying the Limits of Segmentation Foundation Models: Modeling Challenges in Segmenting Tree-Like and Low-Contrast Objects [13.3] 本研究は,対象樹状度とテクスチュラルセパビリティを定量化するための解釈可能な指標を提案する。
慎重に制御された合成実験と実世界のデータセットにおいて、SFMの性能はこれらの要因と顕著に相関していることを示す。
モデルでは局所構造をグローバルなテクスチャと誤解釈し、過剰なセグメンテーションや類似した背景からのオブジェクトの識別が困難になる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:42:44 GMT)
MTA: Multimodal Task Alignment for BEV Perception and Captioning [13.3] Bird's Eye View (BEV)ベースの3D知覚は、自律運転アプリケーションにおいて重要な役割を果たす。
既存のアプローチでは、知覚とキャプションを個別のタスクとして扱い、1つのタスクのみのパフォーマンスに焦点を当てている。
我々は,BEVの知覚とキャプションの双方を促進する,新しいマルチモーダルタスクアライメントフレームワークであるMTAを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:59:22 GMT)
When Lighting Deceives: Exposing Vision-Language Models' Illumination Vulnerability Through Illumination Transformation Attack [13.2] VLM(Vision-Language Models)は様々なタスクにおいて顕著な成功を収めてきたが、現実の照明に対する頑健さは明らかにされていない。
textbfIllumination textbfTransformation textbfAttack (textbfITA)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:12:56 GMT)
Natural Language Processing RELIES on Linguistics [13.1] 言語学がNLPに寄与する6つの主要な面を包含する頭字語RELIESを論じる。
このリストは徹底的なものではないし、言語学もこれらのテーマの下でのあらゆる努力の主点ではない。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:07:49 GMT)
Task-Specific Knowledge Distillation from the Vision Foundation Model for Enhanced Medical Image Segmentation [13.0] 医用画像セグメンテーションのための新規で汎用的なタスク固有知識蒸留フレームワークを提案する。
提案手法は,目標セグメンテーションタスクのVFMを微調整し,より小さなモデルに知識を蒸留する前にタスク固有の特徴を抽出する。
5つの医用画像データセットに対する実験結果から,本手法はタスク非依存の知識蒸留より一貫して優れていることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:39:53 GMT)
LLM-C3MOD: A Human-LLM Collaborative System for Cross-Cultural Hate Speech Moderation [13.0] 非ネイティブモデレーターは、ヘイトスピーチのモデレーションにおいて、文化的に特有の知識、感情、インターネット文化を理解するのに苦労している。
本システムでは, 作業負荷を83.6%削減しつつ, 78%の精度を実現している。
LLMによって適切に支持された非ネイティブモデレーターは、異文化間ヘイトスピーチのモデレーションに効果的に寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:20:20 GMT)
Zero-Shot Hashing Based on Reconstruction With Part Alignment [13.0] RAZHと呼ばれる新しいゼロショットハッシュ法を提案する。
まず、クラスタリングアルゴリズムを用いて、属性マッチングのための画像部品に類似したパッチをグループ化する。
次に、画像パーツを対応する属性ベクトルに置き換え、各部分を最も近い属性に徐々に整合させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:22:03 GMT)
AgriField3D: A Curated 3D Point Cloud and Procedural Model Dataset of Field-Grown Maize from a Diversity Panel [12.9] AgriField3D(アグリフィエルド3D)は、多種多様な遺伝パネルから成長するトウモロコシの3D点雲のキュレートされたデータセットである。
我々のデータセットは、地上レーザースキャナーを用いて収集された1,000以上の高品質な点雲からなる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:53:20 GMT)
Boosting the Generalization and Reasoning of Vision Language Models with Curriculum Reinforcement Learning [12.7] 小型視覚言語モデル(VLM)に特化して設計された新しいポストトレーニングパラダイムであるCurr-ReFT(Curr-ReFT)を提案する。
Curr-ReFTは、カリキュラム強化学習(Curriculum Reinforcement Learning)とRejected Smplingベースの自己改善(Rejected Smpling-based Self-improvement)の2段階からなる。
実験により,Curr-ReFTパラダイムで訓練したモデルが,様々な視覚的タスクにおける最先端性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:48:50 GMT)
FonTS: Text Rendering with Typography and Style Controls [12.7] 本稿では,テキストレンダリングにおけるタイポグラフィとスタイルの制御性を向上させることで,この問題に対処する2段階のDiTパイプラインを提案する。
タイポグラフィ制御トークン(ETCトークン)を囲むパラメータ効率の良い微調整法であるTC-FTを導入する。
テキストレンダリングにおけるスタイルの不整合性に対処するため,スタイル整合性を高めつつコンテンツ漏洩を防止するテキスト非依存型スタイル制御アダプタ(SCA)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:43:03 GMT)
OVA-Det: Open Vocabulary Aerial Object Detection with Image-Text Collaboration [12.7] OVA-Detは,高効率な空撮用オープンボキャブラリ検出器である。
まず、従来のカテゴリ回帰損失を置き換えるために、画像とテキストのアライメント損失を導入する。
次に,エンコーダの機能抽出プロセスを強化する軽量なテキスト誘導方式を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:32:41 GMT)
All That Glitters Is Not Gold: Key-Secured 3D Secrets within 3D Gaussian Splatting [12.7] KeySSは、新しいエンドツーエンドのキー・ツー・エンドの3Dステガノグラフィーフレームワークである。
マルチシークレットの隠蔽と不正アクセス防止を可能にするキー制御可能な機構を備えている。
高いセキュリティレベルを維持しつつ、隠蔽と秘密の再構築の両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:21:07 GMT)
CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers [12.5] CAD-AssistantはFreeCADソフトウェアを備えたPythonインタプリタ上で反復的に実行されるアクションを生成することでユーザクエリに対処する。
我々は,スケッチ画像パラメーター,レンダリングモジュール,2次元断面生成器,その他の特殊なルーチンなど,CAD固有のツールを幅広く検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:27:07 GMT)
Streamlined Federated Unlearning: Unite as One to Be Highly Efficient [12.5] 近年,「忘れられる権利」の制定は,連邦学習(FL)に新たなプライバシー要件を課している。
本研究では, モデル性能を劣化することなく保持データに保存しつつ, 対象データの影響を効果的に除去することを目的とした, 合理化アンラーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:54:33 GMT)
Integrating Dual Prototypes for Task-Wise Adaption in Pre-Trained Model-Based Class-Incremental Learning [12.5] クラスインクリメンタルラーニング(CIL)は、歴史知識を漸進的に保存しつつ、新しいクラスを取得することを目的としている。
本稿では,PTMに基づくCILのタスクワイド適応(DPTA)のためのDual Prototype Networkを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:58:33 GMT)
PriorMotion: Generative Class-Agnostic Motion Prediction with Raster-Vector Motion Field Priors [12.4] textbfPriorMotionは,クラスに依存しない動作予測のために設計された,革新的な生成フレームワークである。
提案手法は,構造化ベクトル表現を用いて動作先行をキャプチャし,変動型オートエンコーダを用いて遅延空間における将来の動きを学習する。
高速移動物体の精度が約15.24%向上し, 一般化が3.59%向上し, 運動安定性が0.0163低下し, 遠隔地での予測誤差が31.52%減少した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:44:04 GMT)
Efficient Membership Inference Attacks by Bayesian Neural Network [12.4] メンバーシップ推論攻撃(MIA)は、特定のデータポイントが与えられたモデルのトレーニングに使用されたかどうかを推定することを目的としている。
本稿では,ベイジアン推論による条件付き攻撃を行う新しいアプローチとして,ベイジアンメンバーシップ推論攻撃(BMIA)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:58:43 GMT)
Provably Accurate Shapley Value Estimation via Leverage Score Sampling [12.2] 本稿では,Kernel SHAP の軽量な修正である Leverage SHAP を紹介する。
提案手法は,強力な回帰ツールであるレバレッジスコアサンプリングを用いて,シェープ値の推定とアクティブラーニングの関連性を利用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:52:54 GMT)
TaskEval: Assessing Difficulty of Code Generation Tasks for Large Language Models [12.1] LLM(Large Language Models)はコード生成のようなコード関連のタスクに優れていますが、ベンチマーク評価は困難などのタスク特性を見落とします。
本稿では,多種多様なプロンプトと項目応答理論(IRT)を用いてLCMの能力とベンチマークタスク特性を効率的に評価するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:41:17 GMT)
Spectral Truncation Kernels: Noncommutativity in $C^*$-algebraic Kernel Machines [12.1] スペクトルトランケーションに基づく正定値カーネルの新しいクラスを提案する。
提案するカーネルは,既存の分離可能カーネルと可換カーネルのギャップを埋めることを示す。
提案されたカーネルクラスの柔軟性により、以前の分離可能で可換なカーネルを超えることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:51:10 GMT)
LEGO-Motion: Learning-Enhanced Grids with Occupancy Instance Modeling for Class-Agnostic Motion Prediction [12.1] 本稿ではLEGO-Motionという,クラスに依存しない動作予測タスクのための新しい占有状況モデリングフレームワークを提案する。
本モデルは,(1)BEVエンコーダ,(2)Interaction-Augmented Instance,(3)インスタンス強化型BEVからなる。
提案手法は最先端の性能を達成し,既存手法より優れている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:26:21 GMT)
PanguIR Technical Report for NTCIR-18 AEOLLM Task [12.1] 大規模言語モデル(LLM)はますます重要で、評価が難しい。
手作業の評価は包括的ではあるが、コストが高くリソース集約的であることが多い。
自動評価はスケーラビリティを提供するが、評価基準の制限によって制約される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:49:01 GMT)
POp-GS: Next Best View in 3D-Gaussian Splatting with P-Optimality [12.0] 3D-GSは計算精度の高い有用な世界モデルであることが証明されているが、不確実性は定量化されていない。
P-最適性により3D-GS内で得られた不確実性と情報の定量化のための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:01:56 GMT)
Demystifying the Accuracy-Interpretability Trade-Off: A Case Study of Inferring Ratings from Reviews [11.9] 解釈可能な機械学習モデルは、意思決定プロセスの背後にある理解可能な推論を提供する。
この解釈可能性とモデルパフォーマンスのトレードオフは、AIの展開に関する議論を引き起こした。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:17:46 GMT)
Frequency-Aware Density Control via Reparameterization for High-Quality Rendering of 3D Gaussian Splatting [11.9] 3D Gaussian Splatting (3DGS) は、高周波領域のシーン詳細を表現できる。
3DGSは現在、ドメイン全体にわたる3Dガウスの密度とスケールをリンクする明示的な制約を欠いている。
我々は,表現品質を向上させるために,デシフィケーションと削除からなる周波数認識密度制御戦略を開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:30:45 GMT)
Interference-Aware Super-Constellation Design for NOMA [11.9] 本稿では、干渉認識型スーパーコンステレーションの設計にオートエンコーダを用いる。
提案したオートエンコーダベースのNOMA (AE-NOMA) は、チャネルゲインに関係なく、受信側で区別可能なシンボルを持つ超星空を設計するよう訓練されている。
干渉認識型星座のビット誤り率向上効果を示すために, 種々の試験結果が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:31:33 GMT)
ALLVB: All-in-One Long Video Understanding Benchmark [11.9] ALLVB(ALL-in-One Long Video Understanding Benchmark)は、長いビデオ理解のための総合的なベンチマークである。
16のカテゴリーで1,376本のビデオがあり、それぞれ平均で2時間近く、QAは252kだ。
これはビデオの数、平均持続時間、QAの数で最大の長ビデオ理解ベンチマークである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:18:05 GMT)
FaceShield: Defending Facial Image against Deepfake Threats [11.8] FaceShieldは拡散モデル(DM)が生み出すディープフェイクをターゲットとした能動的防御手法である
提案手法は3つの主要要素からなる: (i) DMの注意機構を操作し, 認知過程において保護された顔の特徴を排除し, (ii) 顔の特徴抽出モデルをターゲットとし, 対向的摂動の堅牢性を高める, (iii) ガウス的ぼかしとローパスフィルタリング技術を用いてJPEG圧縮に対する頑健性を高めつつ, 知覚能力を向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:36:55 GMT)
Task Vector Quantization for Memory-Efficient Model Merging [11.8] 細調整されたチェックポイントを定量化する代わりに,タスクベクトルの定量化を提案する。
本手法は,完全精度チェックポイントに必要なメモリの8%しか使用せず,モデルマージ性能を維持または改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:00:24 GMT)
A Novel Ophthalmic Benchmark for Evaluating Multimodal Large Language Models with Fundus Photographs and OCT Images [11.8] 眼科領域では,光学コヒーレンス・トモグラフィー(OCT)の報告を解析するために,大言語モデル(MLLM)が研究されている。
データセットは439基の画像と75基のOCT画像からなる。
標準化されたAPIベースのフレームワークを用いて、7つの主流MLLMを評価し、異なる疾患の診断精度に有意なばらつきが認められた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:19:55 GMT)
Robust Multimodal Learning via Cross-Modal Proxy Tokens [11.7] マルチモーダルモデルは、推論中に1つ以上のモダリティが欠落している場合、大きなパフォーマンス低下を経験することが多い。
我々は,すべてのモダリティが利用可能である場合に高い性能を維持しつつ,モダリティの欠如に対するロバスト性を高める,シンプルで効果的なアプローチを提案する。
本手法では, 利用可能なモダリティのトークンのみにのみ参加することで, 欠落したモダリティのクラストークンを近似するクロスモーダルプロキシトークン(CMPT)を導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:34:24 GMT)
Evaluation of Alignment-Regularity Characteristics in Deformable Image Registration [11.6] 変形可能な画像登録(DIR)を評価することは、高いアライメント精度と変形規則性を維持することの間の本質的にトレードオフがあるため困難である。
本稿では,このトレードオフを体系的に捉え解析するためのアライメント・規則性特性(ARC)に基づく新しい評価手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:10:35 GMT)
HiSTF Mamba: Hierarchical Spatiotemporal Fusion with Multi-Granular Body-Spatial Modeling for High-Fidelity Text-to-Motion Generation [11.6] テキスト・トゥ・モーション生成のための新しいHiSTF Mambaフレームワークを提案する。
我々は、HiSTF Mambaが複数のメトリクスにわたって最先端のパフォーマンスを達成することを示す。
以上の結果から,HiSTF Mambaは高い忠実度と強いセマンティックアライメントを達成できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:01:48 GMT)
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning [11.6] 本稿では,感情認識の文脈におけるOmni-multimodalな大規模言語モデルに対するReinforcement Learning with Verifiable Reward (RLVR)の最初の応用について述べる。
我々はRLVRを利用してOmniモデルを最適化し、推論能力、感情認識精度、一般化能力の3つの重要な側面でその性能を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:11:14 GMT)
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling [11.5] 本稿では,トンプソンサンプリングに基づく楽観的な探索手法を提案する。
実験により,楽観的な探索は,少ない報奨を伴う環境における学習を著しく促進することが示された。
さらに、最適化がいつ有用かについての洞察を提供し、探索を導く上でのモデル不確実性の重要性を強調します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:16:44 GMT)
Pairwise Elimination with Instance-Dependent Guarantees for Bandits with Cost Subsidy [11.4] マルチアーム・バンディット(Multi-armed bandits、MAB)は、オンライン意思決定において一般的に用いられる。
Pairwise-Elimination(PE)アルゴリズムは、既知の参照アームの変種に対して導入し、補助金付きベスト報酬変種に対してPEをPE-CSに一般化する。
PE と PE-CS のインスタンス依存分析により,両アルゴリズムはコストと品質レグレクトの順に対数的な上限を持つことが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:55:40 GMT)
Incentive-Compatible Recovery from Manipulated Signals, with Applications to Decentralized Physical Infrastructure [11.4] 本稿では,他のプレイヤーからの暗黙の信号で検証不能な情報を抽出する最初の形式モデルを提案する。
私たちのモデルは、分散化された物理インフラネットワークの応用によって部分的に動機付けられています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:28:45 GMT)
Combined Physics and Event Camera Simulator for Slip Detection [11.3] 本稿では,ロボットアームのカメラグリッパー構成を用いてスリップデータを生成するシミュレーションパイプラインを提案する。
セットアップをいつでも変更でき、繰り返しのプロセスを単純化し、任意に大きなデータセットを生成することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:49:56 GMT)
Endo-FASt3r: Endoscopic Foundation model Adaptation for Structure from motion [11.1] Endo-FASt3rは、両方のタスクに基礎モデルを使用する最初の単眼SSL深度とポーズ推定フレームワークである。
また、高階更新と高速収束を実現する新しい適応手法であるDoMoRAを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:42:37 GMT)
Universal Incremental Learning: Mitigating Confusion from Inter- and Intra-task Distribution Randomness [11.1] 増分学習は、新しいタスクを学習しながら、以前のタスクの忘れを克服することを目的としている。
既存のILメソッドは、入ってくるタスクタイプが新しいクラスやドメインだけを増やすと強く仮定します。
We propose a simple yet effective framework for UIL, named $textbfMiCo$。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:20:55 GMT)
Experimental Exploration: Investigating Cooperative Interaction Behavior Between Humans and Large Language Model Agents [11.1] 本研究は, 繰り返し行われる囚人のジレンマゲームに30人の参加者を参加させることにより, 人間の協調行動について検討した。
その結果, エージェントの特徴と, 参加者の性別および特徴の相互作用効果に基づいて, 協調行動に有意な差異が認められた。
この研究は、AIエージェントに対する人間のバイアスを理解することの重要性と、観察された行動が将来の人間とAIの協力のダイナミクスにどのように影響を与えるかを強調している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:37:36 GMT)
Benchmarking Chinese Medical LLMs: A Medbench-based Analysis of Performance Gaps and Hierarchical Optimization Strategies [11.1] 本研究は,MedBench上の上位10モデルの系統的解析を通じて,粒度の誤差分類を導入する。
10つの主要なモデルの評価は、医療知識のリコールにおいて0.86の精度を達成したにもかかわらず、脆弱性を明らかにしている。
知識境界法と多段階推論の体系的弱点を明らかにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:28:25 GMT)
PanoLlama: Generating Endless and Coherent Panoramas with Next-Token-Prediction LLMs [11.0] パノラマ画像生成(PIG)は任意の長さのコヒーレントな画像を作成することを目的としている。
パノラマ(PanoLlama)は,パノラマ生成と自己回帰パラダイムを融合した,永続的で一貫性のあるパノラマ生成を実現する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:50:28 GMT)
TwinTURBO: Semi-Supervised Fine-Tuning of Foundation Models via Mutual Information Decompositions for Downstream Task and Latent Spaces [10.9] 本稿では,限られたラベル付きデータに対するトレーニングの課題に対処する,半教師付き微調整フレームワークを提案する。
いくつかのデータセットの実験では、極低ラベル条件下での分類タスクが大幅に改善された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:56:54 GMT)
Large Language Models Assume People are More Rational than We Really are [10.9] AIが人と効果的にコミュニケーションするためには、意思決定の仕方を理解する必要があります。
以前の実証的な証拠は、これらの暗黙のモデルが正確であることを示唆しているようである。
人々の選択をシミュレートし、予測する場合は、実際にはそうではありません。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:42:37 GMT)
Joint Graph Rewiring and Feature Denoising via Spectral Resonance [10.9] 雑音グラフを結合して再構成するアルゴリズムを提案する。
提案手法は, 実世界のノード分類タスクにおいて, 既存の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:24:23 GMT)
Brain Inspired Adaptive Memory Dual-Net for Few-Shot Image Classification [10.8] 既存の手法は、関連するローカル機能の位置と整合性によってこの問題に対処することを目的としている。
実世界の画像における高いクラス内変動は、いくつかのショット設定下で意味論的に関連する局所領域を特定する上で大きな課題を生じさせる。
一般化最適化システム統合適応メモリデュアルネットワークSCAM-Netを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:42:51 GMT)
Probabilistic Segmentation for Robust Field of View Estimation [10.8] セキュリティを意識したセンサー融合は脅威を軽減するのに役立つが、自律性を評価していない正確な視野推定が必要である。
我々は,コンピュータグラフィックスアルゴリズムを適用して,最初の自律関連FOV推定器を開発し,基底真理FOVラベルを用いた最初のデータセットを作成する。
本稿では,FOV特徴を抽出し,不確実性を考慮したモンテカルロドロップアウト(MCD)を統合し,信頼マップ上で異常検出を行う学習ベースセグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:30:56 GMT)
PointVLA: Injecting the 3D World into Vision-Language-Action Models [10.8] 我々は,ポイントクラウド入力を必要とせずに,事前学習された視覚言語行動モデルを強化するフレームワークであるPointVLAを提案する。
本手法は,バニラ動作の専門家を凍結し,軽量なモジュールブロックを介して3次元特徴を注入する。
PointVLAは、シミュレーションと現実世界の両方のロボットタスクにおいて、最先端の2D模倣学習方法より優れています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:32:41 GMT)
ProjectEval: A Benchmark for Programming Agents Automated Evaluation on Project-Level Code Generation [10.7] ユーザインタラクションをシミュレートしてプロジェクトレベルのコード生成を自動評価する,LLMエージェントのための新しいベンチマークであるProjectEvalを紹介する。
ProjectEvalは、実行のためのユーザインタラクションシミュレーションと、既存の客観的インジケータによるコード類似性によって、生成されたプロジェクトを評価することができる。
システム工学的なプロジェクトコード、プロジェクト全体の理解、総合的な分析能力が、LLMエージェントが実践的なプロジェクトを達成する鍵であることに気付きました。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:47:27 GMT)
TCM-3CEval: A Triaxial Benchmark for Assessing Responses from Large Language Models in Traditional Chinese Medicine [10.7] 大規模言語モデル (LLMs) は, 様々なNLPタスクや現代医学に優れるが, 伝統的な漢方医学(TCM)における評価は過小評価されている。
そこで本研究では,TCM における LLM の評価を行うベンチマークである TCM3CEval について紹介する。
全てのモデルはメリディアン・アンド・アクポイント理論や様々なTCMスクールのような特殊性に制限があり、現在の能力と臨床ニーズのギャップを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:29:15 GMT)
Bridging Molecular Graphs and Large Language Models [10.6] 大規模言語モデル(LLM)は例外的な一般化能力を示しているが、分子構造のようなグラフデータを処理する能力は依然として限られている。
本稿では,LLMトークンにグラフトークンをアライメントする効率的なソリューションであるGraph2Tokenを提案する。
分子分類および回帰タスクに関する大規模な実験により,提案したGraph2Tokenの有効性が示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:51:05 GMT)
HouseTune: Two-Stage Floorplan Generation with LLM Assistance [10.6] 本稿では,大規模言語モデルの推論能力と拡散モデルの生成能力を組み合わせた2段階のテキスト・ツー・フロアプラン・フレームワークを提案する。
実験結果から,本手法は全指標の最先端性能を実現し,実用的ホームデザインアプリケーションにおける有効性を検証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:08:17 GMT)
Reproducibility and Artifact Consistency of the SIGIR 2022 Recommender Systems Papers Based on Message Passing [10.5] 我々は、SIGIR 2022と2023で発表されたグラフベースのRecommender Systemsの10の論文を分析した。
分析の結果,注意を要するいくつかの重要な点が明らかになった。
これらの問題により、調査・再生を試みた論文のほとんどに記載された主張を裏付けることができない。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:09:04 GMT)
Implicit Reasoning in Transformers is Reasoning through Shortcuts [10.4] テストタイム計算は、言語モデルの複雑な多段階推論機能を強化するための新しいパラダイムとして登場しつつある。
マルチステップタスクにおいて,言語モデルがどのように暗黙的推論を行うかを検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:58:31 GMT)
Enhanced Hamiltonian Learning Precision with Multi-Stage Neural Networks [10.3] ハミルトン学習精度を向上させる多段階ニューラルネットワークフレームワークを提案する。
提案手法は,ランダム初期状態の単一キュービットパウリ測定から時系列データを利用する。
パラメータの精度を最大化することで、2量子システム上でのフレームワークを実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:10:59 GMT)
Resonance: Learning to Predict Social-Aware Pedestrian Trajectories as Co-Vibrations [10.2] 共生形態の歩行者軌跡を符号化・予測するための共振モデル」を提案する。
軌道修正とランダム性を複数の振動部分に分解し、各原因に対するエージェントの反応をシミュレートする。
これらの独立振動の重ね合わせとして軌道を予測している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:37:08 GMT)
PP-DocBee: Improving Multimodal Document Understanding Through a Bag of Tricks [10.2] PP-DocBeeは、エンドツーエンドの文書イメージ理解のために設計された、新しいマルチモーダルな大規模言語モデルである。
我々は、モデル一般化を改善するために多様なデータセットを構築するシナリオを文書化するのに適したデータ合成戦略を開発する。
我々は、動的比例サンプリング、データ前処理、OCR後処理戦略など、いくつかのトレーニング手法を適用している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:22:24 GMT)
Quantum-preserved transport of excitations in Rydberg-dressed atom arrays [10.2] 本稿では,Rydberg-dressed 原子配列を用いた励起の量子保存輸送を実現するためのプロトコルを提案する。
この結果は、Rydberg原子を用いたスピン系の力学を研究するための、容易に実装されたスキームを強調した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:37:18 GMT)
AI-Driven Automated Tool for Abdominal CT Body Composition Analysis in Gastrointestinal Cancer Management [10.1] このツールは、多視点ローカライゼーションモデルと高精度2D nnUNetベースのセグメンテーションモデルを統合し、ローカライゼーション精度90%とセグメンテーションのDice Score Coefficient 0.967を実証する。
本ツールでは, 腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下腹腔鏡下手術を施行し, 腹腔鏡下腹腔鏡下手術を施行した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:32:44 GMT)
LOGen: Toward Lidar Object Generation by Point Diffusion [10.0] 我々は、LiDARオブジェクト生成という新しいタスクを導入し、モデルがLiDARスキャンで見るように3Dオブジェクトを生成することを要求する。
そこで本研究では,高強度を含むデータセットオブジェクトのLiDAR点雲を生成するための拡散モデルを導入し,条件付き情報による生成を広範囲に制御する。
nuScenesの実験は、LiDARオブジェクトに適合するように開発された新しい3Dメトリクスで測定された世代の品質を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:15:45 GMT)
DECO: Life-Cycle Management of Enterprise-Grade Copilots [9.9] DECOは、エンタープライズグレードのコピロを開発し、デプロイし、管理するための包括的なフレームワークである。
効率的でカスタマイズされた検索拡張世代(RAG)アルゴリズムをサポートする。
DECOはその効果を広く採用することで証明し、数万のインタラクションを可能にした。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:24:19 GMT)
ADROIT: A Self-Supervised Framework for Learning Robust Representations for Active Learning [9.9] 本稿では,タスク認識を伴う能動的学習に適した統一表現学習フレームワークを提案する。
再建、敵対的、自己監督的、知識蒸留、分類損失など様々なソースを統合されたVAEベースのADROITアプローチに統合する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:28:04 GMT)
Memorization in Attention-only Transformers [9.9] 本稿では,現在の仮説を任意の文脈サイズに拡張する言語ベースのトランスフォーマーの証明を提案する。
本手法は,注目層を用いたより効果的な正確な記憶を実現することにより,最先端技術の向上を図っている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:40:41 GMT)
YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion [9.8] 本稿では,複雑な環境下で小型ドローンを正確に識別する新しいエンドツーエンドフレームワークを提案する。
最初は、小さなドローンのモーション特性を捉えるために、動きの差分マップを作成する。
次に、この動き差分マップをバイモーダル融合モジュールを用いてRGB画像と組み合わせることで、ドローンの適応的な特徴学習を可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:44:21 GMT)
Strengthening the Internal Adversarial Robustness in Lifted Neural Networks [9.8] まず,トレーニング損失を単に修正するだけで,この枠組みにおける敵の堅牢性をさらに強化することができるかを検討する。
2番目のステップでは、いくつかの残りの制限を修正し、ターゲットと非ターゲットの敵の摂動を組み合わせた、リフトされたニューラルネットワークの新たなトレーニング損失に到達します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:00:38 GMT)
Quantum Frontiers in High Energy Physics [9.7] 標準モデルを超えた新しい物理の微妙な効果を検知する量子デバイスの可能性について論じる。
また、初期の宇宙や衝突機におけるリアルタイム非摂動力学の研究における量子アルゴリズムと大規模量子コンピュータの変換的役割についても論じる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:09:36 GMT)
ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions [9.6] VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。
ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:51:26 GMT)
Correlated vibration-solvent and Duschinsky effects on optical spectroscopy [9.6] このことは、拡張されたジシパトン方程式(ext-DEOM)アプローチを用いて、ドスチンスキーと溶媒の光学スペクトルへの影響について検討する。
溶媒化分子系の正確な説明として、上記の因子がスペクトル帯の位置と形状にどのように影響するかを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:58:53 GMT)
AttFC: Attention Fully-Connected Layer for Large-Scale Face Recognition with One GPU [9.6] 本稿では,計算資源を大幅に削減できるアテンションフルコネクテッド(AttFC)層を提案する。
AttFCはアテンションローダを使用して生成クラスセンター(GCC)を生成し、動的クラスコンテナ(DCC)でクラスセンターを動的に保存する。
DCC はすべてのクラスセンターの小さな部分集合を FC に格納するだけなので、そのパラメータ数は FC 層よりもかなり少ない。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:59:11 GMT)
GUIDE-CoT: Goal-driven and User-Informed Dynamic Estimation for Pedestrian Trajectory using Chain-of-Thought [9.6] GUIDE-CoT (Chain-of-Thought) を用いた歩行者軌跡のゴール駆動およびユーザインフォームド動的推定法を提案する。
提案手法は,(1)視覚的プロンプトと事前学習された視覚的エンコーダを組み合わせた目標予測精度を向上する目標指向視覚プロンプト,(2)軌道生成のためのチェーン・オブ・シント(CoT)LLM,の2つのイノベーティブなモジュールを統合する。
提案手法は,歩行者軌道予測における精度と適応性を両立させ,最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:39:24 GMT)
On the Performance Analysis of Momentum Method: A Frequency Domain Perspective [9.6] 本稿では,モーメント法を時間変動フィルタとして解釈する周波数領域解析フレームワークを提案する。
我々の実験はこの視点を支持し、関連するメカニズムをより深く理解する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:16:28 GMT)
U-Motion: Learned Point Cloud Video Compression with U-Structured Motion Estimation [9.5] ポイントクラウドビデオ(PCV)は、動的シーンと新興アプリケーションを組み合わせた汎用的な3D表現である。
本稿では,PCV形状と属性の両方を学習ベースで圧縮するU-Motionを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:55:18 GMT)
Physics Context Builders: A Modular Framework for Physical Reasoning in Vision-Language Models [9.5] 視覚言語モデル(VLM)における物理推論の課題
ファインチューニングは大きなモデルでは高価であり、すべてのタスクで繰り返し実行できない。
我々は,物理シーンの詳細な記述を生成するために,特殊なVLMを微調整した新しいモジュラーフレームワークであるPhysical Context Builders (PCBs)を紹介した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:01:51 GMT)
VoD: Learning Volume of Differences for Video-Based Deepfake Detection [9.4] 本稿では,新しいDeepfake detention framework, Volume of differences (VoD)を紹介する。
VoDは連続するビデオフレーム間の時間的および空間的不整合を利用して検出精度を向上させるように設計されている。
我々は、よく知られたDeepfakeデータセット上で、データセット内およびクロスデータセットテストシナリオを用いてアプローチを評価した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:59:38 GMT)
Fact Recall, Heuristics or Pure Guesswork? Precise Interpretations of Language Models for Fact Completion [9.4] 言語モデル(LM)はプロンプト内の多くの可能な信号に基づいて正しい予測を行うことができる。
4つの異なる予測シナリオの例を用いてデータセットを構築するためのモデル固有のレシピPrISMを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:47:31 GMT)
Rethinking Diffusion-Based Image Generators for Fundus Fluorescein Angiography Synthesis on Limited Data [9.3] 本稿では,医療データ制限の課題を克服するために,新しい潜伏拡散モデルに基づくフレームワークを提案する。
本フレームワークは,既存の方法と比較して最先端の成果を達成し,眼科診断や患者ケアの強化に有意な可能性を秘めている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:53:38 GMT)
Topology-Preserving Loss for Accurate and Anatomically Consistent Cardiac Mesh Reconstruction [9.3] Topology-Preserving Mesh Loss (TPM Loss) は、メッシュ変形中にトポロジ的制約を明示的に強制する新しい損失関数である。
CTおよびMRIデータセットの大規模な実験は、TPMロスがトポロジー違反を最大93.1%減少させることを示している。
これらの結果から,TPMロスは膜透過を効果的に防止し,心筋メッシュの品質を著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:46:57 GMT)
Self-Corrective Task Planning by Inverse Prompting with Large Language Models [9.3] InversePromptは,新しい自己修正型タスクプランニング手法である。
提案手法は、明確な解釈可能なフィードバックを提供するための推論ステップを組み込んだものである。
ベンチマークデータセットの結果は、既存のLCMベースのタスク計画手法よりも平均16.3%高い成功率を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:35:51 GMT)
Queueing, Predictions, and LLMs: Challenges and Open Problems [9.2] 待ち行列システムは、推定サービス時間などの機械学習予測を適用し、システム性能を改善する機会を提供する。
最近の研究は、一般的にシステム内のジョブ時間を最小限にすることを目的として、予測されたサービス時間を持つキューを探索している。
本稿では,スケジューリングにおける予測,すなわちLarge Language Model (LLM)システムの利用に関する重要な実例について考察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:12:47 GMT)
RD Efficient FPGA Deployment of Learned Image Compression: Knowledge Distillation and Hybrid Quantization [9.2] Learnable Image Compression (LIC)は、RD効率で標準化されたビデオコーデックを上回る性能を示す。
既存のハードウェア実装の多くは、RD効率に遅延を優先順位付けし、ハードウェア設計空間を広範囲に調査している。
本稿では,RD効率を損なうことなく,特定のハードウェアプラットフォームの設計の調整の負担をモデル次元にシフトする,新しい設計パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:47:03 GMT)
Log Optimization Simplification Method for Predicting Remaining Time [9.2] 同様に機能する全ての点の単純化を避けるために,予測点選択アルゴリズムを提案する。
実験によると、単純化されたイベントログは予測性能を保持し、場合によっては、元のイベントログと比較して予測精度を高める。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:54:44 GMT)
From Image- to Pixel-level: Label-efficient Hyperspectral Image Reconstruction [9.2] 画素レベルのスペクトル超解像(Pixel-SSR)パラダイムを導入し,RGBと点スペクトルから高スペクトル像を再構成する。
その利点にもかかわらず、Pixel-SSRは、1)ポイントスペクトルを欠いた新規シーンへの一般化可能性、2)再構成精度を高める効果的な情報抽出の2つの主要な課題を提示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:23:32 GMT)
Interpretable deformable image registration: A geometric deep learning perspective [9.1] 解釈可能な登録フレームワークを設計するための理論的基盤を提示する。
粗い方法で変換を洗練するエンドツーエンドのプロセスを定式化します。
我々は、最先端のアプローチよりもパフォーマンスの指標が大幅に改善されたと結論付けている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:42:18 GMT)
SmartRAG: Jointly Learn RAG-Related Tasks From the Environment Feedback [9.1] RAGシステムは複数のモジュールから構成される。
複数のモジュールを組み込んだRAGのようなシステムは、最適な性能を達成するために共同で最適化されるべきである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:49:31 GMT)
PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity [9.1] 拡散モデルでは、高品質な条件付きサンプルの生成に顕著な結果が示されている。
しかし、既存の方法は、しばしば追加のトレーニングや神経機能評価(NFE)を必要とする。
本稿では,スパースアテンションを生かして事前学習モデルを強化する,PLADISと呼ばれる新しい,効率的な手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:23:19 GMT)
Inorganic Catalyst Efficiency Prediction Based on EAPCR Model: A Deep Learning Solution for Multi-Source Heterogeneous Data [9.0] 本研究では,Embedding-Attention-Permutated CNN-Residual (EAPCR)ディープラーニングモデルを提案する。
EAPCRは埋め込みと注意機構を用いて特徴関連行列を構築し、予測性能を向上させる。
我々は、不均一光触媒、熱、電気触媒のデータセット上でEAPCRを評価する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:10:22 GMT)
Self Pre-training with Adaptive Mask Autoencoders for Variable-Contrast 3D Medical Imaging [9.0] Masked Autoencoder (MAE) は、視覚変換器 (ViT) が自然画像の解析に有効であることを最近証明した。
本稿では,3次元入力コントラストの可変数に対応可能な3次元適応マスク付きオートエンコーダ(AMAE)アーキテクチャを提案する。
この性能は、この適応マスク付きオートエンコーダの自己事前トレーニングにより、ViTベースのセグメンテーションモデルにおいて、梗塞セグメンテーション性能を2.8%-3.7%向上させることができることを示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:48:15 GMT)
Privacy and Accuracy Implications of Model Complexity and Integration in Heterogeneous Federated Learning [8.8] 分散機械学習のプライバシ保護ソリューションとしてフェデレートラーニング(FL)が提案されている。
近年の研究では、クライアントデータのプライバシを損なうことができるMIA攻撃の影響が指摘されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:10:50 GMT)
Sometimes the Model doth Preach: Quantifying Religious Bias in Open LLMs through Demographic Analysis in Asian Nations [8.8] 大きな言語モデル(LLM)は、意見を生成し、バイアスを無意識に伝播することができる。
本研究は,LLMが生み出す意見を定量的に分析する手法を提案する。
Llama や Mistral のような近代的でオープンな LLM を世界各国で実施した調査で評価した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:32:03 GMT)
Survey on Question Answering over Visually Rich Documents: Methods, Challenges, and Trends [8.7] 視覚的にリッチなドキュメント理解の分野は急速に進化しており、まだ処理パイプラインのいくつかの重要な側面についてのコンセンサスを欠いている。
我々は、最先端のアプローチを包括的に概観し、その強みと限界を強調し、この分野の主な課題を指摘し、有望な研究方向性を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:41:41 GMT)
ActiveInitSplat: How Active Image Selection Helps Gaussian Splatting [8.7] Gaussian splatting (GS) はその拡張と変種と共に、リアルタイムのシーンレンダリングにおいて優れたパフォーマンスを提供する。
以前の作品は受動的で一般的に密度の高い2D画像に依存していた。
本稿では,トレーニング画像のアクティブな選択のための新しいフレームワークであるActiveInitSplatを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:35:45 GMT)
Fully Autonomous Programming using Iterative Multi-Agent Debugging with Large Language Models [8.7] 大言語モデル(LLM)を用いたプログラム合成は「ニアミス症候群」に苦しむ
我々は、SEIDR(Synthesize, Execute, Instruct, Debug and repair)と呼ばれるマルチエージェントフレームワークでこの問題に対処する。
代替に焦点を当てた、修復に焦点を当てた、ハイブリッドなデバッグ戦略を比較することで、これらのトレードオフを実証的に探求します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:56:51 GMT)
NeuroTree: Hierarchical Functional Brain Pathway Decoding for Mental Health Disorders [8.7] 我々は既存のfMRIベースのグラフ畳み込みネットワークの限界を克服するためにNeuroTreeを提案する。
NeuroTreeはk-hop AGE-GCNとニューラル常微分方程式(ODE)を統合して機能接続を最適化する。
我々の経験的評価は、NeuroTreeが2つの異なる精神障害データセットで最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:03:09 GMT)
SAUGE: Taming SAM for Uncertainty-Aligned Multi-Granularity Edge Detection [8.7] 我々は,セグメンテーションモデル(SAM)が,エッジラベルの不確実性をモデル化するための事前知識を提供することを明らかにした。
本モデルは,クロスデータセットエッジ検出のための強力な一般化性を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:43:15 GMT)
Two-stage Deep Denoising with Self-guided Noise Attention for Multimodal Medical Images [8.6] 本研究は,AI駆動の2段階学習戦略により,現代の認知的手法の限界に対処する。
提案手法はノイズ画像から残音を推定する。
ノイズアテンション機構を組み込んで、推定残音と雑音入力を相関させ、コース・トゥ・リファインディングでノイズアテンションを行う。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:26:47 GMT)
A Zero-shot Learning Method Based on Large Language Models for Multi-modal Knowledge Graph Embedding [8.6] 現在のアプリケーションは、しばしば、目に見えないカテゴリを含む新しい関係やエンティティを正確に推論し、扱いません。
ZL学習は、マルチモーダル知識グラフにおいて、目に見えないカテゴリの意味情報を効果的に伝達するという課題に直面している。
大規模言語モデルを用いたMMKGのゼロショット埋め込み学習のためのフレームワークZSLLMを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:38:21 GMT)
Solving Differential Equations with Constrained Learning [8.5] (部分微分方程式)は自然現象を記述するための基本的な道具であり、その解は科学や工学において不可欠である。
有限要素法のような従来の手法は信頼性の高い解を提供するが、その精度は計算集約的な微細メッシュの使用と結びついている。
本稿では,SCL(Science-Constrained Learning)フレームワークを開発することにより,これらの課題に対処する。
PDEの(弱い)解を見つけることは、最悪の損失を伴う制約付き学習問題の解決と等価であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:22:06 GMT)
TokenButler: Token Importance is Predictable [8.5] 大規模言語モデル(LLM)はトークン履歴を保存するためにキーバリューキャッシュ(KV)に依存しており、トークンの効率的な復号を可能にする。
以前の研究では、トークンの小さなサブセットのみが、各デコードステップに有意義に寄与することが示されている。
TokenButlerは、これらの重要なトークンを識別することを学ぶ、高粒度でクエリ対応の予測器である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:41:14 GMT)
CASC-AI: Consensus-aware Self-corrective Learning for Noise Cell Segmentation [8.5] 高解像度ギガピクセル全スライド画像における多クラス細胞セグメンテーションは様々な臨床応用に不可欠である。
近年の取り組みは、医療の専門知識を持たないレイアノテータを巻き込むことによって、このプロセスを民主化している。
本稿では,Consensus Matrixを利用して学習プロセスをガイドする,コンセンサス対応の自己修正型AIエージェントを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:58:06 GMT)
NukesFormers: Unpaired Hyperspectral Image Generation with Non-Uniform Domain Alignment [8.5] 本研究では,非ペアデータの幾何学的およびスペクトル的分布を整列するために,コントラッシブラーニングを導入する。
二重領域入力の周波数表現をマッピングし、ヌル空間を徹底的にマイニングする。
新たなベンチマークをUnHIGで確立している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:38:46 GMT)
Breaking Neural Network Scaling Laws with Modularity [8.5] 一般化に必要なトレーニングデータの量は、タスクの入力の内在的な次元によってどのように異なるかを示す。
そして、この利点を活かすために、モジュールネットワークのための新しい学習ルールを開発します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:21:57 GMT)
Score-informed Music Source Separation: Improving Synthetic-to-real Generalization in Classical Music [8.5] 音源分離は、楽器の混合物を構成トラックに分離する作業である。
本稿では,楽譜の分離を支援する2つの方法として,楽譜情報モデルと楽譜情報のみのモデルを提案する。
スコアインフォームドモデルは、ベースラインアプローチと比較して分離結果を改善するが、合成データから実データへの一般化に苦慮する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:08:31 GMT)
ConcreTizer: Model Inversion Attack via Occupancy Classification and Dispersion Control for 3D Point Cloud Restoration [8.4] 本研究は,3次元点雲シーンの復元を目的としたモデル逆転攻撃の詳細な研究である。
解析の結果,3次元点雲の特異性,空のボクセルと空のボクセルとのあいまいさが明らかになった。
我々は,voxelベースの3Dポイントクラウドデータに特化して設計された,シンプルで効果的なモデル逆転攻撃であるConcreTizerを紹介した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:05:36 GMT)
Conditional diffusions for neural posterior estimation [8.4] 本稿では,高容量要約ネットワークを併用した条件拡散の有効性を示す。
その結果,より単純で浅いモデルであっても,安定性の向上,精度の向上,トレーニング時間の短縮が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:15:09 GMT)
CAFusion: Controllable Anatomical Synthesis of Perirectal Lymph Nodes via SDF-guided Diffusion [8.3] 本稿では,直腸リンパ節合成の新しいアプローチであるCAFusionを紹介する。
符号付き距離関数(SDF)を利用することで、CAFusionは極めて現実的な3次元解剖構造を生成する。
実験結果から, 合成データはセグメンテーション性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:59:54 GMT)
Creating and Evaluating Privacy and Security Micro-Lessons for Elementary School Children [8.3] デジタルプライバシとセキュリティに関する話題について、小学生や中学生に限定的なカリキュラム資料が提供されている。
我々は、K--8の子供たちが学校でデジタルプライバシとセキュリティについて学ぶのを助けるために、一連のマイクロレスポンを開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:12:11 GMT)
A Practical Theory of Generalization in Selectivity Learning [8.3] クエリ駆動機械学習モデルは、クエリ選択のための有望な推定手法として登場した。
確率的近似(PAC)学習フレームワークに基づく最先端(SOTA)理論のギャップを埋める。
符号付き測度によって誘導される選択性予測器は学習可能であり,SOTA理論における確率測度への依存を緩和することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:47:18 GMT)
Beyond Full Poisoning: Effective Availability Attacks with Partial Perturbation [8.2] 本稿では,新たなアベイラビリティ攻撃手法を提案する。
マッチ攻撃(PMA)
PMAは、データの一部しか摂動できない場合に30%以上のパフォーマンス低下を引き起こすことができる最初のアベイラビリティ攻撃である。
4つのデータセットにわたる実験結果から、PMAが既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:27:37 GMT)
HDRT: A Large-Scale Dataset for Infrared-Guided HDR Imaging [8.2] 我々はHDRと熱赤外画像からなる最初の包括的データセットを紹介する。
HDRTデータセットは、8つの都市で6ヶ月にわたって3つのシーズンで5万枚の画像で構成されている。
我々は、赤外線とSDRコンテンツを融合してHDR画像を生成する新しいディープニューラルネットワークHDRTNetを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:17:16 GMT)
Multi-set variational quantum dynamics algorithm for simulating nonadiabatic dynamics on quantum computers [8.2] 複数の電子状態を含む非断熱力学に適したマルチセット変分量子力学アルゴリズム(MS-VQD)を提案する。
MS-VQDは従来のVQDと同じ精度で、PQCをはるかに浅めている。
特に、その優位性は電子状態の数によって増大し、複雑な分子系の非断熱量子力学をシミュレートするのに適している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:37:26 GMT)
Mitigating Hallucinations in YOLO-based Object Detection Models: A Revisit to Out-of-Distribution Detection [8.2] 本稿では,パフォーマンスボトルネックの原因を考察し,パフォーマンスを根本的に改善する手法を提案する。
検出対象にセマンティックに類似したOoDデータセットを慎重に合成する手法を開発することにより,全体の幻覚誤差を88%削減する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:42:41 GMT)
A Beam Search Based Parallel Algorithm for the Two-Dimensional Strip Packing Problem [8.2] 本稿では,ビームサーチを利用して2次元ストリップパッキング問題に対処する並列アルゴリズムであるBSPAを紹介する。
さらなる研究を容易にするため、コードとデータセットの両方が公開されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:20:45 GMT)
A Tight Regret Analysis of Non-Parametric Repeated Contextual Brokerage [8.0] 本稿では, 繰り返しブローカー問題の文脈バージョンについて検討する。
各インタラクションにおいて、アイテムのプライベートバリュエーションを持つ2人のトレーダーは、学習者の提案するブローカー価格に基づいて、いくつかのコンテキスト情報によって通知される購入または販売を求めます。
ブローカーの目標は、トレーダーの純益(トレーダーの評価額分布の完全な知識を持つ神託と比較して、後悔を最小限に抑えることでトレーダーの利益としても知られる)を最大化することである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:17:55 GMT)
Multi-Modal 3D Mesh Reconstruction from Images and Text [7.9] 少ない入力画像から3Dメッシュを再構成する言語誘導型少数ショット3D再構成法を提案する。
テクスチャとテクスチャの精度と品質の観点から,本手法の評価を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:18:17 GMT)
Understanding the Learning Dynamics of LoRA: A Gradient Flow Perspective on Low-Rank Adaptation in Matrix Factorization [7.9] 我々は、勾配流(GF)下での行列分解のためのローランド適応(LoRA)の学習ダイナミクスを解析する。
解析の結果,最終誤差は,事前学習されたモデルの特異空間と対象行列との間の不整合によって影響を受けることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:57:10 GMT)
Slow is Fast! Dissecting Ethereum's Slow Liquidity Drain Scams [7.8] 分散型金融(DeFi)の脅威である緩やかな流動性ドレイン(SLID)詐欺を特定する。
本研究では,2018年以降の6大取引所(DEX)における319,166の流動性プールの大規模解析を行った。
我々は3,117個のSLIDが影響を受けた流動性プールを同定し,累積損失は1億3300万ドル以上となった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:01:22 GMT)
Sublinear Algorithms for Wasserstein and Total Variation Distances: Applications to Fairness and Privacy Auditing [7.8] 本稿では,ガウス分布のPDFとCDFを推定する汎用アルゴリズムフレームワークを提案する。
サブ線形空間W.r.t.を必要とするサンプルのストリームから, 分布のマージ可能な要約を計算する。
これにより、サンプルがストリームや複数のソースから到着している間に、Wasserstein と Total Variation (TV) の距離を2つの準ガウス距離で推定することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:57:48 GMT)
Cross-Lingual IPA Contrastive Learning for Zero-Shot NER [7.8] IPA文字起こしにおける音素表現のギャップを減らすことで、高ソース言語で訓練されたモデルが低リソース言語で効果的に実行できるかを検討する。
提案手法は,最高性能のベースラインと比較して,実質的な平均ゲインを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:52:33 GMT)
PTMs-TSCIL Pre-Trained Models Based Class-Incremental Learning [7.8] 時系列データのためのクラスインクリメンタルラーニング(CIL)は、新たな知識獲得のための破滅的な忘れと可塑性に対する安定性のバランスをとる上で、課題に直面している。
PTMを用いた時系列クラスインクリメンタルラーニング(TSCIL)の第1回研究について紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:27:21 GMT)
Decision-Dependent Stochastic Optimization: The Role of Distribution Dynamics [7.7] 動的分布の適応と形成を両立させることで最適な意思決定を実現するオンラインアルゴリズムを開発した。
提案手法の最適性および一般化性能について,本手法が分散力学のキャラクタリゼーションをいかに促進するかを実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:39:57 GMT)
Unlocking Generalization for Robotics via Modularity and Scale [7.7] 本論文は,汎用ロボット制御のための大規模学習とモジュール性を統合することで,汎用ロボットエージェント構築の課題に取り組むことを目的とする。
私たちの重要な洞察は、エージェントに階層構造と低レベルの制御を学習させるのではなく、計画を通じてモジュール化を強制できるということです。
スケールするには、膨大な量の多様なデータ、データに適合する表現力のあるアーキテクチャ、データを生成するための監視源が必要です。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:38:31 GMT)
Recovery of Quantum Correlations using Machine Learning [7.6] 我々はLong Short-Term Memory (LSTM) を用いて量子系の散乱による有害な影響を軽減する。
我々の装置では、高温のルビジウム蒸気の4波混合により2モードの励起光を生成し、1つのモードが散乱器によって量子相関を乱す。
我々は,光子損失が大きいにもかかわらず,74.7%の相互情報の回復と87.7%の2モードのスクイージングの回復を実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:52:42 GMT)
Actual Causation and Nondeterministic Causal Models [7.6] 非決定論的因果モデルによって提供される表現力の増大を利用して、実際の因果関係の新たな定義を提供する。
新規ではあるが、結果として得られた定義は、私の以前の定義とほぼ同一の評定に達する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:53:47 GMT)
Byzantine Distributed Function Computation [7.5] 分散関数計算問題を$k$のユーザで検討し、少なくとも$s$は敵によって制御される可能性がある。
ユーザーが正直に振る舞うと、その機能は高い確率で回収される。
逆向きに振る舞うと、関数は驚くほど小さな歪みで復元される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:59:49 GMT)
Semi-Supervised Medical Image Segmentation via Knowledge Mining from Large Models [7.5] 本研究では,小規模でローカルにホストされたディープラーニングモデルの性能向上を目的とした戦略的知識マイニング手法を提案する。
我々は、限定ラベル付きデータセット上でU-Net++モデルをトレーニングし、未ラベル画像に推論されたSAMの出力をプロンプトに変換することで、その能力を拡張した。
提案手法は,ベースラインの U-Net++ モデルに対して,Dice のセグメント化性能を 3% と 1% に向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:43:45 GMT)
A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications [7.4] 本稿では,ゲーティング機能,エキスパートネットワーク,ルーティング機構,トレーニング戦略,システム設計など,MoEの基本設計を紹介する。
次に,継続学習,メタ学習,マルチタスク学習,強化学習など,機械学習の重要なパラダイムにおけるMoEのアルゴリズム設計について検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:08:55 GMT)
TVNet: A Novel Time Series Analysis Method Based on Dynamic Convolution and 3D-Variation [7.3] 本稿では, パッチ間, パッチ内, 可変次元を考慮した新しい時系列再構成手法を提案する。
本稿では3次元視点を利用して時系列解析を行う動的畳み込みネットワークTVNetを提案する。
TVNetはCNNの計算効率を保ち、5つの主要な時系列解析タスクにおいて最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:30:55 GMT)
Automated Benchmark Generation for Repository-Level Coding Tasks [7.3] SetUpAgentは、歴史的に正確な依存性の設定、テスト実行、結果解析が可能な完全に自動化されたシステムである。
i)SWEE-Benchは数百のリポジトリを含むSWE-Benchの拡張バージョンで、ii)SWA-Benchはライブラリではなくアプリケーションに焦点を当てたベンチマークです。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:42:49 GMT)
Generative method for aerodynamic optimization based on classifier-free guided denoising diffusion probabilistic model [7.2] 逆設計アプローチは、指定された性能目標を満たすために、ニューラルネットワークモデルによる最適空力形状を直接生成する。
本論文では,CDDPMモデルに基づく翼内逆設計手法を革新的に提案する。
現在の最先端のワッサースタイン生成敵ネットワーク法と比較すると、CDDPMは翼生成タスクにおいて33.6%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:42:26 GMT)
FUIA: Model Inversion Attack against Federated Unlearning [7.2] 本稿では,フェデレーション・アンラーニング・インバージョン・アタック(FUIA)を提案する。
FUIAは三種類のFU(サンプルアンラーニング、クライアントアンラーニング、クラスアンラーニング)に特化して設計されている。
忘れられたデータのプライバシーを著しく漏洩させ、あらゆる種類のFUをターゲットにすることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:58:44 GMT)
RefactorBench: Evaluating Stateful Reasoning in Language Agents Through Code [7.2] RefactorBenchは、人気のあるオープンソースリポジトリで100の大規模な手作りのマルチファイルタスクからなるベンチマークである。
ベースラインは、現在のLMエージェントが単純な構成タスクで苦労していることを明らかにし、ベース命令で22%のタスクしか解決していない。
状態表現の条件にベースラインエージェントを適用することにより、RefactorBenchタスクの解決において43.9%の改善が達成される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:23:24 GMT)
SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements [7.1] RAWオブジェクト検出のための軽量かつ効果的なアプローチであるSimRODを提案する。
学習可能なグローバルガンマ変換を4つのパラメータで適用可能なグローバルガンマ拡張(GGE)モジュールを提案する。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:23:14 GMT)
Fourier Head: Helping Large Language Models Learn Complex Probability Distributions [7.1] フーリエ級数を用いて構築されたニューラルネットワーク層を導入し,出力がより連続的な構造であれば,任意の線形層に置換することができる。
我々は,大規模な意思決定や時系列予測タスクと同様に,合成データセットの広範な分析を行う。
提案したフーリエヘッドは,基礎となるデータ分布が自然な連続構造を持つシナリオにおいて有効である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:59:12 GMT)
TANGO: A Robust Qubit Mapping Algorithm via Two-Stage Search and Bidirectional Look [7.1] 現在の量子デバイスには完全な量子ビット接続がないため、量子デバイス上で論理回路を直接実行することは困難である。
本稿では,マップされたノードとアンマップされたノードの両方におけるキュービットマッピングの影響のバランスをとるTANGOアルゴリズムを提案する。
このアルゴリズムは,様々なベンチマークや量子デバイスにおいて,ゲート数と回路深さの多目的共最適化を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:44:16 GMT)
Complete the Cycle: Reachability Types with Expressive Cyclic References [7.0] Reachability Types (RT) は、関数型および高階型プログラミングにおけるエイリアスと分離を追跡するための資格型システムである。
これまでのRTシステムは、周期依存を制限する計算に基づいており、終端であることが示されている。
RTを表現的循環参照型で拡張し、ストアを通して循環依存の形成を可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:42:02 GMT)
Enhanced Multi-Tuple Extraction for Alloys: Integrating Pointer Networks and Augmented Attention [6.9] 本稿では,MatSciBERTに基づく抽出モデルとポインタとアロケーションモデルを組み合わせた新しいフレームワークを提案する。
抽出実験では,データセット間のF1スコアが0.947,0.93,0.753であった。
これらの結果は、正確で構造化された情報を提供するためのモデルの能力を強調します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:39:06 GMT)
ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution [6.9] ClimDetectは、目標の気候変動指標変数と組み合わせた1日当たりの1.17万の気候スナップショットからなる標準化データセットである。
このデータセットは、CMIP6気候モデルシミュレーションと実世界の観測アシミュレートされた再分析データセットの両方から算出される。
私たちはまた、気候変動検出タスクのためにこれまで試みられていない新しいアプローチである、気候変動データへのビジョントランスフォーマー(ViT)の適用についても検討しています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:45:11 GMT)
Practitioners Perspective on Motivators of Agile in Global Software Development [6.9] この研究は、ヨーロッパのソフトウェア産業におけるアジャイルベースのGSDの実行に肯定的な影響を与えるモチベーターを実証的に研究します。
定量的調査が行われ、アジャイルとGSDベースのプロジェクトに取り組んでいる139人の実践者のデータが収集された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:50:14 GMT)
Divide and Conquer Self-Supervised Learning for High-Content Imaging [6.9] Split Component Embedding Registration (SpliCER) は、イメージをセクションに分割し、各セクションから情報を消耗して、よりシンプルで複雑な機能を学ぶためにモデルをガイドする新しいアーキテクチャである。
SpliCERは表現学習のための強力な新しいツールを提供しており、モデルが他のメソッドで見過ごされる可能性のある複雑な機能を明らかにすることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:24:36 GMT)
XMutant: XAI-based Fuzzing for Deep Learning Systems [6.9] XMutantは、説明可能な人工知能(XAI)技術を利用して、挑戦的なテスト入力を生成するテクニックである。
実験の結果,XMutantは入力の最も影響の大きい部分に着目し,より効率的かつ効率的なテスト生成を可能にすることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:05:49 GMT)
From Centralized to Decentralized Federated Learning: Theoretical Insights, Privacy Preservation, and Robustness Challenges [6.8] フェデレートラーニング(FL)は、個人の生データを直接共有することなく、協調学習を可能にする。
FLは、集中型(サーバベース)または分散型(ピアツーピア)の方法で実装することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:27:40 GMT)
LBM: Latent Bridge Matching for Fast Image-to-Image Translation [6.8] 遅延ブリッジマッチング(LBM)は、高速な画像から画像への変換を実現するために、遅延空間におけるブリッジマッチングに依存する新しい、汎用的でスケーラブルな手法である。
提案手法は,1つの推論ステップのみを用いて,様々な画像・画像タスクの最先端結果に到達可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:03:07 GMT)
eMoE: Task-aware Memory Efficient Mixture-of-Experts-Based (MoE) Model Inference [6.6] 大規模言語モデル(LLM)のためのメモリ効率の良い推論システムeMoEを提案する。
eMoEは、専門家ルーティングの繰り返しパターンに基づいて、必要な専門家のみを予測およびロードすることで、メモリ使用量を削減する。
また、処理のプロンプトが40倍長くなり、バッチが4.5倍大きくなり、スループットが1.5倍向上する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:11:52 GMT)
Availability-aware Sensor Fusion via Unified Canonical Space for 4D Radar, LiDAR, and Camera [6.6] 本稿では,ASF (Availability-Aware Sensor fusion) を提案する。UCP (Unified Canonical projection) を用いて,パッチ(CASAP) に沿ったセンサ間の融合とクロスアテンションを実現する。
提案したASFは,各種気象条件およびセンサ劣化(または故障)条件下での既存の最先端核融合法よりも優れた物体検出性能を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:10:28 GMT)
Rule-Based Conflict-Free Decision Framework in Swarm Confrontation [6.6] 本稿では,確率的有限状態マシン,深層畳み込みネットワーク,強化学習を統合した新しい意思決定フレームワークを提案する。
我々のフレームワークは、状態マシンの不安定性とJoDの問題を克服し、Swarmの対決における信頼性と適応性を確保します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:00:01 GMT)
Quantum-based Variational Approach for Solving Graph Isomorphism Problems [6.6] グラフ同型問題はコンピュータ科学における根本的な課題である。
本研究では,量子技術の原理を統合し,グラフ同型問題に対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:03:22 GMT)
Public space security management using digital twin technologies [6.5] 本研究では,リアルタイムシミュレーションとデータ駆動型セキュリティ管理におけるDigital Twinsの価値を強調した。
提案手法は,公共空間におけるスマートセキュリティソリューションの継続的な開発に寄与する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:21:17 GMT)
Towards Fully-Automated Materials Discovery via Large-Scale Synthesis Dataset and Expert-Level LLM-as-a-Judge [6.5] 本研究は,実践的でデータ駆動型資源を提供することで,材料科学コミュニティを支援することを目的としている。
オープンアクセス文献から17Kのエキスパートが検証した合成レシピの包括的データセットを収集した。
AlchemicalBenchは、合成予測に適用された大規模言語モデルの研究をサポートするエンドツーエンドフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:00:39 GMT)
Decentralized Online Learning for Random Inverse Problems Over Graphs [6.4] ヒルベルト空間におけるアルゴリズムの安定性の収束性は、$_$-bounded martingale difference 項で表される。
ネットワークグラフが連結され、フォワード演算子の列が励起条件の無限次元時間持続性を満たすなら、全てのノードの推定は平均平方である。
非定常オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:19:41 GMT)
Enhancing Time Series Forecasting via Logic-Inspired Regularization [6.4] トークン依存性の有効性は,予測シナリオによって異なることがわかった。
本稿では、より少ないがより効果的な依存関係を使用するためのプラグイン・アンド・プレイ方式である注意論理正規化(Attn-L-Reg)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:44:11 GMT)
Efficient Resource Management for Secure and Low-Latency O-RAN Communication [6.4] Open Radio Access Networks (O-RAN) は、中央集権的なアーキテクチャから分散アーキテクチャに移行することで、通信を変革している。
O-RANのクラウドベースのアーキテクチャへの依存と可観測性の向上は、セキュリティとリソース管理の課題をもたらす。
資源管理の効率化は,資源制約環境下でのO-RANのセキュアかつ信頼性の高い通信に不可欠である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:03:48 GMT)
Personalized Code Readability Assessment: Are We There Yet? [6.4] 以前の作業では、コードの可読性を自動的に評価するアプローチを定義していた。
本稿では,コードの可読性について,開発者の認識する主観的な評価がどの程度可能かを理解することを目的とする。
しかし,提案手法は,スニペットレベルでの動作を訓練した,最先端の機能ベースモデルよりも悪い結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:37:15 GMT)
MetaphorShare: A Dynamic Collaborative Repository of Open Metaphor Datasets [6.4] MetaphorShareはメタファデータセットを統合するウェブサイトで、オープンでアクセスしやすい。
Webサイトには、アップロード、ダウンロード、検索、ラベルメタファーの4つの主要な機能がある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:09:20 GMT)
Posterior SBC: Simulation-Based Calibration Checking Conditional on Data [6.4] シミュレーションベースのキャリブレーションチェック(SBC)は、生成モデルからシミュレーションされたデータに対する反復推論による推論アルゴリズムとモデル実装の検証を指す。
本稿では,後部SBCを提案するとともに,観測データに対する推論条件の検証に有効であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:16:16 GMT)
Research and Design on Intelligent Recognition of Unordered Targets for Robots Based on Reinforcement Learning [6.4] 本研究では,強化学習を用いたAIに基づく知的ロボットの標的認識手法を提案する。
強化されたターゲットイメージは、トレーニングのための深層強化学習モデルに入力され、最終的にはAIベースのインテリジェントロボットが、混乱したターゲットを効率的に認識できるようにする。
実験結果から,提案手法は目標画像の品質を向上するだけでなく,AIをベースとした知能ロボットが,高効率かつ精度で障害対象の認識タスクを完了できることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:53:22 GMT)
M3TR: A Generalist Model for Real-World HD Map Completion [6.3] 実地図の変更についての研究は、HDマップの全ての部分が変化せず、前もって使用することができることを示している。
我々は、オフラインのHDマッププリエンプションと非オフラインのHDマッププリエンプションの両方に対する一般的なアプローチであるM3TRを紹介する。
以前のHDマップ要素を完全に活用し、クエリ設計を最適化することで、M3TRは既存のメソッドを+4.3 mAPで上回っている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:24:00 GMT)
Neural Radiance and Gaze Fields for Visual Attention Modeling in 3D Environments [6.3] 我々は3次元シーンにおける視覚的注意パターンを表現するための新しいアプローチとしてニューラルレージアンスとゲイズフィールド(NeRGs)を紹介した。
本システムでは,予めトレーニングしたニューラルレージアンスフィールド(NeRF)を用いて3次元シーンの2次元ビューを描画し,任意の観測位置の視線場を可視化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:18:42 GMT)
Tracking the variation of entanglement Rényi negativity: a quantum Monte Carlo study [6.2] エンタングルメントエントロピーは、量子モンテカルロによる純基底状態の位相と臨界を解析するための強力なツールである。
本稿では,リウェイトアニーリングフレームワーク内で実装し易いQMC手法を提案する。
この方法はスケーラブルで並列化可能であり、高次元および大規模シミュレーションに適している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:27:30 GMT)
ReLATE: Resilient Learner Selection for Multivariate Time-Series Classification Against Adversarial Attacks [6.2] 本稿では,データセットの類似性に基づいた頑健な学習者を特定するフレームワークReLATEを紹介する。
ReLATEは、よく知られた敵攻撃シナリオにおいて、複数のディープラーニングモデルを維持している。
計算オーバーヘッドを平均81.2%削減し、対向レジリエンスを高め、堅牢なモデル選択を合理化している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:55:50 GMT)
A Constraint-Preserving Neural Network Approach for Solving Mean-Field Games Equilibrium [6.2] ニューラルネットワークに基づく手法は,高次元平均フィールドゲーム(MFG)平衡の解法に有効であることを示す。
本稿では、FBSDEとそれに伴うMFG平衡の固定点定式化を解決するためにニューラルネットワークを統合するネットワークアプローチであるNF-MKV Netを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:42:09 GMT)
A Comprehensive Survey on Magnetic Resonance Image Reconstruction [6.2] 近年,深層学習に基づくMRIの再建が著しい進歩を遂げている。
しかし、MRIの再建は未だ完全には解決されていない難しい問題である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:20:53 GMT)
Efficient Perspective-Correct 3D Gaussian Splatting Using Hybrid Transparency [6.1] 3D Gaussian (3DGS)は、リバースレンダリングとリアルタイムなシーン探索の両方のために、多用途レンダリングプリミティブを証明している。
最近の研究は多視点コヒーレンスを損なうアーティファクトを緩和し始めており、その中には不整合な透明性ソートや2Dスプラットの視点修正アウトラインによるアーティファクトのポップアップが含まれていた。
本研究では, リアルタイムフレームレートを維持するために, 高精度なブレンディング, ハイブリッド透明性の高精度な近似を用いて, 完全視点補正された3次元ガウスアンを最大コヒーレンスを達成することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:05:12 GMT)
Keeping Representation Similarity in Finetuning for Medical Image Analysis [6.1] 大規模自然画像に事前訓練された基礎モデルは、微調整によって医療画像解析に適応するために広く利用されている。
本稿では、事前訓練された表現と微調整された表現との距離を最小化する新しい微調整手法RepSimを提案する。
競合精度を維持しながら表現類似性を30%以上改善し、5つの医用画像分類データセットにおいてシャープネスを42%削減する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:44:37 GMT)
Federated Multimodal Learning with Dual Adapters and Selective Pruning for Communication and Computational Efficiency [6.1] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間の協調学習を可能にする。
本稿では,これらの課題に対処するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:21:33 GMT)
Are We There Yet? A Measurement Study of Efficiency for LLM Applications on Mobile Devices [5.9] 小型の大規模言語モデル(LLM)は、大きなモデルに比べて品質に制限があるにもかかわらず、強力なモバイルデバイス上で正常に動作することができる。
小型のLDMだけが強力なモバイルデバイス上で正常に動作するが、大型のモデルに比べて品質に制限がある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:27:17 GMT)
A Systematic Comparison of Syntactic Representations of Dependency Parsing [5.8] 我々は、普遍的な依存ツリーバンクで観測される特定の構文構造を、より標準的な表現に変換することを提案する。
本研究は,標準構文が体系的に解析性能の向上に繋がることはなく,言語によってスコアが大きく異なることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:13:55 GMT)
Encoding Argumentation Frameworks to Propositional Logic Systems [5.7] 本稿では,異なる命題論理系における論理式として$AF$sを符号化することで,符号化法を一般化する。
議論意味論(Dung's classical semantics)やガベイの方程式意味論(Gabbay's equational semantics)など)によって、AFのモデル間の関係を研究する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:06:58 GMT)
Reducing Friction in Cloud Migration of Services [5.7] 大規模な製品開発組織は、大企業のマイクロサービスベースの製品デプロイメントをパブリッククラウドプロバイダに移行することを検討する。
我々は、製品がプライベートからパブリッククラウド環境に移行する際に、デプロイコストがどのように変わるのか、なぜ変化するのかを理解するために、探索的なシングルケーススタディを実施しました。
デプロイ間でリソースを共有する場合であっても、カスタマチップのパブリッククラウドプロバイダに切り替えることによって、コストが最大50%増加することが分かりました。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:47:27 GMT)
Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition [5.7] 海中マルチシーン認識は知的海洋ロボットの能力向上に不可欠である。
MLLM(Multimodal Large Language Model)により生成された画像データ、テキスト記述、分類ベクトルを統合する。
我々のモデルは98$%の精度を達成し、以前のSOTAモデルを3.5$%の精度で上回っている。
この研究は、リアルタイムな海洋環境認識のための高性能なソリューションを提供し、リソース制限された環境での環境モニタリングと災害対応を自律表面車両(ASV)がサポートできるようにする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:47:38 GMT)
Revisiting Noise in Natural Language Processing for Computational Social Science [5.6] この論文は、計算社会科学におけるノイズは本質的に有害か役に立たないという概念に挑戦する。
むしろ、ある種のノイズは、CSS研究を進める上で貴重な有意義な情報をエンコードできると主張している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:42:42 GMT)
Simultaneous Decoding of Classical Coset Codes over $3-$User Quantum Interference Channel : New Achievable Rate Regions [5.6] 量子干渉チャネル(QIC)を用いた古典情報通信の問題点について検討する。
古典量子容量領域に3ドル(約3,300円)のQICを新たに導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:36:53 GMT)
SCANIA Component X Dataset: A Real-World Multivariate Time Series Dataset for Predictive Maintenance [5.6] 本稿では,SCANIAトラック群をまたいだ1つの匿名化エンジンコンポーネント(Component X)から収集した実世界の多変量時系列データセットを紹介する。
データセットには、オペレーショナルデータ、リカバリレコード、コンポーネントXに関する仕様が含まれ、匿名化による機密性を維持している。
分類、回帰、生存分析、異常検出など、幅広い機械学習アプリケーションに適している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:12:04 GMT)
Inversion-Free Video Style Transfer with Trajectory Reset Attention Control and Content-Style Bridging [5.5] 我々は,高品質なスタイル転送を可能にする新しい手法であるTRAC(Trajectory Reset Attention Control)を導入する。
TRACは、遅延軌跡をリセットし、注意制御を強制することにより、コンテントの一貫性を高める。
画像とビデオの両方の転送に対して,安定的でフレキシブルで効率的なソリューションを提供する,チューニング不要なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:18:43 GMT)
The Majority Vote Paradigm Shift: When Popular Meets Optimal [5.4] マジョリティ投票(Majority Vote、MV)は、投票数が最も多いクラスラベルを選択する。
本稿では,MVがラベル推定誤差に基づいて理論的に最適な下界を実現する条件を特徴付ける。
この最適性の証明は、ラベルアグリゲーションのためのモデル選択により原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:53:28 GMT)
Building English ASR model with regional language support [5.3] 本稿では,ヒンディー語クエリを効果的に処理できる英語自動音声認識(ASR)システムを提案する。
本稿では,言語間の共有層と言語固有の投影層を自己認識機構で組み合わせた新しい音響モデル(AM)を提案する。
その結果,ヒンディー語と英語のテストセットに対する単語誤り率の69.3%と5.7%の相対的な低下が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:48:51 GMT)
Find your Needle: Small Object Image Retrieval via Multi-Object Attention Optimization [5.2] 本研究では,小物体画像検索(SoIR)の課題に対処する。その目的は,特定の小物体を含む画像を,散らばったシーンで検索することである。
主な課題は、画像内のすべてのオブジェクトを効果的に表現する、スケーラブルで効率的な検索のための単一のイメージ記述子を構築することである。
専用多目的事前学習フェーズを組み込んだ新しい検索フレームワークであるMaO(Multi-object Attention Optimization)を導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:27:02 GMT)
PER-DPP Sampling Framework and Its Application in Path Planning [5.2] 意思決定中心の強化学習フレームワークは、高度な制御システム研究で注目されている。
本研究では,強化学習体験再生機構におけるサンプル問題に対する方法論的改善を提案する。
多様性評価にDPP(Determinant Point Process)を導入することにより、適応的な選択プロトコルを備えた二重基準サンプリングフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:58:16 GMT)
Processing and Decoding Rydberg Decay Error with MBQC [5.2] 本稿では,測定に基づく量子計算において,ライドバーグの減衰誤差を管理する新しい手法を提案する。
我々は、トポロジカルクラスタ状態の固有構造と最終リーク検出情報を利用して、Rydbergの崩壊誤差から伝播誤差を見つける。
以上の結果から,本手法の短期プラットフォームへの応用の可能性が明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:18:25 GMT)
Gradient-Guided Annealing for Domain Generalization [5.1] ドメインの一般化効率を向上させるため,GGAアルゴリズムを提案する。
GGAの有効性は、広く受け入れられ、困難な画像分類領域の一般化ベンチマークで評価される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:50:14 GMT)
Runtime Detection of Adversarial Attacks in AI Accelerators Using Performance Counters [5.1] 本稿では,AIハードウェアの悪意ある使用に対する保護のための新しいフレームワークである佐村井を提案する。
Samurai氏は、AIモデルの動的振る舞いを追跡するAI Performance Counter(APC)を紹介している。
APCは、異なるAI操作の低レベルのハードウェアイベントのランタイムプロファイルを記録する。
APCが記録した要約情報は、TANTOによって処理され、潜在的なセキュリティ違反を効率的に識別する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:38:42 GMT)
Josephson traveling-wave parametric amplifier based on low-intrinsic-loss coplanar lumped-element waveguide [5.1] 本稿では、低損失コプラナーラム素子導波路アーキテクチャに基づくJTWPA(Josephson Travel-wave Parametric GC)を提案する。
オープンスタブコンデンサとマンハッタンパターンジャンクションを用いることで、1dB以下で最大12GHzの挿入損失が得られる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:28:59 GMT)
Motion-Guided Dual-Camera Tracker for Endoscope Tracking and Motion Analysis in a Mechanical Gastric Simulator [5.1] 運動誘導型デュアルカメラ・ビジョン・トラッカーは内視鏡先端の3次元位置の頑健かつ正確な追跡を実現するために提案される。
提案したトラッカーは、最先端のビジョントラッカーに対して優れた性能を示し、平均誤差と最大誤差において、第2ベット法に対して42%と72%の改善を達成している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:30:06 GMT)
Towards Spatial Transcriptomics-guided Pathological Image Recognition with Batch-Agnostic Encoder [5.0] 複数の患者においてSTの遺伝子発現から一貫した信号を抽出できるバッチ非依存型コントラスト学習フレームワークを提案する。
実験では、公開データセット上でのフレームワークの有効性を実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:50:33 GMT)
A Multimodal Benchmark Dataset and Model for Crop Disease Diagnosis [5.0] 本稿では,農学研究の分野を開拓するための先駆的資源である作物病領域マルチモーダルデータセットについて紹介する。
このデータセットは、さまざまな作物の病気の画像13万7000枚と、幅広い農業知識にまたがる100万の質問と回答のペアで構成されている。
我々は,最先端のマルチモーダルモデルを微調整し,作物病診断の大幅な改善を示すことにより,データセットの有用性を実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:37:42 GMT)
Personalized Convolutional Dictionary Learning of Physiological Time Series [5.0] ローカル辞書がローカル情報をパーソナライズしたグローバル辞書としてモデル化するPerCDLを提案する。
この変換は学習可能であり、時間のワープや回転といった操作を組み合わせることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:27:21 GMT)
Synthetic Lung X-ray Generation through Cross-Attention and Affinity Transformation [5.0] 本稿では,合成肺X線画像から高精度なセマンティックマスクの自動生成手法を提案する。
テキストと画像間の相互アテンションマッピングを使用して、テキスト駆動画像合成をセマンティックマスク生成に拡張する。
実験結果から,本手法を用いて生成した合成データに基づいて学習したセグメンテーションモデルは,実際のデータセットで学習したモデルと同等であり,場合によっては同等であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:48:26 GMT)
Identifying the Truth of Global Model: A Generic Solution to Defend Against Byzantine and Backdoor Attacks in Federated Learning (full version) [5.0] フェデレートラーニング(FL)は、複数のパーティが生のトレーニングデータを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
悪意のあるクライアントは、Byzantineまたはバックドア攻撃を介してエラーモデルのアップデートを注入することで、トレーニングされたモデルに影響を与えることができる。
本稿では,FLにおけるモデル中毒に対する防御策として,FedTruthを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:37:26 GMT)
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition [4.9] 有限水平マルコフ決定過程(MDPs)に対するオンラインQ-ラーニングのための2つの重要なアルゴリズムのギャップ依存境界について検討する。
本稿では, UCB-Advantage と Q-EarlySettled-Advantage のギャップ依存的再帰境界を, 対数的に$T$で証明する新しい誤り分解フレームワークを開発する。
また, UCB-Advantage の政策切替コストのギャップ依存境界を確立し, 最悪の MDP でそれを改善する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:04:21 GMT)
Federated Q-Learning with Reference-Advantage Decomposition: Almost Optimal Regret and Logarithmic Communication Cost [4.9] 本稿では,FedQ-Advantageと呼ばれる新しいモデルフリーなフェデレーションQ-ラーニングアルゴリズムを提案する。
我々のアルゴリズムは対数通信コストを低くするだけでなく、時間的地平線が十分に大きい場合と比較して、対数係数に縛られた情報とほぼ直線的後悔のスピードアップに到達して、ほぼ最適の後悔を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:01:21 GMT)
Capture Global Feature Statistics for One-Shot Federated Learning [4.9] 従来のフェデレートラーニング(FL)では、サーバとクライアント間の多数の通信が必要になります。
ワンショットFLは、単一の通信ラウンドを通じてグローバルサーバモデルのトレーニングを可能にすることで、上記の欠点を克服するための魅力的な学習パラダイムになっています。
本稿では,フェデレート学習アルゴリズムであるFedCGSを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:20:39 GMT)
VizTrust: A Visual Analytics Tool for Capturing User Trust Dynamics in Human-AI Communication [4.8] VizTrustはリアルタイムのビジュアル分析ツールで、人間とエージェントのコミュニケーションにおけるユーザの信頼のダイナミクスをキャプチャする。
ステークホルダーは信頼の形成を観測し、信頼開発におけるパターンを特定し、信頼に影響を与える特定の相互作用要素を特定できる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:00:41 GMT)
SHAP-Integrated Convolutional Diagnostic Networks for Feature-Selective Medical Analysis [4.8] 本研究では,限られたデータセットを対象とした解釈可能な特徴選択手法であるSHAP統合畳み込み診断ネットワーク(SICDN)を紹介する。
SICDNモデルは、肺炎と乳癌のデータセットを使用して分類タスクでテストされ、97%以上の精度を示し、4つの人気のあるCNNモデルを上回った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:48:35 GMT)
Analysis of Learning-based Offshore Wind Power Prediction Models with Various Feature Combinations [4.8] 本稿ではメキシコ湾沿岸域における沖合風力予測における各種機械学習モデルの有効性について検討する。
出力特性として風速を用いることで、出力として風力を使用する場合と比較して予測精度が約10%向上する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:28:24 GMT)
AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.8] AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。
AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:41:05 GMT)
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools [4.8] MITOは、多種多様な日常オブジェクトの最初のミリ波(mmWave)データセットである。
我々は、RGB-D画像、セグメンテーションマスク、生のmmWave信号だけでなく、550個の高分解能mmWave画像をライン・オブ・ザ・ライト・オブ・ザ・ライト(NLOS)で生成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:38:55 GMT)
A Simple Approach to Constraint-Aware Imitation Learning with Application to Autonomous Racing [4.8] 模倣学習(IL)に安全性を組み込むための簡単なアプローチを提案する。
我々は、フルステートとイメージの両方のフィードバックで、自律的なレースタスクに対する我々のアプローチを実証的に検証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:16 GMT)
AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements [4.7] AthletePose3Dは、高速で高速な運動運動をキャプチャするために設計された、新しいデータセットである。
本研究では,SOTA (State-of-the-art monocular 2D and 3D pose Estimation model on the dataset。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:16:02 GMT)
Automatic Curriculum Design for Zero-Shot Human-AI Coordination [4.6] ゼロショットヒューマンAIコーディネーション(ゼロショットヒューマンAIコーディネーション)とは、人間データを使わずに人間と協調するエゴエージェントのトレーニングである。
ゼロショット人間-AI協調設定のためのユーティリティ関数とコプレーヤサンプリングを提案する。
提案手法は,他のベースラインモデルよりも優れており,目に見えない環境での人間とAIの協調性能が高い。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:55:31 GMT)
Trustworthy Machine Learning via Memorization and the Granular Long-Tail: A Survey on Interactions, Tradeoffs, and Beyond [4.6] 我々は、信頼に値する機械学習(ML)に関する既存の研究と記憶の役割について調査する。
私たちは3段階のロングテールの粒度(クラス不均衡、非定型性、ノイズ)を定式化し、現在のフレームワークがこれらのレベルをどう悪用しているかを明らかにします。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:20:29 GMT)
Fair Text Classification via Transferable Representations [4.6] グループフェアネスはテキスト分類における中心的な研究テーマであり、センシティブなグループ間で公平な扱いを受けることはオープンな課題である。
本稿では、未バイアスのニューラルテキスト分類器を学習するためのWasserstein Dependency Measureの使用を拡大するアプローチを提案する。
ドメイン適応(Domain Adaptation)は、処理するデータセットのセンシティブな属性にアクセスする必要をなくすために、効率的に活用できることを示します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:52:45 GMT)
KSOD: Knowledge Supplement for LLMs On Demand [4.5] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著な機能を示すが、ドメイン固有のタスクではエラーを発生させる。
KSODは,知識に基づく微調整によるLLMの能力向上を支援する新しいフレームワークである。
知識ベースSFTによるLCMの能力向上の可能性について検討した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:17:41 GMT)
Multi-Objective Routing Optimization Using Coherent Ising Machine in Wireless Multihop Networks [4.5] Coherent Ising Machines (CIM) は、無線ネットワークにおける多目的ルーティング最適化のための量子インスパイアされたアルゴリズムである。
CIMは、トポロジ固有の調整を必要とせずに、多様なネットワークトポロジにわたって強力なスケーラビリティを示す。
その結果、CIMは数百のノードと数千のエッジを含むネットワークに対して、実現可能でほぼ最適のソリューションを提供することがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:59:50 GMT)
Fully Unsupervised Annotation of C. Elegans [4.5] キーポイント特徴のガウス分布を仮定できる問題に適用可能な,教師なしマルチグラフマッチングのための新しい手法を提案する。
サイクル一貫性を自己教師付き学習の損失として活用し,ベイズ最適化を用いてガウスパラメータを決定する。
線虫C。線虫C. elegansの3D顕微鏡画像における細胞核のアノテートのための最先端の制御手法の精度に到達することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:03:18 GMT)
Competing LLM Agents in a Non-Cooperative Game of Opinion Polarisation [4.4] 我々は、意見の形成と抵抗を分析するために、新しい非協調ゲームを導入する。
我々のシミュレーションでは、人口に影響を与えるために競合するLarge Language Model (LLM) エージェントが特徴的である。
このフレームワークは、リソースの最適化をエージェントの意思決定プロセスに統合する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:14:41 GMT)
Online estimation of the inverse of the Hessian for stochastic optimization with application to universal stochastic Newton algorithms [4.4] 本稿では,期待値として記述された凸関数の最小値推定のための2次最適化について述べる。
Robbins-Monro 法を用いて逆 Hessian 行列の直接帰納的推定手法を提案する。
とりわけ、普遍的なニュートン法を開発し、提案手法の効率性を調べることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:10:45 GMT)
When narrower is better: the narrow width limit of Bayesian parallel branching neural networks [4.4] 狭い幅制限におけるBPB-NNの性能は、一般にバイアス制限シナリオにおける幅制限よりも優れているか、あるいは同等である。
本結果は,並列分岐ネットワークにおいて,新たに定義された狭帯域方式を特徴付けるものである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:00:49 GMT)
AttenST: A Training-Free Attention-Driven Style Transfer Framework with Pre-Trained Diffusion Models [4.4] AttenSTは、トレーニング不要の注意駆動型スタイル転送フレームワークである。
本稿では,参照スタイルに自己注意を条件付ける,スタイル誘導型自己注意機構を提案する。
また、コンテンツやスタイルの特徴を融合するための二重機能横断機構も導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:28:36 GMT)
KL-geodesics flow matching with a novel sampling scheme [4.3] 非自己回帰型言語モデルは全てのトークンを同時に生成し、従来の自己回帰型モデルよりも潜在的に高速である。
テキスト生成のための条件付きフローマッチング手法について検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:58:19 GMT)
Convergence of the Chambolle-Pock Algorithm in the Absence of Monotonicity [4.3] Chambolle-Pockアルゴリズム(CPA)は、大規模な凸構造問題の解法の成功により、過去10年間で人気を博している。
この研究は、関連する原始双対作用素上のいわゆる弱ミント条件によって定量化される、(非)単調性の異なる問題に対する収束解析を拡張した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:45:25 GMT)
Your Assumed DAG is Wrong and Here's How To Deal With It [4.3] 本稿では,因果グラフの集合上の因果クエリのバウンダリを提供する,効率的な勾配に基づく最適化手法を提案する。
当社のアプローチは,DAGが間違っていると仮定した場合の有効な批判に対して,使いやすく,広く適用可能な反論を提供することを目的としています。」
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:00:28 GMT)
Extracting Information in a Low-resource Setting: Case Study on Bioinformatics Workflows [4.2] 16のエンティティをアノテートした52の新たなコーパスであるBioToFlowを使用して、SciBERTベースのNERモデルは、アノテータ間の合意に匹敵する70.4F尺度を達成した。
バイオインフォマティクスのための高性能情報抽出が実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:00:23 GMT)
RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations [4.2] RS2V-Lは道路センサ観測から車載LiDARデータを再構成・合成するための新しいフレームワークである。
我々の知る限りでは、道路沿いのセンサー入力から車載LiDARデータを再構築する最初のアプローチである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:08:05 GMT)
DatawiseAgent: A Notebook-Centric LLM Agent Framework for Automated Data Science [4.1] DatawiseAgentはノートブック中心のエージェントフレームワークで、ユーザ、エージェント、計算環境間のインタラクションを統合する。
DSFライクな計画、インクリメンタルな実行、自己老化、ポストフィルタの4つのステージを編成する。
一貫して、複数のモデル設定で最先端のメソッドを上回るか、マッチする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:32:33 GMT)
Machine learning of the Ising model on a spherical Fibonacci lattice [4.1] 球面上のイジングモデルについて検討し,フィボナッチ格子を用いて一様被覆を近似した。
我々はモンテカルロシミュレーションとグラフ畳み込みネットワーク(GCN)を用いて、様々な温度でスピン配置を研究する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:06:14 GMT)
Simulating Influence Dynamics with LLM Agents [4.1] 本稿では、ソーシャルネットワーク内での競合する影響をモデル化するために、意見力学研究者向けに設計されたシミュレータを提案する。
このツールは、確立された意見力学の原理を最先端のLCMと統合することにより、影響伝播と反情報戦略の研究を可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:05:21 GMT)
From Text to Visuals: Using LLMs to Generate Math Diagrams with Vector Graphics [4.0] 大規模言語モデル(LLM)は、教師と学生の両方のサポートを自動化することで、数学教育を強化する新しい可能性を提供する。
LLMを使ってスケーラブルベクトルグラフ(SVG)を生成する最近の研究は、図作成を自動化するための有望なアプローチを示している。
本稿では,(1)問題解のヒントを自動的に生成し,それらの品質を評価する方法,(2)SVGが数学図の効果的な中間表現であるかどうか,(3)正確なSVGベースの図を生成するためには,LSMがどのような戦略や形式を必要とするのか,という3つの研究課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:13:38 GMT)
Beyond Discretization: Learning the Optimal Solution Path [4.0] 本稿では,解経路を基底関数の集合でパラメータ化し,エンフィングル最適化問題を解く手法を提案する。
我々の手法は、離散化よりも相当に複雑化している。
また、機械学習に共通する特殊なケースに対して、より強力な結果を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:31:50 GMT)
Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions [4.0] 本稿では,フレームレベルの字幕から得られる包括的情報を戦略的に活用するナレーション・ザ・ビデオ(NarVid)を提案する。
提案したNarVidは,ナレーションを複数の方法で活用する。1)ナレーションとビデオ間の相互モーダルな相互作用による機能強化,2)無関係あるいは不正な情報を抑制するためのクエリ対応適応フィルタリング,3)クエリ-動画類似度とクエリ-ナレーション類似度を付加したデュアルモーダルマッチングスコア。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:28:45 GMT)
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs [4.0] 量子ニューラルネットワーク(QNN)は、モデルサイズと計算コストを削減するための有望なソリューションとして登場した。
本研究は, 量子化モデルにおいて, 逆パッチは高い転送性を有することを示す。
本稿では,QADT-R(Quantization-Aware Defense Training with Randomization)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:43:36 GMT)
Distributionally Robust Statistical Verification with Imprecise Neural Networks [3.9] AI安全性における特に困難な問題は、高次元自律システムの振る舞いを保証することだ。
本稿では,確率の概念を用いた不確実性定量化に基づく新しい手法を提案する。
提案手法は高次元システムに対して有用かつスケーラブルな保証を提供できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:10:08 GMT)
Time delay of mean field interaction in thermal Rydberg atomic gas [3.9] 平均場理論は、熱いリドベルク原子アンサンブルにおける非平衡力学の研究に一般的に用いられる。
平均場相互作用の蓄積における時間遅延効果を実験的に観察し,衝突イオン化の鍵となる役割を明らかにする。
本研究は, 熱リドバーグガスの非平衡力学におけるイオン化過程の寄与を示唆する証拠となる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:28:50 GMT)
Joint Explainability-Performance Optimization With Surrogate Models for AI-Driven Edge Services [3.9] 本稿では,複雑なAIモデルの予測精度と代理モデルによる近似とのバランスについて検討する。
我々は,多目的最適化(MOO)に基づく新しいアルゴリズムを導入し,複雑なモデルの予測誤差と,その出力とサロゲートの誤差を同時に最小化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:04:09 GMT)
Decision-aware training of spatiotemporal forecasting models to select a top K subset of sites for intervention [3.8] 最高の到達率(BPR)と呼ばれるパフォーマンス指標は、モデルの推奨サイズのKサブセットを使用する影響を測定する。
本研究では,各地点における事象数を予測する確率モデルを用いて,各地点を数値的にランク付けする方法を示す。
我々は、オピオイドに関連する致命的な過剰摂取を公衆衛生のために軽減し、絶滅危惧種の野生生物を監視するという、2つの場所から場所へのアプローチを実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:25:16 GMT)
Temporal Reversal Regularization for Spiking Neural Networks: Hybrid Spatio-Temporal Invariance for Generalization [3.8] スパイキングニューラルネットワーク(SNN)は、超低消費電力コンピューティングパラダイムとして広く注目を集めている。
近年の研究では、SNNは過度なオーバーフィッティングに悩まされ、一般化性能が制限されていることが示されている。
トレーニング中のオーバーフィッティングを緩和し,SNNの一般化を容易にするため, 簡易かつ効果的な時間逆正則化を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:30:52 GMT)
Learning and Evaluating Hierarchical Feature Representations [3.8] 我々は、直交部分空間の階層的構成(Hier-COS)という新しい枠組みを提案する。
Hier-COSは、与えられた分類木の構造と整合した設計により、深い特徴埋め込みをベクトル空間にマッピングすることを学ぶ。
Hier-COSはすべてのデータセットにまたがって最先端の階層的パフォーマンスを実現し,同時に1つのケースを除いてトップ1の精度を上回ります。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:59:41 GMT)
CIMAGE: Exploiting the Conditional Independence in Masked Graph Auto-encoders [3.7] 条件付き独立性(CI)は本質的に最小冗長性と最大関連基準を満たすが、その適用は通常下流ラベルへのアクセスを必要とする。
CIMAGEは、条件付き独立を利用して、潜伏空間における効果的なマスキング戦略を導出する新しいアプローチである。
我々の理論解析は,CIMAGEの新しいCI対応マスキング手法の優位性をさらに裏付けるものである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:59:27 GMT)
Enabling AI Scientists to Recognize Innovation: A Domain-Agnostic Algorithm for Assessing Novelty [3.7] 相対近傍密度(Relative Neighbor density)は、研究思想における新規性評価のための領域に依存しないアルゴリズムである。
RNDは、コンピュータ科学と生物医学研究領域における最先端のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:21:15 GMT)
Utilizing Jailbreak Probability to Attack and Safeguard Multimodal LLMs [3.7] 入力のジェイルブレイクポテンシャルを定量化するためにジェイルブレイク確率を導入し、この入力によってMLLMが悪意ある応答を発生させる可能性を示す。
具体的には,Jailbreak-Probability-based Attack (JPA)を提案する。
また,攻撃対策として,Jailbreak-Probability-based FinetuningJPFとJailbreak-Probability-based Defensive Noiseを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:10:38 GMT)
A Task and Motion Planning Framework Using Iteratively Deepened AND/OR Graph Networks [3.6] 本稿では,AND/ORグラフネットワークに基づくタスクと動作計画の統合手法を提案する。
タスク・アンド・モーション・プランニング問題(TAMP)の異なるクラスの実装に活用する。
このアプローチは、シミュレーションと実際のデュアルアームロボットマニピュレータ、すなわちRethink RoboticsのBaxterで評価され、検証されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:28:22 GMT)
ASTRA: A Negotiation Agent with Adaptive and Strategic Reasoning through Action in Dynamic Offer Optimization [3.6] 交渉は自己利益と協力を動的にバランスさせ、自身の効用を最大化する。
ターンレベルのオファリング最適化のための新しいフレームワークであるASTRAをベースとした,原則駆動型ネゴシエーションエージェントを提案する。
ASTRAは,(1)対向行動の解釈,(2)線形プログラミング(LP)ソルバによる対向者最適化,(3)交渉方略とパートナーの受理確率に基づくオファーの選択の3段階からなる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:57:50 GMT)
Analysis of 3D Urticaceae Pollen Classification Using Deep Learning Models [3.5] 本稿では,3次元画像のスタック全体を分類に利用し,異なるディープラーニングモデルを用いて分類性能を評価することを目的とする。
本論文で用いた3D画像データセットは,キク科,特にキク科のものである。
事前訓練されたResNet3Dモデルは最適な層選択と拡張エポックを使用して、98.3%のF1スコアで最高の性能を達成した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:07:04 GMT)
Can Generative Geospatial Diffusion Models Excel as Discriminative Geospatial Foundation Models? [3.5] SatDiFuserは拡散に基づく地理空間基盤モデルを識別的RSのための強力な事前学習ツールに変換するフレームワークである。
リモートセンシングベンチマークの実験では、SatDiFuserは最先端のGFMよりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:15:51 GMT)
Entanglement distribution over metropolitan fiber using on-chip broadband polarization entangled photon source [3.5] シリコンオン絶縁体(SOI)プラットフォームを用いたオンチップ広帯域シリコンナノワイヤ双光子偏光源を用いた30km大都市圏での絡み合い分布を報告する。
我々の結果は、量子技術のスケーラブルで実用的なプラットフォームとしてのシリコンフォトニック技術の可能性を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:31:10 GMT)
Goal Conditioned Reinforcement Learning for Photo Finishing Tuning [3.5] フォトフィニッシュチューニングは、Adobe LightroomやDarktableのような、写真フィニッシュパイプラインのマニュアルチューニングプロセスを自動化することを目的としている。
本稿では,ゴールイメージを条件としてパラメータを効率的にチューニングする,新しい目標条件強化学習フレームワークを提案する。
本手法の利点を実証するため,写真仕上げチューニングと写真スタイル化チューニングタスクについて詳細な実験を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:20:59 GMT)
A LongFormer-Based Framework for Accurate and Efficient Medical Text Summarization [3.5] 本稿では,LongFormerに基づく医用テキスト要約手法を提案する。
従来の要約法は短期記憶によって制限されることが多い。
LongFormerはテキスト内の長距離依存関係を効果的にキャプチャし、より重要な情報を保持する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:33:45 GMT)
Text-IRSTD: Leveraging Semantic Text to Promote Infrared Small Target Detection in Complex Scenes [3.4] 我々は,テキストIRSTDと呼ばれる赤外線小ターゲット検出のためのセマンティックテキストを活用した新しいアプローチを提案する。
テキストと画像間の情報融合を容易にするために, プログレッシブ・モーダル・セマンティック・インタラクション・デコーダ (PCSID) を提案する。
さらに,FZDTと呼ばれるファジィセマンティックテキストアノテーションを用いて,異なるシナリオの2,755個の赤外線画像からなる新しいベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:33:07 GMT)
SANDRO: a Robust Solver with a Splitting Strategy for Point Cloud Registration [3.4] ポイントクラウドの登録は、特にナビゲーション分野において、コンピュータとロボティクスにおいて重要な問題である。
現行の手法は、高い降圧率に直面したり、収束するのに長い時間を要する場合、しばしば失敗する。
本稿では,ポイントクラウド登録のための新しい戦略を紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:47 GMT)
Are GNNs Actually Effective for Multimodal Fault Diagnosis in Microservice Systems? [3.4] グラフニューラルネットワーク(GNN)は、サービス依存をモデル化する能力に基づいて、マイクロサービスシステムの障害診断に広く採用されている。
GNNの真の価値を分離するために,意図的に最小限のトポロジーに依存しないベースラインであるDiagMLPを提案する。
DiagMLPは, 故障検出, 局所化, 分類において, 最先端のGNN方式と同等の性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:51:12 GMT)
Automatic Test-Case Reduction in Proof Assistants: A Case Study in Coq [3.4] 我々は、最小限のファイルとスタンドアロンのファイルでバグの振る舞いを再現するツールであるCoq Bug Minimizerを紹介する。
私たちのツールは、CoqのリバースCI障害を自動的にトリガーするために、Coqbotと統合されています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:58:36 GMT)
What do Large Language Models Say About Animals? Investigating Risks of Animal Harm in Generated Text [3.3] 大型言語モデル(LLM)における動物害リスクの新しい評価である動物害評価(AHA)を提案する。
私たちのデータセットはRedditのポストタイトルから1,850のキュレートされた質問と、50の動物カテゴリーと50の倫理的シナリオに基づいて2500の合成質問で構成されています。
AHAはフロンティアLSMに適用すると有意義な評価結果が得られる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:02:59 GMT)
The Impact of Generative AI Coding Assistants on Developers Who Are Visually Impaired [3.3] 我々は、視覚障害のある開発者が、生成型AIコーディングアシスタントを使用して一連のプログラミングタスクを完了した研究を行った。
参加者はAIアシスタントが有益であることに気付き、重要なアドバンテージを報告したが、アクセシビリティの課題も強調した。
我々の発見は、活動中心の設計原則を生成型AIアシスタントに適用する必要性を強調した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:06:43 GMT)
COMODO: Cross-Modal Video-to-IMU Distillation for Efficient Egocentric Human Activity Recognition [3.3] ビデオモダリティからIMUモダリティへのリッチな意味的知識をラベル付きアノテーションを必要とせずに伝達するクロスモーダルな自己教師型蒸留フレームワークであるCOMODOを提案する。
我々のアプローチは、IMUエンコーダが実世界のアプリケーションのためにその効率を保ちながら、ビデオからリッチなセマンティック情報を継承することを可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:43:51 GMT)
Personalized Generative Low-light Image Denoising and Enhancement [3.2] 本稿では,異なるユーザ向けにカスタマイズされた拡散モデルを構築することにより,個人化生成デノベーション(PGD)を提案する。
私たちの中心となるイノベーションは、ギャラリーから人物の物理的属性を抽出するアイデンティティ一貫性のある物理バッファです。
幅広い低照度テストシナリオにおいて、PGDは優れた画像復調性能と高精細化性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:25:25 GMT)
ECNN: A Low-complex, Adjustable CNN for Industrial Pump Monitoring Using Vibration Data [3.2] 本稿では,産業用ポンプの故障を予測するための新しい拡張畳み込みニューラルネットワーク(ECNN)を提案する。
提案アルゴリズムは, 正規データサンプルの小さなセットで決定できるポンプ固有パラメータを特徴とする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:49:37 GMT)
cantnlp@DravidianLangTech-2025: A Bag-of-Sounds Approach to Multimodal Hate Speech Detection [3.2] 変換メル分光法を用いて音声(音声)データに基づいてヘイトスピーチ検出システムを訓練する。
本研究は,マルチモーダルヘイトスピーチ検出システムの開発において,テキストと音声(オーディオ)データの両方を使用することが可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:21:13 GMT)
A Unified View of Optimal Kernel Hypothesis Testing [3.2] 本稿では,MDD の2サンプル,HSIC 独立性,KSD に適したフレームワーク間の最適なカーネル仮説テストの統一的な視点を提供する。
カーネルの最適分離率と$L2$のメトリクスを2つの適応的なカーネル選択法で示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:06:40 GMT)
High-accuracy disposable micro-optical anti-counterfeiting labels based on single-molecule quantum coherence [3.2] 単一分子量子コヒーレンス(SMQC)に基づく使い捨てマイクロ光学反偽造ラベルへの革新的アプローチを導入する。
本発明の方法は、アンチカウンセリング情報ラベルとして用いられる単一の分子によるアンチカウンセリングの編集および読取を容易にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:38:32 GMT)
Certificate Games and Consequences for the Classical Adversary Bound [3.1] 証明ゲームの4つのバージョン、すなわち、プライベートコイン、パブリックコイン、共有エンタングルメント、および非署名ゲームについて検討する。
量子測度は古典的クエリモデルと量子的クエリモデルの間に興味深い、そして驚くべき違いを明らかにしている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:14:40 GMT)
Balancing optimism and pessimism in offline-to-online learning [3.1] 我々は、有限武装の盗賊問題に焦点をあて、オフラインからオフラインの学習環境と呼ぶものについて考察する。
オフラインからオフラインの学習では、学習者は未知の環境とのインタラクションから収集されたオフラインデータから始める。
我々の新しいアルゴリズムは、どの時点でもLCBやUPBよりも性能が良いことを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:30:27 GMT)
SIC: Similarity-Based Interpretable Image Classification with Neural Networks [3.0] SICは、意思決定プロセスのローカルおよびグローバルな説明を提供するニューラルネットワークである。
SICは,Stanford DogsとFunnyBirdsのきめ細かい分類,Pascal VOCの多ラベル分類,RSNAデータセットの病理診断の3つのタスクで評価した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:36:39 GMT)
SegResMamba: An Efficient Architecture for 3D Medical Image Segmentation [3.0] 本稿では,SegResMambaという医用画像の効率的な3次元分割モデルを提案する。
我々のモデルは、他の最先端(SOTA)アーキテクチャと比較して、トレーニング中に半分未満のメモリを使用します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:40:28 GMT)
An Information-Theoretic Approach to Identifying Formulaic Clusters in Textual Data [3.0] フォーミュラテキストは繰り返しと制約された表現によって特徴づけられ、自己情報の変動性が低い傾向にある。
本研究の目的は,反復句,構文構造,スタイルマーカーを解析することにより,定式的クラスタを同定することである。
重み付き自己情報分布を利用してテキスト中の構造化パターンを検出する情報理論アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:24:46 GMT)
Harnessing Increased Client Participation with Cohort-Parallel Federated Learning [3.0] Federated Learning(FL)は、ノードがグローバルモデルを協調的にトレーニングする機械学習アプローチである。
本研究では,ネットワークを小さなパーティション,あるいはコホートに分割することで,クライアント更新の有効性を高める。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:38:37 GMT)
CaRtGS: Computational Alignment for Real-Time Gaussian Splatting SLAM [2.9] リアルタイムガウス切削SLAM(CaRtGS)の計算アライメントについて紹介する。
CaRtGSは、リアルタイム環境における光リアルなシーン再構築の効率性と品質を向上させる新しい手法である。
本手法は適応戦略によりガウススティングSLAM(GS-SLAM)の計算ミスアライメントに対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:15:03 GMT)
Conformal Prediction: A Data Perspective [2.9] コンフォーマル予測(CP)はブラックボックスモデルに対して有効な予測推測を提供する。
現代のデータサイエンスは、データとモデルの複雑さの増加とともに、従来のCPメソッドに挑戦する。
本調査では,データ中心の観点からCPの基礎概念と最近の進歩を概観する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:48:15 GMT)
Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru [2.9] 基礎的視覚言語モデル(VLM)と運転時の人間(Humans in Driving)の類似性を示す。
その結果,アライメントの程度は,システムの種類によって大きく異なることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:50:04 GMT)
Probing Entanglement Scaling Across a Quantum Phase Transition on a Quantum Computer [2.9] 強相関量子物質の研究は、次元と複雑な絡み合い構造のために困難である。
完全結合型イオン量子コンピュータ上でのサブシステムトモグラフィーのホログラフィー手法を実装した。
サブシステムエンタングルメントエントロピーの臨界度における対数法則のスケーリングを初めて実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:53:35 GMT)
Efficient Distributed Learning over Decentralized Networks with Convoluted Support Vector Machine [2.7] 本稿では,分散ネットワーク上での高次元データを効率的に分類する問題に対処する。
我々は、ペナル化SVMを解くために、乗算器の効率的な一般化交互方向法(ADMM)を開発した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:31:26 GMT)
How Well Can Differential Privacy Be Audited in One Run? [2.7] 1回の監査で達成可能な最大効果を特徴付ける。
我々は、個々のデータ要素の影響を分離できる構造を持つアルゴリズムの真のプライバシパラメータを、ワンラン監査で完全に発見できることを示します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:32:30 GMT)
Robustness of Vacancy-Bound Non-Abelian Anyons in the Kitaev Model in a Magnetic Field [2.6] 量子スピン液体(QSL)における非アベリア素粒子の探索は、フォールトトレラント量子計算の進歩に不可欠である。
ここでは、スピン空孔における非アベリア素粒子の安定化に対するこのアプローチが、適切なゼーマン項で表される有限磁場にどのように拡張するかを検討する。
両方の場合において、場の包含はエノン結合を弱めるが、有限体挙動に顕著な違いがあることが分かる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:01 GMT)
DynTaskMAS: A Dynamic Task Graph-driven Framework for Asynchronous and Parallel LLM-based Multi-Agent Systems [2.6] 本稿では,マルチエージェントシステムにおける非同期および並列操作をオーケストレーションする新しいフレームワークであるDynTaskMASを紹介する。
1) 論理的依存関係を維持しながら複雑なタスクを分解する動的タスクグラフ生成装置,(2) 効率的なタスクスケジューリングによるリソース利用を最適化する非同期並列実行エンジン,(3) エージェント間の効率的な情報共有を可能にするセマンティック・アウェア・コンテキスト管理システムである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:16:10 GMT)
Effect of Selection Format on LLM Performance [2.6] 弾頭点と平易な英語がモデル性能に与える影響を比較した。
以上の結果から,通常,弾丸点による提示がより良い結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:11:58 GMT)
Identifying Non-Replicable Social Science Studies with Language Models [2.6] オープンソース (Llama 3 8B, Qwen 2 7B, Mistral 7B) とプロプライエタリ (GPT-4o) 命令調整 LLM の複製可能と非複製可能の区別能力について検討した。
LLMを用いて、行動研究から反応の合成サンプルを生成し、測定結果が元の結果を支持するかどうかを推定する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:48:05 GMT)
Exploring Multimodal Perception in Large Language Models Through Perceptual Strength Ratings [2.5] 本研究は, GPT-3.5, GPT-4o, GPT-4o, GPT-4o-miniを比較し, 接地および言語的推論に対するマルチモーダル入力の影響を強調した。
GPT-4 と GPT-4o は、人間による評価と、より小さなモデルに対する顕著な進歩を示す。
GPT-4oはGPT-4よりも優れた接地率を示しなかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:52:35 GMT)
Strategies for political-statement segmentation and labelling in unstructured text [2.5] MARPORプロジェクトの参加者によって、バイステートメントな政治的スタンスラベルを持つマニフェストの大規模なコーパスが作成されている。
本稿では,テキストデータから文を共同で分割・分類することのできる,統一された分割・ラベルのフレームワークを提案し,検証する。
本手法は,政治宣言の原文に適用した場合,競争精度が向上することを示し,英国庶民院の記録に応用することで,その研究可能性を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:56:06 GMT)
Differentially Private Continual Release of Histograms and Related Queries [2.5] 我々は、$T$行の更新を行う宇宙からのエントリを持つ$d$次元テーブルの列和をプライベートにリリースすることを研究する。
我々のメカニズムは、大量のクエリと入力ストリームに対する既存のメカニズムよりも、より優れた付加的な$ell_infty$-errorを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:40:22 GMT)
Human Machine Co-Adaptation Model and Its Convergence Analysis [2.5] ロボットによるリハビリテーションの鍵は、患者と機械の両方のニーズに応えなければならないヒューマン・マシン・インタフェースの設計にある。
本稿では,協調適応マルコフ決定過程(CAMDP)モデルに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:36:36 GMT)
Contextual Cues in Machine Translation: Investigating the Potential of Multi-Source Input Strategies in LLMs and NMT Systems [2.5] 我々は,大規模言語モデルであるGPT-4oと,従来の多言語ニューラルマシン翻訳(NMT)システムとの比較を行った。
中間言語翻訳を文脈的手がかりとして、ポルトガル語への英語と中国語の翻訳を強化する効果を評価する。
その結果、文脈情報はドメイン固有のデータセットの翻訳品質を著しく改善し、言語学的に離れた言語ペアにとって潜在的に有益であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:23:44 GMT)
From Limited Labels to Open Domains: An Efficient Learning Paradigm for UAV-view Geo-Localization [2.5] 従来のUAV-view Geo-Localization(UVGL)管理パラダイムは、正のサンプル選択のためのペアデータへの厳格な依存によって制約される。
クロスドメイン不変知識伝達ネットワーク(CDIKTNet)を提案する。
本手法は,完全教師付き条件下での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:46:43 GMT)
Materials Map Integrating Experimental and Computational Data through Graph-Based Machine Learning for Enhanced Materials Discovery [2.5] 材料情報学(MI)は、材料発見と開発を大幅に効率化することが期待されている。
MIに使用されるデータは、計算と実験の両方から得られる。
本研究では,得られたデータを用いて材料マップを構築し,材料の構造的特徴との関係を可視化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:31:34 GMT)
Learning Partial Graph Matching via Optimal Partial Transport [2.4] 最適部分移動にインスパイアされた部分グラフマッチングのための新しいフレームワークを提案する。
提案手法は, 偏りを取り入れつつ部分的代入を可能にする目的を定式化したものである。
我々の手法は,3次最悪のケースタイムの複雑さの中で,効率的かつ正確な解が得られる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:26:34 GMT)
A Secure Blockchain-Assisted Framework for Real-Time Maritime Environmental Compliance Monitoring [2.4] 本稿では,リアルタイム環境コンプライアンス監視のためのセキュアなブロックチェーン支援フレームワークを提案する。
IoTと船上センサーをブロックチェーン技術に統合することにより、このフレームワークは環境データの不変かつ透過的な記録を保証する。
スマートコントラクトはコンプライアンス検証を自動化し、非準拠の場合には関連当局に通知する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:38:34 GMT)
HalluVerse25: Fine-grained Multilingual Benchmark Dataset for LLM Hallucinations [2.4] 英語,アラビア語,トルコ語で微粒な幻覚を分類する多言語データセットであるHaluVerse25を紹介する。
我々のデータセット構築パイプラインは、LLMを使用して幻覚を実際の伝記文に注入し、続いて厳密な人間のアノテーションプロセスでデータ品質を保証します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:24:07 GMT)
NimbleReg: A light-weight deep-learning framework for diffeomorphic image registration [2.4] ディープラーニングは画像登録に革命をもたらしたが、ほとんどの方法はグリッド化された表現に依存している。
複数領域の解剖学的領域の表面表現を利用した回折像登録のための軽量なフレームワークを提案する。
提案手法は,イメージを消費する最先端のDLベース登録技術に匹敵するアライメントを実現することを実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:43:44 GMT)
On the Minimum Distances of Finite-Length Lifted Product Quantum LDPC Codes [2.3] 本稿では, 有限長QLDPC符号設計基準に着目し, 縮退した準循環対称昇降積 (LP-QLDPC) 符号の構築を目的とする。
設計したLP-QLDPC符号は、最小重量安定器発生器よりも厳密な距離を持つことが保証される必要条件について述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:38:30 GMT)
Linear Contracts in Multitasking: Robustness, Uniformity, and Learning [2.3] 線形契約の特殊クラスを, 堅牢性, 均一性, 学習の3つの視点から検討する。
オフライン環境で最適契約パラメータを推定したり、オンライン環境で最適契約を学習したりするためのインストゥルメンタル回帰手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:55:43 GMT)
Roamify: Designing and Evaluating an LLM Based Google Chrome Extension for Personalised Itinerary Planning [2.3] Roamifyは、旅行計画のプロセスを簡単にするためのAIによる旅行アシスタントだ。
我々は、LlamaやT5のような複数の大規模言語モデルをテスト、使用して、ユーザの好みに応じてパーソナライズされたイテレーションを生成しました。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:14:57 GMT)
Experimental observation of non-Markovian quantum exceptional points [2.3] 本稿では、ジョセフソン接合型量子ビットを漏洩電磁共振器に結合させることにより、非マルコフ量子例外点(EP)の最初の実験例を示す。
我々は、量子ビットと擬モードの量子状態の進化を観察することで、拡張されたリウヴィリア超作用素のスペクトルをマッピングする。
この結果は,非マルコフ量子EPに関するエキゾチック現象の実験的探索の道を開くものである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:40:40 GMT)
Benchmarking Self-Supervised Methods for Accelerated MRI Reconstruction [2.3] 高アンサンプ測定からMRIを再構築することは、医療画像の高速化に不可欠である。
教師付きディープラーニングアプローチは目覚ましい成功を収めてきたが、完全にサンプル化された真実データに依存している。
本研究は,すべてのフィードフォワード自己監督法から得られた損失関数の総合的レビューと,基礎的真実を伴わない高速MRI再構成に関する最初のベンチマークを提示する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:34:20 GMT)
Event-Driven Implementation of a Physical Reservoir Computing Framework for superficial EMG-based Gesture Recognition [2.2] 本稿では,表面筋電図(SEMG)データをイベント駆動方式で抽出することで,ジェスチャー認識のための新しいニューロモーフィックな実装手法を提案する。
このネットワークは、スパイキングニューラルネットワーク(SNN)の領域内で、回転ニューロン貯水池(Rotating Neuron Reservoir, RNR)と呼ばれる単純な構造化およびハードウェアフレンドリな物理貯留層コンピューティングフレームワークを実装して設計された。
提案システムはオープンアクセス型大規模sEMGデータベースで検証され,平均分類精度は74.6%,80.3%であった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:18:14 GMT)
On the Byzantine Fault Tolerance of signSGD with Majority Vote [2.2] 多数決のSignSGDのような符号ベースの圧縮アルゴリズムは、SGDの軽量な代替手段を提供する。
我々は,シグナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズナズ
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:46:52 GMT)
Discrete Gaussian Process Representations for Optimising UAV-based Precision Weed Mapping [2.1] 本研究では,UAVを用いた雑草マッピングのための5つの離散化手法を比較した。
実世界の雑草分布の評価は、視覚的類似性、平均二乗誤差(MSE)、計算効率を測定する。
結果から、クワッドツリーは全体的なパフォーマンスが最も優れていますが、特定のシナリオでは代替手段が優れています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:50:15 GMT)
The Files are in the Computer: Copyright, Memorization, and Generative AI [2.1] ニューヨーク・タイムズのOpenAIとマイクロソフトに対する著作権訴訟は、OpenAIのGPTモデルがNYTの記事を「記憶している」と主張している。
これらの議論は「記憶」の性質に関する曖昧さによって曇っている。
我々は、記憶の正確な定義を提供するために、技術的な文献を描きます。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:10:16 GMT)
QKD-KEM: Hybrid QKD Integration into TLS with OpenSSL Providers [2.1] 本稿では,2つの異なる統合アプローチを用いたハイブリッドQKD-KEMプロトコルを提案する。
ETSI 004と014仕様の両方と互換性のあるクライアント初期フローと、サーバ初期フローは既存の作業と似ているが、ステートレスなETSI 014 APIに限定されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:24:38 GMT)
MIRAM: Masked Image Reconstruction Across Multiple Scales for Breast Lesion Risk Prediction [2.0] Masked Image Modeling (MIM) はより強力なSSL技術として登場した。
本稿では,より困難なプリテキストタスクを中心に,スケーラブルで実用的なSSLアプローチを提案する。
我々の仮説は、高解像度画像の再構成により、より微細な空間的詳細に対応することができるというものである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:32:55 GMT)
CATPlan: Loss-based Collision Prediction in End-to-End Autonomous Driving [2.0] 本稿では,エンド・ツー・エンドの自動運転システムによって予測される計画軌道の不確実性を推定する。
我々はCATPlanと呼ばれる新しい軽量モジュールを導入し、動作をデコードし、エンド・ツー・エンドのADシステムを部分的に監視するために使用される衝突損失の推定に埋め込みを計画する。
我々は、CATPlanを安全クリティカルでナーフベースのクローズドループベンチマークであるNeuroNCAPで評価し、GMMベースのベースラインの平均精度に対して54.8%の相対的な改善で衝突を検出することに成功した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:10:40 GMT)
Application of Multiple Chain-of-Thought in Contrastive Reasoning for Implicit Sentiment Analysis [1.9] 暗黙の感情分析は、微妙に表現された感情を明らかにすることを目的としており、曖昧さと比喩的な言語によってしばしば隠蔽される。
本稿では、暗黙の感情分析の性能を高めるために、新しい2元逆連鎖推論フレームワークを提案する。
また、ランダム仮説の限界に対処する三重逆連鎖推論フレームワークも導入する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:10:50 GMT)
An Experience Report on Regression-Free Repair of Deep Neural Network Model [1.9] ディープニューラルネットワーク(DNN)に基づくシステムは、業界でますます利用されている。
本稿では,業界におけるDNN更新の要件を特定し,その要件を満たす技術を用いたケーススタディを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:00:43 GMT)
A Deep Learning Architecture for Land Cover Mapping Using Spatio-Temporal Sentinel-1 Features [1.9] この研究は、アマゾン、アフリカ、シベリアの3つの異なる地域に焦点を当て、これらの地域の様々なエコリージョンにおけるモデルパフォーマンスを評価する。
その結果,訓練データに制限のある地域においても,総合的精度(O.A.)の達成における提案手法の有効性と能力が示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:15:35 GMT)
A Semantic Link Network Model for Supporting Traceability of Logistics on Blockchain [1.9] 本稿ではセマンティックリンクネットワークモデルに基づくロジスティックなプロセスを表現する意味データモデルを提案する。
状態表現モデルは、意味的リンクによるロジスティック輸送の状態を表現するように設計されている。
セマンティックリンクからブロックチェーントランザクションへのマッピングは、セマンティックリンクのスキーマとセマンティックリンクの状態がブロックチェーントランザクションにパブリッシュできるように設計されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:56:00 GMT)
Revisiting Point Cloud Completion: Are We Ready For The Real-World? [1.9] 制約のある、困難な、制御されていない、マルチセンサーの現実世界設定で取得されるポイントクラウドは、ノイズ、不完全、不均一にスパースである。
現在のベンチマークオブジェクトポイントクラウドは、現実的な環境でキャプチャされたポイントクラウドの重要な部分である豊富なトポロジ的特徴を欠いていることを実証する。
本稿では,0次元PH前駆体が3次元骨格の形で完全形状の大域的位相を抽出し,位相的に一貫した完全形状を生成するモデルを支援する方法について述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:03:43 GMT)
Onion Routing Key Distribution for QKDN [1.9] 量子コンピューティングの進歩は、古典暗号に重大な脅威をもたらす。
量子暗号とポスト量子暗号の2つの主要なアプローチが登場した。
量子鍵配信ネットワーク(QKDN)のためのセキュア鍵配信プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:32:40 GMT)
Better Pose Initialization for Fast and Robust 2D/3D Pelvis Registration [1.8] 本稿では,最適化に基づくポーズ推定器における2D/3D骨盤登録を改善するためのアプローチを提案する。
粗い初期化器でもポーズ推定精度が大幅に向上し、全体的な計算効率が向上することがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:42:13 GMT)
2D/3D Registration of Acetabular Hip Implants Under Perspective Projection and Fully Differentiable Ellipse Fitting [1.8] 人工股関節全置換術における人工股関節全置換術の適応と位置を全股関節全置換術により推定する新しい方法を提案する。
数値シミュレーションとデジタル再構成の両方による実験結果は,最小限の計算要求で高精度であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:34:41 GMT)
The 4D Human Embryonic Brain Atlas: spatiotemporal atlas generation for rapid anatomical changes using first-trimester ultrasound from the Rotterdam Periconceptional Cohort [1.8] 我々は、グループ登録と生成のためのディープラーニングに基づくアプローチを用いて、4D Human Embryonic Brain Atlasを作成しました。
このアトラスはロッテルダム知覚コーホートにおける402名の被験者の831個の3D超音波画像を用いて検証された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:55:30 GMT)
FunGraph: Functionality Aware 3D Scene Graphs for Language-Prompted Scene Interaction [1.8] 我々は、より細かな解像度でオブジェクトを検出し、保存することに集中し、価格関連部品に焦点をあてる。
現在利用可能な3Dリソースを活用して、2Dデータを生成し、検出器をトレーニングし、標準の3Dシーングラフ生成パイプラインを拡張するために使用します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:13:35 GMT)
Data-driven inventory management for new products: An adjusted Dyna-$Q$ approach with transfer learning [1.8] 本稿では,過去の需要情報を持たない新商品の在庫管理のための新しい強化学習アルゴリズムを提案する。
このアルゴリズムは、モデルフリーとモデルベースアプローチのバランスをとる古典的なDyna-$Q$構造に従っている。
転送学習の考え方に基づいて、既存の類似商品の需要データからウォームスタート情報をアルゴリズムに組み込むことができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:43:36 GMT)
Data-Driven Sequential Sampling for Tail Risk Mitigation [1.8] 固定サンプリング予算を逐次割当てして最適な選択肢を高い確率で特定する問題について検討する。
本稿では,データ駆動シーケンシャルサンプリングポリシーを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:32:27 GMT)
Machine learning algorithms to predict stroke in China based on causal inference of time series analysis [1.8] 本研究では,動的因果推論と機械学習モデルを組み合わせた脳卒中リスク予測手法を提案する。
その結果,脳卒中リスクの予測には動的因果推論の特徴が重要であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:45:43 GMT)
Ecosystem-wide influences on pull request decisions: insights from NPM [1.7] NPMエコシステム内の20,052のGitHubプロジェクトから、約1.8万のプルリクエストと2100万のイシューのデータセットを収集しています。
エコシステムの経験のある開発者は、ユーザとは異なるコントリビューションをしているのです。
プルリクエストの結果を予測するために,生態系全体の要因と過去の研究で検討された特徴を組み合わせることで,F1全体のスコアが0.92に達した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:29:00 GMT)
A LSTM-Transformer Model for pulsation control of pVADs [1.7] AP-pVADモデルは3つの油圧実験と動物実験で検証されている。
深層学習は脈動特性の時間点を予測するのに使うことができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:33:59 GMT)
Detecting mental disorder on social media: a ChatGPT-augmented explainable approach [1.7] デジタル時代には、ソーシャルメディア上で表現されるうつ病症状の流行が深刻な懸念を抱いている。
本稿では,Large Language Models(LLM)とeXplainable Artificial Intelligence(XAI)とChatGPTのような対話エージェントを効果的に組み合わせた新しい手法を提案する。
説明は、Twitter固有のBERTの変種であるBERTweetを、新しい自己説明モデル、BERT-XDDに統合することで達成される。
ChatGPTを使用して解釈可能性をさらに強化し、技術的説明を人間可読な注釈に変換する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:32:00 GMT)
Kernel-based estimators for functional causal effects [1.7] 実験的なFr'echet平均と演算子評価カーネルに基づく因果効果推定器を提案する。
これらの手法は、処理ミス特異性に対する堅牢性を維持しながら、高次元性、逐次順序付け、モデル複雑性の課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:28:55 GMT)
FastInstShadow: A Simple Query-Based Model for Instance Shadow Detection [1.7] 本稿では,クエリベースアーキテクチャによる検出精度を向上させるFastInstShadowを提案する。
SOBAデータセットを用いた実験結果から,提案手法はすべての基準において既存手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:39:01 GMT)
AlignPxtr: Aligning Predicted Behavior Distributions for Bias-Free Video Recommendations [1.6] ビデオレコメンデーションシステムでは、視聴時間、お気に入り、フォローなどのユーザの行動は、一般的にユーザーの興味を推測するために使用される。
本研究では,様々なバイアス条件にまたがる予測行動分布を量子マッピングを用いて整列する手法を提案する。
主要なビデオプラットフォームであるKuaishou LiteとKuaishouのオンラインA/Bテストを通じて,本手法の有効性を検証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:59:56 GMT)
MambaFlow: A Mamba-Centric Architecture for End-to-End Optical Flow Estimation [1.6] エンド・ツー・エンド光フロー推定のための最初のマンバ中心アーキテクチャである。
MambaFlowは1.60のEPEを達成し、GMFlowの1.74を上回っている。
MambaFlowは0.113秒のランタイムで推論速度を大幅に改善し、GMFlowよりも18%高速になった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:33:54 GMT)
Weak Supervision for Improved Precision in Search Systems [1.6] 本稿では,クエリとドキュメントのペアの品質を推定するための弱い監視手法を提案する。
大規模検索システムの精度を高めるために,ラーニング・トゥ・ランク・フレームワークに応用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:06:30 GMT)
Sensor-fusion based Prognostics Framework for Complex Engineering Systems Exhibiting Multiple Failure Modes [1.5] 複雑なエンジニアリングシステムは、しばしば複数の障害モードを必要とする。
本稿では,ラベルのないトレーニングデータセットに対して,クラスタリングとセンサの選択を同時に行う手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:05:51 GMT)
MELON: Multimodal Mixture-of-Experts with Spectral-Temporal Fusion for Long-Term Mobility Estimation in Critical Care [1.5] MELONは、医療現場における12時間移動状態を予測するための新しいフレームワークである。
フロリダ州ゲインズビルにあるフロリダ・ヘルス・サンズ病院の9つの集中治療室を受診した126名の患者を対象に,MELONモデルを訓練・評価した。
その結果、MELONは従来の12時間移動状態推定手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:47:46 GMT)
Distilling Knowledge into Quantum Vision Transformers for Biomedical Image Classification [1.5] 線形層を量子ニューラルネットワーク(QNN)に置き換えることで、視覚変換器(ViT)上に構築する量子ビジョン変換器(QViT)
本稿では,生体画像分類のための新しいQViTモデルを提案する。
8種類のデータセットで比較可能なViTの性能について検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:16:48 GMT)
Application-level Benchmarking of Quantum Computers using Nonlocal Game Strategies [1.5] 非ローカルゲームでは、2人のプレーヤーが、ゲームのルールに違反しない戦略を持っていることを審判に納得させるために協力する。
非局所ゲームの規則をハミルトニアンに符号化することにより、非局所ゲームに対する量子戦略を計算する変分量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:57:47 GMT)
Exact Community Recovery under Side Information: Optimality of Spectral Algorithms [1.5] 本研究では,ノードに分散した$side$$informationの存在下で,一般の2つのコミュニティブロックモデルにおいて,コミュニティの正確な回復の問題について検討する。
我々のスペクトルアルゴリズムはいわゆる$genie$-$aided$ $estimatorsを模倣できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:46:14 GMT)
Hybrid quantum surface acoustic wave with skyrmion qubit for quantum information processing [1.5] スカイミオン量子ビットとSAW空洞からなるハイブリッド量子システム。
その結果、このシステムは、異なるモードの1つのフォノンとスカイミオン量子ビットの強い結合を可能にすることが示された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:02:35 GMT)
A Sparse Tensor Generator with Efficient Feature Extraction [1.4] スパーステンソル研究における大きな障害は、大規模なスパーステンソルデータセットの欠如である。
我々は,実スパーステンソルの鍵特性を再現するスマートスパーステンソルジェネレータを開発した。
また,スパーステンソル特徴の包括的集合を抽出する効率的な方法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:06:10 GMT)
From Idea to Implementation: Evaluating the Influence of Large Language Models in Software Development -- An Opinion Paper [1.4] トランスアーキテクチャの導入は自然言語処理(NLP)の転換点となった。
ChatGPT や Bard などの大規模言語モデル (LLM) が一般向けに公開されており、これらのモデルの膨大な可能性を示している。
専門家の全体的な意見は肯定的であり、生産性の向上やコーディング時間の短縮といったメリットを専門家が特定している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:30:05 GMT)
Advances in APPFL: A Comprehensive and Extensible Federated Learning Framework [1.4] Federated Learning(FL)は、データプライバシを保持しながら協調的なモデルトレーニングを可能にする分散機械学習パラダイムである。
本稿では,統合学習のためのフレームワークおよびベンチマークスイートであるAPPFLの開発における最近の進歩について述べる。
本稿では, 通信効率, プライバシー保護, 計算性能, 資源利用など, FLの様々な側面を評価する広範な実験を通じて, APPFLの能力を実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:21:37 GMT)
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models [1.4] 数百万から数十億のパラメータを持つディープニューラルネットワーク(NN)は、有限のトレーニングセットからトレーニングを受けた後、目に見えないデータに対して非常によく機能する。
このようなNNの優れた能力を説明するために、様々な先行理論が開発されているが、テストエラーに意味のある拘束力を与えていない。
PAC-Bayesと相互情報に基づく近年のいくつかの理論は、非空白であり、NNの優れた性能を説明する大きな可能性を示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:40:10 GMT)
NonGEMM Bench: Understanding the Performance Horizon of the Latest ML Workloads with NonGEMM Workloads [1.4] 非GEMM演算子はまだ15%から48%のレイテンシを保っていることを示す。
非GEMMパフォーマンスボトルネックは、すべてのプラットフォームとモデルで大きな問題である。
我々は、モデルとデプロイメントソフトウェアごとに、GEMM以外の最も支配的な演算子をデミストする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:51:22 GMT)
Correlation measurement of propagating microwave photons at millikelvin [1.4] マイクロ波光子は、量子コンピューティングのための多くの有望なプラットフォームにおいて、量子情報の重要なキャリアである。
ミリケルビン温度の光子統計を直接測定するナノボロメータを用いた計測手法を提案する。
入力場のコヒーレント比と非コヒーレント比をエンジニアリングすることにより、マイクロ波光子の超ポアソニアン統計とポアソニアン統計の遷移を観察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:14:38 GMT)
Towards Experience Replay for Class-Incremental Learning in Fully-Binary Networks [1.4] 本稿では,FBNN(Fully-Binarized NN)におけるクラスインクリメンタル学習の実現に向けて,さらに一歩進める。
我々は、CILに適したFBNN設計とその訓練手順を再検討する。
第3に、転送可能な表現のためのFBNNの特徴抽出器を事前訓練する半教師付き手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:31:32 GMT)
Beyond One-Size-Fits-All Summarization: Customizing Summaries for Diverse Users [1.4] テキストデータの可読性を制御することは、異なるオーディエンスのための要約を作成する上で重要な要素である。
私たちは独自のカスタムデータセットを作成し、カスタムアーキテクチャでモデルをトレーニングします。
本手法は,精度とコヒーレンスを維持しつつ,可読性レベルを効果的に制御することを保証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:08:36 GMT)
A Time Series Multitask Framework Integrating a Large Language Model, Pre-Trained Time Series Model, and Knowledge Graph [1.4] 時系列分析は金融、交通、産業などの分野において重要である。
本稿では,時間的特徴をテキスト記述と統合した新しい時系列マルチタスクフレームワーク LTM を提案する。
ベンチマークデータセットの実験では、LTMが既存のメソッドよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:25:01 GMT)
Improving Deep Ensembles by Estimating Confusion Matrices [1.2] クラウドソーシングにインスパイアされた私たちは、ディープアンサンブルのためのソフトなダウィドスキーを提案します。
軟ダウィドスキーの精度,キャリブレーション,分布検出における優位性を実証的に示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:48:52 GMT)
Real-Time Monitoring of Multimode Squeezing [1.2] マルチモード圧縮光は高次元量子技術の鍵となる資源である。
本稿では,マルチモード光の共伝搬モードのリアルタイムモニタリングを実現するために,MOPA(Multimode Optical Parametric Amplification)を用いる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:04:35 GMT)
Explainable Android Malware Detection and Malicious Code Localization Using Graph Attention [1.2] XAIDroidはマルウェアの中に悪意のあるコードスニペットを自動的に配置する新しいアプローチである。
APIコールグラフとしてコードを表現することで、XAIDroidはセマンティックコンテキストをキャプチャし、難読化に対するレジリエンスを高める。
合成および実世界のマルウェアデータセットの評価は、我々のアプローチの有効性を示し、悪意のあるコードローカライゼーションのための高いリコールとF1スコア率を達成する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:33:37 GMT)
Using Large Language Models to Develop Requirements Elicitation Skills [1.1] チャットベースのインタビューにおいて,クライアントの役割を果たすために,大規模言語モデルを条件付けすることを提案する。
どちらの手法も、参加者が技術的に健全なソリューションを構築するのに十分な情報を提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:27:38 GMT)
An automated machine learning framework to optimize radiomics model construction validated on twelve clinical applications [1.1] 新しい臨床応用では、幅広い方法から最適な放射能法を見つけることは、手動による試行錯誤プロセスに依存している。
アプリケーション毎の放射能構築を最適化する新しい自動化フレームワークを導入する。
我々は2つの戦略(ランダム検索とベイズ最適化)と3つのアンサンブルアプローチを通じて自動機械学習を採用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:20:03 GMT)
Learning signals defined on graphs with optimal transport and Gaussian process regression [1.1] 計算物理学において、機械学習は工学研究における効率的な候補設計を探索するための強力な補完ツールとして登場した。
本稿では,入力が大きく,連続ノード属性を持つ疎グラフと,関連する入力のノード上で定義された信号が出力となるガウス過程回帰の革新的な戦略を提案する。
信号予測の実現に加えて,提案手法の要点は,不確実性や能動学習に欠かせないノード値に対する信頼区間を持つことである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:11:26 GMT)
On the Semantic Security of NTRU -- with a gentle introduction to cryptography [1.1] NTRUは、量子コンピュータによる攻撃に対して安全であるように見える格子ベースの暗号システムである。
NTRUの効率は、ポスト量子世界におけるRSA、ElGamal、ECCに代わる強力な候補であることを示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:14:13 GMT)
Detection Avoidance Techniques for Large Language Models [1.1] DetectGPTなどの分類システムの開発が重要になっている。
生成モデルの温度証明による浅層学習検出器の開発は信頼性が低い。
強化学習による生成モデルの微調整によりBERTに基づく検出を回避した。
言い換えると、ディテクターGPTのようなゼロショット検出器の90%の回避につながった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:56:25 GMT)
Using a single actor to output personalized policy for different intersections [1.1] 複数の交差点を持つ交通シナリオにおいて、マルチエージェント強化学習(MARL)は、各交差点をエージェントとして扱う。
我々は,非イド観測分布と交差する交差点に対してパーソナライズされたポリシを提供するために,HAMH-PPO(Hyper-Action Multi-Head Proximal Policy Optimization)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:55:33 GMT)
Open-Set Gait Recognition from Sparse mmWave Radar Point Clouds [1.0] スパースmmWaveレーダ点雲からの開集合ゲイト認識の問題に対処する。
これは、スパースポイントクラウドデータによるオープンセット歩行認識に対処する最初の作業である。
10人の被験者から5時間以上の計測結果が得られた最初の人間の歩行データセットであるmmGait10をリリースする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:18:10 GMT)
FLP-XR: Future Location Prediction on Extreme Scale Maritime Data in Real-time [0.9] 本稿では,海上移動データを活用するモデルであるFLP-XRを紹介し,高精度な予測を行うロバストなフレームワークを構築する。
3つの実世界のAISデータセットを用いた大規模な実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:31:42 GMT)
Stabilized Inverse Probability Weighting via Isotonic Calibration [0.9] 推定確率スコアによる逆重み付けは、因果推論で広く使われ、共起バイアスに適応する。
提案手法は, 利用者に供給された, クロスフィットした適合度スコア推定値から, 高い校正, 安定した重み付けを生成する逆正度重み付けのためのポストホック校正アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:32:47 GMT)
Helios 2.0: A Robust, Ultra-Low Power Gesture Recognition System Optimised for Event-Sensor based Wearables [0.9] 我々は,スマートグラスの自然な手の動き制御を可能にする,モバイル最適化,リアルタイム,超低消費電力イベントカメラシステムを提案する。
我々のアプローチは、慎重に選択されたマイクロゲインを通して課題に取り組む。
これらの人間中心のインタラクションは、ユーザが複雑なコマンドシーケンスを学習することなく、自然な手の動きを活用して、直感的なユーザビリティを確保する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:12:06 GMT)
Bot Wars Evolved: Orchestrating Competing LLMs in a Counterstrike Against Phone Scams [0.8] ボット・ウォーズ (Bot Wars) は、Large Language Models (LLMs) scam-baiters を用いて、シミュレーションされた対話を通して電話詐欺に対処するフレームワークである。
我々は,3,200件のスカム・ダイアログのデータセットを用いて,人間のスカム・バイティング・インタラクションの179時間に対する検証を行った。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:21:36 GMT)
Mapping AI Benchmark Data to Quantitative Risk Estimates Through Expert Elicitation [0.8] 我々は、リスク見積の作成を容易にするために、既存のAIベンチマークをどのように利用できるかを示す。
本稿では、AIベンチマークであるCybenchからの情報を用いて確率推定を生成するパイロット研究の結果について述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:00:00 GMT)
Entropy Computing: A Paradigm for Optimization in an Open Quantum System [0.7] 量子貯水池を条件付けして動作する新しい計算パラダイムであるエントロピー計算を導入する。
提案したエントロピー・コンピューティング・パラダイムは、幅広いNPハード最適化問題に対処するためのスケーラブルで多用途なプラットフォームとして機能することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:48:23 GMT)
An experimental platform for levitated mechanics in space [0.7] 本稿では,宇宙空間における光磁気トラップ実験のための技術実証装置の開発について述べる。
私たちのペイロードは、基本的な物理的質問を探索する目的で、将来のミッションに向けた最初の具体的なステップを表しています。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:32:01 GMT)
Bell nonlocality with a single shot [0.7] 小さいp-値を得るには、ベルの不等式の局所境界とツィレルソン境界の間に大きなギャップを持つことが十分であることを示す。
空隙を任意に1に近づけたベルの不等式の明示的な例を示し、これにより局所的に隠れた変数を1枚のショットで拒否できることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:51:48 GMT)
Global Context Is All You Need for Parallel Efficient Tractography Parcellation [0.7] 並列効率的なトラクトグラフィ解析のための新しい手法であるPETParcを提案する。
PETParcはトランスフォーマーベースのアーキテクチャで、脳全体のトラクトグラムをランダムにサブトラクトグラムに分割する。
結果はしばしば以前の方法よりも優れている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:27:07 GMT)
Talking to GDELT Through Knowledge Graphs [0.6] 本研究では,各アプローチの強みと弱みを質問応答解析で把握するために,様々なRAG(Retrieval Augmented Regeneration)アプローチについて検討する。
テキストコーパスから情報を取得するために,従来のベクトルストアRAGと,最先端の大規模言語モデル(LLM)に基づくアプローチを実装した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:48:10 GMT)
Optimizing Continuous-Wave Pumped Entanglement-based QKD in Noisy Environment [0.6] 量子鍵分布(QKD)は、量子コンピュータの脅威から暗号システムを保護するための有望なソリューションとして登場した。
本稿では,検出タイミングの不確実性(ジッタ)を含むQKDシステムパラメータに対する極端雑音の影響について検討する。
これらのパラメータの変化は、ノイズの多い環境でのシステム性能を決定する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:40:12 GMT)
The potential role of AI agents in transforming nuclear medicine research and cancer management in India [0.6] インドでは、がんに罹患していると診断された5人のうち3人近くが死亡率の上昇に悩まされている。
インドにおけるがん研究、診断、管理のための核医学の発展におけるAIエージェントの役割について検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:30:07 GMT)
Sub-Image Recapture for Multi-View 3D Reconstruction [0.6] 我々は、大画像を小さなサブイメージに分割し、個別に処理するための汎用的アプローチであるサブイメージ再キャプチャ(SIR)を開発した。
このフレームワークにより、メモリを大幅に削減し、スケーラビリティを大幅に改善したサブイメージ再キャプチャに基づいて、既存の3D再構成アルゴリズムを実装できる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:53:52 GMT)
NeAS: 3D Reconstruction from X-ray Images using Neural Attenuation Surface [0.6] 2次元X線画像から3D構造を再構成することは、CTスキャンよりも放射線被曝が少ない医療応用において貴重な技術である。
暗黙の神経表現を用いた最近のアプローチは、スパースX線画像から新しいビューを合成することを可能にする。
本稿では, 表面形状と減衰係数場を同時に捉えるニューラル減衰面(NeAS)を用いて3次元シーンを再構成する手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:11:58 GMT)
Prompt Selection Matters: Enhancing Text Annotations for Social Sciences with Large Language Models [0.6] 性能はプロンプト間で大きく異なり,高品質なプロンプトを体系的に構築するために自動プロンプト最適化手法を適用する。
我々はまた、このメソッドのシンプルなブラウザベースの実装をコミュニティに提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:35:53 GMT)
Negative Local Partial Density of States [0.6] 実量子系は、量子力学の公理的アプローチでは証明できない状態の局所部分密度(LPDOS)と呼ばれる局所的な対象を示すことができる。
我々は、ファノ共鳴を示すことができる実際のメソスコピック系が、この物体を示し、非常に反故意に負となり、コヒーレント電流の増大をもたらすことを実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 08:15:01 GMT)
TexAVi: Generating Stereoscopic VR Video Clips from Text Descriptions [0.6] 本稿では,既存の生成システムを融合してテキストから立体視のバーチャルリアリティービデオを作成する手法を提案する。
私たちの研究は、バーチャルリアリティーシミュレーションのような分野において自然言語駆動グラフィックスを使うことのエキサイティングな可能性を強調します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:52:31 GMT)
NPSim: Nighttime Photorealistic Simulation From Daytime Images With Monocular Inverse Rendering and Ray Tracing [0.5] 強力な自律運転システムは、夜間を含むすべての条件下で画像を処理できなければならない。
実写夜間画像のシミュレーションを可能にするNPSimという新しい手法を提案する。
NPSimはメッシュ再構築とリライトという2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:47:24 GMT)
Quantization of nonlinear non-Hamiltonian systems [0.5] 量子論の発展において、ディラックらは古典的ハミルトニアン系が正準量子化(canonical Quantization)によって量子にマッピングできることに気付いた。
ここでは、すべての系がリンドブラディアンの時間発展の生成元を持つことを構成的に証明する。
事実上、$f(x,y)$ および $g(x,y)$ 保存関数を持つ任意の古典系は任意の精度で量子化することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:38:10 GMT)
A friendly guide to exorcising Maxwell's demon [0.5] マクスウェルの悪魔の誕生、生死は、熱力学、計算、情報の間の相互作用に関する深い議論を引き起こした。
このチュートリアルは、マックスウェルの悪魔とその永続的な影響を包括的に概観し、熱力学、情報理論、量子力学に関する現代の洞察で古典的な概念をブリッジする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:35 GMT)
A Recipe for Improving Remote Sensing VLM Zero Shot Generalization [0.4] 本稿では,リモートセンシング基礎モデルのトレーニングのための2つの新しい画像キャプチャーデータセットを提案する。
最初のデータセットは、Google Mapsから抽出されたランドマークを使用して、Geminiによって生成されたキャプションと航空画像と衛星画像のペアである。
第2のデータセットは、リモートセンシングドメインのためにフィルタリングされたパブリックWebイメージとそれに対応するalt-textを利用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:09:02 GMT)
Untwisted and Twisted Rényi Negativities: Toward a Rényi Proxy for Logarithmic Negativity in Fermionic Systems [0.4] エンタングルメントエントロピー(Entanglement Entropy)は、純粋状態に対する量子エンタングルメントの基本的な尺度である。
混合状態の場合、対数否定性(LN)は広く用いられる絡み合い測度として機能するが、その直接特異性はしばしば難解である。
フェルミオン系において、R'enyi negativity (RN) は LN の真の R'enyi proxy として機能する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:05 GMT)
Fermionic Partial Transpose in the Overlap Matrix Framework for Entanglement Negativity [0.4] 重なり行列アプローチにフェミオン部分転移を導入する。
両部系における絡み合いの負性性を計算するための明示的な公式を導出する。
2つの格子モデルの対数ネガティビティを数値計算して、ジョエフ・クリッヒ=ウィドムのスケーリング法則を検証する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:45 GMT)
Sustainable Visions: Unsupervised Machine Learning Insights on Global Development Goals [0.4] 2030年アジェンダ・フォー・サステナブル・ディベロップメント(Agenda for Sustainable Development)は、世界各国が開発におけるグローバルな課題に取り組むための17の目標を概説している。
我々は、教師なし機械学習(ML)技術を用いて、107カ国から20年以上(2000-2022年)にわたって時系列データを分析するために、新しいデータ駆動手法を用いてきた。
SDGsの進展は, 地理的, 文化的, 社会経済的要因に大きく影響されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:54:32 GMT)
Cascade of one-class classifier ensemble and dynamic naive Bayes classifier applied to the myoelectric-based upper limb prosthesis control with contaminated channels detection [0.4] 筆者らは, 汚染されたsEMG信号の検出による手指義肢の制御を目的とした新しい認識システムを提案する。
提案手法の独創性は、カスケード構造で動作する2つの認識システムの協調性にある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:39:36 GMT)
Numerical security analysis for quantum key distribution with partial state characterization [0.3] 本稿では,準備・測定および測定・デバイスに依存しないQKDプロトコルの秘密鍵レートを評価する新しいセキュリティ証明手法を提案する。
提案手法は, 達成可能なシークレットキーレートの観点から, 部分状態のキャラクタリゼーションに対処する現在の解析手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:08:25 GMT)
Operationalizing Cybersecurity Knowledge: Design, Implementation & Evaluation of a Knowledge Management System for CACAO Playbooks [0.3] サイバーセキュリティのプレイブックは 重要な手段だ 構造化され 再利用可能な インシデント対応への アプローチを継続的に改善する
新たなコラボレーティブ・オートマチック・コース・オブ・アクション・オペレーション(CACAO)標準は、サイバーセキュリティのプレイブックのための一般的なマシン処理可能なスキーマを定義している。
本稿では,CACAOのサイバーセキュリティプレイブックを管理するための知識管理システム(KMS)の設計,開発,評価について述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:24:39 GMT)
Towards a Multimodal MRI-Based Foundation Model for Multi-Level Feature Exploration in Segmentation, Molecular Subtyping, and Grading of Glioma [0.3] Multi-Task S-UNETR(MTSUNET)モデルはBrainSegFounderモデルに基づいて構築された新しい基盤ベースのフレームワークである。
同時にグリオーマのセグメンテーション、組織学的サブタイプ、神経画像サブタイプを行う。
非侵襲的, パーソナライズされたグリオーマ管理の進展には, 予測精度と解釈可能性を改善することにより有意な可能性を秘めている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:27:09 GMT)
Advancing Vietnamese Information Retrieval with Learning Objective and Benchmark [0.2] 本研究はベトナム研究コミュニティに情報検索のための新しいベンチマークを提供することを目的としている。
また,ベトナムの埋め込みモデルの学習に使用されるInfoNCE損失関数に基づく新たな目的関数を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:47:01 GMT)
Less is more? Rewards in RL for Cyber Defence [0.2] 我々は、スパース報酬機能がより効果的なサイバー防衛エージェントの訓練を可能にするかどうかを評価する。
以上の結果から,スパルス報酬,特に未妥協のネットワーク状態に対する肯定的な強化は,より効果的なサイバー防衛エージェントの訓練を可能にすることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:51:39 GMT)
A Framework for Supporting the Reproducibility of Computational Experiments in Multiple Scientific Domains [0.2] 近年、研究コミュニティや一般大衆は、科学的研究の再現性について深刻な疑問を提起している。
本稿では,計算実験の構成,実行,パッケージングをサポートするSciRepというフレームワークを提案する。
我々のアプローチは、あらゆるコンピュータで再実行可能な、複数の科学分野から実験用のパッケージを作成することを可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:02:01 GMT)
Modern Models, Medieval Texts: A POS Tagging Study of Old Occitan [0.2] 大規模言語モデル (LLM) は自然言語処理において顕著な能力を示した。
本研究では,古オクシタンのPOSタグ付けにおけるオープンソースのLDMの性能について検討した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:16:01 GMT)
A Systematic Review of ECG Arrhythmia Classification: Adherence to Standards, Fair Evaluation, and Embedded Feasibility [0.2] このレビューは、2017年から2024年にかけて発行されたECG分類研究を体系的に分析する。
我々は,E3C基準を満たす最先端の手法を特定し,精度,推定時間,エネルギー消費,メモリ使用量の比較分析を行った。
これらのギャップに対処することにより、より堅牢で臨床的に実行可能なECG分類システムに向けた今後の研究を導くことを目的としている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:57:43 GMT)
Improving cognitive diagnostics in pathology: a deep learning approach for augmenting perceptional understanding of histopathology images [0.2] 本論文は, 病理組織像解析の高度化に向けた新しいアプローチについて述べる。
視覚変換器(Vit)とGpt-2を併用した画像キャプチャ用マルチモーダルモデル
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:50:25 GMT)
Automated Consistency Analysis of LLMs [0.2] 大きな言語モデル(LLM)を備えたジェネレーティブAIは、業界、アカデミック、政府で広く採用されている。
LLMの信頼性と信頼性に対する重要な課題の1つは、LLMがその応答においていかに一貫性があるかである。
本稿では,複数のLSM間での自己検証と検証という,一貫性を検証するための2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:14:34 GMT)
An Evaluation Benchmark for Adverse Drug Event Prediction from Clinical Trial Results [0.1] 副作用薬物イベント(ADEs)は臨床試験における主要な安全性の問題である。
単剤治療における多ラベルADE予測のためのデータセットであるCT-ADEを紹介する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:51:28 GMT)
Prediction of the Most Fire-Sensitive Point in Building Structures with Differentiable Agents for Thermal Simulators [0.1] 本稿では,MFSP(Mest Fire-Sensitive Point)の概念と,その識別のための効率的な機械学習フレームワークを提案する。
MFSPは、火災が開始すれば建物の安定性に最も深刻な有害な影響をもたらす場所と定義されている。
本フレームワークでは,従来の有限要素解析(FEA)シミュレータにおいて,グラフニューラルネットワーク(GNN)が効率的かつ微分可能なエージェントとして機能する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:24:28 GMT)
Transitional supersolidity in ion doped helium droplets [0.1] 大きな液滴の場合、遷移性超固体層が生成し、固体コアと液体バルクの間を架橋できると予測する。
小さな液滴の場合、我々のアプローチの予測はモンテカルロのパス・インテグレラル計算とよく一致している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:51:29 GMT)
tūQ: a design and modelling tool for cluster-state algorithms [0.0] t=uQツールチェーンは、クラスタステートコンピューティングの研究を進めるために設計された。
t=uQ の2つのモードは Modeller と Simulator である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:19:35 GMT)
Weak-coupling bound states in semi-infinite topological waveguide QED [0.0] 原子-光子結合状態は通常、原子と環境の結合が十分に強いときに形成される。
量子エミッタが、位相的に保護された表面状態を示す構造的な貯水池に弱結合している場合、これらの状態とエミッタとのハイブリッド化が形成されることを示す。
弱結合状態間の振動は、予測可能かつ可逆的にエミッタから格子へ粒子を移動させるのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:51:19 GMT)
Ways of Seeing, and Selling, AI Art [0.0] クリスティーの最初のAIアートオークションは、論争を呼んだジャンルを展示したことで批判を浴びた。
バックラッシュは、クリエイティブ経済におけるAIの対立する立場の微視的微視的側面と見なすことができる。
本稿では, 社会的不協和性の中で, 機械学習がアートワールドにどのような位置を占めるのかを考察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:44:11 GMT)
VocalEyes: Enhancing Environmental Perception for the Visually Impaired through Vision-Language Models and Distance-Aware Object Detection [0.0] 本研究では,ユーザの環境を音声で記述し,状況認識を改善する革新的なリアルタイムシステムを提案する。
システムはライブビデオの入力を取得し、定量化および微調整されたFlorence-2ビッグモデルで処理する。
Parler TTS Miniは、軽量で適応可能なText-to-Speech(TTS)ソリューションで、効率的なオーディオフィードバックを提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:40:13 GMT)
Vacuum polarization in a one-dimensional effective quantum-electrodynamics model [0.0] デルタポテンシャル相互作用を持つ水素様原子の一次元有効QEDモデルについて検討した。
このモデルはクーロン相互作用を持つ3次元実効QED理論に似ており、かなり単純である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:49:42 GMT)
Uncertainty quantification and posterior sampling for network reconstruction [0.0] 再構成ネットワークの後方分布をサンプリングするための効率的なMCMCアルゴリズムを提案する。
提案アルゴリズムは,大規模かつスパースなネットワークの推測に特に適している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:14 GMT)
Transforming Traditional Neural Networks into Neuromorphic Quantum-Cognitive Models: A Tutorial with Applications [0.0] 本稿では,従来のニューラルネットワークをニューロモルフィック量子モデルに変換する方法について述べる。
これらの量子機械学習変換のいくつかの例を示し、その応用の可能性を探る。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:00:48 GMT)
Time- and frequency-resolved dynamics of resonant two-photon terahertz quantum cascade lasers [0.0] 2光子テラヘルツ(THz)量子カスケードレーザー(QCL)は、THz周波数源の従来の応用と新しい用途への開放窓を著しく改善することができる。
本研究は、マクスウェル・ブロッホ方程式を数値解き、共鳴2光子 THz QCL の時間分解と周波数分解のダイナミクスについて検討する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:50:10 GMT)
The single-photon steering and the quantum mechanical free-interaction measurement are identical phenomena [0.0] 簡単な方法で単一光子ステアリング現象を実験的に示す方法を示す。
単一光子ステアリングと量子力学的相互作用自由度測定(QM-IFM)が同一の現象であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:03:32 GMT)
The influence of missing data mechanisms and simple missing data handling techniques on fairness [0.0] 不足値とその処理がアルゴリズムの公平性に与える影響について検討する。
この研究の出発点は、欠落のメカニズムであり、欠落したデータの処理方法に繋がる。
その結果、あるシナリオでは、不一致のメカニズムがランダムに欠如している場合、公平性への影響が明らかになる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:32:25 GMT)
The Janus Face of Innovation: Global Disparities and Divergent Options [0.0] この課題には、技術移転と規制協力のための新たな制度機構が必要だと私は考えています。
良いプラクティスは、発展途上国がグローバルな技術格差のギャップを埋めるのに役立ちます。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:33:07 GMT)
The Economics of p(doom): Scenarios of Existential Risk and Economic Growth in the Age of Transformative AI [0.0] 主な焦点は、変革型AI(TAI)の出現の可能性である。
公表されたシナリオは、不整合TAIが引き継いだ後のヒトの絶滅(「AIの運命」)から、前例のない経済成長と豊かさ(「ポスト・スカーシティ」)まで様々である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:53:39 GMT)
The (un)detectability of trajectories in pilot-wave theory [0.0] パイロット波理論は、決定論的力学によって常に支配される定位置の粒子を授けている。
個々の粒子軌道は、実験によって一般的には検出できない。
このパズルは、量子力学的測定が何を意味するのかというコヒーレントな説明がないことから生じると結論付けられた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:00:09 GMT)
The $k$-photon quantum Rabi model [0.0] 量子ラビモデルの一般化は、2レベル系と放射モードの間の線形(双極子)結合を置き換えることによって得られる。
各スピンフリップが$k$光子を含む場合、「$k$-光子」量子ラビモデルと呼ばれる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:12:21 GMT)
Testing for Overfitting [0.0] オーバーフィッティング問題について議論し、トレーニングデータによる評価に標準値と集中値が成立しない理由を説明する。
本稿では,モデルの性能をトレーニングデータを用いて評価できる仮説テストを紹介し,議論する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:52:21 GMT)
Symmetry-protection Zeno phase transition in monitored lattice gauge theories [0.0] 保護ゲージ理論と不規則状態の間の測定速度によって引き起こされる急激な遷移の存在を示す。
我々の結果は、強い相互作用を持つ高制約量子系の散逸臨界性に光を当てた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:44:35 GMT)
Steady-state tripartite non-Gaussian entanglement and steering in output field from intracavity triple-photon parametric downconversion [0.0] 最近の実験では、マイクロ波NTPDによる明るい光子三重項間の強い3次相関が示されている。
これまでの理論的な研究により、NTPDで生成できるのは、短時間の真の三部体の非ガウス的絡み合いのみであることが判明した。
負のウィグナー関数量子状態の遠隔生成には,出力三部式非ガウス的ステアブル相関が適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:40:24 GMT)
Split-n-Chain: Privacy-Preserving Multi-Node Split Learning with Blockchain-Based Auditability [0.0] Split-n-Chainは分割学習の一種で、ネットワークのレイヤを複数の分散ノードに分割する。
Split-n-Chainは、異なるフェーズを実行するのに要する時間の観点から効率が良いことを示し、トレーニング損失傾向はモノリシックな方法で実装された場合と同じニューラルネットワークの場合と似ていることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:40:05 GMT)
Speed limits to the growth of Krylov complexity in open quantum systems [0.0] 我々は、散逸的開量子系におけるクリロフ複雑性の成長に普遍的な極限を導入する。
また、散逸系におけるランツォス係数の特性挙動に対するクリロフ複雑性の解析結果を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:01:18 GMT)
Spacetime events from the inside out [0.0] 相対性理論の特殊理論と一般理論は、時空事象が量子測定結果に対応することを暗黙的に仮定する。
本稿では,非古典的因果構造を示す時間的測定を用いたベル試験について述べる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:03:13 GMT)
Solving lattice gauge theories using the quantum Krylov algorithm and qubitization [0.0] 量子部分空間展開アルゴリズムを用いてシュウィンガーモデルの基底状態を計算する。
量子化を用いた量子アルゴリズムを用いて,LGT真空状態の計算に必要な資源の完全な分析を行う。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:27:33 GMT)
Sensemaking in Novel Environments: How Human Cognition Can Inform Artificial Agents [0.0] 我々は,新しい環境下でのセンスメイキング能力を備えた知的エージェントを創出するためのアプローチを提供する。
記憶にまたがる属性を新しい方法で共有・再結合し、新しい環境における特定の結果を示す合成記号を作成することを提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:03:09 GMT)
Semiring Activation in Neural Networks [0.0] ニューラルネットワークでの使用に適したセミリングに基づいて、トレーニング可能な非線形演算子のクラスを導入する。
トレーニング可能なセミリング演算子のアクティベーション関数を置き換える実験を行い、これらが完全に接続されたネットワークに組み込むことができることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:33:36 GMT)
Semiclassical Backreaction: A Qualitative Assessment [0.0] 古典的背景における量子自由度のバックアクションは、理論物理学においてあまり理解されていないトピックである。
多くの場合、背景の力学に対する量子励起の影響を考慮に入れた様々なアドホック処方薬の助けを借りて、半古典的近似の中で扱われる。
i) 量子自由度が量子期待値を介して古典的背景と結合する平均場近似、(ii) 量子自由度の様々なランダムサンプリングされた初期条件に対する古典的運動方程式を用いて完全に結合されたシステムを進化させる(stochastic)Trncated Wigner法、である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:29:58 GMT)
Selecting time-series hyperparameters with the artificial jackknife [0.0] 私はそれをArtificial delete-d$ jackknifeと呼び、このアプローチが古典的な削除ステップを架空の削除に置き換えていることを強調します。
この手順はデータの順序をそのままに保ち、時系列とのプレーンな互換性を可能にする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:11:11 GMT)
Robust Multilinear Principal Component Analysis [0.0] マルチ線形主成分分析(MPCA)はテンソルデータを解析するための重要なツールである。
標準MPCAは外れ値に敏感である。
本稿では,両タイプのアウトレイラを同時に処理できる新しい堅牢MPCA法を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:41:03 GMT)
Real-Time Structural Deflection Estimation in Hydraulically Actuated Systems Using 3D Flexible Multibody Simulation and DNNs [0.0] 本研究では,油圧作動系におけるリアルタイム構造偏向を推定するための新しい枠組みを提案する。
これは、強制励起を受ける機械系の動的応答を推定する機械学習に基づくSLIDEに基づいている。
PyTorch、ADAM、各種センサー入力、最小出力データから標準パラメータを使用して、少ない時間でトレーニングされる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:56:35 GMT)
Quasiparticle poisoning of superconducting qubits with active gamma irradiation [0.0] 超伝導量子ビットアレイにおける$gamma$-ray影響のダイナミクスについて検討する。
電荷感受性トランスモン量子ビットを用いることで、オフセット電荷シフトと準粒子中毒の両方を測定することができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:09:34 GMT)
Quantum weak values and the 'which way?' question [0.0] 不確実性原理は、量子系が旅行した2つの経路のどれかを決定することを禁ずる。
弱いポインタが同時に不正確なポインタであることを示し、個々の試行においてシステムによって取られた経路に関する情報が必然的に失われることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:50:01 GMT)
Quantum geometry and adiabaticity in molecules and in condensed matter [0.0] 断熱定理は、ハミルトニアンの時間進化が「無限に遅い」とき、系は常に瞬間的な基底状態のままである。
これは、一般可観測体の断熱的進化が、即時固有状態に対する期待値として単に得られるという意味ではない。
量子幾何学的な性質の別の断熱的用語があり、これはいくつかの静的あるいは断熱的観測物に関係している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:59:22 GMT)
Quantum Games and Synchronicity [0.0] 非局所量子ゲームを拡張して、量子問題と答えを許容する。
方程式はテンソル圏の図式計算を用いて表される。
我々は、戦略、相関、同期性を含む標準定義を拡張し、これらの定義を使用して同期性に関する結果を拡張する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:49:32 GMT)
Quantum Error Correction resilient against Atom Loss [0.0] 原子損失の存在下で中性原子量子プロセッサの量子誤り訂正プロトコルについて検討する。
偏極ノイズがゼロの場合、原子損失閾値は約2.6%である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:37:16 GMT)
QuantU-Net: Efficient Wearable Medical Imaging Using Bitwidth as a Trainable Parameter [0.0] 低消費電力デバイスへの効率的な展開に最適化された量子化されたU-NetであるQuantu-Netを紹介する。
このモデルは、約8倍のサイズの縮小を実現し、ウェアラブル医療機器のリアルタイム応用に適している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:25:34 GMT)
Prog-QAOA: Framework for resource-efficient quantum optimization through classical programs [0.0] 現在の量子最適化アルゴリズムでは、元の問題を二進最適化問題として表現し、量子デバイスに適した等価コストハミルトニアンに変換する必要がある。
目的関数を計算し、制約を認証するための古典的プログラムを設計し、後に量子回路にコンパイルする。
我々は、このアイデアをトラベリングセールスマン問題やMax-K$-Cutといった最適化タスクに活用し、関連するすべてのコスト対策に関して最適に近い回路を得る。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:34:45 GMT)
Probing the Quantum Nature of Gravity through Classical Diffusion [0.0] 重力が局所的な操作という意味で古典的であるなら、量子系の運動に拡散をもたらす必要があることを示す。
ミリケルビン温度における高精度ねじり振り子に基づく実験的プロトコルを概説する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:18:40 GMT)
Probing quantum properties of black holes with a Floquet-driven optical lattice simulator [0.0] 超低温原子を用いた (1 + 1) 次元ブラックホールと (2 + 1) 次元ブラックホールのアナログ量子シミュレーション手法を提案する。
我々は, ブラックホールの湾曲した形状を符号化した位置依存トンネル振幅を, 駆動系の有効力学によって生成できることを示す。
また、(1+1)Dの模擬ブラックホールのホーキング温度をオンサイト原子集団測定のみに基づいて決定する手法も提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:39:16 GMT)
Probing Topological Anderson Transition in Quasiperiodic Photonic Lattices via Chiral Displacement and Wavelength Tuning [0.0] Su-Schrieffer-Heeger格子の準周期的細胞間結合障害に起因するトポロジカルアンダーソン転移について報告する。
準周期的な強度が変化するにつれて、システムは自明な位相から位相的な位相への再帰的な遷移を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:52:57 GMT)
PoseLess: Depth-Free Vision-to-Joint Control via Direct Image Mapping with VLM [0.0] PoseLessは、2D画像をトークン化表現を用いて関節角に直接マッピングすることで、明示的なポーズ推定の必要性を排除した、ロボットハンドコントロールのための新しいフレームワークである。
提案手法では,ランダムな関節構成によって生成された合成トレーニングデータを活用し,実世界のシナリオへのゼロショット一般化とロボットから人間の手へのクロスモルフォロジー移行を実現する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:34:05 GMT)
Physical aspects of symmetry breaking in non-interacting Bose gases at thermal equilibrium [0.0] 相互作用しないボース気体の理論は、2次元の非局所順序パラメータを持つ数値場の記述によって補われる。
変動する粒子数の極限において、理想的で非常に弱い相互作用を持つボース気体のある種の新しい基本対称性の側面を説明することは可能である。
凝縮部と非凝縮部をコヒーレントに結合させることは、ボース気体中の異なる磁場成分間の量子コヒーレンス時間の増加による直接的な結果である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:22:11 GMT)
Photonic Mode Description of the Jaynes-Cummings Hamiltonian States [0.0] Jaynes-Cummings Hamiltonian は、フォトニックモードと相互作用する2レベル系の要素記述を提供する。
我々は、ハイブリッド化状態を別個のフォトニックモードとして記述したフォトニック信号による送信応答の式を導出する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:48:25 GMT)
Perceptions of Sentient AI and Other Digital Minds: Evidence from the AI, Morality, and Sentience (AIMS) Survey [0.0] アメリカ成人の5人に1人は、一部のAIシステムが現在センシティブであり、38%がセンシティブAIの法的権利を支持していると信じている。
2023年の平均的な予測は、知覚的AIがわずか5年で到着するというものだった。
安全で有益なAIの開発には、技術的な研究だけでなく、人間がデジタルマインドと認識し共存する複雑な方法を理解することが必要である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:10:28 GMT)
Packaged Quantum States in Field Theory: No Partial Factorization, Multi-Particle Packaging, and Hybrid Gauge-Invariant Entanglement [0.0] 量子場励起は束縛された絡み合った状態を生成することができることを示す。
すべての内部量子数(IQN)は分離的に絡み合っており、既約表現ブロックに制約される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:30:45 GMT)
Optomechanical non-Gaussian quantum steering and remote preparation of large-size motional Schördinger cat states [0.0] 本研究では, キャビティオメカニクスシステムにおいて, 大型運動型シュリンガー猫状態を遠隔で生成する手法を提案する。
まず、これらの多光子演算が非ガウス型OM量子ステアブル相関に繋がることを示した。
この結果から,多光子演算による非ガウス的ステアリングの特性が明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:11:03 GMT)
Optimal Connectivity from Idle Qubit residual coupling Cross-Talks in a Cavity Mediated Entangling Gate [0.0] 可変結合型空洞型アーキテクチャにおいて,高プロセッサ接続が平均2量子ゲート忠実度に与える影響について検討する。
逆残余結合からクロストーク誤差を定量化し,そのスケールが$nm2$であることを示す。
我々は、$E_mathrmthr$が許容する量子ビットの最大数は、$n propto E_mathrmthr/m2$としてスケールすると予想する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:36:10 GMT)
Opening Krylov space to access all-time dynamics via dynamical symmetries [0.0] 我々は、クリロフ鎖に自然に発散する開境界条件を導入することにより、無限閉系におけるいくつかの力学対称性を数値的に解析的に導出する。
我々のアプローチは、カオス系における可観測物の熱化と指数的崩壊と、作用素成長仮説を直接的に関連付けることができる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:52:45 GMT)
On the Random Schrödinger Equation and Geometric Quantum Control [0.0] ランダムなエルミート行列によって与えられる雑音項を雑音量子系をモデル化する手段として、ランダムなシュル「オーディンガー方程式を導入する。
合成ユニタリの誤差をノイズのノルム上の境界で導出し、特定のノイズ過程においてこれらの境界がきついことを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:52:20 GMT)
On Sequential Maximum a Posteriori Inference for Continual Learning [0.0] 損失関数の再帰として逐次最大化を定式化し、損失関数を近似するために連続学習の問題を減らした。
本稿では,2次近似を用いたオートディフ2次積分法と,ニューラルネットワーク近似を用いたニューラルコンソリデーションという2つのコアセットフリー手法を提案する。
ニューラルコンソリデーションは、入力次元が小さい古典的なタスクシーケンスでは良好に機能し、オートディフ二次コンソリデーションは、固定された事前訓練された特徴抽出器を持つイメージタスクシーケンスでは一貫して良好に機能する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:20:24 GMT)
Non-positive energy quasidistributions in coherent collision models [0.0] 量子系および環境粒子の内部エネルギー変動の事例に付随するカークウッド・ディラック準確率分布(KDQ)を決定する。
この非平衡物理アプローチを用いて、モデルの衝突過程が量子特性を示す条件を認証する。
我々は、KDQエネルギー分布の分散を見て、量子システムによって交換されるエネルギーの速度を定量化する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:26:23 GMT)
No Silver Bullets: Why Understanding Software Cycle Time is Messy, Not Magic [0.0] 216の組織で55,000以上の観測データを用いて,チケット作成から完成までのサイクルタイムを計測した。
サイクルタイムと週あたりのコーディング日数、マージされたプルリクエストの数、コラボレーションの度合いといった要因との間には、正確だが控えめな関連性があります。
以上の結果から,一般的な職場要因は期待方向のサイクル時間に影響を及ぼすが,どの観測でも典型的性能に関する限られた信号が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:52:46 GMT)
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations [0.0] 本稿では,ドメイン固有のアノテーションを使わずに,単一のRGBカメラから3Dオブジェクト検出器をトレーニングする方法を提案する。
この手法は3つの公開データセットで評価され、人間のラベルを使わずに、先行研究よりもかなりの差で性能が向上する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:27:10 GMT)
Many-Body Open Quantum Systems [0.0] 我々は、散逸性およびコヒーレントなプロセスの両方を高度に調整・制御できるプラットフォームにおけるオープン量子多体物理学の理解における最近の理論的進歩について論じる。
熱や多体損失などの相関した多体散逸過程の存在下でのオープン量子多体系のダイナミクスを概観する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:28:18 GMT)
Magic dynamics in many-body localized systems [0.0] 非安定剤性(Nonstabilizerness)、または量子魔法(quantum magic)は、量子状態を作るのに必要なクリフォードの演算を特徴づける。
本研究は、乱れた量子多体系の力学において、非安定化剤性がどのように拡散するかを考察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:46:49 GMT)
Local Quenches from a Krylov Perspective [0.0] 我々は、共形場理論における局所結合および分割クエンチに対するランツォ係数、拡散複雑性、クリロフエントロピーを導出する。
さらに,拡散複雑性とクリロフエントロピーは相互作用量子系の非平衡力学を探索するための強力なツールであることを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:36:52 GMT)
Leveraging Large Language Models to Address Data Scarcity in Machine Learning: Applications in Graphene Synthesis [0.0] 材料科学における機械学習は、限られた実験データのために困難に直面している。
大規模言語モデル(LLM)を用いて機械学習の性能を向上させる戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:04:38 GMT)
Learning Using a Single Forward Pass [0.0] 資源制約のある環境における従来のバックプロパゲーションの限界を克服する学習アルゴリズムを提案する: Solo Pass Embedded Learning Algorithm (SPELA)
SPELAは高速学習機能を備えており、重量を更新するための局所的な損失関数を動作させ、勾配の伝播に割り当てられたリソースを著しく節約し、計算グラフを十分に正確に保存する。
この結果から,SPELAは資源制約のあるエッジAIアプリケーションにおいて,学習の理想的な候補となる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:32:41 GMT)
Leap into the future: shortcut to dynamics for quantum mixtures [0.0] 強い反発性原子ガス混合物の長時間の力学に短時間でアクセスできることを示す。
映画プレーヤーの次のチャプターボタンが、観たい映画の一部に素早く届くようにしているように、それは未来への飛躍だ。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:41:43 GMT)
Lawful and Accountable Personal Data Processing with GDPR-based Access and Usage Control in Distributed Systems [0.0] 本稿では,データ処理活動の合法性に関する法的議論を確立するための,自動規範推論のためのケースジェネリック手法を提案する。
議論は、プライバシーの専門家によるケース固有の法的資格に基づいて確立され、人間をループに導く。
GPDRから抽出した要求に対して、結果のシステムは設計され、批判的に評価される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:49:34 GMT)
Large-scale Remote Sensing Image Target Recognition and Automatic Annotation [0.0] LRSAAと呼ばれる大面積リモートセンシング画像におけるオブジェクト認識と自動ラベリングの手法を提案する。
YOLOv11とMobileNetV3-SSDオブジェクト検出アルゴリズムをアンサンブル学習により統合し,モデル性能を向上させる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:54:40 GMT)
Krylov complexity for non-local spin chains [0.0] 本研究では、Isingモデルの異なる非局所バージョンにおけるKrylov複雑性を用いた演算子成長について検討する。
非局所性は演算子をすべてのサイトへ高速にスクランブルさせる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:13:25 GMT)
Is attention all you need to solve the correlated electron problem? [0.0] 我々は、固体中の相互作用する電子問題を解くために、自己アテンションアンサッツを用いることができることを示した。
モワール量子材料に関するシステマティック・ニューラル・ネットワークの変動型モンテカルロによる研究により、自己注意型アンサッツが正確で効率的で偏りのない解を提供することを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:05:44 GMT)
Intersubband optical absorption in the GaN/AlN qunatum wire with donor-doping [0.0] 本研究は,QWRとQDの光学特性を包括的に解析することにより,GaN/AlNヘテロ構造を理解することを促進する。
その結果、半導体ナノ構造が光電子装置の光学特性に与える影響の明確な証拠が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:58:24 GMT)
In Search Of Lost Tunneling Time [0.0] 我々は,結合デルタ電位と定電場からなる静的一次元トンネルモデルの時刻時間を算出する。
トンネル出口ではゼロではないものの、原子から遠く離れた検出器で消滅する。
このモデルにより, 位置分解トンネル時間の類似を導出できる。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 21:12:07 GMT)
Hyperoctant Search Clustering: A Method for Clustering Data in High-Dimensional Hyperspheres [0.0] 座標の符号(ハイパーロクタント)によって定義される空間の領域に適用される位相的アプローチに基づく新しいクラスタリング法を提案する。
密度基準によれば、この方法はグラフの分割に基づいてデータポイントのクラスタを構築する。
テキストマイニングにおいて重要な課題である話題検出の応用を選択する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:41:44 GMT)
HGO-YOLO: Advancing Anomaly Behavior Detection with Hierarchical Features and Lightweight Optimized Detection [0.0] 本研究では,HGNetv2アーキテクチャをYOLOv8に統合したHGO-YOLOを提案する。
評価の結果,提案アルゴリズムはmAP@0.5の87.4%,リコールレート81.1%,モデルサイズは4.6MB,フレームレート56FPSであることがわかった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:29:12 GMT)
Geometric Delocalization in Two Dimensions [0.0] 標準平坦な2次元空間における局所化とは対照的に、ランダムウォーキング粒子が無限大に逃げ出す過渡的な2次元曲面の存在を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:00 GMT)
Formulas for Mutually Orthogonal Quantum States in Two-Qubit Systems: Orthogonal Schmidt Decompositions [0.0] 我々は、その絡み合い構造に基づいて正則集合を分類する。
我々は任意の純粋状態に対して明確なシュミット分解公式を導出する。
1つまたは2つの最大絡み合った状態を含むものを分析する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:10:36 GMT)
Force-current structure in Markovian open quantum systems and its applications: geometric housekeeping-excess decomposition and thermodynamic trade-off relations [0.0] エントロピー生成速度は、力と電流演算子の積によって与えられることを示す。
この枠組みは離散古典系の非平衡熱力学と包括的に類似している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:53:11 GMT)
Folded Context Condensation in Path Integral Formalism for Infinite Context Transformers [0.0] 本稿では、パス積分形式論の枠組みの中で、そのコアメカニズムを再解釈することにより、トランスフォーマーアルゴリズムの一般化された定式化を提案する。
よりコンパクトで効率的な表現が得られ、シーケンスのコンテキスト情報をメモリのようなセグメントに凝縮する。
本稿では,この手法の有効性をPasskey検索タスクと要約タスクで検証し,提案手法が履歴情報を保存し,メモリ使用率とシーケンス長を線形に拡張することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:24:46 GMT)
Flavor Patterns of Fundamental Particles from Quantum Entanglement? [0.0] 量子絡み合いとクォークの混合度との間には驚くべき関係がある。
量子絡み合いの最小化は、粒子物理学の入力パラメータを決定する基本的な原理かもしれないと推測する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:44:26 GMT)
Fine-Tuning LLMs for Report Summarization: Analysis on Supervised and Unsupervised Data [0.0] 報告要約の特定のタスクに対する微調整大型言語モデル(LLM)の有効性について検討した。
2つの異なる微調整手法を並列に実験する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:47:11 GMT)
Feshbach Resonances in Exciton-Charge-Carrier Scattering in Semiconductor Bilayers [0.0] トンネルにより誘導される層ハイブリッド化は、原子性半導体における2つの異なるFeshbach共鳴のクラスを発生させる可能性がある。
顕微鏡散乱理論に基づいて、これらの2種類のフェシュバッハ共鳴は、電子と短寿命の層内相互作用と長寿命の層間励起子を調整できることを示した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:43:50 GMT)
Fabrication and characterization of vacuum-gap microstrip resonators [0.0] 真空ギャップマイクロストリップの製造プロセスの開発について報告する。
高容量伝送線に加えて、このアーキテクチャはエアブリッジとコンパクトパラレルプレートコンデンサも可能にしている。
低温希釈冷凍機における分散アルミニウムと粒状アルミニウム共振器を用いて製造性能を調べた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:14:11 GMT)
Exploring Dynamics of Open Quantum Systems in Naturally Inaccessible Regimes [0.0] 我々は、ポストセレクションによりリンドブラッドマスター方程式を一般化されたリウヴィリア形式に一般化する。
我々の形式主義は、自然発生系では到達不能な状態を持つパラメータ空間を提供する。
この一般化されたリウヴィリア形式主義は、新しい現象や量子技術を探究する機会を与える。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:52:02 GMT)
Exact time-evolving scattering states in open quantum-dot systems with an interaction: Discovery of time-evolving resonant states [0.0] クーロン相互作用を持つオープンダブル量子ドット系の時間進化多電子状態について検討する。
量子ドット上の局在電子の初期状態について、我々は新しいタイプの正確な時間進化状態を見つけ、これを時間進化共鳴状態と呼ぶ。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 04:00:39 GMT)
Evaluating LLaMA 3.2 for Software Vulnerability Detection [0.0] 大規模な言語モデルであるLLaMA 3.2を微調整して脆弱性検出に使用するDiverseVulデータセットの洗練されたバージョンを提案する。
実験結果から, 前処理技術の使用により性能が向上したことが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:47:41 GMT)
Entangled responsibility: an analysis of citizen science communication and scientific citizenship [0.0] 本稿では,科学知識生産における市民の関与のプロセスに焦点を当てる。
市民科学の発展は、参加型デザイン研究やフェミニストテクノサイエンスのような多様な分野の恩恵を受けることができると論じている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:38:49 GMT)
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance [0.0] 本稿では,多言語のパフォーマンスを犠牲にして,英語タスクのパフォーマンスが維持されたかどうかを考察する。
有意な結果が得られた全ての実験は、現在の量子化の慣行が多言語のパフォーマンスを不当に損なわないことを示している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:36:46 GMT)
Engineering interactions by collective coupling of atom pairs to cavity photons for entanglement generation [0.0] 工学的な原子と原子の相互作用は、新しい物質の相を制御し、多体の絡み合った状態の効率的な調製に不可欠である。
誘導原子-光子相互作用は、2モード超低温ボソンにおいて頑健な多体絡みを生じさせることを示す。
本研究は, ハイブリッド原子-光子系における光と物質の新しい位相を研究するために, 原子-原子相互作用の工学的手法を開拓するものである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:51:10 GMT)
Emergence of synchronisation in a driven-dissipative hot Rydberg vapor [0.0] この系の同期は原子運動のために予期せぬものである。
理論上は、大域Rydberg密度平均場による十分に強い相互作用が周波数および位相エントレメントを引き起こすことを示す。
2光子励起方式のプローブレーザの透過において、蒸気のバルク量の発振を検出する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:44:53 GMT)
Elderly Activity Recognition in the Wild: Results from the EAR Challenge [0.0] 本稿では, WACV 2025におけるコンピュータビジョン・フォー・スモールズワークショップの一環として, 高齢者行動認識(EAR)チャレンジの解決策を提案する。
本手法は,高齢者固有のデータセットの伝達学習を通じて微調整を行い,適応性を向上する,最先端の行動認識モデルを構築している。
本ソリューションは, 高齢者活動の分類における有効性を強調し, 一般のリーダーボード上で0.81455の精度を実現している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:07:05 GMT)
Eigenstate Correlations in Dual-Unitary Quantum Circuits: Partial Spectral Form Factor [0.0] 固有状態相関の解析的な洞察は、最近導入された部分スペクトル形状因子によって得られる。
熱力学限界におけるカオス二重単位量子回路における部分スペクトル形状因子について検討した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:03:11 GMT)
EfficientQA : a RoBERTa Based Phrase-Indexed Question-Answering System [0.0] 言語モデルの自然言語理解を,質問や回答候補を表す高密度なベクトルに変換することができることを示す。
提案モデルでは,Phrase-Indexed Question Answering (PIQA) の最先端結果が得られた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:43:32 GMT)
Efficient Distillation of Classifier-Free Guidance using Adapters [0.0] アダプタ誘導蒸留(AGD)は、CFGを単一の前方通過でシミュレートする新しい手法である。
AGDは基本モデルを凍結させ、最小限の追加パラメータを訓練するのみである。
我々はAGDがCFGに匹敵するあるいは優れたFIDを複数のアーキテクチャで達成していることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:55:08 GMT)
Dynamics of disordered quantum systems with two- and three-dimensional tensor networks [0.0] 2次元および3次元テンソルネットワークは、格子上のイジングスピングラスの量子アニールダイナミクスを正確に、効率的にシミュレートできることを示す。
この結果から, テンソルネットワークは2次元および3次元の量子力学をシミュレーションする上で, 実現可能な手法であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:29:40 GMT)
Dynamic thermalization on noisy quantum hardware [0.0] 電子量子コンピュータ上の熱可観測物質をエミュレートすることは、多体物理学の量子シミュレーションに不可欠である。
熱風呂のない小型閉鎖系では, 熱可観測物と揺らぎが得られうることを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:00 GMT)
Differentially Private Zeroth-Order Methods for Scalable Large Language Model Finetuning [0.0] プリトレーニング済みLLMのDP微調整は、タスク固有のデータセットのプライバシ保護に広く用いられている。
DP-SGDのスケーラビリティを限界まで押し上げたにもかかわらず、DP-SGDベースの微調整法は残念ながらSGD固有の非効率性によって制限されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:52:03 GMT)
Detecting kHz gravitons from a neutron star merger with a multi-mode resonant mass detector [0.0] この多モード検出器は、最大質量元素の重力波との結合強度を保持する通常のモードを有する。
これにより、通常のモードは、トンスケールの最大の質量のためにグラビトン吸収率を持つことができる。
我々は、端質量のエネルギー測定を通して、バーの重力フォノンを直接数えることの可能性について議論する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 09:15:38 GMT)
DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains [0.0] 低照度画像強調(LLE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
これらの問題は、物体検出、顔認識、自律運転などのコンピュータビジョンタスクのパフォーマンスを妨げる。
本稿では,2つの異なる注意機構を組み込んだ新しいアーキテクチャであるDual Light Enhance Network(DLEN)を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 02:13:57 GMT)
CtrlRAG: Black-box Adversarial Attacks Based on Masked Language Models in Retrieval-Augmented Language Generation [0.0] Retrieval-Augmented Generation (RAG) システムは、外部知識ベースを統合することにより、Large Language Models (LLM) を強化する。
我々は,実世界のシナリオに合わせて,ブラックボックス設定におけるRAGシステムのための新たな攻撃手法であるCtrlRAGを提案する。
実験の結果,CtrlRAGは情動操作と幻覚増幅の両目的において3つのベースライン法より優れていた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:55:15 GMT)
Creating Cybersecurity Regulatory Mechanisms, as Seen Through EU and US Law [0.0] デジタル機器やシステムは社会のあらゆる面で広く使われている。
敵が同様のレベルでサイバー攻撃を起こすリスクは依然として高い。
異なる管轄区域は、他の場所で成功した技術からインスピレーションを受けなければならない。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 12:33:33 GMT)
Counting with the quantum alternating operator ansatz [0.0] 本稿では,量子交互演算子 Ansatz (QAOA) に基づく変分アルゴリズムを導入する。
我々のアルゴリズムはVQCountと呼ばれ、ランダムサンプリングと近似カウントの等価性に基づいており、QAOAを解サンプリングとして利用する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:02 GMT)
Consistency of EFT illuminated via relative entropy: A case study in scalar field theory [0.0] 相対エントロピーの非負性は摂動計算に反する可能性があることを示す。
単体インフレーションのFTを再検討し、その非線形パラメータ$f_rm NL$とEDT記述の一貫性条件の関係を示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:18:39 GMT)
Complexity for one-dimensional discrete time quantum walk circuits [0.0] 1次元離散時間量子ウォーク(DTQW)から導かれる混合状態密度演算子の複雑性を計算する。
この複雑さは、混合状態の正準浄化から得られる2量子ビット量子回路を用いて計算される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:11:37 GMT)
Complete Key Recovery of a DNA-based Encryption and Developing a Novel Stream Cipher for Color Image Encryption: Bio-SNOW [0.0] 画像暗号化のための新しいDNAベースのストリーム暗号Bio-SNOWを提案する。
Bio-SNOWは、堅牢な画像暗号化を提供する。
これらの結果から,Bio-SNOWは,軽量および画像暗号アプリケーションのための有望なDNAベースの暗号として注目されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:09:47 GMT)
Comparing regularisation paths of (conjugate) gradient estimators in ridge regression [0.0] 線形回帰におけるペナル化リッジ基準を最小化するための反復アルゴリズムとして,勾配勾配,勾配流,共役勾配を考察する。
特に、オラクル共役勾配は勾配流の最適性を共有し、尾根回帰は定数係数までオラクルする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 07:25:09 GMT)
Coarse Set Theory for AI Ethics and Decision-Making: A Mathematical Framework for Granular Evaluations [0.0] 粗い集合論(CST)は、粗い倫理(CE)を定式化する数学的枠組みを導入する
CEは人間の評価やAI分類システムでよく使われる粗粒度決定過程をモデル化する。
CSTは全順序構造と粗い写像を用いて集合間の階層的関係を定義し、決定の粒度を動的に調整することができる。
この研究では、グレーディングシステム、自動レコメンデーション、リスクアセスメントにCSTを採用し、公正性を高め、バイアスを低減し、AIによる意思決定における透明性を向上させる可能性を実証している。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 10:04:26 GMT)
Chat-GPT: An AI Based Educational Revolution [0.0] AI革命は前例のないペースで勢いを増している。
教育におけるAIの潜在的な革命的影響について、多くの記事が書かれている。
本稿では,ChatGPTの実践的影響と,その実践が教育の新しい時代への重要な一歩であると考えられる理由について考察する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 06:33:07 GMT)
Causality violation of Schrödinger-Newton equation: direct test on the horizon? [0.0] 非線形シュリンガー・ニュートン方程式(SNE)に基づく重力の古典性と量子性に関する光学的テストの提案
我々は、最近設計された実験で、巨大なプローブの量子光学モニタリングが、1つのプローブ上の偽のアクション・アット・ア・ディスタンス(音響)を予測することを明らかにした。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:38:03 GMT)
Cauchy-Schwarz bound on the accuracy of truncated models in non-relativistic quantum electrodynamics [0.0] コーシー=シュワルツの不等式は、有限個の物質エネルギーレベルしか持たない光マター理論の精度を制限していることを示す。
輪郭空間におけるユニタリ回転は、逆の仮定が誤った予測をもたらすため、ゲージ間の変換が不可能である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:14:41 GMT)
Can Proof Assistants Verify Multi-Agent Systems? [0.0] Sodaは高レベルの関数型およびオブジェクト指向言語である。
強く静的に型付けされた高レベルのプログラミング言語であるScalaだけでなく、リーンにも、コードのコンパイルをサポートする。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 00:24:29 GMT)
Bypassing eigenstate thermalization with experimentally accessible quantum dynamics [0.0] 固有状態の熱化は、フォン・ノイマンの初期の量子エルゴード性の研究以来、量子統計力学の妥当性の決定者として重要な役割を果たしてきた。
ここでは、エネルギーレベル間隔を有限エネルギー分解能で粗粒化する制限に対処するために、エネルギーバンド熱化の概念を紹介する。
エネルギーバンドの熱化は、エネルギー固有値や固有状態の微妙な性質に頼ることなく、ほぼ全ての物理的状態における観測可能な熱化を時間スケールで表すことを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 18:00:05 GMT)
Bound state formation within the Lindblad approach [0.0] 我々は, P"oschl-Teller電位を含む非相対論的境界状態の形成について検討し, 生成時間と熱平衡について検討した。
変換されたリンドブラッド方程式は、ソースを持つ拡散対流方程式の観点で、したがって散逸的な量子マスター方程式の流体力学的定式化を提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:52:15 GMT)
Automatic Speech Recognition for Non-Native English: Accuracy and Disfluency Handling [0.0] 本研究は,L2-ARCTICコーパスからの録音を用いて,英語アクセント音声の最先端5つの音声認識システムについて検討した。
読み上げ音声では,Whisper と AssemblyAI がそれぞれ 0.054 と 0.056 のマッチング誤り率 (MER) で最高の精度を達成した。
自発音声では,平均MERは0.063。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 05:09:44 GMT)
Artificial Utopia: Simulation and Intelligent Agents for a Democratised Future [0.0] 政治と経済学のトップダウンシステムは、21世紀の圧力のかかる課題に追随するのに苦労している。
政治と経済学におけるボトムアップの民主化と参加的アプローチは、これらの問題に直面し克服するための有望な代替手段としてますます見なされている。
本稿では, 形式的, 計算的手法, 人工知能に焦点をあてた, ユートピア民主化の取り組みに焦点を当てた新たな研究課題を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 14:20:58 GMT)
Artificial Intelligence in Deliberation: The AI Penalty and the Emergence of a New Deliberative Divide [0.0] デジタル審議は民主的参加を拡大したが、課題は残る。
人工知能(AI)の最近の進歩は潜在的な解決策を提供するが、熟考におけるAIの役割に対する大衆の認識はいまだに過小評価されている。
AIが熟考、公的な信頼、受け入れ、参加意欲に統合される場合、影響される可能性がある。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:33:15 GMT)
Analyzing the temporal dynamics of linguistic features contained in misinformation [0.0] 本研究では,2010年から2024年にかけてのPoitiFact文の解析に自然言語処理を用いる。
その結果,PolititiFact文では,文の感情が時間とともに著しく低下し,概して否定的な傾向がみられた。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 01:43:38 GMT)
An alternative explicit circuit diagram for the quantum search algorithm by implementing a non-unitary gate [0.0] グロバー探索アルゴリズムの最終量子状態はグラマーシュミット過程から正規化されたマーク付き量子状態であるため、非単位ゲートを用いてこのベクトルを生成することができる。
非ユニタリ行列の平方根とGram-Schmidt過程を模倣したユニタリ行列を用いて、複数の明示的なユニタリ実装を提案する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:39:10 GMT)
Advanced Image Segmentation Techniques for Neural Activity Detection via C-fos Immediate Early Gene Expression [0.0] 我々は、畳み込みニューラルネットワーク(CNN)とUnetモデルを含むセグメンテーションプロセスのための新しいワークフローを開発する。
我々は,C-fos発現の著しい部位と正常組織領域との鑑別における本法の有効性を実証した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 23:42:49 GMT)
Adaptive routing protocols for determining optimal paths in AI multi-agent systems: a priority- and learning-enhanced approach [0.0] 本稿では,AIマルチエージェントネットワークに適した拡張適応ルーティングを提案する。
タスク複雑性,ユーザ要求優先度,エージェント能力,帯域幅,レイテンシ,負荷,モデル高度化,信頼性などの多面的パラメータを組み込んだ。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:16:54 GMT)
APECS: Adaptive Personalized Control System Architecture [0.0] 本稿では,アダプティブ・パーソナライズド・コントロール・システム(APECS)アーキテクチャについて述べる。
システムの目的に対して適切な制約を定義するアーキテクチャが開発されている。
リプシッツと結果の制御子上のセクター境界を定式化する方法が導出され、望ましい制御特性が保証される。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 20:11:19 GMT)
AI-driven control of bioelectric signalling for real-time topological reorganization of cells [0.0] 生体電気信号は、細胞の分化、増殖、アポトーシス、組織の形態形成を含む重要な過程を制御するのに重要な役割を果たしている。
近年の研究では、これらのシグナルを調節して組織再生を制御できることが示されている。
本研究の目的は、生体電気信号を用いた新しいバイオメディカル・バイオエンジニアリング応用の開発である。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:30:32 GMT)
AI-Enabled Knowledge Sharing for Enhanced Collaboration and Decision-Making in Non-Profit Healthcare Organizations: A Scoping Review Protocol [0.0] このプロトコルは、非営利医療組織におけるAIによる知識共有に関する既存の証拠を体系的にマッピングするために設計されたスコープレビューの概要である。
本研究の目的は、特にUSAID運用中止後の外部支援の削減という文脈において、このような技術が協調と意思決定をいかに促進するかを検討することである。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:09:12 GMT)
AI Biases as Asymmetries: A Review to Guide Practice [0.0] バイアスはAIシステムにとって不可欠なものと認識され、バイアスの少ない選択肢よりも好まれる。
AIシステムのエラーバイアス、不平等バイアス、プロセスバイアスの3つの主要な非対称性を識別する。
私たちは、AI開発とアプリケーションのパイプラインの中で、それぞれのタイプのバイアスが良い、悪い、あるいは避けられないであろう場所を強調します。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 13:40:28 GMT)
A primer on optimal transport for causal inference with observational data [0.0] このレビューの目的は、最適な輸送と観測データによる因果関係の同定の間の驚くほど深い関係について紹介することである。
結果として、このレビューは、統計学、数学、計量学の様々な分野の言語と表記を統一することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 19:51:37 GMT)
A Step Toward Interpretability: Smearing the Likelihood [0.0] 本稿では,機械が活用する物理的エネルギースケールの分離と同定のための定義とそれに対応する実用的な方法を提案する。
我々は、(近似)スケーリング法則が極端な値理論の結果であることを示す。
例えば、クォークとグルーオンジェットの識別について検討し、スミアーズの可能性を構築し、分解能が低下するにつれて識別力が着実に増加することを示す。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 16:35:05 GMT)
A Review on Geometry and Surface Inspection in 3D Concrete Printing [0.0] 本研究では3次元コンクリート印刷における形状と表面品質制御の諸側面について検討する(3DCP)。
データキャプチャ技術の4つのカテゴリについて検討し、AMCの文脈におけるその利点と限界について論じる。
印刷物の製造サイクルの異なる段階において, (i) 印刷中, (ii) レイヤーワイド, (iii) プレアセンブリ, (iv) アセンブリなど,様々な品質管理戦略を探索した。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 15:48:17 GMT)
A Review on Generative AI For Text-To-Image and Image-To-Image Generation and Implications To Scientific Images [0.0] 本稿では、生成AIの範囲内でのテキスト・ツー・イメージ生成と画像・ツー・イメージ生成の最先端を概観する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 22:22:19 GMT)
A Representationalist, Functionalist and Naturalistic Conception of Intelligence as a Foundation for AGI [0.0] 論文は、人工知能(AGI)の創出に関連する基礎原則を分析している。
知性は、これまで未知の条件下でゴールを達成できる新しいスキルを作る能力であると理解されている。
AGIは、ノー・フリー・ランチの定理によって制限されているにもかかわらず、人間よりも世界への根本的なアクセスを得られることが示されている。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 17:58:00 GMT)
A Formally Verified Lightning Network [0.0] われわれは、Lightning Network(LN)が常に誠実なユーザーの資金を保護していることを示すために、正式な検証を行っている。
我々は、LNのカスタム実装(単純化)を提供し、所望のセキュリティ目標を表現し、初めて、彼らがすべてのシナリオで維持されているというマシンチェック可能な証明を提供する。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 11:33:22 GMT)
(SPT-)LSM theorems from projective non-invertible symmetries [0.0] 射影対称性は量子格子モデルにおいてユビキタスであり、位相図や絡み合い構造を制約するために利用することができる。
本稿では,非可逆対称性と格子変換によって形成される射影代数の結果について検討する。
射影性はまた、$mathsfRep(G)times Z(G)$ sub-symmetriesの後に双対対称性に影響を与える。
論文参考訳(メタデータ) (Mon, 10 Mar 2025 03:17:24 GMT)