TAR3D: Creating High-Quality 3D Assets via Next-Part Prediction [137.3] TAR3Dは、3D対応ベクトル量子可変オートエンコーダ(VQ-VAE)と生成事前学習トランス(GPT)で構成される新しいフレームワークである。
TAR3Dは,テキスト・ツー・3Dタスクや画像・ツー・3Dタスクにおいて,既存の手法よりも優れた生成品質が得られることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:21:56 GMT)
Error Analyses of Auto-Regressive Video Diffusion Models: A Unified Framework [127.6] 様々な自動回帰ビデオ拡散モデル(ARVDM)は、リアルなロングフォームビデオの生成において顕著な成功を収めた。
我々はこれらのモデルに関する理論的基盤を開発し、既存のモデルの性能を改善するために洞察を利用する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:32:44 GMT)
High-Quality Mask Tuning Matters for Open-Vocabulary Segmentation [109.2] ここでは,CLIPのマスク分類能力を高めるために,生成されたマスクの代わりに接地トラスマスクを使用するMaskCLIP++を提案する。
低コストの微調整を経て、MaskCLIP++はマルチドメインデータセットのマスク分類性能を大幅に改善した。
我々は,A-847,PC-459,A-150,PC-59,PAS-20データセット上で+1.7,+2.3,+2.1,+3.1,+0.3 mIoUの性能改善を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:04:32 GMT)
A Survey of Direct Preference Optimization [103.6] LLM(Large Language Models)は、前例のない生成能力を示す。
人的価値との整合性は、有用で無害なデプロイメントを保証する上で、依然として重要です。
直接優先度最適化(DPO)は、最近、合理化された代替案として注目されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:45:15 GMT)
Depth Any Video with Scalable Synthetic Data [98.4] 多様な仮想環境からリアルタイムのビデオ深度データをキャプチャする,スケーラブルな合成データパイプラインを開発した。
我々は、生成的ビデオ拡散モデルの強力な先駆を生かして、実世界の動画を効果的に処理する。
我々のモデルは、空間的精度と時間的一貫性の観点から、過去のすべての生成深度モデルより優れている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:16:59 GMT)
Unified Dense Prediction of Video Diffusion [91.2] テキストプロンプトからビデオとその対応するエンティティセグメンテーションと深度マップを同時に生成する統合ネットワークを提案する。
カラーマップを用いて実体マスクと深度マップを表現し,RGBビデオ生成と密集予測を密に統合する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:41:02 GMT)
Dual Test-time Training for Out-of-distribution Recommender System [91.2] DT3ORと呼ばれるOODレコメンデーションのための新しいDual Test-Time-Trainingフレームワークを提案する。
DT3ORでは、テスト期間中にモデル適応機構を導入し、リコメンデーションモデルを慎重に更新する。
我々の知る限りでは、テストタイムトレーニング戦略を通じてOODレコメンデーションに対処する最初の研究である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:06:24 GMT)
Learning to Contextualize Web Pages for Enhanced Decision Making by LLM Agents [90.0] 複雑なWebページをより理解しやすい形式にするための言語モデルを学習するためのフレームワークであるLCoWを紹介する。
LCoWは、別々のコンテキスト化モジュールをトレーニングすることで、意思決定からWebページ理解を分離する。
我々の文脈化モジュールは、様々なスケールのLLMエージェントと効果的に統合され、意思決定能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:33:40 GMT)
Solving Bayesian inverse problems with diffusion priors and off-policy RL [86.7] 相対軌道バランス(Relative Trajectory Balance, RTB)は、逆問題の最適解法である。
視覚・科学における線形・非線形逆問題に挑戦するために,RTBを用いて条件拡散モデル後部を事前訓練した未条件前部から訓練する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:45:22 GMT)
GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.9] 本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:28:05 GMT)
Revealing and Reducing Gender Biases in Vision and Language Assistants (VLAs) [82.6] 画像・テキスト・ビジョン言語アシスタント(VLA)22種における性別バイアスの検討
以上の結果から,VLAは実世界の作業不均衡など,データ中の人間のバイアスを再現する可能性が示唆された。
これらのモデルにおける性別バイアスを排除するため、微調整に基づくデバイアス法は、デバイアス化と性能維持の最良のトレードオフを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:00 GMT)
Investigating User Perspectives on Differentially Private Text Privatization [81.6] この研究は、$textitscenario$, $textitdata sensitivity$, $textitmechanism type$, $textitreason for data collection$, $textitreason for user preferences for text privatizationについて調査する。
これらの要因がプライバシー決定に影響を及ぼす一方で、ユーザはプライベートな出力テキストの有用性と一貫性に非常に敏感である、ということを学びました。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:33:20 GMT)
Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog [81.3] ビデオグラウンドダイアログは、正確な応答生成のために、ダイアログ履歴とビデオコンテンツの両方を深く理解する必要がある。
本稿では,テキストエンコーダ,ビジュアルエンコーダ,ジェネレータで構成される反復探索・推論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:09:37 GMT)
Inductive Moment Matching [81.0] Inductive Moment Matching (IMM) は1段階または数段階のサンプリングのための新しい生成モデルである。
IMMはImageNet-256x256上の拡散モデルを8ステップのみを用いて1.99 FIDで上回り、CIFAR-10上で1.98の最先端の2ステップFIDをスクラッチから訓練したモデルで達成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:00:02 GMT)
I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data? [79.0] 大規模言語モデル (LLM) は、多くの人が知能の形式を示すと結論づけている。
本稿では,潜在離散変数として表される人間の解釈可能な概念に基づいてトークンを生成する新しい生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:21:17 GMT)
ClassDiffusion: More Aligned Personalization Tuning with Explicit Class Guidance [78.4] 新しい概念を学ぶ際に, 概念空間を明示的に規制するために, ** 連続保存損失** を利用するテクニックである **ClassDiffusion** を提示する。
このアプローチは単純ではあるが、ターゲット概念の微調整過程における意味的ドリフトを効果的に防止する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:45:13 GMT)
AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents [75.9] 我々は、既存のAIエージェントと将来のAIエージェントが、潜在的にプライベートな情報の処理をどの程度制限できるかを評価するために、AgentDAMと呼ばれるベンチマークを開発する。
我々のベンチマークは、現実的なWebインタラクションシナリオをシミュレートし、既存のWebナビゲーションエージェントすべてに適用できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:30:31 GMT)
BiasConnect: Investigating Bias Interactions in Text-to-Image Models [73.8] テキスト・ツー・イメージ・モデルにおけるバイアス相互作用の分析と定量化を目的とした新しいツールであるBiasConnectを紹介する。
我々の手法は、与えられたバイアスが修正されたとき、他のバイアス次元が理想的な分布に向かって、あるいは離れてどのように変化するかを示す経験的推定を提供する。
本稿では,最適なバイアス緩和軸の選択,学習する依存関係の異なるTTIモデルの比較,およびTTIモデルにおける交叉社会的バイアスの増幅を理解するためのBiasConnectの有用性を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:01:41 GMT)
Revealing the Implicit Noise-based Imprint of Generative Models [71.9] 本稿では,検出タスクにノイズに基づくモデル固有インプリントを利用する新しいフレームワークを提案する。
様々な生成モデルからのインプリントを集約することにより、将来のモデルのインプリントを外挿してトレーニングデータを拡張することができる。
提案手法は,GenImage,Synthbuster,Chameleonの3つの公開ベンチマークにおいて,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:04:53 GMT)
Teaching LMMs for Image Quality Scoring and Interpreting [71.1] Q-SiT(Quality Scoring and Interpreting Joint Teaching)は,画像品質のスコアリングと解釈を同時に行うための統合フレームワークである。
Q-SiTは、Q-SiT-miniと共に画像品質スコアリングと解釈タスクを同時に実行する最初のモデルである。
実験結果から,Q-SiTはIQA能力の優れた両タスクにおいて高い性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:39:33 GMT)
SuperCarver: Texture-Consistent 3D Geometry Super-Resolution for High-Fidelity Surface Detail Generation [70.8] SuperCarverは、粗いメッシュにテクスチャ一貫性のある表面の詳細を追加するのに適した3Dジオメトリフレームワークである。
幾何的詳細生成を実現するために,2つのペアの低極性および高極性正規レンダリングのデータセットに微調整を施した決定論的事前誘導正規拡散モデルを開発した。
メッシュ構造を、潜在的に不完全な正規写像予測から最適化するために、単純で効果的なノイズ耐性逆レンダリング方式を設計する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:38:45 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [70.7] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
目標は、受信したコンテキストのすべての基盤関数を最小化することです。
サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:15:47 GMT)
Exo2Ego: Exocentric Knowledge Guided MLLM for Egocentric Video Understanding [70.0] 現在のMLLMは、主に第三者(外見中心)のビジョンに焦点を当てており、一対一(自我中心)の動画のユニークな側面を見下ろしている。
本研究では,エゴ中心領域とエゴ中心領域のマッピングを学習し,エゴ中心領域の理解を高めることを提案する。
Ego-ExoClipは1.1M同期のEgo-Exoクリップテキストペアからなる事前学習データセットである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:10:33 GMT)
Generative Frame Sampler for Long Video Understanding [69.9] 本稿では,ビデオLLMと統合されたプラグイン・アンド・プレイモジュールであるGenerative Frame Sampler (GenS)を導入し,映像知覚の効率化を図る。
大規模な実験により、GenSは様々なVideoLLMのパフォーマンスを継続的に向上させることが示された。
GenSを装着すると、オープンソースのVideoLLMは、長大なビデオベンチマークで印象的な結果が得られる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:16:39 GMT)
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data [69.7] 音声分類データセットを合成データで拡張する新しい手法であるSynthioを提案する。
最初の課題を克服するために、好みの最適化を用いて、T2Aモデルの世代と小規模データセットを整列する。
2つ目の課題に対処するために,大規模言語モデルの推論能力を活用する新しいキャプション生成手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:25:08 GMT)
Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey [69.1] 時空間(ST)データサイエンスは、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。
研究者は、様々なSTタスクに対する適応性と一般化を高めるために、時空間モデル(STFM)の概念を探求し始めている。
STFMは、データセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:42:18 GMT)
DAST: Difficulty-Aware Self-Training on Large Language Models [68.3] 大規模言語モデル(LLM)の自己学習手法は、常に挑戦的なクエリのアンダーサンプルである。
本研究は,自己生成応答の量と品質を改善することに焦点を当てた,難易度を考慮した自己学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:36:45 GMT)
GENEOnet: Statistical analysis supporting explainability and trustworthiness [67.4] Group Equivariant Non-Expansive Operators (GENEOs) は、機械学習と人工知能のためのネットワークを構築する数学的ツールとして登場した。
近年の知見は,eXplainable Artificial Intelligence (XAI) の領域内にそのようなモデルが挿入可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:43:48 GMT)
HaploVL: A Single-Transformer Baseline for Multi-Modal Understanding [67.2] そこで本稿では,マルチモーダル入力を早期に融合し,自動回帰方式で視覚的指示に応答できる新しいアーリーフュージョンLMMを提案する。
提案モデルでは,1つの変圧器を用いた他のLMMと比較して優れた性能を示し,合成LMMによる性能ギャップを著しく狭めている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:01:05 GMT)
A Survey on Trustworthy LLM Agents: Threats and Countermeasures [67.2] 大規模言語モデル(LLM)とマルチエージェントシステム(MAS)はLLMエコシステムの機能を大幅に拡張した。
本稿では,エージェントの信頼性に関する総合的研究であるTrustAgentフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:42:05 GMT)
Decoupled Doubly Contrastive Learning for Cross Domain Facial Action Unit Detection [66.8] そこで本稿では,AU 表現を2つに分離した2つのコントラスト適応 (D$2$CA) 手法を提案する。
D$2$CAは、合成顔の質を評価することにより、AUとドメイン因子を乱すように訓練される。
最先端のクロスドメインAU検出アプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:42:17 GMT)
Structure Language Models for Protein Conformation Generation [66.4] 伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:06:38 GMT)
Global Convergence and Rich Feature Learning in $L$-Layer Infinite-Width Neural Networks under $μ$P Parametrization [66.0] 本稿では, テンソル勾配プログラム(SGD)フレームワークを用いた$L$層ニューラルネットワークのトレーニング力学について検討する。
SGDにより、これらのネットワークが初期値から大きく逸脱する線形独立な特徴を学習できることを示す。
このリッチな特徴空間は、関連するデータ情報をキャプチャし、トレーニングプロセスの収束点が世界最小であることを保証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:33:13 GMT)
Stick to Facts: Towards Fidelity-oriented Product Description Generation [65.8] 我々はFPDG(Fidelity-oriented Product Description Generator)というモデルを提案する。
FPDGは、製品属性情報が常にエンティティワードによって伝達されるため、各単語のエンティティラベルを考慮に入れている。
大規模実世界の製品記述データセットを用いて行った実験は、従来の生成指標と人的評価の両方の観点から、我々のモデルが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:41:38 GMT)
DynOMo: Online Point Tracking by Dynamic Online Monocular Gaussian Reconstruction [65.5] モノクラーカメラ入力からのオンライン2Dおよび3Dポイントトラッキングの課題を対象としている。
我々は3Dガウススプラッティングを利用して動的シーンをオンラインに再構築する。
我々は,オンラインのポイントトラッキングとリコンストラクションを推進し,様々な現実のシナリオに適用可能にすることを目的としている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:00:45 GMT)
Generative Models in Decision Making: A Survey [63.7] 生成モデルは、高逆状態反応領域や中間部分ゴールへエージェントを誘導する軌道を生成することによって意思決定システムに組み込むことができる。
本稿では,意思決定タスクにおける生成モデルの適用について概説する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:32:00 GMT)
Attention Reallocation: Towards Zero-cost and Controllable Hallucination Mitigation of MLLMs [62.9] 約ゼロの余剰コストで幻覚を緩和するための注意再配置(AttnReal)を提案する。
我々のアプローチは,MLLMの注意分布が,歴史的出力トークンによって特徴が支配されるという重要な観測によって動機付けられている。
この観測に基づいて、AttnRealは出力トークンからの過剰な注意をリサイクルし、それを視覚トークンに再配置することで、MLLMの言語優先への依存を軽減します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:18:48 GMT)
Constrained Language Generation with Discrete Diffusion Models [61.8] 本稿では,離散拡散モデルと微分可能最適化を統合し,自然言語に制約を課す新しい手法であるConstrained Discrete Diffusion (CDD)を提案する。
本手法は, 有害な内容の出現防止による毒性軽減, (ii) 形質および配列レベルの語彙的制約, (iii) 特定の性質に順応した新規分子配列生成など, 様々な自然言語制約を満たすために適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:48:12 GMT)
Silent Branding Attack: Trigger-free Data Poisoning Attack on Text-to-Image Diffusion Models [61.6] 本稿では,テキストから画像への拡散モデルを操作する新しいデータ中毒手法であるSilent Branding Attackを紹介する。
トレーニングデータに特定の視覚パターンが繰り返し現れると、モデルはその出力で自然にそれを再現することを学ぶ。
我々は、ロゴを元の画像に不当に注入し、自然にブレンドし、検出されないようにする自動データ中毒アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:21:57 GMT)
A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning [61.4] 強化学習(Reinforcement Learning, RL)に基づく微調整は, 拡散モデルとブラックボックスの目的を整合させる強力なアプローチとして登場した。
拡散微調整のための新しいRLであるLOOP(Left-one-out PPO)を提案する。
以上の結果から, LOOPは様々なブラックボックス対象の拡散モデルを効果的に改善し, 計算効率と性能のバランスを良くすることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:43:07 GMT)
Media and responsible AI governance: a game-theoretic and LLM analysis [61.1] 本稿では,信頼できるAIシステムを育成する上での,AI開発者,規制当局,ユーザ,メディア間の相互作用について検討する。
進化的ゲーム理論と大言語モデル(LLM)を用いて、異なる規制体制下でこれらのアクター間の戦略的相互作用をモデル化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:39:38 GMT)
Robust Asymmetric Heterogeneous Federated Learning with Corrupted Clients [60.2] 本稿では、異種・データ破損クライアントをモデルとした頑健な連立学習課題について検討する。
データ破損は、ランダムノイズ、圧縮アーティファクト、現実のデプロイメントにおける環境条件などの要因によって避けられない。
本稿では,これらの問題に対処する新しいロバスト非対称不均一なフェデレート学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:52:04 GMT)
Single Image, Any Face: Generalisable 3D Face Generation [59.9] 我々は,制約のない単一画像入力を伴う3次元顔を生成する新しいモデルGen3D-Faceを提案する。
私たちの知る限りでは、これは1枚の画像からフォトリアリスティックな3D顔アバターを作るための最初の試みであり、ベンチマークである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:34:01 GMT)
HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation [59.7] 我々はHERMESという統合運転世界モデルを提案する。
シナリオを駆動する統合フレームワークを通じて、3Dシーン理解と将来のシーン進化(世代)をシームレスに統合する。
HERMESは最先端のパフォーマンスを実現し、生成エラーを32.4%削減し、CIDErなどの理解基準を8.0%改善した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:02 GMT)
MRGen: Segmentation Data Engine For Underrepresented MRI Modalities [59.6] 稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では、生成モデルを利用してトレーニングデータを合成し、未表現のモダリティに対するセグメンテーションモデルを訓練する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:59:46 GMT)
Towards Regulatory-Confirmed Adaptive Clinical Trials: Machine Learning Opportunities and Solutions [59.3] 本研究は,全人口と低給付人口の規制制約と治療方針値を統合した将来の臨床試験の新たな2つの目的を紹介する。
我々は、第III相臨床試験を設計するための新しい枠組みであるRFAN(Randomize First Augment Next)を定式化する。
我々のフレームワークは、標準的なランダム化コンポーネントと適応コンポーネントから構成されており、臨床試験中に患者を効率よく安全に獲得し、患者を治療アームに割り当てることを目的としている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:17:54 GMT)
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality [58.8] FasterCacheは、高品質な生成を伴うビデオ拡散モデルの推論を高速化するために設計された、トレーニング不要の戦略である。
我々は、FasterCacheがビデオの質をベースラインと同等に保ちながら、ビデオ生成を著しく加速できることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:40:38 GMT)
Adding Additional Control to One-Step Diffusion with Joint Distribution Matching [58.4] JDMは、画像-条件関節分布間の逆KL分散を最小化する新しいアプローチである。
トラクタブルな上限を導出することにより、JDMは条件学習から忠実度学習を分離する。
この非対称蒸留方式により,一段階の生徒が教師モデルに未知の制御を処理できるようになる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:24:26 GMT)
MultiConIR: Towards multi-condition Information Retrieval [57.6] 我々は,マルチコンディションシナリオにおける検索モデルの評価を目的とした,最初のベンチマークであるMultiConIRを紹介する。
本稿では,マルチコンディションのロバスト性,モノトニック関連性ランキング,クエリフォーマットの感度に基づいて,検索とリランクモデルの評価を行う3つのタスクを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:13:15 GMT)
Memory-enhanced Retrieval Augmentation for Long Video Understanding [57.4] 我々は,ヒトの認知記憶にインスパイアされた新しいRAGベースのLVUアプローチ,MemVidを紹介した。
提案手法は,全体的映像情報の記憶,メモリに基づくタスクの情報要求の推論,情報要求に基づくクリティカルモーメントの検索,最終回答を生成するための検索モーメントの抽出という,4つの基本的なステップで機能する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:23:32 GMT)
IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [57.0] Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:39:51 GMT)
LLM-PS: Empowering Large Language Models for Time Series Forecasting with Temporal Patterns and Semantics [57.0] Time Series Forecasting (TSF) は、金融計画や健康モニタリングなど、多くの現実世界のドメインにおいて重要である。
既存のLarge Language Models (LLM) は通常、時系列データ固有の特性を無視するため、非最適に実行する。
時系列データから基本的なtextitPatterns と有意義な textitSemantics を学習し,TLF のための LLM-PS を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:45:11 GMT)
Teaching VLMs to Localize Specific Objects from In-context Examples [56.8] 現在、視覚言語モデル(VLM)には、状況を考慮した特定の物体をシーン内でローカライズする学習という、基本的な認知能力がないことが分かっています。
この研究は、VLMのパーソナライズされた数ショットのローカライゼーションを探索し、ベンチマークした初めてのものである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:43:14 GMT)
WildAvatar: Learning In-the-wild 3D Avatars from the Web [55.9] ウェブから人間をキュレートするためのフィルタプロトコルを用いた注釈パイプラインを提案する。
そして、YouTubeから抽出されたウェブスケールの人間のアバター生成データセットであるWildAvatarをキュレートする。
WildAvatarは、人間の3Dアバター作成のための以前のデータセットより少なくとも10倍高額で、現実世界に近い。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:19:55 GMT)
HumanVBench: Exploring Human-Centric Video Understanding Capabilities of MLLMs with Synthetic Benchmark Data [55.7] 我々は,ビデオMLLMの評価において,ギャップを埋めるために巧みに構築された,革新的なベンチマークであるHumanVBenchを紹介する。
HumanVBenchは、内的感情と外的表現、静的、動的、基本的、複雑にまたがる2つの主要な側面と、単一モーダルとクロスモーダルという2つの側面を慎重に検討する16のタスクで構成されている。
22のSOTAビデオMLLMの総合評価では、特にクロスモーダルおよび感情知覚において、現在のパフォーマンスに顕著な制限が示される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:42:48 GMT)
Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.6] 3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)において顕著な効果を示した
本稿では,Self-Ensembling Gaussian Splatting(SE-GS)を紹介する。
我々は,トレーニング中に不確実性を認識した摂動戦略を導入することで,自己理解を実現する。
LLFF, Mip-NeRF360, DTU, MVImgNetデータセットによる実験結果から, 本手法がNVSの品質を向上させることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:26:34 GMT)
On strategies for risk management and decision making under uncertainty shared across multiple fields [55.2] 本稿では、このような戦略の110以上の例を見つけ、リスクに対するこのアプローチをRDOT: Risk-reducing Design and Operations Toolkitと呼ぶ。
RDOT戦略は、構造的、反応性、形式的、敵対的、多段階、ポジティブの6つの幅広いカテゴリに分類される。
全体的なRDOTは、不確実性に対する多目的応答の見過ごされたクラスを表している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:38:21 GMT)
An Optimistic Algorithm for Online Convex Optimization with Adversarial Constraints [55.2] 逆制約を伴うオンライン凸最適化(OCO)について検討する。
本稿では,損失関数と制約関数の予測にアルゴリズムがアクセス可能な設定に着目する。
以上の結果から,現在のO(sqrtT) $ regret と $ tildeO(sqrtT) $ cumulative constraint violation の改善が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:09:19 GMT)
Fast Feedforward 3D Gaussian Splatting Compression [55.1] 3D Gaussian Splatting (FCGS) は、1つのフィードフォワードパスで3DGS表現を高速に圧縮できる最適化フリーモデルである。
FCGSは圧縮比を20倍以上に向上し、高精細度を維持しながら、ほとんどのシーン毎のSOTA最適化手法を上回ります。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:49:45 GMT)
Improving the Diffusability of Autoencoders [54.9] 高品質な画像やビデオを生成するための主要なアプローチとして、潜伏拡散モデルが登場している。
我々は、現代のオートエンコーダのスペクトル分析を行い、その潜在空間における不規則な高周波成分を同定する。
我々は、この高周波成分が拡散合成プロセスの粗大な微細な性質に干渉し、生成品質を阻害する仮説を立てた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:08:10 GMT)
ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [54.8] Reinforced Meta-thinking Agents(ReMA)は,MARL(Multi-Agent Reinforcement Learning)を利用したメタ思考行動の抽出手法である。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
実験の結果、ReMAは複雑な推論タスクにおいて単一エージェントRLベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:05:31 GMT)
OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting [54.5] 我々はオブジェクトの削除と挿入を相互依存プロセスとして再概念化する統合フレームワークであるOmniPaintを紹介した。
我々の新しいCFDメトリクスは、コンテキスト整合性とオブジェクト幻覚の堅牢で参照不要な評価を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:05:47 GMT)
Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [54.0] 画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:46:12 GMT)
Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.7] 拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:49:52 GMT)
DoF-Gaussian: Controllable Depth-of-Field for 3D Gaussian Splatting [52.5] 3D-GSのための制御可能な深度法であるDoF-Gaussianを導入する。
我々は、DoF効果を制御するための幾何光学原理に基づくレンズベースイメージングモデルを開発した。
私たちのフレームワークはカスタマイズ可能で、様々なインタラクティブアプリケーションをサポートしています。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:26:41 GMT)
Light-A-Video: Training-free Video Relighting via Progressive Light Fusion [52.4] Light-A-Videoは、時間的にスムーズなビデオリライティングを実現するためのトレーニング不要のアプローチである。
Light-A-Videoは、画像のリライティングモデルに適応して、照明の一貫性を高める2つの重要な技術を導入している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:38:20 GMT)
Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models [52.2] RepEはモデルの内部表現を直接操作する。
より効果的で、解釈可能で、データ効率が良く、モデルの振る舞いを柔軟に制御できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:31:36 GMT)
Stealthy Patch-Wise Backdoor Attack in 3D Point Cloud via Curvature Awareness [52.1] バックドア攻撃はディープニューラルネットワーク(DNN)に深刻な脅威をもたらす
既存の3Dポイントのクラウドバックドア攻撃は、主にサンプルワイドなグローバルな修正に依存している。
本稿では,最初のパッチワイズトリガを3Dポイントクラウドに適用したSPBA(Stalthy Patch-Wise Backdoor Attack)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:30:59 GMT)
Bayesian Test-Time Adaptation for Vision-Language Models [51.9] CLIPのような事前訓練された視覚言語モデルによるテスト時適応は、新しい、潜在的に配布外テストデータにモデルを適応させることを目的としている。
我々は、クラス埋め込みを継続的に更新して妥当性を適応させる新しいアプローチ、textbfBayesian textbfClass textbfAdaptation (BCA)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:42:11 GMT)
Naive Feature Selection: a Nearly Tight Convex Relaxation for Sparse Naive Bayes [51.6] そこで本稿では,特徴選択に使用可能なnaive Bayesのスパースバージョンを提案する。
余剰特徴の余剰寄与が減少するにつれて凸緩和境界が厳密になることを示す。
二項スパースモデルと多項スパースモデルの両方は、問題サイズにおいてほぼ線形な時間で解決可能である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:57:25 GMT)
Video Individual Counting for Moving Drones [51.4] ビデオ個別カウント(VIC)は、インテリジェントなビデオ監視の重要性から、近年注目を集めている。
以前の群衆カウントデータセットは、比較的まばらな個人で固定された、または稀に動くカメラでキャプチャされる。
本研究では,移動DroneCrowdデータセットに基づく密度マップに基づくVIC手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:09:33 GMT)
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation [51.3] 単一の入力ビデオから同期化されたマルチビュービデオを生成するための統合フレームワークであるReangle-A-Videoを紹介する。
提案手法は,多視点映像生成タスクをビデオ間翻訳として再設計し,公開画像とビデオ拡散先行情報を活用する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:26:15 GMT)
Adaptive$^2$: Adaptive Domain Mining for Fine-grained Domain Adaptation Modeling [50.9] 本稿では,ドメインマイニングモジュールを用いてドメインを適応的に学習する新しいフレームワークであるAdaptive$2$を提案する。
その結果、手作りドメインを用いた従来のドメイン適応手法は、公正なFLOPS条件下では単一ドメインモデルより優れていることがわかった。
Adaptive$2$は、オンライン広告におけるドメイン識別と適応の両方を自動的に学習する最初のアプローチである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:26:16 GMT)
Emergent quantum Majorana metal from a chiral spin liquid [50.6] 反強磁性キタエフモデルにおける中間ギャップレススピン液体相の出現を説明するメカニズムを提案する。
マヨラナスペクトル関数は無限射影ペア状態法により得られる動的スピンと二量相関を捉える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:18:39 GMT)
Planning with Adaptive World Models for Autonomous Driving [50.4] マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。
我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。
また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:55:20 GMT)
Token Weighting for Long-Range Language Modeling [50.2] 損失時の各トレーニングトークンに異なる重みを割り当てる新しいトークン重み付け方式を提案する。
複数の長文理解タスクにおける全ての手法を評価し、不均一な損失重みが有用であることを示す。
この研究は、長いコンテキスト言語モデリングのトレードオフのより深い理解に寄与します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:46:59 GMT)
Long-horizon Visual Instruction Generation with Logic and Attribute Self-reflection [50.2] LIGERはLong-Horizon Instruction GEnerationのための最初のフレームワークである。
前のステップの履歴的なプロンプトと視覚的記憶によって、各ステップのドラフトイメージを生成する。
LIGERは、さまざまな画像編集ツールを使用して、間違った属性、ロジックエラー、オブジェクトの冗長性、ドラフトイメージのアイデンティティの不整合などのエラーを修正している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:11:02 GMT)
Detect, Investigate, Judge and Determine: A Knowledge-guided Framework for Few-shot Fake News Detection [50.1] Few-Shot Fake News Detection (FS-FND) は、極めて低リソースのシナリオにおいて、非正確なニュースを実際のニュースと区別することを目的としている。
ソーシャルメディア上でのフェイクニュースの拡散や有害な影響により、このタスクは注目を集めている。
本稿では,内外からLLMを増強するDual-perspective Knowledge-Guided Fake News Detection (DKFND)モデルを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:46:47 GMT)
Not All Edges are Equally Robust: Evaluating the Robustness of Ranking-Based Federated Learning [49.7] Federated Ranking Learning (FRL) は最先端のFLフレームワークであり、通信効率と中毒攻撃に対するレジリエンスで際立っている。
Vulnerable Edge Manipulation (VEM) 攻撃という, FRLに対する新たな局所モデル中毒攻撃を導入する。
我々の攻撃は、全体的な53.23%の攻撃効果を達成し、既存の方法よりも3.7倍のインパクトを与える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:38:14 GMT)
Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning [49.3] 本稿では、事前学習の有効性を大幅に向上させる、新しい周波数ベースの自己監視学習(SSL)手法を提案する。
我々は、知識蒸留によって強化された2ブランチのフレームワークを使用し、モデルがフィルタされた画像と原画像の両方を入力として取り込むことを可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:26:49 GMT)
REArtGS: Reconstructing and Generating Articulated Objects via 3D Gaussian Splatting with Geometric and Motion Constraints [48.8] REArtGSは、幾何学的および運動的制約を3Dガウスプリミティブに導入する新しいフレームワークである。
我々は,3次元ガウス多様体の変形可能場を定式化対象の運動構造に拘束し,未知の状態における表面メッシュの教師なし生成を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:50:33 GMT)
Towards Graph Foundation Models: A Transferability Perspective [48.5] Graph Foundation Models (GFMs) は、さまざまなグラフドメインやタスクにまたがる一般化の可能性に対して、大きな注目を集めている。
現在まで、転送可能性の観点からGFMを調査・分析する体系的な研究は行われていない。
本稿では、トランスファービリティーのレンズを通して既存のGFMを分類・分析する最初の包括的分類法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:04:05 GMT)
Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [48.2] 大きな言語モデル(LLM)は、不一致の自己認識のためにしばしば幻覚する。
既存のアプローチは、不確実性推定やクエリの拒否を通じて幻覚を緩和する。
高速かつ低速な推論システムを統合するための明示的知識境界モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:42:04 GMT)
High-Rank Irreducible Cartesian Tensor Decomposition and Bases of Equivariant Spaces [47.8] カルテシアンテンソルの分解のための経路行列を、小さくて手頃な複雑さを持つランク$n=9$まで構築する。
我々は、経路行列の連結がテンソル積空間と球面直和空間の間の正則な基底行列であることを証明し、活用する。
結果は任意のテンソル積と直和空間に拡張され、対称性を維持しながら異なる空間間の自由な設計が可能となる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:15:14 GMT)
DeformPAM: Data-Efficient Learning for Long-horizon Deformable Object Manipulation via Preference-based Action Alignment [47.3] 本稿では、優先学習と報酬誘導行動選択に基づくデータ効率の一般学習フレームワークを提案する。
DeformPAMは、長い水平タスクを複数のアクションプリミティブに分解し、3Dポイントクラウド入力と拡散モデルを利用する。
実世界の長軸変形可能な3つのオブジェクト操作タスクの実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:54:11 GMT)
Independence Tests for Language Models [47.1] 2つのモデルの重みを考えると、独立してトレーニングされたかどうかテストできますか?
制約付きと制約なしの2つの設定を検討します。
本稿では,2つのモデル間の隠れアクティベーションに一致し,逆変換やモデルアーキテクチャの変更に対して堅牢な新しいテストを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:58:01 GMT)
Audio Large Language Models Can Be Descriptive Speech Quality Evaluators [46.8] 本稿では,人間格付けから生成した最初の自然言語に基づく音声評価コーパスについて紹介する。
このコーパスは、複数の次元にわたる詳細な分析を提供し、品質劣化の原因を特定する。
生音声から関連情報を抽出するために,LLM蒸留(ALLD)を用いたアライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:01:46 GMT)
Helping the Helper: Supporting Peer Counselors via AI-Empowered Practice and Feedback [46.7] CAREはAIベースのツールで、実践とフィードバックを通じて同僚のカウンセラーを力づけ、訓練する。
CAREは、特定の状況で必要なカウンセリング戦略の診断を支援し、実践セッション中にカウンセラーにサンプル応答を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:18:39 GMT)
Revisiting Medical Image Retrieval via Knowledge Consolidation [46.7] 本稿では,階層的特徴と機能に関する知識を集約する新しい手法を提案する。
本稿では,Depth-aware Representation Fusion (DaRF)とStructure-aware Contrastive Hashing (SCH)を紹介する。
解剖学的放射線学データセットの平均精度は5.6~38.9%向上した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:16:42 GMT)
RandLoRA: Full-rank parameter-efficient fine-tuning of large models [46.3] Low-Rank Adaptation (LoRA)とその変種は、大きなトランスフォーマーネットワークのトレーニング可能なパラメータとメモリ要求の数を削減した。
ウェイト更新の低ランクの性質は、本質的に微調整されたモデルの表現力を制限している。
本稿では、低ランクで非学習可能なランダム行列の線形結合を用いて、フルランク更新を行うRandLoRAを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:43:45 GMT)
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering [46.2] 長いビデオにおけるビデオ質問回答(VQA)は、関連する情報を抽出する上で重要な課題である。
長大なビデオを扱うための効率的な状態空間モデルであるBIMBAを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:57:32 GMT)
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning [45.7] 本稿では,大規模言語モデル(LLM)のためのDeepSeek-R1モデルの拡張であるSearch-R1を紹介する。
Search-R1は、リアルタイム検索によるステップバイステップ推論中に(複数の)検索クエリを自律的に生成する。
実験の結果、サーチ-R1は26%(Qwen2.5-7B)、21%(Qwen2.5-3B)、10%(LLaMA3.2-3B)のSOTAベースラインの性能向上を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:26:39 GMT)
CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in 3D Action Role-Playing Games [45.6] 我々は3Dアクションロールプレイングゲーム(ARPG)における戦闘タスクに最適化された効率的なVLAモデルであるCombatVLAを紹介する。
具体的には、当社のCombatVLAはアクショントラッカーによって収集されたビデオアクションペアに基づいてトレーニングされた3Bモデルです。
実験結果から,CombatVLAは戦闘理解ベンチマークにおいて既存のモデルを全て上回るだけでなく,戦闘における50倍の加速も達成していることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:42:26 GMT)
MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration [45.4] 我々はMultiple Boosting Trees (MBCT)と呼ばれる特徴認識型バイナリフレームワークを提案する。
MBCTは非単調であり,学習可能なビンニング方式と個々のキャリブレーションにより,順序精度が向上する可能性がある。
その結果,本手法はキャリブレーション誤差と順序精度の両方で競合するモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:15:57 GMT)
Maximum Entropy Heterogeneous-Agent Reinforcement Learning [45.4] 近年,多エージェント強化学習(MARL)が協調ゲームに有効であることが示されている。
我々は,サンプルの複雑さ,トレーニング不安定性,および準最適ナッシュ平衡に収束するリスクに関する問題を解決するための統一的な枠組みを提案する。
The MaxEnt framework, we propose Heterogeneous-Agent Soft Actor-Critic (HASAC) algorithm。
HASACは、Bi-DexHands、Multi-Agent MuJoCo、StarCraft Challenge、Google Research Football、Multi-Agent Particle Environment、Light Aircraft Gameの6つのベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:29:23 GMT)
BAMBI: Developing Baby Language Models for Italian [45.4] 本稿では,5歳児のイタリア語話者の言語入力を模倣したデータに基づいて学習したBAMBI(Baby Language Models Boostrapped for Italian)について述べる。
BAMBIモデルは、受信したモデルのトレーニング入力量を考慮して、言語モデルを評価するために特別に設計されたベンチマークを使用してテストされる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:36:50 GMT)
LuciBot: Automated Robot Policy Learning from Generated Videos [45.0] 大規模言語モデル(LLM)や視覚言語モデル(VLM)は、ピック・アンド・プレイスのようなよく定義された報酬を持つ単純なタスクに限られている。
汎用ビデオ生成モデルの想像力を生かして、具体的タスクのためのトレーニング監督を生成する。
提案手法は複雑な実施タスクの監督品質を大幅に向上させ,シミュレータの大規模トレーニングを可能にした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:07:36 GMT)
StereoCrafter-Zero: Zero-Shot Stereo Video Generation with Noisy Restart [44.7] ゼロショットステレオビデオ生成のための新しいフレームワークであるStereoCrafter-Zeroを紹介する。
主なイノベーションは、ステレオ認識の潜在表現を初期化するノイズリスタート戦略である。
我々は,StereoCrafter-Zeroが高精細度と時間的滑らかさを向上した高品質なステレオビデオを生成することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:18:56 GMT)
Fair Play in the Fast Lane: Integrating Sportsmanship into Autonomous Racing Systems [44.5] 本稿では,スポーツマンシップ(SPS)をレースに組み込むための2段階のゲーム理論フレームワークを提案する。
高レベルでは、モンテカルロ木探索(MCTS)を用いて最適な戦略を導出するスタックルバーグゲームを用いて、レース意図をモデル化する。
低レベルにおいては、車両の相互作用は一般化ナッシュ平衡問題(GNEP)として定式化され、全てのエージェントが軌道を最適化しながらスポーツマンシップの制約に従うことが保証される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:02:38 GMT)
Fine-tuning Vision Language Models with Graph-based Knowledge for Explainable Medical Image Analysis [44.4] 現在の糖尿病網膜症(DR)のステージングモデルはほとんど解釈できない。
本稿では,グラフ表現学習を視覚言語モデル(VLM)と統合し,説明可能なDR診断を実現する手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:19:07 GMT)
A unifying framework for generalised Bayesian online learning in non-stationary environments [44.3] 我々はこのフレームワークを (B)ayesian (O)nline learning in (N)on-stationary (E)nvironments で一般化された (B)ayesian (O)nline learning を意味する BONE と呼ぶ。
BONEは、オンライン連続学習、事前予測、文脈的盗賊など、さまざまな問題に対処するための共通の構造を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:05:37 GMT)
Shaping Inductive Bias in Diffusion Models through Frequency-Based Noise Control [43.9] 我々は拡散確率モデル(DPM)のトレーニングとサンプリングに誘導バイアスを組み込む。
本研究は,各データセットが異なる誘導バイアスを必要とすること,および適切な周波数ベースノイズ制御により,標準拡散よりも生成性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:40:15 GMT)
Beyond the Eye: A Relational Model for Early Dementia Detection Using Retinal OCTA Images [43.7] 早期発症アルツハイマー病 (AD) と軽度認知障害 (MCI) をコントロールから識別するために, 網膜光コヒーレンストモグラフィー (OCTA) を用いた新しいPolarNet+を提案する。
提案手法は,まずカルト座標から極座標へのOCTA画像のマッピングを行う。
次に,包括的かつ臨床的に有用な情報抽出のための3次元画像のシリアライズと解析を行う多視点モジュールを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:58:41 GMT)
Optimization by Decoded Quantum Interferometry [43.6] Decoded Quantum Interferometry (DQI) という量子アルゴリズムを導入する。
有限フィールド上のデータに対する最適適合性を近似するために、DQIは我々の知る時間よりも優れた近似比を達成する。
30,000以上の変数を持つインスタンスをベンチマークすることで、これを実証します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:20:25 GMT)
DAVE: Diagnostic benchmark for Audio Visual Evaluation [43.5] DAVEは,聴覚・視覚モデルの評価を体系的に行うために設計された,新しいベンチマークデータセットである。
DAVEは、(i)両方のモダリティが正しく答えるのを確実にし、(ii)評価をアトミックなサブカテゴリに分離することで、既存の制限を緩和する。
最先端モデルの詳細な分析では、特定の障害モードを明らかにし、改善のための目標となる洞察を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:12:46 GMT)
LiveScene: Language Embedding Interactive Radiance Fields for Physical Scene Rendering and Control [43.3] 本稿では,複雑なシーンにオブジェクトレベルの再構築を拡大し,インタラクティブなシーン再構築を推し進める。
複数のオブジェクトを効率的に再構成し,制御する,シーンレベルの言語埋め込み型対話型放射場LiveSceneを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:19:42 GMT)
InteractEdit: Zero-Shot Editing of Human-Object Interactions in Images [42.8] ゼロショット・ヒューマン・オブジェクト・インタラクション(HOI)編集のための新しいフレームワークであるInteractEditを提案する。
画像内の既存のインタラクションを、対象と対象のアイデンティティを保持しながら、新しい望ましいインタラクションに変換する。
実験の結果,InteractEditは既存の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:40:45 GMT)
ReCon: Enhancing True Correspondence Discrimination through Relation Consistency for Robust Noisy Correspondence Learning [42.3] 本稿では,マルチモーダルデータ間の真の対応を正確に識別するための一般関係一貫性学習フレームワークであるReConを提案する。
ReConは、真の対応判別の有効性を大幅に向上させ、不一致ペアを確実にフィルタリングする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:13:56 GMT)
I2V3D: Controllable image-to-video generation with 3D guidance [42.2] IV23Dは、静的画像を正確な3D制御で動的ビデオにアニメーションするためのフレームワークである。
提案手法は,コンピュータグラフィックスパイプラインの精度と高度な生成モデルを組み合わせる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:26:34 GMT)
Discovering Influential Neuron Path in Vision Transformers [42.0] ビジョントランスフォーマーモデルは、人間の理解に不透明な大きな力を示し、実用的な応用のための課題やリスクを提起する。
本稿では、モデル入力から出力までのニューロンの経路である視覚変換器における影響ニューロン経路の重要性について検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:10:46 GMT)
Vi-LAD: Vision-Language Attention Distillation for Socially-Aware Robot Navigation in Dynamic Environments [41.8] 社会に適合したナビゲーション知識を蒸留する新しいアプローチであるVi-LAD(Vision-Language Attention Distillation)を紹介する。
Vi-LADは、事前学習された視覚行動モデルから抽出された中間注意マップを用いたトランスフォーマーベースモデルを微調整する。
我々は,ハスキー車輪付きロボットによる実世界実験を通じて,我々のアプローチを検証するとともに,最先端のナビゲーション手法に対する大幅な改善を実証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:38:23 GMT)
Unreflected Use of Tabular Data Repositories Can Undermine Research Quality [41.7] データレポジトリからのデータセットの未修正使用は、研究品質と科学的厳密さを低下させた可能性がある、と我々は主張する。
本図は,(1)最適なモデル選択戦略,(2)強いベースラインを見渡すこと,(3)不適切な前処理を行うことによる,データリポジトリのユーザによる落とし穴の回避を支援する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:41:49 GMT)
Physics-Aware Human-Object Rendering from Sparse Views via 3D Gaussian Splatting [41.4] HOGSは、スパースビューから効率よく、物理的に妥当なHOIレンダリングのための新しいフレームワークである。
Human Pose RefinementモジュールとSparse-View Human-Object Contact Predictionモジュールが組み込まれている。
HODomeデータセットの実験では、HOGSは既存の方法に比べてレンダリング品質、効率、物理的妥当性が優れていることが示されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:19:21 GMT)
Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking [41.3] CoT(Chain-of-Thought)は、幅広いタスクにわたる大規模言語モデル(LLM)の性能を大幅に向上させる。
本研究では,Transformer+CoTとその変種の状態追跡機能の評価を行い,CoTの有効性を確認した。
圧縮と区別という2つの指標を提案し、各状態のニューロンセットが100%近い精度を達成することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:47:08 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:02:54 GMT)
TrackGS: Optimizing COLMAP-Free 3D Gaussian Splatting with Global Track Constraints [40.9] マルチビュー幾何をグローバルに制約する機能トラックを組み込んだTrackGSを紹介する。
また、幾何整合性を改善するために、再投射と後方投射の誤差を最小化することを提案する。
内在性の勾配を導出することにより、カメラパラメータ推定と3DGSトレーニングを結合最適化フレームワークに統合する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:03:52 GMT)
Rethinking Prompt-based Debiasing in Large Language Models [40.9] 大規模言語モデル(LLM)におけるバイアスの調査は、信頼できるAIを開発する上で不可欠である。
即発的なエンジニアリングは一般的であるが、その効果はモデルがバイアスを本質的に理解しているという仮定に依存している。
本研究では,BBQ と StereoSet のベンチマークを用いて,オープンソースモデルと商用 GPT モデルの両方を用いて,この仮定を体系的に解析した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:06:03 GMT)
Theoretical Guarantees for High Order Trajectory Refinement in Generative Flows [40.9] フローマッチングは、生成モデリングの強力なフレームワークとして登場した。
我々は,高次フローマッチングが分布推定器として最悪の場合の最適性を保っていることを証明した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:07:07 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8] 敵環境におけるジェネラリストWebエージェントのプライバシーリスクに関する最初の研究を行う。
まず,Webサイト上での攻撃に対する現実的な脅威モデルを提示し,ユーザ固有のPIIを盗むか,あるいはユーザ要求全体に対して,敵対的な2つのターゲットを検討する。
我々は、Mind2Webから様々なPIIカテゴリを含む177のアクションステップを収集し、これまでで最も有能なジェネラリストWebエージェントフレームワークの1つを使用して実験を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:54:00 GMT)
AI Conversational Interviewing: Transforming Surveys with LLMs as Adaptive Interviewers [40.8] 本研究では,人間のインタビュアーを大規模言語モデル (LLM) に置き換えて,スケーラブルな対話型インタビュアーを実現する可能性について検討する。
大学生を対象に,AIやヒューマンインタビュアーによる会話面接にランダムに割り当てられた,小規模かつ詳細な調査を行った。
様々な量的・質的な尺度は, インタビュアーのガイドライン, 応答品質, 参加者参加率, 総合的な面接効果に順応した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:55:22 GMT)
Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k [39.5] 商用レベルのビデオ生成モデルであるOpen-Sora 2.0について紹介する。
トップパフォーマンスビデオ生成モデルのトレーニングコストは,高い制御性を有することを示す。
Open-Sora 2.0を完全にオープンソースにすることで、先進的なビデオ生成技術へのアクセスを民主化することを目指している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:00:07 GMT)
TempMe: Video Temporal Token Merging for Efficient Text-Video Retrieval [39.4] TempMeはパラメータ効率とトレーニング推論効率のよいテキストビデオ検索アーキテクチャである。
出力トークンを95%減らし、GFLOPを51%減らし、1.8倍のスピードアップと4.4%のR-Sum改善を実現した。
完全な微調整により、TempMeは7.9%のR-Sumの改善、1.57倍の高速化、75.2%のGPUメモリ使用率を実現している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:11:37 GMT)
Batch List-Decodable Linear Regression via Higher Moments [39.3] バッチを用いたリスト復号化線形回帰の課題について検討する。
バッチは、未知の線形回帰分布からのi.d.サンプルからなる場合、クリーンと呼ばれる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:11:07 GMT)
Bidirectional Prototype-Reward co-Evolution for Test-Time Adaptation of Vision-Language Models [39.2] Bidirectional Prototype-Reward Co-Evolution (BPRE)は視覚言語モデル(VLM)のための新しいTTAフレームワークである
BPREは、機能品質評価とプロトタイプの進化を相乗的なフィードバックループを通じて統合する。
BPREは、最先端の手法に比べて常に優れた平均性能を達成している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:40:33 GMT)
Beyond Overfitting: Doubly Adaptive Dropout for Generalizable AU Detection [39.2] クロスドメインAU検出のための二重適応型ドロップアウト手法を提案する。
これは、畳み込み特徴写像と領域シフトに対する空間トークンの堅牢性を高める。
提案手法は、クロスドメインAU検出において、既存の手法よりも一貫して優れている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:34:43 GMT)
TreeX: Generating Global Graphical GNN Explanations via Critical Subtree Extraction [39.0] メッセージパッシングの内部動作によって生じる重要なサブツリーを分析し,抽出することにより,GNNのアンボックス化を提案する。
埋め込み空間のサブツリーを効率的なアルゴリズムで集約することにより、ローカル、クラス、グローバルレベルでメッセージパッシングGNNの直感的なグラフィカルな説明を行うことができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:36:28 GMT)
DetectRL: Benchmarking LLM-Generated Text Detection in Real-World Scenarios [39.0] 我々は,最新技術(SOTA)検出技術でさえも,このタスクにおいてまだ性能が劣っていることを強調した新しいベンチマークであるTectorRLを提案する。
人気のある大規模言語モデル(LLM)を使用して、実世界のアプリケーションとの整合性を向上するデータを生成しました。
我々は,書式,モデルタイプ,攻撃方法,テキストの長さ,および実世界の人間の筆記因子が,さまざまな種類の検知器に与える影響について分析した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:08:22 GMT)
Towards Next-Generation Recommender Systems: A Benchmark for Personalized Recommendation Assistant with LLMs [38.8] 大規模言語モデル(LLM)はRecSysの基礎アーキテクチャに革命をもたらした。
既存の研究の多くは、リコメンデーションを生成するための固定されたタスク固有のプロンプトテンプレートに依存している。
これは、一般的に使用されるデータセットには、現実世界のレコメンデーションシナリオを反映した高品質なテキストユーザークエリがないためである。
我々は、複雑なユーザレコメンデーションニーズを処理するLLMの能力にアクセスするために設計された新しいデータセットであるRecBench+を紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:28:23 GMT)
Can A Society of Generative Agents Simulate Human Behavior and Inform Public Health Policy? A Case Study on Vaccine Hesitancy [38.6] 大規模言語モデル(LLM)を利用した100個の生成エージェントを備えたVacSimフレームワークについて紹介する。
VacSim ワクチンは,1) 人口統計データに基づくエージェントの集団のインスタンス化,2) ソーシャル・ネットワークを介してエージェントを接続し,社会的ダイナミクスと疾患関連情報の関数としてワクチンの態度をモデル化すること,3) ワクチンの根絶を緩和するための様々な公衆衛生介入の設計と評価を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:54:15 GMT)
Evaluating Reinforcement Learning Safety and Trustworthiness in Cyber-Physical Systems [38.5] 本稿では,SAFE-RL (Safety and Accountability Framework for Evaluation Reinforcement Learning) を提案する。
我々は,小型無人航空システム(sUAS)における3つのRLアプリケーションにおいて,フレームワークの構築と利用を実証するために,設計科学的アプローチを採用する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:33:07 GMT)
Locality-aware Gaussian Compression for Fast and High-quality Rendering [37.2] 局所性を考慮した3Dガウススティング(3DGS)フレームワークであるLocoGSを紹介し,3Dガウスアンの空間コヒーレンスを利用してシーンのコンパクトなモデリングを行う。
まず,3次元ガウス属性の局所的コヒーレンスを解析し,局所的コヒーレントなガウス属性を効果的に符号化する3次元ガウス表現を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:12:31 GMT)
Training Data Provenance Verification: Did Your Model Use Synthetic Data from My Generative Model for Training? [36.8] 高品質なオープンソーステキスト・ツー・イメージモデルは、フォトリアリスティックな画像を得るためのしきい値を大幅に下げている。
疑念は、これらの生成モデルによって生成された合成データを使用して、特定のタスクのためのモデルを許可なく訓練することができる。
トレーニングデータ保証検証(TrainProVe)と呼ばれる,この重要な未解決問題に対する最初の手法を提案する。
Stable Diffusion v1.4, latent consistency model, PixArt-$alpha$, Stable Cascade)。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:15:16 GMT)
SciHorizon: Benchmarking AI-for-Science Readiness from Scientific Data to Large Language Models [36.7] SciHorizonは、科学データと大規模言語モデルの両方の観点からAI4Scienceの可読性を評価するために設計された総合的なアセスメントフレームワークである。
まず、品質、FAIRネス、説明可能性、コンプライアンスの4つの重要な側面を含む、AI対応の科学データを評価するための一般化可能なフレームワークを紹介します。
複数の科学分野にまたがるLCMの能力を評価するために,知識,理解,推論,マルチモダリティ,価値の5つのコア指標に基づいて,16のアセスメントを定めている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:34:41 GMT)
Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks [36.6] Plan-and-Actは、大規模言語モデル(LLM)に明示的なプランニングを組み込んだフレームワークである。
Plan-and-Actは、ユーザ目標を達成するための構造化された高レベルのプランを生成するPlannerモデルと、これらのプランを環境固有のアクションに変換するExecutorモデルで構成される。
我々は,WebArena-Liteベンチマークにおいて,Webナビゲーションを代表的な長期計画環境として利用し,最先端の54%の成功率を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:40:52 GMT)
Comparing a radiation damage model for avalanche photodiodes through in-situ observation of CubeSat based devices [36.1] 我々は、放射線遮蔽の違いを考慮し、宇宙ベースシリコンGeiger-mode avalanche photodiodes(GM-APD)の暗カウント率の傾向を予測できるモデルを提案する。
予測傾向は,SQy-1 CubeSatミッションにおけるGM-APDのその場観測と相関することがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:51:38 GMT)
FaiREE: Fair Classification with Finite-Sample and Distribution-Free Guarantee [35.7] FaiREE は群フェアネス制約を有限サンプルと分布自由な理論保証で満たす公平な分類アルゴリズムである。
FaiREEは最先端のアルゴリズムよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:17:23 GMT)
Evaluating Automatic Speech Recognition Systems for Korean Meteorological Experts [35.3] 本稿では,韓国の気象学者を対象とした自然言語クエリシステムへの自動音声認識の統合について検討する。
韓国の気象分野におけるASRシステム開発における課題に対処する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:18:04 GMT)
A Large-Scale Study on Video Action Dataset Condensation [35.2] 我々は,画像とビデオのデータセットの縮合のギャップを,体系的な設計と公正な比較による大規模研究によって埋めることを目的としている。
1)ビデオデータの時間的処理,(2)ビデオデータセットの凝縮評価プロトコル,(3)縮合アルゴリズムの時空領域への適応。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:28:28 GMT)
SoftShadow: Leveraging Soft Masks for Penumbra-Aware Shadow Removal [35.2] シャドウ除去に特化して設計された新しいソフトシャドウマスクを導入する。
我々は,事前学習されたSAMの事前知識を活用し,物理的な制約を統合することで,SoftShadowフレームワークを提案する。
このフレームワークは、ペナムブラ(部分陰影)とウンブラ(完全に陰影)の正確な予測を可能にし、同時にエンドツーエンドのシャドウ除去を容易にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:18:15 GMT)
ReLaX-VQA: Residual Fragment and Layer Stack Extraction for Enhancing Video Quality Assessment [35.0] ReLaX-VQAは、NRVQA(No-Reference Video Quality Assessment)モデルである。
これは、オリジナルの圧縮されていないビデオに言及することなく、多様なビデオコンテンツの品質を評価するという課題に対処することを目的としている。
NR-VQA法を一貫して上回り、平均Sスコアは0.8658、PLCCは0.8873である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:07:16 GMT)
Knowledge Entropy Decay during Language Model Pretraining Hinders New Knowledge Acquisition [34.9] 本研究では,モデルがパラメトリック知識を広く統合する傾向が,事前学習を通じてどのように進化するかを検討する。
モデルが関与するメモリ源の範囲を定量化する知識エントロピーの概念を導入する。
知識のエントロピーの低下は、モデルの知識獲得と保持能力を損なうことがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:17:41 GMT)
GRU: Mitigating the Trade-off between Unlearning and Retention for Large Language Models [34.9] 大言語モデル(LLM)のアンラーニングは、プライバシや著作権関連の応答を取り除く上で重要な役割を担っている。
完全な未学習の追求には、その一般的な機能に妥協があるため、かなりのコストが伴うことが多い。
幾何的な方法で勾配の更新を制御する拡張型アンラーニングフレームワークであるGradient Rectified Unlearning (GRU)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:08:54 GMT)
P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders [34.6] 3Dの事前学習は、3D知覚タスクの進行に欠かせない。
しかし、クリーンな3Dデータの不足は、3D事前学習のスケールアップに重大な課題をもたらす。
革新的な自己指導型事前学習フレームワークを導入する。
本手法は,3次元分類,検出,少数ショット学習における最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:13:37 GMT)
Learning Cascade Ranking as One Network [34.5] Cascade Rankingは、リコメンデーションや広告プラットフォームのような大規模なトップk選択システムにおいて一般的なアーキテクチャである。
本稿では,カスケードランキングによって基底真理項目が選択される確率の低い値から,新しい代理損失関数を導入するLCRONを提案する。
LCRONは、公開ベンチマークや産業アプリケーションにおける既存の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:52:51 GMT)
User-centric Immersive Communications in 6G: A Data-oriented Framework via Digital Twin [34.0] 6Gにおける没入型通信のための新しいユーザ中心型サービス提供法を提案する。
本稿では、パーソナライズされたデータ管理を特徴とする、ネットワークリソース管理のためのデータ指向フレームワークを提案する。
トレース駆動型ケーススタディは、ユーザ中心のICを実現する上で、我々のフレームワークの有効性を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:52:20 GMT)
Attention Reveals More Than Tokens: Training-Free Long-Context Reasoning with Attention-guided Retrieval [33.8] 大規模言語モデル(LLM)は、要求される能力よりもはるかに短い有効文脈長を示すことが多い。
本研究では,注意重みを利用した学習自由度アルゴリズムAttrievalを提案する。
以上の結果から,Attrievalは,合成QAデータセットと実世界のQAデータセットの両方において,長文推論能力の向上を図っている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:34:14 GMT)
The Pitfalls of Imitation Learning when Actions are Continuous [33.4] 本研究では,連続的な状態・動作制御システムにおいて,専門家のデモレータを模倣する問題について検討する。
ダイナミクスが安定していても、スムーズで決定論的な模倣ポリシーは、指数関数的に大きい実行時に必ずエラーを被ることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:11:37 GMT)
Motion Blender Gaussian Splatting for Dynamic Reconstruction [33.0] 本研究では,動きグラフを明示的かつスパースな動き表現として利用する新しいフレームワークである動きブラインドガウススティング(MB-GS)を提案する。
実験によると、MB-GSは、HyperNeRFで競合しながら、iPhoneデータセット上で最先端のパフォーマンスを達成する。
動作編集による新しい物体の動きやロボットのデモ生成における本手法の適用可能性を実証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:55:16 GMT)
BYOS: Knowledge-driven Large Language Models Bring Your Own Operating System More Excellent [32.8] BYOSはLarge Language Models (LLM) をベースとしたフレームワークで、カーネル設定をさまざまなユーザ要求に合わせてカスタマイズする。
OS指向のDual-layer Knowledge Graph(OD-KG)とそれに対応する推論戦略を統合することで、BYOSはカーネル構成のカスタマイズ、コスト効率、便利な生成を可能にした。
実験の結果、BYOSによって構成されたカーネルはデフォルトのベンダー構成のカーネルを7.1%から155.4%上回った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:50:16 GMT)
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection [32.8] DitHubは、効率的な適応モジュールのライブラリを作成し、管理するように設計されたフレームワークである。
Version Control SystemsにインスパイアされたDitHubは、必要に応じてフェッチしてマージできるブランチのようなエキスパートモジュールを編成する。
提案手法は,ODinW-13ベンチマークとODinW-Oベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:15:34 GMT)
Multi-Modal Foundation Models for Computational Pathology: A Survey [32.3] 基礎モデルは、計算病理学(CPath)の強力なパラダイムとして登場した。
我々は、32の最先端マルチモーダル基盤モデルを、視覚言語、視覚知識グラフ、視覚生成表現の3つの主要なパラダイムに分類する。
病理学に適した28の利用可能なマルチモーダルデータセットを分析し、画像テキストペア、命令データセット、画像以外のモダリティペアにグループ化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:03:33 GMT)
Diverse Target and Contribution Scheduling for Domain Generalization [32.0] 分散シフトの下での一般化は、コンピュータビジョンにおいて大きな課題である。
我々は、DGの新しいパラダイムであるDiverse Target and Contribution Scheduling(DTCS)を提案する。
DTCSは2つの革新的なモジュール、Diverse Target Supervision (DTS)とDiverse Contribution Balance (DCB)で構成されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:24:26 GMT)
Knowledge Consultation for Semi-Supervised Semantic Segmentation [31.9] この研究はCross Pseudo Supervisionを再考し、セグメンテーション性能をさらに高めるための知識コンサルティング(SegKC)を導入している。
提案されたSegKCは、PascalとCityscapesのベンチマークにおいて、mIoUスコアが87.1%、89.2%、89.8%がPascal VOCでそれぞれ1/4、1/2、フルスプリットパーティションでそれぞれ大幅に改善されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:32:37 GMT)
On Distributed Larger-Than-Memory Subset Selection With Pairwise Submodular Functions [31.3] 証明可能な近似保証付き分散バウンディングアルゴリズムを提案する。
CIFAR-100 と ImageNet の高品質なサブセットは,集中型手法と比較して,品質が損なわれるか,あるいは損なわれない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:02:27 GMT)
On the Generalization Properties of Diffusion Models [31.1] この研究は拡散モデルの一般化特性を包括的に理論的に探求することを目的としている。
我々は、スコアベース拡散モデルのトレーニング力学と合わせて、タンデムで進化する一般化ギャップの理論的推定値を確立する。
我々は定量分析をデータ依存のシナリオに拡張し、対象の分布を密度の連続として表現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:18:59 GMT)
Tracking the Best Expert Privately [31.0] 我々は、動的後悔の下で専門家のアドバイスで予測する問題に対して、微分プライベートなアルゴリズムを設計する。
我々の研究は3つの自然な種類の敵に対処し、変化する分布、曖昧さ、適応性を持ち、3つのケースすべてに対してサブ線形後悔を伴うアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:17:03 GMT)
Measuring memorization in language models via probabilistic extraction [29.4] 大規模言語モデル(LLM)は、トレーニングデータを記憶する可能性がある。
発見可能な抽出は、この問題を測定する最も一般的な方法である。
確率的探索可能な抽出を導入し、追加コストなしで複数のクエリを考慮し、発見可能な抽出を緩和する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:25:10 GMT)
Context-guided Responsible Data Augmentation with Diffusion Models [29.4] 本稿では,DiffCoRe-Mixというテキスト・ツー・イメージ(T2I)データ拡張手法を提案する。
キーセマンティックな軸を保存するために、増大過程における望ましくない生成サンプルをフィルタリングする。
我々は、ImageNet-1K、Tiny ImageNet-200、CIFAR-100、Flowers102、CUB-Birds、Stanford Cars、Caltechのデータセットでこの手法を広範囲に評価した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:12:27 GMT)
A Comprehensive Survey on Enterprise Financial Risk Analysis from Big Data Perspective [29.3] 本稿では,ビッグデータの観点から企業リスク分析手法の体系的な文献調査を行う。
私たちの知る限りでは、ビッグデータの観点からの企業財務リスクに関する調査は、これが初めてで唯一のものです。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:59:50 GMT)
Benefits of Learning Rate Annealing for Tuning-Robustness in Stochastic Optimization [29.2] 勾配法における学習速度は、標準グリッドサーチによるチューニングに費用がかかることで悪名高い超特異性である。
我々は,広く使用されているコサインスケジュールなど,学習率を0に低下させる学習速度アニール方式の理論的利点を同定する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:06:34 GMT)
Grounding Video Models to Actions through Goal Conditioned Exploration [29.1] 本稿では,エージェントが複雑なタスクを解くために,映像誘導とトラジェクトリレベルのアクション生成を利用するフレームワークを提案する。
当社のアプローチが,専門家によるデモンストレーションでトレーニングされた,複数の行動クローンベースラインと同等であるか,あるいは超越しているかを示します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:03:25 GMT)
PISA Experiments: Exploring Physics Post-Training for Video Diffusion Models by Watching Stuff Drop [29.0] 我々は、オブジェクトのフリーフォールをモデル化するシンプルな、しかし基本的な物理課題に、最先端のビデオ生成モデルが苦戦していることを示す。
比較的少量のシミュレーションビデオの微調整は、モデル内の落下挙動を誘導するのに有効である。
本稿では,大規模ビデオ生成モデル開発における身体的精度の追跡に有用な診断ツールとして,このタスクのベンチマークをリリースする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:14 GMT)
A Unified Framework for Motion Reasoning and Generation in Human Interaction [28.7] 本稿では,言語と運動の両モードを統合したVersatile Interactive Motion-Languageモデルを提案する。
VIMは、動きとテキストのモダリティの両方を同時に理解し、生成することができる。
我々は,動画像のテキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト・テキスト)、反応生成,動作編集,および動作系列の推論を含む複数の対話的動作関連タスク
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:54:44 GMT)
Entanglement and purity can help to detect systematic experimental errors [28.6] 量子実験における系統的誤りを検出するための直接的かつ効率的な手法を開発した。
以上の結果から,純度の高い量子状態だけでなく絡み合いも系統的誤りの同定に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:05:06 GMT)
ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data [28.6] ProcTagは、文書命令データの有効性を評価するデータ指向の手法である。
実験により、既存のオープンソースおよび生成された文書VQA/インストラクションデータセットをProcTagでサンプリングすることは、インストラクションデータを評価する現在の方法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:20:28 GMT)
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation [28.5] ScMMGPT (Single-Cell MultiModal Generative Pre-trained Transformer)
scMMGPTは最先端のセルとテキストPLMを効果的に統合する。
システムは、これまでで最大のマルチモーダルセルテキストPLMデータセットである2700万セルで、大規模な事前トレーニングを行っている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:26:16 GMT)
Revisiting semi-supervised learning in the era of foundation models [28.4] 半教師付き学習(SSL)は、ラベル付きデータとともに豊富なラベル付きデータを活用して学習を強化する。
我々は,凍結視覚基盤モデル(VFM)が性能的に劣るSSLベンチマークデータセットを開発し,代表的なSSLメソッドを体系的に評価する。
ラベル付きデータのみを用いたパラメータ効率細調整(PEFT)は、ラベルなしデータを活用することなく、SSLのパフォーマンスとよく一致します。
ノイズの多い擬似ラベルの悪名高い問題を克服するため,より堅牢な擬似ラベルを生成するために,複数のPEFTアプローチとVFMバックボーンのアンサンブルを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:01:10 GMT)
Rethinking Bimanual Robotic Manipulation: Learning with Decoupled Interaction Framework [28.2] バイオマチックなロボット操作は、ロボティクスコミュニティにおいて、新しくて重要なトピックである。
本稿では,バイマニュアル操作における異なるタスクの特徴を考察した,疎結合なインタラクションフレームワークを提案する。
我々のフレームワークは,SOTA法よりも23.5%向上し,優れた性能を実現している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:28:41 GMT)
Learning richness modulates equality reasoning in neural networks [28.1] 多層パーセプトロン(MLP)における等式推論の理論を開発する。
リッチレジムは概念的行動を示すが,遅延レジムは知覚的行動を示す。
我々の研究は、特徴学習の豊かさを重要なパラメータの平等推論として特定し、人間と動物の平等推論も同様に神経回路の学習に依存する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:30:51 GMT)
Scale-Invariant Adversarial Attack against Arbitrary-scale Super-resolution [28.1] 局所連続画像関数(LIIF)は、任意のスケールの超解像(SR)技術に対して大きな注目を集めている。
敵の攻撃に対する連続表現に基づく任意のスケールのSRの堅牢性は、さらなる探索を保証している領域のままである。
本稿では, SIAGT と呼ばれる, 高い転送性を有する簡易かつ効果的なスケール不変な SR 逆攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:42:24 GMT)
WonderVerse: Extendable 3D Scene Generation with Video Generative Models [28.0] 拡張可能な3Dシーンを生成するフレームワークであるWonderVerseを紹介する。
WonderVerseは、ビデオ生成基盤モデルに埋め込まれた強力な世界レベルの事前情報を活用する。
様々な3D再構成手法と互換性があり、効率的かつ高品質な生成を可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:44:51 GMT)
Computation-Aware Kalman Filtering and Smoothing [27.6] 本稿では,高次元ガウス・マルコフモデルにおける推論の確率論的数値法を提案する。
行列フリー反復アルゴリズムはGPUアクセラレーションを活用し,計算コストと予測の不確実性との間の調整可能なトレードオフを可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:51:20 GMT)
SwapAnyone: Consistent and Realistic Video Synthesis for Swapping Any Person into Any Video [27.5] ビデオのボディースワッピングは、既存のビデオのボディーを、任意のソースから新しいボディーに置き換えることを目的としている。
本研究では,映像のボディースワッピングを独立したタスクとして定義し,アイデンティティの整合性,動作の整合性,環境の整合性という3つの重要な要素を提案する。
SwapAnyoneというエンド・ツー・エンドのモデルを導入し、ビデオボディー・スワッピングを基準忠実度とモーションコントロールによる映像インペインティングタスクとして扱う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:30:29 GMT)
Federated Learning on Virtual Heterogeneous Data with Local-global Distillation [27.5] ローカル・グローバル・データセット蒸留(FedLGD)を用いた仮想異種データのフェデレーション学習を提案する。
提案手法は,様々な条件下で,最先端の異種FLアルゴリズムより優れる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:01:17 GMT)
MOAT: Evaluating LMMs for Capability Integration and Instruction Grounding [27.1] 大規模マルチモーダルモデル(LMM)は、視覚言語(VL)タスクにおけるジェネラリストとして大きな可能性を示している。
最先端のLMMと人間のパフォーマンスの間には、依然として大きなギャップがある。
LMM に挑戦する複雑な実世界の VL タスクのベンチマークである MOAT を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:49:31 GMT)
Strategyproof Reinforcement Learning from Human Feedback [27.1] 既存のRLHF法は, 防御性がないことを示す。
また, 任意のRLHFアルゴリズムは, 最適ポリシーよりも$k$-times悪い処理をしなければならないことも見いだした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:25:52 GMT)
A Semantic-Loss Function Modeling Framework With Task-Oriented Machine Learning Perspectives [26.8] データ駆動型地球観測(EO)アプリケーションの性能は、データ収集と送信プロセスに大きく影響されている。
セマンティック・コミュニケーション(SC)の概念を採用することで、生の情報に対する本質的なデータセマンティクスの伝達を優先順位付けすることで、有望なソリューションを提供する。
本研究では、実世界のEOデータセットとドメイン固有の洞察を用いて、セマンティック損失を経験的にモデル化する新しいデータ適合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:45:11 GMT)
Efficient Alignment of Unconditioned Action Prior for Language-conditioned Pick and Place in Clutter [26.4] 本研究では,ロボットが対象物を開き散らかし,特定の場所に移動させるという,言語条件のピック・アンド・プレイス作業について検討する。
いくつかのアプローチは、ビジョンファウンデーションモデルから機能を使ってエンドツーエンドのポリシーを学び、大きなデータセットを必要とする。
本研究では,無条件動作先行と3次元視覚言語先行とを1つの注意層から学習することで協調する行動先行アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:20:33 GMT)
AI-native Memory 2.0: Second Me [26.4] SECOND MEはインテリジェントで永続的なメモリオフロードシステムとして機能する。
コンテキスト対応の応答を生成し、必要な情報をプリフィルし、外部システムとのシームレスな通信を容易にする。
さらに、第2のMEは、永続的で文脈的に認識され、自己最適化されたメモリシステムとの人間と世界の相互作用を強化するための重要なステップである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:31:31 GMT)
MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation [25.7] 本稿では,個別表現とフローマッチングを組み合わせた統合ビデオ生成フレームワークMaskFlowを紹介する。
トレーニング中にフレームレベルのマスキング戦略を活用することで、以前に生成したアンマスクフレーム上のMaskFlow条件を使用して、トレーニングシーケンスの10倍以上の長さのビデオを生成する。
我々は,FaceForensics (FFS) とDeepmind Lab (DMLab) のデータセットにおける手法の品質を検証するとともに,最先端のアプローチと競合するFrechet Video Distance (FVD) を報告する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:27:37 GMT)
CDI3D: Cross-guided Dense-view Interpolation for 3D Reconstruction [25.5] 大規模再構成モデル (LRM) は, 2次元拡散モデルにより生成された多視点画像を利用して3次元コンテンツを抽出する際の大きな可能性を示している。
しかし、2次元拡散モデルはしばしば、強い多視点一貫性を持つ高密度画像を生成するのに苦労する。
CDI3Dは,高画質で高画質な3D画像生成を実現するためのフィードフォワードフレームワークである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:56:38 GMT)
LocAgent: Graph-Guided LLM Agents for Code Localization [25.4] LocAgentは、グラフベースの表現を通じてコードのローカライゼーションに対処するフレームワークである。
細調整したQwen-2.5-Coder-Instruct-32Bモデルを用いて,SOTAプロプライエタリモデルと比較して,コストを大幅に削減した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:55:01 GMT)
Inductive Spatio-Temporal Kriging with Physics-Guided Increment Training Strategy for Air Quality Inference [25.1] 本稿では,観測されていない場所での空気質を推定するための物理誘導インクリメントトレーニング戦略(PGITS)を提案する。
この戦略は,仮想ノードと実ノードのブリッジとして物理原理を用いることで,仮想ノードの特徴が実ノードに近いことを保証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:14:46 GMT)
Motion Anything: Any to Motion Generation [24.8] Motion Anythingはマルチモーダルモーション生成フレームワークである。
我々のモデルは、テキストや音楽を含む多モード条件を適応的に符号化し、制御性を向上させる。
Text-Music-Danceデータセットは2,153対のテキスト、音楽、ダンスで構成されており、AIST++の2倍の大きさである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:45:04 GMT)
MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error Priors [24.8] 本稿では,MonoDGPと呼ばれるトランスフォーマーを用いたモノクロ3Dオブジェクト検出手法を提案する。
射影公式を変更するために、パースペクティブ不変幾何誤差を採用する。
提案手法は, 余分なデータを必要としないKITTIベンチマークにおいて, 最先端の性能を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:48:22 GMT)
Dynamic Feature Selection from Variable Feature Sets Using Features of Features [24.7] そこで本稿では,動的特徴選択(DFS)における可変特徴集合を用いた新しい問題設定を提案する。
提案手法は,測定可能な特徴の集合がインスタンスからインスタンスに変化しても,事前情報に基づく特徴を効果的に選択できることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:13:21 GMT)
Detection, Pose Estimation and Segmentation for Multiple Bodies: Closing the Virtuous Circle [24.6] 新しいマスク条件のポーズ推定モデルであるMaskPoseは、OCHumanにおけるトップダウンアプローチの中でも最高のものである。
BBox-Mask-Poseは、OCHumanデータセット上のSOTAを、検出、インスタンスセグメンテーション、ポーズ推定という3つのタスクすべてでプッシュする。
大規模なインスタンスが重複するシーンでは特に良好で、ベースライン検出器よりも39%検出が改善されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:28:25 GMT)
Conformal Prediction and Human Decision Making [24.6] 医学や金融といった高度な分野において、予測の不確実性を定量化する手法が求められている。
コンフォーマルな予測は、特定の平均カバレッジを持つ一連の予測を生成する一般的な方法として現れてきた。
しかし, 人的意思決定を支援するための共形予測セットの価値は, カバレッジ保証と意思決定者の目標と戦略との不安定な関係が原因で, いまだ解明されていない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:18:09 GMT)
AdvAD: Exploring Non-Parametric Diffusion for Imperceptible Adversarial Attacks [24.4] 知覚不能な敵攻撃は、入力データに知覚不能な摂動を加えることでDNNを騙すことを目的としている。
従来手法では、特定の設計された知覚に基づく損失や生成モデルの能力と共通の攻撃パラダイムを統合することにより、攻撃の非受容性を改善することが一般的であった。
本稿では、既存の攻撃パラダイムとは異なる新しいモデリングフレームワークAdvAD(Adversarial Attacks in Diffusion)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:22:39 GMT)
How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation [24.4] 大規模言語モデル(LLM)は多様なシナリオに広くデプロイされている。
彼らが誤報をうまく広める程度は、重大な安全上の懸念として浮かび上がっている。
暗黙的誤報の最初のベンチマークであるECHOMISTをキュレートした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:59:18 GMT)
Enhancing Ultra High Resolution Remote Sensing Imagery Analysis with ImageRAG [24.3] ImageRAG for RSは、UHRリモートセンシング画像の解析の複雑さに対処する、トレーニング不要のフレームワークである。
ImageRAGのコアイノベーションは、UHRイメージの最も関連性の高い部分を視覚的コンテキストとして選択的に検索し、焦点を合わせる能力にある。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:16:13 GMT)
HisTrackMap: Global Vectorized High-Definition Map Construction via History Map Tracking [24.2] 本稿では,地図要素の履歴軌跡を時間的に追跡することで,新たなエンドツーエンド追跡フレームワークのグローバルマップ構築を提案する。
このトラッキングフレームワーク内にMap-Trajectory Prior Fusionモジュールを導入し、追跡されたインスタンスの過去の事前情報を活用して、時間的滑らかさと連続性を改善する。
nuScenesとArgoverse2データセットに関する実質的な実験により、提案手法は、単一フレームおよび時間メトリクスの両方において、最先端(SOTA)メソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:21:55 GMT)
Tacchi 2.0: A Low Computational Cost and Comprehensive Dynamic Contact Simulator for Vision-based Tactile Sensors [24.2] 視覚ベースの触覚センサの耐久性は、触覚情報取得のコストを大幅に高める。
計算コストの低い視覚ベースの触覚シミュレータTacchiを紹介する。
Tacchi 2.0は、触覚画像、マークされたモーション画像、そして押したり、滑ったり、回転したりといった異なる動作状態下での関節画像をシミュレートすることができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:34:12 GMT)
UniCombine: Unified Multi-Conditional Combination with Diffusion Transformer [24.2] 条件の組み合わせを扱える多条件制御可能な多条件生成フレームワークを提案する。
具体的には、新しいMMDiTアテンション機構を導入し、トレーニング可能なLoRAモジュールを組み込む。
また,マルチ条件生成タスク用に設計された最初のデータセットであるSubjectSpatial200Kを構築するための新しいパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:22:47 GMT)
Sparse Autoencoder as a Zero-Shot Classifier for Concept Erasing in Text-to-Image Diffusion Models [24.2] Interpret then Deactivate (ItD) は、T2I拡散モデルにおける正確な概念除去を可能にする新しいフレームワークである。
ItDはスパースオートエンコーダを使用して、各概念を複数の機能の組み合わせとして解釈する。
さらなるトレーニングを必要とせずに、簡単に複数の概念を消去できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:46:40 GMT)
Un-Straightening Generative AI: How Queer Artists Surface and Challenge the Normativity of Generative AI Models [24.0] 13人のクイアアーティストを対象にワークショップを行い、GPT-4とDALL-E 3へのアクセスを参加者に提供した。
参加者は、デザインにさまざまな規範的価値が埋め込まれているため、これらのモデルの使用に苦労していました。
本稿では,「最先端」モデルの概念化の意義を論じ,FAccT研究者がキー代替品をどのようにサポートするかを検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:16:38 GMT)
FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model [24.0] 本稿では,3次元テンプレート条件付き拡散モデル上に構築された細粒度心臓画像合成フレームワークを提案する。
FCaSはテンプレート誘導条件拡散モデル(TCDM)を用いた正確な心構造生成を実現する
本稿では,不正確な合成画像による混乱を軽減するために,信頼を意識した適応学習(CAL)戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:25:09 GMT)
VideoScan: Enabling Efficient Streaming Video Understanding via Frame-level Semantic Carriers [23.5] VideoScanは、リアルタイムビデオインタラクションのための効率的な視覚言語モデル(VLM)推論フレームワークである。
VideoScanでは、各フレームを表すために単一のセマンティックキャリアトークンを使用している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:30:40 GMT)
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach [23.5] 本研究では,物理ロボットを用いた実環境におけるヌンペプソデスのナビゲーションエピソードに関する大規模実験を行った。
エンドツーエンドのトレーニングから生じる推論のタイプを分析します。
本稿では,エージェントが学習した値関数が長期計画に関連があることをポストホック分析で示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:55:23 GMT)
Probabilistic Reasoning with LLMs for k-anonymity Estimation [23.2] 本稿では,プライバシーに敏感な情報を含むユーザ生成文書のk-匿名性を推定することに着目し,不確実性を考慮した新しい数値推論タスクを提案する。
そこで本研究では,LLMを用いた共同確率分布の分解とk-値の推定を行うBRANCHを提案する。
実験の結果, 正しいk値を67%の時間で推定し, GPT-4o連鎖理論と比較して11%増加した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:41:25 GMT)
Adaptive Backdoor Attacks with Reasonable Constraints on Graph Neural Networks [23.2] ABARC(Adaptive Backdoor Attack with Reasonable Constraints)を提案する。
グラフレベルのタスクに対しては,グラフのトポロジに依存しないサブグラフバックドアアタックを提案する。
ノードレベルのタスクの場合、攻撃はノード機能の分析から始まり、続いてトリガ機能の選択と修正を行います。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:23:10 GMT)
Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training [22.9] 3D Gaussian Splatting (3DGS) は, トレーニング後の新規ビューの合成において, 優れた性能を示した。
しかし、そのレンダリング品質は、合成されたビューがトレーニングビューから著しく逸脱すると劣化する。
本稿では,自己生成データを用いて3DGSモデルを段階的にトレーニングすることで,クローズアップビュー生成のための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:44:00 GMT)
Prompt Inference Attack on Distributed Large Language Model Inference Frameworks [22.8] 現代の大規模言語モデル(LLM)の推論プロセスでは、計算資源の禁止が要求され、コンシューマグレードのデバイスへのデプロイでは不可能である。
近年,資源制約のあるハードウェア上での協調LLM推論を実現するために,分割学習原理を用いた分散LLM推論フレームワークが提案されている。
しかし、LDM層を参加者に分散させるには中間出力の送信が必要であるため、元の入力プロンプトにプライバシーリスクが生じる可能性がある。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:36:29 GMT)
Communication-Efficient Language Model Training Scales Reliably and Robustly: Scaling Laws for DiLoCo [22.7] 固定計算予算下でのLLMのトレーニングにおいて,DiLoCoのスケーリング法挙動について検討した。
DiLoCoはモデルサイズで予測可能かつ堅牢にスケールする。
十分に調整された場合、DiLoCoはモデルサイズでデータ並列トレーニングよりもスケールし、小さなモデルサイズでもデータ並列トレーニングよりパフォーマンスがよい。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:04:38 GMT)
Online Language Splatting [22.5] 3DGS-SLAMシステム内で、オンライン、ほぼリアルタイムでオープン語彙の言語マッピングを実現するための最初のフレームワークであるOnline Language Splattingを紹介する。
我々のオンライン手法は最先端のオフライン手法を精度良く超え,40倍以上の効率向上を実現している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:49:24 GMT)
Measure Twice, Cut Once: Grasping Video Structures and Event Semantics with LLMs for Video Temporal Localization [22.5] 時間的局所化タスクのためのタイムスタンプのないフレームワークであるMeCoを紹介する。
MeCoは、提案された構造トークン生成とグラウンドパイプラインに基づいて、ビデオを全体的なイベントとトランジションセグメントに分割する。
本稿では,LLMを補完するクエリ中心のキャプションタスクを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:33:50 GMT)
SSD: A State-based Stealthy Backdoor Attack For Navigation System in UAV Route Planning [22.0] 無人航空機(UAV)はリスクの高い作業を行うためにますます用いられる。
UAVはサイバーセキュリティの脅威をエスカレートする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:19:58 GMT)
Overcoming Data and Model Heterogeneities in Decentralized Federated Learning via Synthetic Anchors [21.9] 従来のフェデレートラーニング(FL)には、ユーザデータのプライバシを維持しながら、グローバルモデルの協調的なトレーニングが含まれる。
そのブランチの1つ、分散FLは、クライアントが別々のローカルモデルを所有し、最適化できるサーバーレスネットワークである。
本稿では,DeSAと呼ばれる合成アンカーを導入し,新しい分散FL手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:39:54 GMT)
SDD-4DGS: Static-Dynamic Aware Decoupling in Gaussian Splatting for 4D Scene Reconstruction [21.8] SDD-4DGSは、ガウススプラッティングに基づく4次元シーン再構成のための最初のフレームワークである。
提案手法は,ガウス再建パイプラインに自然に統合された確率論的動的知覚係数に基づく。
5つのベンチマークデータセットの実験により、SDD-4DGSは復元忠実度において最先端の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:25:58 GMT)
Accurate INT8 Training Through Dynamic Block-Level Fallback [21.8] トランスフォーマーモデルは、さまざまなAIアプリケーションで顕著な成功を収めているが、かなりのトレーニングコストに直面している。
オフレイアを含むアクティベーションブロックに対して,動的に8ビットから16ビットにフォールバックする混合精度GEMMを実装したフォールバック量子化を提案する。
実験により、我々のアプローチは微調整と事前学習の両方で堅牢に機能していることが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:20:28 GMT)
CMP: Cooperative Motion Prediction with Multi-Agent Communication [21.6] 本稿では,協調動作予測の実現可能性と有効性について検討する。
提案手法であるCMPは,LiDAR信号をモデル入力とし,追跡と予測能力を向上させる。
特に、CMPは最強のベースラインに比べて平均予測誤差を12.3%削減する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:03:13 GMT)
EVOKE: Elevating Chest X-ray Report Generation via Multi-View Contrastive Learning and Patient-Specific Knowledge [21.6] textbfEVOKEは、マルチビューコントラスト学習と患者固有の知識を取り入れた、新しい胸部X線レポート生成フレームワークである。
本稿では,患者固有の指標を統合した知識誘導レポート生成モジュールを提案する。
提案するEVOKEは,複数のデータセットにまたがる最新の最先端手法を超越している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:38:02 GMT)
Differentially Private Equilibrium Finding in Polymatrix Games [21.2] 2つの設定のいずれかで高い精度と差分プライバシー予算を同時に達成できないことを示す。
我々は,Nashギャップを同時に解消して戦略を回復する分散アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:54:23 GMT)
Natural Humanoid Robot Locomotion with Generative Motion Prior [21.1] 本稿では,ヒューマノイドロボットの移動作業のきめ細かい監督を行う新しいジェネレーティブ・モーション・プライオリティ(GMP)を提案する。
我々は、条件付き変分自動エンコーダに基づいて、ロボットの将来の自然参照動作を予測するために、生成モデルをオフラインでトレーニングする。
政策訓練の間、生成運動は凍結したオンラインモーションジェネレータとして機能し、軌道レベルで正確に包括的な監視を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:04:15 GMT)
Unified Locomotion Transformer with Simultaneous Sim-to-Real Transfer for Quadrupeds [21.0] Unified Locomotion Transformer (ULT)は、知識伝達とポリシー最適化のプロセスを統合するための新しいトランスフォーマーベースのフレームワークである。
ポリシーは強化学習、次の状態アクション予測、アクション模倣によって最適化され、すべて1つのトレーニング段階で、ゼロショットデプロイメントを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:15:13 GMT)
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction [20.7] 本稿では、RAGフレームワーク内の情報ゲインのレンズを通して、検索品質を測定する自動評価手法を提案する。
検索の利便性を,検索後の意味的難易度を低減する程度で定量化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:49:58 GMT)
Explicit Learning and the LLM in Machine Translation [20.6] 本研究では,大規模言語モデル(LLM)の明示的学習能力について検討する。
制御されたテスト環境として手段によって生成された構築言語を用いて,LLMの文法規則を明示的に学習し適用する能力を評価する実験を設計した。
思考の連鎖を微調整することで、LLMのパフォーマンスは著しく向上するが、類型的に新しい言語的特徴やより複雑な言語的特徴への一般化に苦慮する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:57:08 GMT)
Harmonizing Large Language Models with Collaborative Behavioral Signals for Conversational Recommendation [20.5] 本研究は、潜在的嗜好モデルを用いて、対話的相互作用と行動パターンを相乗化する新しい確率的枠組みを提案する。
このフレームワークは、まず、確立された協調フィルタリング技術を通して潜在的嗜好表現を導出し、次にこれらの表現を用いて、言語的嗜好表現と行動パターンの両方を共同で洗練する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:01:09 GMT)
SciFi-Benchmark: How Would AI-Powered Robots Behave in Science Fiction Literature? [20.5] 我々は824のSF文学において重要な瞬間にまたがるベンチマークを生成する。
我々は、同様の状況下で質問を生成するために、各キーモーメントをLLMで再現する。
次に、人間の投票した回答の集合上で、モデルと人間の価値がいかにうまく一致しているかを近似する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:35:51 GMT)
EigenGS Representation: From Eigenspace to Gaussian Image Space [20.5] EigenGSは、固有空間と画像空間のガウス表現を接続する効率的な変換パイプラインである。
EigenGSは直接2次元ガウスフィッティングよりも優れた再現性が得られることを示す。
結果は,様々な解像度と多様なカテゴリを持つ画像に対して,EigenGSの有効性と一般化能力を強調した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:21:58 GMT)
HiFi-CS: Towards Open Vocabulary Visual Grounding For Robotic Grasping Using Vision-Language Models [20.4] 本稿では、画像とテキストの埋め込みを融合させるためのFiLM(Featurewise Linear Modulation)の階層的応用を特徴とするHiFi-CSを紹介する。
ビジュアルグラウンドティングは2D/3D空間のオブジェクトと自然言語入力を関連付け、クローズドとオープンボキャブラリの2つのシナリオで研究されている。
7-DOFロボットアームを用いた実世界RGS実験によるアプローチの有効性を検証し、15台のテーブルトップシーンで90.33%の視覚的接地精度を達成した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:30:37 GMT)
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space [20.4] 潜在拡散モデル(LDM)は不安定な生成過程を持つことが知られている。
これにより、一貫した結果を必要とするアプリケーションに適用できなくなる。
本研究では,LDMをシフト同変にすることで整合性を高めるために再設計する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:16:30 GMT)
The Interaction Layer: An Exploration for Co-Designing User-LLM Interactions in Parental Wellbeing Support Systems [20.3] 我々はNurtureBotを開発した。NurtureBotは、新しい親のための幸福なサポートアシスタントだ。
32人の親が非同期リモートコミュニティ方式でシステムを設計した。
改良されたプロトタイプは、Interaction Layerを特徴とするもので、32人の親と46人の親によって評価された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:29:28 GMT)
Prompt to Restore, Restore to Prompt: Cyclic Prompting for Universal Adverse Weather Removal [19.9] 普遍的悪天候除去(UAWR)は、統合された枠組みの中で様々な気象劣化に対処しようとするものである。
近年の手法は、事前学習された視覚言語モデル(例えば、CLIP)を用いた即時学習にインスパイアされている。
本稿では,UAWRの有効性,適応性,一般化性の向上を目的とした,革新的なサイクリックプロンプト手法であるCyclicPromptを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:03:06 GMT)
Steering No-Regret Agents in MFGs under Model Uncertainty [19.8] 本研究では,密度非依存遷移を伴う平均フィールドゲームにおけるステアリング報酬の設計について検討する。
我々は,エージェントの行動と所望の行動との累積的ギャップについて,サブ線形後悔の保証を確立する。
本研究は, 不確実な大人口システムにおいて, エージェントの操舵行動に有効な枠組みを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:02:02 GMT)
Provable Imbalanced Point Clustering [19.7] 不均衡点クラスタリングの近似を計算するための効率的かつ証明可能な手法を提案する。
提案手法の実証的寄与を実画像(ノイズと参照)、合成データ、実世界のデータに示す実験を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:18:23 GMT)
In-Context Defense in Computer Agents: An Empirical Study [19.7] 我々は,テキスト・コンテクスト・ディフェンスを導入し,コンテキスト内学習とチェーン・オブ・シークレット・推論を活用して攻撃に対処する。
我々のアプローチは、悪意のある環境とそれに対応する防御応答の両方を含む、慎重にキュレートされた例題の小さなセットでエージェントのコンテキストを増強することである。
提案手法の有効性を実証し, ポップアップウィンドウ攻撃では91.2%, 環境注入攻撃では74.6%, 邪魔広告に対しては100%の防御効果が得られた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:38:15 GMT)
Enhancing High-Quality Code Generation in Large Language Models with Comparative Prefix-Tuning [19.5] 大型言語モデル(LLM)は商用コード補完エンジンで広く採用されている。
LLMは、コーディング標準に違反した品質の問題のあるコードを生成する。
制御可能な高品質コード生成のための新しい比較プレフィックスチューニング法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:15:46 GMT)
Safe RuleFit: Learning Optimal Sparse Rule Model by Meta Safe Screening [19.5] スパースルールモデル(sparse rule model)は,ルールのスパース線形結合の形での予測モデルである。
このような規則の数は極端に多いため、最適な一連のアクティブな規則を計算的に選択することは困難である。
我々は、よく知られた安全なスクリーニング手法の非自明な拡張であるSafe RuleFit (SRF)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:59:48 GMT)
Probing Network Decisions: Capturing Uncertainties and Unveiling Vulnerabilities Without Label Information [19.5] 本稿では, 対実例を用いて分類器の弱点を明らかにするための新しい枠組みを提案する。
本研究では, 画像分類ベンチマークを用いて, 誤分類検出の性能を検証し, その妥当性を検証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:05:58 GMT)
Reasoning is All You Need for Video Generalization: A Counterfactual Benchmark with Sub-question Evaluation [19.5] マルチ次元マルチモーダルベンチマークであるtextbfunderline(textbfunderlineCounterfactual textbfunderlineEo textbfunderlineReasoning)を導入する。
複雑なクエリを構造化されたサブクエリに分解し、きめ細かい推論分析を可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:25:51 GMT)
Paths-over-Graph: Knowledge Graph Empowered Large Language Model Reasoning [19.4] 我々は,KGから知識推論経路を統合することで,Large Language Models(LLM)推論を強化する新しい手法であるPaths-over-Graph(PoG)を提案する。
PoGは3段階の動的マルチホップパス探索を通じて、マルチホップとマルチエンタリティの問題に取り組む。
実験では、GPT-3.5-TurboのPoGは、GPT-4のToGを最大23.9%上回った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:45:13 GMT)
Enhancing elusive clues in knowledge learning by contrasting attention of language models [19.4] 本稿では,言語モデル事前学習における知識学習の促進手法を提案する。
より大きな言語モデルは、より小さな言語モデルによって見落とされがちな、目立たないが重要な手がかりにより多くの注意を払っていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:42:19 GMT)
DAMM-Diffusion: Learning Divergence-Aware Multi-Modal Diffusion Model for Nanoparticles Distribution Prediction [19.4] 腫瘍の診断と治療には,ナノ粒子分布の予測が重要である。
textbfDAMM-Diffusionモデル(textbfDAMM-Diffusionモデル)を提案し、ユニモーダル分岐とマルチモーダル分岐から予測結果を適応的に生成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:52:05 GMT)
ICMarks: A Robust Watermarking Framework for Integrated Circuit Physical Design IP Protection [19.4] ICMarksは、最新のIC物理設計のための品質保存および堅牢な透かしフレームワークである。
ICMarksは、有線長とタイミングメトリクスの劣化を伴わず、オーナシップの証明に成功している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:37:44 GMT)
CryptoX : Compositional Reasoning Evaluation of Large Language Models [18.9] 既存のベンチマークと暗号を組み合わせた評価フレームワークであるCryptoXを紹介する。
我々はCryptoBenchを用いて、広く使われているオープンソースおよびクローズドソース LLM に関する詳細な実験を行う。
コンポジション推論を独立に研究することの価値を強調し,LLMのコンポジション推論能力を高める必要性を強調した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:17:27 GMT)
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary [18.7] VLogはビデオナレーションを語彙として定義するビデオ理解フレームワークである。
軽量言語モデル GPT-2 上に構築された VLog には,3つの重要なイノベーションがある。 (i) 生成的検索モデル。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:53:30 GMT)
Ext2Gen: Alignment through Unified Extraction and Generation for Robust Retrieval-Augmented Generation [18.6] 提案するExt2Genは,回答を生成する前にクエリ関連文を抽出することでRAGを強化する新しい抽出列生成モデルである。
実験により、Ext2Genはクエリ関連文を高い精度とリコールで効果的に識別し、信頼性の高い回答をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:42:18 GMT)
Autoregressive Image Generation with Vision Full-view Prompt [18.6] 自動回帰画像生成のための視覚フルビュープロンプト(VFプロンプト)を提案する。
NLPの分野でのプロンプトエンジニアリングにインスパイアされ、自動回帰画像生成を改善するためにビジョンフルビュープロンプト(VFプロンプト)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:09:21 GMT)
Robust Multimodal Survival Prediction with the Latent Differentiation Conditional Variational AutoEncoder [18.5] 本研究では,マルチモーダルサバイバル予測のための条件付き遅延微分変分自動エンコーダ(LD-CVAE)を提案する。
具体的には, ギガピクセルWSIから圧縮された病理表現を学習するために, 変分情報ボトルネック変換器 (VIB-Trans) モジュールを提案する。
多様な機能を持つゲノム埋め込みの共通部分および特定の部分について学習するために,新しい遅延微分変分オートエンコーダ (LD-VAE) を開発した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:58:37 GMT)
Is LLMs Hallucination Usable? LLM-based Negative Reasoning for Fake News Detection [18.4] 本研究では, 自己強化型推論補正手法を提案する。
それは、ニュースに対する一般的な合理的な推論と間違った理解(否定的な推論)の両方をもたらす。
3つの人気のある偽ニュースデータセットで検証した実験結果から,本手法の優位性が確認された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:29:59 GMT)
MAC-VO: Metrics-aware Covariance for Learning-based Stereo Visual Odometry [18.4] MAC-VOは,学習用ステレオVOである。
我々のキーポイントセレクタは、学習した不確実性を利用して、グローバルな不整合に基づいて低品質な特徴をフィルタリングする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:51:33 GMT)
Single-Shot Metric Depth from Focused Plenoptic Cameras [18.4] 視覚センサによる距離推定は、ロボットが環境を知覚し、ナビゲートし、操作するために不可欠である。
光電界イメージングは、単一のデバイスを通してユニークなレンズ構成を使用することで、メートル法深度を推定するための有望なソリューションを提供する。
我々の研究は、高密度なメートル法深度のための集束型レンズカメラの可能性を探究する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:31:15 GMT)
FAST-Splat: Fast, Ambiguity-Free Semantics Transfer in Gaussian Splatting [18.2] FAST-Splat for fast, ambiguity-free semantic Gaussian Splatting。
閉集合セマンティック蒸留の限界を解消したFAST-Splatのボトムアップ手法を提案する。
FAST-Splatはトレーニングが6倍から8倍速く、レンダリングが18倍から51倍速く、GPUメモリが6倍小さい。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:17:03 GMT)
Learning Few-Step Diffusion Models by Trajectory Distribution Matching [18.2] トラジェクティブ・ディストリビュータ・マッチング(TDM)は、トラジェクタ・マッチングとトラジェクタ・マッチングの強さを組み合わせた統合蒸留パラダイムである。
我々は,学習目標を異なるステップで分離し,より調整可能なサンプリングを可能にする,サンプリングステップ対応の目標を開発する。
我々のモデルであるTDMは、様々なバックボーン上で既存の手法よりも優れており、優れた品質を提供し、トレーニングコストを大幅に削減する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:25:18 GMT)
KV-Edit: Training-Free Image Editing for Precise Background Preservation [18.1] KV-Editはトレーニング不要のアプローチで、バックグラウンドの一貫性を維持するためにDiTのKVキャッシュを使用する。
我々のアプローチは、追加のトレーニングなしでDiTベースの生成モデルと互換性がある。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:23:32 GMT)
CS-Dialogue: A 104-Hour Dataset of Spontaneous Mandarin-English Code-Switching Dialogues for Speech Recognition [17.8] コードスイッチング(英: Code-switching)とは、1つの会話の中で2つ以上の言語を交換することである。
既存のマンダリン・イングリッシュのコードスイッチングデータセットは、サイズ、自発性、および書き起こしを伴うフル長の対話記録の欠如に悩まされることが多い。
CS-Dialogueは,200人の話者から104時間の自発的な会話を含む,大規模マンダリン・イングリッシュ・コードスイッチング音声データセットである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:06:01 GMT)
Other Vehicle Trajectories Are Also Needed: A Driving World Model Unifies Ego-Other Vehicle Trajectories in Video Latant Space [17.8] 本論文では,EOT-WMという駆動型textbfWorld textbfModelを提案する。
まず,BEV空間内のエゴなどの車両軌跡を画像座標に投影し,各軌跡と対応する車両とのマッチングを行う。
次に、軌跡映像を時空間変オートで符号化し、統一された視覚空間において、駆動ビデオ潜伏者と空間的・時間的に一致させる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:02:18 GMT)
PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs [17.6] Pythiaモデルスイート用の45の新しいトレーニング実行セットであるPolyPythiasを紹介します。
種によって決定される初期条件の違いが,(i)下流のパフォーマンス,(ii)言語表現の学習,(iii)訓練段階の出現に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:59:30 GMT)
Bimodal Connection Attention Fusion for Speech Emotion Recognition [17.6] 効果的なバイモーダル音声感情認識システムを構築するために,バイモーダル接続注意融合法(BCAF)を提案する。
BCAFには、対話型接続ネットワーク、バイモーダルアテンションネットワーク、相関アテンションネットワークの3つの主要なモジュールが含まれている。
MELDとIEMOCAPデータセットの実験は、提案されたBCAFメソッドが既存の最先端ベースラインより優れていることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:50:21 GMT)
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection [17.5] トレーニング性能を維持しながら計算オーバーヘッドを最小限に抑えるメモリ効率の高いCOAPを提案する。
LLaMA-1Bでは、メモリをわずか2%追加で61%削減し、AdamWと同じPPLを実現する。
8ビット量子化により、COAPはメモリを81%削減し、LLaVA-v1.5-7BファインチューニングのためにGaLoreを4倍高速化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:36:08 GMT)
Real-Time Risky Fault-Chain Search using Time-Varying Graph RNNs [17.5] 本稿では,電力グリッド内のカスケード故障連鎖(FC)をリアルタイムに検索するための,データ駆動型グラフィカルフレームワークを提案する。
気候変動によって引き起こされる極端な気象現象が増加するにつれて、カスケード障害を緩和し、グリッド安定性を確保するためにリスクの高いFCを特定することが重要である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:27:07 GMT)
Señorita-2M: A High-Quality Instruction-based Dataset for General Video Editing by Video Specialists [17.5] 高品質なビデオ編集データセットであるSenorita-2Mを紹介する。
高品質で特殊な4つのビデオ編集モデルを構築することで構築される。
編集が不十分なビデオペアを除去するためのフィルタリングパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:47:48 GMT)
Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models [17.4] 言語間移動により、視覚言語モデルは1つの言語でのみトレーニングデータを用いて様々な言語で視覚タスクを実行することができる。
現在のアプローチは、大規模で訓練済みの多言語言語モデルに依存している。
本稿では,事前学習したVLM Florence-2と大規模言語モデルGemma-2を組み合わせた,0.4Bから11.2Bの単一言語エンコーダVLMであるFlorenzを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:41:10 GMT)
Can Vision-Language Models Evaluate Handwritten Math? [17.4] FERMATは、手書きコンテンツのエラーを検出し、ローカライズし、修正するVision-Language Modelsの能力を評価するために設計されたベンチマークである。
我々は、エラー検出、ローカライゼーション、修正の3つのタスクにまたがる9つのVLMをベンチマークする。
Gemini-1.5-Proは誤り訂正率が最も高い。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:10:33 GMT)
Chain of Thoughtlessness? An Analysis of CoT in Planning [17.3] 推論問題におけるLLM(Large Language Model)のパフォーマンスは通常、分布から一般化しない。
本稿では,古典的計画領域であるBlocksworldの問題に対する思考連鎖のケーススタディを示す。
それらのプロンプトが問題クラスに特有である場合、一連の思考プロンプトから有意義なパフォーマンス改善が得られます。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:56:46 GMT)
Local Look-Ahead Guidance via Verifier-in-the-Loop for Automated Theorem Proving [17.3] 自動定理証明タスクのための新しい検証器-イン・ザ・ループ設計を提案する。
実験により,ステップバイステップの局所的検証がモデルの推論精度と効率を大域的に向上させることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:20:47 GMT)
Text-to-3D Generation by 2D Editing [17.2] 事前訓練された2D拡散モデルから3D表現を蒸留することは、ゲーム、フィルム、インテリアデザインの3Dクリエイティブアプリケーションに不可欠である。
現在のSDS法は拡散モデルからの非効率な情報蒸留によって妨げられ、光現実的な3Dコンテンツの作成を妨げている。
本稿では,事前学習した拡散モデルを用いて,複数ステップで多粒度情報を抽出する3次元編集(GE3D)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:05:39 GMT)
COMAE: COMprehensive Attribute Exploration for Zero-shot Hashing [17.0] COMAEと呼ばれるゼロショットハッシュ(ZSH)のための総合属性探索を行う。
COMAEは、3つの精巧に設計された探索を通して、見知らぬクラスから目に見えないクラスとの関係を描いている。
一般的なZSHデータセットの結果は、COMAEが最先端のハッシュ技術より優れていることを示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:29:30 GMT)
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens [16.9] Layton(Latent Consistency Tokenizer)は、事前学習された潜在拡散モデル(LDM)のコンパクト潜在空間で離散的視覚トークンをブリッジする
MSCOCO-2017の1024x1024画像再構成のためのFrechet Inception DistanceをMSCOCO-2017 5Kベンチマークで10.8再構成した。
私たちはLaytonをテキストから画像生成モデルであるLaytonGenに拡張し、自動回帰で作業します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:31:33 GMT)
Large Language Models for Multi-Facility Location Mechanism Design [16.9] 深層学習モデルは、マルチファシリティロケーションのための戦略防御メカニズムの代替として提案されている。
LLMMechと呼ばれる新しいアプローチを導入し、大きな言語モデルを進化のフレームワークに組み込むことにより、これらの制限に対処する。
実験の結果, LLM生成機構は, 既存の手作りベースラインやディープラーニングモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:49:56 GMT)
LLM-Guided Compositional Program Synthesis [16.9] 大規模言語モデル(LLM)は、異なるターゲット言語でコードを生成することによってPBEタスクを解く能力を持つが、予測不能に失敗する可能性がある。
そこで本研究では,LLMのためのシンプルなサブタスクを構築することで,障害から回復する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:36:43 GMT)
Enhanced Continual Learning of Vision-Language Models with Model Fusion [16.8] VLM(Vision-Language Models)は、人工知能のブレークスルーである。
VLMは、複数の下流タスクで連続的に微調整されたときに、破滅的な忘れをしがちである。
本稿では,連続的な学習にモデル融合を導入することで,新しいアプローチであるConDUを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:48:13 GMT)
ExBody2: Advanced Expressive Humanoid Whole-Body Control [16.7] 人間のモーションキャプチャーとシミュレーションデータの両方に基づいてトレーニングされた全身トラッキングコントローラの製作法を提案する。
我々は,ロボットのキネマティクスに適合する中間データを生成するために,教師の方針を利用する。
少量のデータによる微調整により追跡性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:40:43 GMT)
Distributed quantum algorithm for divergence estimation and beyond [16.7] 本稿では,$rm Tr(f(A)g(B))$を付加誤差$varepsilon$内で計算する分散量子アルゴリズムフレームワークを提案する。
このフレームワークは、様々な分散量子コンピューティングタスクに適用可能である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:28:22 GMT)
TPDiff: Temporal Pyramid Video Diffusion Model [16.5] トレーニングと推論効率を向上させる統合フレームワークであるPDiffを提案する。
拡散をいくつかの段階に分割することで,拡散過程に沿ってフレームレートを徐々に向上させる。
整列データと雑音下での拡散の分配された確率流常微分方程式(ODE)を解くことにより、我々の訓練戦略は様々な拡散形式に適用できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:33:22 GMT)
AI Suggestions Homogenize Writing Toward Western Styles and Diminish Cultural Nuances [16.3] 本稿では,西洋中心のAIモデルが,異なる文化的背景を持つユーザに対して提案書を提示した場合に何が起こるかを検討する。
インドと米国からの参加者118名を対象に、異文化間制御実験を行った。
分析の結果、AIはインド人に比べて、アメリカ人の効率が向上したことがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:40:12 GMT)
SCOPE-DTI: Semi-Inductive Dataset Construction and Framework Optimization for Practical Usability Enhancement in Deep Learning-Based Drug Target Interaction Prediction [16.0] SCOPE-DTIは、大規模でバランスの取れたセミインダクティブなDTIデータセットと高度なディープラーニングモデリングを組み合わせた統合フレームワークである。
SCOPEデータセットは、Humanデータセットのような一般的なベンチマークと比較して、データボリュームを最大100倍に拡張する。
包括的なデータ、高度なモデリング、およびアクセス可能なツールを提供することで、SCOPE-DTIは薬物発見の研究を加速する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:46:25 GMT)
Test-Time Discovery via Hashing Memory [16.0] テスト時間ディスカバリ(TTD)は、テスト中のクラスシフトに対処する新しいタスクである。
TTDの重要な課題は、新たに発見されたクラスと、すでに特定されているクラスを区別することである。
本稿では,クラス発見を向上する学習不要なハッシュベースのメモリ機構を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:43:01 GMT)
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models [15.9] 拡散言語モデルは自己回帰モデルよりも独特な利点を提供する。
確率モデリングに遅れがあり、固定長生成に制限される。
本稿では,離散化拡散モデルと自己回帰モデルとを補間するブロック拡散言語モデルについて紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:43:40 GMT)
MoE-Infinity: Efficient MoE Inference on Personal Machines with Sparsity-Aware Expert Cache [15.8] MoE-Infinityは、GPUメモリ容量に制限のあるパーソナルマシン向けに設計された効率的なMoE推論システムである。
選択されたトレースを分析することで、MoE-Infinityはエキスパートキャッシュの置換とプリフェッチをガイドし、トークン毎の3.1-16.7倍のレイテンシ改善を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:14:21 GMT)
Active Learning Inspired ControlNet Guidance for Augmenting Semantic Segmentation Datasets [15.8] ControlNetは、地上の真実セグメンテーションマスクと生成された画像内容との正確なアライメントを可能にする。
本稿では,アクティブな学習に基づく選択指標を後方拡散プロセスに統合するための最初のアプローチを提案する。
誘導合成データを用いて訓練されたセグメンテーションモデルは、非誘導合成データで訓練されたモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:09:27 GMT)
Large Language Model Enhanced Knowledge Representation Learning: A Survey [15.6] 知識表現学習(KRL)は、知識グラフから下流タスクへの記号的知識の適用を可能にするために重要である。
この研究は、これらの進化する領域における新たな研究方向を同時に特定しながら、下流のタスクの広範な概要を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:48:32 GMT)
A Survey on Enhancing Causal Reasoning Ability of Large Language Models [15.6] 大規模言語モデル(LLM)は、最近、言語タスク以降で顕著なパフォーマンスを示している。
LLMは、医療や経済分析などの堅牢な因果推論能力を必要とするタスクを扱う上で、依然として課題に直面している。
本稿では,LLMの因果推論能力の強化に関する文献を体系的にレビューする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:20:31 GMT)
MP-HSIR: A Multi-Prompt Framework for Universal Hyperspectral Image Restoration [15.5] ハイパースペクトル画像(HSI)は、イメージング中に多彩で未知の劣化に悩まされることが多い。
既存のHSI復元法は特定の劣化仮定に依存しており、複雑なシナリオでの有効性を制限している。
我々は,スペクトル,テキスト,視覚的プロンプトを効果的に統合し,汎用的なHSI復元を実現する,新しいマルチプロンプトフレームワークMP-HSIRを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:40:49 GMT)
Automating Code Review: A Systematic Literature Review [15.4] コードレビューは、コード品質の向上を目標として、チームメイトによって書かれたコードを評価することで構成される。
実証的な研究は、そのようなプラクティスによってもたらされた利益を文書化しており、開発者の時間という面ではコストがかかる。
コードレビュータスクを自動化する技術とツールが提案されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:19:10 GMT)
Accelerate 3D Object Detection Models via Zero-Shot Attention Key Pruning [15.4] 3次元オブジェクト検出モデルにおけるトランスフォーマーデコーダのゼロショット実行時プルーニング法を提案する。
提案手法は,ToC3Dモデルのトランスデコーダにおける1.99倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:03:24 GMT)
SurgicalVLM-Agent: Towards an Interactive AI Co-Pilot for Pituitary Surgery [15.3] 大規模ビジョン言語モデル(VLM)は、動的なタスク計画と予測決定サポートを可能にすることで、有望なソリューションを提供する。
本稿では,画像ガイド下下垂体手術のためのAIコパイロットであるオペレーショナルVLM-Agentについて紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:30:39 GMT)
SimLingo: Vision-Only Closed-Loop Autonomous Driving with Language-Action Alignment [15.2] 本研究では,(1)クローズドループ駆動,(2)視覚言語理解,(3)言語行動アライメントの3つのタスクを処理できるモデルを提案する。
我々のモデルSimLingoは視覚言語モデル(VLM)に基づいており、LiDARのような高価なセンサーを除いて、カメラのみを使用します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:06 GMT)
Learning Visual Proxy for Compositional Zero-Shot Learning [15.2] 視覚分布の学習を容易にする新しいアプローチである視覚プロキシラーニングを紹介する。
本稿では,原文画像空間と細粒度視覚空間との相互制約を課す効果的なクロスモーダル・ジョイント・ラーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:46:59 GMT)
On the Learn-to-Optimize Capabilities of Transformers in In-Context Sparse Recovery [15.2] K層変換器は, 証明可能な収束率を持つL2OアルゴリズムをK層に線形に実行可能であることを示す。
従来のL2Oアルゴリズムとは違って、トレーニングにおいて測定行列に一致させる必要があるが、トレーニングされたTransformerは、異なる測定行列で生成されたスパースリカバリ問題を解くことができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:09:21 GMT)
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models [15.1] PRISMは、異種データ分散における安定した性能を保証する生成モデルに適したフレームワークである。
ポーラス化特性により、PRISMは余分なプルーニングや量子化なしに軽量なモデルが得られる。
PRISMは、非IIDおよびプライバシ保護FL環境下で画像の生成に成功した最初の企業である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:22:25 GMT)
Týr-the-Pruner: Unlocking Accurate 50% Structural Pruning for LLMs via Global Sparsity Distribution Optimization [15.0] T'yr-the-Prunerは、効率的なエンドツーエンド検索ベースのグローバルな構造解析フレームワークである。
実効的な局所刈り取りと,スーパーネット構築を改善するための予測誤差蓄積手法を導入する。
その結果、T'yr-the-Prunerは最先端の構造解析を達成し、高密度モデルの性能の97%を維持しながら、Llama-3.1-70Bのパラメータの50%を除去した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:52:49 GMT)
Bayesian WeakS-to-Strong from Text Classification to Generation [14.9] この研究は、人間の意見の多様性をシミュレートする弱いモデルのアンサンブルを探索することで、Weak-to-StrongからWeakS-to-Strongに拡張する。
信頼性スコアは、WeakS-to-Strong一般化を導くベイズ的アプローチを用いて推定される。
その結果,提案手法の有効性を学生モデルの信頼性に示し,スーパーアライメントの可能性を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:57:44 GMT)
Prompt Inversion Attack against Collaborative Inference of Large Language Models [14.8] 本稿では、悪意のある参加者が、前の参加者が送信したアクティベーションを通じて入力プロンプトを回復しようとする、プロンプト・インバージョン・アタック(PIA)の概念を紹介する。
Llama-65Bモデルを用いてSkytraxデータセットの88.4%のトークン精度を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:20:03 GMT)
CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model [14.7] 本稿では,3つの革新を通じて中国語の書道問題を解く視覚言語モデル(VLM)であるCalliReaderを提案する。
正確な文字抽出とソートのための文字スライシング、ビジュアルテキストトークン圧縮とアライメントのためのCalliAlign、埋め込み命令チューニング(e-IT)
ユーザスタディを含む大規模な実験は、CalliReaderのtextbfsuperiorityを、他の最先端の方法や人間専門家に検証するために実施されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:50:14 GMT)
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling [14.7] RewardSDSは、報酬モデルからのアライメントスコアに基づいてノイズサンプルを重み付けし、重み付けされたSDS損失を生成する。
この損失は、整列した高逆出力をもたらすノイズサンプルから勾配を優先する。
テキスト・ツー・イメージ,2D編集,テキスト・ツー・3D生成タスクにおいて,RewardSDSとRewardVSDを評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:59:47 GMT)
How to Combine Differential Privacy and Continual Learning [14.7] 継続的な学習は、センシティブなトレーニングデータに必要な厳密なプライバシーと矛盾する。
この研究は、CLと差分プライバシー(DP)の交わりを探求する。
CLとDPを組み合わせた手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:22:07 GMT)
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC [14.7] 既存の学習に基づくRANSAC手法は、ディープラーニングを利用して、外れ値に対するRANSACの堅牢性を高める。
本研究では,地中構造データに段階的にノイズを注入する拡散に基づく新しいパラダイムを提案する。
我々は,ScanNetとMegaDepthデータセットの総合的な実験を通じて,特徴マッチングの文脈におけるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:01:18 GMT)
GarmentPile: Point-Level Visual Affordance Guided Retrieval and Adaptation for Cluttered Garments Manipulation [14.6] 単衣の操作とは異なり、散らかったシナリオは複雑な衣服の絡み合いと相互作用を管理する必要がある。
我々は、点レベルの可測性、複素空間をモデル化した密度表現、およびマルチモーダルな操作候補を学習する。
本研究では,高度に絡み合った衣服を操作可能な状態に再構成するための適応モジュールを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:39:12 GMT)
Adversarial Vulnerabilities in Large Language Models for Time Series Forecasting [14.6] 大規模言語モデル(LLM)は、最近、時系列予測において大きな可能性を証明している。
しかし、現実世界のアプリケーションにおける堅牢性と信頼性は、まだ未調査のままである。
LLMに基づく時系列予測のためのターゲット対向攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:35:52 GMT)
Urban Region Representation Learning: A Flexible Approach [14.3] 本稿では,都市域の形成と入力領域の特徴の両方に柔軟に対応する都市域表現学習のためのモデルFlexiRegを提案する。
都市域表現を用いた4つの下流タスクの精度において,FlexiRegは最先端モデルよりも最大202%高い性能を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:33:44 GMT)
LREF: A Novel LLM-based Relevance Framework for E-commerce [14.2] 本稿では,eコマース検索の妥当性を高めることを目的とした,LREF(LLM-based Relevance Framework)と呼ばれる新しいフレームワークを提案する。
大規模な実世界のデータセットのオフライン実験やオンラインA/Bテストを通じて,フレームワークの性能を評価する。
このモデルは有名なeコマースアプリケーションにデプロイされ、かなりの商業的利益をもたらした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:10:30 GMT)
OASIS: Order-Augmented Strategy for Improved Code Search [14.2] コード検索の改善のための新しい秩序強化戦略を提案する。
オーダーベースの類似性ラベルを活用してモデルをトレーニングし、負のペア間の類似性の微妙な違いを捉えます。
これは、効果的なコード埋め込みトレーニングのために、オーダラベルと負のペア間の微妙な違いを利用する価値を強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:04:42 GMT)
Neural Network-Based Change Point Detection for Large-Scale Time-Evolving Data [14.1] 以下の2段階の手順に基づいて検出戦略を開発する。
戦略は、変化点の数と位置の両方について一貫した見積もりを得る。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:58:52 GMT)
FastTextSpotter: A High-Efficiency Transformer for Multilingual Scene Text Spotting [14.1] 本稿では,Swin Transformerの視覚バックボーンとTransformer-Decoderアーキテクチャを統合したFastTextSpotterを提案する。
FastTextSpotterは、通常のテキストのICDAR2015や任意の形のテキストのCTW1500、TotalTextなど、複数のデータセットで検証されている。
以上の結果から,FastTextSpotterは多言語シーンテキストの検出と認識において,より優れた精度を実現することが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:56:20 GMT)
Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features [14.0] 本稿では動的表現を強化するために動的静的特徴分離モジュール(DSFD)を提案する。
動的特徴と現在のフレーム特徴によって駆動される分離された特徴を取得する。
空間軸に沿って、動的領域の類似情報を適応的に選択する。
提案手法は,映像から4Dまで,最先端のSOTA(State-of-the-art)を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:49:03 GMT)
KNighter: Transforming Static Analysis with LLM-Synthesized Checkers [14.0] KNighterは、履歴パッチの知識によってガイドされる特殊な静的アナライザを生成する。
これまでKNighterの合成チェッカーは、Linuxカーネルに70の新しいバグ/脆弱性を発見した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:30:19 GMT)
Learning a Unified Degradation-aware Representation Model for Multi-modal Image Fusion [13.9] All-in-One Degradation-Aware Fusion Models (ADFM)は、ソース画像からの劣化を軽減し、高品質の融合画像を生成することで複雑なシーンに対処する。
メインストリームADFMは、しばしば高度に合成されたマルチモーダル・マルチクオリティ・イメージを監督に頼り、クロスモーダルおよび希少な劣化シナリオにおけるその有効性を制限している。
本稿では、赤外線と可視画像融合のための学習駆動統一表現モデルLUREについて述べる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:43:50 GMT)
From Task-Specific Models to Unified Systems: A Review of Model Merging Approaches [13.8] 本稿では、モデルマージ手法の新たな分類法を確立し、異なるアプローチを体系的に比較し、重要な展開の概要を提供する。
この分野での急速な進歩にもかかわらず、最近の進歩と今後の方向性を予測する包括的な分類学と調査はいまだに欠落している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:17:31 GMT)
Revisiting Backdoor Attacks on Time Series Classification in the Frequency Domain [13.8] 時系列分類(TSC)は現代のウェブアプリケーションの基盤となっている。
ディープニューラルネットワーク(DNN)は、臨界領域におけるTSCモデルの性能を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:05:32 GMT)
Language Models Fail to Introspect About Their Knowledge of Language [13.7] 我々は,21のオープンソース言語モデルを対象とした創発的イントロスペクションを体系的に検討する。
モデルがメタ言語的刺激に対する応答を、内部知識を忠実に反映しているかどうかを評価する。
本稿では,モデルが入力した応答が自身の文字列の確率を予測する度合いという,新しいイントロスペクション尺度を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:18:36 GMT)
TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues [13.7] そこで, TRACE は, 位置協調作業におけるライブ*共通グラウンド* トラッキングのための新しいシステムである。
TRACEは、高速でリアルタイムなパフォーマンスに焦点を当て、参加者のスピーチ、アクション、ジェスチャー、視覚的注意を追跡する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:20:31 GMT)
Freeze and Cluster: A Simple Baseline for Rehearsal-Free Continual Category Discovery [13.7] 本稿では,RF-CCD(Rehearsal-Free Continual Category Discovery)の問題に対処する。
RF-CCDはラベル付きデータからの知識を活用することで、新しいクラスを継続的に識別することに焦点を当てている。
従来のアプローチでは、両方のドメインの高度なテクニックを効果的に統合することに苦労していた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:46:32 GMT)
Two Simple Principles for Diffusion-Based Test-Time Adaptation [13.6] 拡散に基づくテスト時間適応(TTA)は、未知のテスト領域の画像をトレーニング領域にマッピングするために拡散モデルを活用する、大きな進歩を示している。
本稿では拡散法の設計手法の2つの簡単な原理を解明する。
単純だが効果的な拡散誘導型試験時間適応法(PDDA)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:19:07 GMT)
TabNSA: Native Sparse Attention for Efficient Tabular Data Learning [13.1] 本稿では,Native Sparse Attention(NSA)を活用した新しいディープラーニングアーキテクチャであるTabNSAを紹介する。
TabNSAは、グローバルなコンテキスト認識と局所的精度の両方を維持するために、粗粒度特徴圧縮と細粒度特徴選択を組み合わせた動的階層的スパース戦略を取り入れている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:13:41 GMT)
Learning Appearance and Motion Cues for Panoptic Tracking [13.1] パノプティカルトラッキングは、パノプティカルセグメンテーションにインスタンストラッキングを統合することで、ビデオのピクセルレベルのシーンを可能にする。
本稿では、情報とインスタンス固有の外観と動作特徴を同時にキャプチャする、パノプティカルトラッキングのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:32:29 GMT)
Measuring directional bias amplification in image captions using predictability [13.0] MLデータセットのバイアス増幅を測定するために,DPAC(Directional Predictability Amplification in Captioning)を提案する。
DPACはキャプションの方向バイアス増幅を測定し、データセットバイアスをよりよく推定し、攻撃モデルに敏感でない。
COCOキャプションデータセットを用いた実験は, DPACがキャプションのバイアス増幅測定において最も信頼性の高い指標であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:47:54 GMT)
Diffusion Models as Cartoonists: The Curious Case of High Density Regions [12.9] 拡散モデルの高密度領域における画像の種類について検討する。
そこで本研究では,通常の試料より高い確率の画像を連続的に生成する,実用的な高密度サンプリング器を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:08:55 GMT)
Fair Federated Medical Image Classification Against Quality Shift via Inter-Client Progressive State Matching [12.8] 本研究では, 単一状態に基づく公正性は, テスト中の公正性に対する適切な代名詞ではない,と論じる。
本稿では,複数の状態を用いて,探索距離の異なるシャープネスや摂動損失を算出し,収束度を評価することを提案する。
次にローカルトレーニングとグローバルアグリゲーションに2つのコンポーネントを組み込んで、各状態に対するクロスクライアントフェアネスを確保します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:56:28 GMT)
Distributionally Robust Multi-Agent Reinforcement Learning for Dynamic Chute Mapping [12.8] Amazonのロボット倉庫では、行き先とシュートをマッピングする問題は、効率的なパッケージソートに不可欠である。
本稿では,誘導率の逆方向変動に耐性のある宛先間マッピングポリシを学習する,分散ロバストなマルチエージェント強化学習フレームワークを提案する。
DRMARLは,様々な誘導分布が存在する場合の堅牢なシュートマッピングを実現し,シミュレーションシナリオにおけるパッケージ再循環を平均80%低減することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:56:25 GMT)
Dual-Domain Homogeneous Fusion with Cross-Modal Mamba and Progressive Decoder for 3D Object Detection [12.8] 均一なBEV空間におけるLiDAR点雲の特徴と画像の特徴は、自律運転における3次元物体検出に広く採用されている。
密度の高いボクセル空間における特徴融合を探求する研究もあるが、それらは高い計算コストとクエリ生成の非効率に悩まされている。
本稿では,BEVドメインとボクセルドメインの相補的優位性を利用するDual-Domain Homogeneous Fusion Network (DDHFusion)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:55:02 GMT)
Evaluating the Generalizability of LLMs in Automated Program Repair [12.7] DeFECTS4J-TRANSは,Deffects4Jを変換した新しいデータセットである。
Defects4J と DEFECTS4J-TRANS の両実験の結果、LLM は APR タスクにおいて限定的な一般化性を持つことが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:03:58 GMT)
Cockatiel: Ensembling Synthetic and Human Preferenced Training for Detailed Video Caption [12.7] Video Detailed Captioning (VDC)は、複雑なビデオコンテンツのきめ細やかな記述を可能にするビジョンブリッジのための重要なタスクである。
本稿では,現在の最先端手法をベンチマークし,2つの限界を体系的に同定する。
我々は,VDCの性能向上のために,人工的・人為的なトレーニングをアンサンブルする,新しい3段階トレーニングパイプラインであるCockatielを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:25:04 GMT)
Hierarchical Contact-Rich Trajectory Optimization for Multi-Modal Manipulation using Tight Convex Relaxations [12.6] 本稿では,ロボット,オブジェクト,コンタクトの軌跡を効率的に設計し,コンタクトリッチな操作を行うための新しい枠組みを提案する。
本研究では,Mixed-Integer Linear Program (MILP) がロボットとオブジェクト間の最適な接触を選択する階層的最適化フレームワークを提案する。
我々は,MILPがより厳密な解を提供できるようなバイナリ符号化技術を用いて,双線形制約の凸緩和を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:43:20 GMT)
On the Internal Representations of Graph Metanetworks [12.5] グラフメタネット (GMN) は, 中心核アライメント (CKA) を用いて, この分野における最先端の成果が得られることを示す。
様々な実験を通して、GMNと一般的なニューラルネットワーク(テクスタイト、多層パーセプトロン(MLP)、畳み込みニューラルネットワーク(CNN))が表現空間の点で異なることが明らかとなった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:12:34 GMT)
Exploring Position Encoding in Diffusion U-Net for Training-free High-resolution Image Generation [12.5] 事前トレーニングされたU-Netを介して高分解能潜伏剤をノイズ化すると、反復的および乱れたイメージパターンが生じる。
本稿では,プログレッシブ・バウンダリ・コンプリメント (PBC) 法を導入し,新しい学習自由な手法を提案する。
本手法は,特徴マップ内の動的仮想画像境界を作成し,位置情報の伝搬を向上させる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:51:17 GMT)
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation [12.4] CleverDistillerは、自己監督型の2D-to-3D KDフレームワークである。
セマンティックセグメンテーションと3Dオブジェクト検出の両方において、最大10% mIoUで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:18:29 GMT)
Differential Privacy Personalized Federated Learning Based on Dynamically Sparsified Client Updates [12.4] 本稿では,動的に分散化されたクライアント更新を利用する個人個人化学習手法を提案する。
EMNIST, CIFAR-10, CIFAR-100の実験結果から, 提案手法が優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:34:05 GMT)
How Feasible is Augmenting Fake Nodes with Learnable Features as a Counter-strategy against Link Stealing Attacks? [12.4] グラフニューラルネットワーク(GNN)は、グラフベースの予測タスクに広く使われ、デプロイされている。
攻撃は、潜在的に機密性の高い情報を漏洩することでユーザーのプライバシーを危うくする可能性がある。
我々は「$(N)$ode $(A)$ugmentation for $(R)$estricting $(G)$raphs from $(I)$nsinuating their $(S)$tructure」というアプローチを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:16:37 GMT)
FEDS: Feature and Entropy-Based Distillation Strategy for Efficient Learned Image Compression [12.3] 学習画像圧縮(lic)法は、最近、速度歪み性能においてVVCなどの従来のコーデックよりも優れている。
本稿では,まず,Swin-Transformer V2ベースのアテンションモジュールを統合することで,高容量教師モデルを構築する。
次に、教師から軽量の学生モデルに重要な知識を伝達するアンダーラインFeatureとアンダーラインEntropyベースのアンダーラインDistillation underlineStrategy(textbfFEDS)を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:13:20 GMT)
Cumulative Reasoning with Large Language Models [12.3] 累積推論(英: Cumulative Reasoning, CR)は、大規模言語モデルを累積的かつ反復的に利用する手法である。
いくつかの複雑な推論タスクを通じてCRの利点を実証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:55:36 GMT)
FedMSGL: A Self-Expressive Hypergraph Based Federated Multi-View Learning [12.2] 自己表現型ハイパーグラフに基づくフェデレーション・マルチビュー学習法(FedMSGL)を提案する。
提案手法は,局所学習における自己表現的特徴を利用して,潜在サンプル関係を持つ一様次元部分空間を学習する。
特徴次元の異なる多視点データセットによる実験により,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:13:45 GMT)
PRISM: Efficient Long-Range Reasoning With Short-Context LLMs [12.1] PRISMは、型付き階層スキーマで指定された構造化されたインコンテキストメモリを維持しながら、情報をチャンクのストリームとして処理する。
PRISMは、長いコンテキストモデルよりも少なくとも4倍短いコンテキストを使用しながら、様々なタスクのベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:59:18 GMT)
FaVChat: Unlocking Fine-Grained Facail Video Understanding with Multimodal Large Language Models [12.0] FaVChatは、顔のきめ細かいビデオ理解のために特別に設計された最初のVMLLMである。
我々は60k以上の動画からなる大規模な顔画像データセットを構築し,大半が83の微粒な顔属性で注釈付けされている。
我々は,映像要約から高品質な映像QAサブセットへ移行し,タスクの複雑さを徐々に増大させ,モデルのきめ細かい視覚知覚を高める,プログレッシブトレーニングパラダイムを採用する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:33:46 GMT)
A Real-time Multimodal Transformer Neural Network-powered Wildfire Forecasting System [12.0] 極度の山火事は人類文明にとって最も危険な自然災害の1つとなっている。
森林火災の発生を正確に予測することは、世界規模で最も緊急かつ厄介な環境課題の1つとなっている。
本研究では,リアルタイムのマルチモーダルトランスフォーマーニューラルネットワーク機械学習モデルを構築し,正確な位置での山火事発生をリアルタイムに予測する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:22:04 GMT)
Safer or Luckier? LLMs as Safety Evaluators Are Not Robust to Artifacts [11.8] 大規模言語モデル(LLM)は、生成されるコンテンツの安全性を評価するための自動評価器として、ますます採用されている。
本研究は、臨界安全領域にまたがる11のLCM判定モデルの多種多様なセットを評価する。
以上の結果から,LLM審査員のバイアスは,どのコンテンツソースがより安全かという最終判断を著しく歪めることができることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:49:02 GMT)
Mixture of Experts based Multi-task Supervise Learning from Crowds [11.8] 本稿では,群衆からのマルチタスク指導型学習の新たなパラダイムを提案する。
このパラダイム内では,Mixture of Experts をベースとしたマルチタスク監視学習(Multi-task Supervised Learning from Crowds)と呼ばれる,アイテム機能レベルでの作業行動モデルを提案する。
MMLCには2つの真理推論戦略が提案されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:25:11 GMT)
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System [11.8] 本稿では,境界明瞭度とチャンクスティックネスを組み合わせた2次元評価手法を提案する。
我々は、複雑なコンテキストニュアンスを扱う際に、伝統的および意味的なチャンキングの固有の制限を強調します。
3段階の処理機構からなるMixture-Aware Mixture-of-Chunkers (MoC) フレームワークを考案した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:59:42 GMT)
Audio-Visual Deepfake Detection With Local Temporal Inconsistencies [11.7] 本稿では,音声と視覚の微妙な時間的不整合を捉えることを目的とした,音声-視覚的ディープフェイク検出手法を提案する。
アーキテクチャの観点からは、時間距離マップと注意機構が組み合わさって、これらの矛盾を捉えるように設計されている。
本手法はDFDCおよびFakeAVCelebデータセットを用いた最先端手法に対して評価を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:22:54 GMT)
Variational Quantum Metrology with Loschmidt Echo [11.6] 我々は、ロシミトエコーと同様に前方と後方の進化からなる対称変動量子回路を用いたスケーラブルなスキームを提案する。
このスキームでは、精度限界を定量化する量子フィッシャー情報は、ロシミットエコーの測定信号から効率的に得られることを示す。
我々は10スピン量子プロセッサのアンサンブルにこのスキームを実験的に実装し、標準量子限界を12.4dBで上回る理論限界付近の精度を実現した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:46:20 GMT)
Self-Consistent Equation-guided Neural Networks for Censored Time-to-Event Data [11.6] 本稿では,自己整合方程式を利用した生成逆数ネットワークを用いた条件付き生存関数の非パラメトリック推定手法を提案する。
提案手法はモデルフリーであり,条件付き生存関数の構造に関するパラメトリックな仮定は不要である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:24:35 GMT)
Proceedings of the ISCA/ITG Workshop on Diversity in Large Speech and Language Models [11.5] 現代の技術は1つまたは複数の言語の一般的な知識を表現するために大きなモデルに依存している。
人間がそのような技術と対話するとき、その相互作用の有効性は、人間が同じタイプの言語をどこまで使うかによって影響される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:57 GMT)
Large Language Model as Meta-Surrogate for Data-Driven Many-Task Optimization: A Proof-of-Principle Study [11.5] 本研究では,マルチタスク最適化を支援するメタサロゲートフレームワークを提案する。
問題群に適合するメタデータを持つ普遍モデルを定義することにより、多タスクフィットネス予測のための統一的なフレームワークを定式化する。
我々のフレームワークは、双対レベルの知識伝達 -- 代理レベルと個別レベルの両方 -- をサポートし、最適化の効率性と堅牢性を高めます。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:00:27 GMT)
CM-Diff: A Single Generative Network for Bidirectional Cross-Modality Translation Diffusion Model Between Infrared and Visible Images [11.4] 近赤外モードと可視モードの両方でデータ分布を同時にモデル化するための相互モダリティ変換拡散モデル(CM-Diff)。
本稿では,生成した画像が目標モダリティのデータ分布に密着することを保証するため,統計的制約推論(SCI)戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:25:18 GMT)
RelationMatch: Matching In-batch Relationships for Semi-supervised Learning [11.4] 半教師付き学習は、少ないラベル付きデータと豊富なラベル付きデータを活用するための重要なアプローチとして登場した。
本稿では, 行列クロスエントロピー(MCE)損失関数を用いて, バッチ内でのリレーショナル一貫性を明示的に強化する新しいSSLフレームワークであるRelationMatchを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:45:16 GMT)
Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models [11.3] ロングチェーン・オブ・ソート(Long CoT)特性は推論能力を高め、複雑な問題の解決を可能にする。
まず、Long CoTとShort CoTを区別し、現在の推論パラダイムを分類する新しい分類法を導入する。
次に,Long CoTの出現やオーバー思考,テストタイムスケーリングなど,これらの特徴について考察する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:35:03 GMT)
A Geometric Framework for Understanding Memorization in Generative Models [11.3] 近年の研究では、深層生成モデルにより、デプロイ時にトレーニングデータポイントを記憶・再生することが可能であることが示されている。
これらの知見は、特に暗記によって引き起こされる法的およびプライバシー上のリスクを考慮して、生成モデルのユーザビリティを疑問視する。
本稿では, 多様体の暗記仮説(MMH)を, 暗記を推論する明快な言語として活用する幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:00 GMT)
EVA-Gaussian: 3D Gaussian-based Real-time Human Novel View Synthesis under Diverse Multi-view Camera Settings [11.2] 3次元ガウス散乱法は、人間のモデルに対するリアルタイムな新しいビュー合成において、例外的な能力を示した。
本研究では,多様なマルチビューカメラ設定にまたがる3次元新規ビュー合成のためのEVA-Gaussianという新しいパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:14:39 GMT)
CoRe^2: Collect, Reflect and Refine to Generate Better and Faster [11.2] 本稿では,3つのサブプロセス(コレクタ,リフレクション,リファイン)からなる新しいプラグアンドプレイ推論パラダイムであるCoRe2を紹介する。
CoRe2は、条件付き出力を洗練させるために弱いガイダンスを使用し、それによってモデルの能力を改善し、高周波でリアルなコンテンツを生成する。
HPD v2、Pick-of-Pic、Drawbench、GenEval、T2I-Compbenchで大幅に性能が向上した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:15:25 GMT)
Precoder Learning by Leveraging Unitary Equivariance Property [11.2] プリコーダ学習のための置換同値、すなわちユニタリ同値よりも強い特性について検討する。
我々は、ユニタリ同値を満たす新しい非線形重み付けプロセスを開発し、その後、連立ユニタリおよび置換同変DNNを構築する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:48:34 GMT)
Endo-FASt3r: Endoscopic Foundation model Adaptation for Structure from motion [11.1] Endo-FASt3rは、両方のタスクに基礎モデルを使用する最初の単眼SSL深度とポーズ推定フレームワークである。
また、高階更新と高速収束を実現する新しい適応手法であるDoMoRAを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:43:19 GMT)
Hybrid Mask Generation for Infrared Small Target Detection with Single-Point Supervision [11.1] SIRST(Single-frame infrared small target)検出は、複雑な赤外背景乱れの中で微小な目標を識別する必要があるため、大きな課題となる。
本稿では,ポイントレベルのアノテーションから高品質な擬似マスクを得るための,弱教師付きパラダイムに焦点を当てる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:13:29 GMT)
Learning-Augmented Competitive Algorithms for Spatiotemporal Online Allocation with Deadline Constraints [11.0] 我々は,サステナビリティとエネルギの新たな課題によって動機付けられた,新たなオンライン問題を紹介し,研究する。
オンラインプレーヤーは$mathsfSOADで、ポイント当たりのメートル法空間$(, d) にアロケートしてスケジューリングすることで、ワークロードを完了します。
各時点において、各時点における作業負荷のコストを表すサービスコスト関数が明らかにされ、プレーヤは、現在の作業のポイントへの割り当てを不当に決定しなければならない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:56:43 GMT)
Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model [11.0] AVVAは、オーディオ用Whisperとビデオ用DINOv2を使って、デュアルエンコーダコントラスト学習フレームワーク内で高品質なトレーニングクリップをスコアし、選択する。
データ品質のトレーディングデータ量により、AudioCaps、VALOR、VGGSoundの各トップ3の精度は47.8、48.4、58.0ポイント向上する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:48:38 GMT)
CALLM: Context-Aware Emotion Analysis in Cancer Survivors Using LLMs and Retrieval-Augmented Mobile Diaries [11.0] CALLMは文脈対応の感情分析フレームワークで、がんの生き残りからモバイル日記のエントリを分析し、感情状態を予測する。
がん生存者の移動的時間的評価(EMA)の大規模データセットを収集した。
結果はCALLMの強いパフォーマンスを示し、バランスの取れたアキュラシーは72.96%、ネガティブな影響は73.29%、個人の感情を規制したいという欲求は73.72%に達した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:36:41 GMT)
How Well Does Your Tabular Generator Learn the Structure of Tabular Data? [11.0] 本稿では,構造忠実度をコア評価次元として位置づける新しい評価ベンチマークであるTabStructを紹介する。
構造的忠実度はタスクに依存しないドメインに依存しない評価次元を提供することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:54:58 GMT)
Astrea: A MOE-based Visual Understanding Model with Progressive Alignment [10.9] マルチモーダル理解において,Mixture-of-Experts (MoE)アーキテクチャに基づく視覚言語モデル (VLM) が重要なパラダイムとして登場した。
本稿では,プログレッシブ事前アライメントに基づく新しいマルチエキスパート協調型VLMアーキテクチャであるAstreaを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:44:52 GMT)
FDCT: Frequency-Aware Decomposition and Cross-Modal Token-Alignment for Multi-Sensor Target Classification [10.9] 我々は、ターゲット分類のための複数の画像センサデータを分解、整列、融合する。
本稿では,センサ間の共有離散トークン(UDT)空間を提案する。
単一モダリティ分類器よりも優れた分類性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:12:35 GMT)
Feasibility-aware Imitation Learning from Observations through a Hand-mounted Demonstration Interface [10.8] FABCO(Fasibility-Aware Behavior Cloning from Observation)を提案する。
FABCOフレームワークでは、ロボットの事前訓練された前方および逆ダイナミクスモデルを用いて、各デモンストレーションの実現可能性を評価する。
我々はFABCOの有効性を,パイプとバイエルを含むピペット挿入作業に適用して実験的に検証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:14:04 GMT)
Deep Learning for Climate Action: Computer Vision Analysis of Visual Narratives on X [10.7] 我々は、2019年に共有されたX(元Twitter)の気候変動に関連するツイートのデータセットを分析し、共有された画像とともに730万のツイートを含む。
本手法は, 統計的分析, 画像分類, 物体検出, 感情分析を統合し, 気候談話における視覚的物語を探索する。
筆者らは, 気候コミュニケーションにおける重要なテーマを明らかにするとともに, 画像とテキストの感情の相違を強調し, ソーシャルメディア画像解析における基礎モデルの強みと限界を明らかにする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:03:49 GMT)
SLayR: Scene Layout Generation with Rectified Flow [10.4] 本稿では,テキスト・ツー・イメージ生成のための新しいトランスフォーマーモデルであるSLayRを紹介する。
提案手法は, パラメータの3倍以上小さく, 両手法を同時に実現するための新しい手法であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:40:48 GMT)
U-Motion: Learned Point Cloud Video Compression with U-Structured Motion Estimation [10.4] ポイントクラウドビデオ(PCV)は、動的シーンと新興アプリケーションを組み合わせた汎用的な3D表現である。
本稿では,PCV形状と属性の両方を学習ベースで圧縮するU-Motionを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:12:57 GMT)
GASPACHO: Gaussian Splatting for Controllable Humans and Objects [10.3] 本稿では,人間と物体の相互作用の制御可能なレンダリングを生成する手法を提案する。
ヒトと物体の相互作用の多視点RGB画像が与えられた場合、本手法は人間と物体のアニマタブルテンプレートをガウスの別集合として再構成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:38:48 GMT)
AI Rivalry as a Craft: How Resisting and Embracing Generative AI Reshape Writing Professions [10.2] ジェネレーティブAI(GAI)技術は、プロフェッショナルな書き込みを妨害し、従来のプラクティスに挑戦しています。
最近の研究では、創造的実践者のGAI導入経験を探求しているが、これらの経験が確立された実践へとどのように進化するかはほとんど分かっていない。
我々は,GAIを採用・抵抗する書記専門家を対象に,25件の半構造化インタビューを行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:43:57 GMT)
Towards Quantifying Long-Range Interactions in Graph Machine Learning: a Large Graph Dataset and a Measurement [10.1] グラフ表現学習には長距離依存が不可欠である。
既存のデータセットのほとんどは、帰納的タスクに適した小さなグラフに焦点を当てており、長距離インタラクションに関する限られた洞察を提供する。
都市ネットワークワークス(City-Networks)は、現実世界の都市道路から派生した、新しい大規模トランスダクティブ学習データセットである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:51:17 GMT)
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution [10.1] Inlicit Neural Representation (INR) は、任意スケール超解法 (ASR) に成功している
ASRのためのGSを一般化する2つの新しい手法を開発した。
高速な2次元GPU/CUDAベースのスケールアウェアライズを実装し,スーパーアウェアイメージのレンダリングを行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:03:16 GMT)
3DArticCyclists: Generating Synthetic Articulated 8D Pose-Controllable Cyclist Data for Computer Vision Applications [10.0] 本稿では,異なるタスクのトレーニングデータを生成するために使用できる,合成動的3Dサイクリストデータアセットを生成するフレームワークを提案する。
我々は、選択可能な合成3D人物を再配置することにより、完全な合成3Dサイクリスト(自転車をペダリングするライダー)を構築する。
近年の拡散法と比べ,定性的かつ定量的な結果が得られた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:15:52 GMT)
Trustworthy AIGC Copyright Management with Full Lifecycle Recording and Multi-party Supervision in Blockchain [10.0] 現在の著作権の法体系は、人間のクリエーターを中心に構築されているが、AIGCの領域では、コンテンツ制作における人間の役割は減少している。
著作権の公平な分配を達成するためには、AIGCの発生に関わるすべてのエンティティの貢献を慎重に記録する必要がある。
この研究はAIGCの全ライフサイクルを通じて生成された中間データを徹底的に記録し、それらを分散化されたブロックチェーンシステムに堆積して、セキュアなマルチパーティ監視を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:33:02 GMT)
DRESS: Disentangled Representation-based Self-Supervised Meta-Learning for Diverse Tasks [9.8] DRESS はタスク非依存の Disentangled Representation-based Self-Supervised meta-learning approach である。
変動要因と複雑さの異なるデータセットを用いた実験により,DRESSの有効性を検証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:00 GMT)
The Value of Goal Commitment in Planning [9.7] 達成した特定の目標の永続化を強制するコミットアクションにより、当初の計画タスクを拡張するコンパイルを提案する。
このアプローチは、検索ツリーの一部、潜在的にデッドエンド状態を導入する際に、特定の目標達成順序を課す。
実験結果は、改革されたタスクが最先端のアジャイルプランナーに適していることを示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:00:37 GMT)
Towards Robust Model Evolution with Algorithmic Recourse [9.6] Algorithmic Recourseは、ユーザーが属性を変更してモデルの期待に合わせる方法である。
現実のシナリオでは、ユーザーは限られたリソースと競合するために、属性を戦略的に調整する必要があることが多い。
これらのシフトは、ユーザの競争、リソースの制約、適応的なユーザ応答から生じます。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:17:34 GMT)
Medical Large Language Model Benchmarks Should Prioritize Construct Validity [9.5] 医学大言語モデル(LLMs)の研究は、臨床知識の符号化から医師のような推論に至るまで、大胆な主張をすることが多い。
しかし、どうやって真の進歩をリーダーボードのフレックスから切り離すのか?
医療用LLMベンチマークは、その構成妥当性を実証的に評価すべきである(そして実際に可能である)。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:08:02 GMT)
Teaching LLMs How to Learn with Contextual Fine-Tuning [9.3] 我々は、文脈微調整(contextual fine-tuning)と呼ばれる命令チューニングの新しい一般化について研究する。
我々は、このシンプルで効果的な修正によって、新しいデータセット上で高速に微調整できるLLMの能力が向上することが実証的に実証された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:45:53 GMT)
Diff-CL: A Novel Cross Pseudo-Supervision Method for Semi-supervised Medical Image Segmentation [9.3] 本研究は、分布から見た半教師付き医用画像分割フレームワーク(Diff-CL)を紹介する。
本稿では,拡散と畳み込みのセグメンテーションネットワーク間のクロス擬似超越学習機構を提案する。
本手法は,左房,脳腫瘍,NIH膵臓の3つのデータセットにまたがって,最先端のSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:59:09 GMT)
Federated Smoothing ADMM for Localization [9.3] フェデレートされたシステムは、分散データ、非滑らか性、非滑らか性によって特徴づけられる。
このような環境に固有のスケーラビリティと外乱問題に対処する頑健なアルゴリズムを提案する。
提案アルゴリズムの信頼性を検証するため,定常点に収束することを示す。
数値シミュレーションは、既存の最先端ローカライゼーション法と比較して収束レジリエンスの優れた性能を強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:01:34 GMT)
Improving the Reusability of Conversational Search Test Collections [9.2] 不完全関連判断は、テストコレクションの再利用性を制限する。
これは、新しいシステムが返すテストコレクションの未判断のドキュメント(穴と呼ばれる)のポケットが原因である。
既存の判断を活かして穴を埋めるために,Large Language Models (LLMs) を用いる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:36:40 GMT)
NVP-HRI: Zero Shot Natural Voice and Posture-based Human-Robot Interaction via Large Language Model [9.2] 本稿では音声コマンドと視覚姿勢を組み合わせた直感的マルチモーダルHRIパラダイムであるNVP-HRIを紹介する。
NVP-HRIは、事前の知識がなくてもゼロショット予測による新しいオブジェクトとの対話を可能にする。
ユニバーサルロボットを用いた多様な実世界のタスクの評価では、従来のジェスチャー制御よりも59.2%の効率向上が見られた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:30:18 GMT)
Two-party entanglement distribution in XXZ spin chains with the exponential and power-law long-range interactions [9.2] XXZスピン鎖におけるTPE(long-range two-party entanglement)について,指数的およびパワーローな長距離相互作用を用いて検討した。
ELRIを用いた熱力学的極限の場合、TPEは2ビットのコンカレンスで指数関数的に2サイト距離で崩壊する。
より一般的なPLRIを持つ有限XXZ鎖では、TPEは2スピン距離とともに代数的に崩壊する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:57:41 GMT)
ByteCheckpoint: A Unified Checkpointing System for Large Foundation Model Development [9.1] ByteCheckpoint は大規模 LFM トレーニングのための産業レベルのチェックポイントシステムである。
ByteCheckpoint はチェックポイントストールを著しく減少させ、平均54.20倍の減少を達成する。
ByteCheckpointは、保存時間とロード時間を最大9.96倍と8.80倍に改善した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:10:33 GMT)
Rule-Guided Reinforcement Learning Policy Evaluation and Improvement [9.1] LEGIBLEは、深層強化学習ポリシーを改善するための新しいアプローチである。
それは、部分的に象徴的な表現を構成する深いRLポリシーからルールをマイニングすることから始まる。
第2のステップでは、メタモルフィック関係として表現されたドメイン知識を用いて、マイニングされたルールを一般化する。
第3のステップは、一般化されたルールを評価し、実行時にどの一般化がパフォーマンスを改善するかを決定することである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:13:08 GMT)
MarineGym: A High-Performance Reinforcement Learning Platform for Underwater Robotics [9.0] MarineGymは、水中ロボット工学に特化した高性能強化学習(RL)プラットフォームである。
MarineGymはIsaac SimをベースとしたGPUアクセラレーション型動的プラグインを統合している。
また、無人水中車両(UUV)の5つのモデル、複数の推進システム、事前定義された一連のタスクも提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:47:58 GMT)
Unveiling Hidden Pivotal Players with GoalNet: A GNN-Based Soccer Player Evaluation System [9.0] サッカー分析ツールは、期待目標などの指標を強調し、プレイヤーの貢献を過度に表現する。
我々は、予測脅威(xT)の変化に対する個人クレジットを割り当てるGNNベースのフレームワークを導入する。
我々のパイプラインは、イベント中心グラフにおける空間的特徴と時間的特徴の両方を符号化し、非装飾行動の公平な帰属を可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:36:55 GMT)
Conversational Gold: Evaluating Personalized Conversational Search System using Gold Nuggets [8.7] 本稿では,RAGシステムによって生成された応答の検索効率と関連性を評価するための新しいリソースを提案する。
我々のデータセットは、TREC iKAT 2024コレクションに拡張され、17の会話と20,575の関連パスアセスメントを含む。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:44:10 GMT)
C^2 ATTACK: Towards Representation Backdoor on CLIP via Concept Confusion [8.7] 我々は、新しいバックドア攻撃フレームワーク、コンセプト・コンフュージョン・アタック(C2 ATTACK)を開発した。
実際のトリガーの使用を回避し、潜伏空間における特定の概念を直接活性化または非活性化させることにより、我々のアプローチはステルスを高め、既存の防御による検出を著しく困難にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:17:12 GMT)
Locally Differentially Private Online Federated Learning With Correlated Noise [8.6] 本稿では,時間的相関雑音を用いたオンライン学習のための局所微分プライベート(LDP)アルゴリズムを導入し,プライバシーを保ちながら実用性を向上させる。
数値実験により提案アルゴリズムの有効性が確認された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:46:46 GMT)
Context-aware Constrained Reinforcement Learning Based Energy-Efficient Power Scheduling for Non-stationary XR Data Traffic [8.5] ダウンリンク伝送では、データパケットをハードレイテンシ内で供給しながら電力資源を保存するために、効率的な電力スケジューリング(EEPS)が不可欠である。
従来のアルゴリズムではEEPSではpromiseを示すが、コンテキスト非定常データ制約と競合する。
これらの課題を克服するために,提案した文脈対応制約付き強化学習アルゴリズムを用いて,これらの課題を克服する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:37:19 GMT)
SeqSAM: Autoregressive Multiple Hypothesis Prediction for Medical Image Segmentation using SAM [8.5] 複数のマスクを生成するためのシーケンシャルでRNNにインスパイアされたアプローチであるSeqSAMを紹介する。
2つの公開データセットで生成された各マスクの品質が顕著に向上したことを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:01:52 GMT)
ProtTeX: Structure-In-Context Reasoning and Editing of Proteins with Large Language Models [8.5] 大規模言語モデルは分子科学の分野で顕著な進歩を遂げた。
タンパク質科学において、アミノ酸配列はLDMの唯一のトークン化剤として機能する。
本稿では,タンパク質配列,構造,テキスト情報を統一された離散空間にトークン化する新しいフレームワークであるProtを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:46:33 GMT)
Minimax Optimality of the Probability Flow ODE for Diffusion Models [8.2] この研究は、決定論的ODEベースのサンプリングのための最初のエンドツーエンド理論フレームワークを開発する。
L2$のスコア誤差と関連する平均ジャコビアン誤差の両方を同時に制御するスムーズな正規化スコア推定器を提案する。
得られたサンプルは全変動距離, 変調対数係数において最小値が得られることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:51:29 GMT)
CIPHERMATCH: Accelerating Homomorphic Encryption-Based String Matching via Memory-Efficient Data Packing and In-Flash Processing [8.1] ホモモルフィック暗号化(HE)は、元のデータを公開せずに暗号化されたデータのセキュアな計算を可能にする。
多くのクラウドコンピューティングアプリケーション(例えば、DNA読み取りマッピング、バイオメトリックマッチング、Web検索)は、正確な文字列マッチングをキー操作として使っている。
ホモモルフィック暗号を用いた従来の文字列マッチングアルゴリズムは、高い計算遅延によって制限される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:25:58 GMT)
Zero-Shot Subject-Centric Generation for Creative Application Using Entropy Fusion [8.1] 本稿では,事前訓練されたテキスト・画像・モデルFLUXの各サンプリングステップから得られた情報的横断的特徴をマージするエントロピーに基づく特徴強調融合法を提案する。
また,Large Language Models (LLMs) に基づくエージェントフレームワークを開発し,ユーザのカジュアルな入力をより記述的なプロンプトに変換することにより,高精細な画像生成を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:27:30 GMT)
VaxGuard: A Multi-Generator, Multi-Type, and Multi-Role Dataset for Detecting LLM-Generated Vaccine Misinformation [8.1] 既存のベンチマークでは、ワクチン関連の誤報や誤報拡散の多様な役割を見落としていることが多い。
本稿では,これらの課題に対処するために設計された新しいデータセットであるVaxGuardを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:43:25 GMT)
MotionScript: Natural Language Descriptions for Expressive 3D Human Motions [8.1] 人間の3次元動作の詳細な自然言語記述を生成するための新しいフレームワークであるMotionScriptを紹介した。
MotionScriptは、人間の動きの完全な複雑さを捉える、きめ細かい構造化された記述を提供する。
MotionScriptは、テキスト・トゥ・モーションモデルのための記述ツールとトレーニングリソースの両方として機能する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:16:45 GMT)
How good are deep learning methods for automated road safety analysis using video data? An experimental study [8.0] 画像ベースマルチオブジェクト検出(MOD)とマルチオブジェクト追跡(MOT)は高速に進んでいる。
ステレオカメラをベースとした3つのMOT手法について, 注釈付きKITTIトラヒックビデオデータセットを用いて検討した。
実験の結果, 相互作用数に関していくつかの利点があるにもかかわらず, 全ての試験方法が系統的に相互作用数を過大評価し, TTCを過小評価していることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:17:50 GMT)
A practical guide to machine learning interatomic potentials -- Status and future [8.0] 本稿では機械学習の原子間ポテンシャル(MLIP)に関する幅広い話題について概説する。
これには、最新の進歩、機能、欠点、そしてこの初期段階のMLIPの潜在的な応用の概要が含まれている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:24:01 GMT)
Have LLMs Made Active Learning Obsolete? Surveying the NLP Community [8.0] 教師付き学習は注釈付きデータに頼っている。
大規模言語モデルは、アクティブラーニングの有効性を推し進めてきたが、ほとんどショットラーニングやゼロショットラーニングのような手法も改善した。
アクティブな学習は時代遅れになったのだろうか?
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:04 GMT)
Unveiling Concept Attribution in Diffusion Models [8.0] 拡散モデルは、テキストプロンプトから現実的で高品質な画像を生成する際、顕著な能力を示した。
近年の研究では、他のレイヤがターゲット概念にどのように貢献するかを示すことなく、知識保存層を生成モデルにローカライズするために因果トレースを採用している。
成分属性を用いた拡散モデルを分解し,概念生成における各成分の重要性を体系的に明らかにする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:02:44 GMT)
Membership Inference Attacks fueled by Few-Short Learning to detect privacy leakage tackling data integrity [7.9] ディープラーニングモデルは、トレーニングデータの一部を記憶し、プライバシリークを生成する。
本稿では、深層学習モデルのプライバシー侵害の評価を容易にするFeS-MIAモデルとして考案されたFew-Shot学習に基づくMIAを提案する。
また,Log-MIA尺度と呼ばれる,解釈可能な量的・質的なプライバシ尺度を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:09:43 GMT)
Time-EAPCR: A Deep Learning-Based Novel Approach for Anomaly Detection Applied to the Environmental Field [7.8] 従来の監視方法は遅延応答、不十分なデータ処理、弱い一般化に悩まされている。
ディープラーニングは、機能を自動的に学習する機能を備え、複雑な非線形関係をキャプチャし、検出性能を向上させる。
本稿では,新しいディープラーニング手法であるTime-EAPCR(Time-Embedding-Permutated CNN-Residual)を紹介し,環境科学に応用する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:44:15 GMT)
DistJoin: A Decoupled Join Cardinality Estimator based on Adaptive Neural Predicate Modulation [7.8] 多自己回帰モデルを用いた効率的な分布予測に基づく結合濃度推定器DistJoinを紹介する。
この問題を緩和するため、DistJoinは結合濃度を推測するカウントベースのアプローチではなく、選択性に基づくアプローチを採用している。
我々は、JOB-lightとJOB-light-rangeのDistJoinを評価し、その評価を非等価結合条件にまで拡張した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:07:08 GMT)
Search of High-Frequency Variations of Fundamental Constants Using Spin-based Quantum Sensors [7.8] 本研究では,スピン量子センサを用いて基本定数の時間変動を探索する手法を提案する。
周波数範囲を大きく拡大し、スカラーダークマターに制約を与える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:28:54 GMT)
ClaimTrust: Propagation Trust Scoring for RAG Systems [7.8] ClaimTrustは、RAGシステムにおける文書の信頼性を動的に評価する、伝搬ベースの信頼評価フレームワークである。
我々は、政治ニュース記事814件を前処理し分析し、2,173件のユニークなクレームを抽出し、965件の有意義な関係を分類する。
ClaimTrustは、信頼に値する記事と信頼できない記事とを効果的に区別し、コンバージェンスまで信頼スコアを反復的に更新する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:52:24 GMT)
Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition [7.7] 本研究は,13頭のブタの行動を含むデータセットを提案する。
ネットワークは、時間知覚ネットワークと時間特徴強調ネットワークとから構成される。
本論文で確立したデータセットにおいて,提案モデルではMAPスコアが75.92%に達し,従来モデルよりも8.17%向上した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:27:29 GMT)
All Your Knowledge Belongs to Us: Stealing Knowledge Graphs via Reasoning APIs [7.7] 我々は,限られたクエリ予算の下で,機密性の高いサブKGを高い忠実度で抽出する攻撃であるKGXを提案する。
実験および実世界のKGR APIに対するKGXの有効性を検証する。
以上の結果から,KGRシステムの開発・展開において,より原則的なアプローチの必要性が示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:18:44 GMT)
Real-Time Decision-Making for Digital Twin in Additive Manufacturing with Model Predictive Control using Time-Series Deep Neural Networks [7.7] Digital Twinは、リアルタイム監視、モデル更新、予測、意思決定を可能にする物理システムの仮想レプリカである。
本稿では,リアルタイム意思決定のためのマルチステップモデル予測制御フレームワークを提案する。
また,TiDEは溶融プール温度と深さを正確に予測できることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:56:35 GMT)
PCLA: A Framework for Testing Autonomous Agents in the CARLA Simulator [7.7] オープンソースのPythonテスティングフレームワークであるPCLA(Pretrained CARLA Leaderboard Agents)を紹介する。
PCLAは、任意のCARLA環境/シナリオで様々な自律エージェントをテストするために特別に設計された最初のインフラである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:29:35 GMT)
Large-Scale FPGA-Based Privacy Amplification Exceeding $10^8$ Bits for Quantum Key Distribution [7.5] プライバシ増幅(PA)は、量子鍵分配(QKD)後処理において必須である。
リソースが限られているため、FPGAベースのPA方式では、入力と出力のサイズが主要なボトルネックとなっている。
本稿では,入力ブロックサイズと出力キーサイズが108ドルを超える大規模FPGAベースのPA方式を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:25:13 GMT)
Broad Spectrum Coherent Frequency Conversion with Kinetic Inductance Superconducting Metastructures [7.5] パラメトリック周波数変換器(PFC)は、量子情報キャリア間の周波数ギャップをブリッジする上で重要な役割を果たす。
本稿では、広帯域周波数モード間のパラメトリック周波数変換のためのマルチモード運動的メタ構造について述べる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:42:38 GMT)
Efficient Multi-Task Inferencing: Model Merging with Gromov-Wasserstein Feature Alignment [7.4] 本稿では,Gromov-Wasserstein Scoring Model Merging (GW-SMM)法を提案する。
グロモフ=ワッサーシュタイン距離で測定された特徴分布の類似性に基づいてモデルをマージする。
我々は,人間の知識に対するアプローチとGPT-o1をベースとしたマージ手法の検証を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:20:33 GMT)
Interactive-KBQA: Multi-Turn Interactions for Knowledge Base Question Answering with Large Language Models [7.4] Interactive-KBQAは知識ベース(KB)との直接インタラクションを通じて論理形式を生成するように設計されたフレームワークである
提案手法は,WebQuestionsSP, ComplexWebQuestions, KQA Pro, MetaQAデータセット上での競合結果を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:15:34 GMT)
CULEMO: Cultural Lenses on Emotion -- Benchmarking LLMs for Cross-Cultural Emotion Understanding [7.3] カルチャー・レンズ・オン・エモーション (CuLEmo) は、6つの言語にまたがるカルチャー・アウェア・感情予測を評価するための最初のベンチマークである。
キュレモ語は言語ごとに400の工芸的な質問で構成されており、それぞれに微妙な文化的推論と理解が必要である。
その結果,(1) 感情の概念化は言語や文化によって大きく異なり,(2) LLMのパフォーマンスは言語や文化の文脈によって様々に異なり,(3) 明示的な国的文脈を持つ英語のプロンプトは,文化に意識された感情や感情理解のための英語のプロンプトよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:01:30 GMT)
RetSTA: An LLM-Based Approach for Standardizing Clinical Fundus Image Reports [7.3] フォーマット、用語、スタイルを含む統一された標準の欠如は、臨床基礎診断報告において大きな課題である。
基礎的臨床用語と臨床診断で一般的に用いられる記述を含むバイリンガル標準用語を構築した。
RetSTA-7Bは、RetSTA-7B-Zeroによって生成された大量の標準化されたデータと対応する英語データを統合する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:00:57 GMT)
Finding the Muses: Identifying Coresets through Loss Trajectories [7.3] Loss Trajectory correlation (LTC)は、コアセット選択のための新しいメトリクスであり、一般化を駆動する重要なトレーニングサンプルを特定する。
$LTC$は、最先端のコアセット選択メソッドに匹敵する精度を一貫して達成します。
また、一致した振る舞いや矛盾するサンプルの振る舞いを識別するなど、トレーニングダイナミクスに関する洞察も提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:11:16 GMT)
ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation [7.2] 変換器は大規模画像分類において最先端の性能を達成した。
それらはしばしば大量のデータを必要とし、その堅牢性と一般化性を制限するバイアスを示す。
本稿では、帰納バイアスを明示的に含む新しいデータ拡張方式であるForAugを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:49:45 GMT)
The R2D2 Deep Neural Network Series for Scalable Non-Cartesian Magnetic Resonance Imaging [7.2] R2D2 Deep Neural Network (DNN) シリーズのパラダイムを導入し,MRIにおける非モンテカルロk空間の取得から高速でスケーラブルな画像再構成を実現する。
少数のDNNを持つシリーズは、ロールされていないR2D2-Netよりも優れた再構築品質を実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:24:47 GMT)
Revisiting the Predictability of Performative, Social Events [7.2] 予測がデータに与える影響にかかわらず、常に社会的事象を正確に予測できることが示される。
達成可能ではあるが、これらの予測はしばしば望ましくないものであり、過去のデシダラタの限界を強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:19:33 GMT)
Multimodal Foundation Models for Material Property Prediction and Discovery [7.2] 材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。
複数の軸上のMaterial Projectデータベースからのデータを用いて,MultiMatの可能性を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:04:21 GMT)
CommonPower: A Framework for Safe Data-Driven Smart Grid Control [7.1] PythonツールのCommonPowerは、機械学習に適したパワーシステム管理のモデリングとシミュレーションのための最初のフレームワークである。
CommonPowerには、機械学習ベースの予測器のためのトレーニングパイプラインと、RLコントローラの学習アップデートにセーフガードのフィードバックを組み込む柔軟なメカニズムが含まれている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:23:13 GMT)
A Siamese Network to Detect If Two Iris Images Are Monozygotic [7.1] 我々は,一対の虹彩画像をモノジゴティックアイライズや非モノジゴティックアイライズに分類するために,シームズネットワークアーキテクチャとコントラスト学習を採用している。
本手法は, 単接合型虹彩対のヒト分類において, 従来報告されていたものを超える全虹彩画像を用いて精度を向上する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:48:38 GMT)
Coherence Properties of Rare-Earth Spins in Micrometer-Thin Films [7.0] イオン注入法によるバルク結晶から細径イットリウムアルミニウムガーネット(YAG)膜を作製した。
その結果, バルク状スピン特性と薄膜加工技術との相性を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:16:52 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9] 人間の動きの生成と編集はコンピュータグラフィックスと視覚の重要な要素である。
本稿では,多様なタスクの統一的な定式化を可能にする新しいパラダイムであるMotion-Condition-Motionを紹介する。
このパラダイムに基づいて、ソースモーションからターゲットモーションへのマッピングを学習するために、修正フローを組み込んだ統合フレームワーク、MotionLabを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:59:19 GMT)
Fundamental work costs of preparation and erasure in the presence of quantum side information [6.8] 本稿では,量子側情報の存在下での量子熱力学の資源理論的枠組みを紹介する。
我々は、デーモンの心と結合する熱力学系を二部分量子状態によって記述すると同時に、準備する1ショットの作業コストを導出する。
我々は、ヘルムホルツ自由エネルギーの条件付きバージョンの観点から、量子側情報の存在下での熱力学のマクロ的な第二法則を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:02:03 GMT)
Puzzle Similarity: A Perceptually-guided Cross-Reference Metric for Artifact Detection in 3D Scene Reconstructions [6.7] 我々は,新しい視点でアーティファクトをローカライズするために,新しいクロスリファレンス指標であるPuzzle similarityを提案する。
提案手法は,人的評価に関連し,新しい視点における工芸品の最先端のローカライゼーションを実現する。
我々は新しいメトリクスを活用して、画像の自動復元、ガイド付き取得、スパース入力からの3D再構成などの応用を強化することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:04:43 GMT)
Exploring the best way for UAV visual localization under Low-altitude Multi-view Observation Condition: a Benchmark [6.7] 高度の低い多視点UAV AVLは、極端な視点の変化による大きな課題を提示する。
このベンチマークでは、低高度多視点UAV AVLの課題を明らかにし、将来の研究に貴重なガイダンスを提供した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:29:27 GMT)
On Generalization Across Environments In Multi-Objective Reinforcement Learning [6.7] 我々は,多目的強化学習(MORL)における一般化の概念を定式化し,その評価方法について述べる。
パラメータ化された環境構成を持つ多目的ドメインを特徴とする新しいベンチマークを提案。
このベンチマークにおける最先端のMORLアルゴリズムのベースライン評価は、限定的な一般化能力を示し、改善の余地があることを示唆している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:09:08 GMT)
Clustering by Nonparametric Smoothing [6.6] クラスタリング問題の新たな定式化は、タスクを推定問題として表現するものである。
提案手法は、任意の明示的なモデリング仮定を回避し、非パラメトリックな平滑化の柔軟な推定ポテンシャルを利用する。
提案手法の強い性能を示すために,公開データセットの大規模なコレクションに関する実験が用いられている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:44:11 GMT)
Bags of Projected Nearest Neighbours: Competitors to Random Forests? [6.6] 単純で直感的に適応的な k 近傍分類器を導入し、ブートストラップ集約の文脈でその有用性を探る。
このアプローチは、計算効率が良く、最も近い近傍分類器によるクラス識別を強化することによって動機付けられる判別部分空間を見つけることに基づいている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:44:12 GMT)
Near-Polynomially Competitive Active Logistic Regression [6.6] 能動的学習は受動的学習と比較して指数関数的に少ないラベルクエリを必要とすることはよく知られている。
入力毎に最適なアルゴリズムと競合する最初のアルゴリズムを示す。
我々のアルゴリズムは効率的なサンプリングに基づいており、より一般的な関数のクラスを学習できるように拡張することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:09:09 GMT)
2HandedAfforder: Learning Precise Actionable Bimanual Affordances from Human Videos [6.6] 本研究では,人間の活動ビデオデータセットから手頃なデータを抽出するフレームワークを提案する。
本稿では,VLMに基づく価格予測モデルである2HandedAfforderを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:12:07 GMT)
Neural embedding of beliefs reveals the role of relative dissonance in human decision-making [6.6] 我々は,オンラインユーザの議論データと信念を微調整された大言語モデル(LLM)にマッピングすることで,信念の相互作用を研究する。
本研究は,既存の信念と新しい信念との距離に基づいて,個人が認知不協和を推定する方法の新たな信念を予測できることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:50:34 GMT)
Automatic Operator-level Parallelism Planning for Distributed Deep Learning -- A Mixed-Integer Programming Approach [6.4] 本稿では,最適性と計算効率のバランスをとる二段階のソリューションフレームワークを提案する。
我々のフレームワークは、同等または優れた性能を実現し、同じメモリ制約下で計算バブルを半分に減らします。
このような能力は、最適な並列化戦略を探求するための貴重な研究ツールであり、大規模なAIデプロイメントのための実践的な産業ソリューションである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:00:29 GMT)
An Evaluation of LLMs for Detecting Harmful Computing Terms [6.4] 本研究では, モデルアーキテクチャが有害な言語検出に与える影響を, 専門用語のキュレートされたデータベースの評価により検討する。
我々は、BERT-base-uncased、RoBERTa large-mnli、Gemini Flash 1.5および2.0、GPT-4、Claude AI Sonnet 3.5、T5-large、BART-large-mnliを含む、エンコーダ、デコーダ、エンコーダ-デコーダ言語モデルをテストした。
その結果、デコーダモデル、特にGemini Flash 2.0とClaude AIは、微妙な文脈分析に優れており、BERTのようなエンコーダモデルは強力なパターン認識を示すが、分類の確実性に苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:36:45 GMT)
Representation Retrieval Learning for Heterogeneous Data Integration [6.3] Representation Retrieval(R2$)フレームワークを提案する。このフレームワークは表現学習モジュール(表現器)と疎性誘導機械学習モデル(学習器)を統合している。
我々は,マルチタスク学習における従来の完全共有仮定を緩和し,部分的共有構造を実現し,SIPが過剰リスク境界の収束率を向上させることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:54:37 GMT)
Better Together: Unified Motion Capture and 3D Avatar Reconstruction [6.3] マルチビュービデオから3次元アバターを再構成しながら,人間のポーズ推定問題を同時に解決する手法を提案する。
パーソナライズされたメッシュ上に3Dガウシアンを組み込んだアニマタブルアバターを新たに導入した。
我々はまず,高度に挑戦するヨガポーズについて評価し,多視点人間のポーズ推定における最先端の精度を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:39:43 GMT)
Terrier: A Deep Learning Repeat Classifier [6.3] Terrierは反復的なDNA配列を分類するために設計されたディープラーニングモデルである。
RepBaseシーケンスの97.1%をRepeatMaskerカテゴリにマッピングする。
より広い範囲のシーケンスを分類しながら、より優れた精度を実現した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:03:26 GMT)
Ordered Semantically Diverse Sampling for Textual Data [6.3] 順序付きサンプルリストの多様性を計測する新しい指標に基づいて、順序付き多様なサンプリング問題を導入する。
埋め込みベクトルの主成分を用いたテキストデータに対して順序付き多様なサンプルを生成する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:38:57 GMT)
Mixture of Experts for Node Classification [6.3] 本稿では,ノード分類のための専門家フレームワークであるMoE-NPを提案する。
特に、MoE-NPはノード予測器の混合と、ノードパターンに基づいて戦略的にモデルを選択する。
さまざまな実世界のデータセットによる実験結果からは、大幅なパフォーマンス向上が示されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:33:46 GMT)
Mitigating Membership Inference Vulnerability in Personalized Federated Learning [6.3] フェデレートラーニング(FL)は、クライアントの個人データを共有せずに、協調的なモデルトレーニングのための有望なパラダイムとして登場した。
クラスタリングプロセスにMIAリスクアセスメントを統合するIFCAの改良版であるIFCA-MIRを紹介する。
IFCA-MIRは従来のIFCAと同等のモデル精度と公平性を保ちながらMIAリスクを著しく低減することを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:10:35 GMT)
BBGKY hierarchy for quantum error mitigation [6.2] 量子エラーの軽減は、現在のNISQデバイスにとって重要である。
実機で発生する量子ノイズの緩和を支援するために,物理の知識を利用する。
エラー軽減のためのZNE法では,BBGKY階層のサブセットを制約として採用している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:25:57 GMT)
PromptMap: An Alternative Interaction Style for AI-Based Image Generation [6.2] PromptMapは、ユーザーが膨大な合成プロンプトを探索できるテキスト・ツー・イメージAIのための新しいインタラクションスタイルである。
PromptMapは、セマンティックな類似性によって視覚的にイメージをグループ化し、ユーザーは関連するサンプルを見つけることができる。
本研究は,ユーザに対して,良好な画像出力の実現を促すことによって,使い慣れないインタラクションスタイルを提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:31:50 GMT)
Holistic Reasoning with Long-Context LMs: A Benchmark for Database Operations on Massive Textual Data [6.2] HoloBenchは、テキストベースのコンテキストにデータベース推論操作をもたらすフレームワークです。
本研究では,文脈内の情報量が文脈長よりもLCLMの性能に大きく影響していることを示す。
複数の情報の集約を必要とするタスクは、コンテキスト長が増加するにつれて顕著な精度低下を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:21:04 GMT)
Electromyography-Informed Facial Expression Reconstruction for Physiological-Based Synthesis and Analysis [6.1] 筋活動と表情の関係は、心理学、医学、エンターテイメントなど様々な分野において重要である。
既存の顔分析法では、電極閉塞を処理できないため、効果がない。
本手法は,SEMG 閉塞下での顔の復元を敵対的に忠実に行う新しい手法である。
本手法の有効性を,同期SEMG記録と顔模倣のデータセットを用いた実験により検証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:21:10 GMT)
Bidirectional Learned Facial Animation Codec for Low Bitrate Talking Head Videos [6.1] ディープ・フェース・アニメーション技術は、ディープ・ジェネレーティブ・モデルを適用して音声ヘッドビデオを効率よく圧縮する。
本稿では,過去と未来のフレームを用いた自然な顔画像を生成する,新しい学習アニメーションを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:39:09 GMT)
SVGBuilder: Component-Based Colored SVG Generation with Text-Guided Autoregressive Transformers [5.9] 本稿では,テキスト入力から高品質な色付きSVGを生成するためのコンポーネントベース自動回帰モデルを提案する。
計算オーバーヘッドを大幅に削減し、従来の方法に比べて効率を向上する。
既存のSVGデータセットの限界に対処し、我々の研究を支援するために、カラーSVGの最初の大規模データセットであるColorSVG-100Kを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:34:11 GMT)
Adaptive political surveys and GPT-4: Tackling the cold start problem with simulated user interactions [5.9] 適応質問票は, アンケート参加者に対して, 前の回答に基づいて, 次の質問を動的に選択する。
デジタル化により、これらは政治科学などの応用分野における伝統的な調査の代替となる。
1つの制限は、質問の選択のためにモデルをトレーニングするデータへの依存である。
適応型政治調査の統計モデルを事前学習するために,合成データが利用できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:02:36 GMT)
Time-Efficient Logical Operations on Quantum Low-Density Parity Check Codes [5.9] 任意の可換論理パウリ作用素の集合を演算子数に依存しない時間で測定できるスキームを提案する。
唯一の条件は可換性であり、量子力学における同時測定の基本的な要件である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:51:06 GMT)
Minimal Time Series Transformer [5.8] Transformerは、多くの自然言語処理、コンピュータビジョン、音声分析問題に対する最先端のモデルである。
本研究は,連続値時系列データに適したトランスフォーマーアーキテクチャを実現するために,最小限の適応を導入する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:48:37 GMT)
$^R$FLAV: Rolling Flow matching for infinite Audio Video generation [5.8] 共同オーディオビデオ(AV)生成は、生成AIにおいて依然として重要な課題である。
AV生成における重要な課題に対処する新しいトランスフォーマーベースのアーキテクチャであるR$-FLAVを提示する。
実験の結果,$R$-FLAVはマルチモーダルAV生成タスクにおける既存の最先端モデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:48:33 GMT)
An Achievable Rate Region for $3-$User Classical-Quantum Broadcast Channels [5.6] 本稿では,3Mhyphen$user classical-quantumブロードキャストチャンネル上での通信のシナリオについて考察する。
我々は、代数的特性を持つ符号の集合である、新しい符号化スキームに基づくテキスト分割コセット符号を設計する。
我々は,3ドルの古典量子放送チャンネルの古典量子容量領域に新たな内部結合を特徴付ける。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:18:48 GMT)
RESTRAIN: Reinforcement Learning-Based Secure Framework for Trigger-Action IoT Environment [5.5] トリガーアクション機能を備えたIoT(Internet of Things)プラットフォームでは、イベント条件が自律的にアクションをトリガーすることができる。
敵は、この一連のインタラクションを利用して、偽のイベント条件をIoTハブに不正に注入する。
本稿では,プラットフォームに依存しないマルチエージェントオンライン防衛システムであるRESTRAINを提案し,実行時にリモートインジェクション攻撃に対処する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:23:14 GMT)
ProAPO: Progressively Automatic Prompt Optimization for Visual Classification [5.5] 視覚言語モデル(VLM)は、大規模なペア画像テキストデータを用いた訓練により、画像分類に大きな進歩をもたらした。
近年の手法では,大型言語モデル(LLM)が生成する視覚的記述がVLMの一般化を促進することが示されているが,クラス固有のプロンプトはLLMの幻覚によって不正確あるいは識別に欠ける可能性がある。
本稿では,最小限の監督を要さず,かつループを含まない細粒度カテゴリに対して,視覚的に識別可能なプロンプトを見つけることを目的とする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:56:58 GMT)
GIGP: A Global Information Interacting and Geometric Priors Focusing Framework for Semi-supervised Medical Image Segmentation [5.5] 本稿では,ラベル付きデータとラベルなしデータの分散差を低減するため,グローバルインフォメーション・インタラクション・マンバ・モジュールを提案する。
次に,よりリッチなグローバルな幾何学的特徴を抽出するための幾何学的モーメント注意機構を提案する。
NIH PancreasとLeft Atriumデータセットの優れた性能は、我々のアプローチの有効性を示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:59:38 GMT)
Edge AI for Real-time Fetal Assessment in Rural Guatemala [5.4] 周産期合併症は、世界中の母体と新生児の健康に重大な負担をもたらす。
我々は,介護現場での意思決定支援を目的とした,AI対応スマートフォンアプリケーションを開発した。
このツールは、機械学習(ML)技術を活用して妊娠中の健康モニタリングを強化することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:31:07 GMT)
ConjointNet: Enhancing Conjoint Analysis for Preference Prediction with Representation Learning [5.3] 本稿では,2つのニューラルアーキテクチャからなるConjointNetを提案する。
提案したコンジョイントネットモデルは、2つの選好データセット上で従来のコンジョイント推定手法を5%以上上回っていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:01:59 GMT)
Trotter error mitigation by error profiling with shallow quantum circuit [5.3] 比較的浅い回路深度でアルゴリズムトロッター誤差を低減するための資源効率の手法を提案する。
提案手法は、浅い回路を持つ短期量子プロセッサにおいて、量子シミュレーションの効率的な方法を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:02:44 GMT)
State-space systems as dynamic generative models [5.2] 本稿では、入力過程と出力過程の間の決定論的離散時間状態空間システムによって引き起こされる依存構造について検討する。
状態空間系は、これらの2つの空間の間に機能的関係が存在しない場合でも、入力列空間と出力列空間の間の純粋確率的依存構造を誘導できることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:00:23 GMT)
OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment [5.2] 視覚言語モデル(VLM)は、オープン語彙の視覚的関係の検出に役立つが、多くの場合、様々な視覚領域とそれらの関係との関係を見落としている。
本稿では,オープン語彙のVidVRDフレームワークであるOpenVidVRDを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:13:17 GMT)
Generative AI Policies under the Microscope: How CS Conferences Are Navigating the New Frontier in Scholarly Writing [5.2] コンピューティング分野において、明確なGen-AIポリシーを確立し、採用することが不可欠である。
本研究は,64大コンピュータサイエンス会議におけるGen-AI政策の展望について考察する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:10:33 GMT)
LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement [5.2] ファンデーションモデル(FM)は、タスク固有の微調整によって、多様なタスクにまたがる強力なパフォーマンスを実現する。
低ランク適応 (LoRA) のようなローランク適応 (LoRA) 手法は、少ないパラメータをチューニングするための低ランク行列を導入することで、このコストを削減する。
LoRA-FAIRは計算と通信の効率を維持し、最先端の手法よりも優れた性能が得られる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:43:25 GMT)
Exploring the boundary of quantum network states from inside out [5.1] バイパーティイトリソースと共有ランダム性を備えた量子ネットワークは、将来の量子インターネットを実装するための最も単純な基盤を提供する。
本研究では,このような量子ネットワークからどのような絡み合いが生じるのかを,異なるグラフ状態でその忠実さを調べることによって検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:33:50 GMT)
Large-scale Regional Traffic Signal Control Based on Single-Agent Reinforcement Learning [5.1] 本稿では,単一エージェント強化学習(RL)に基づく地域交通信号制御モデルを提案する。
このモデルは、広域交通渋滞を緩和し、総走行時間を最小化することを目的として、広範囲にわたる交通信号を調整することができる。
SUMO交通シミュレーションソフトウェアを用いて実験を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:51:29 GMT)
Introducing Verification Task of Set Consistency with Set-Consistency Energy Networks [5.1] 自然言語推論の拡張である集合整合性検証(NLI)の課題について紹介する。
提案するSC-Energy(Set-Consistency Energy Network)は,コントラスト・ロス・フレームワークを用いて文集合間の互換性を学習する新しいモデルである。
我々のアプローチは、矛盾を効率的に検証し、論理的矛盾の原因となる特定の言明をピンポイントするだけでなく、既存の手法を著しく上回る。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:11:11 GMT)
Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control [5.1] 本稿ではロバスト決定性ポリシー勾配(RDPG)と呼ばれる強化学習アルゴリズムを提案する。
RDPGは2プレイヤーゼロサムダイナミックゲームとして$H_infty$制御問題を定式化している。
次に、決定論的政策勾配(DPG)とその深い強化学習を用いて、効果的な外乱減衰を伴う堅牢な制御政策を訓練する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:39:47 GMT)
Fine-Tuning Large Language Models for Educational Support: Leveraging Gagne's Nine Events of Instruction for Lesson Planning [5.0] 本研究では,Gagne's Nine Events of Instructionに組み込むことで,大規模言語モデル(LLM)が教師の準備をいかに向上させるかを検討する。
この研究は、数学のカリキュラム標準とガグネの指導イベントに基づく包括的なデータセットの作成から始まる。
第2の方法は、特別なデータセットを使用してオープンソースモデルを微調整し、教育コンテンツ生成と分析能力を向上する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:22:13 GMT)
Large Language Models-Aided Program Debloating [5.0] LEADERはLarge Language Models (LLM)によって強化されたプログラムのデブロ化フレームワークである
重要な機能を保持し、セキュリティ問題を減らすことでセキュリティを強化することで、機能とセキュリティのバランスをとる。
結果は、LEADERが機能とセキュリティにおいて最先端のツールであるCovAを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:30:51 GMT)
Characterization and Greedy Learning of Gaussian Structural Causal Models under Unknown Interventions [5.0] 我々は、GnIESと呼ばれる欲求アルゴリズムを用いて、介入対象の知識のないデータ生成モデルの等価クラスを復元する。
さらに,本論文では,半合成データセットを未知の因果基底真理で生成する手法を開発した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:15:46 GMT)
HELM: Hierarchical Encoding for mRNA Language Modeling [5.0] 我々は、mRNA言語モデリング(HELM)のための階層的生成アプローチを紹介する。
HELMはコドンの同義性に基づいて損失関数を調節し、モデルの学習過程とmRNA配列の生物学的現実を一致させる。
我々は,多様なmRNAデータセットとタスク上でHELMを評価し,HELMが標準言語モデルの事前学習より優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:51:14 GMT)
Parsing the Language of Expression: Enhancing Symbolic Regression with Domain-Aware Symbolic Priors [4.9] 本稿では,多様な科学領域のシンボル先行を統合した高度な記号回帰手法を提案する。
本稿では,これらのシンボルに先行する新しい木構造リカレントニューラルネットワーク(RNN)を提案する。
実験結果から,シンボル先行値の活用はシンボル回帰の性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:57:48 GMT)
What's In Your Field? Mapping Scientific Research with Knowledge Graphs and Large Language Models [4.8] 大規模言語モデル(LLM)は、大きな仕事の全体にわたる詳細な関係を捉えることができない。
構造化された表現は、自然に補完する -- コーパス全体にわたって体系的な分析を可能にする。
文献全体に関する正確な質問に答えるシステムを試作する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:24:40 GMT)
Priority-Aware Preemptive Scheduling for Mixed-Priority Workloads in MoE Inference [4.8] 大規模言語モデルは自然言語処理に革命をもたらしたが、データセンターで効率的に処理するのは難しい。
我々は、Mixture of Experts(MoE)モデル用に設計された新しい推論システムQLLMを紹介する。
QLLMはエキスパートレベルのプリエンプションを可能にし、LS Time-to-First-Token(TTFT)を最小化しながらBEジョブの実行を遅延させる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:56:01 GMT)
An Asymmetric Independence Model for Causal Discovery on Path Spaces [4.6] 我々は、有向混合グラフ(DMG)における「E-セパレーション」と、微分方程式(SDE)における座標過程間の条件独立関係を関連付ける理論を開発する。
循環型SDEに対する大域的マルコフ特性を証明し、自然に観察された循環型SDEに拡張する。
我々は,同じ独立関係の集合を符号化したグラフのクラスを特徴付け,有向非巡回グラフ(DAG)に対するセミナルサメ骨格とv構造の結果に類似した結果を与える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:43:49 GMT)
Analyzing the Role of Permutation Invariance in Linear Mode Connectivity [4.5] 学生ネットワーク幅が$m$増加するにつれて、LCC損失障壁変調は二重降下挙動を示す。
学習率の増加に伴うGD/SGD溶液の分散度の変化を観察し,この分散度がLCC損失障壁変調に与える影響について検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:22:51 GMT)
FED: Fast and Efficient Dataset Deduplication Framework with GPU Acceleration [4.5] 最近NVIDIAはGPUベースのMinHash LSH復号法を導入したが、まだ準最適である。
本稿では,GPUクラスタにMinHash LSHを最適化するGPU高速化復号化フレームワークFEDを提案する。
大規模な実験では、1.2兆のトークンの重複は4ノード16GPU環境でわずか6時間で完了する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:36:32 GMT)
X-GAN: A Generative AI-Powered Unsupervised Model for High-Precision Segmentation of Retinal Main Vessels toward Early Detection of Glaucoma [4.3] 本稿では,OCTA画像から主血管を抽出するAIを用いた非教師付きセグメンテーションモデルであるX-GANを提案する。
X-GANはラベル付きデータや高性能コンピューティングリソースに頼ることなく、100%近いセグメンテーション精度を達成する。
また,GSS-RetVeinは高分解能2Dおよび3D緑内障網膜データセットである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:23:00 GMT)
RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations [4.2] RS2V-Lは道路センサ観測から車載LiDARデータを再構成・合成するための新しいフレームワークである。
我々の知る限りでは、道路沿いのセンサー入力から車載LiDARデータを再構築する最初のアプローチである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:32:28 GMT)
DAWN-FM: Data-Aware and Noise-Informed Flow Matching for Solving Inverse Problems [4.2] 不完全またはノイズの観測からパラメータを推定する逆問題(逆問題)は、医療画像などの様々な分野で発生する。
簡単な参照分布をマップするために決定論的プロセスを統合する生成フレームワークであるフローマッチング(FM)を採用している。
我々の手法DAWN-FM: Data-AWare and Noise-informed Flow Matchingは,データとノイズの埋め込みを組み込んで,測定データに関する表現へのアクセスを可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:30:41 GMT)
Sparse Mixture-of-Experts for Non-Uniform Noise Reduction in MRI Images [4.2] 本稿では,MRI画像復調のためのスパース・ミックス・オブ・エキスパート・フレームワークを活用した新しいアプローチを提案する。
各専門家は、異なる画像領域に関連付けられた特定のノイズ特性をターゲットとするために微調整された、特殊化畳み込みニューラルネットワークである。
提案手法は, 合成および実世界のMRIデータセット上での最先端の復調技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:32:20 GMT)
GenHPE: Generative Counterfactuals for 3D Human Pose Estimation with Radio Frequency Signals [4.2] GenHPEは、ドメイン固有の共同設立者を排除するために、偽のRF信号を生成する3Dポーズ推定手法である。
我々は、WiFi、超広帯域、ミリ波の3つの公開データセット上でGenHPEを評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:53:58 GMT)
Characterizing Quantum Coherence via Schur-Horn Majorization: Degenerate Distillation and Refined Entropic Uncertainty [4.1] 不整合操作下での全ての資源理論公理を満たす多種多様なコヒーレンス測度スイートを導入する。
この統一的アプローチは、フォン・ノイマン=ツァリスエントロピー空間における物理的に実現可能な状態の幾何学的境界を明らかにする。
本研究では, エントロピーに基づく不確実性関係を, マゼン=ウフィンク境界を精製して, 異なる測定基準をまたいだ最大の固有値を求めることにより強化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:51:11 GMT)
The BIG Argument for AI Safety Cases [4.1] BIGの議論は、さまざまな能力、自律性、臨界性を持つAIシステムの安全ケースを構築するためのシステム全体のアプローチを採用する。
それは、コンテキストに対する感受性、トレーサビリティ、リスク比例といった、長年確立されてきた安全保証規範を尊重している。
それは、フロンティアAIモデルの高度な能力から生まれる、新しい危険な行動に特に焦点をあてる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:33:28 GMT)
Object-Centric World Model for Language-Guided Manipulation [4.0] エージェントが自律運転やロボット工学といった分野の将来と計画を予測するためには,世界モデルが不可欠である。
本稿では,言語命令で案内されたスロットアテンションを用いて,オブジェクト中心の表現空間を活用する世界モデルを提案する。
本モデルでは,オブジェクト中心の表現として現在の状態を認識し,この表現空間における将来の状態を自然言語命令で予測する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:52:50 GMT)
Algorithm-Oriented Qubit Mapping for Variational Quantum Algorithms [4.0] 短期デバイスに実装された量子アルゴリズムは、ノイズと限定的な量子ビット接続による量子ビットマッピングを必要とする。
本稿では,アルゴリズム指向キュービットマッピング(AOQMAP)と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:02:18 GMT)
Modeling Variants of Prompts for Vision-Language Models [3.9] 本稿では、視覚言語モデルに対する異なるプロンプトテンプレートに対するロバスト性を評価するための、体系的なベンチマークであるRobustPrompt Benchmarkを紹介する。
本稿では,プロンプトの変種をモデル化することによって感度を緩和する簡易かつ効果的な手法であるCM(Modeling Variants of Prompts)を提案する。
MVPは、パフォーマンスの低下なしに、入力プロンプトのバリエーションに対するモデルロバスト性を大幅に向上させることができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:30:01 GMT)
Foundation X: Integrating Classification, Localization, and Segmentation through Lock-Release Pretraining Strategy for Chest X-ray Analysis [3.9] nFoundation Xは、さまざまな専門家レベルのアノテーションを使用して基礎モデルをトレーニングするエンドツーエンドフレームワークである。
11個の胸部X線データセットを用いてモデルを訓練し、分類、局所化、セグメンテーションタスクのアノテーションをカバーした。
実験結果から,ファウンデーションXは広範囲なアノテーション利用によって顕著な性能向上を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:45:13 GMT)
Got Compute, but No Data: Lessons From Post-training a Finnish LLM [3.7] 我々は多言語LLMを用いて、英語からフィンランド語への命令と好みのデータセットを翻訳する。
我々は、英語とフィンランド語で命令チューニングと好みの最適化を行い、両方の言語でモデルの指示追従能力を評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:58:43 GMT)
How To Make Your Cell Tracker Say "I dunno!" [3.7] 本稿では,線形代入に基づくセルトラッキングアルゴリズムにおける不確実性を推論し,定量化するための様々な手法を提案し,ベンチマークする。
我々の手法は統計学と機械学習からインスピレーションを得ており、この研究を通じて探索された細胞追跡問題に対する2つの視点を生かしている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:39:14 GMT)
Statistical Virtual Temperature of Classical and Quantum Systems [3.6] 本稿では,Gibs Kubo-Martin-Schwinger(KMS)状態のスペクトルから得られた統計的仮想温度の基本的な定義を紹介する。
我々は、フォン・ノイマンエントロピーと統計的仮想温度の間の普遍的な物理的境界がこれらのIPによって制約されることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:13:49 GMT)
Harnessing Causality in Reinforcement Learning With Bagged Decision Times [3.6] 我々は,有意な決定時間を持つ問題に対する強化学習について検討する。
モバイルヘルスにおいて、複数のアクティビティ提案は、ユーザの日々のアクティブ化へのコミットメントに一括して影響を及ぼす。
我々のゴールは、バッグ固有の報酬の割引金額を最大化するオンラインRLアルゴリズムを開発することである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:15:10 GMT)
Med-gte-hybrid: A contextual embedding transformer model for extracting actionable information from clinical texts [3.6] 本稿では,gte-large文変換器から得られた文脈埋め込みモデルmed-gte-hybridを提案する。
メド・グテ・ヒブリッドのモデルチューニング戦略は、コントラスト学習とデノナイジングオートエンコーダを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:17:01 GMT)
You Only Train Once: A Flexible Training Framework for Code Vulnerability Detection Driven by Vul-Vector [3.6] underlinetextbfYOTO--underlinetextbfYou underlinetextbfOnly underlinetextbfTrain underlinetextbfOnceフレームワーク。
本稿では, underlinetextbfYOTO-underlinetextbfYou underlinetextbfOnly underlinetextbfTrain underlinetextbfOnceフレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:22:03 GMT)
MastermindEval: A Simple But Scalable Reasoning Benchmark [3.6] MastermindEvalは、ボードゲームMastermindにインスパイアされたシンプルでスケーラブルで解釈可能な推論ベンチマークである。
本ベンチマークでは,(1) エージェント評価,(2) モデルが自律的にプレイするエージェント評価,(2) モデルが1つの有効なコードしか推論できないプリプレイされたゲーム状態を与える演目推論評価という2つの評価パラダイムをサポートする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:02:43 GMT)
Magnetic Field Data Calibration with Transformer Model Using Physical Constraints: A Scalable Method for Satellite Missions, Illustrated by Tianwen-1 [3.5] 本研究は、天wen-1火星ミッションの磁場データ補正と、マクスウェル方程式に制約されたニューラルネットワークアーキテクチャを統合する新しいアプローチを提案する。
トランスフォーマーモデルを用いることで、衛星力学、機器干渉、環境騒音による計測異常を補正する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:15:56 GMT)
Isolated Channel Vision Transformers: From Single-Channel Pretraining to Multi-Channel Finetuning [3.4] 大規模MCIデータセットのための簡易かつ効果的な事前学習フレームワークを提案する。
分離チャネル ViT (IC-ViT) と呼ばれるこの手法は,画像チャネルを個別にパッチし,マルチモーダルなマルチチャネルタスクの事前学習を可能にする。
JUMP-CPとCHAMMI、衛星画像用So2Sat-LCZ42など、様々なタスクとベンチマークの実験により、提案されたIC-ViTはパフォーマンス改善の4-14ポイントを提供することが示された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:45:02 GMT)
Accelerating Diffusion Sampling via Exploiting Local Transition Coherence [3.4] LTC-Accelは,テキスト・ツー・イメージとテキスト・ツー・ビデオの合成において,サンプリングを著しく高速化することを示した。
蒸留モデルと組み合わせることで、LCC-Accelはビデオ生成において驚くべき10倍のスピードアップを実現し、16FPS以上のリアルタイム生成を可能にした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:52:09 GMT)
QuickDraw: Fast Visualization, Analysis and Active Learning for Medical Image Segmentation [3.3] 医用画像の可視化と解析のためのオープンソースフレームワークQuickDrawを提案する。
当社のツールでは,DICOM画像をアップロードし,市販モデルを実行して3次元セグメンテーションマスクを生成することができる。
QuickDrawは、手動でCTスキャンを4時間から6分に分割する時間を短縮し、機械学習支援セグメンテーション時間を以前の作業と比べて10%短縮する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:53:27 GMT)
Advancing Education through Tutoring Systems: A Systematic Literature Review [3.3] 本研究は,知能学習システム (ITS) とロボット学習システム (RTS) を包含した学習システムの変革的役割を体系的にレビューする。
この発見は、適応性、エンゲージメント、学習結果を向上するAI技術の著しい進歩を示している。
この研究は、ITSとRTSの相補的な強みを強調し、教育効果を最大化するために統合されたハイブリッドソリューションを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:47:07 GMT)
Enhancing Adversarial Example Detection Through Model Explanation [3.2] 逆例は機械学習モデルの大きな問題である。
有望な方向性の1つは、モデル説明を活用して、これらの攻撃をよりよく理解し、防御することである。
我々は、NeurIPS 2018のスポットライトペーパーで提案されたAmIについて検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:34:41 GMT)
SQLCritic: Correcting Text-to-SQL Generation via Clause-wise Critic [3.2] 本稿では、構造化された実行フィードバックと、詳細な解釈可能な批評を提供する訓練された批評家エージェントを組み合わせる新しいアプローチを提案する。
この方法は、構文的誤りと意味的誤りの両方を効果的に識別し、修正し、精度と解釈可能性を高める。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:41:45 GMT)
Connections between sequential Bayesian inference and evolutionary dynamics [3.2] 生物学における進化過程を記述する力学方程式とシーケンシャルベイズ学習法の間には、長い間関係があると仮定されてきた。
この写本は、この正確な関係を連続的に厳密に確立した新たな研究を記述している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:12:39 GMT)
Axiomatic Explainer Globalness via Optimal Transport [3.2] 我々は,説明の分布のより深い理解を可能にする,説明者,グローバル性のための複雑性尺度を定義する。
提案した測度であるワッサーシュタイン・グローバルネスがこれらの基準を満たすことを証明している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:46:50 GMT)
Quantum Computing and Cybersecurity Education: A Novel Curriculum for Enhancing Graduate STEM Learning [3.2] 量子コンピューティングは、古典的領域において難解であると考えられる問題に対処することによって、多くのアプリケーション領域を変換する可能性を持つ新興パラダイムである。
サイバー攻撃の指数的な増加は、量子能力によってさらに複雑になり、金融システムと国家安全保障に深刻なリスクをもたらす。
従来のサイバーセキュリティ教育は、しばしば実践的手法に依存しており、これらの進化する課題に備えるために必要な、学生中心の学習経験を欠いている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:26:54 GMT)
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge [3.1] 最近の傾向はコンパクトモデル(典型的には量子化のような技術によって100億のパラメータが許容される)に注目が集まっていることを示している。
このシフトは、エッジデバイス上でのLMの道を開き、プライバシーの強化、レイテンシの低減、データ主権の向上といった潜在的なメリットを提供する。
本稿では,CPUベースおよびGPUアクセラレーションエッジデバイスにおけるジェネレーティブLM推論の総合評価を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:01:34 GMT)
Battling Misinformation: An Empirical Study on Adversarial Factuality in Open-Source Large Language Models [3.1] 相手の事実性とは、相手が入力のプロンプトに誤報を意図的に挿入することを指す。
敵対的信頼の3つの階層は、強い自信、適度な自信、限られた信頼の3つと考えられている。
実験の結果、LLaMA 3.1 (8B) は敵の入力を検出できるが、Falcon (7B) は比較的低い性能を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:53:49 GMT)
xVLM2Vec: Adapting LVLM-based embedding models to multilinguality using Self-Knowledge Distillation [3.0] 本稿では,言語データに基づいて学習した大規模視覚言語モデルの適応手法を提案し,その性能を向上する。
マルチ言語およびマルチモーダル埋め込みモデルの有効性を評価するためのベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:04:05 GMT)
TetraGrip: Sensor-Driven Multi-Suction Reactive Object Manipulation in Cluttered Scenes [2.9] テトラは、リニアアクチュエータに搭載された4つの吸引カップを備えた、真空ベースの新しい把握戦略である。
倉庫のような環境下でのテトラの評価を行い、積み重ねや閉塞された構成でオブジェクトを操作できることを実証した。
以上の結果から,RLをベースとした政策は,単一吸引グリップよりも22.86%向上することが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:53:52 GMT)
Leveraging Knowledge Graphs and LLMs for Context-Aware Messaging [2.8] 本稿では,KG(Knowledge Graph)を用いて文字通信を動的に表現するフレームワークを提案する。
好み、職業的役割、文化規範などの関連情報の抽出は、元のメッセージと組み合わせられる。
このフレームワークは、医療の42%、教育の53%、職業採用の78%など、さまざまな領域で顕著なメッセージ受け入れ率を示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:17:15 GMT)
Parameter-Efficient Adaptation of Geospatial Foundation Models through Embedding Deflection [2.8] DEFLECTは、非常に少数のパラメータを持つマルチスペクトル衛星画像にGFMを適用するための新しい戦略である。
5-10$times$より少ないパラメータで、オンパーまたはより高い精度で分類とセグメンテーションタスクを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:53:58 GMT)
DeepInnovation AI: A Global Dataset Mapping the AI innovation and technology Transfer from Academic Research to Industrial Patents [2.8] 本稿では,学術論文と産業特許のギャップを埋めるために設計された,初の包括的グローバルデータセットであるDeepInnovationAIを紹介する。
DeepInnovationAIは、技術開発パターンと国際競争ダイナミクスの詳細な分析を支援する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:56:02 GMT)
Training Hybrid Deep Quantum Neural Network for Reinforced Learning Efficiently [2.8] 我々は、効率的なバックプロパゲーションによって課題を克服するスケーラブルな量子機械学習アーキテクチャを提案する。
提案手法は,hDQNNが純粋に古典的なモデルと比較して,潜在的な一般化可能性を示すことを強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:12:02 GMT)
Physical knowledge improves prediction of EM Fields [2.8] 本研究では,高周波コイル内における電磁界の空間分布を予測するための3次元U-Netモデルを提案する。
物理学で拡張された変種であるU-Net Physを導入し、ガウスの磁性の法則を有限差分による損失関数に組み込む。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:22:57 GMT)
Honey Trap or Romantic Utopia: A Case Study of Final Fantasy XIV Players PII Disclosure in Intimate Partner-Seeking Posts [2.8] ファイナルファンタジーXIV(FFXIV)プレーヤーのソーシャルメディアへの投稿を求める親密なパートナーについて事例研究を行った。
その結果、プレーヤーは機密情報を開示し、信頼を確立するために脆弱性を共有していることがわかった。
本稿では,プライバシーと安全性のリスクを低減し,仮想空間におけるより健全な社会的相互作用を育むための設計上の意義を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:53:06 GMT)
Derivation of Output Correlation Inferences for Multi-Output (aka Multi-Task) Gaussian Process [2.7] マルチタスクGP(MTGP)は、複数の出力の依存関係を考慮するために定式化される。
本稿ではMTGPの定式化とその勾配のフレンドリな導出を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:12:01 GMT)
Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging [2.7] 注意マップの視覚的説明と,他の医用画像診断法との比較を行った。
注意マップは一定の条件下での有望性を示し,説明可能性においてGradCAMを上回っていることがわかった。
本研究は, 認識可能性の方法としての注意マップの有効性が文脈依存的であり, 医用意思決定に必要となる総合的な洞察を常に提供していないため, 限定的である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:52:52 GMT)
Domain Adaptation for Japanese Sentence Embeddings with Contrastive Learning based on Synthetic Sentence Generation [2.7] 本稿では,SDJCについて紹介する。
英語から機械翻訳されたデータセットと既存のデータセットを組み合わせることで、ベンチマークデータセットを構築する。
実験により,2つのドメイン固有の下流タスクに対するSDJCの有効性と,構築したデータセットの有用性が検証された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:15:33 GMT)
Aligning to What? Limits to RLHF Based Alignment [2.6] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の好みを合わせるためにますます使われている。
本研究では,大言語モデルにおけるRLHFとカバートバイアス,オーバートバイアスの関係について検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:24:44 GMT)
MoE-Gen: High-Throughput MoE Inference on a Single GPU with Module-Based Batching [2.5] MoE-GenはシングルGPU実行のための高速なMoE推論システムである。
モジュールベースのトークンを導入し、ホストメモリに蓄積し、大きなバッチを動的に起動して利用を最大化する。
MoE-Genは最先端システムに比べて8-31倍高いスループットを実現している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:08:01 GMT)
Taming Large Multimodal Agents for Ultra-low Bitrate Semantically Disentangled Image Compression [2.5] 本稿では,新しい画像圧縮フレームワークSemantically Disentangled Image Compression(SEDIC)を提案する。
提案するSEDICは,大規模マルチモーダルモデル(LMM)を利用して,画像をいくつかの重要な意味情報に分解する。
多段セマンティックデコーダは、送信された参照画像オブジェクトをオブジェクト単位で段階的に復元するように設計されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:03:22 GMT)
Patch-Wise Hypergraph Contrastive Learning with Dual Normal Distribution Weighting for Multi-Domain Stain Transfer [2.5] 仮想染色はコンピュータ支援技術を用いて組織サンプルの組織化学的染色パターンを他の染色タイプに変換する。
ハイパーグラフに基づくパッチワイドコントラスト学習手法STNHCLを提案する。
そこで本研究では,STNHCLが2種類のステンレス転写タスクの最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:39:53 GMT)
CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection [2.5] 本稿では,異なる手法の脆弱性検出能力を評価するためのベンチマークフレームワークであるCASTLEを紹介する。
我々は,25個のCWEをカバーする250個のマイクロベンチマークプログラムを手作りしたデータセットを用いて,静的解析ツール13,LLM10,形式検証ツール2を評価した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:30:05 GMT)
SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey [2.5] 本チュートリアルでは,ロボット工学における多種多様な深層学習・制御手法について概説する。
視覚ロボットの操作と制御設計において, 自然な3次元回転と翻訳の対称性を利用するSE(3)-equivariantモデルに焦点をあてる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:47:40 GMT)
SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability [2.5] SAEBenchは7つのメトリクスにわたるSAEパフォーマンスを測定する総合的な評価スイートである。
最近提案された8つのSAEアーキテクチャとトレーニングアルゴリズムをまたいだ200以上のSAEスイートをオープンソースにしています。
評価の結果,プロキシメトリクスのゲインは,実用的なパフォーマンスに確実に変換されないことがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:49:02 GMT)
JBFuzz: Jailbreaking LLMs Efficiently and Effectively Using Fuzzing [2.4] JBFuzzは、ソフトウェアのバグや脆弱性を検出するファジングの成功にインスパイアされている。
JBFuzzは、様々な有害・非倫理的な質問に対して全てのLSMを投獄し、平均的な攻撃成功率は99%である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:52:17 GMT)
BiomedCoOp: Learning to Prompt for Biomedical Vision-Language Models [2.3] 本稿では,バイオメディカル画像解析のための新しいプロンプト学習フレームワークであるBiomedCoOpを提案する。
提案手法は,Large Language Models (LLMs) からの平均的なプロンプトアンサンブルとのセマンティック一貫性と,統計に基づくプロンプト選択戦略による知識蒸留を活用することで,効果的なプロンプト文脈学習を実現する。
9つのモダリティと10の臓器にまたがる11の医療データセットについて,提案手法を総合的に検証し,精度と一般化性の両方に有意な改善が認められた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:28:09 GMT)
Evaluating Contextualized Representations of (Spanish) Ambiguous Words: A New Lexical Resource and Empirical Analysis [2.3] スペイン語の単言語モデルと多言語BERTモデルを用いて、文脈におけるスペイン語のあいまいな名詞の意味表現を評価する。
様々な BERT ベースの LM の文脈的意味表現は、人間の判断に多少の違いがあるが、ヒトのベンチマークには及ばない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:31:41 GMT)
CyberLLMInstruct: A New Dataset for Analysing Safety of Fine-Tuned LLMs Using Cyber Security Data [2.3] 大規模言語モデルのサイバーセキュリティアプリケーションへの統合は、大きなチャンスをもたらす。
CyberLLMInstructは、サイバーセキュリティタスクにまたがる54,928の命令応答ペアのデータセットである。
微調整モデルは、CyberMetricベンチマークで最大92.50%の精度を達成することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:29:27 GMT)
Contextuality sans incompatibility in the simplest scenario: Communication supremacy of a qubit [2.3] 本稿では,準備に関する具体的な制約を含む,二者間による準備対応型コミュニケーションゲームを紹介する。
最も単純な測定シナリオでは、文脈性は相容れないことが示され、3段階の量子ビット測定しか必要としない。
これは、前述の5-outcome qubit 測定とは対照的であり、5つの3-outcome qubit 測定の適切な凸混合でシミュレートできる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:50:24 GMT)
Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law [2.2] 本稿では,モデルの重みがトレーニングデータの圧縮表現を具現化する,トレーニング・アズ・圧縮の視点を紹介する。
本稿では,基礎モデルによるアウトプットの著作権侵害から生じる技術的・法的課題について考察する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:54:13 GMT)
Training Human-Robot Teams by Improving Transparency Through a Virtual Spectator Interface [2.1] アフターアクションレビュー(英: After-action Review、AAR)は、オペレーターとチームがタスクパフォーマンスを向上させるのに役立つ専門的な議論である。
我々は,人間のロボットチームパフォーマンスを向上させるために,VSI(Virtual Spectator Interface)と呼ばれる新しいトレーニングレビューツールを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:13:34 GMT)
Parallel Backpropagation for Inverse of a Convolution with Application to Normalizing Flows [2.0] 非可逆的畳み込みの逆は正規化フローで現れる重要な操作である。
正方形画像に対して,動作時間$O(sqrtn)$の高速並列バックプロパゲーションアルゴリズムを提案する。
従来のモデルと比較して,次元毎に類似したビットでサンプリング時間を大幅に改善した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:28:50 GMT)
Equivalence of Quantum Approximate Optimization Algorithm and Linear-Time Quantum Annealing for the Sherrington-Kirkpatrick Model [2.0] QAOAエネルギーは、2つの条件下での量子アニールを近似し、すなわち、角度が1つの層から次の層に滑らかに変化し、和が定数で束縛されていることを示す。
この結果は,一定の角度と任意の深さの和と,角度の和におけるエネルギーの級数展開によるQAOAエネルギーの新式によって実現された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:27:40 GMT)
Complementarity, Augmentation, or Substitutivity? The Impact of Generative Artificial Intelligence on the U.S. Federal Workforce [2.0] 本研究では, 生産型人工知能(AI)技術が米国の労働力における職業能力に与える影響について検討した。
予測AIモデリングに大規模な言語モデルを活用するための多段階検索拡張生成システムを開発した。
この研究は、AI時代の労働計画に不可欠な政策勧告を強調した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:19:52 GMT)
Mono2D: A Trainable Monogenic Layer for Robust Knee Cartilage Segmentation on Out-of-Distribution 2D Ultrasound Data [2.0] マルチスケール,コントラスト,強度不変の局所位相特徴を抽出するモノジェニック層であるMono2Dを提案する。
Mono2Dはセグメンテーションネットワークの第1層の前に統合されており、そのパラメータはネットワークのパラメータと共同で訓練されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:27:45 GMT)
Gap between quantum theory based on real and complex numbers is arbitrarily large [1.9] 我々は、スターネットワーク内で量子システムを共有する$N+1$パーティでシナリオを研究する。
パーティの数が増加するにつれて、実数に基づくヒルベルト空間の定式化は、量子系の複雑なネットワークを記述する際に極端に悪化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:12:18 GMT)
Hardware-Efficient Entanglement Distillation Using Bosonic Systems [1.9] 量子システム間で共有される高忠実な絡み合いは、量子通信と計算にとって不可欠な資源である。
一対のボゾン系の高次元ヒルベルト空間を利用して大量の絡み合いを保存することを提案する。
本研究では,本プロトコルが自然に発生する損失や誤認識の存在下で,絡み合った状態の忠実度を著しく向上させることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:03 GMT)
CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.8] 本研究は,多クラスCitation Intent Classificationタスクに対処するアンサンブルフレームワークであるCiteFusionを紹介する。
CiteFusionは最先端のパフォーマンスを実現し、Macro-F1スコアはSciCiteが89.60%、ACL-ARCが76.24%だった。
我々は、SciCiteで開発されたCiteFusionモデルを利用して、引用意図を分類するWebベースのアプリケーションをリリースする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:59:18 GMT)
Addressing pitfalls in implicit unobserved confounding synthesis using explicit block hierarchical ancestral sampling [1.7] バイアスのないデータ合成は、観測されていないコンバウンディングの存在下で因果発見アルゴリズムを評価するために重要である。
本研究では, ブロック階層的な基底真理因果グラフの生成を生かした, 観測不能な共起に対する明示的モデリング手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:38:40 GMT)
Quantitative Analysis of Deeply Quantized Tiny Neural Networks Robust to Adversarial Attacks [1.7] ディープニューラルネットワーク(DNN)の欠点は、敵の攻撃に対する感受性にある。
本稿では,ブラックボックス攻撃とホワイトボックス攻撃の両方に対してレジリエンスを示すコンパクトDNNモデルの結果を示す。
このレジリエンスは、QKeras量子化対応トレーニングフレームワークを使用したトレーニングを通じて達成されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:34:25 GMT)
QUCE: The Minimisation and Quantification of Path-Based Uncertainty for Generative Counterfactual Explanations [1.6] Quantified Uncertainty Counterfactual Explanations (QUCE) は、経路の不確実性を最小化する手法である。
そこで本研究では,QUCEが説明文の提示時に不確実性を定量化し,より確実な逆実例を生成することを示す。
本稿では,QUCE法の性能を,経路に基づく説明法と生成対実例の両方の競合手法と比較することによって示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:31:10 GMT)
ANPMI: Assessing the True Comprehension Capabilities of LLMs for Multiple Choice Questions [1.6] 様々なプロンプトと選択からなる多重選択ベンチマークは、言語モデルの自然言語理解能力を評価する最も広く使われている手法の一つである。
提案手法を用いて測定された性能は,プロンプトに対するモデルによる理解だけでなく,プロンプトによらず特定の選択に対する固有のバイアスも反映している。
本稿では,ポイントワイド・ミューチュアル・インフォメーション(PMI)を$-log P(Choice)$で正規化するANPMIという新しい計量法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:27:59 GMT)
VeCoGen: Automating Generation of Formally Verified C Code with Large Language Models [1.6] VECOGENは、大規模な言語モデルと形式検証を組み合わせた新しいツールで、公式に検証されたCプログラムの自動生成を行う。
VECOGENは、/ISO C仕様言語における正式な仕様、自然言語仕様、検証プログラムの生成を試みるテストケースのセットを定めている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:40:22 GMT)
AI-based Framework for Robust Model-Based Connector Mating in Robotic Wire Harness Installation [1.5] 我々は、力制御と深層ビゾタクティル学習を統合することで、ケーブルコネクタの配座を自動化する新しいAIベースのフレームワークを設計する。
視覚的・触覚的・受容的データに基づいて学習したマルチモーダルトランスフォーマーアーキテクチャ上での1次最適化を用いた探索・挿入戦略を最適化する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:59:26 GMT)
Two-Photon Interference of Photons from Remote Tin-Vacancy Centers in Diamond [1.5] ダイヤモンド中のスズ原子空孔は長寿命のクビットとして出現している。
リモートノードを接続するには、区別できない光子の量子干渉が必要である。
遠隔量子レジスタ間のロバストな光リンクを確立するため,ダイヤモンド中のスズ空孔中心の可能性を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:05:39 GMT)
Variational preparation of normal matrix product states on quantum computers [1.5] 行列積状態(MPS)は、多体物理学のシミュレーションを含む幅広い種類の量子アルゴリズムにおいて重要である。
我々は、近似量子コンパイル(AQC)の相関を利用して、浅い回路で通常のMPSをいかに準備できるかを示す。
次に、これらの手法を用いて、反強磁性-XY相境界上の大域的クエンチに従って、50部位のハイゼンベルクXXZスピン鎖のダイナミクスを研究する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:00 GMT)
Two-Step Quantum Search Algorithm for Solving Traveling Salesman Problems [1.5] 2組の演算子を用いた2段階量子探索(TSQS)アルゴリズムを提案する。
最初のステップでは、すべての実現可能な解は、同じ重ね合わせ状態に増幅される。
2番目のステップでは、この重ね合わせ状態から最適解状態が増幅される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:38:33 GMT)
Toward a method for LLM-enabled Indoor Navigation [1.4] 屋内地図画像から自然にコンテキストを意識したナビゲーション命令を生成するためのLarge Language Model(LLM)の可能性を探る。
以上の結果から,パーソナライズされた屋内ナビゲーションを支援するLLMが,平均52%,最大62%の正答率を持つ可能性が示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:32:43 GMT)
From Idea to Implementation: Evaluating the Influence of Large Language Models in Software Development -- An Opinion Paper [1.4] トランスアーキテクチャの導入は自然言語処理(NLP)の転換点となった。
ChatGPT や Bard などの大規模言語モデル (LLM) が一般向けに公開されており、これらのモデルの膨大な可能性を示している。
専門家の全体的な意見は肯定的であり、生産性の向上やコーディング時間の短縮といったメリットを専門家が特定している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:57:19 GMT)
Two-component atomic Fermi superfluid with spin-orbital coupling in thin spherical-shell geometry [1.4] 我々は、スピン軌道カップリング(SOC)を受ける薄い球殻における2成分原子フェルミ超流動と調整可能なペアリング相互作用の理論を提示する。
BCS-ボース・アインシュタイン凝縮クロスオーバーにおけるフェルミ超流動にSOCを組み込むことで、エネルギースペクトルと状態方程式を得る。
圧縮性は、ペアリング相互作用またはSOCが変化し、自由エネルギーの高次微分の特異な挙動を示すため、キンクを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:27:17 GMT)
Long-Term Planning Around Humans in Domestic Environments with 3D Scene Graphs [1.3] 家庭環境におけるロボットの長期計画は、人間、物体、空間間の相互作用によって、ユニークな課題を生んでいる。
軌道計画の最近の進歩は、文脈情報を抽出するために視覚言語モデルを活用している。
本稿では,人間の嗜好,活動,空間的文脈を統合した軌道計画手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:00:45 GMT)
A Rule Based Solution to Co-reference Resolution in Clinical Text [1.3] 本研究の目的は、バイオメディカルドメインに適した効果的なコレファレンス解決システムを構築することである。
複数の医療データセットの総合成績は89.6%であった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:29:08 GMT)
Privacy-Preserved Automated Scoring using Federated Learning for Educational Research [1.3] 本研究では,教育評価における自動スコアリングのための統合学習フレームワークを提案する。
生徒の反応はエッジデバイス上でローカルに処理され、最適化されたモデルパラメータのみが中央集約サーバと共有される。
本研究では,9つの中学校における評価データを用いて,従来の学習モデルと統合学習に基づくスコアリングモデルの精度を比較した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:06:25 GMT)
Hardware.jl - An MLIR-based Julia HLS Flow (Work in Progress) [1.2] われわれはJulia言語のための再利用可能なエンドツーエンドのコンパイラツールチェーンを開発している。
これにより、Juliaソースコードを自動的に高性能なVerilogに合成することで、アクセラレータとアルゴリズムの開発を統一する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:12:12 GMT)
The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction [1.2] 我々は、クラスターの形成と可視化に対する影響を明らかにするために、力を分析する。
我々の分析により、UMAPと類似の埋め込み手法がより解釈可能で、より堅牢で、より正確になる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:37:43 GMT)
Data Traceability for Privacy Alignment [1.2] この論文は、成長するサービスのエコシステムに対して、新たなプライバシアプローチを提供する。
個人は、データのコントロール、データの使い方に関する透明性、サードパーティによる誤用に対する説明責任を望んでいる。
説明責任を持つサードパーティデータ共有の現代的なプライバシー問題に対する包括的アプローチは、技術的システムアーキテクチャと法的機関設計の緊密な整合性を必要とする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:42:23 GMT)
Leveraging Retrieval Augmented Generative LLMs For Automated Metadata Description Generation to Enhance Data Catalogs [1.2] データカタログは、さまざまなデータ資産の収集とアクセスのためのリポジトリとして機能する。
組織内の多くのデータカタログは、資産記述のようなメタデータが不十分なため、検索容易性が制限されている。
本稿では,メタデータ作成に関わる課題について考察し,既存のメタデータコンテンツを活用するという,独特なプロンプト・エンリッチメントの考え方を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:33:33 GMT)
Quantization Condition of the Bound States in $n$th-order Schrödinger equations [1.2] 我々は、$n$th-order Schr"odinger方程式のポテンシャル井戸における有界状態に対する一般的な近似量子化則を証明した。
唯一の仮説は、指数関数的に成長する全ての成分は無視可能であり、狭い井戸には適さないということである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:05:09 GMT)
Learning Spatially Adaptive $\ell_1$-Norms Weights for Convolutional Synthesis Regularization [1.2] 我々は、事前学習された畳み込みフィルタのファミリーを考察し、スパース特徴写像に適用された空間的に変化するパラメータを深くパラメータ化して推定する。
提案手法は,後者の手法で視覚的,定量的に比較可能な結果が得られ,同時に高い解釈が可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:38:11 GMT)
The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions [1.2] スタンス検出は、議論プラットフォームへの展開を通じて、オンラインの政治的議論を改善する大きな可能性を秘めている。
伝統的に、トランスフォーマーベースのモデルは、大量のデータを必要とする姿勢検出に直接使用される。
LLM生成合成データは,オンライン政治討論における姿勢検出にどのように役立つかを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:04:34 GMT)
A Finite-Sample Analysis of an Actor-Critic Algorithm for Mean-Variance Optimization in a Discounted MDP [1.1] 政策評価のために線形関数近似(LFA)を用いた時間差分学習アルゴリズムを解析する。
我々は、(i) を平均二乗の意味で保持し、(ii) を尾の反復平均化の下で高い確率で導く有限サンプル境界を導出する。
これらの結果は、強化学習におけるリスクに敏感なアクター批判法に対する有限サンプル理論的保証を確立する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:32:31 GMT)
Universal Properties of Critical Mixed States from Measurement and Feedback [1.0] 単一ショット」適応進化から得られる混合量子物質の普遍的性質について検討する。
混合量子状態は、局所的な可観測物、混合状態エントロピー、および絡み合いの負性の間の長距離関係の変化によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:55 GMT)
Hybrid Rendering for Multimodal Autonomous Driving: Merging Neural and Physics-Based Simulation [1.0] ニューラル再構成の強みと物理ベースのレンダリングを組み合わせたハイブリッドアプローチを導入する。
提案手法は,特に道路面やレーンマーキングにおいて,新規なビュー合成品質を著しく向上させる。
ノイズの多いLiDAR点雲からの奥行き正則化により、元の画像上でカスタマイズされたNeRFモデルをトレーニングすることで、これを実現する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:18:50 GMT)
RAID-Database: human Responses to Affine Image Distortions [1.0] このデータ記述子は、上垂体アフィン画像変換に対する人間の反応のセットを提示する。
これらの反応は、確立された精神物理学(最大相違尺度法)を用いて測定された。
実験では、105人の観察者、20000人以上の画像の比較が行われた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:12:43 GMT)
Discovering new robust local search algorithms with neuro-evolution [1.0] 本稿では,局所探索アルゴリズムの領域における既存の課題を克服することを目的とした,新しいアプローチを提案する。
本研究の目的は,局所探索アルゴリズム内で発生する決定プロセスを改善することであり,各反復で最良な遷移を実現することである。
このアプローチは、新しいローカル検索アルゴリズムの出現とブラックボックス問題に対する問題解決能力の改善に有望な道を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:37:23 GMT)
On the Limitations of Vision-Language Models in Understanding Image Transforms [0.9] 視覚言語モデル(VLM)は、様々な下流タスクにおいて大きな可能性を証明している。
本稿では,VLMのイメージレベルの理解,特にOpenAIによるCLIPとGoogleによるSigLIPについて検討する。
以上の結果から,これらのモデルには複数の画像レベルの拡張の理解が欠如していることが判明した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:58:16 GMT)
Are Small Language Models Ready to Compete with Large Language Models for Practical Applications? [0.9] 本研究は,小規模かつオープンなLMを実用的に評価する枠組みを提案する。
また、特定のアプリケーション要件に応じて、最高のLMとプロンプトスタイルを特定するために、10個のオープンなLMの詳細な比較を行う。
選択された小さいLMは、DeepSeek-v2, GPT-4o, GPT-4o-mini, Gemini-1.5-ProなどのSOTA LLMより優れ、GPT-4oと競合する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:37:42 GMT)
Energy Optimized Piecewise Polynomial Approximation Utilizing Modern Machine Learning Optimizers [0.9] 本稿では,カムプロファイルの総曲率を最小化し,よりスムーズな動きと入力データのエネルギー消費を低減させるフレームワークを提案する。
提案手法の有効性を実験的に検証し,従来の手法では入力データがノイズの多い場合や最適でない場合の効率向上の可能性を示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:23:15 GMT)
Smart Feeding Station: Non-Invasive, Automated IoT Monitoring of Goodman's Mouse Lemurs in a Semi-Natural Rainforest Habitat [0.9] 本論文は、Goodmanのマウスレマー(Microcebus lehilahytsara)に合わせたIoT対応ワイヤレススマート給餌ステーションについて述べる。
システム設計では、正確なRFID(Radio Frequency Identification)リーダーを統合して、動物の埋め込んだRFIDチップを識別する。
このステーションは、チューリッヒ動物園の半天然のマゾアラ熱帯雨林で2ヶ月にわたって試験された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:34:05 GMT)
Frequency-noise-insensitive universal control of Kerr-cat qubits [0.9] 周波数不確かさがKerr-cat量子ビットの演算に及ぼす影響について検討する。
本稿では,Kerr-cat量子ビットにおける保護と可制御性のトレードオフを回避するための共通ゲートスキームを提案する。
この量子ビット設計の魅力的な応用には、調整可能な超伝導プラットフォームが含まれる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:12:10 GMT)
RRWNet: Recursive Refinement Network for effective retinal artery/vein segmentation and classification [0.8] 網膜血管の徹底的な解析は、血管の分画と動脈と静脈への分類を必要とする。
本稿では,この制限に対処する新しいエンドツーエンドディープラーニングフレームワークRRWNetを紹介する。
特にRRWNetは、入力画像からベースセグメンテーションマップを生成するBaseサブネットワークと、これらのマップを反復的に改善するRecursive Refinementサブネットワークである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:04:36 GMT)
Towards Robust Multimodal Representation: A Unified Approach with Adaptive Experts and Alignment [0.8] 不完全なマルチモーダルデータを処理するディープラーニングフレームワークであるMoSAReを提案する。
MoSAReは、専門家の選択、横断的な注意、および対照的な学習を統合して、特徴表現と意思決定を改善する。
データが欠落している場合でも、信頼性の高い予測を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:03:00 GMT)
A Prototype VS Code Extension to Improve Web Accessible Development [0.8] 本稿では、開発者がアクセシビリティの問題を特定し解決するのを支援するために、LLM(Large Language Model)への呼び出しを統合するVisual Studio Codeプラグインを紹介する。
このプラグインは,エラーが正しく検出された場合に,アクセシビリティ問題に対する機能的修正を効果的に生成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:33:34 GMT)
Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval [0.8] 本稿では,SemEval 2025 Task 7:以前のFact-Checked Claim Retrievalについて述べる。
このタスクは、広範囲な多言語MultiClaimデータセットから与えられた入力クレームに関する関連する事実チェックを取得する必要がある。
最適なモデルでは,クロスリンガルデータでは85%,モノリンガルデータでは92%の精度が得られた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:59:41 GMT)
Image Encryption Using DNA Encoding, Snake Permutation and Chaotic Substitution Techniques [0.8] 本稿では,DNAエンコーディング,ヘビ置換,カオス置換技術を用いた新しい画像暗号化手法を提案する。
DNAエンコーディングとヘビ置換モジュールは、ピクセルの効果的なスクランブルを保証する。
混乱部分には、3つのSボックスからランダムに選択された画素値を代用するカオス置換技術が実装されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:54:37 GMT)
MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification [0.8] バグベースのMIL(Multiple Instance Learning)アプローチが、WSI(Whole Slide Image)分類の主流方法論として登場した。
本稿では,マルチスケール特徴抽出と複数インスタンス学習を統合したエンドツーエンドのWSI分類フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:27:31 GMT)
Constraint-Guided Learning of Data-driven Health Indicator Models: An Application on the Pronostia Bearing Dataset [0.7] 本稿では,身体的一貫した健康指標を開発するための制約誘導型ディープラーニングフレームワークを提案する。
我々は、オートエンコーダアーキテクチャ内で制約誘導勾配降下を実装し、制約付きオートエンコーダを作成する。
パフォーマンスは、トレーサビリティ、堅牢性、一貫性の3つの指標を使って評価される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:01:27 GMT)
A Case Study on Model Checking and Runtime Verification for Awkernel [0.7] 人間が手動で同時動作をレビューしたり、可能なすべての実行をカバーしたテストケースを書くことは難しい。
本稿では,スケジューラなどの並列ソフトウェアの開発手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:27:45 GMT)
Faithful and Privacy-Preserving Implementation of Average Consensus [0.7] 本稿では,メカニズム設計理論と暗号化制御に基づくプロトコルを提案し,平均的なコンセンサス問題を解決する。
我々は,セキュアなマルチパーティ計算におけるシミュレーションパラダイムを用いて,提案プロトコルのセキュリティを分析する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:28:22 GMT)
Generalized squeezing as a witness [0.7] 量子系は無限の連続状態で準備できるが、量子技術の資源として使用できるのは一部のみである。
観測可能な作用素の分散を非使用状態のしきい値以下に抑えるシナリオである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:58:59 GMT)
Optimal elemental configuration search in crystal using quantum approximate optimization algorithm [0.6] 量子近似最適化アルゴリズムを用いて、Au-Cu合金において最も安定な元素配置を求める。
この結果から, 結晶中の最適元素配置探索を, 短期量子コンピュータを用いて実現できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:00:20 GMT)
Predicting Tropical Cyclone Track Forecast Errors using a Probabilistic Neural Network [0.6] 熱帯性サイクロントラックの不確かさを推定する新しい手法が提案され, 試験された。
この方法は、ニューラルネットワークを用いて二変量正規分布を予測し、トラックの不確かさを推定する。
我々は,提案手法が現在のNHC手法よりも精度の高い不確実性推定値を生成するとともに,本手法がGlobal Ensemble Forecast Systemと同じような性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:00:31 GMT)
Differentiable Folding for Nearest Neighbor Model Optimization [0.6] Nearest NeighborモデルはRNA二次構造形成の$textitde facto$熱力学モデルである。
ここでは、$textitdifferentiable folding$の最近の進歩を活用して、パラメータ最適化の効率的でスケーラブルで柔軟な手段を考案する。
提案手法では,既存の基準値よりも優れたパラメータセットが得られた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:36:12 GMT)
Optimisation of the Accelerator Control by Reinforcement Learning: A Simulation-Based Approach [0.6] 本研究では,Reinforcement Learning(RL)と統合されたシミュレーションベースのフレームワークの構築を目的とする。
シミュレーションバックエンドとして textttElegant を用い,RL アルゴリズムとアクセルシミュレーションの相互作用を簡略化する Python ラッパーを開発した。
提案したRLフレームワークは物理学者のコパイロットとして機能し,ビームライン性能の向上,チューニング時間短縮,運用効率の向上など,インテリジェントな提案を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:57:52 GMT)
AI, insurance, discrimination and unfair differentiation. An overview and research agenda [0.6] 保険会社は人工知能(AI)によって実現された2つのトレンドに魅了されているようだ
まず、保険会社はAIを使って、より正確にリスクを評価するために、より新しいタイプのデータを分析することができる。
第二に、保険会社はAIを使用して、個々の消費者の行動をリアルタイムで監視することができる。
この2つの傾向は多くの利点をもたらすが、社会に差別的影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:32:28 GMT)
Manify: A Python Library for Learning Non-Euclidean Representations [0.6] Manifyは、非ユークリッド表現学習のためのオープンソースライブラリである。
Manifyは、機械学習の研究と応用の進歩を目指している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:44:40 GMT)
Simulation of Two-Qubit Grover Algorithm in MBQC with Universal Blind Quantum Computation [0.6] Universal Blind Quantum Computation Protocolは、量子コンピューティングにおける機能とデータのプライバシを保証するためのフレームワークを提供する。
現在の量子クラウドコンピューティングプラットフォームは、MBQCを効率的にシミュレートする能力に制限がある。
本稿では,回路ベースの量子コンピューティングプラットフォーム上でMBQCをシミュレートする効率的な手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:29:35 GMT)
Effective Feature Selection for Predicting Spreading Factor with ML in Large LoRaWAN-based Mobile IoT Networks [0.6] 本稿では機械学習(ML)技術を用いたLoRaWANネットワークにおける拡散係数(SF)予測の課題に対処する。
大規模な公開データセットでMLモデルのパフォーマンスを評価し、主要なLoRaWAN機能で最高の機能を調べました。
RSSIとSNRの組み合わせは最高の機能セットとして同定された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:58:28 GMT)
Quantum Computer Controlled by Superconducting Digital Electronics at Millikelvin Temperature [0.6] 現在の超伝導量子コンピューティングプラットフォームは、大きなスケーリング課題に直面している。
有望な代替手段は、量子ビットと共存する低温超伝導デジタル制御エレクトロニクスを利用することだ。
この研究は、高度にスケーラブルなチップベースの量子コンピュータを実現するための重要な一歩である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:21:28 GMT)
ShuffleGate: An Efficient and Self-Polarizing Feature Selection Method for Large-Scale Deep Models in Industry [0.5] Shuffle-Gateはインスタンス間ですべての機能値を同時にシャッフルする。
モデルを再トレーニングすることなく、適切に分離された重要なスコアを生成し、パフォーマンスを見積もることができます。
様々なシナリオで、Bilibiliの検索モデルの日々のイテレーションにうまく統合されています。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:05:03 GMT)
Hamiltonian Neural Networks for Robust Out-of-Time Credit Scoring [0.5] 本稿では,クラス不均衡と時間外予測問題に対処するためにニューラルネットワークを用いた新しいクレジットスコアリング手法を提案する。
我々はハミルトン力学にインスパイアされた特定の損失関数を開発し、信用リスクのダイナミクスをよりよく捉えた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:03:20 GMT)
Performance Evaluation of Threshold Signing Schemes in Cryptography [0.5] Threshold Signature Scheme (TSS)プロトコルは、暗号通貨の普及により、過去10年間で大きな注目を集めている。
本研究は,TSSプロトコルの全体像,最先端TSSプロトコルの評価,特徴の強調,セキュリティと性能の両面から比較する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:17:58 GMT)
MERGE -- A Bimodal Dataset for Static Music Emotion Recognition [0.5] 本稿では,半自動手法を用いて作成した3つの新しい音声・歌詞・バイモーダル音楽感情認識研究データセットであるMERGEを提案する。
得られた結果は、提案したデータセットの生存可能性を確認し、ディープニューラルネットワークを用いたバイモーダル分類において、79.21%のF1スコアを達成した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:52:43 GMT)
Grand Unification of All Discrete Wigner Functions on $d \times d$ Phase Space [0.5] 単一の$d$次元のquditに対して、可能なすべての$dtimes d$離散ウィグナー関数を定義、視覚化、変換するための普遍的なフレームワークを提案する。
このフレームワークは、自然に現れる2dtimes 2d$離散ウィグナー関数とステンシルと呼ばれる情報再構成関数を相互に関連付けて有効な関数を構築する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:55:37 GMT)
Fully-Synthetic Training for Visual Quality Inspection in Automotive Production [0.5] 領域ランダム化を用いた合成画像を生成するパイプラインを提案する。
提案手法を実検シナリオで評価し,合成データのみに基づいて訓練された物体検出モデルが実画像上で訓練されたモデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:58:30 GMT)
Review GIDE -- Restaurant Review Gastrointestinal Illness Detection and Extraction with Large Language Models [0.5] 食品性消化管疾患(英: Foodborne gastrointestinal disease, GI)は、イギリスにおける健康上の一般的な原因である。
本研究では,GI病の専門家と共同で開発した新しいアノテーションスキーマをYelp Openのレビューデータセットに適用する。
GI 病検出,症状抽出,食品抽出の3つの課題において,オープンウェイト LLM の性能評価を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:42:43 GMT)
I Felt Pressured to Give 100% All the Time: How Are Neurodivergent Professionals Being Included in Software Development Teams? [0.5] 本研究は,異なるソフトウェア開発におけるニューロディバージェント・プロフェッショナルの作業経験を理解することを目的とする。
我々は,社会技術理論(STS)を応用し,組織の社会構造とそれぞれの作業技術がこれらの専門家の関与にどのように影響するかを考察した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:28:59 GMT)
Fermionic Partial Transpose in the Overlap Matrix Framework for Entanglement Negativity [0.4] 重なり行列アプローチにフェミオン部分転移を導入する。
両部系における絡み合いの負性性を計算するための明示的な公式を導出する。
2つの格子モデルの対数ネガティビティを数値計算して、ジョエフ・クリッヒ=ウィドムのスケーリング法則を検証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:08:37 GMT)
Towards Generating Automatic Anaphora Annotations [0.4] 様々なNLPタスクでうまく機能する訓練モデルは大量のデータを必要とする。
そこで本研究では,手動によるゴールドアノテートデータ作成の禁止コストに対処するため,中核アノテーションを用いたデータセットの自動作成方法について検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:15:57 GMT)
Convex Is Back: Solving Belief MDPs With Convexity-Informed Deep Reinforcement Learning [0.4] 本稿では,概念空間上の値関数の凸性を取り入れた深層強化学習(DRL)を提案する。
この凸性機能を含めることで,エージェントの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:53:07 GMT)
A PyTorch-Enabled Tool for Synthetic Event Camera Data Generation and Algorithm Development [0.4] イベントカメラデータのシミュレーションと処理を行うPyTorchベースのライブラリであるPythonで,SENPI(Synthetic Events for Neural Processing and Integration)を導入する。
SENPIには、強度ベースのデータをイベント表現に変換し、イベントカメラのパフォーマンスを評価する、微分可能なデジタルツインが含まれている。
SENPIは、合成出力と実際のイベントカメラデータを比較して、リアルなイベントベースデータを生成する能力を示し、これらの結果を用いて、イベントベース知覚の特性と有用性に関する結論を導出する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:55:52 GMT)
Exploiting Unstructured Sparsity in Fully Homomorphic Encrypted DNNs [0.4] プライバシーに敏感な環境でのディープニューラルネットワーク(DNN)は、完全同型暗号化(FHE)における計算オーバーヘッドによって制約される
本稿では,FHE行列乗算法における非構造的空間性について,モデルの精度要件を維持しつつ,その負担を軽減する方法として検討する。
本研究では,任意の行列乗法で空間空間を利用でき,全ての空間領域において,ベースラインナイーブアルゴリズムと比較して実行時利益が得られることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:24:31 GMT)
Neural reservoir control of a soft bio-hybrid arm [0.4] 屈曲性脊椎を包む複数の筋腱群からなる生体ハイブリッドモデルアームの動的制御に神経貯水池がどのように使用されるかを示す。
我々は,貯水池の使用が,従来のニューラルネットワークのアプローチよりも優れた,困難なタスクのセットに対して,同時制御と自己モデリングを促進する方法を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:31:33 GMT)
Exponentially accurate open quantum simulation via randomized dissipation with minimal ancilla [0.4] リンドブラッド力学をシミュレートするいくつかの量子アルゴリズムは、精度$varepsilon$で対数的に短い回路深さを達成する。
観測可能な推定を目的とした複数のジャンプ演算子を用いて一般リンドブラッド力学をシミュレーションする量子アルゴリズムを提案し,対数的に短い回路深さと最小アンシラサイズの両方を達成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:07:22 GMT)
A Comprehensive Multi-Vocal Empirical Study of ML Cloud Service Misuses [0.4] 本稿では,これまで研究されていない20のMLクラウドサービスの誤用のカタログを提案する。
この結果から,MLサービスの誤用はオープンソースプロジェクトと業界の両方で一般的であることがわかった。
これはMLサービスのベストプラクティスにおける継続的な教育の重要性を強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:27:10 GMT)
Materials Discovery With Quantum-Enhanced Machine Learning Algorithms [0.3] 量子強化機械学習アルゴリズムを用いて,低ホール再編成エネルギーを持つ新規ヘテロアセン構造を推定する。
我々は、以前の大規模仮想スクリーニングで生成された化学データを活用し、3つの初期訓練データセットを構築した。
符号化ビット数が増加するにつれて,予測化合物の品質が向上するのを観察する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:27:47 GMT)
EquiPy: Sequential Fairness using Optimal Transport in Python [0.3] 本稿では,複数変数に対して効率よく公平性を実現するために,オープンソースのPythonパッケージであるEquiPyを紹介する。
また、グローバルコンテキスト内の各センシティブ変数の影響を解釈するための総合的なグラフィックユーティリティも提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:53:22 GMT)
A Survey on Spoken Italian Datasets and Corpora [0.3] この調査は、66のイタリア語のデータセットを包括的に分析する。
データセットは、音声タイプ、ソースとコンテキスト、人口統計学的特徴と言語学的特徴によって分類される。
データセットの不足,代表性,アクセシビリティに関する課題について論じる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:59:29 GMT)
Investigation of Frame Differences as Motion Cues for Video Object Segmentation [0.3] 動きキュー抽出における光フローの代替として,フレーム差を用いた手法を提案する。
本研究は,限られた計算資源を持つ場合の移動手段としてフレーム差を利用した場合の有用性を示唆するものである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:42:15 GMT)
A Deep Reinforcement Learning Approach to Automated Stock Trading, using xLSTM Networks [0.3] 本研究では,拡張長短期記憶(xLSTM)ネットワークと深部強化学習(DRL)アプローチを併用して,自動株式取引に利用することを検討した。
提案手法はアクターと批評家の両方でxLSTMネットワークを利用し,時系列データと動的市場環境の効果的処理を可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:56:03 GMT)
Light Drag in a Cavity Magnomechanics [0.2] 光引きずり」は、光の軌跡が動く媒質を移動するときにどのように変化するかを記述する。
この現象は、量子ゲート操作で広く使われている非常に遅い光の速度を正確に検出するのに役立つ。
マグノメカニクス系における光引き込み効果の存在が提案されたのはこれが初めてである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:50:17 GMT)
Towards Causal Model-Based Policy Optimization [0.2] 因果モデルに基づく政策最適化(C-MBPO)を紹介する。
C-MBPOは、因果学習をモデルベース強化学習パイプラインに統合する新しいフレームワークである。
我々は、C-MBPOが、動的に急激で非因果関係に影響を及ぼす分布シフトのクラスに対して堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:09:02 GMT)
Significant circular Unruh effect at small acceleration [0.2] ウンルー効果の円形バージョンは、非常に小さな遠心加速でも有意であることがわかった。
この発見は、円形のウンルー効果の実験的検出に新たな光を放つ。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:00:36 GMT)
The Kieker Observability Framework Version 2 [0.2] 我々は、Keeker Monitoring Frameworkの後継であるKeeker Observability Framework Version 2を紹介する。
このツールアーティファクトペーパーでは、Keekerフレームワークだけでなく、TeaStoreベンチマークへのアプリケーションのデモも公開しています。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:30:23 GMT)
Quantifying total correlations in quantum systems through the Pearson correlation coefficient [0.2] 量子状態は古典的あるいは量子的な方法で相関しうること、すなわち2つのケースは互いに排他的であることを示す。
また、少なくとも2量子ビット系の場合、局所的に非互換な観測可能なペア間の相関の分布は、システムが古典的あるいは量子的相関を含むかどうかについての洞察を与える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:42:06 GMT)
A Hybrid Neural Network with Smart Skip Connections for High-Precision, Low-Latency EMG-Based Hand Gesture Recognition [0.2] 本稿では,手の動き認識を高精度かつ効率的に行うために,ConSGruNetという新しいハイブリッドニューラルネットワークを提案する。
提案されたモデルは、わずか25ミリ秒で53クラスの分類において99.7%の精度を持つ。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:01:32 GMT)
Assessing high-order effects in feature importance via predictability decomposition [0.2] 特徴量における協調効果の定量化のための新しい手法を提案する。
特に,特徴量尺度の適応バージョンを提案する。
GEANTによる模擬検出器の陽子/陽子判別への応用について報告する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:06:05 GMT)
Optimal sensing on an asymmetric exceptional surface [0.2] 例外点(EP)と最適パラメータ推定の関連について検討する。
1つのモードの出力をもう1つのモードに部分的に反映すると、例外曲面(ES)を示す非エルミートハミルトニアンが生成される。
いずれの入力状態に対しても、QFIはEPの存在下で強化され、両方の状態がCram'er-Rao境界を飽和させることが分かる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:57:35 GMT)
AI-Driven Decision Support in Oncology: Evaluating Data Readiness for Skin Cancer Treatment [0.2] この研究は、大学病院Mの皮膚腫瘍センターで実施され、オンコロジーにおける効果的なAI応用の実現において、データ品質、可用性、および抽出性の本質的な役割を解明した。
本研究は、皮膚がん治療決定のための重要なデータポイントを特定し、様々な情報システムにおけるそれらの存在と品質を評価し、構造化されていないデータから情報を抽出する難しさを強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:49:03 GMT)
Towards an Inclusive Digital Society: Digital Accessibility Framework for Visually Impaired Citizens in Swiss Public Administration [0.2] 本稿では,スイスの公共行政におけるアクセス可能なデジタル公共サービスの実装課題について検討する。
私たちの研究は、リソース制約、断片化された政策執行、限られた技術的専門知識を含む重要な障壁を明らかにします。
本稿では,WebコンテンツアクセシビリティガイドラインとHERMESプロジェクト管理方法論を統合した包括的行政フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:43:29 GMT)
Automatic Association of Quality Requirements and Quantifiable Metrics for Cloud Security Certification [0.1] European Cybersecurity Certification Scheme for Cloud Services (EUCS)は、ヨーロッパで最初のサイバーセキュリティスキームの1つである。
本稿では,Sentence Transformerに基づく要件とメトリクスを自動的に関連付ける手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:06:45 GMT)
Can open source large language models be used for tumor documentation in Germany? -- An evaluation on urological doctors' notes [0.1] この評価は、腫瘍ドキュメンテーションプロセスの3つの基本的なタスクについて、11の異なるオープンソース言語モデル(LLM)をテストする。
モデルLlama 3.1 8B、Mistral 7B、Mistral NeMo 12Bはタスクにおいて相容れない性能を発揮した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:48:46 GMT)
Blockchain Data Analytics: Review and Challenges [0.1] 本稿では,学術研究と産業応用の両面から,総合的な文献レビューを行う。
ブロックチェーン分析ツールをブロックエクスプローラー、オンチェーンデータプロバイダ、リサーチプラットフォーム、暗号市場データプロバイダといったカテゴリに分類します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:49:51 GMT)
A Short Scalability Study on the SeQUeNCe Parallel Quantum Network Simulator [0.1] SeQUeNCe離散イベントシミュレータは、システムアーキテクチャや大規模でうまく機能することがまだ証明されていない。
その結果、スケーラビリティの挙動に関する新たな知見が得られ、その戦略と改善の可能性について検討する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:27:51 GMT)
Why LLMs Cannot Think and How to Fix It [0.0] 我々は、その用語の伝統的な理解を包含する「思考」の定義を確立し、それを大規模言語モデルに適用するために適応する。
特徴空間内で思考プロセスを実現するためのソリューションを提案し、これらのアーキテクチャ変更のより広範な意味について論じる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:00:09 GMT)
Who Are You Behind the Screen? Implicit MBTI and Gender Detection Using Artificial Intelligence [0.0] 本研究は,Telegram 会話データにおける言語パターンから直接,人格と性別の変数を推定する暗黙の分類について検討する。
本研究では,トランスフォーマーに基づく言語モデル (RoBERTa) を改良し,人格特性や性差を示す複雑な言語的手がかりを抽出する。
信頼度はモデル精度を86.16%に大きく上げるのに役立つため、RoBERTaは会話テキストデータから暗黙のパーソナリティタイプを一貫して識別する能力を持っている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:24:22 GMT)
What is the relation between Slow Feature Analysis and the Successor Representation? [0.0] Slow Feature Analysis (SFA) は時系列データから表現を抽出する教師なしの手法である。
後継表現(SR)は、遷移統計に基づくマルコフ決定過程(MDP)における状態を表現する方法である。
この研究は、これらの2つの軸に沿った関係を研究する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:41:49 GMT)
Virtual Z gates and symmetric gate compilation [0.0] オープンな量子システム設定において,コンパイル方法が重要な結果をもたらすことを示す。
仮想Z回転に関して対称なコンパイルを選択することが重要であることを実験的に示す。
以上の結果より, DDの性能は仮想Zゲートの誤使用によって悪影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:22:47 GMT)
Validity in Design Science [0.0] 本稿では,デザイン科学の妥当性を定義し,それを適用するプロセスモデルとデザイン科学の妥当性フレームワークを導出する。
このフレームワークは、3つのハイレベルなクレームと妥当性のあるタイプ-クレーム、因果、コンテキスト-および妥当性のサブタイプから構成される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:19:10 GMT)
Unveiling a Hidden Percolation Transition in Monitored Clifford Circuits: Inroads from ZX-Calculus [0.0] 我々はクリフォード回路における測定誘起相転移(MPT)を再検討する。
回路構造に隠されたパーコレーション遷移を明らかにする。
以上の結果から,クリフォード回路のMPTは古典的なパーコレーション遷移によって制御されていることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:46:06 GMT)
Unmask It! AI-Generated Product Review Detection in Dravidian Languages [0.0] 生成AIは、AI生成レビューの急増につながっており、しばしばオンラインプラットフォームの信頼性に深刻な脅威をもたらしている。
本研究では,2つの低リソース言語であるタミル語とマラヤラム語におけるAI生成製品レビューの検出に焦点をあてる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:35:04 GMT)
Unlimited Practice Opportunities: Automated Generation of Comprehensive, Personalized Programming Tasks [0.0] 本稿では、包括的なプログラミングタスクを生成するためのTutor Kaiと呼ばれる新機能を紹介し、評価する。
提示されたシステムでは、学生は自由にプログラミングの概念やタスクの文脈的テーマを選択できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:35:25 GMT)
Universal quantum computation using quantum annealing with the transverse-field Ising Hamiltonian [0.0] 逆場イジング・ハミルトニアンを用いた普遍量子計算の実践的実装法を提案する。
我々の提案はD-Waveデバイスと互換性があり、大規模ゲートベースの量子コンピュータの実現の可能性を広げている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:29:42 GMT)
Universal Narrative Model: an Author-centric Storytelling Framework for Generative AI [0.0] 著者を将来の物語デザインの中心に配置するオープンスタンダードであるユニバーサル・ナラティブ・モデル(UNM)を提案する。
客観的な物語モデルに従って著者の意図を符号化することにより、UNMは物語の移植性と、生成システムに対する意図に基づく制約を可能にする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:26:37 GMT)
Unique Rashomon Sets for Robust Active Learning [0.0] Unique Rashomon Ensembled Active Learning (UNREAL)を紹介する。
UNREALは、ほぼ最適なモデルの集合である羅生門集合からモデルを選択的にアンサンブルする。
我々はUNREALが従来のアクティブラーニング手法よりも高速な理論収束率を実現することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:53:55 GMT)
Unification of stochastic matrices and quantum operations for N-level systems [0.0] 1点確率分布過程と$N$レベルの系の量子過程の時間発展は統一されている。
量子状態と量子演算は、一点確率ベクトルと行列の一般化と見なすことができる。
CP差分性は、量子過程がマルコビアンとして特定されるために必要な条件であるが不十分である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:27:39 GMT)
Ultra-cold atoms as quantum simulators for relativistic phenomena [0.0] 本稿の目的は、超低温原子を量子シミュレータとして用いることについての展開をレビューすることである。
この雑誌の読者にとって最も興味深いのは、相対論的量子現象である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:42:13 GMT)
Trade-off relations between measurement dependence and hiddenness for separable hidden variable models [0.0] ベルの定理は、隠れ変数モデルフレームワーク内の基礎となる仮定の間のトレードオフ関係の観点から検討される。
本稿では,その分布を考慮した「隠蔽情報」という尺度を提案する。
また、この関係は分解可能なモデルによって実現される測度に必要かつ十分な条件を与えることも明らかにした。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:17:36 GMT)
Towards Hardware Supported Domain Generalization in DNN-Based Edge Computing Devices for Health Monitoring [0.0] ディープニューラルネットワーク(DNN)モデルは、オブジェクト検出や分類など、多くの現実シナリオで顕著な成功を収めている。
これらのモデルは、モデル堅牢性とデプロイメントに対する極めて高い要求のため、健康モニタリングにおいてまだ広く採用されていない。
本稿では、ECG加速器とDG法の概要を概説し、両領域の組み合わせがもたらす影響について論じる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:02:39 GMT)
Three tiers of computation in transformers and in brain architectures [0.0] 人間は、算術的または論理的推論タスクを実行するために、言語を熱心に処理するが、批判的な訓練を必要とする。
スケールしたサイズではなく、システムの能力を決定する階層間の遷移であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:08:01 GMT)
Thermodynamics of Non-Hermitian Josephson junctions with exceptional points [0.0] 我々は、直近の主張にもかかわらず、超電流がEPに発散しない非エルミート的ジョセフソン接合に、我々の形式主義を適用する。
反対にエントロピーは1/2log 2$の普遍的なジャンプを示し、これはマヨラナ零モードの出現と関連付けられる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:54:19 GMT)
The erasure of intensive livestock farming in text-to-image generative AI [0.0] ChatGPTのテキスト・トゥ・イメージ・モデル(DALL-E3)は、牧草地や泥に根ざした豚の乳牛として家畜農業をロマンチックにする強いバイアスをもたらす。
工業国におけるほとんどの養殖動物は屋内で飼育され、1個体当たりの空間は限られており、社会的価値と共鳴することができない。
即時改正の禁止は、現代の農業慣行をより深く反映したイメージを生み出した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:35:38 GMT)
The Logic of Counterfactuals and the Epistemology of Causal Inference [0.0] ノーベル経済学賞はルービン因果モデルに基づく因果推論の推論を認めた(ルービン1974)
このモデルは、反事実の論理的原理、排他的中条件(CEM)を前提とする。
私はCEMを使わずにその成功を保ったRubin因果モデルでこの議論に挑戦する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:08:24 GMT)
Tensor Product Structure Geometry under Unitary Channels [0.0] 局所性は通常、量子系の局所的なサブシステムを特定する製品構造(TPS)に関して定義される。
このTPS距離は局所的なサブシステム間の力学のスクランブル特性と関連し、2つのユニットの絡み合いの力と一致することを示す。
短時間のハミルトン進化では、TPS距離の特徴的な時間スケールは、局所的なサブシステム間の相互作用の強さによって決定されるスクランブルレートに依存する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:53:15 GMT)
Temporal CW polarization-tomography of photon pairs from the biexciton radiative cascade: theory and experiment [0.0] 半導体量子ドットからのバイエキシトン・エキシトン放射カスケード中に放出される光子対の分極の時間的相関について検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:22:19 GMT)
Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale [0.0] テキスト音声(TTS)、大言語モデル(LLM)、音声音声(STT)を統合したAIによる電話調査システムを提案する。
米国におけるパイロットスタディ (n = 75) とペルーにおける大規模展開 (n = 2,739) の2つの集団でテストを行った。
以上の結果から,AIシステムの質的深度探索は人間のインタビュアーよりも限定的であったが,全体的なデータ品質は構造化項目の人間主導の基準に近づいた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:52:23 GMT)
Technical Insights and Legal Considerations for Advancing Federated Learning in Bioinformatics [0.0] フェデレート・ラーニング(Federated Learning)は、データ共有の制限に従い、患者のプライバシを保護するとともに、機関間でのデータを活用して臨床発見を改善する。
本稿では, 学術・臨床機関が実施前に取り組まなければならない方法論的, インフラ的, 法的問題について概観する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:45:31 GMT)
Symmetric quantum joint measurements on multiple qubits [0.0] 3つの量子ビットに対して対称な関節計測ベースを構築する方法について述べる。
我々は、現在の測定基準で期待される四面体対称性を実証する。
このアーキテクチャにより、2量子対称関節測定を$n$-qubitバージョンに一般化することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:01:46 GMT)
Symbolic Approximations to Ricci-flat Metrics Via Extrinsic Symmetries of Calabi-Yau Hypersurfaces [0.0] 我々は、Fermat Calabi-Yau n-foldsの平坦なメトリクスに機械学習の近似を解析する。
平坦な計量は、複素構造モジュライの特定の選択に対して驚くほどコンパクトな表現を持つことを示す。
ほぼゼロのスカラー曲率を持つケーラー計量の閉形式式をMLモデルを蒸留して初めて得られる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:38:59 GMT)
Superconductivity in tin telluride films grown by molecular beam epitaxy [0.0] 分子線エピタキシー法により成長した高品質スズテルリド薄膜の超伝導の観察について報告する。
意図しないドープスズテルル化物は100Kで強誘電性遷移を行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:08:47 GMT)
Status and Future Prospects of the Standardization Framework Industry 4.0: A European Perspective [0.0] 産業用4.0技術の急速な開発には、相互運用性、安全性、効率性を確保するため、堅牢で包括的な標準化が必要である。
本稿では,標準化の基本的役割と機能について考察し,欧州の規制枠組みにおけるその重要性に着目した。
人工知能とデジタルツインズに関して、産業4.0の既存の標準への情報的ガイドとして機能し、標準化団体と研究コミュニティの間の協力を強化するための行動として機能する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:30:52 GMT)
Stark-modulated Rydberg dissipative time crystals at room-temperature applied to sub-kHz electric-field sensing [0.0] 平衡外リドベルクガスは、モード競合により出現する多体相を示す。
室温でのB磁場駆動により持続極限周期振動(OSC)が出現し、ロバストなリドバーグ散逸時間結晶(DTC)を形成する
サブkHz系におけるDCおよびACスタークフィールドは、室温でのRydberg DTCのOSC周波数のシフト(DC)や変調(AC)に効果的に使用できる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:34:20 GMT)
Stabilizing steady-state properties of open quantum systems with parameter engineering [0.0] 我々は、リンドブラッド方程式によって支配される駆動散逸量子系において、所望の非平衡定常状態(NESS)を生成するためのパラメータを最適化する手法について述べる。
本手法を用いて、Ising, Kitaev, Dicke モデルにおける高絡み合いおよび混合NESSをいくつかの量子相で予測する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:10:38 GMT)
Specification languages for computational laws versus basic legal principles [0.0] 我々は,この法律が自動意思決定プロセスを通じてソフトウェアによって施行されることを意図した場合に,テキスト計算法について述べる。
本稿では、自然言語で書かれた計算法則や形式言語で書かれた計算法則の両シナリオにおいて、ある法的原則がいかに相応しいかを考察する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:39:27 GMT)
Single-Qudit Quantum Neural Networks for Multiclass Classification [0.0] 本稿では,マルチクラス分類のための単一量子ニューラルネットワークを提案する。
我々の設計では$d$次元のユニタリ演算子を使用し、$d$はクラスの数に対応する。
我々は,MNISTデータセットとEMNISTデータセットを用いたモデルの評価を行い,競合精度を実証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:12:05 GMT)
SU(4) gate design via unitary process tomography: its application to cross-resonance based superconducting quantum devices [0.0] 超伝導量子デバイスにパルス効率のよいSU(4)ゲートを実装するための新しい手法を提案する。
本手法では,静的なZZ$相互作用を考慮に入れたCR-Hamiltonian propagatorからパラメータ化ユニタリを導入する。
我々は、R_ZZ(theta)$を用いて生成される様々なSU(4)ゲートの平均忠実度とゲート時間を評価し、実装の利点を確かめる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:39:53 GMT)
SO(3)-Equivariant Neural Networks for Learning Vector Fields on Spheres [0.0] モデルは球面の回転対称性とベクトル場の固有対称性の両方を尊重すべきである。
本稿では,3次元回転群における群畳み込みに基づく新しい手法を用いて,両方の対称性を尊重する深層学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:00:32 GMT)
Revealing Unintentional Information Leakage in Low-Dimensional Facial Portrait Representations [0.0] ニューラルネットワークの低次元出力に意図せずに漏れ込むことのできる情報を評価する。
顔画像の抽象的な属性のみを記述しようとする40要素または32要素特徴ベクトルから入力画像を再構成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:01:15 GMT)
Reinforcement Learning is all You Need [0.0] 純粋な強化学習によるカウントダウンゲームを用いて3B言語モデルを訓練する。
我々のモデルは5つのベンチマークのうち4つのベースラインを上回り、トレーニングデータ以外の一般化の改善を実証している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:22:28 GMT)
Refining Filter Global Feature Weighting for Fully-Unsupervised Clustering [0.0] 教師なし学習では、効果的なクラスタリングが、ラベルのないデータからパターンや洞察を明らかにする上で重要な役割を果たす。
本稿では,クラスタリングのための特徴重み付けについて検討し,SHAP(SHapley Additive exPlanations)に基づく手法を含む新しい重み付け手法を提案する。
実験により、SHAPに基づく特徴重み付けは、教師なしクラスタリングの品質を高め、他の重み付け法よりも最大22.69%改善できることを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:14:09 GMT)
Quantum position verification in one shot: parallel repetition of the $f$-BB84 and $f$-routing protocols [0.0] 1ラウンドのプロトコルのセキュリティは、量子リソースよりも古典的な情報のサイズに依存する可能性があることを示す。
我々は、$f$-BB84と$f$-routing QPVプロトコルの並列反復を確立する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:00:32 GMT)
Quantum criticality and universality in stationary state of long-range Kitaev model [0.0] 北エフ鎖の長期定常状態における量子臨界性のシグネチャについて検討する。
我々は、$alpha$の値に関係なく、臨界臨界クエンチが定常状態においても量子臨界性を示すことを示した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:58:26 GMT)
Quantum advantage and lower bounds in parallel query complexity [0.0] 本稿では,全関数に対する量子・ランダム化・決定論的(逐次的)問合せ複雑性について検討する。
これらの測度の平行一般化の間には、はるかに大きな分離が可能であることが分かる。
逐次上界から並列量子下界を導出する新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:08:24 GMT)
Quantum Information of a Four-Level Tripod-Type Atom in Motion Interacting with a Deformed Binomial Field in the Presence of a Non-Linear Medium [0.0] 本稿では,Kerr-medium内のQ変形二項体状態に結合した4レベル三脚型原子系の相互作用ダイナミクスについて検討する。
特別な焦点は、q-変形、時間依存結合パラメータ、変形パラメータ、カーの非線形性が系の忠実性や線形エントロピー力学にどのように影響するかを調べることである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:28:47 GMT)
Quantum Global Minimum Finder based on Variational Quantum Search [0.0] 量子グローバルファインダ(QGMF, Quantum Global Finder)は,ミニマを効率的に同定する革新的な計算手法である。
QGMFは2進法を組み合わせて位置を見つける。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:28:51 GMT)
Quantum Feasibility Labeling for NP-complete Vertex Coloring Problem [0.0] 本稿では、カラーリング問題に対する全ての可能な解をラベル付けするための量子フィジビリティラベリング(QFL)アルゴリズムを提案する。
我々は、QFLをIBM Qiskitシミュレータ上で実装し、4色の4頂点3エッジカラー問題を解決する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:45:53 GMT)
Quantization for OpenAI's Whisper Models: A Comparative Analysis [0.0] 本稿では、Whisperと、ライブ音声ストリーミングに最適化された2つのモデルと、オフラインで書き起こしに最適化された2つのモデルについて検討する。
より大規模なモデルでは、レイテンシが増加し、リソース制約のあるデバイスへのデプロイが困難になる。
その結果、量子化は19%のレイテンシとモデルサイズを45%削減し、転写精度を保った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:50:35 GMT)
Quantifying two-mode entanglement of bosonic Gaussian states from their full counting statistics [0.0] その結果, 2モードのボソニックガウス状態の絡み合いを完全に特徴づけるには, 2-体数相関と4-体数相関が十分であることがわかった。
最近の一連の実験で絡み合いが明らかになるので,本研究は極めて重要である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:16:57 GMT)
Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages [0.0] インドのような多言語社会では、テキストはしばしばコードミキシングを示し、異なる言語レベルで現地の言語と英語をブレンドする。
本稿では,Dravidian言語における単語レベルのLI課題への対処を目的とした,共有タスクのプロンプトベース手法を提案する。
本研究では,GPT-3.5 Turboを用いて,大言語モデルが単語を正しいカテゴリに分類できるかどうかを検証した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:57:27 GMT)
Probing quantum properties of black holes with a Floquet-driven optical lattice simulator [0.0] 超低温原子を用いた (1 + 1) 次元ブラックホールと (2 + 1) 次元ブラックホールのアナログ量子シミュレーション手法を提案する。
我々は, ブラックホールの湾曲した形状を符号化した位置依存トンネル振幅を, 駆動系の有効力学によって生成できることを示す。
また、(1+1)Dの模擬ブラックホールのホーキング温度をオンサイト原子集団測定のみに基づいて決定する手法も提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:20:27 GMT)
Probing Latent Subspaces in LLM for AI Security: Identifying and Manipulating Adversarial States [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは、迅速な注射攻撃による脱獄のような敵の操作に弱いままである。
LLMから隠れた活性化を抽出し, 安全状態と脱獄状態の潜伏部分空間について検討した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:59:22 GMT)
Power Spectrum Signatures of Graphs [0.0] グラフ信号の2乗グラフフーリエ変換として定義される新しい点符号、パワースペクトル符号、$mathbbR$の尺度を提案する。
入力グラフの摂動の下では、パワースペクトルのシグネチャは、ワッサーシュタイン計量に関して安定であることを示す。
このシグネチャの実用的価値を示すために、ポイントクラウドデータにおける幾何や対称性を特徴づけるいくつかの応用とグラフ回帰問題を紹介した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:36:25 GMT)
Polygonizing Roof Segments from High-Resolution Aerial Images Using Yolov8-Based Edge Detection [0.0] 本研究では,リモートセンシング画像を用いた屋上詳細抽出とベクトル化のための新しい手法を提案する。
我々は、元来回転物体検出用に設計されたYOLOv8 OBBモデルを適用し、屋根の縁を効果的に抽出する。
メルヴィルとハウスドルフのデータセットで実施された実験は、この方法の有効性を強調している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:29:10 GMT)
Paths Not Taken: A Secure Computing Tutorial [0.0] このチュートリアルでは、システムエンジニアリングの実践を、その運用環境における統合アーティファクトの非公式なモデルで提示することで、システムエンジニアリングの実践を取り入れている。
このチュートリアルは、教師がカリキュラムに重要な過去の作業を含めることを奨励し、その成果をセキュアコンピューティングの探究に追加するために自己教育を行っている学生を育成することが望まれる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:17:47 GMT)
PairVDN - Pair-wise Decomposed Value Functions [0.0] PairVDNは、値関数をエージェントごとの関数ではなくペアワイドのコレクションに分解する新しい方法である。
そこで本研究では,新しい多エージェント協調環境であるBox Jumpを実装し,これらのベースラインに対する性能向上を実証する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:38:22 GMT)
On the generalized eigenvalue problem in subspace-based excited state methods for quantum computers [0.0] 量子化学における挑戦的な問題を解くことは、量子コンピュータの先導的な応用の1つである。
励起状態量子化学における問題のために提案された量子アルゴリズムの中で、サブスペースベースの量子アルゴリズムは、前フォールト耐性量子デバイスに対して有望である。
統計的サンプリング誤差の存在下で一般化固有値方程式を解くと,重なり行列の条件数の増加に伴い固有値の誤差が大幅に増加することを示す。
また、q-sc-EOMのような作業方程式として固有値方程式を持つ励起状態法はそのような問題を持たないことを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:26:11 GMT)
On the contraction properties of Sinkhorn semigroups [0.0] 重み付きバナッハ空間上のシンクホーン方程式の指数収束性を証明するために、リャプノフ法に基づく新しい半群縮約解析を開発した。
我々の知る限り、これらはエントロピー輸送とシンクホーンアルゴリズムに関する文献におけるこのタイプの最初の結果である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 23:05:27 GMT)
On the Weak Point of the Stronger Uncertainty Relation [0.0] いくつかの論文で呼ばれる分散の和の不確実性関係を解析し、すべての不整合可観測物に対する強い不確実性関係を解析する。
分散の和に対するこの不確実性関係は、$A$の分散にいかなる境界も与えないことを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:45:16 GMT)
On the Robustness of Kolmogorov-Arnold Networks: An Adversarial Perspective [0.0] Kolmogorov-Arnold Networks (KAN) は関数近似の新しいアプローチとして登場した。
理論的な約束にもかかわらず、敵対的な条件下でのカンの堅牢性はまだ十分に検討されていない。
我々は,標準のホワイトボックスとブラックボックスの敵攻撃に対するカンの性能を評価する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:45:25 GMT)
Older adults' safety and security online: A post-pandemic exploration of attitudes and behaviors [0.0] オンラインの安全性とサイバーセキュリティの異なる側面に関して,60歳以上の高齢者集団の行動と態度を調査した。
その結果,高齢者は個人情報の安全性について明確な懸念を抱いていることが明らかとなった。
保護体制の整備には高齢者を包含し、その多様性を認めなければならない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:21:49 GMT)
Nonlinear Dynamics of a Dicke Model for V-Type Atoms [0.0] 従来のディックモデルの開スピン-1(3レベル)多様体の非線形半古典力学について検討する。
周期振動と2周波振動の両方が出現し、多重性やカオス力学が現れる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:35:14 GMT)
Noise2Score3D: Tweedie's Approach for Unsupervised Point Cloud Denoising [0.0] ノイズ2Score3Dはノイズデータから直接基礎となる点雲分布のスコア関数を学習する。
本手法は,既存の教師なし手法の反復処理を回避するため,単一ステップでデノナイズを行う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:28:04 GMT)
No quantum advantage without classical communication: fundamental limitations of quantum networks [0.0] 両部絡み合いの長距離分布に依存する量子ネットワークが,局所演算と共有ランダム性とを組み合わさって,関連する量子優位性を達成できないことを示す。
具体的には、これらのネットワークは、グリーンバーガー・ホーネ・ザイリンガー状態やクラスター状態のような、資源の多い量子状態の調製に役立ちません。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:30:02 GMT)
Neuro-Informed Adaptive Learning (NIAL) Algorithm: A Hybrid Deep Learning Approach for ECG Signal Classification [0.0] 本研究では、畳み込みニューラルネットワーク(CNN)と変圧器に基づく注意機構を統合し、ECG信号の分類を強化するハイブリッドアプローチであるNeuro-Informed Adaptive Learning (NIAL)アルゴリズムを紹介する。
このアルゴリズムは、リアルタイム検証性能に基づいて学習率を動的に調整し、効率的な収束を保証する。
MIT-BIH Arrhythmia と PTB 診断ECG データセットを用いて,従来の手法よりも高い分類精度を実現している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:37:53 GMT)
Multimodal Programming in Computer Science with Interactive Assistance Powered by Large Language Model [0.0] DeepSeek R1をベースとした対話型宿題支援システムを開発した。
生徒の仕事はパーソナライズされたプロンプトで包み、すぐに答えを出すことなく教育目的を前進させる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:42:46 GMT)
Multi-objective Memetic Algorithm with Adaptive Weights for Inverse Antenna Design [0.0] 局所最小値の勾配に基づく探索と最適化を組み合わせたメメティックアルゴリズムを提案する。
重要な進歩は、最適化中の目的関数の適応重み付けである。
実装されたアルゴリズムはアンテナ逆設計問題に適用され、機械学習ツールの効率的なデータマイナである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:07:30 GMT)
Multi-Timescale Quantum Averaging Theory for Driven Quantum Systems [0.0] 本稿では、周期的およびほぼ周期的に駆動される量子システムをモデル化するためのマルチスケール量子平均化理論(QAT)を提案する。
マグナス展開を複数のスケールで平均化する方法に統合することにより、QATはシステム力学に対する遠距離および近距離共振相互作用の影響を捉える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:00:24 GMT)
Multi-Step Reasoning in Korean and the Emergent Mirage [0.0] HRMCR(HAE-RAE Multi-Step Commonsense Reasoning)は,文化的に特定の文脈で多段階推論を行う大規模言語モデルの能力を評価するためのベンチマークである。
質問はテンプレートやアルゴリズムを通じて自動的に生成され、韓国の文化知識をシーケンシャルな推論ステップに統合する必要がある。
実験の結果, (2 cdot 1025) 未満の FLOP のトレーニングモデルでは, ほぼゼロに近い性能を示しながら, 問題の解決に苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:45:28 GMT)
Model validation and error attribution for a drifting qubit [0.0] ビット性能は、様々な単一値のメトリクスでしばしば報告され、それぞれが性能を制限するノイズメカニズムのファセットを提供する。
これらの値の分布を用いて、候補雑音モデルの検証や無効化を行う方法を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:06:24 GMT)
Merging Language and Domain Specific Models: The Impact on Technical Vocabulary Acquisition [0.0] 本稿では,統合言語モデルにおける技術的語彙の統合について検討する。
本実験は, この統合プロセスが, 専門用語処理における対象モデルの習熟度に及ぼす影響を解析した。
この知見は、ドメイン固有の知識を高めるために、異なるモデルマージ手法の有効性についての洞察を与える。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:00:49 GMT)
ManeuverGPT Agentic Control for Safe Autonomous Stunt Maneuvers [0.0] 本稿では,自律走行車における高ダイナミックなスタント動作の生成と実行のための新しいフレームワークManeuverGPTを提案する。
3つの特殊エージェントからなるエージェントアーキテクチャを提案する。
実験により、複数の車両モデル間でのJターン実行が成功した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:51:41 GMT)
Long-Time Limits of Local Operator Entanglement in Interacting Integrable Models [0.0] 有限サイズの相互作用可積分系における局所作用素エンタングルメントエントロピー(LOE)の長時間挙動について検討する。
ルール54の特定の演算子に対して、LOEはシステムサイズにおいて最も対数的な値に飽和することを示す。
数値的なエビデンスによって支持される論証として、総合的な相互作用可能な可積分系の場合、LOEの飽和値はシステムサイズにおいて体積法則であるとする。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:49:18 GMT)
Local ergotropy dynamically witnesses many-body localized phases [0.0] 多体局在は、強く相互作用し、乱れた多体量子系に特徴的な力学現象である。
局所的なエルゴトロピーは、エルゴディックから局所的な位相への変化を動的に観察することを示す。
これは、従来の研究で分析された局所的な可観測物やエントロピーの代わりに、どのように局所制御を直接活用するかを示すもので、局所化現象の熱力学的マーカーを提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:45:48 GMT)
Intanify AI Platform: Embedded AI for Automated IP Audit and Due Diligence [0.0] 我々は、中小企業の努力を支援するために作成されたプラットフォームを導入し、その無形資産から価値を効果的に抽出する。
我々は,無形アセットコンサルタント,特許弁護士,デューディリジェンス弁護士の知識を含む知識ベースを,知識ベースの元パートシステムシェルを用いて5つの知識ベースを開発した。
私たちは、同じ専門家の関与によって、赤い旗、リスクスコア、評価のシステムを作成しました。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:44:44 GMT)
In Context Learning and Reasoning for Symbolic Regression with Large Language Models [0.0] 大規模言語モデル(LLM)はトランスフォーマーベースの機械学習モデルであり、明示的に訓練されていないタスクにおいて顕著なパフォーマンスを示している。
ここでは、データセットから単純で正確な方程式を見つけるための機械学習手法であるシンボリック回帰を実行するためのLLMの可能性を探る。
本稿では,戦略的なプロンプトによってモデルの性能が向上し,自然言語インタフェースが理論とデータの統合をいかに単純化するかを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:14:22 GMT)
Improved Honeycomb and Hyper-Honeycomb Lattice Hamiltonians for Quantum Simulations of Non-Abelian Gauge Theories [0.0] 非アベリア・ヤン=ミルズゲージ理論の量子シミュレーションのための改良されたKogut-Susskind Hamiltonianが開発された。
ハニカム格子に対して、古典的には$cal O(b2)$-improved Hamiltonian を導出し、$b$は格子間隔である。
我々は、ゲージ理論の3+1D量子シミュレーションの空間的テッセルレーション候補として(非キラルな)超ハニカムを同定し、関連する$cal O(b)$-improved Hamiltonianを決定した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:00:01 GMT)
Implicit Contrastive Representation Learning with Guided Stop-gradient [0.0] コントラスト学習の概念を暗黙的に取り入れる方法論を導入する。
本手法はトレーニングを安定させ,性能を向上することを示す。
提案手法のアルゴリズムは, バッチサイズが小さくてもうまく動作し, 予測器がなくても崩壊しない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:46:53 GMT)
IT Students Career Confidence and Career Identity During COVID-19 [0.0] 本研究は、新型コロナウイルス(COVID-19)前後のIT(IT)における大学生のキャリア信頼度とアイデンティティについて考察する。
オーストラリア大学のIT学生1349人がキャリアへの自信を報告。
その結果,IT学生のキャリア信頼度は,その期間に維持されることが示唆された。
2021年には、IT学生のキャリアコミットメントが向上し、職業的期待が高まった。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 22:37:44 GMT)
Hyperfine Coupling Constants on Quantum Computers: Performance, Errors, and Future Prospects [0.0] 本稿では,電子スピン共鳴等方性超微細結合定数(HFC)の量子ハードウェア上での最初の実装と計算について述べる。
実験例ではヒドロキシルラジカル(OH$bullet$)、一酸化窒素(NO$bullet$)、三重項ヒドロキシルカチオン(OH$+$)のHFCを計算する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:02:08 GMT)
Heuristic-Based Address Clustering in Cardano Blockchain [0.0] Cardano支払いアドレスのクラスタリングには2つの新しいクラスタリングアルゴリズムが提案されている。
結果は、カルダーノネットワークの各中規模のエンティティが平均9.67の支払いアドレスを所有し、制御していることを示している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:22:26 GMT)
Global Position Aware Group Choreography using Large Language Model [0.0] 大規模言語モデル(LLM)の最近の進歩を生かしたグループ振付フレームワークを提案する。
我々のフレームワークは、連続した特徴を離散トークンに変換するトークンライザと、動きトークンを予測するために微調整されたLCMから構成される。
我々のフレームワークは、強い音楽相関とダンサーの一貫性を維持しながら、現実的で多様なグループダンスを生成することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:25:32 GMT)
Generative AI for Named Entity Recognition in Low-Resource Language Nepali [0.0] 本稿では,ネパールにおけるLarge Language Models (LLMs) のNERへの適用について検討する。
LLMは、限られたデータから学習できるため、低リソース言語に特に有望である。
ネパール語などの言語におけるNLP研究の進展に貴重な貢献をしている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:40:09 GMT)
Gauge freedoms in unravelled quantum dynamics: When do different continuous measurements yield identical quantum trajectories? [0.0] マルコフの開量子系の量子軌跡は、システムが相互作用する環境で行われる測定のバックアクションから生じる。
我々は、異なる測定結果が同じ量子軌道をもたらす必要十分条件を導出する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:01:07 GMT)
Fusion Dynamics of Majorana Zero Modes [0.0] スピンレス・キタエフモデルにおけるマヨラナゼロモードの核融合ダイナミクスと磁気-超伝導ハイブリッド構造を記述するスピンフルモデルについて検討する。
以上の結果から,マヨラナゼロモードの融合力学がマヨラナ量子ビットの読み出しに有効であることが確認された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:09:17 GMT)
Folded Context Condensation in Path Integral Formalism for Infinite Context Transformers [0.0] 本稿では、パス積分形式論の枠組みの中で、そのコアメカニズムを再解釈することにより、トランスフォーマーアルゴリズムの一般化された定式化を提案する。
よりコンパクトで効率的な表現が得られ、シーケンスのコンテキスト情報をメモリのようなセグメントに凝縮する。
本稿では,この手法の有効性をPasskey検索タスクと要約タスクで検証し,提案手法が履歴情報を保存し,メモリ使用率とシーケンス長を線形に拡張することを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:13:15 GMT)
Feynman Propagator of the Arthurs-Kelly system at the Planck Scale [0.0] 一般化不確実性原理(GUP)を持つ非相対論的量子力学をアーサース・ケリー系で検討する。
宇宙の初期における応用については、概説する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 06:53:05 GMT)
Fast computation of the TGOSPA metric for multiple target tracking via unbalanced optimal transport [0.0] 複数のターゲットトラッキングでは、異なるトラッキングアルゴリズムの性能を評価することが重要である。
軌道一般化最適部分パターン割当量(TGOSPA)は,最近提案された評価基準である。
本稿では,TGOSPA問題を不均衡なマルチマルジナル最適輸送問題としてキャストすることで,TGOSPAメトリックを評価する近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:51:03 GMT)
Exploration of Hepatitis B Virus Infection Dynamics through Virology-Informed Neural Network: A Novel Artificial Intelligence Approach [0.0] Virology-Informed Neural Networks (VINNs) は、ウイルス感染のダイナミックスを把握する強力なツールである。
VINNは、微分方程式のシステムを解くための従来の数値法に代わるアプローチを提供する。
本手法を最近提案したB型肝炎ウイルス(HBV)感染動態モデルに適用し,肝内感染の伝達をより正確に予測する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:02:31 GMT)
Exploiting Adjacent Similarity in Multi-Armed Bandit Tasks via Transfer of Reward Samples [0.0] 2つの連続するタスクに対する腕の平均報酬の差がパラメータによって制限されるという意味で、バンドイットタスクは隣接して類似していると仮定する。
UCBに基づく2つのアルゴリズムを用いて,前タスクからの報酬サンプルを転送し,すべてのタスクに対する全体的な後悔を改善する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:15:36 GMT)
Exact Correlation Functions for Dual-Unitary Quantum circuits with exceptional points [0.0] 双対ユニタリ量子回路を例外点で構築する逆手法を提案する。
固有ベクトルの結果として、相関関数は指数関数の変形を示す。
相関関数の挙動はラテンポス変換によって異なることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 10:39:47 GMT)
Everything Can Be Described in Words: A Simple Unified Multi-Modal Framework with Semantic and Temporal Alignment [0.0] 時間的推論と大規模マルチモーダルデータ処理の必要性から,Long Video Question Answering (LVQA) は困難である。
非常に長い動画を効率的に処理する検索拡張生成フレームワークであるUMaTを紹介する。
UMaTは、マルチモーダル統合、長文ビデオ理解、スパース情報検索において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 05:28:24 GMT)
Evaluation of state-of-the-art deep learning models in the segmentation of the heart ventricles in parasternal short-axis echocardiograms [0.0] 胸部短軸心エコー図(PSAX-echo)における心室のセグメンテーションによる深層学習モデルの評価
深層学習モデルはPSAX-echoの左室と右室のセグメンテーションに適したモデルである。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 00:33:01 GMT)
Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0] 実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。
その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:13:33 GMT)
Entropy Gain and Information Loss by Measurements [0.0] システムの量子エントロピーが測定によって増加すると、特定の情報が失われる。
純粋で偏りのないmビット状態が最大混合状態に崩壊すると、エントロピーの最も高い利得が得られることを示す。
ベル, GHZ, および辺縁に絡み合ったヴェルナー状態を測定すると、同じ最小エントロピーゲイン(ln2)と等しい最小情報損失が得られることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:46:46 GMT)
Energy Dissipation Preserving Physics Informed Neural Network for Allen-Cahn Equations [0.0] 本稿では, 物理インフォームドニューラルネットワーク(PINN)に基づく, 定数および退化運動量, 対数エネルギー関数, 決定的およびランダムな初期関数, 1, 2, 3次元の対流項を持つアレン・カーン方程式の数値解について検討する。
PINNの学習能力を向上させるため,ネットワークの損失関数にペナルティ項としてアレン・カーン方程式のエネルギー散逸特性を組み込む。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 12:50:29 GMT)
Electro-mechanically tunable, waveguide-coupled photonic-crystal cavities with embedded quantum dots [0.0] 量子ドットを埋め込んだ1次元フォトニック結晶キャビティをベースとした完全チューニング可能なシステムを提案する。
キャビティモード波長を調整するためにマイクロエレクトロメカニカルカンチレバーが使用される。
量子ドットはキャビティモードと共振するように調整され、エミッションレートが向上する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:37:02 GMT)
Eigen-SNAP gate for photonic qubits in a cavity-transmon system [0.0] 回路QED環境におけるフォトニック量子ビットに基づくプラットフォームを構築した。
トランスモンを介して結合された2つのキャビティに基づく多目的2量子ゲートを提案する。
これらの最適プロトコルの忠実度は、システムのコンポーネントのコヒーレンス時間によってのみ制限される。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:38:41 GMT)
Efficient dynamic modal load reconstruction using physics-informed Gaussian processes based on frequency-sparse Fourier basis functions [0.0] 本稿では,物理インフォームドガウス法(GP)を用いた効率的な動的負荷再構成法を提案する。
GPの共分散行列はシステム力学の記述を用いて構築され、構造応答測定を用いてモデルを訓練する。
開発されたモデルは, 構造的健康モニタリング, 損傷予後, 負荷モデル検証に応用できる可能性を秘めている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 14:16:27 GMT)
Edge AI-Powered Real-Time Decision-Making for Autonomous Vehicles in Adverse Weather Conditions [0.0] 従来のクラウドベースのAIシステムは通信遅延を導入し、リアルタイムの自律ナビゲーションには適さない。
本稿では,悪天候下でのAV応答性向上を目的とした,エッジAIによるリアルタイム意思決定フレームワークを提案する。
ネットワークエッジでデータを処理することにより、AV適応性を改善しながら決定遅延を大幅に低減する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 02:02:05 GMT)
Easy better quantum process tomography [0.0] 標準線形反転QPTとオーバーコンプリート線形反転QPTに対する明示的な補正手順を提案する。
また、最大推定のような統計的に原理化された推定器に拡張する方法についても述べる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:15:39 GMT)
Dynamically emergent correlations in bosons via quantum resetting [0.0] 調和トラップ中のN$非相互作用ボソン系の量子リセットにより誘導される非平衡定常状態(NESS)について検討する。
我々は, 平均密度, 極値統計, 秩序, ギャップ統計などの物理観測値を解析的に計算することによって, 定常状態を完全に特徴づける。
これは、様々な観測可能なものを正確に計算できる強い相関の量子多体NESSの稀な例である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 04:27:48 GMT)
Double-Stage Feature-Level Clustering-Based Mixture of Experts Framework [0.0] 本稿では,DFCP-MoE(Mixture of Experts)フレームワークについて述べる。
入力特徴抽出、特徴レベルのクラスタリング、計算効率の良い擬似ラベル戦略で構成されている。
そこで本研究では,MoEモデルを用いたクラスタリング入力の訓練により,専門家の専門性を向上する条件付きエンドツーエンド共同訓練手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:13:50 GMT)
Disentangling anomaly-free symmetries of quantum spin chains [0.0] 1+1d格子ハミルトニアン系の任意の有限、内部、非特異な対称性は、オンサイト対称性に切り離すことができることを証明している。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:08:22 GMT)
Detuning-symmetric laser cooling of many mechanical modes with a photothermally modified cavity [0.0] 単一青色レーザで駆動される光熱修飾光学キャビティを用いた膜のメカニカルモードを同時に冷却する。
機械系に直接適用される放射圧やボロメトリー力とは対照的に、この冷却効果は変形の兆候に依存しない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:45:36 GMT)
Detecting and Preventing Data Poisoning Attacks on AI Models [0.0] 本研究は,データ中毒の発生を検知・予防する新しい手法を開発し,評価することを目的とする。
本研究は, 異常検出, 頑健な最適化戦略, アンサンブル学習など, モデルトレーニング中の有毒データの影響を識別・緩和する様々な手法について検討した。
統計的異常検出および逆行訓練を含む防御機構が提案され, 毒性の軽減, モデルロバスト性の向上, 平均15~20%の精度回復が達成された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:55:01 GMT)
Designing Graph Convolutional Neural Networks for Discrete Choice with Network Effects [0.0] 本稿では,ネットワーク効果を個別にモデル化する新しいグラフ畳み込みニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、推論に必要な解釈可能性を維持しながら、標準的な離散選択モデルよりも高い予測性能を達成する。
アーキテクチャを従来の個別選択と汎用ディープラーニングモデルから派生したものと比較する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:38:47 GMT)
Decoherence-free measurement of wavefunction collapse with interferometers in quantum superpositions [0.0] 干渉計測と異なり、デコヒーレンスの影響を受けない新しい波動関数崩壊測定手法を提案する。
アプローチでは、干渉計の鏡は量子重ね合わせに置かれ、鏡の重ね合わせは、干渉計の光子を検出する確率に影響を与えるという事実によって間接的に測定することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:47:39 GMT)
Data-driven decoding of quantum error correcting codes using graph neural networks [0.0] グラフニューラルネットワーク(GNN)を用いたモデルフリーでデータ駆動型デコーディングアプローチについて検討する。
GNNベースのデコーダは、シミュレーションデータのみを与えられた表面コード上での回路レベルのノイズに対する整合デコーダよりも優れていることを示す。
その結果、デコードに対する純粋にデータ駆動型アプローチが、実用的な量子誤り訂正のための実行可能な選択肢である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:21:48 GMT)
Cover Learning for Large-Scale Topology Representation [0.0] 本稿では,幾何学的データセットのトポロジ的に忠実な被覆を学習する手法について述べる。
そこで得られた単純複体は, 標準トポロジカル推論手法よりも, サイズ的に優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 19:10:20 GMT)
Correlated quasiparticle poisoning from phonon-only events in superconducting qubits [0.0] 超伝導量子ビットのための対破壊フォノンバーストの非イオン源
これらの現象の1つの原因は、デバイス層と基板間の差熱収縮による熱誘起応力の緩和である。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:16:21 GMT)
Comparing quantum complexity and quantum fidelity [0.0] 複雑性は量子忠実度と同じ情報を提供し、したがって量子相転移を検出することができることを示す。
我々は,空間的局所性の概念を複雑性の計算に取り入れることが,新しい物理を明らかにする上で重要であると結論付けた。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:04:57 GMT)
CoLaNET -- A Spiking Neural Network with Columnar Layered Architecture for Classification [0.0] 本稿では、幅広い教師付き学習分類タスクに使用できるスパイキングニューラルネットワーク(SNN)アーキテクチャについて述べる。
全ての参加信号(分類対象記述、正しいクラスラベル、SNN決定)がスパイクの性質を持つと仮定する。
モデルに基づく強化学習に関わる課題に対して,私のネットワークの性能について解説する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:50:18 GMT)
Characterization of non-adaptive Clifford channels [0.0] 量子安定化回路は、量子計算と通信のほぼすべての領域で発生する。
クリフォードチャネルと呼ばれるものに対するいくつかの自然なアプローチを考える。
この単純な構造は、そのようなチャネルの情報容量を計算することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:21:27 GMT)
Chain of Draft for Software Engineering: Challenges in Applying Concise Reasoning to Code Tasks [0.0] 本研究は,CoD(Chain of Draft)法をソフトウェア工学に拡張する。
すべてのCoD変種は、Chain of Thought (CoT)よりもかなり少ないトークンを使用した。
CoDの変種は、CoTのコード品質の90%以上を、正確性、互換性、保守性を含む主要なメトリクスで維持する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 07:44:18 GMT)
Bridging Pattern-Aware Complexity with NP-Hard Optimization: A Unifying Framework and Empirical Study [0.0] 本稿では,ドメイン間の効率的な計算複雑性を低減するための新しいパターン認識フレームワークを提案する。
厳密な定義、定理、メタ学習駆動型ソルバパイプラインによって、パターン利用効率(PUE)のようなメトリクスを導入し、最大で79%のソリューション品質向上を実現します。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 11:05:06 GMT)
Auspex: Building Threat Modeling Tradecraft into an Artificial Intelligence-based Copilot [0.0] Auspexは、生成人工知能ベースのメソッドの特別なコレクションを使用して構築された脅威モデリングシステムである。
商工会議所は、脅威モデリング者の地上での知識のコーディングを推進している。
Auspexは、手作業で要する数週間または数ヶ月に対して、形式化された脅威モデル出力を数分で生成する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:54:18 GMT)
Attention Condensation via Sparsity Induced Regularized Training [0.0] 自己注意は、コンテキストウィンドウが拡大するにつれて、トランスフォーマーの推論時間を支配する。
我々は,大規模言語モデルにおける注意分散の理論的枠組みを拡張した。
カスタマイズされた損失関数は、注目行列の上位要素の数を制限することで、空間性を強制するように設計されている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:12:59 GMT)
Asking Again and Again: Exploring LLM Robustness to Repeated Questions [0.0] 我々は,最近の5つの大言語モデル (LLM) を理解データセットの読解において評価した。
以上の結果から,モデルの精度を最大で6%向上する可能性が示唆された。
すべてのモデル、設定、データセットにまたがって、統計的に重要な結果が見つからない。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 13:48:12 GMT)
Analysis of a multi-target linear shrinkage covariance estimator [0.0] 我々は, 精密かつ実証的な平均値で, オラクルとテライトボナの多ターゲット線形収縮推定器を導出する。
様々な状況において、他の標準推定値よりも優れていることを実証的に示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:02:55 GMT)
An Autonomous RL Agent Methodology for Dynamic Web UI Testing in a BDD Framework [0.0] 本稿では,自律型強化学習(RL)エージェントを振る舞い駆動開発(BDD)フレームワークに統合し,ユーザインターフェーステストを強化する。
RLの適応的意思決定機能を活用することで、提案手法は、特定のビジネス期待や実際のユーザ行動に適合したテストシナリオを動的に生成し、洗練する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:31:03 GMT)
Algebraic Evaluation Theorems [0.0] MVがいつグループ決定に最適かを考える理論は、コンドルセットの1785年の陪審式決定定理にさかのぼる。
American Community Surveyによる人口統計データを用いた実験は、MVに対するAEの実用性を確認した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 16:31:39 GMT)
Agentic AI for Scientific Discovery: A Survey of Progress, Challenges, and Future Directions [0.0] エージェントAIシステムは推論、計画、自律的な意思決定を行うことができる。
彼らは、科学者が文献のレビューを行い、仮説を作成し、実験を行い、結果を分析する方法を変えようとしている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 01:00:05 GMT)
Adaptive Temperature Based on Logits Correlation in Knowledge Distillation [0.0] 知識蒸留は、深層学習モデルが持つ性能を模倣する技法であるが、他のモデルのサイズを小さくする手法である。
これら2つの異なるモデルは、情報の提供方法に似ており、1つは「教師」、もう1つは「学生」として振る舞う。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:41:31 GMT)
Acceleration without photon pair creation [0.0] 量子物理学はより複雑であるため、古典理論から派生することはできない。
本稿では, 真空を熱状態に変換することなく, 非慣性フレーム内の量子化電磁場を一貫したモデル化が可能であることを示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 21:47:46 GMT)
AIDetection: A Generative AI Detection Tool for Educators Using Syntactic Matching of Common ASCII Characters As Potential 'AI Traces' Within Users' Internet Browser [0.0] AIDetection.infoは、ジェネレーティブAIモデルによって残された共通トレースを識別するために、構文に基づくアプローチを採用している。
このツールは、ドキュメントをスキャンして、潜在的なAIアーティファクト、AI引用と承認をスキャンし、ダウンロード可能なExcelとCSVレポートによる視覚的な要約を提供する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:53:58 GMT)
A primer on optimal transport for causal inference with observational data [0.0] このレビューの目的は、最適な輸送と観測データによる因果関係の同定の間の驚くほど深い関係について紹介することである。
結果として、このレビューは、統計学、数学、計量学の様々な分野の言語と表記を統一することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 18:18:00 GMT)
A method for classification of data with uncertainty using hypothesis testing [0.0] 不確実性を定量化し、それを考慮に入れた意思決定アプローチを採用する必要がある。
2種類の仮説テストを用いた新しい意思決定手法を提案する。
この方法は、2つのクラス分布の重なり合う領域に属するあいまいなデータを検出することができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 03:58:43 GMT)
A Strategy for Label Alignment in Deep Neural Networks [0.0] 本研究では,ディープニューラルネットワークに適したラベルアライメントを利用した適応アルゴリズムの代替式を導出する。
また,本手法は,より安定な収束性を持ちながら,主流の教師なしドメイン適応法に匹敵する性能を発揮することを示す実験を行った。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:04:03 GMT)
A Review of Bayesian Uncertainty Quantification in Deep Probabilistic Image Segmentation [0.0] 画像セグメンテーションの進歩は、ディープラーニングベースのコンピュータビジョンの幅広い範囲において重要な役割を担っている。
この文脈において不確かさの定量化が広く研究され、モデル無知(エピステミック不確実性)やデータあいまいさ(アラート不確実性)を表現し、不正な意思決定を防ぐことができる。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 09:51:17 GMT)
A Novel Approach for Intrinsic Dimension Estimation [0.0] 実生活データは、その性質から複雑で非線形な構造を持つ。
低次元空間におけるデータセットのほぼ最適な表現を見つけることは、機械学習タスクの成功を改善するための適切なメカニズムを提供する。
本研究では,高効率で頑健な内在次元推定手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 15:42:39 GMT)
A New $\sim 5σ$ Tension at Characteristic Redshift from DESI-DR1 BAO and DES-SN5YR Observations [0.0] 我々は,マルチタスクガウスプロセスフレームワークを用いて,角径距離(D_A$)のモデルに依存しない再構成を行う。
我々は、バリオンドラッグエポック$r_d$の共振音の水平方向をプランクの最適値に調整する。
我々の発見によると、$zsim 1.63$で、$H(z)$はPlanck-2018 $Lambda$CDM予測と完全に一致している。
$zsim 0.512$とすると、導出された$H(z)$は5sigma$以上の相違を示す。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 08:13:04 GMT)
A Monte Carlo approach for finding optimally controlled quantum gates with differential geometry [0.0] 我々はユニタリ群の多様体上の部分リーマン幾何学を用いて、単一キュービットゲートを生成するために最適に設計されたハミルトニアンを得る。
我々は、測地方程式の解から得られる最適化された制御場と、よく知られたクロトフ法から抽出されたものとを比較した。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:58:01 GMT)
A Generative Framework for Predictive Modeling of Multiple Chronic Conditions Using Graph Variational Autoencoder and Bandit-Optimized Graph Neural Network [0.0] 複数の慢性疾患(MCC)の出現を予測することは、早期介入とパーソナライズされた医療にとって重要である。
グラフニューラルネットワーク(GNN)は、MCCに見られるような複雑なグラフデータをモデリングするための効果的な手法である。
本稿では,データ分布を利用してグラフ構造を代表的に構築するGNNのための新しい生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 17:08:05 GMT)
A Comprehensive Review on Understanding the Decentralized and Collaborative Approach in Machine Learning [0.0] 機械学習(ML)の登場によって、データから貴重な情報をアンロックする方法は完全に変わりました。
すべてをひとつの場所に格納する従来の手法は、情報を非公開にし、大量のデータを処理し、不公平な優位性を避けるという大きな問題を抱えていた。
私たちは、分散機械学習とそのメリット、例えば、データのプライベート化、回答の高速化、さまざまなデータソースの使用などについて検討しました。
医療と金融の現実的な例は、情報セキュリティを守りながら、コラボレーション機械学習が重要な問題を解決する方法を示すために使用された。
論文参考訳(メタデータ) (Wed, 12 Mar 2025 20:54:22 GMT)