CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation [98.1] CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:00:30 GMT)
Learning Task Decomposition to Assist Humans in Competitive Programming [90.5] タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。
我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。
人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:47:54 GMT)
Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.9] カリキュラムベースの論理認識型チューニングフレームワークであるLACTを提案する。
具体的には、任意の一階論理クエリをバイナリツリー分解によって拡張する。
広く使われているデータセットに対する実験では、LATは高度な手法よりも大幅に改善(平均+5.5% MRRスコア)し、新しい最先端技術を実現している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:24:49 GMT)
Theoretical Insights in Model Inversion Robustness and Conditional Entropy Maximization for Collaborative Inference Systems [89.4] 協調推論により、クラウドサーバに機密データを公開することなく、エンドユーザは強力なディープラーニングモデルを活用することができる。
近年の研究では、これらの中間機能は、情報が漏洩し、生データをモデル反転攻撃(MIA)によって再構築できるため、プライバシーを十分に保持できないことが判明している。
この研究はまず、与えられた中間特徴の入力の条件エントロピーが、任意のMIAの下での再構成平均二乗誤差(MSE)の保証された下界を与えることを理論的に証明する。
そして、ガウス混合推定に基づいて、この条件付きエントロピーを有界化するための微分可能かつ可解な尺度を導出し、逆ロバスト性を高める条件付きエントロピーアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:15:21 GMT)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.2] 逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。
DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。
DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:24:42 GMT)
Perceptual Visual Quality Assessment: Principles, Methods, and Future Directions [82.0] 知覚的視覚品質評価(PVQA)は、人間の知覚に基づいてマルチメディアコンテンツの品質を評価することに焦点を当てる。
PVQAプロセスには、画像、ビデオ、VR、ポイントクラウド、メッシュ、マルチモダリティなど、さまざまなマルチメディアコンテンツの特徴が含まれている。
従来の画像やビデオに加えて、没入型マルチメディアと生成型人工知能(GenAI)のコンテンツについても論じている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:28:12 GMT)
ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos [82.0] 我々は人間のビデオから視覚に基づくポリシー学習を改善するためにViViDexを提案する。
最初は強化学習と軌道誘導報酬を使って、各ビデオに対する州ベースのポリシーを訓練する。
次に、州ベースのポリシーから成功したエピソードをロールアウトし、特権情報を使用しずに統一された視覚ポリシーをトレーニングします。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:26:22 GMT)
Learning to Animate Images from A Few Videos to Portray Delicate Human Actions [80.6] 少数のビデオから人間の行動をアニメーション化するための学習課題について検討する。
動き特徴とフレーム間対応関係を整列させることにより、動きの一般化を改善するFLASHを提案する。
実験により、FLASHは、目に見えない人間やシーンの外観の画像を、特定のアクションに効果的に一致させることが示されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:09:45 GMT)
Jointly Understand Your Command and Intention:Reciprocal Co-Evolution between Scene-Aware 3D Human Motion Synthesis and Analysis [80.5] シーン認識型テキスト対人間合成は、同じテキスト記述から多様な屋内動作サンプルを生成する。
そこで本研究では,テキスト駆動型シーン特異的なヒューマンモーション生成を3段階に分解するケースドジェネレーション戦略を提案する。
我々は3次元シーンにおけるリアルな人間の動き合成と頑健な人間の動き解析を共同で改善する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:56:58 GMT)
OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference [80.4] オープンソースのマルチモーダル大規模言語モデル(MLLM)の最近の進歩は,基礎的能力の向上に重点を置いている。
OmniAlign-Vは,多彩な画像,複雑な質問,さまざまな応答形式を含む200Kの高品質なトレーニングサンプルのデータセットである。
実験の結果,OmniAlign-Vを用いたMLLMの微調整は,SFT(Supervised Fine-Tuning)やDPO(Direct Preference Optimization)を用いることで,人間の嗜好のアライメントを著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:09:28 GMT)
FitDiff: Robust monocular 3D facial shape and reflectance estimation using Diffusion Models [79.7] 拡散型3次元顔アバター生成モデルFitDiffを提案する。
本モデルでは,「近距離」2次元顔画像から抽出したアイデンティティ埋め込みを利用して,再現性のある顔アバターを高精度に生成する。
FitDiffは、顔認識の埋め込みを前提とした最初の3D LDMであり、一般的なレンダリングエンジンで使用可能な、ライティング可能な人間のアバターを再構築する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:24:56 GMT)
Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.6] テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。
本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:21:58 GMT)
Towards Multiple Character Image Animation Through Enhancing Implicit Decoupling [77.1] 文字画像アニメーションのための新しい多条件ガイドフレームワークを提案する。
我々は、モデルが暗黙的に疎結合する能力を高めるために、よく設計された入力モジュールをいくつか採用する。
本手法は,特に複雑な背景と複数の文字のシナリオにおいて,高品質なキャラクタアニメーションの生成に優れる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:24:04 GMT)
POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding [76.7] POGEMAは、学習のための高速環境、問題インスタンスジェネレータ、可視化ツールキットを含む、総合的なツールセットである。
また、プライマリ評価指標に基づいて計算されるドメイン関連メトリクスの範囲を規定する評価プロトコルを導入し、定義する。
この比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含む。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:24:22 GMT)
How Deep is Love in LLMs' Hearts? Exploring Semantic Size in Human-like Cognition [75.1] 本研究では,大言語モデル (LLM) が意味的サイズを理解する上で類似した傾向を示すかどうかを検討する。
以上の結果から,マルチモーダルトレーニングはLLMにとって人間的な理解を深める上で不可欠であることが示唆された。
最後に,LLMが実世界のWebショッピングシナリオにおいて,より大きなセマンティックサイズを持つ注目の見出しに影響されているかを検討する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:35:56 GMT)
Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection [74.0] 本稿では,リモートセンシングオブジェクト検出において,大きなストリップ畳み込みが優れた特徴表現学習者であることを示す。
我々はStrip R-CNNと呼ばれる,シンプルで効率的でパワフルなネットワークアーキテクチャを構築した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:41:19 GMT)
Mixture of Parrots: Experts improve memorization more than reasoning [72.4] 専門家の数が増えるにつれて、推論能力が飽和している間に記憶性能が一貫して向上することを示す。
専門家の増加は知識集約的なタスクの解決に役立ちますが、推論タスクには同じようなメリットが得られません。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:53:04 GMT)
How to Probe: Simple Yet Effective Techniques for Improving Post-hoc Explanations [69.7] ポストホック重要属性法は、ディープニューラルネットワーク(DNN)を"説明"するための一般的なツールである
この研究において、我々はこの概念に挑戦する経験的証拠を提示する。
トレーニング済みモデルの分類レイヤのトレーニング詳細が重要な役割を果たすことを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:25:11 GMT)
Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy [68.5] GemBenchは視覚言語ロボット操作ポリシーの一般化能力を評価するための新しいベンチマークである。
LLMのタスク計画機能と3D-LOTUSの動作計画機能を統合するフレームワークである3D-LOTUS++を提案する。
3D-LOTUS++はGemBenchの新しいタスクで最先端のパフォーマンスを実現し、ロボット操作の一般化のための新しい標準を設定している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:11:10 GMT)
Hype, Sustainability, and the Price of the Bigger-is-Better Paradigm in AI [67.6] AIパラダイムは、科学的に脆弱なだけでなく、望ましくない結果をもたらすものだ、と私たちは主張する。
第一に、効率の改善にもかかわらず、その計算要求はモデルの性能よりも速く増加するため、持続可能ではない。
第二に、健康、教育、気候などの重要な応用は別として、他人を犠牲にして特定の問題に焦点をあてることである。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:02:55 GMT)
3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning [65.4] エンボディエージェントのための新しい3Dシーンメモリフレームワークである3D-Memを提案する。
3D-Memは、シーンを表現するために、Memory Snapshotsと呼ばれる情報的なマルチビューイメージを使用している。
さらに、Frontier Snapshots-glimpsの未探索領域対応エージェントを導入して、情報的な意思決定を行うことによって、フロンティアベースの探索をさらに統合する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:44:28 GMT)
GraphBridge: Towards Arbitrary Transfer Learning in GNNs [65.0] GraphBridgeは、GNNの異なるタスクやドメイン間での知識伝達を可能にする新しいフレームワークである。
予測ヘッドと入力を出力層に接続するブリッジングネットワークを備えた、事前訓練されたGNNの拡張を可能にする。
これらのシナリオを代表する16以上のデータセットで実施された実証検証では、タスクとドメインに依存しないトランスファー学習のためのフレームワークの能力が確認されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:10:27 GMT)
SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal [65.0] SORRY-Benchは、安全でないユーザ要求を認識し拒否する大規模言語モデル(LLM)能力を評価するためのベンチマークである。
まず、既存の手法では、安全でないトピックの粗い分類を使い、いくつかのきめ細かいトピックを過剰に表現している。
第二に、プロンプトの言語的特徴とフォーマッティングは、様々な言語、方言など、多くの評価において暗黙的にのみ考慮されているように、しばしば見過ごされる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:45:36 GMT)
Heavy-Tailed Linear Bandits: Huber Regression with One-Pass Update [63.0] ヘビーテール付きバンディットには、ヘビーテール付きノイズ、トランケーション、中央値の2つの基本戦略が導入されている。
本稿では,オンラインミラー降下フレームワークに基づくEmphone-passアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:41:45 GMT)
Reinforcement learning with combinatorial actions for coupled restless bandits [62.9] 提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。
我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:25:21 GMT)
ABC: Achieving Better Control of Multimodal Embeddings using VLMs [61.4] ビジュアル埋め込みモデルは、ビジュアル検索や分類のようなゼロショットタスクで優れている。
既存のCLIPベースのアプローチでは、イメージとテキストを独立して埋め込み、結果を融合する。
本稿では,視覚言語モデルバックボーンを用いたオープンソースのマルチモーダル埋め込みモデルABCを紹介する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:29:02 GMT)
MoDeGPT: Modular Decomposition for Large Language Model Compression [59.4] 本稿では,新しい構造化圧縮フレームワークである textbfModular bfDecomposition (MoDeGPT) を紹介する。
MoDeGPTはTransformerブロックを行列対からなるモジュールに分割し、隠れた次元を減らす。
本実験では, 後方伝播を伴わないMoDeGPTが, 従来の圧縮手法と一致するか, あるいは超えていることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:19:07 GMT)
DADM: Dual Alignment of Domain and Modality for Face Anti-spoofing [58.6] マルチモーダル・フェイス・アンチ・スプーフィング (FAS) が顕著な研究対象となっている。
相互情報に基づくモダリティ間のアライメントモジュールを提案する。
サブドメイン超平面とモダリティ角マージンの両方を整列する双対アライメント最適化法を用いる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:12:00 GMT)
Language Guided Skill Discovery [56.8] 言語ガイドスキル発見(LGSD)を導入し,スキル間の意味的多様性を最大化する。
LGSDはユーザープロンプトを入力として取り、セマンティックなスキルのセットを出力する。
本研究は,LGSDにより,単にプロンプトを変更するだけで,手足のロボットが平面上の異なるユーザ意図のエリアを訪問できることを実証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:07:31 GMT)
Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.5] Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:42:55 GMT)
G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.5] ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:02:47 GMT)
Compositional Entailment Learning for Hyperbolic Vision-Language Models [54.4] 画像とテキストのペアを超えて、双曲的埋め込みの自然的階層性を完全に活用する方法を示す。
双曲型視覚言語モデルのための構成的包摂学習を提案する。
数百万の画像テキストペアで訓練された双曲型視覚言語モデルに対する経験的評価は、提案手法が従来のユークリッドCLIP学習より優れていることを示している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:43:36 GMT)
ViBiDSampler: Enhancing Video Interpolation Using Bidirectional Diffusion Sampler [54.0] 現在の画像とビデオの拡散モデルは、単一のフレームからビデオを生成するのに強力だが、2フレーム条件付き生成に適応する必要がある。
我々は,これらのオフマンド問題に対処するために,広範囲な再ノイズや微調整を必要とせずに,新しい双方向サンプリング戦略を導入する。
提案手法では,それぞれ開始フレームと終了フレームに条件付き前方経路と後方経路の両方に沿って逐次サンプリングを行い,中間フレームの整合性を確保した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:27:28 GMT)
Instructional Segment Embedding: Improving LLM Safety with Instruction Hierarchy [53.5] LLM(Large Language Models)は、セキュリティや安全性の脅威を受けやすい言語である。
これらの脆弱性の大きな原因の1つは、命令階層の欠如である。
本稿では,BERTにインスパイアされた命令セグメント埋め込み(ISE)技法を,現代の大規模言語モデルに導入する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:06:35 GMT)
Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.4] コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:01:02 GMT)
ET-Former: Efficient Triplane Deformable Attention for 3D Semantic Scene Completion From Monocular Camera [53.2] 本稿では,単一単眼カメラを用いたセマンティックシーン補完のための新しいエンドツーエンドアルゴリズムET-Formerを紹介する。
本手法は,単一のRGB観測からセマンティック占有マップを生成すると同時に,セマンティック予測のための不確実性推定を行う。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:48:48 GMT)
Zero-Shot Keyphrase Generation: Investigating Specialized Instructions and Multi-Sample Aggregation on Large Language Models [52.8] キーフレーズ生成(英: Keyphrase generation)とは、ある文書のキーフレーズを自動的に生成する、長期にわたるNLPタスクである。
本稿では,オープンソースの命令調整型LDM (Phi-3, Llama-3) のゼロショット機能と,このタスクのためのクローズドソース GPT-4o に着目した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:38:57 GMT)
dyAb: Flow Matching for Flexible Antibody Design with AlphaFold-driven Pre-binding Antigen [52.8] 治療抗体の開発は、抗原が抗体とどのように相互作用するかの正確な予測に大きく依存している。
抗体設計における既存の計算方法はしばしば、結合過程において抗原が実行されている重要なコンフォメーション変化を見落としている。
我々は、αFold2による予測を組み込んだ柔軟なフレームワークであるdyAbを導入し、前結合性抗原構造をモデル化する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:53:18 GMT)
MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [52.1] 病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:02:30 GMT)
LongCaptioning: Unlocking the Power of Long Video Caption Generation in Large Multimodal Models [52.1] 大規模マルチモーダルモデル (LMM) はビデオキャプションタスクにおいて例外的な性能を示した。
本稿では,長文ビデオの長文キャプション生成におけるLMMの限界について検討する。
階層的セマンティックアグリゲーションによる長文キャプションデータを合成するフレームワークであるLongCaption-Agentを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:06:59 GMT)
Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScore [51.7] 我々は,人文テキストがLLM生成テキストよりも文法的誤りを多く含んでいるという観察に基づく,シンプルで効果的なブラックボックスゼロショット検出手法を提案する。
実験結果から,本手法はゼロショット法や教師あり手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:19:12 GMT)
Class-Independent Increment: An Efficient Approach for Multi-label Class-Incremental Learning [49.7] 本稿では,MLCIL(Multi-label class-incremental Learning)問題に焦点をあてる。
マルチラベルサンプルに対して複数のクラスレベルの埋め込みを抽出する新しいクラス独立インクリメンタルネットワーク(CINet)を提案する。
クラス固有のトークンを構築することで、異なるクラスの知識を学び、保存する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:40:52 GMT)
LongPO: Long Context Self-Evolution of Large Language Models through Short-to-Long Preference Optimization [49.4] LongPOはショート・ツー・ロングの嗜好データを利用して、ショート・コンテクストの機能をロング・コンテクストのタスクに転送する。
LongPOは短文性能を完全に保持し、長文タスクと短文タスクの両方において単純 SFT と DPO をほぼ上回っている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:02:07 GMT)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [49.0] 大規模言語モデル(LLM)のための最初の形式的確率的評価フレームワークを紹介する。
すなわち,モデルの出力分布に関する確率保証の高い新しい指標を提案する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:51:16 GMT)
JudgeLM: Fine-tuned Large Language Models are Scalable Judges [48.1] 大規模言語モデル(LLM)をオープンなシナリオで評価することは、既存のベンチマークやメトリクスがそれらを包括的に測定できないため、難しい。
本稿では,拡張性のある審査員 (JudgeLM) としてLLMを微調整し,LLMを効率よく,かつ効率的に評価する手法を提案する。
我々は7B,13Bから33Bパラメータの異なるスケールでJiceLMを訓練し、その能力と振る舞いを体系的に分析する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:06:43 GMT)
Cheems: A Practical Guidance for Building and Evaluating Chinese Reward Models from Scratch [48.0] リワードモデル(RM)は、大きな言語モデルと人間の嗜好の整合に不可欠である。
CheemsBenchは、中国の文脈における完全な人間によるRM評価ベンチマークである。
CheemsPreferenceは、人間と機械のコラボレーションを通じて注釈付けされた大規模で多様な好みデータセットである。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:23:31 GMT)
Towards Understanding the Benefit of Multitask Representation Learning in Decision Process [47.6] 強化学習(RL)におけるサンプル効率向上のための多タスク表現学習(MRL)が主流となっている。
本研究は,テキストを未知の非線形表現に拡張し,そのメカニズムを網羅的に分析することで,そのギャップを埋めようとしている。
我々は、この手法が、M$別のタスクを学習する際の下位境界よりも優れており、一般関数クラスにおけるMRLの有効性の最初の実証となることを正式に証明する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:29:22 GMT)
IGL-Bench: Establishing the Comprehensive Benchmark for Imbalanced Graph Learning [47.3] IGL-Benchは、不均衡グラフ学習のための包括的なベンチマークである。
ノードレベルおよびグラフレベルのタスクにおける有効性、堅牢性、効率性の観点から、最先端のIGLアルゴリズムについて検討する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:35:37 GMT)
Octopus: Alleviating Hallucination via Dynamic Contrastive Decoding [46.4] LVLM(Large Vision-Language Models)は、視覚コンテンツ理解とマルチモーダル推論において、優れた性能を得た。
これらのモデルは、深刻な幻覚の問題に悩まされ、製造された応答を生成する傾向がある。
我々は,モデルが幻覚のタイプを適応的に識別し,動的CDワークフローを作成することのできる,シンプルで効果的なOctopusライクなフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:00:34 GMT)
Differential Coding for Training-Free ANN-to-SNN Conversion [45.7] スパイキングニューラルネットワーク(SNN)は、その低エネルギー消費のために大きな可能性を秘めている。
ニューラルネットワーク(ANN)をSNNに変換することは、高性能なSNNを実現するための効率的な方法である。
本稿では, ANN-to-SNN変換の差分符号化について紹介する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:17:35 GMT)
Offline Reinforcement Learning with Domain-Unlabeled Data [45.7] ロボット工学において、正確なシステム識別は、展開の一部としてのみ実行される可能性がある。
我々は、少数のラベル付きターゲットドメインデータを持つ新しいオフラインRL設定である、Positive-Unlabeled Offline RL (PUORL)を考える。
提案手法は,目標領域のサンプルを正確に同定し,動的シフトがかなり大きい場合でも高い性能を実現する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:09:19 GMT)
CoT2Align: Cross-Chain of Thought Distillation via Optimal Transport Alignment for Language Models with Different Tokenizers [45.6] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる最先端のパフォーマンスを実現するが、高い計算コストとメモリ制約のためにデプロイメントの課題に直面している。
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する、有望なソリューションである。
CoT2Alignは,Chain-of-Thought(CoT)拡張を統合した普遍的なKDフレームワークであり,Cross-CoTアライメントを導入して推論伝達を強化する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:17:50 GMT)
XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning [45.0] 我々は,XLand-MiniGrid環境に基づくテキスト内強化学習のための大規模データセットであるXLand-100Bを提案する。
これには3万ドル近いさまざまなタスクのための完全な学習履歴が含まれており、100ドルの移行と2.5億ドルのエピソードをカバーしている。
データセットの収集には5万時間のGPUが必要だった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:36:02 GMT)
Adversarial Attacks on Event-Based Pedestrian Detectors: A Physical Approach [45.0] この研究は、イベント駆動型歩行者検出器に対する物理的敵攻撃を初めて調査した。
本稿では,2次元テクスチャ最適化問題として,デジタルドメインにおけるエンド・ツー・エンドのテクスチャ・フレームワークを構築した。
以上の結果から,デジタル領域で同定されたテクスチャは強い対角特性を有することが明らかとなった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:06:52 GMT)
GenVDM: Generating Vector Displacement Maps From a Single Image [44.8] VDM(Vector Displacement Map)の作成法について紹介する。
1つの入力画像が与えられた場合、まずマルチビューの正規写像を生成し、次に新しい再構成パイプラインを通して正規写像からVDMを再構成する。
また、3DオブジェクトからVDMを抽出する効率的なアルゴリズムを提案し、最初の学術的VDMデータセットを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:11:18 GMT)
V2X-R: Cooperative LiDAR-4D Radar Fusion for 3D Object Detection with Denoising Diffusion [43.6] 我々は、LiDAR、カメラ、および4Dレーダを取り入れた初のシミュレーションV2XデータセットであるV2X-Rを提案する。
V2X-Rには12,079のシナリオがあり、LiDARと4Dレーダーポイント雲の37,727フレーム、150,908の画像、170,859の注釈付き3D車両バウンディングボックスがある。
本稿では,3次元物体検出のための新しいコラボレーティブLiDAR-4Dレーダ融合パイプラインを提案し,様々な融合戦略を用いて実装する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:36:44 GMT)
Going Beyond Feature Similarity: Effective Dataset distillation based on Class-aware Conditional Mutual Information [43.4] 本稿では,データセットのクラス認識複雑性を評価するために,条件付き相互情報(CMI)を導入する。
合成データセットのクラス認識複雑性を制約しながら,蒸留損失を最小限に抑える。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:24:41 GMT)
LLaMA-Omni: Seamless Speech Interaction with Large Language Models [43.3] LLaMA-Omniは、大規模言語モデルとの低レイテンシで高品質な音声インタラクションのために設計された新しいモデルアーキテクチャである。
事前訓練された音声エンコーダ、音声適応器、LLM、ストリーミング音声デコーダを統合する。
レスポンスレイテンシは226ms以下で、コンテンツとスタイルの両方でより優れたレスポンスを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:59:49 GMT)
Latent Action Priors for Locomotion with Deep Reinforcement Learning [42.6] 深層強化学習(DRL)は、ロボットが環境との相互作用を通じて複雑な行動を学ぶことを可能にする。
本稿では,特にトルク制御に有用な移動学習のための帰納バイアスを提案する。
エージェントは実演の報酬レベルに制限されず、転送タスクの性能は大幅に向上する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:12:55 GMT)
Functional multi-armed bandit and the best function identification problems [42.5] 本稿では,機能的マルチアームバンディット問題 (FMAB) と機能同定問題の2つの新しいクラスを提案する。
これらの問題クラスは、競争力のあるLLMトレーニングのような現実世界の問題をモデリングするのに驚くほど適しています。
本稿では, 既知収束率を持つ非線形最適化アルゴリズムに基づく, UCB型アルゴリズム, すなわちF-LCBアルゴリズムを構築するための新しい削減手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:28:52 GMT)
Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation [40.9] メタスタブルマルコフプロセスとしてチェーン・オブ・シント(CoT)生成による推論時間計算について検討する。
スパースエッジに報酬を与える検索プロトコルの実装は、異なるクラスタに到達するための期待するステップ数を減らし、CoTを改善することを実証する。
また,検索によって得られる情報を利用して,より優れた推論モデルが得られることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:27:24 GMT)
Understanding the Capabilities and Limitations of Weak-to-Strong Generalization [40.8] 弱強一般化に関する理論的知見を提供する。
弱いモデルは強力な一般化性能を示し、よく校正された予測を維持するべきである。
我々は、Charikar et al. (2024) の業績を、Kullback-Leibler の発散に基づく損失関数に拡張する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:45:16 GMT)
Adaptive Rank Allocation for Federated Parameter-Efficient Fine-Tuning of Language Models [40.7] 本稿では,パラメータ効率の高い言語モデルの微調整のための新しい適応ランクアロケーションフレームワークであるFedARAを提案する。
FedARAは、ヘテロジニアスなデータの下で、さまざまなデータセットやモデルに対して平均6.95%から8.49%のベースラインを一貫して上回っている。
各種エッジデバイスの実験では、それぞれ48.90%、46.95%のトレーニング時間とエネルギー消費が大幅に減少している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:30:25 GMT)
Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions [39.2] 検索・レコメンデーション(S&R)を伴う複雑なシステムにおけるユーザエクスペリエンス向上の課題は、学術と産業の両方から大きな注目を集めている。
本稿では,新しいマルチモーダル情報検索データセット,すなわちQilinを提案する。
データセットはXiaohongshuから収集されている。Xiaohongshuは3億人の月間アクティブユーザーがいて、平均的な検索浸透率は70%を超えている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:15:00 GMT)
Semantic Integrity Constraints: Declarative Guardrails for AI-Augmented Data Processing Systems [39.2] セマンティック・インテリティ・制約(SIC)を導入し、AI拡張データ処理システム内の意味演算子を制御・最適化する。
SICはリレーショナルモデルにシームレスに統合され、ユーザーは制約の共通クラスを指定できる。
我々の研究は、信頼できる高性能なAIデータ処理のための基盤となるフレームワークとしてSICを確立している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:59:25 GMT)
Computationally Efficient RL under Linear Bellman Completeness for Deterministic Dynamics [39.1] 線形ベルマン完全設定に対する計算的および統計的に効率的な強化学習アルゴリズムについて検討する。
この設定では線形関数近似を用いて値関数をキャプチャし、線形マルコフ決定プロセス(MDP)や線形二次レギュレータ(LQR)のような既存のモデルを統一する。
我々の研究は、線形ベルマン完全設定のための計算効率の良いアルゴリズムを提供し、大きなアクション空間、ランダムな初期状態、ランダムな報酬を持つMDPに対して機能するが、決定論的となる基礎となる力学に依存している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:16:22 GMT)
Revisiting Prefix-tuning: Statistical Benefits of Reparameterization among Prompts [36.9] 本研究では,大規模事前学習モデルの微調整のためのプロンプトベース手法の理論的基礎について検討する。
再パラメータ化は単なる工学的トリックではなく、深い理論的基礎に根ざしていることを示す。
本研究は,プロンプトベース手法の理解を深める上で,理論的および経験的貢献を提供するものである。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:18:23 GMT)
Surveying the Landscape of Image Captioning Evaluation: A Comprehensive Taxonomy, Trends and Metrics Analysis [35.7] 本稿では,70以上の画像キャプション指標の初回調査と分類について,数百の論文で紹介する。
提案された指標の多様性にもかかわらず、ほとんどの研究は、人間の評価と弱い相関を示す5つの一般的な指標に頼っている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:40:09 GMT)
NeuroSymAD: A Neuro-Symbolic Framework for Interpretable Alzheimer's Disease Diagnosis [35.5] NeuroSymADは、ニューラルネットワークとシンボリック推論を相乗化するための、ニューロシンボリックなフレームワークである。
ニューラルネットワークは脳のMRIスキャンを受理し、大きな言語モデルは医療規則を蒸留し、生体マーカーや医療史を推論して象徴的なシステムを導く。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:29:39 GMT)
Communication-Efficient Device Scheduling for Federated Learning Using Lyapunov Optimization [35.3] フェデレートラーニング(FL)は、データを集中的に収集することなく、分散データ上で機械学習モデルのトレーニングを可能にする便利なツールである。
FLを制約された無線環境にデプロイする場合、接続性、断続的な接続品質、および非i.d.データは、機械学習モデルのトレーニングを著しく遅くする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:30:56 GMT)
MMKE-Bench: A Multimodal Editing Benchmark for Diverse Visual Knowledge [35.3] 本稿では,MultiModal Knowledge Editing Benchmark であるMMKE-Benchを紹介する。
LMMが現実世界のシナリオで様々な視覚的知識を編集する能力を評価するように設計されている。
ビジュアルエンティティ編集、ビジュアルセマンティック編集、ユーザー固有の編集という3種類の編集タスクが組み込まれている。
知識は2,940点、画像は8,363点、評価質問は自動的に生成され、人間による検証が行われる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:16:00 GMT)
Using Machine Learning for move sequence visualization and generation in climbing [35.2] 本研究では,岩盤の移動シーケンス評価のための可視化ツールを開発した。
次に,3つの異なるトランスフォーマーモデルを用いて,単純なホールドシーケンス情報からの移動シーケンス予測について検討する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:50:36 GMT)
CREAM: Consistency Regularized Self-Rewarding Language Models [34.3] 自己回帰型大規模言語モデル (LLM) は, 優先データに対する人間のアノテーションを必要とせずに, LLM-as-a-Judge を用いてアライメント性能を向上させることに成功した。
しかし、報酬とランキングの正確性は保証されていないため、精度の高い報酬と高品質な選好データを保証するのに不可欠である。
本稿では,各イテレーション間の報酬の整合性を活用し,自己回帰訓練を規則化する一貫性正規化sElf-rewarding lAnguage Model(CREAM)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:03:21 GMT)
BodyGen: Advancing Towards Efficient Embodiment Co-Design [33.1] エボディメントの共同設計は、ロボットの形態と制御ポリシーを同時に最適化することを目的としている。
設計と制御の両方にトポロジを意識した自己アテンションを利用するBodyGenを提案する。
Bodyは最先端のベースラインに対して平均60.03%のパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:25:42 GMT)
Synergy Between Sufficient Changes and Sparse Mixing Procedure for Disentangled Representation Learning [32.5] アンタングル表現学習は、観測データの背後にある潜伏変数を明らかにすることを目的としている。
いくつかのアプローチは、ドメインインデックスのような補助変数によって示される潜伏変数の分布に十分な変化に依存する。
本稿では,分散変化とスパース混合過程に関する制約の少ない識別可能性理論を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:21:37 GMT)
BadJudge: Backdoor Vulnerabilities of LLM-as-a-Judge [31.8] 本稿では, LLM-as-a-Judge評価体制に対する新たなバックドア脅威を提案する。
評価者トレーニングデータの1%を単一のトークンバックドア中毒が、正当性スコアに対して相手のスコアを3倍にする。
評価者のトレーニングデータの10%を中毒にすることで、有害なプロンプトを非毒性の89%と誤分類するために毒性審査員(ガードレール)を制御し、RAGの文書再検査官は、その97%を最初に有毒な文書にランク付けした。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:35:01 GMT)
What Makes a Good Diffusion Planner for Decision Making? [31.7] 我々は6000以上の拡散モデルのトレーニングと評価を行い、ガイド付きサンプリング、ネットワークアーキテクチャ、アクション生成、計画戦略などの重要なコンポーネントを特定した。
拡散計画における従来の手法とは逆のデザイン選択によって、実際に性能が向上することが判明した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:31:14 GMT)
Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings [31.3] 我々は、異なる人間のテンプレート間でモデルを識別できるスキルベースのベンチマークを導入する。
4つのテンプレートと4つのT2Iモデルにまたがって人間の評価を収集し、合計100Kのアノテーションを作成します。
既存の指標よりも人間の評価と相関した新しいQAベースの自動評価指標を導入する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:41:18 GMT)
Collective Neutrino Oscillations in Three Flavors on Qubit and Qutrit Processors [31.2] 集団ニュートリノのフレーバー振動は、核崩壊型超新星のダイナミックな進化とその後の地球観測を理解する上で最も重要なものである。
我々は3つのフレーバーすべてに量子ビットと量子ビットのエンコーディングを提供し、時間発展のための最適化された量子回路を開発し、トロッター誤差を解析する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:25:25 GMT)
QA-Calibration of Language Model Confidence Scores [31.0] 生成的質問・回答システムは、十分な信頼性スコアを提供する必要がある。
既存の校正法は、信頼スコアが平均*であることを保証することを目的としており、答えが正しい可能性を示している。
QA-calibrationを導入し、異なる問合せグループ間の校正を確実にする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:32:14 GMT)
How to Steer LLM Latents for Hallucination Detection? [30.0] 本稿では、推論中に表現空間を再評価し、真理と幻覚の出力を分離するステアリングベクトルを提案する。
我々の2段階のフレームワークは、まず、ラベル付き例題の小さなセットでSVを訓練し、コンパクトで分離されたクラスタを形成します。
その後、ラベルなしのLLM世代で模範集合を拡張し、疑似ラベル付けに最適なトランスポートベースのアルゴリズムと信頼に基づくフィルタリングプロセスを組み合わせた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:19:34 GMT)
Rehearse With User: Personalized Opinion Summarization via Role-Playing based on Large Language Models [29.9] 大きな言語モデルは、長いテキストを含むパーソナライズされたタスクにおいて困難に直面します。
モデルがユーザとして機能することで、モデルはユーザのパーソナライズされたニーズをよりよく理解できます。
提案手法は,大規模モデル生成サマリーにおけるパーソナライズレベルを効果的に向上させることができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:05:01 GMT)
SolidMark: Evaluating Image Memorization in Generative Models [29.7] メモリ化の評価に用いられるメトリクスとその緩和技術が,データセット依存バイアスに悩まされていることを示す。
以下に示すのは、$rm stylefont-variant: small-capsSolidMark$, a novel evaluation method that provide a-image memorization score。
また、$rm stylefont-variant: small-capsSolidMark$は、きめ細かいピクセルレベルの記憶を評価できることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:14:51 GMT)
MERIT: Multi-view evidential learning for reliable and interpretable liver fibrosis staging [29.5] 本稿では,MERITと呼ばれる顕在的学習に基づく新しいマルチビュー手法を提案する。
MERITは、予測の不確実性を可能とし、信頼性を高め、論理ベースの組み合わせルールを用いて解釈性を向上させる。
その結果、提案したMERITの有効性を示し、信頼性を強調し、アドホックとポストホックの両方の解釈性を提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:07:59 GMT)
Unlocking Efficient, Scalable, and Continual Knowledge Editing with Basis-Level Representation Fine-Tuning [29.2] 大規模言語モデル (LLM) は様々な自然言語処理において顕著な性能を発揮している。
静的コーパスでトレーニングされ、その知識は急速に変化する世界で急速に時代遅れになる。
以前の取り組みでは、LLMの特定の層に少量のパラメータを更新しようと試みていた。
本研究では,様々な種類の知識を適応的に管理し,より優れた編集・局所性トレードオフを実現するため,BaFTを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:34:44 GMT)
Reducing Large Language Model Safety Risks in Women's Health using Semantic Entropy [29.1] 大型言語モデル (LLM) は幻覚と呼ばれる誤りや誤解を招く出力を生成する。
難易度などの不確実性を定量化する伝統的な手法は、誤報につながる意味レベルの不整合を捉えることに失敗する。
我々は,新たな不確実性指標であるセマンティックエントロピー(SE)を評価し,AI生成医療内容の幻覚を検出する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:57:52 GMT)
CL-MoE: Enhancing Multimodal Large Language Model with Dual Momentum Mixture-of-Experts for Continual Visual Question Answering [27.8] 連続視覚質問応答 (VQA) のためのMLLMs-based dual momentum Mixture-of-Experts (CL-MoE) フレームワークを提案する。
MLLMと連続学習を統合し,LLMの豊富なコモンセンス知識を活用する。
提案手法は,10VQAタスクにおける最先端性能を実現し,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:25:23 GMT)
Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation [27.8] 既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
我々は,クエリ効率の良いオンラインブラックボックスターゲット生成のための,新規でシンプルなアルゴリズムである$textbfFast Direct$を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:39:47 GMT)
PodAgent: A Comprehensive Framework for Podcast Generation [27.5] PodAgentはポッドキャストのようなオーディオプログラムを作成するためのフレームワークである。
ホスト-ゲスト-ライター・マルチエージェント協調システムの設計により、情報的トピック・ディスカッションコンテンツを生成する。
適切な音声ロールマッチングのための音声プールを構築し、LLM強化音声合成法を用いて、表現力のある会話音声を生成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:35:17 GMT)
HybridLinker: Topology-Guided Posterior Sampling for Enhanced Diversity and Validity in 3D Molecular Linker Generation [27.4] リンカー生成は鉛最適化やPROTAC設計といった薬物発見の応用において重要である。
既存の手法は3Dポイントクラウド(PC)を利用したPCフリーとPCアウェアのカテゴリに分類される
事前学習したPC-フリーモデルから多様な結合トポロジをガイダンスとして提供することにより,PC-Aware推論を強化するフレームワークであるHybridLinkerを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:25:36 GMT)
Semantic Operators: A Declarative Model for Rich, AI-based Data Processing [27.3] 我々は、宣言型および汎用AIベースの変換のための最初の定式化である意味演算子を紹介する。
セマンティックフィルタリング,ジョイン,グループバイ,トップk操作を最大1000ドルまで高速化する新しい最適化を提案する。
セマンティック・オペレーター・モデルは表現力があり、いくつかのオペレーター・コールで最先端のAIパイプラインをキャプチャする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:47:51 GMT)
Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference [27.2] 我々は各文にスコアを割り当て、中間粒度の報酬モデルを導入することを提案する。
すべての文のスコアを応答レベルスコアに集約する新しい注意機構が導入された。
提案手法はRewardBench上で応答レベル報酬モデルを2.7%向上させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:11:04 GMT)
MCNet: Monotonic Calibration Networks for Expressive Uncertainty Calibration in Online Advertising [27.1] オンライン広告では、不確実性のキャリブレーションは、ランキングモデルの確率予測を調整し、イベントの真の可能性をよりよく近似することを目的としている。
既存のキャリブレーションアプローチは、複雑な非線形関係をモデル化し、コンテキストの特徴を考慮し、異なるデータサブセット間でバランスの取れた性能を達成する能力に欠ける可能性がある。
我々はモノトニックネットワークと呼ばれる新しいモデルを紹介し、モノトニックキャリブレーション関数、順序保存正規化器、フィールドバランス正規化器の3つの重要な設計を特徴とする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:54:58 GMT)
A Unified Framework for Heterogeneous Semi-supervised Learning [26.9] Heterogeneous Semi-Supervised Learning (HSSL) と呼ばれる新しい問題設定を導入する。
HSSLは、半教師付き学習(SSL)タスクと教師なしドメイン適応(UDA)タスクをブリッジすることで、ユニークな課題を提示している。
本稿では,HSSLに対処するための新しい手法であるUnified Framework for Heterogeneous Semi-supervised Learning (Uni-HSSL)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:32:02 GMT)
Balance Reward and Safety Optimization for Safe Reinforcement Learning: A Perspective of Gradient Manipulation [26.2] 探索中の報酬と安全の間のトレードオフを管理することは、大きな課題である。
本研究では,勾配操作の理論を活用することによって,この矛盾する関係に対処することを目的とする。
実験の結果,提案アルゴリズムは報酬のバランスと安全性の最適化の観点から,最先端のベースラインよりも優れていた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:27:26 GMT)
GS-CPR: Efficient Camera Pose Refinement via 3D Gaussian Splatting [25.8] 本稿では,新しいテストタイムカメラ・ポーズ・リファインメント(CPR)フレームワーク,GS-CPRを提案する。
このフレームワークは、最先端の絶対ポーズ回帰とシーン座標回帰法の局所化精度を高める。
3DGSモデルは高品質な合成画像と深度マップを描画し、2D-3D対応の確立を容易にする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:23:19 GMT)
FCoReBench: Can Large Language Models Solve Challenging First-Order Combinatorial Reasoning Problems? [25.4] 一階推論問題は、様々なサイズの無限個の問題インスタンスでインスタンス化することができる。
課題40のデータセットであるFCoReBenchと,さまざまなサイズの問題インスタンスを生成し,そのソリューションを自動検証して生成するスクリプトを提案する。
本稿では,LLMとシンボルソルバとプログラムインタプリタを組み合わせたSymPro-LMを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:46:25 GMT)
Retrieval-Augmented Generation for Natural Language Processing: A Survey [25.1] 検索強化世代(RAG)は、外部知識データベースを活用して大規模言語モデル(LLM)を拡張する
本稿では,RAGの重要技術,特に検索器と検索融合について概説する。
RAGの評価とベンチマーク、および代表的NLPタスクおよび産業シナリオにおけるRAGの適用。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:23:07 GMT)
Homomorphism Expressivity of Spectral Invariant Graph Neural Networks [25.0] スペクトル不変なGNNは、並列木と呼ばれる特定の木のようなグラフのクラスを正確に成すことができることを証明している。
我々の結果はArvind et al. (2024) を著しく拡張し、オープンな疑問を解決した。
我々は解析を高次GNNに一般化し、Zhangらによって提起されたオープンな質問に答える(2024年)。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:23:49 GMT)
Intelligence at the Edge of Chaos [24.9] ルールベースのシステムの複雑さが、これらのルールを予測するために訓練されたモデルの能力にどのように影響するかを検討する。
以上の結果から,複雑性の高いルールは,より優れたインテリジェンスを示すモデルにつながることが判明した。
我々は、知性は複雑さを予測する能力から生じ、知性を生み出すには複雑さにのみ暴露する必要があると推測する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:21:09 GMT)
Deep Change Monitoring: A Hyperbolic Representative Learning Framework and a Dataset for Long-term Fine-grained Tree Change Detection [24.8] 既存のデータセットは、低解像度の画像と高い取得コストのために、ツリーの連続的なきめ細かい変更をキャプチャできない。
UAVTCは,カメラを備えたUAVを用いて収集した大規模,長期,高解像度のデータセットである。
本稿では, 動的木変化のコンパクトかつ階層的な表現を可能にする, TC検出のための新しいハイパーボリック・シームズ・ネットワーク(HSN)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:29:29 GMT)
Discrete Codebook World Models for Continuous Control [24.7] 強化学習(RL)では、世界モデルは内部シミュレータとして機能し、エージェントが環境力学と将来の成果を予測することができる。
離散潜在状態のモデリングは、連続潜在状態よりも利点があり、離散コードブックエンコーディングは、連続制御においてより効果的な表現であることを示す。
我々はDCWM: Discrete Codebook World Modelを紹介した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:58:44 GMT)
Rapid morphology characterization of two-dimensional TMDs and lateral heterostructures based on deep learning [23.7] 本研究では,2次元材料,特にMoS2-MoSe2の側面ヘテロ構造とMoS2フレークの形状と厚さの変化を特徴付ける深層学習手法を提案する。
YOLOモデルを利用することで、これらの材料を識別する精度は94.67%以上となる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:51:32 GMT)
RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation [23.6] 本稿では,ロボット拡散変換器(RDT)について述べる。
RDTは、マルチモーダリティを効果的に表現するために拡散モデルを構築し、スケーラブルトランスフォーマーの革新的な設計である。
さらに,様々なロボットの動作表現を統一する物理解釈可能な統一行動空間を導入する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:57:15 GMT)
How Useful is Continued Pre-Training for Generative Unsupervised Domain Adaptation? [23.5] 生成型UDAにおけるCPT(Continuoused Pre-Training)の有用性について検討した。
以上の結果から,下流の課題を暗黙的に学習し,その課題に有意なマスク付き単語を予測できることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:39:28 GMT)
UniGaussian: Driving Scene Reconstruction from Multiple Camera Models via Unified Gaussian Representations [23.3] 運転シーンで魚眼カメラを効果的にシミュレートする方法は、未解決の問題である。
複数のカメラモデルから統一された3次元ガウス表現を学習する新しいアプローチであるUniGaussianを提案する。
我々のアプローチは、複数のセンサー(ピンホールと魚眼カメラ)とモード(深度、意味、正常、LiDAR点雲)をモデル化する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:05:39 GMT)
Periodic Materials Generation using Text-Guided Joint Diffusion Model [23.1] TGDMatは3次元周期材料生成のために設計された新しいテキスト誘導拡散モデルである。
提案手法は,各段階での文章記述を通じて,グローバルな構造的知識を統合する。
実験の結果,TGDMatは既存のベースライン法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:56:44 GMT)
Efficiently Editing Mixture-of-Experts Models with Compressed Experts [22.9] 完全エキスパートのコンパクト表現として機能する軽量モジュールである圧縮された専門家の概念を提案する。
我々のアプローチは、他の補助活性化専門家を圧縮専門家に置き換えながら、最も重要な専門家を保護します。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:00:03 GMT)
FlashMask: Efficient and Rich Mask Extension of FlashAttention [22.8] FlashMaskはFlashAttentionの拡張であり、アテンションマスクのカラム単位のスパース表現を導入している。
この新しい表現を採用することで、FlashMaskは長いコンテキストシーケンスのモデリングに適した線形メモリ複雑性$O(N)$を達成する。
SFT, LoRA, DPO, RMなどのLLMの微調整およびアライメント訓練におけるFlashMaskの性能を評価する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:33:37 GMT)
CFSum: A Transformer-Based Multi-Modal Video Summarization Framework With Coarse-Fine Fusion [22.6] CFSumは、粗い微細融合を伴うトランスフォーマーベースのマルチモーダルビデオ要約フレームワークである。
CFSumはビデオ、テキスト、オーディオのモーダル機能を入力として利用し、2段階のトランスフォーマーベースの機能融合フレームワークを組み込んでいる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:13:13 GMT)
RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization [22.5] RainbowPOはキーコンポーネントを7つの方向に分類する統合フレームワークである。
RainbowPOは既存のDPOよりも優れていることを実証する。
我々は、研究者が新しいDPO手法の開発を指導し、実践者を支援するための洞察を提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:02:01 GMT)
Policy Design in Long-Run Welfare Dynamics [21.2] 我々は、最も要求の高い政策を優先するラウルシアン政策(Rawlsian policy)と、即時福祉利益を最大化する実用政策(utilitarian policy)という2つの主要な政策枠組みの長期的ダイナミクスを分析する。
我々は、ラウルシの政策に従う介入が、たとえ後者が短期的に支配的であったとしても、長期的には実用主義政策よりも優れていることを証明している。
本研究は,福祉政策を設計・評価する上での長期的地平の検討の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:50:57 GMT)
Scalable Reinforcement Learning for Virtual Machine Scheduling [21.2] クラスタ値分解強化学習(CVD-RL)
本稿では,クラスタ値分解強化学習(CVD-RL)と呼ばれるスケーラブルなRLフレームワークを紹介する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:33:52 GMT)
R2-T2: Re-Routing in Test-Time for Multimodal Mixture-of-Experts [21.1] 大規模マルチモーダルモデル(LMM)では、非言語的モダリティ(視覚表現など)の知覚は通常、大きな言語モデル(LLM)と同等ではない。
本稿では,テスト時間における経路重みのベクトルを局所的に最適化する,新しい効率的な手法であるRe-Routing in Test-Time (R2-T2)を提案する。
R2-T2は、ベースモデルパラメータを訓練することなく、様々なタスクのベンチマークに挑戦する上で、最先端のLMMの性能を一貫して大幅に改善する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:17:00 GMT)
OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking [20.7] 既存の多用途透かしアプローチは、タンパーの局所化精度と視覚的品質のトレードオフに悩まされている。
オムニガード(OmniGuard)は、能動的埋め込みと受動的、視覚的抽出を統合した新しい多目的透かし手法である。
コンテナ画像のPSNRは4.25dB、ノイズ条件ではF1スコアは20.7%、平均ビット精度は14.8%である。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:23:05 GMT)
Brain Foundation Models: A Survey on Advancements in Neural Signal Processing and Brain Discovery [20.6] 脳基礎モデル(BFM)は、計算神経科学における変革的パラダイムとして登場した。
BFMは大規模な事前学習技術を活用し、複数のシナリオ、タスク、モダリティを効果的に一般化することができる。
本稿では,BFMを初めて定義し,これらのモデルを様々なアプリケーションで構築・活用するための明確かつ簡潔なフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:12:50 GMT)
Dissecting the Impact of Model Misspecification in Data-Driven Optimization [20.4] データ駆動最適化は、推定コストの決定を最適化することで、機械学習モデルを意思決定に変換することを目的としている。
より最近のアプローチでは、推定誤差の代わりに決定誤差を最小限に抑える推定最適化統合を採用している。
我々は、基礎となるモデルが誤って特定されたときに、トップ2の後悔の言葉に「統合アプローチが普遍的な二重利益をもたらす」ことを示します。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:31:54 GMT)
SPA: 3D Spatial-Awareness Enables Effective Embodied Representation [20.1] 具体的AIにおける3次元空間認識の重要性を強調する新しい表現学習フレームワークであるSPAを紹介する。
本研究では,8つのシミュレータにまたがる268のタスクを網羅し,これまでで最も包括的な表現学習の評価を行った。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:51:38 GMT)
Post-training an LLM for RAG? Train on Self-Generated Demonstrations [20.0] 大規模言語モデル(LLM)は知識集約型NLPタスクとしばしば競合する。
検索拡張生成(RAG)は、モデルがコンテキスト内情報を利用することを可能にする。
自己生成型実演を用いたRAG対応LDMの学習法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:33:01 GMT)
Leveraging Vision Language Models for Specialized Agricultural Tasks [19.7] 本稿では,植物ストレス表現におけるビジョン言語モデルの能力を評価するためのベンチマークであるAgEvalを紹介する。
本研究は,ドメイン固有のタスクに対して汎用的なVLMをどのように活用できるかを,いくつかの注釈付き例で検討する。
以上の結果から,VLMの特殊タスクへの適応性は,F1スコアが46.24%から73.37%に向上した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:16:08 GMT)
A MIMO Wireless Channel Foundation Model via CIR-CSI Consistency [19.7] 本稿では,チャネル状態情報(CSI)とチャネルインパルス応答(CIR)を自然に整列したマルチモーダルデータとして扱う。
CIRとCSIの両方の結合表現を効果的にキャプチャすることで、CSI-CLIPはシナリオ間で顕著な適応性を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:07:25 GMT)
Instructor-Worker Large Language Model System for Policy Recommendation: a Case Study on Air Quality Analysis of the January 2025 Los Angeles Wildfires [19.6] ロサンゼルスの山火事における大気の質を調査するために,多エージェントの大規模言語モデルフレームワークを改良し,活用する。
我々は、インストラクタエージェントとWorkerエージェントからなるマルチエージェントの大規模言語システムを使用する。
本研究では,インストラクタ・ワークス LLM システムの健康基準を空気質に基づいて評価することにより,データに基づく政策推薦の能力をテストする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:29:26 GMT)
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity [19.0] BIOSCAN-5Mは、500万以上の昆虫の標本のマルチモーダル情報を含む包括的データセットである。
マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:03:47 GMT)
Towards Hierarchical Rectified Flow [19.0] 階層的な整流流を定式化し、データ分布をモデル化する。
我々は、既知のソース分布からデータ分布を生成する時間差分プロセスを経験的に定義する。
我々は,MNIST,CIFAR-10,ImageNet-32データとともに,合成1Dおよび2Dデータ上でこれを検証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:48:22 GMT)
Show Me Why It's Correct: Saving 1/3 of Debugging Time in Program Repair with Interactive Runtime Comparison [18.9] パッチの理解と比較を容易にするために,iFixと呼ばれる対話型アプローチを提案する。
iFixは静的解析を行い、バグギーステートメントに関連するランタイム変数を識別する。
パッチ毎に実行中のランタイム値をキャプチャし、実行時の動作を比較してコントラストすることができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:52:49 GMT)
Decoupling Content and Expression: Two-Dimensional Detection of AI-Generated Text [18.8] 我々は、AIリスクレベルの階層的なフレームワークであるHARTを紹介し、それぞれが検出タスクに対応する。
以上の結果から, コンテンツは表面変化に耐性があり, 検出の重要な特徴となる可能性が示唆された。
実験により、2D法は既存の検出器を著しく上回り、AUROCは0.705から0.849に、RAIDは0.807から0.886に改善された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:19:13 GMT)
High Dynamic Range Video Compression: A Large-Scale Benchmark Dataset and A Learned Bit-depth Scalable Compression Algorithm [18.7] 私たちはHDRVD2Kという大規模なHDRビデオベンチマークデータセットを最初に収集しました。
本稿では,HDRVD2Kをベースとして,HDRビデオのための最初の学習ビット深度スケーラブルビデオ圧縮(LBSVC)ネットワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:13:29 GMT)
Towards Continuous Reuse of Graph Models via Holistic Memory Diversification [18.7] 本稿では,より複雑なタスクを持つグラフの成長における漸進的学習の課題に対処する。
目標は、新しいタスクを処理するためにグラフモデルを継続的にトレーニングし、メモリリプレイによる以前のタスクの習熟性を維持することである。
既存の方法は、通常、以前のタスクから高品質なメモリを選択する際の制限として、メモリの多様性の重要性を見落としている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:18:00 GMT)
Generalization Bounds for Equivariant Networks on Markov Data [18.5] 我々は、マルコフデータセットでトレーニングされたニューラルネットワークの一般化を導出するために、新しいマクダイアルミドの不等式を導入する。
このバウンダリは、低次元既約表現の選択に関する実用的な洞察を提供し、固定幅同変ニューラルネットワークの一般化性能を向上させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:53:48 GMT)
Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning [18.2] 本稿では,複数の3次元シーン理解タスクを同時に扱うために,インスタンス対応3次元大規模マルチモーダルモデル(Inst3D-LMM)を提案する。
まず,MCMF(Multi-view Cross-Modal Fusion)モジュールを導入し,それに対応する幾何学的特徴に多視点2Dセマンティクスを注入する。
シーンレベルの関係対応トークンに対しては、オブジェクト間の複雑な対空間関係をキャプチャするための3次元インスタンス空間関係(3D-ISR)モジュールをさらに提示する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:38:42 GMT)
Synthetic data enables context-aware bioacoustic sound event detection [18.2] 本研究では,文脈内学習能力を向上させる基礎モデル学習手法を提案する。
我々は、8.8万時間以上の強いラベル付き音声を生成し、クエリ・バイ・サンプル・トランスフォーマー・ベース・モデルを用いて、バイオアコースティック・サウンド・イベントの検出を行う。
トレーニングされたモデルをAPIを通じて利用可能にすることで、生態学者や生態学者にバイオ音響音響イベント検出のためのトレーニング不要のツールを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:03:22 GMT)
Secure Aggregation in Federated Learning using Multiparty Homomorphic Encryption [18.0] 連合学習における重要な操作は、個々のクライアントノードによって生成される勾配ベクトルの集約である。
我々は,この集約を中央ノードが計算できるように,多党同型暗号(MPHE)に基づく手法を開発した。
我々は,クライアントノードのサブセットのみが利用可能であっても,集約ベクトルの復号化が成功するように,従来のMPHEメソッドを拡張した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:19:25 GMT)
LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation [17.9] 本稿では,自己回帰拡散モデルであるLayerDAGを導入し,リアル指向非巡回グラフ(DAG)を生成する。
ノードの部分順序を二部グラフのシーケンスとして解釈することにより、LayerDAGは、強いノード依存を順次処理可能な管理可能なユニットに分離する。
様々なコンピューティングプラットフォームからの合成および実世界のフローグラフに関する実験により、LayerDAGはより優れた統計特性とベンチマーク性能を持つ有効なDAGを生成することが示された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:44:51 GMT)
SelectFormer: Private and Practical Data Selection for Transformers [17.8] 本稿では,MPC(Multi-Party Computation)を用いたデータ選択の実用化について述べる。
提案手法は,MPC上での目標モデルを直接評価することにより,数千時間から数十時間までの遅延を低減し,選択したデータによるトレーニングから約0.20%の精度低下をみせる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:44:44 GMT)
Split Adaptation for Pre-trained Vision Transformers [17.3] 本稿では,データやモデルを保護しながら,効果的な下流適応を可能にする分割適応(SA)手法を提案する。
通常のSLとは異なり、SAはパラメータを低ビットの量子化値に置き換え、モデルの直接露光を防ぐ。
SAは、ノイズ注入が適応性能に与える影響を軽減するために、データレベルとモデルレベルのアウト・オブ・ディストリビューションの強化を取り入れている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:38:53 GMT)
TimeMixer++: A General Time Series Pattern Machine for Universal Predictive Analysis [17.1] 時系列解析は多くのアプリケーションにおいて重要な役割を担い、予測、分類、異常検出、計算などのタスクをサポートする。
本研究では,高機能な表現とパターン抽出機能を通じて,幅広い時系列タスクを最適化するモデルである時系列パターンマシン(TSPM)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:45:57 GMT)
Diffusing States and Matching Scores: A New Framework for Imitation Learning [16.9] 敵対的模倣学習は伝統的に、学習者と敵対的に選択されたコスト関数の間の2つのプレイヤーゼロサムゲームとしてフレーム化されている。
拡散モデルは、回帰を通じてスコア関数を訓練することだけを必要とするGANの非敵対的な代替品として登場した。
提案手法は, GANスタイルの模倣学習ベースラインと差別化なし模倣学習ベースラインの両方を, 連続制御問題に比較して優れていることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:13:38 GMT)
UltraFusion: Ultra High Dynamic Imaging using Exposure Fusion [16.9] 入力と9の差分をマージできる最初の露光融合技術であるUltraFusionを提案する。
私たちのモデルは、アライメントの潜在的な問題や照明のバリエーションに対して堅牢です。
提案手法は最新のHDRベンチマークにおいてHDR-Transformerより優れている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:44:03 GMT)
Evolution of Information in Interactive Decision Making: A Case Study for Multi-Armed Bandits [16.6] マルチアームバンディット問題のレンズによる対話型意思決定における情報の進化について検討する。
最適な成功確率と相互情報の分離が可能であり、最適学習を達成するためには、必ずしも情報の獲得を最大化する必要がなくなる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:01:41 GMT)
DFlow: Diverse Dialogue Flow Simulation with Large Language Models [16.2] 本稿では,合成対話の多様性を高めるための新しいデータシミュレーション手法を提案する。
我々は、15の異なる領域に3,886の対話フローからなるタスク指向対話データセットを生成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:22:15 GMT)
BGM2Pose: Active 3D Human Pose Estimation with Non-Stationary Sounds [16.1] BGM2Poseは、任意の音楽(例えば、バックグラウンド音楽)をアクティブなセンシング信号として利用する非侵襲的な人間のポーズ推定手法である。
本手法は人間の不快感を最小限に抑える自然音楽を利用する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:32:19 GMT)
Dual Process Learning: Controlling Use of In-Context vs. In-Weights Strategies with Weight Forgetting [15.7] 言語モデルは、文脈内学習(ICL)を実行する能力を持つ
言語モデルは、コンテキスト内で学習する能力があるにもかかわらず、目に見えないか、めったに見られないトークンに直面したときに苦労することが知られている。
本研究では,玩具モデル,マスク言語モデル,自己回帰言語モデルを用いて,合成タスクと自然主義タスクの両方に関する構造的インコンテキストアルゴリズムについて検討する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:42:10 GMT)
AesthetiQ: Enhancing Graphic Layout Design via Aesthetic-Aware Preference Alignment of Multi-modal Large Language Models [15.5] Aesthetic-Aware Preference Alignment (AAPA)はレイアウトインタフェースのためのMLLM(Multi-modal Large Language Model)をトレーニングする新しいテクニックである。
高品質なレイアウト上でのトレーニングを確実にするための,レイアウト品質予測プロトコルを利用したデータフィルタリングプロトコルを提案する。
我々は、CrelloとWebuiの2つの挑戦的なベンチマークに対して、我々のアプローチの有効性を実証し、17%、現在のState-of-The-Artメソッドよりも16の改善を示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:05:02 GMT)
Trajectory Inference with Smooth Schrödinger Bridges [15.4] Smooth "odinger Bridges" を導入した。
提案手法は,Schr"odinger Bridge問題における参照過程を滑らかなガウス過程とすることで,先行処理を一般化する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:12:01 GMT)
End-To-End Learning of Gaussian Mixture Priors for Diffusion Sampler [15.4] 学習可能な混合前駆体は、探索の制御を改善し、目標支援への適応性を高め、モード崩壊に対抗するために増強する。
実験結果から,様々な実環境および総合的なベンチマーク問題に対して,大幅な性能向上が得られた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:58:14 GMT)
NeuroLit Navigator: A Neurosymbolic Approach to Scholarly Article Searches for Systematic Reviews [15.3] NeuroLit Navigator' は、ドメイン固有の LLM と、MeSH (Messical Subject Headings) やUMLS (Unified Medical Language System) のような構造化知識ソースを組み合わせる。
この統合はクエリの定式化を強化し、検索語彙を拡張し、検索範囲を深くし、より正確な検索を可能にする。
NeuroLit Navigatorは、最初の文献検索に必要な時間を90%削減した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:11:24 GMT)
Limits of Deep Learning: Sequence Modeling through the Lens of Complexity Theory [15.2] 彼らの成功にもかかわらず、ディープラーニングモデルは複雑な推論と機能構成を必要とするタスクに苦しむ。
本研究では,SSM(Structured State Space Models)とTransformer(Transformer)の制約に関する理論的および実証的研究を行う。
信頼性の高い多段階推論と構成課題解決を実現するための革新的なソリューションの必要性を強調した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:07:04 GMT)
Towards High-fidelity 3D Talking Avatar with Personalized Dynamic Texture [15.0] 動的テクスチャが高忠実な発話アバターの描画において重要な役割を担っていることを示す。
我々は,100人の被験者の詳細な8Kダイナミックテクスチャを備えた,100分間の音声同期スキャンレベルメッシュからなる高解像度4DデータセットtextbfTexTalk4Dを提案する。
音声から顔の動きと動的テクスチャを同時に生成するフレームワーク textbfTexTalker を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:51:37 GMT)
A Conditional Independence Test in the Presence of Discretization [14.9] 既存のテストメソッドは、離散化された観察しかできない場合、機能しない。
このような離散化の存在に対応するために特別に設計された条件付き独立テストを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:00:10 GMT)
On the Saturation Effects of Spectral Algorithms in Large Dimensions [14.6] 本研究の主な焦点は,大規模なスペクトルアルゴリズムの飽和効果を大規模に検討することである。
飽和効果は, 原条件$s>tau$で, 固定次元設定では$s>2tau$で発生する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:21:38 GMT)
Solving Instance Detection from an Open-World Perspective [14.4] インスタンス検出(InsDet)は、与えられた視覚的参照に基づいて、新しいシーンイメージ内の特定のオブジェクトインスタンスをローカライズすることを目的としている。
本稿では,オープンワールドの観点からInsDetにアプローチし,その方法を提案する。
提案手法では, 距離学習と新たなデータ拡張を併用し, トラクタを陰例とし, 新規ビューインスタンスを合成し, 視覚的参照を豊かにする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:56:58 GMT)
Privacy-Aware Joint DNN Model Deployment and Partition Optimization for Delay-Efficient Collaborative Edge Inference [14.4] エッジ推論(EI)は、クラウドベースのDeep Neural Network(DNN)推論における遅延応答時間、スケーラビリティの制限、プライバシに関する問題に対処する上で、重要なソリューションである。
本稿では,資源およびプライバシ制約下での長期平均推論遅延を最小限に抑えるために,プライバシを意識した共同DNNモデルの配置と分割最適化のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:35:04 GMT)
Challenges in Testing Large Language Model Based Software: A Faceted Taxonomy [14.0] LLM(Large Language Models)とMulti-Agent LLM(MALLMs)は、従来の機械学習ソフトウェアとは異なり、非決定性を導入している。
本稿では, LLMテストケース設計の分類について, 研究文献, 経験, 実践状況を表すオープンソースツールの両面から報告する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:15:56 GMT)
Feature Averaging: An Implicit Bias of Gradient Descent Leading to Non-Robustness in Neural Networks [14.0] 勾配降下によって訓練されたニューラルネットワークは、分類に平均的な特徴に依存する傾向があることを示す。
勾配降下は、各隠れニューロンの重みがクラスター中心の平均を表す特徴平均化に偏りがあることを証明した。
我々は,2層ReLUネットワークが個々の特徴を分類する訓練を行う際に,最適なロバスト性を実現することを証明した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:06:51 GMT)
Tutorial Proposal: Speculative Decoding for Efficient LLM Inference [13.7] 投機的復号法(SD: Speculative Decoding)は、LLM推論高速化のための高度な手法である。
このチュートリアルでは、ドラフトモデルアーキテクチャや検証戦略など、SDの最新技術について詳しく説明している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:34:42 GMT)
Modulating CNN Features with Pre-Trained ViT Representations for Open-Vocabulary Object Detection [13.5] 我々は、textbfViT-Feature-textbfModulated Multi-Scale textbfConvolutional Network (VMCNet) と呼ばれる新しい2分岐バックボーンネットワークを提案する。
VMCNetは、トレーニング可能な畳み込みブランチ、凍結された事前トレーニングされたViTブランチ、VMCモジュールで構成される。
この混合構造により、検出器はより新しいカテゴリーの物体を発見する可能性が高くなる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:49:01 GMT)
Distributionally Robust Reinforcement Learning with Human Feedback [13.5] 大規模言語モデルを微調整するための分散ロバストなRLHFを提案する。
我々のゴールは、プロンプトの分布が著しく異なる場合でも、微調整モデルがその性能を維持することである。
我々は,学習した報酬モデルの精度を平均で向上し,推論などのタスクにおいて顕著に向上することを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:43:39 GMT)
SHAZAM: Self-Supervised Change Monitoring for Hazard Detection and Mapping [13.5] この研究は、危険検出とマッピングのためのSHAZAM - Self-Supervised Change Monitoringを提示する。
SHAZAMは軽量な条件付きUNetを使用して、その年のどの日でも関心のある領域のイメージを生成する。
修正された構造的類似度尺度は、生成された画像と実際の衛星観測を比較して、領域レベルの異常スコアとピクセルレベルのハザードマップを計算する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:45:46 GMT)
Full Scaling Automation for Sustainable Development of Green Data Centers [13.4] クラウドコンピューティングの急速な増加は、データセンターの二酸化炭素排出量の急激な増加をもたらした。
提案するフルスケーリング自動化(FSA)メカニズムは,ワークロードの変化に対応するために,動的にリソースを適用する効果的な方法である。
FSAは、ディープ表現学習の力を利用して、各サービスの将来のワークロードを正確に予測し、対応するターゲットCPU使用レベルを自動的に安定化する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:57:31 GMT)
Building Trust in Mental Health Chatbots: Safety Metrics and LLM-Based Evaluation Tools [13.4] 100のベンチマーク質問と理想的な回答を備えた評価フレームワークを作成しました。
このフレームワークはメンタルヘルスの専門家によって検証され、GPT-3.5ベースのチャットボットでテストされた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:49:53 GMT)
Nucleolus Credit Assignment for Effective Coalitions in Multi-agent Reinforcement Learning [13.2] 協調型マルチエージェント強化学習(MARL)では、エージェントは一般的に、複合タスクに取り組むためのクレジット割り当てに基づいて、単一の大連立を形成する。
本稿では,協調ゲーム理論に基づくヌクレオルスに基づくクレジット割り当てを提案し,エージェントを小さな連立に自律的に分割することを可能にする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:01:58 GMT)
An evaluation of DeepSeek Models in Biomedical Natural Language Processing [12.8] DeepSeekシリーズのモデルは、一般的なNLPタスクにおいて有望な可能性を示しているが、バイオメディカル領域におけるそれらの能力はいまだ探索されていない。
本研究は,12個のデータセットを用いて,4つの重要なNLPタスクにわたるDeepSeekモデルを評価した。
以上の結果から,DeepSeekモデルは名前付きエンティティ認識やテキスト分類において競合的に機能するが,高精度リコールトレードオフによるイベント抽出や関係抽出では課題が持続することが明らかとなった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:26:29 GMT)
Current-driven collective control of helical spin texture in van der Waals antiferromagnet [12.7] ヘリカル反強磁性体の電流制御の最初の実験的および理論的例を報告する。
平面内電流はスピン軌道トルクを生成し、その結果、ヘリカル反強磁性秩序と直接相互作用する。
この研究はヘリカル反強磁性体の電気的制御の理解を広げ、電気的制御のための興味深い材料プラットフォームとしてvdW量子磁石を推進している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:14:10 GMT)
Remasking Discrete Diffusion Models with Inference-Time Scaling [12.6] マスク付き拡散モデルに適用可能な手法であるリマスキー拡散モデル(ReMDM)を原則的に導入する。
最も興味深いことに、ReMDMは推論時間計算スケーリングの形で離散拡散を許容する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:37:51 GMT)
GaussianSeal: Rooting Adaptive Watermarks for 3D Gaussian Generation Model [12.5] 本稿では3DGS生成モデルのための最初のビット透かしフレームワークであるGaussianSealを提案する。
モデルの出力の忠実さを維持しながら、トレーニングオーバーヘッドを最小限に抑えた高精度ビットデコーディングを実現する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:16:05 GMT)
DATransNet: Dynamic Attention Transformer Network for Infrared Small Target Detection [12.3] 赤外線小目標検出(ISTD)は、民間や軍事用途で広く用いられている。
ISTDは、小さなターゲットと薄暗いターゲットが複雑な背景によって隠蔽される傾向など、いくつかの課題に直面している。
本研究では,小ターゲットに不可欠な詳細な情報を抽出し,保存する動的注意変換ネットワーク(DATransNet)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:31:31 GMT)
Sample Complexity of Linear Quadratic Regulator Without Initial Stability [12.0] ReINFORCEに触発されて、未知のパラメータを持つ線形二次レギュレータ(LQR)問題に対して、新しい回帰水平アルゴリズムを導入する。
従来の手法とは異なり、本アルゴリズムはサンプルの複雑さの順序を同じに保ちながら、2点勾配推定に依存することを回避している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:46:23 GMT)
Content-Style Learning from Unaligned Domains: Identifiability under Unknown Latent Dimensions [11.9] クロスドメインテクトitlatent Distribution Match (LDM) による新しい分析フレームワークを提案する。
我々は、潜伏変数の成分的独立性のような制限的な仮定を除去できることを示す。
我々は LDM の定式化を正規化マルチドメイン GAN ロスに再キャストし, 遅延変数を結合させた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:02:28 GMT)
QAEA-DR: A Unified Text Augmentation Framework for Dense Retrieval [11.6] 厳密な検索では、長いテキストを密度の高いベクトルに埋め込むと、情報が失われ、クエリとテキストのマッチングが不正確になる。
近年の研究では,文の埋め込みモデルや検索プロセスの改善を中心に研究が進められている。
本稿では,高密度検索のための新しいテキスト拡張フレームワークを導入し,生文書を高密度テキスト形式に変換する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:39:33 GMT)
Circuit Partitioning and Transmission Cost Optimization in Distributed Quantum Circuits [11.5] 本稿では,量子回路モデルに基づく分散量子コンピューティングにおける過度な通信複雑性の問題に焦点をあてる。
分散量子回路において、伝送コストなどの量子状態伝送の回数を減らすために、回路分割法を提案する。
実験により,提案手法は現行の回路分割法と比較して,実行時間が短いことを示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:45:17 GMT)
Scaling ResNets in the Large-depth Regime [11.4] Deep ResNetは、機械学習タスクで最先端の結果を達成するために認識されている。
Deep ResNetsは、勾配の消滅や爆発を避けるために慎重に設計する必要があるトレーニング手順に依存している。
この問題を緩和する方法については合意が得られていないが、広く議論されている戦略は、各レイヤの出力を$alpha_L$でスケーリングすることである。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:23:02 GMT)
Interacting with AI Reasoning Models: Harnessing "Thoughts" for AI-Driven Software Engineering [11.1] AI推論モデルの最近の進歩は、意思決定プロセスに前例のない透明性をもたらす。
ソフトウェアエンジニアには、AI生成されたすべての思考を詳細に分析、検証、解釈する時間や認知の帯域幅がほとんどありません。
本稿では,AI推論モデルとソフトウェアエンジニアのインタラクションを再構築し,信頼性,効率,意思決定力を最大化するためのビジョンを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:19:15 GMT)
RFWNet: A Lightweight Remote Sensing Object Detector Integrating Multi-Scale Receptive Fields and Foreground Focus Mechanism [11.0] 本研究では,RFWNet というマルチスケール受容場とフォアグラウンドフォーカス機構を組み込んだ,効率的かつ軽量なRSODアルゴリズムを提案する。
DOTA V1.0とNWPU VHR-10データセットの実験的評価は、RFWNetが6.0Mパラメータで高度なパーフォルマンスを達成し、52FPSを達成することを示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:02:15 GMT)
Streaming Video Question-Answering with In-context Video KV-Cache Retrieval [11.0] 我々は,効率的なストリーミングビデオ質問応答(StreamingVQA)を可能にするトレーニング不要な手法であるReKVを提案する。
提案手法は,長い動画をストリーミング形式で分析し,ユーザの問い合わせが受信されたら即座に応答することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:53:33 GMT)
Seeing A 3D World in A Grain of Sand [10.9] 本研究では,1台のカメラと8対の平面鏡を用いた動画像撮影システムの設計を行った。
本手法は,様々なミニチュアシーンにおける最先端性能を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:29:48 GMT)
CAT-3DGS: A Context-Adaptive Triplane Approach to Rate-Distortion-Optimized 3DGS Compression [10.9] 3D Gaussian Splatting (3DGS)は、最近、有望な3D表現として登場した。
リモート側への3DGS表現の圧縮と送信の必要性は見落としている。
この新しいアプリケーションは、レート歪みを最適化した3DGS圧縮を要求する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:42:52 GMT)
Stable and Accurate Orbital-Free DFT Powered by Machine Learning [10.8] ホーエンバーグとコーンは、電子エネルギーと1粒子の電子密度は、密度に関して機能するエネルギーを最小化することで得られることを示した。
QM9の有機分子に適用すると、化学的な精度でエネルギーを得ると同時に、有意義な電子密度に収束する密度関数が初めて得られる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:39:52 GMT)
Progressive Sparse Attention: Algorithm and System Co-design for Efficient Attention in LLM Serving [10.8] 本稿では,$underlineP$rogressive $underlineS$parse $underlineA$ttentionメカニズムを提案する。
アルゴリズムの革新とシステムの共同設計を統合し、大規模言語モデルにおいて高い推論精度と効率性の両方を達成する。
実験によると、PSAは注意計算のKVキャッシュ使用量を2.4$times$と8.8$times$に削減し、エンドツーエンドのサービススループットを1.4$times$と2.0$times$に向上する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:56:42 GMT)
More of the Same: Persistent Representational Harms Under Increased Representation [10.7] モデルがバイオグラフィーやペルソナを生成するように促された場合,女性は男性よりも表現力が高いことを示す。
この結果、表現的害、ステレオタイプ、新自由主義の理想が拡大する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:45:35 GMT)
TSDW: A Tri-Stream Dynamic Weight Network for Cloth-Changing Person Re-Identification [10.5] 衣服交換者再識別は、異なる時間空間シナリオで個人を特定するという課題を解決することを目的としている。
既存のReID研究は主に、顔認識、意味認識、衣服に関係のない特徴識別に頼っている。
本稿では,画像のみを必要とするTri-Stream Dynamic Weight Network (TSDW)を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:04:49 GMT)
The Hidden Cost of Waiting for Accurate Predictions [10.3] 予測精度は時間とともに向上するが、平均的なランキング損失は悪化する可能性がある。
この現象の原動力は不平等である。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:50:11 GMT)
Lasso Bandit with Compatibility Condition on Optimal Arm [10.2] 文脈特徴のスパース部分のみが期待される報酬関数に影響を及ぼすような疎線型バンドイット問題を考える。
本稿では,強制サンプリング手法を適用したアルゴリズムを提案し,提案アルゴリズムが$O(textpolylog dT)$ regretを達成したことを証明した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:33:54 GMT)
Nonperturbative Open Quantum Dynamics Bypass Influence Functional [10.1] 正確な開量子力学への順序モーメントアプローチが提示され、ファインマン=ヴァーノンの函数形式論をバイパスする。
階層的な運動方程式はウィックの収縮を用いて構成され、これは浴場の生成と消滅演算子の特定の順序に従う。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:06:42 GMT)
U-NIAH: Unified RAG and LLM Evaluation for Long Context Needle-In-A-Haystack [9.8] 本稿では,Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)を体系的に比較する統一フレームワークであるU-NIAHを紹介する。
本フレームワークでは,複数のニードル,長いニードル,ニードルの設定を,異なる検索設定とともに組み込んでいる。
以上の結果から,RAGはロスト・イン・ザ・ミドル効果を緩和し,ロバスト性を向上させることにより,より小さなLCMを著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:05:24 GMT)
Never too Prim to Swim: An LLM-Enhanced RL-based Adaptive S-Surface Controller for AUVs under Extreme Sea Conditions [9.7] 大規模言語モデル(LLM)強化学習(RL)に基づくAUV用適応S面制御
マルチモーダルおよび構造化された明示的なタスクフィードバックを用いることで、LLMは共同調整を可能にし、複数の目的をバランスさせ、タスク指向のパフォーマンスと適応性を高める。
提案したコントローラでは、RLポリシは、S面コントローラが制御信号に変換するタスク指向の高レベルコマンドを出力する、上層タスクに重点を置いている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:01:50 GMT)
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter [9.6] 投機的復号化は,軽量な投機的ドラフトモデルを活用することで,Large Language Model (LLM)推論を高速化する強力な手法である。
近年の手法では、多段階のトレーニング戦略を採用することでこの問題の解決が試みられているが、異なるトレーニングステップの複雑な入力によって、ドラフトモデルを収束させるのが難しくなっている。
投機的起草における精度と効率を両立させる新しいフレームワークであるCORALを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:13:45 GMT)
Unbiased Video Scene Graph Generation via Visual and Semantic Dual Debiasing [9.4] ビデオシーングラフ生成(VidSGG)は、映像フレームを逐次解析し、視覚情報と意味情報を統合することによって、エンティティ間の動的関係をキャプチャすることを目的としている。
本稿では,ビジュアル・セマンティック・アウェアネス(VISA)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:31:02 GMT)
A Multi-modal Approach to Dysarthria Detection and Severity Assessment Using Speech and Text Information [9.2] 本研究は、音声とテキストのモダリティを両立させる新しいアプローチを提案する。
本手法は,クロスアテンション機構を用いて,音声とテキスト表現の音響的・言語的類似性を学習する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:29:27 GMT)
A Computational Framework for Modeling Emergence of Color Vision in the Human Brain [9.1] 脳がどのようにして色覚を受信した視神経信号から純粋にデコードするかは謎である。
眼と大脳皮質の両方をシミュレートすることで、人間の色覚の出現をモデル化するための計算フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:41:22 GMT)
Pseudo-Knowledge Graph: Meta-Path Guided Retrieval and In-Graph Text for RAG-Equipped LLM [8.9] Pseudo-Knowledge Graph (PKG)フレームワークはメタパス検索、イングラフテキスト、ベクトル検索を大規模言語モデルに統合する。
PKGはより豊かな知識表現を提供し、情報検索の精度を向上させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:39:37 GMT)
LABOR-LLM: Language-Based Occupational Representations with Large Language Models [8.9] CAREERは、キャリア履歴の関数として労働者の次の仕事を予測する。
本稿では,履歴書に基づく基礎モデルを大規模言語モデルに置き換える方法を検討する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:10:03 GMT)
URO-Bench: A Comprehensive Benchmark for End-to-End Spoken Dialogue Models [8.9] 音声対話モデル(SDM)の広範なベンチマークであるURO-Benchを提案する。
URO-BenchはS2Sベンチマークで、多言語主義、多ラウンド対話、パラ言語学の評価をカバーしている。
ベンチマークは、基本トラックとプロトラックの2つの難易度に分類され、それぞれ16と20のデータセットで構成されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:14:44 GMT)
Asymptotic Theory of Eigenvectors for Latent Embeddings with Generalized Laplacian Matrices [8.9] 依存は新しいランダムマトリックス理論の 主要なボトルネックです
一般化ラプラシア行列(ATE-GL)を用いた潜伏埋め込みのための固有ベクトルの新しい枠組みを提案する。
提案するATE-GLフレームワークのいくつかの応用について論じ、いくつかの数値例を通してその妥当性を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:22:42 GMT)
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts [8.8] Mixture-of-experts (MoE) は、大規模な言語モデルを1兆以上のパラメータに拡張するために広く利用されている。
既存の方法は、オーバーラップする計算でMoE層内の通信をパイプライン化することを提案している。
細粒度通信-計算オーバラップを最適化したMOEシステムであるCOMETを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:21:52 GMT)
Explainable LiDAR 3D Point Cloud Segmentation and Clustering for Detecting Airplane-Generated Wind Turbulence [8.7] そこで本研究では,光検出とランキング(LiDAR)データを用いて効率的なウェイク渦検出を行う,高度な機械学習手法を提案する。
本研究の新たな特徴は、モデルの決定過程を明確にする摂動に基づく説明手法を使用することである。
リアルタイムの覚醒渦追跡のためのセマンティックセグメンテーションとクラスタリングの組み合わせは、航空安全対策を大幅に前進させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:51:31 GMT)
Multi-models with averaging in feature domain for non-invasive blood glucose estimation [8.5] 本論文は、血糖値の異なる範囲に基づいて、血糖推定を行うための異なるモデルを用いている。
提案手法は,芸術的手法と比較して,推定精度を効果的に向上させることができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:25:51 GMT)
DashCop: Automated E-ticket Generation for Two-Wheeler Traffic Violations Using Dashcam Videos [8.3] 自動電子タバコ生成のためのエンドツーエンドシステムであるDashCopを提案する。
このシステムは、車載のダッシュカムビデオを処理して、二輪車の交通違反を検出する。
本システムでは, 広範囲な評価により, 違反検出の大幅な改善が示された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:10:06 GMT)
Consensus Capacity of Noisy Broadcast Channels [8.2] コンセンサスとの通信は、放送チャンネルが埋め込まれた場合にのみ可能であり、自然な「共通チャンネル」である。
放送チャンネルに「共通チャンネル」が埋め込まれた場合にのみ、コンセンサスとの通信が可能であることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:33:20 GMT)
Image Matching Filtering and Refinement by Planes and Beyond [8.2] 本稿では,画像マッチングにおけるスパース対応のフィルタリングと精細化のためのモジュール型非深度学習手法を提案する。
提案手法は, 標準データセットと画像マッチングパイプラインで広く評価され, 最先端のアプローチと比較される。
実験の結果,提案した非深層学習の幾何学的アプローチは,最近の最先端のディープラーニング手法に匹敵する,あるいは同等な性能を達成できることが示された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:29:09 GMT)
Efficient quantum tomography of a polynomial subspace [8.2] 直接忠実度推定(DFE)に基づく部分量子トモグラフィー法を開発した。
本研究は, 様々な状態に対して, 利用可能な測定値の異なるセットを用いて, このアプローチの効率性について検討する。
この方法は、制限された力学を持つ量子系を特徴づけるなど、多くの状況で応用できる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:09:02 GMT)
Cauchy Random Features for Operator Learning in Sobolev Space [8.2] 理論的保証と誤り境界を持つランダムな特徴演算子学習法を提案する。
カーネルベースの手法やニューラルネットワーク手法と比較して、提案手法は類似またはより良いテスト誤差を得ることができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:14:25 GMT)
CATS: A framework for Cooperative Autonomy Trust & Security [8.1] 本稿では、評価に基づく最も優れた特徴と過半数に基づく検出機構を融合した自動システムCATSを紹介する。
現実的な交通データを用いた都市規模シミュレーションによる評価は、誤動作車両の迅速同定および分離におけるCATSの有効性を示している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:18:40 GMT)
TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning [8.0] 大きな言語モデル(LLM)は、人間のアノテーションに大きく依存することによる課題に直面することが多い。
この作業では、強化学習(RL:Reinforcement Learning)へと方向転換します。
我々はRLを用いて、微調整だけで十分である基礎的な命令データセットを直接生成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:25:49 GMT)
PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery [7.8] 我々はPinLandingを紹介します。PinLandingは、プラットフォームがトピックコレクションを作成する方法を変える、コンテンツファーストアーキテクチャです。
本システムでは,属性抽出のための視覚言語モデル(VLM)とトピック生成のための大規模言語モデル(LLM)と,正確なコンテンツマッチングのためのCLIPベースのデュアルエンコーダアーキテクチャを用いる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:55:28 GMT)
SegImgNet: Segmentation-Guided Dual-Branch Network for Retinal Disease Diagnoses [7.8] 網膜疾患診断のためのセグメンテーション誘導型デュアルブランチネットワークであるSegImgNetを提案する。
SegImgNetにはセグメンテーションモジュールが組み込まれており、網膜画像から多スケールの網膜構造の特徴マップを生成する。
パブリックAIROGSデータセットとプライベートe-ROPデータセットを用いてSegImgNetを評価した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:56:45 GMT)
Efficient Prompting for Continual Adaptation to Missing Modalities [7.8] 動的欠落モード問題を連続学習課題として定式化する。
モータリティ特化プロンプト,タスク認識,タスク特化プロンプトの3種類を紹介する。
これらのプロンプトにより、モデルはモダリティ内、モダリティ間、タスク内、タスク間の特徴を学ぶことができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:09:37 GMT)
Decoding Game: On Minimax Optimality of Heuristic Text Generation Strategies [7.6] 我々は,テキスト生成をストラテジストとネイチャーの2プレイヤーゼロサムゲームとして再定義する,包括的な理論的枠組みであるデコードゲームを提案する。
逆数自然は可能性に対して暗黙の正則化を課し、トラルニケーション正規化法は、この正則化の下での最適戦略の第一次近似である。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:16:51 GMT)
xIDS-EnsembleGuard: An Explainable Ensemble Learning-based Intrusion Detection System [7.3] 我々は、先進的な説明可能な侵入検知システム(xIDS)を設計することで、ネットワーク内の悪意ある攻撃を検出することの課題に対処することに注力する。
既存の機械学習とディープラーニングアプローチには、予測の潜在的なバイアス、解釈可能性の欠如、トレーニングデータに過度に適合するリスクなど、目に見えない制限がある。
本稿では,これらの課題を克服するためのアンサンブル学習手法"EnsembleGuard"を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:49:31 GMT)
Characterizing the mixed eigenstates in kicked top model through the out-of-time-order correlator [7.1] 固有状態のタイプがOTOCの短期的および長期的挙動にどのように反映されるかを示す。
我々は、OTOCの力学が混合固有状態の指標として利用できると推測する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:05:40 GMT)
Characterizing the Lipkin-Meshkov-Glick excited spectrum through the quantum coherence spectrum [7.1] 我々は、多重量子コヒーレンススペクトルを、リプキン-メシュコフ-グリックモデルの枠組み内で励起状態量子相転移を探索する有効なツールとして用いる。
多重量子コヒーレンススペクトルの時間依存性と時間平均は、量子多体系の励起スペクトルにおける特異点の存在に由来する複雑なダイナミクスを明らかにする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:58:11 GMT)
Safety Tax: Safety Alignment Makes Your Large Reasoning Models Less Reasonable [7.1] 安全アライメントは、大規模言語モデルが公式にデプロイされる前に重要な手順である。
シーケンシャルなLRM生産パイプラインでは、推論と安全性のトレードオフがあることが示されている。
副産物として、安全アライメントのための代替データセットとして機能する、DirectRefusalと呼ばれるデータセットをキュレートします。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:42:01 GMT)
ICPE: An Item Cluster-Wise Pareto-Efficient Framework for Recommendation Debiasing [7.1] そこで本研究では,クラスタ単位の多目的最適化の観点から,推薦の偏りの中心的テーマについて検討する。
トレーニングプロセスで人気が異なるさまざまなアイテムクラスタ上での学習のバランスをとることを目的とした,モデルに依存しないフレームワークであるItem Cluster-Wiseを提案する。
より詳しくは、推奨モデルが人気が異なるすべてのアイテムクラスタのバランスをとるべきであるとして、アイテムクラスタの最適化ターゲットを定義します。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:46:43 GMT)
Balancing Accuracy and Efficiency for Large-Scale SLAM: A Minimal Subset Approach for Scalable Loop Closures [7.1] 本稿では,ループ閉鎖に最も影響の大きい優越性を用いてポーズグラフを構築するオンラインサンプリング手法を提案する。
各種公開データセットの評価結果から,提案手法は位置認識における偽陽性率の低減に優れることが示された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:17:25 GMT)
ReX: A Framework for Incorporating Temporal Information in Model-Agnostic Local Explanation Techniques [6.9] 機械学習モデルに時間情報を統合するフレームワークであるtextscReXを提案する。
我々は、Anchors、LIME、Kernel SHAPの3つの一般的な説明手法にアプローチをインスタンス化する。
評価の結果,本手法は説明の忠実度を著しく向上させることが示された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:56:20 GMT)
Enhanced Predictive Capability for Chaotic Dynamics by Modified Quantum Reservoir Computing [6.8] 本稿では,カオス行動の予測を推し進めるためのアプローチを提案する。
我々のアプローチは、新しい量子貯水池計算スキームと見なすことができる。
私たちの仕事は、カオスシステムを扱うための新しい道の道を開くものです。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:10:35 GMT)
A new practical and effective source-independent full-waveform inversion with a velocity-distribution supported deep image prior: Applications to two real datasets [6.8] フルウェーブフォームインバージョン(Full-waveform Inversion, FWI)は、高分解能地下物理パラメータを再構成するための高度な技術である。
ソースの不確実性と振幅依存性を軽減することを目的としたFWIのための相関に基づくソース非依存目的関数を提案する。
ベンチマーク速度モデルと2つの実データからの合成データを用いて,提案手法の優位性を実証した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:15:43 GMT)
Model Editing as a Robust and Denoised variant of DPO: A Case Study on Toxicity [6.8] 本稿では,無調音アライメントの代替であるProFSを導入し,毒性低減のユースケースでその効果を実証する。
ProFSはモデルパラメータ空間内の有毒な部分空間を特定し、検出された部分空間を投影することでモデル毒性を低減する。
我々は, ProFS が DPO よりもサンプリング効率が高いことを示し,さらにノイズの多いデータに対するロバスト性を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:35:47 GMT)
Self-Normalized Resets for Plasticity in Continual Learning [6.6] SNR(Self-Normalized Resets)は、ニューロンの重みをリセットすることで可塑性損失を緩和する適応アルゴリズムである。
我々は,SNRが競合するアルゴリズムと比較して常に優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:34:01 GMT)
LoR2C : Low-Rank Residual Connection Adaptation for Parameter-Efficient Fine-Tuning [6.5] 本稿では,LoR2Cと呼ばれるパラメータ効率の高いファインチューニング手法を提案する。
LoR2Cはモデル層内の低ランク行列との残差接続を導入している。
複数の自然言語理解および自然言語生成タスクの実験結果は、LoR2Cとその最適化された変種がパラメータのオーバーヘッドを著しく減少させることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:42:57 GMT)
Robust Multi-Objective Preference Alignment with Online DPO [6.4] 多目的選好アライメントは、パーソナライズ可能で、有用で、安全であるAIシステムの開発に不可欠である。
既存のアプローチは、トレーニングに計算コストがかかるか、モデル動作を十分に制御できないかのいずれかである。
本稿では,多目的オンラインDPOアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:01:49 GMT)
MobileViM: A Light-weight and Dimension-independent Vision Mamba for 3D Medical Image Analysis [6.4] この原稿は3次元医用画像の効率的なセグメンテーションのための合理化アーキテクチャであるMobileViMを提示する。
我々は,視覚マンバを基盤とした新しい次元非依存機構と二方向トラバースアプローチを考案した。
これらの拡張により、MobileViMは1つのグラフィックス処理ユニットで毎秒90フレームを超えるセグメンテーション速度を達成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:42:44 GMT)
Modification and Generated-Text Detection: Achieving Dual Detection Capabilities for the Outputs of LLM by Watermark [6.4] 1つの実用的な解決策は、透かしをテキストに埋め込むことで、透かし抽出によるオーナシップの検証を可能にする。
既存の手法は主に修正攻撃に対する防御に重点を置いており、しばしば他の偽造攻撃を無視している。
本研究では, 修正に敏感な不偏形透かしに対して, テキスト中の修正を検出する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:14:12 GMT)
A Review of Brain-Computer Interface Technologies: Signal Acquisition Methods and Interaction Paradigms [6.3] Brain-Computer Interface (BCI)技術は、人間の脳と外部デバイスとの直接通信を容易にする。
このレビューでは、古典的パラダイム、現在の分類、ハイブリッドパラダイムなど、さまざまなBCIパラダイムを詳細に分析する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:22:47 GMT)
Self-supervision via Controlled Transformation and Unpaired Self-conditioning for Low-light Image Enhancement [6.3] 撮像装置が捉えた現実世界の低照度画像は視認性が悪く、成果物のない出力を生成するためには、ドメイン固有の拡張が必要である。
本稿では,新しい制御されたトランスフォーメーションベースの自己スーパービジョンと未ペアの自己コンディショニング戦略を活用した,未ペアの低照度画像強調ネットワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:25:49 GMT)
Theoretical Exploration of Phase Transitions in a Cavity-BEC System with Two Crossed Optical Pumps [6.1] 光学キャビティ内のボース・アインシュタイン凝縮と2つの交差コヒーレントポンプ場を考える。
通常の超流動相と超放射相を分離する位相境界を決定する。
魅力的な格子の場合、2つのポンプ格子電位が等しく増加すると、通常の位相から超放射相への遷移が誘導される。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:42:51 GMT)
Prompting Medical Large Vision-Language Models to Diagnose Pathologies by Visual Question Answering [6.1] 本稿では,幻覚を減らし,VQA性能を向上させるMLVLMの2つのプロンプト戦略を提案する。
MIMIC-CXR-JPGおよびChexpertデータセットを用いて検討したところ,診断精度は有意に向上した。
POPE測定値に基づいて、既存のLVLMの偽陰性予測を効果的に抑制し、リコールを約0.07改善する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:14:00 GMT)
Real-Time Personalization with Simple Transformers [6.0] 単純な変換器は複雑なユーザの好みを捉えることができる。
そこで我々は,単純な変換器に基づく推薦タスクを高速に最適化するアルゴリズムを開発した。
本アルゴリズムは, 準線形時間における準最適性能を実現する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:29:33 GMT)
Cross-Attention Fusion of MRI and Jacobian Maps for Alzheimer's Disease Diagnosis [6.0] アルツハイマー病分類におけるsMRI強度とJSM由来の変形の関係をモデル化するクロスアテンション融合フレームワークを提案する。
ROC-AUCスコアはAD対認知正常(CN)、0.692は軽度認知障害(MCI)、CNは平均0.903である。
性能は高いが、我々のモデルは依然として非常に効率的であり、パラメータはわずか156万で、ResNet-34 (63M) と Swin UNETR (61.98M) の40倍以上である。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:50:46 GMT)
DeepONet Augmented by Randomized Neural Networks for Efficient Operator Learning in PDEs [5.8] 精度と効率のバランスをとるために設計されたハイブリッドアーキテクチャであるRaNN-DeepONetsを提案する。
RaNN-DeepONetsは計算コストを桁違いに削減しながら、同等の精度を達成する。
これらの結果は、PDEシステムにおける演算子学習の効率的な代替手段としてのRaNN-DeepONetsの可能性を強調している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:05:29 GMT)
Representation Learning in a Decomposed Encoder Design for Bio-inspired Hebbian Learning [5.7] 本稿では,異なる不変な視覚ディスクリプタを帰納バイアスとして活用する並列エンコーダを含む,バイオインスパイアされたコントラッシブ予測符号化を訓練したモジュラーフレームワークを提案する。
以上の結果から,帰納的バイアスは学習表現の堅牢性を大幅に向上させ,モデル間の性能ギャップを狭めることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:17:49 GMT)
A Unified Framework for Automated Code Transformation and Pragma Insertion [5.7] 高レベルの合成、ソース・ソース・コンパイラ、およびプラグマ挿入のための様々な設計空間探索技術により、生成された設計結果の品質が大幅に向上した。
これらのツールは、開発時間を短縮し、パフォーマンスを向上するといった利点を提供する。
しかしながら、高品質な結果を達成するには、通常、個別または前処理ステップとして実行される、追加の手動コード変換とタイリング選択が必要になることが多い。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:43:19 GMT)
Erase, then Redraw: A Novel Data Augmentation Approach for Free Space Detection Using Diffusion Model [5.6] 従来のデータ拡張方法は、ハイレベルなセマンティック属性を変更することはできない。
画像から画像への変換をパラメータ化するためのテキスト間拡散モデルを提案する。
我々は、元のデータセットから実際のオブジェクトのインスタンスを消去し、削除されたリージョンで同様の意味を持つ新しいインスタンスを生成することで、この目標を達成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:14:34 GMT)
PEARL: Preconditioner Enhancement through Actor-critic Reinforcement Learning [5.4] PEARL(Preconditioner Enhancement through Actor-critic Reinforcement Learning)は,行列プレコンディショナーを学習するための新しい手法である。
近年、深層ニューラルネットワークを用いてプレコンディショナーを学習する方法が検討されているが、目標関数の誤動作やコストのかかるトレーニング手順といった課題は残されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:04:59 GMT)
Why Johnny Signs with Sigstore: Examining Tooling as a Factor in Software Signing Adoption in the Sigstore Ecosystem [5.4] 我々は、現代的で広く採用されているソフトウェア署名ツールであるSigstoreの形式的ユーザビリティについて研究する。
ツールの選択に影響を与える要因について,13名 (13名) のセキュリティ実践者に対してインタビューを行った。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:59:18 GMT)
Self-correction is Not An Innate Capability in Large Language Models: A Case Study of Moral Self-correction [5.3] 我々は、道徳的自己補正は大規模言語モデル(LLM)の本質的な能力ではないと論じる。
我々は,CoT(Chain-of-Thought)推論や外部フィードバックといった自己補正の重要な構成要素が,道徳的自己補正を実現するためにどのように相互作用するかを,機械論的に分析する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:58:42 GMT)
Characterizing dynamical behaviors in topological open systems with boundary dissipations [5.1] リンドブラッドマスター方程式により記述された境界散逸を伴うSu-Schrieffer-Heegerモデルの力学について検討する。
長期間の減衰力学を調べた結果,弱発散領域と強発散領域の動的双対性現象が明らかになった。
位相的に非自明な領域において、熱力学限界における境界局在化ダーク状態の存在を同定する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:01:06 GMT)
HalCECE: A Framework for Explainable Hallucination Detection through Conceptual Counterfactuals in Image Captioning [5.1] この研究は、広く使われている画像キャプターが示す幻覚現象の複雑さを掘り下げて、興味深いパターンを明らかにした。
採用された概念的反事実のバックボーンの決定論的かつ効率的な性質は、意味的に最小限の編集を提案することができる。
提案する幻覚検出フレームワークは,スタンドアローン数とは別に意味論的に意味のある編集を提供することにより,高い解釈が可能となる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:28:19 GMT)
AILS-NTUA at SemEval-2025 Task 8: Language-to-Code prompting and Error Fixing for Tabular Question Answering [5.1] 本稿では,SemEval-2025 Task 8: Question Question Answering over Tabular Dataについて述べる。
このタスクは、DataBenchデータセットに基づいて評価され、構造化データに対する自然言語の質問に答えるLarge Language Modelsの機能を評価する。
自然言語クエリを実行可能なコードに変換するために,LLMを効果的に活用するシステムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:24:42 GMT)
Revisiting Word Embeddings in the LLM Era [5.1] 大規模言語モデル(LLM)は、最近、様々なNLPタスクにおいて顕著な進歩を見せている。
従来の非コンテクスト化単語と文脈化単語の埋め込みをLLMによる埋め込みで比較した。
以上の結果から,LLMは意味的関連語をより緊密にクラスタ化し,非文脈化設定における類似処理をより良く行うことが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:27:41 GMT)
Topological Point Cloud Clustering [5.1] トポロジカル・ポイント・クラウド・クラスタリング(TPCC)は、グローバル・トポロジカルな特徴への貢献に基づいて任意のポイント・クラウドにポイントをクラスタリングする新しい手法である。
我々は、合成データと実世界のデータの両方でTPCCを試験し、古典的なスペクトルクラスタリングと比較する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:21:38 GMT)
A Guide to Failure in Machine Learning: Reliability and Robustness from Foundations to Practice [5.1] 機械学習(ML)を採用する上で大きな障壁の1つは、MLモデルが予期せず失敗する可能性があることだ。
本研究は,MLモデルが失敗する理由をよりよく理解するためのガイドを提供することを目的としている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:21:36 GMT)
QDCNN: Quantum Deep Learning for Enhancing Safety and Reliability in Autonomous Transportation Systems [5.1] 本稿では,輸送におけるCPSの安全性と信頼性を高めるために,QDCNN(Quantum Deep Convolutional Neural Network)を提案する。
提案したQDCNNは,正常な条件下での3つのデータセットと,雨による1つの道路を用いて,その頑健性を評価する。
これは計算効率の点で既存の手法よりも優れており、わずか0.0049352秒のシャドウ検出時間を達成する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:04:44 GMT)
Entanglement transition and suppression of critical phase of thermofield double state in monitored quantum circuit with unitary $R$ matrix gates [4.9] 我々は、ID演算子、プロジェクタ、あるいはある種の$R$行列からランダムに構成されたゲートを持つ量子回路について研究する。
これにより、量子回路を異なるオーバークロスとアンダークロスを持つ位相対象に変換することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:17:11 GMT)
A Survey of Adversarial Defenses in Vision-based Systems: Categorization, Methods and Challenges [4.7] 敵対的攻撃は、マシンラーニングモデルの信頼できるデプロイに対する大きな課題として現れている。
本稿では,2つの重要なコンピュータビジョンタスクに焦点をあて,敵防衛に関する知識の包括的体系化について述べる。
これらの防御を、最も効果的である敵攻撃やデータセットの種類にマップする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:17:18 GMT)
Exactly characterizing critical states: invariance in both position and momentum spaces [4.7] 臨界状態は位置空間と運動量空間の両方で不変であり、両方の双対空間において非局在化をもたらす。
また, 逆参加比や情報エントロピーといった実験で直接観測される物理量も, 位置空間と運動量空間の両方で不変であることを示した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:33:28 GMT)
DCILP: A Distributed Approach for Large-Scale Causal Structure Learning [4.6] 因果学習は因果グラフを推定する計算的に要求されるタスクに取り組む。
本稿では,DCILPと呼ばれる因果グラフ学習のための新たな分枝・分枝手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:45:44 GMT)
Inteval Analysis for two spherical functions arising from robust Perspective-n-Lines problem [4.5] 本稿では、ロバストなパースペクティブ・イン・ラインズ(PnL)問題から導かれる2つの球面関数の包括的間隔解析について述べる。
この研究は、ロバストなPnL問題に対する大域的な解を達成するために次元還元法の適用によって動機付けられている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:29:31 GMT)
Value Gradient Sampler: Sampling as Sequential Decision Making [4.5] 本稿では,サンプリングを離散時間逐次意思決定として解釈したトレーニング可能なサンプリング手法を提案する。
VGSは、ある非正規化密度(すなわちエネルギー)からランダムな粒子の漂流と拡散によってサンプルを生成する。
産業用異常検出アプリケーションにおけるエネルギーベースモデルの正確なトレーニングにおけるVGSの有効性を実証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:27:03 GMT)
Bring Your Own Grasp Generator: Leveraging Robot Grasp Generation for Prosthetic Grasping [4.5] 本稿では,共有自律性原理に従う新しい義手把握システムを提案する。
本システムでは,ユーザの指示に基づいてアプローチ・ツー・グリップ動作を開始し,義手のDoFを自動的に設定する。
我々はハンヌ補綴の手にシステムを展開し、実効性のある被験者とアンプでテストし、その有効性を検証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:35:05 GMT)
ON-OFF Neuromorphic ISING Machines using Fowler-Nordheim Annealers [4.4] 本稿では,Ising問題の基底状態への収束を確保するために設計されたニューロモルフィックアーキテクチャであるNeuroSAを紹介する。
複数回の実行で、NeuroSAは一貫して最先端の結果(99%)に集中するソリューションを生成したり、Max Independent Setベンチマークの最先端ソリューションを上回ります。
実例として,SpiNNaker2プラットフォーム上でのNeuroSAの実装結果を紹介する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:41:01 GMT)
A Hardware-Friendly Shuffling Countermeasure Against Side-Channel Attacks for Kyber [4.4] CRYSTALS-Kyberは、大規模な量子コンピュータによる攻撃に耐えるために、NISTによる唯一の鍵カプセル化機構(KEM)スキームとして標準化されている。
本稿では,新しいコンパクトシャッフルアーキテクチャを取り入れた,キーバーのセキュアで効率的なハードウェア実装を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:03:36 GMT)
Urban Safety Perception Through the Lens of Large Multimodal Models: A Persona-based Approach [4.3] 本研究では,Llava 1.6 7Bと呼ばれるLarge Multimodal Models(LMM)を,都市空間の安全知覚を評価する新しいアプローチとして紹介する。
このモデルの平均F1スコアは59.21%に達し、都市のシナリオを安全または安全でないものとして分類した。
ペルソナをベースとしたプロンプトを取り入れた結果,年齢,性別,国籍の社会デノグラフィーグループにおいて,安全性の認知に有意な変化が認められた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:34:30 GMT)
Mechanistic Permutability: Match Features Across Layers [4.2] SAE Matchは、ニューラルネットワークの異なる層にまたがってSAE機能を整列するための、新しいデータフリーな手法である。
我々の研究は、ニューラルネットワークにおける特徴力学の理解を深め、機械論的解釈可能性研究のための新しいツールを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:16:47 GMT)
2DMCG:2DMambawith Change Flow Guidance for Change Detection in Remote Sensing [4.2] 本稿では、2次元空間情報をキャプチャする能力を高めるビジョンマンバ変種に基づく効率的なフレームワークを提案する。
このフレームワークは、2DMambaエンコーダを使用して、多時間画像からグローバルなコンテキスト空間情報を効果的に学習する。
ベンチマークデータセットの実験は、最先端の手法と比較して、我々のフレームワークの優れた性能を示している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:55:13 GMT)
Mitigating Paraphrase Attacks on Machine-Text Detectors via Paraphrase Inversion [4.1] 高品質なパラフレーズは命令調整言語モデルを使って容易に生成できる。
x2013$$は、マシンテキスト検出器の性能を著しく低下させることで知られている。
本稿では,パラフレーズ付きテキストから元のテキストへのパラフレーズとして,この問題をフレーム化する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:12:48 GMT)
Generative Artificial Intelligence for Academic Research: Evidence from Guidance Issued for Researchers by Higher Education Institutions in the United States [4.1] ジェネレーティブAI(GenAI)は、研究活動の大幅な変化を示唆している。
これにより、GenAIの一見生産的な使用と倫理的懸念のバランスをとる方法について疑問が持ち上がった。
これらの懸念に対処するため、多くの高等教育機関(HEIs)は研究者のための制度的なガイダンスを公開した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:34:02 GMT)
Breaking the Loop: Detecting and Mitigating Denial-of-Service Vulnerabilities in Large Language Models [4.0] LLM(Large Language Models)は、教育、ソフトウェア開発、医療、エンターテイメント、法律サービスなど、幅広い分野のアプリケーションに不可欠な、高度なテキスト理解と生成を持つ。
モデルが同じあるいは同じ出力を繰り返し生成するリカレントジェネレーションは、レイテンシの増加と潜在的なDoS(DoS)脆弱性を引き起こす。
本稿では,LLama-3 や GPT-4o などの著名な LLM における再帰発生シナリオを効率よく同定するブラックボックス進化アルゴリズムである RecurrentGenerator を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:32:17 GMT)
DySec: A Machine Learning-based Dynamic Analysis for Detecting Malicious Packages in PyPI Ecosystem [4.0] 悪意あるPythonパッケージは、Python Package Index (PyPI)のようなオープンソースのリポジトリの信頼を悪用することで、ソフトウェアサプライチェーンを脆弱にする
リアルタイムの行動監視の欠如は、メタデータ検査と静的コード解析を高度な攻撃戦略に不適当にする。
我々は,PyPI用の機械学習ベースの動的解析フレームワークであるDySecを紹介し,eBPFカーネルとユーザレベルのプローブを用いてパッケージインストール時の動作を監視する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:20:42 GMT)
PIMutation: Exploring the Potential of PIM Architecture for Quantum Circuit Simulation [4.0] 我々は、高速かつエネルギー効率の量子回路シミュレーションを実現するために、PIM(PIM framework for qUanTum circuit simulation)を導入する。
PIMutationには、実際のPIMシステムを用いた量子回路シミュレーションのオーバーヘッドを克服するための3つの最適化戦略が組み込まれている。
評価の結果,PIMutation の平均速度は2.99x と 16.51x であり,CPU 上でのQuESTシミュレータよりも 25.23% と 75.29% のエネルギー削減を実現している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:48:12 GMT)
Efficient Biological Data Acquisition through Inference Set Design [4.0] 本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
本稿では,このメカニズムを推論セット設計と呼び,信頼性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:46:21 GMT)
Through the Looking-Glass: Transparency Implications and Challenges in Enterprise AI Knowledge Systems [3.9] 本稿では,AI知識システムにおける透明性要件と影響のリフレクティブ分析について述べる。
私たちは透明性を、さまざまな見方を形作る上で重要な仲介者として定式化しています。
我々は,AI知識システムの価値を実現するために必要な3つの透明性次元を同定する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:55:12 GMT)
Search and Society: Reimagining Information Access for Radical Futures [3.9] 情報検索研究は、それが生み出す技術の社会的意味を理解し、議論しなければならない。
コミュニティは、多様に明示された社会技術的想像から着想を得て構築すべきシステムの種類について、積極的に研究課題を定めるべきである。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:49:44 GMT)
Nonparametric Control Koopman Operators [3.9] 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:08:37 GMT)
Language Model Mapping in Multimodal Music Learning: A Grand Challenge Proposal [3.8] テキストモデルマッピング(LMM)の課題を提案する。
まず LMM の基本構成を紹介し, クロスモーダルアライメントのより深い側面を明らかにすることを目標としている。
次に,音楽がLMM研究を行う理想的な分野である理由について議論する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:04:36 GMT)
Simulation of prosthetic vision with PRIMA system and enhancement of face representation [3.6] 本稿では,人工視覚をシミュレートする新しい非画素化アルゴリズムを提案する。
アルゴリズムの予測と臨床知覚結果を比較する。
また、顔表現を改善するコンピュータビジョンと機械学習(ML)メソッドも提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:54:31 GMT)
Quantum Advantage in Trading: A Game-Theoretic Approach [3.6] 本稿では,取引に応用した量子ゲーム理論モデルを提案する。
その結果、以前は理論上のみ知られていた量子的優位性が、高給の市場であるナッシュ均衡として実現された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:00:08 GMT)
Clifford Assisted Optimal Pass Selection for Quantum Transpilation [3.6] 量子トランスパイレーションのための最適パスセットを選択するためのフレームワークである OPTRAN を提案する。
OPTRAN は IBM Qiskit が使用するベースラインの最大限界の87.66% で忠実さを向上することを示す。
また,OPTRANよりも78.33%,76.66%の許容限界を58.33%,69.44%のコスト削減で改善するOPTRAN-E-3およびOPTRAN-E-1の低コスト版を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:37:30 GMT)
Embracing Diversity: A Multi-Perspective Approach with Soft Labels [3.5] 本稿では,複数のアノテータが議論の的となっているトピックに基づいてスタンスを割り当てる,スタンス検出タスクにおける視点認識モデルの設計手法を提案する。
その結果,マルチパースペクティブアプローチにより,より優れた分類性能(より高いF1スコア)が得られることがわかった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:33:38 GMT)
Few-shot crack image classification using clip based on bayesian optimization [3.5] そこで本研究では,CLIPとベイズ最適化に基づく新しい数発き裂画像分類モデルを提案する。
マルチモーダル情報とベイズ的アプローチを組み合わせることで、少数のトレーニングサンプルにおいてクラック画像の効率的な分類を実現する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:04:54 GMT)
Leveraging Compute-in-Memory for Efficient Generative Model Inference in TPUs [3.2] Processing Units(TPU)は、AIワークロードを高速化するように設計されている。
CIM(Compute-in-Memory)は、より優れた領域とエネルギー効率を持つ有望なパラダイムとして登場した。
本稿では,デジタルCIMを統合したTPUアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:03:25 GMT)
Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation [3.2] SlotAdaptは、スロットアテンションと事前訓練された拡散モデルを組み合わせたオブジェクト中心学習手法である。
本手法は,テキスト中心の条件付けバイアスを回避しつつ,事前学習した拡散モデルの生成力を保っている。
実験結果から,本手法は物体発見タスクや画像生成タスクにおいて,最先端技術よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:25:36 GMT)
Ranking pre-trained segmentation models for zero-shot transferability [3.0] 十分なトレーニングデータをラベル付けする膨大なコストは、ディープラーニングの使用において大きなボトルネックになります。
セグメンテーションタスクとインスタンスセグメンテーションタスクのための最初の教師なし転送可能性推定器を提案する。
本手法は,顕微鏡モダリティにまたがる複数のセグメンテーション問題に対して評価を行う。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:11:06 GMT)
Approaching the Limits to EFL Writing Enhancement with AI-generated Text and Diverse Learners [3.0] 生徒は、自分の言葉をAI生成テキストと統合することで、テキストを構成することができる。
本研究は,香港の59人の中学生がAI生成テキストと対話し,特集記事を構成する方法を検討した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:29:00 GMT)
Bayesian Active Learning for Multi-Criteria Comparative Judgement in Educational Assessment [3.0] 比較判断(CJ)は、仕事を個別の基準に分解するのではなく、全体的評価によって代替的な評価手法を提供する。
この方法は、人間によるニュアンスの比較能力を活用し、より信頼性が高く有効な評価を得る。
ルーブリックは教育で広く使われており、グレーディングと詳細なフィードバックのための構造化された基準を提供しています。
これにより、CJの総合的なランキングと、基準に基づくパフォーマンスのブレークダウンの必要性の間にギャップが生じる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:12:41 GMT)
Local convergence of simultaneous min-max algorithms to differential equilibrium on Riemannian manifold [3.0] 本稿では,2つの決定論的同時アルゴリズムである $tau$-GDA と $tau$-SGA の局所収束解析を行う。
収束解析から得られた知見が、Wasserstein GANsのトレーニングをどのように改善するかを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:37:00 GMT)
Convergence of energy-based learning in linear resistive networks [2.9] エネルギーベースの学習アルゴリズムはアナログ電子デバイスにおける分散実装に適している。
我々は、線形調整可能な抵抗器のネットワークに適用した、特定のエネルギーに基づく学習アルゴリズムであるContrastive Learningを分析して、この方向への第一歩を踏み出す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:47:02 GMT)
A Multi-Labeled Dataset for Indonesian Discourse: Examining Toxicity, Polarization, and Demographics Information [2.9] 世界第3位の民主主義国であるインドネシアは、政治的分極とオンライン毒性の相互作用に対する懸念が高まっている。
これまでのNLP研究は毒性と分極の関係を十分に研究していない。
本稿では, 毒性, 分極性, およびアノテータの人口統計情報を組み込んだ, インドネシアの多ラベルデータセットを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:33:10 GMT)
T-REX: A 68-567 μs/token, 0.41-3.95 μJ/token Transformer Accelerator with Reduced External Memory Access and Enhanced Hardware Utilization in 16nm FinFET [2.7] 本研究では、トランスモデル推論時の外部メモリアクセスを低減するために、新しいトレーニングとポストトレーニング圧縮スキームを導入する。
動的と呼ばれる新しい制御フロー機構と新しいバッファアーキテクチャにより、ハードウェア使用率を改善しながら、外部メモリアクセスをさらに削減できる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:18:12 GMT)
Harnessing Hybrid Frequency-Entangled Qudits through Quantum Interference [2.7] 高次元(HD)量子絡み合いはヒルベルト空間を拡張する。
我々はHFEQ(Hybrid frequency-entangled qudit)と呼ばれる新しいHD周波数領域の絡み合い状態を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:00:54 GMT)
Taming Large Multimodal Agents for Ultra-low Bitrate Semantically Disentangled Image Compression [2.5] 本稿では,新しい画像圧縮フレームワークSemantically Disentangled Image Compression(SEDIC)を提案する。
提案するSEDICは,大規模マルチモーダルモデル(LMM)を利用して,画像をいくつかの重要な意味情報に分解する。
多段セマンティックデコーダは、送信された参照画像オブジェクトをオブジェクト単位で段階的に復元するように設計されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:27:11 GMT)
Improving internal cluster quality evaluation in noisy Gaussian mixtures [2.4] Average Silhouette Width、Calinski-Harabasz、Davies-Bouldin Indicesなどの内部クラスタリング検証は、外部の接地真実ラベルが利用できない場合にクラスタリングの品質を評価する上で重要な役割を果たす。
本稿では,その分散に基づいて特徴量を調整することにより,内部クラスタリングの妥当性を高めるための特徴重要再スケーリング(FIR)手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:11:30 GMT)
T-cell receptor specificity landscape revealed through de novo peptide design [2.4] 主要組織適合性複合体(MHC)に発現するT細胞受容体(TCR)と病原体由来ペプチドの効果的な結合は免疫応答を媒介する。
本稿では,MHCクラスIアレルに提示されるペプチドとのTCR相互作用を予測し,特定のTCR-MHC複合体に新規な免疫原性ペプチドを設計するための計算手法を提案する。
本手法は免疫原性ペプチドとネオ抗原設計のためのプラットフォームを提供し,ウイルスや癌に対するT細胞ワクチン開発のための新しい計算経路を開拓する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:45:19 GMT)
Reservoir Network with Structural Plasticity for Human Activity Recognition [2.4] Echo State Network(ESN)は、時系列データのユニークなパターンを特定し、将来のイベントを予測するために使用できる、リカレントニューラルネットワークのクラスである。
本研究では,ESNターゲットエッジデバイスに基づくカスタム設計ニューロモルフィックチップを提案する。
提案システムは, 構造的可塑性, シナプス的可塑性, 局所的オンチップなど, 様々な学習メカニズムをサポートする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:57:22 GMT)
Space-Time Graphs of Convex Sets for Multi-Robot Motion Planning [2.3] MRMP(Multi-Robot Motion Planning)は、連続環境における複数ロボットの衝突のない軌道の計算問題である。
本研究では,無衝突時空間領域をランダムサンプリングに頼るのではなく,無衝突時空間領域で体系的にカバーする新しいプランナである,凸集合の空間時間グラフ(ST-GCS)を提案する。
また,コンベックス分解(ECD)を時間的障害としてトラジェクトリを「保存」するために提案し,その後の計画のための衝突のない時空間グラフセットの維持に対処する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:28:57 GMT)
VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers [2.3] 動的環境とコーナーケースは、エゴ車の意思決定の堅牢性に重大な課題をもたらす。
本稿では,拡散過程の条件付けのために,環境を幾何学的に,文脈的に解析する新しいパイプラインVDT-Autoを紹介する。
VDT-Autoは平均L2誤差で0.52m, nuScenesオープンループ計画評価で平均衝突速度で21%を達成した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:17:26 GMT)
LTLf Synthesis on First-Order Agent Programs in Nondeterministic Environments [2.2] Gologで表現された高レベルエージェントプログラムのポリシーの合成について検討する。
一階アクション理論の表現型クラスを活用することで、プログラムの実行をカプセル化し、時間的目標の満足度を追跡する有限ゲームアリーナを構築する。
この作業はエージェントプログラミングと時間論理合成を橋渡しし、非決定論的環境における堅牢なエージェント動作のためのフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:35:15 GMT)
Saarthi: The First AI Formal Verification Engineer [2.2] Devinは、世界初の完全自律型AIソフトウェアエンジニアとして、人工知能(AI)コミュニティで大きな話題を呼んだ。
同様に、完全に自律的なAI形式検証エンジニアであるSaarthiは、所定のRTL設計をエンドツーエンドで検証することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:02:14 GMT)
A physics-informed Bayesian optimization method for rapid development of electrical machines [2.1] 本研究では、スロット充填率(SFF)を改善するための新しい物理インフォームド機械学習(PIML)設計プロセスを提案する。
最大エントロピーサンプリングアルゴリズム (MESA) を用いて物理インフォームドベイズ最適化 (PIBO) アルゴリズムをシードする。
提案したPIBO-MESAは、非支配的ソート遺伝的アルゴリズム(NSGA-II)のような既存の方法よりも45%高速である。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:43:58 GMT)
The Uncertainty of Machine Learning Predictions in Asset Pricing [2.0] 予測されたリターンのニューラルネットワーク予測は、古典的ノンパラメトリック手法と同じ分布を持つことを示す。
これらの予測信頼区間を不確実な逆投資枠組みに組み込む。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:32:00 GMT)
Learning Color Equivariant Representations [2.0] 色変化に同値なグループ畳み込みニューラルネットワーク(GCNN)を導入する。
GCNNは、2次元と3次元の回転群からスケールのような半群への様々な幾何学的変換のために設計されている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:19:53 GMT)
Unveiling AI's Threats to Child Protection: Regulatory efforts to Criminalize AI-Generated CSAM and Emerging Children's Rights Violations [1.9] イメージによる児童性虐待の分野における新たな警戒傾向の提示を目指す。
主な貢献は、ホットラインレポートとダークウェブフォーラムで特定されたドメイン名との相関分析である。
ボイジャーシステムのATLASデータセットからの投稿内容の分析
このタイプのコンテンツやルートに対するユーザの見解も、悪意のある目的の防止を目的として設定された技術的障壁を克服するためのものだ。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:18:00 GMT)
Deterministic high-rate entanglement distillation with neutral atom arrays [1.9] 片道ハッシング法は、その限界における絡み合いを効率よく、決定論的に蒸留することが知られている。
本研究では,中性原子配列を用いて一方向ハッシュ法を効率的に実装する方法を示す。
片道ハッシュ法の完全なコヒーレントな実装は、最先端の量子技術に到達している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:54:25 GMT)
Conceptual Contrastive Edits in Textual and Vision-Language Retrieval [1.9] 我々は、検索モデルの表現に印字された注目すべきパターンやバイアスを明らかにするために、ポストホックな概念的コントラスト編集を用いる。
我々はこれらの編集をブラックボックス方式で言語的および言語学的事前学習モデルの両方を説明するために応用する。
また、モデル結果に対する対照的な介入による単語ごとの影響を評価するための新しい指標も導入する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:14:28 GMT)
Explainable Machine Learning-Based Security and Privacy Protection Framework for Internet of Medical Things Systems [1.8] インターネット・オブ・メディカル・モノ(IoMT)は、従来の医療境界を超越し、反応性治療から予防への転換を可能にする。
その利点は、処理されたデータの感度と価値のために、ユーザの生活を危険にさらす、重大なセキュリティ上の課題に対処されている。
ニューラルネットワークを侵入検知に利用し、フェデレーション学習(FL)をプライバシ保護に活用する、侵入検知システムのための新しいフレームワークが導入された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:42:04 GMT)
ToolDial: Multi-turn Dialogue Generation Method for Tool-Augmented Language Models [1.8] 我々は,RapidAPIのAPIに基づいて,対話毎に平均8.95回転する11,111のマルチターン対話からなるデータセットであるToolDialをリリースした。
システムから必要な情報をAPIドキュメントに基づいて要求する対話をシミュレートし,必要な情報の提供に失敗した場合に追加のAPIを求める。
我々は,正しい動作を予測し,対話履歴からAPI呼び出しの入力パラメータ値を抽出する言語モデル群を評価する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:23:51 GMT)
Deep Optimal Sensor Placement for Black Box Stochastic Simulations [1.6] 本稿では, 入力パラメータに対する結合分布と, 結合エネルギーモデルを用いた解を提案する。
提案手法は,従来の手法に比べて計算コストの低い高精度なセンサ位置を提供することを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:19:51 GMT)
ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science [1.5] ストリートビューイメージ(SVI)は、街路の特徴や構築環境を理解し、特徴付けるために、過去10年間に多くの研究で役立っている。
我々は、フリーでオープンソースのPythonパッケージであるZenSVIを開発し、SVI分析の全プロセスを統合し、実装した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:42:33 GMT)
Hidden Convexity of Fair PCA and Fast Solver via Eigenvalue Optimization [1.5] 主成分分析(英: principal Component Analysis、PCA)は、高次元データセットの次元的削減のための機械学習の技法である。
The Fair (FPCA) model was introduced by Samadi et al. to equalize the reconstruction loss between subgroups。
Samadiらによって提案された半有限緩和(SDR)に基づくアプローチは、準最適解に対しても計算コストがかかる。
本稿では,FPCAモデルに隠れた凸性を同定し,固有値最適化による凸最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:13:20 GMT)
Large Engagement Networks for Classifying Coordinated Campaigns and Organic Twitter Trends [1.4] ソーシャルメディアのユーザーと不正なアカウントは、トピックの宣伝に協力することができる。
トピックがオーガニックなのか、あるいは信頼できる地上の真実が欠如しているため、協調したキャンペーンなのかを予測するのは難しい。
本稿では,短絡攻撃によるキャンペーンを検知することで,そのような真実を創出する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:50:32 GMT)
DV-Matcher: Deformation-based Non-Rigid Point Cloud Matching Guided by Pre-trained Visual Features [1.3] DV-Matcherは、非剛性変形点雲間の密接な対応を推定するための学習ベースのフレームワークである。
実験結果から,本手法は非剛性点雲をほぼ等尺形状と異質形状の両方で整合させることで,最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:59:27 GMT)
An Empirical Study on the Classification of Bug Reports with Machine Learning [1.1] 課題報告の分類処理において,異なる要因(プロジェクト言語,報告内容など)がモデルの性能に与える影響について検討する。
Support Vector Machine, Logistic Regression, Random Forestは課題レポートの分類に有効である。
不均一なプロジェクトに基づくモデルは、トレーニング中に存在しないプロジェクトからのレポートを分類することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:19:56 GMT)
Performance Heterogeneity in Graph Neural Networks: Lessons for Architecture Design and Preprocessing [1.1] グラフニューラルネットワークは、グラフレベルの学習において最もポピュラーなアーキテクチャとして登場した。
優れたパフォーマンスを実現するには、注意深いモデル設計が必要です。
選択的なアプローチを提案する。これは、個々のパフォーマンスがリライトの恩恵を受けるグラフのみを対象としている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:18:07 GMT)
Shaping Laser Pulses with Reinforcement Learning [1.1] 高出力レーザー(HPL)システムはフェムト秒方式で動作する。
Deep Reinforcement Learning (DRL)は、静的でない環境でシーケンシャルな意思決定を可能にする、有望な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:00:41 GMT)
Flow Matching for Medical Image Synthesis: Bridging the Gap Between Speed and Quality [1.1] 本稿では,画像生成を高速化する最適な輸送フローマッチング手法を提案する。
ソースとターゲットの分布のより直線的なマッピングを導入することにより,提案手法は推論時間を著しく短縮する。
本研究は, この枠組みの効率性と汎用性を実証し, 医用画像の応用に有望な進歩をもたらした。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:49:47 GMT)
Unstable Grounds for Beautiful Trees? Testing the Robustness of Concept Translations in the Compilation of Multilingual Wordlists [1.0] 9つの異なる言語族をカバーする10組のデータセットから独立にコンパイルされた単語リストにおける概念翻訳のバリエーションについて検討した。
平均すると、すべての翻訳の83%のみが同じ語形を生成するのに対し、音素の書き起こしにおける同一の形式は全てのケースの23%にしか見つからない。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:16:45 GMT)
The Role, Trends, and Applications of Machine Learning in Undersea Communication: A Bangladesh Perspective [1.0] 本稿では,海上の安全を向上し,持続可能な資源利用を促進し,災害対応システムを強化するため,ML駆動型ソリューションを展開するためのロードマップを提案する。
バングラデシュはベンガル湾に豊富な資源を持つ海洋国であり、水中コミュニケーションに関わる課題に取り組むために機械学習の潜在能力を活用することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:53:18 GMT)
Hybrid Quantum Neural Networks with Variational Quantum Regressor for Enhancing QSPR Modeling of CO2-Capturing Amine [1.0] 我々は,CO2捕捉アミンの構造-適合関係モデルを改善するために,ハイブリッド量子ニューラルネットワーク(HQNN)を開発した。
HQNNは、塩基性、粘性、沸点、融点、蒸気圧などの主要な溶媒特性の予測精度を向上させる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:26:45 GMT)
Multi-objective Representation for Numbers in Clinical Narratives: A CamemBERT-Bio-Based Alternative to Large-Scale LLMs [0.9] 本稿では,数値の理解におけるトランスフォーマーモデルの限界について検討する。
医学文書から抽出した数値を,CamemBERT-bioを用いて8つの特定の生理カテゴリーに分類することを目的とする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 09:48:15 GMT)
Psychological Counseling Ability of Large Language Models [0.7] 本研究は,1096件の心理カウンセリングスキル質問を用いて,LLMの心理カウンセリング能力を評価した。
中国の質問に対するLCMの正当率は、GLM-3(46.5%)、GPT-4(46.1%)、Gemini(45.0%)、ERNIE-3.5(45.7%)、GPT-3.5(32.9%)である。
チ二乗検定では、中国語と英語の質問に対するLLMのパフォーマンスに有意な違いが認められた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:01:25 GMT)
CRUPL: A Semi-Supervised Cyber Attack Detection with Consistency Regularization and Uncertainty-aware Pseudo-Labeling in Smart Grid [0.5] スマートグリッドに対するサイバー攻撃は、データの整合性を妥協し、電源の信頼性を損なう可能性がある。
従来の侵入検知システムは、しばしば、新しく洗練された攻撃を効果的に検出する助けを必要とする。
本研究では,ラベル付きおよびラベルなし計測データを活用することにより,スマートグリッドにおけるサイバー攻撃検出の半教師付き手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:49:23 GMT)
Learning Conditional Average Treatment Effects in Regression Discontinuity Designs using Bayesian Additive Regression Trees [0.5] 本稿では, 回帰不連続設計から条件付き平均処理効果(CATE)を学習するためのBARTモデルについて検討する。
線形回帰葉モデルを用いたBARTの目的構築バージョンは、既製のBART実装よりも優れた性能を示す。
本手法は, 学生の学業成績に及ぼす学業調査の効果を実証的に検討するとともに, 徹底的なシミュレーション研究において評価された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:23:10 GMT)
MedSimAI: Simulation and Formative Feedback Generation to Enhance Deliberate Practice in Medical Education [0.5] MedSimAIはAIを利用したシミュレーションプラットフォームで、故意の実践、自己統制型学習、対話型患者出会いによる自動評価を可能にする。
初等医学生104名を対象にしたパイロットスタディでは,エンゲージメント,会話パターン,ユーザ認知について検討した。
学生たちは、MedSimAIが反復的で現実的な患者史の実践に有用であると考えた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:51:55 GMT)
Semi-Parametric Batched Global Multi-Armed Bandits with Covariates [0.5] マルチアームバンディット(MAB)フレームワークは、シーケンシャルな意思決定に広く使われているアプローチである。
本稿では,コパラメトリックと腕間の共有パラメータを持つバッチバンドの半パラメトリックフレームワークを提案する。
Batched Single-Index Dynamic binning and Successive arm elimination (BIDS) というアルゴリズムでは、バッチ化された逐次アームの除去戦略を採用している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:23:55 GMT)
An Adaptive Importance Sampling for Locally Stable Point Processes [0.5] 境界領域における局所安定点過程の統計値の期待値を求めるための適応的な重要度サンプリング手法を提案する。
提案した推定器は、ほぼ確実に目標値に収束し、その正規性を証明する。
提案手法の性能をマルコフ連鎖モンテカルロシミュレーションと完全サンプリングと比較した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:24:13 GMT)
On Limitations of LLM as Annotator for Low Resource Languages [0.4] 低リソース言語は、教師付き学習、アノテーション、分類といったタスクのための十分な言語データ、リソース、ツールが不足しているため、重大な課題に直面している。
このギャップを埋めるために、Large Language Models (LLM) は潜在的なアノテータの機会を提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:07:45 GMT)
Estimation of total body fat using symbolic regression and evolutionary algorithms [0.4] 体脂肪率(Body fat percentage)は、体重と肥満を測定するためにボディ・マス・インデックス(Body Mass Index)の代替品として人気が高まり、より正確な体組成の表現を提供する。
本稿では,3つの進化的計算手法を評価し,解釈可能な数学的表現を導出し,同時に精度の高い体脂肪の割合を推定する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:23:33 GMT)
Revisiting Word Embeddings in the LLM Era [0.3] 大規模言語モデル(LLM)は、最近、様々なNLPタスクにおいて顕著な進歩を見せている。
従来の非コンテクスト化単語と文脈化単語の埋め込みをLLMによる埋め込みで比較した。
以上の結果から,LLMは意味的関連語をより緊密にクラスタ化し,非文脈化設定における類似処理をより良く行うことが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:33:15 GMT)
Cross-linguistic disagreement as a conflict of semantic alignment norms in multilingual AI~Linguistic Diversity as a Problem for Philosophy, Cognitive Science, and AI~ [0.2] 言語間の整合性(CL整合性)は言語間の普遍的な概念を求める。
言語固有の意味規範を尊重する民族一貫性。
普遍表現と言語間移動能力が本質的に望ましいという仮定を見つける。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:31:40 GMT)
AI-Augmented Thyroid Scintigraphy for Robust Classification [0.2] 甲状腺シンチグラフィー分類のためのディープラーニングモデルは、制限された不均衡なデータセットのためにしばしば課題に直面している。
その結果,FMベースの拡張はSDベースのアプローチより一貫して優れていた。
これらの知見は,高画質の合成甲状腺シンチグラフィー画像を作成するための優れたアプローチとして,FMベースの拡張の可能性を強調した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 06:21:46 GMT)
Adaptive Entanglement Routing with Deep Q-Networks in Quantum Networks [0.2] 量子インターネットは、グローバル通信の変革の可能性を秘めている。
量子ビットのような重要なリソースの効率的な分配は、永続的で未解決の課題である。
本研究では,新しい強化学習に基づく適応的絡み合いルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:05:54 GMT)
SecRef*: Securely Sharing Mutable References Between Verified and Unverified Code in F* [0.2] SecRef*は、F*で検証されたステートフルなプログラムを、リンクされた未検証コードから保護するフレームワークである。
SecRef*は、未検証のコードとの健全かつセキュアな相互運用性を保証する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 08:48:39 GMT)
Datenschutzkonformer LLM-Einsatz: Eine Open-Source-Referenzarchitektur [0.1] 本稿では,オープンソース技術を用いたLCMベースのクローズドシステム開発のためのリファレンスアーキテクチャを提案する。
このアーキテクチャは、厳格なデータプライバシとセキュリティ要件を満たす、フレキシブルで透過的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:51:07 GMT)
Mediated Interactions and Damping Effects in Superfluid Mixtures of Bose and Fermi Gases [0.1] 本稿では,Bardeen-Cooper-Schrieffer(BCS)超流動の均一な超流動混合物について検討する。
BCS超流動と関連する自由を統合することで、ボソン間のフェルミオンによる相互作用を導出する。
ボーソン-フェルミオン質量比とボソン-フェルミオンカップリング強度で表される相図を,ボソン-フェルミオン質量比とボソン-フェルミオン結合強度で解析した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:55:40 GMT)
Variational formulation based on duality to solve partial differential equations: Use of B-splines and machine learning approximants [0.0] 多くの偏微分方程式(PDE)は、正確な原始的変動構造を持っていない。
双対(ラグランジュ乗算器)場に基づく変分原理を提案した。
線形, 一次元, 過渡対流拡散方程式の二重弱形式を導出する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:20:53 GMT)
Two-body interaction induced phase transitions and intermediate phases in nonreciprocal non-Hermitian quasicrystals [0.0] 相互作用と非相互ホッピングが準周期格子上の2つのボソンの挙動にどのように影響するかを示す。
これらの現象に付随するスペクトル、局在、位相遷移を特徴づける枠組みが開発された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:47:04 GMT)
Towards Differential Handling of Various Blur Regions for Accurate Image Deblurring [0.0] 本稿では,異なるぼかし領域に対して差分処理を行うディファレンシャルハンドリングネットワーク(DHNet)を提案する。
具体的には、非線形特性を劣化ネットワークに統合するVolterraブロック(VBlock)を設計する。
モデルがぼやけた領域の様々な劣化度に適応的に対応できるようにするため,分解度認識エキスパートモジュールを考案した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:00:01 GMT)
Structured Reasoning for Fairness: A Multi-Agent Approach to Bias Detection in Textual Data [0.0] 本稿では,各文を事実あるいは意見として切り離して識別するマルチエージェントフレームワークを提案する。
改良された検出精度と解釈可能な説明を組み合わせることで、現代の言語モデルにおける説明責任を促進する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:27:54 GMT)
Statistical Mechanics of Semantic Compression [0.0] 我々は,認知神経科学と機械学習からインスピレーションを得て,連続ユークリッドベクトル空間としてのセマンティック空間をモデル化する。
我々は、最小長の意味保存メッセージを決定する最適化問題をスピングラスハミルトニアンにマップする。
最悪な場合、意味保存圧縮を見つける問題は計算的に難しいが、ほぼ最適な性能を実現する効率的なアルゴリズムが存在すると論じる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:38:16 GMT)
Review on Determining the Number of Communities in Network Data [0.0] 本稿では,ネットワークモデルにおける仮説検証とクラスタリングの統計的手法について述べる。
The SCORE method by Jin et al. and the NCV method by Chen et al. were evaluation for their effective in clustering in Degree-Corrected Block Models。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:01:06 GMT)
Quantum Lamb model [0.0] ラムは量子論の発展以前に弾性媒質に埋め込まれた振動する粒子の古典力学を考察した。
ラムは、生成した弾性波のバックアクションが粒子の振動を減衰させる方法に興味を持っていた。
このモデルは、マルチモードのボゴリューボフ変換を用いて、正確に解けることを示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:12:52 GMT)
Quantum Geometry insights in Deep Learning [0.0] まずボルツマン学習の構造と自由エネルギー最小化との関係について概説する。
次に、最適輸送理論と深層学習の関連性を確立し、モンゲ・アンペア方程式が生成モデルにおける確率変換をどのように支配するかを示す。
本稿では,再正規化群 (RG) の流れに基づく別の手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 15:49:32 GMT)
Polyconvex Physics-Augmented Neural Network Constitutive Models in Principal Stretches [0.0] 凸関数は二階対称関数で記述できることを示す。
モデルが任意の物質を捕獲する能力は, 合成データと実験データを用いて実証した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:55:09 GMT)
Particle-based plasma simulation using a graph neural network [0.0] このモデルは2桁の精度で従来のシミュレーションよりも長い時間ステップで精度を向上する。
この研究は、複雑なプラズマ力学を学習できることを示し、高速な微分可能シミュレータの開発を約束することを示している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 01:07:37 GMT)
POSERS: Steganography-Driven Molecular Tagging Using Randomized DNA Sequences [0.0] 我々は,DNAシークエンス内に埋め込まれたステガノグラフタグシステムPOSERS(Position-Oriented Scattering of Elements among a Randomized Sequence)を紹介する。
POSERSは、ランダム化されたDNAライブラリに制限を加えることで、コピーとフォージェリーの認証を保証する。
この結果から,製品認証の長期的かつ適応的なソリューションとして,POSERSの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 22:09:49 GMT)
PINN-DT: Optimizing Energy Consumption in Smart Building Using Hybrid Physics-Informed Neural Networks and Digital Twin Framework with Blockchain Security [0.0] 本研究は,予測エネルギー最適化を強化するための多面的手法を提案する。
このモデルは、スマートメーターエネルギー消費データ、再生可能エネルギー出力、動的価格設定、IoTデバイスから収集されたユーザの好みなど、包括的なデータセットを使用してトレーニングされ、検証された。
提案手法は平均絶対誤差(MAE)が0.237 kWh、ルート平均平方誤差(RMSE)が0.298 kWh、R2が0.978、データ分散の97.8%で予測性能に優れていた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:37:09 GMT)
Navigation-Guided Sparse Scene Representation for End-to-End Autonomous Driving [0.0] SSRは16個のナビゲーション誘導トークンのみをスパースシーン表現として利用する新しいフレームワークである。
提案手法は,人間設計による教師付きサブタスクの必要性を排除し,計算資源が必須要素に集中できるようにする。
SSRはL2エラーを27.2%減少させ、nuScenesでは51.6%の衝突速度をUniADに還元し、10.9$times$高速推論速度と13$times$高速トレーニングタイムを達成している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:42:24 GMT)
Modeling Arbitrarily Applicable Relational Responding with the Non-Axiomatic Reasoning System: A Machine Psychology Approach [0.0] 非公理推論システム(NARS)を用いた人工知能フレームワークにおけるAARRモデリングのための新しい理論的アプローチを提案する。
NARSの推論規則とメモリ構造から,AARRのキー特性がどのように現れるかを示す。
その結果、AARRは、適切に設計されたAIシステムによって概念的に捕捉可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 20:37:11 GMT)
Mathematical Contributions to the Dynamics of the Josephson Junctions: State of the Art and Open Problems [0.0] ある種の初期境界問題の解とそれらの推定のいくつかについて研究する。
これらの解の振舞いの厳密な解析の結果は、時間が無限大になる傾向にあり、小さいパラメータがゼロになる傾向にある場合を引用する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:10:06 GMT)
Masked Mixers for Language Generation and Retrieval [0.0] 我々は、トランスにおける入力表現精度の低下と、マスクミキサーと呼ばれるものにおけるより正確な表現を観察する。
小型のマスクミキサーは、最先端のトランスフォーマーベース検索モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:34:06 GMT)
MCDFN: Supply Chain Demand Forecasting via an Explainable Multi-Channel Data Fusion Network Model [0.0] CNN,Long Short-Term Memory Network (LSTM), Gated Recurrent Units (GRU)を統合したハイブリッドアーキテクチャであるMulti-Channel Data Fusion Network (MCDFN)を紹介する。
我々の比較ベンチマークは、MCDFNが他の7つのディープラーニングモデルより優れていることを示している。
本研究は,需要予測手法を進歩させ,MCDFNをサプライチェーンシステムに統合するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 19:43:45 GMT)
Local-Aware Global Attention Network for Person Re-Identification Based on Body and Hand Images [0.0] 本稿では,身体画像と手動画像の両面から,人物Re-Idに対するエンドツーエンドの識別的深層特徴学習のための複合的アプローチを提案する。
提案手法は既存の最先端手法よりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:11:01 GMT)
Learning Automata of PLCs in Production Lines Using LSTM [0.0] 本稿では,Long Short-Term Memory (LSTM) ネットワークを用いて搬送システムのモデル化を行う。
センサーからのデータは、搬送システムをモデル化するオートマトンを出力するためにLSTMを訓練するために使用される。
その結果、LSTMオートマトンはOTALAから得られたものとは異なり、搬送システムのより正確な表現であることが証明された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 21:49:25 GMT)
Joint Person Identity, Gender and Age Estimation from Hand Images using Deep Multi-Task Representation Learning [0.0] 画像から人物の身元、性別、年齢を共同で推定するマルチタスク表現学習フレームワークを提案する。
公開可能な1kハンドデータセット上で,畳み込みベースと変圧器ベースの両方のディープラーニングアーキテクチャの評価と比較を行う。
実験により, 身元だけでなく, 被疑者の性別や年齢などの属性を手動画像から効率的に推定できることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:43:08 GMT)
Investigating the contribution of terrain-following coordinates and conservation schemes in AI-driven precipitation forecasts [0.0] 本研究は, 地形追従座標と大域的質量・エネルギー保全スキームをAIWPモデルに統合する。
保存法は, ドライズルバイアスを低減させるのに対して, 地形追従座標を用いることで, 極端事象と降水強度スペクトルの推定が向上する。
この研究の解決策は、幅広いAIWPモデルに有効であり、大気領域の知識がAIWPモデルの開発にどのように役立つかについての洞察をもたらすことができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:44:46 GMT)
Interference of photons from independent hot atoms [0.0] 基本的な原子放出物質からの光のコヒーレンスは、現代の光学の様々な領域において最も重要な役割を担っている。
原子蒸気中の温かい原子の独立したアンサンブルから散乱した光子の干渉を実証する。
光のコヒーレンスを前と後ろに弾性的に散らばって保存する可能性に頼っている。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:22:09 GMT)
Interference and Bell States in q-deformed Quantum Oscillator a Wigner Function Perspective [0.0] 我々はq変形高調波の干渉とベル状態について検討する。
干渉状態と4つのベル状態のウィグナー関数を計算し、議論する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:24:09 GMT)
Input Specific Neural Networks [0.0] ニューラルネットワークのブラックボックスは、入力と出力の間の特定の関係をエンコードまたは強制する能力を制限する。
本稿では、入力に関する第1次微分方程式とともに、2つのISNNについて述べる。
本稿では、ISNNを用いて、バイナリゲーティング機構を用いて入力出力間の構造的関係を学習する方法を示す。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:57:16 GMT)
Hierarchical Multi-Stage BERT Fusion Framework with Dual Attention for Enhanced Cyberbullying Detection in Social Media [0.0] 本研究では,ソーシャルメディアにおけるサイバーバブル検出のための多段階BERT融合フレームワークを提案する。
このフレームワークはBERT埋め込みと感情やトピック情報といった機能を組み合わせたものだ。
自己アテンションと横断アテンションを使って特徴を整列し、階層的な分類ヘッドを複数カテゴリに分類する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 04:12:31 GMT)
Heatwave increases nighttime light intensity in hyperdense cities of the Global South: A double machine learning study [0.0] 気候変動や急速な都市化によって強まる熱波は、都市システムに重大な脅威をもたらす。
本研究では,グローバルサウスの4大都市における熱波と夜間光(NTL)放射率の関係について検討した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 16:52:42 GMT)
HDKD: Hybrid Data-Efficient Knowledge Distillation Network for Medical Image Classification [0.0] ビジョントランスフォーマー(ViT)は、強力なモデリング能力のため、コンピュータビジョンタスクにおいて大きな進歩を遂げている。
知識蒸留(KD)への以前のアプローチは、CNNの教師からViTの学生へのロジット分布の蒸留に焦点を絞った2つの主要な経路を追求してきた。
本稿では,CNN教師とハイブリッド学生を併用したHybrid Data- efficient Knowledge Distillation(HDKD)パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:17:11 GMT)
Generating Generalised Ground-State Ansatzes from Few-Body Examples [0.0] 本稿では,量子多体系のための基底状態アンサーゼを生成する手法を提案する。
相関関係をエンコードし、有限サイズの効果を捉え、基底状態のエネルギーを正確に予測し、臨界現象のよい記述を提供する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 13:52:57 GMT)
From RAGs to riches: Utilizing large language models to write documents for clinical trials [0.0] この記事は、現在ジャーナルのウェブサイトで公開されている: https://journals.sagepub.com/doi177/174077452520806。
公開リンク: https://pubmed.ncbi.nlm.nih.gov/40013826/
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:22:20 GMT)
Figurative Archive: an open dataset and web-based application for the study of metaphor [0.0] フィギュラティブ・アーカイブ(英語: Figurative Archive)は、イタリアの997のメタファーの公開データベースである。
日常的なメタファーと文学的なメタファーの両方が含まれており、構造や意味の領域によって異なる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:47:45 GMT)
Extracting RABBITT-like phase information from time-dependent transient absorption spectra [0.0] パルス列のスペクトル位相が過渡吸収(TA)分光における光断面積にどのように影響するかを考察する。
極紫外(XUV)と時間遅延近赤外(NIR)の相互作用は力学を制御している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 12:48:02 GMT)
Entanglement dynamics via Geometric phases in Trapped-ions [0.0] メルマー・ソレンセンゲートは多粒子系における制御相互作用の実装法として広く用いられている。
量子プロセストモグラフィ(QPT)やベル状態トモグラフィ(BST)といった一般的な手法は、MSゲートの性能を評価するために一般的に用いられる。
我々は,MSゲートにおける性能評価と雑音識別のためのツールとして,幾何位相を利用することを提案する。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 02:01:25 GMT)
Development of an Unpaired Deep Neural Network for Synthesizing X-ray Fluoroscopic Images from Digitally Reconstructed Tomography in Image Guided Radiotherapy [0.0] 肺がん治療において、デジタル再構成ラジオグラフィ(DRR)画像からフラットパネル検出器(FPD)画像を生成することができるディープニューラルネットワーク(DNN)。
肺腫瘍患者から得られたDRR-FPD画像データを用いてCycleGANアーキテクチャを訓練した。
平均画像生成時間は、画像毎のミリ秒の順序であり、リアルタイムアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 23:34:43 GMT)
Detection of Customer Interested Garments in Surveillance Video using Computer Vision [0.0] 本稿では,映像監視を通じてこの問題に対処するコンピュータビジョンベースのフレームワークを提案する。
提案するフレームワークは,ビデオフレームに存在する前景を特定するために,ガウシアン背景抽出アルゴリズムの混合を用いている。
このフレームワークは、衣料品店のCCTVビデオからなるデータセット上でテストされた。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 10:39:50 GMT)
Design of a quantum diamond microscope with efficient scanning confocal readout [0.0] 我々は,光シート共焦点量子ダイヤモンド顕微鏡 (LC-QDM) を導入し, 高速共焦点読み出しによる広視野3次元量子センシングを行った。
LC-QDMは光シート照明とレーザー走査共焦点法を利用して、ダイヤモンド中の窒素空孔(NV)欠陥による高分解能で高速な3D計測を可能にする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 00:00:46 GMT)
Deep Learning based approach to detect Customer Age, Gender and Expression in Surveillance Video [0.0] 監視ビデオにおける年齢・性別予測に対するコンピュータビジョンに基づくアプローチを提案する。
提案手法は,ワイド残留ネットワークとXception深層学習モデルの有効性を活用する。
提案手法の有効性を実生活の衣料品店の監視ビデオで評価した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:26:53 GMT)
Customer Analytics using Surveillance Video [0.0] 本研究は,顧客の買い物行動を分析し,購入パターンを識別する手法を提案する。
重み付きk平均アルゴリズムを用いたマルチクラスタオーバーラップk平均拡張(MCOKE)アルゴリズムの拡張版を用いて、顧客を興味のある衣服にマッピングする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 11:26:31 GMT)
Conditioning on Local Statistics for Scalable Heterogeneous Federated Learning [0.0] フェデレーション・ラーニング(Federated Learning)は、複数のクライアントがローカルデータを共有せずに、協調的にモデルをトレーニングする分散機械学習アプローチである。
本稿では,各クライアントが独立に計算した統計特性を,局所的な特徴統計として利用することを提案する。
トレーニング中、これらのローカル統計は、モデルがローカルデータ分布の条件付け方法を学ぶのに役立ち、推論中は、クライアントの予測をガイドする。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 07:10:58 GMT)
Bridging Classical and Quantum Machine Learning: Knowledge Transfer From Classical to Quantum Neural Networks Using Knowledge Distillation [0.0] 本稿では,古典的畳み込みニューラルネットワーク(CNN)から量子ニューラルネットワーク(QNN)へ知識を伝達するための新しい枠組みを提案する。
我々は、MNIST, Fashion MNIST, CIFAR10データセット上の4および8キュービットを持つ2つのパラメタライズド量子回路(PQC)を用いて、広範な実験を行う。
我々の結果は、古典的なディープラーニングと新しい量子コンピューティングをブリッジし、量子マシンインテリジェンスにおいてより強力でリソースを意識したモデルを構築するための、有望なパラダイムを確立します。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 17:21:39 GMT)
Bose-Fermi $N$-polaron state emergence from correlation-mediated blocking of phase separation [0.0] 単位充填時の1次元格子ボゾン浴中におけるフェルミオン不純物$N$について検討した。
高い種間反発で相分離を置き換える$N$ポラロン基底状態が見つかる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 03:56:48 GMT)
BERT-based model for Vietnamese Fact Verification Dataset [0.0] 本稿では,ベトナムのデータセットを用いたFact Verificationの課題に対処するアプローチを提案する。
提案手法は,事前学習したPhoBERTとXLM-RoBERTaをネットワークのバックボーンとして利用することにより,大規模言語モデルのパワーを活用する。
特に、Strictの精度は75.11%に達し、ベースラインモデルよりも28.83%改善した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 05:31:04 GMT)
An Improved NSGA-II with local search for multi-objective energy-efficient flowshop scheduling problem [0.0] 製造業におけるエネルギー消費は、効率の良いスケジュールに直接関係している。
提案されたアルゴリズムは、ベンチマーク問題でそれぞれFTとECの最小化を平均47%、平均15.44%改善した。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 18:56:06 GMT)
A Classical Analogue of Entanglement for a Kicked Top [0.0] 時間進化のユニタリ性は、量子状態間の距離が保存されることを保証するため、量子力学はカオスを示すことができないと広く信じられている。
平行議論は古典的なカオスの存在を否定するように見える古典力学で構築することができる。
論文参考訳(メタデータ) (Sat, 01 Mar 2025 14:57:34 GMT)