Lumina-Video: Efficient and Flexible Video Generation with Multi-scale Next-DiT [98.6] Lumina-Nextは、Next-DiTによる画像生成において、例外的なパフォーマンスを実現している。
Lumina-VideoにはマルチスケールのNext-DiTアーキテクチャが組み込まれており、複数のパッチを共同で学習している。
本稿では,Next-DiTに基づく音声合成モデルであるLumina-V2Aを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:58:11 GMT)
LIAR: Leveraging Inference Time Alignment (Best-of-N) to Jailbreak LLMs in Seconds [98.2] LIAR(Leveraging Inference Time Alignment to jailbReak)は、ジェイルブレイク攻撃に適した高速で効率的なNのアプローチである。
その結果, 最適Nアプローチは, 整列LLMのロバスト性を評価する上で, 単純かつ高効率な戦略であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:22:08 GMT)
MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities against Hard Perturbations [90.1] 各種モデルにおけるMATH-P-Hardの性能低下を観察する。
また、学習した問題解決スキルを盲目的に適用する新しい形態の記憶に関する懸念も提起する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:31:46 GMT)
DRT: Deep Reasoning Translation via Long Chain-of-Thought [89.5] 本稿では,長いCoTをニューラルネットワーク翻訳(MT)に適用する試みであるDRTを紹介する。
まず、既存の文献から模範文や比喩文を含む文を抽出し、その後、長い思考を通してこれらの文を翻訳する多エージェントフレームワークを開発する。
Qwen2.5とLLama-3.1をバックボーンとして使用することで、DRTモデルは機械翻訳中に思考プロセスを学ぶことができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:35:28 GMT)
CANeRV: Content Adaptive Neural Representation for Video Compression [89.4] 映像圧縮のためのコンテンツ適応型ニューラル表現法(CANeRV)を提案する。
CANeRVは革新的なINRベースのビデオ圧縮ネットワークであり、各ビデオシーケンスの特定の内容に基づいて、構造最適化を適応的に行う。
CNeRVはH.266/VVCと最先端のINRベースの動画圧縮技術の両方を多種多様なビデオデータセットで上回り得ることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:21:16 GMT)
Visual Agents as Fast and Slow Thinkers [88.1] 本稿では、Fast and Slow Thinking機構を視覚エージェントに組み込んだFaSTを紹介する。
FaSTは、システム1/2モード間の動的選択にスイッチアダプタを使用する。
モデルの信頼性を調整し、新しいコンテキストデータを統合することで、不確実で目に見えないオブジェクトに取り組む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:00:10 GMT)
Col-OLHTR: A Novel Framework for Multimodal Online Handwritten Text Recognition [82.9] オンライン手書き文字認識(OLHTR)は様々な用途で注目されている。
現在のアプローチは通常、OLHTRをシーケンス認識タスクとして扱い、単一のトラジェクトリまたはイメージエンコーダまたはマルチストリームエンコーダを使用する。
単ストリーム推論プロセスを維持しながら、トレーニング中にマルチモーダルな特徴を学習するコラボレーティブ学習ベースのOLHTRフレームワークCol-OLHTRを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:12:24 GMT)
Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models [75.6] 本稿では,DiffQKV の注目を含む新しいアーキテクチャを応用した,システムドメインに特化した効率的な大規模言語モデルを提案する。
我々は、モデルがK成分とV成分の圧縮に対して様々な感度を持つことを示す実験を行い、微分圧縮KVの開発に繋がる。
我々は最初の総合ベンチマークであるAIMiciusを紹介し、Sigmaはすべてのタスクで顕著なパフォーマンスを示し、52.5%の絶対的な改善でGPT-4を著しく上回った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:19:21 GMT)
SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering [74.0] SyncMindは、ソフトウェア工学において、大きな言語モデル(LLM)エージェントが直面している非同期の問題を体系的に定義するフレームワークである。
SyncMindをベースとしたSyncBenchは,実世界のCSEで24,332のエージェントアウトオブシンクシナリオを特徴とするベンチマークです。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:38:36 GMT)
GuideLLM: Exploring LLM-Guided Conversation with Applications in Autobiography Interviewing [73.8] 大規模言語モデル(LLM)は、指示の追従や質問応答といった人間の指導による会話に成功している。
本研究では, LLM誘導会話を, ゴールナビゲーション, (ii) コンテキストマネジメント, (iii) 共感エンゲージメントの3つの基本要素に分類した。
GPT-4o や Llama-3-70b-Instruct のような6つの最先端 LLM と比較し, 面接品質, 自伝生成品質の観点から検討した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:11:32 GMT)
SeaExam and SeaBench: Benchmarking LLMs with Local Multilingual Questions in Southeast Asia [72.9] 本研究では,東南アジア(SEA)アプリケーションシナリオにおけるLarge Language Models(LLM)の機能を評価するために,SeaExamとSeaBenchという2つの新しいベンチマークを紹介する。
英語翻訳から派生した既存の多言語データセットとは異なり、これらのベンチマークはSEA領域の現実シナリオに基づいて構築されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:40:25 GMT)
Optimizing Knowledge Integration in Retrieval-Augmented Generation with Self-Selection [72.9] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) がより正確で信頼性の高い応答を生成するのに有効であることが証明されている。
本稿では,自己選択型RAGフレームワークを提案する。このフレームワークでは,内部パラメトリック知識のみで生成されたペアの応答からLLMを選択できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:29:36 GMT)
EVEv2: Improved Baselines for Encoder-Free Vision-Language Models [72.1] 既存のエンコーダフリービジョン言語モデル(VLM)は、エンコーダベースモデルと性能ギャップを狭めている。
我々は,主流のエンコーダをベースとしたVLMと競合するエンコーダフリーVLMの効率的な戦略を開発する。
統一モデルにおいて、視覚と言語を適切に階層的に関連付けることで、モダリティ間の干渉を減少させることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:59:58 GMT)
Goku: Flow Based Video Generative Foundation Models [70.4] 直流変圧器を応用した画像・映像の共同生成モデルの最先端のファミリーは、業界をリードする性能を達成する。
データキュレーションパイプライン、モデルアーキテクチャ設計、フローの定式化、効率的で堅牢な大規模トレーニングのための高度なインフラなど、高品質なビジュアル生成を可能にする基本的な要素について詳述する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:56:35 GMT)
Low Tensor-Rank Adaptation of Kolmogorov--Arnold Networks [70.1] コルモゴロフ-アルノルドネットワーク(KAN)は、様々な領域における多層知覚(MLP)の代替としての可能性を示した。
微調整カンのためのローテンソルランク適応(LoTRA)を開発した。
微調整カンによる様々な偏微分方程式(PDE)を効率的に解くためのLoTRAの適用について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:57:07 GMT)
Teaching Models to Balance Resisting and Accepting Persuasion [69.7] PBT (Persuasion-Training) は正と負の説得のバランスをとることができる。
PBTにより、より小さな7-8Bモデル間の対話から生成されたデータを使用して、より大規模な70Bモデルのトレーニングを行うことができる。
PBTは, より安定な結果をもたらし, 順序依存の低減につながることが判明した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:09:46 GMT)
Hephaestus: Improving Fundamental Agent Capabilities of Large Language Models through Continual Pre-Training [69.1] Hephaestus-Forgeは、API関数呼び出し、本質的な推論、計画におけるLLMエージェントの機能を強化するために設計された大規模な事前トレーニングコーパスである。
Hephaestus-Forgeは、76,537のAPIを含む103Bのエージェント固有のデータで構成されている。
Hephaestus-Forge上でのトレーニングの継続により、Hephaestusは3つのエージェントベンチマークで、小規模から中規模のオープンソースLLMと商用LLMに匹敵するパフォーマンスを誇っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:54:34 GMT)
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models [69.0] TripoSGは入力画像に正確に対応して高忠実度3Dメッシュを生成することができる新しいパラダイムである。
結果として得られた3D形状は、高解像度の能力によって細部を拡大し、入力した現在年齢に対して例外的な忠実さを示す。
3Dジェネレーションの分野における進歩と革新を促進するため、我々はモデルを一般公開する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:07:54 GMT)
TEST-V: TEst-time Support-set Tuning for Zero-shot Video Classification [68.3] 我々は、ゼロショットビデオ分類(TEST-V)のためのTEst-time Support-set Tuningという新しいフレームワークを提案する。
サポートセットを複数のプロンプト(Multi-prompting Support-set Dilation, MSD)で拡張した後、学習可能なウェイトを通じてサポートセットを侵食し、キーキューをマイニングする。
$textbfTEST-V$は、4つのベンチマークで最先端の結果を達成し、サポートセットのディレーションとエロージョンに優れた解釈性を持つ。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:44:35 GMT)
Self-Correcting Decoding with Generative Feedback for Mitigating Hallucinations in Large Vision-Language Models [66.7] LVLM(Large Vision-Language Models)は、与えられた視覚入力と一致しない幻覚的テキスト応答を生成する傾向がある。
テキストから画像への生成モデルからのフィードバックをデコードプロセスに組み込んだ,新たなトレーニングフリーアルゴリズムである生成フィードバック付き自己修正デコード(DeGF)を導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:43:55 GMT)
Outsourced diffusion sampling: Efficient posterior inference in latent spaces of generative models [65.7] 本稿では、$p(mathbfxmidmathbfy) propto p_theta(mathbfx)$ という形式の後続分布からサンプリングするコストを償却する。
多くのモデルと関心の制約に対して、ノイズ空間の後方はデータ空間の後方よりも滑らかであり、そのような償却推論に対してより快適である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:49:54 GMT)
Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning [65.2] 推論能力は汎用知能の重要な構成要素である。
OpenAIのoシリーズモデルなどのプロプライエタリ企業による最近の進歩は、推論タスクに顕著な進歩をもたらした。
本稿では、数学的推論タスクのための textbfOutcome textbfREwtextbfArd ベースの強化 textbfLearning により達成できる性能限界を追求する新しい RL フレームワーク OREAL を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:57:29 GMT)
Demystifying Singular Defects in Large Language Models [62.0] 大規模言語モデル(LLM)では、ハイノームトークンの根本原因は未解明のままである。
理論的な洞察と経験的検証の両方を、近年のモデルで提供します。
量子化方式の改良とLCMシグネチャの設計の2つの実用的応用について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:09:16 GMT)
SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators [61.8] 既存の多言語テキストデトックス化へのアプローチは、並列多言語データセットの不足によって妨げられている。
本稿では,手動で収集・合成した多言語並列テキストデトックス化データセットであるSynthDetoxMを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:30:25 GMT)
History-Guided Video Diffusion [61.0] ビデオ拡散は、可変数のコンテキストフレーム上に設定されたビデオ条件を生成し、総称してヒストリと呼ばれる。
可変長履歴を導く上で重要な課題は、固定サイズの条件付けのみをサポートするアーキテクチャと、CFGスタイルの履歴ドロップアウトが不十分な経験的観察である。
DFoTによって一意に実現されたガイダンス手法であるHistory Guidanceを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:44:25 GMT)
Rethinking Large-scale Dataset Compression: Shifting Focus From Labels to Images [60.4] 蒸留と刈り取りの両文献の方法論を公平に評価するベンチマークを導入する。
我々のベンチマークでは、大規模データセットの主流データセット蒸留設定において、ランダムに選択されたサブセットでさえ驚くほどの競争性能を達成できることが示されている。
我々は、画像データのみを活用することに焦点を当てた、Prune, Combine, Augment(PCA)と呼ばれるデータセット圧縮のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:11:40 GMT)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.1] 本稿では,AI生成コンテンツ分類器におけるグループ固有のしきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のアプローチは、属性(例えば、テキストの長さと書き込みスタイル)に基づいて、データをサブグループに分割し、各グループの決定しきい値を学ぶ。
我々のフレームワークは、AIが生成する出力検出において、より堅牢で公平な分類基準の道を開く。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:22:15 GMT)
Investigating the Zone of Proximal Development of Language Models for In-Context Learning [59.9] 大規模言語モデル(LLM)の文脈内学習(ICL)の振る舞いを分析するための学習分析フレームワークを提案する。
我々は,各例のモデル性能に基づいて,LLMのZPDを測定することにより,ZPD理論をICLに適用する。
本研究はICLの複雑な多面的動作を明らかにし,この手法の理解と活用に関する新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:36:21 GMT)
Smoke and Mirrors in Causal Downstream Tasks [59.9] 本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:54:11 GMT)
Epidemiology-informed Network for Robust Rumor Detection [59.9] 本稿では, 疫学知識を統合し, 性能を高めるための新しい疫学情報ネットワーク(EIN)を提案する。
疫学理論をうわさ検出に適応させるため,各利用者が情報源情報に対する姿勢を付加することが期待されている。
実験結果から,提案したEINは実世界のデータセット上で最先端の手法より優れるだけでなく,樹木の深度にまたがる堅牢性も向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:45:01 GMT)
Pre-Trained Video Generative Models as World Simulators [59.5] 本研究では,事前学習した映像生成モデルを制御可能な世界シミュレータに変換するための動的世界シミュレーション(DWS)を提案する。
条件付き動作と生成した視覚的変化の正確なアライメントを実現するために,軽量で普遍的な動作条件付きモジュールを導入する。
実験により、DWSは拡散モデルと自己回帰変換モデルの両方に汎用的に適用可能であることが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:49:09 GMT)
Examining False Positives under Inference Scaling for Mathematical Reasoning [59.2] 本稿では,言語モデルにおける数学的問題解決における偽陽性解の有効性を体系的に検討する。
擬陽性が言語モデルの推論時間スケーリング行動にどのように影響するかを考察する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:49:35 GMT)
Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Ownership Verification with Reasoning [58.6] 大規模言語モデル (LLM) は、検索強化生成機構 (RAG) を通じて現実のアプリケーションに統合されつつある。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、通常、中毒攻撃を伴う。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:15:56 GMT)
Tamper-Resistant Safeguards for Open-Weight LLMs [57.9] オープンウェイトLLMにタンパ耐性保護具を組み込む方法を開発した。
本手法は良性を保持しながらタンパー抵抗を大幅に改善する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:26:14 GMT)
MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval [57.9] $textbfMultiVENT 2.0$は、大規模かつ多言語なイベント中心のビデオ検索ベンチマークである。
218,000以上のニュースビデオと、特定の世界イベントを対象とした3,906のクエリが提供されている。
予備的な結果は、最先端のビジョン言語モデルは、この課題にかなり苦労していることを示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:26:40 GMT)
Boost-and-Skip: A Simple Guidance-Free Diffusion for Minority Generation [57.2] 拡散モデルを用いて少数サンプルを生成するために,Boost-and-Skipと呼ばれる強力なガイダンスのない手法を提案する。
これらの一見自明な修正は、確固たる理論と実証的な証拠によって支えられていることを強調する。
我々の実験は、Boost-and-Skipが少数サンプルを生成する能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:37:26 GMT)
DocMamba: Efficient Document Pre-training with State Space Model [56.8] 本稿では,状態空間モデルに基づく新しいフレームワークDocMambaを紹介する。
グローバルなモデリング能力を保ちながら、計算複雑性を線形に減らすように設計されている。
HRDocの実験では、DocMambaの長さ外挿の可能性が確認された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:31:35 GMT)
Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene [56.7] 共同自動運転(CAV)は有望な方向のようだが、開発のためのデータ収集は簡単ではない。
本研究では,運転シーンにおける異なる視点から現実的な知覚を生み出すことを目的とした,救助支援のための新しいサロゲートを提案する。
シミュレーションされたコラボレーティブデータと実車データを組み合わせた,最初のソリューションを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:07:53 GMT)
Learning Clustering-based Prototypes for Compositional Zero-shot Learning [56.6] ClusProは、コンポジションゼロショット学習のための堅牢なクラスタリングベースのプロトタイプマイニングフレームワークである。
それは、多様化されたプロトタイプの集合を通じて、プリミティブの概念的境界を定義する。
ClusProは、学習可能なパラメータを追加することなく、非パラメトリックな方法でプロトタイプクラスタリングを効率的に実行する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:20:01 GMT)
RelGNN: Composite Message Passing for Relational Deep Learning [56.5] 本稿では,リレーショナルデータベースの特徴を捉えた新しいGNNフレームワークであるRelGNNを紹介する。
我々のアプローチの核となるのは、高次三部構造を形成するノードの列である原子経路の導入である。
RelGNNは、最先端の精度を最大25%改善して一貫して達成している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:58:40 GMT)
MARS: Unleashing the Power of Variance Reduction for Training Large Models [56.5] 深層ニューラルネットワークのための統合トレーニングフレームワークを提案する。
我々は,事前条件付き勾配最適化を利用するMARSの3つの例を紹介する。
その結果,MARSの実装はAdamより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:23:11 GMT)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.2] 本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。
まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。
本稿では,実証的リスク最小化法(DEM)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:52:17 GMT)
From Pixels to Components: Eigenvector Masking for Visual Representation Learning [55.6] 画像の可視部分からマスクを予測することは、視覚表現学習のための強力な自己教師型アプローチである。
本稿では,生のピクセルではなく,適切なデータ変換を行うマスキング戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:06:46 GMT)
FairDP: Certified Fairness with Differential Privacy [55.5] 本稿では,FairDPについて紹介する。FairDPは,トレーニングされたモデルの判断に対して,グループフェアネスの認定を提供するために設計された,新しいトレーニングメカニズムである。
FairDPの鍵となる考え方は、独立した個別グループのためのモデルをトレーニングし、データプライバシ保護のための各グループの勾配にノイズを加え、グループモデルの知識を統合して、下流タスクにおけるプライバシ、ユーティリティ、公正性のバランスをとるモデルを構築することである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:39:55 GMT)
EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation [55.3] 本稿では,エンボディ空間の構築と解釈を行う生成ロボティクス基礎モデルを提案する。
EnerVerseは、自己回帰的ビデオ拡散フレームワークを使用して、命令から将来のエンボディドスペースを予測する。
本稿では,生成モデルと4次元ガウススプラッティングを組み合わせたデータエンジンパイプラインであるEnerVerse-Dについて述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:36:02 GMT)
Dynamic Loss-Based Sample Reweighting for Improved Large Language Model Pretraining [55.3] 既存のリウェイト戦略は主にグループレベルのデータの重要性に焦点を当てている。
動的・インスタンスレベルのデータ再重み付けのための新しいアルゴリズムを提案する。
当社のフレームワークでは,冗長データや非形式データを優先的に再重み付けする戦略を考案することが可能です。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:57:15 GMT)
EquiTabPFN: A Target-Permutation Equivariant Prior Fitted Networks [55.2] 本研究では,この過小評価を不圧縮誤差の原因とみなし,等分散ギャップとよばれ,予測の不安定性を生じさせる。
これらの問題を緩和するために,出力次元の等値性を維持するために設計された新しいモデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:11:20 GMT)
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion [55.0] 投機的復号化は,大規模言語モデル推論を高速化する手法として広く採用されている。
本稿では,離散拡散モデルを用いてドラフトシーケンスを生成する投機的復号法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:51:18 GMT)
GAS: Generative Avatar Synthesis from a Single Image [55.0] 一つの画像からビュー一貫性と時間的コヒーレントなアバターを合成するための、一般化可能で統一されたフレームワークを導入する。
提案手法は, 回帰に基づく3次元再構成と拡散モデルの生成能力を組み合わせることで, このギャップを埋めるものである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:39 GMT)
A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.9] 高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:26:57 GMT)
Beyond Literal Token Overlap: Token Alignability for Multilinguality [53.7] 我々は,多言語トークン化の効果と品質を理解する新しい方法として,サブワードトークン整合性を提案する。
特に、この指標は、スクリプトが異なっており、リテラルトークンの重複が低い場合、多言語性を予測する。
言語間移動のための最適な言語ペアを特定するために,我々のサブワードトークン整合性指標を推奨する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:50:12 GMT)
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation [53.3] 光胸腺撮影と心電図は、連続血圧モニタリング(BP)を可能にする可能性がある。
しかし、データ品質と患者固有の要因の変化のため、正確で堅牢な機械学習(ML)モデルは依然として困難である。
本研究では,1つのモータリティで事前学習したモデルを効果的に利用して,異なる信号タイプの精度を向上させる方法について検討する。
本手法は, 拡張期BPの最先端精度を約1.5倍に向上し, 拡張期BPの精度を1.5倍に向上させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:33:12 GMT)
Satisfaction-Aware Incentive Scheme for Federated Learning in Industrial Metaverse: DRL-Based Stackbelberg Game Approach [52.8] Industrial Metaverseはフェデレーション学習とメタコンピューティングを使用して、データのプライバシを確保しながら、モデルを分散的にトレーニングする。
本稿では、データサイズ、年齢情報(AoI)、学習遅延を考慮に入れた満足度関数を設計する。
満足度関数は、モデルトレーニングにおけるノード参加を動機付けるユーティリティ関数に組み込まれる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:33:36 GMT)
Generalizable Implicit Motion Modeling for Video Frame Interpolation [52.0] フローベースビデオフレーム補間(VFI)における動きの重要性
本稿では,動きモデリングVFIの新規かつ効果的なアプローチである一般インプリシット・モーション・モデリング(IMM)を紹介する。
我々のGIMMは、正確にモデル化された動きを供給することによって、既存のフローベースVFIワークと容易に統合できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:49:25 GMT)
Towards Efficient and Intelligent Laser Weeding: Method and Dataset for Weed Stem Detection [51.7] 本研究は,レーザー除草における雑草認識の実証的研究としては初めてである。
我々は,雑草の検出と雑草の局在を1つのエンドツーエンドシステムに統合した。
提案システムは,既存の雑草認識システムと比較して,雑草の精度を6.7%向上し,エネルギーコストを32.3%削減する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:42:46 GMT)
ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates [51.6] 思考テンプレートのスケーリングによる階層的LLM推論は、推論検索空間を効果的に最適化することができる。
i)類似または関連する推論問題に一般化可能な500ほどの高レベルな思考テンプレートを含む構造化・汎用的な思考テンプレートライブラリ,(ii)長いCoTではなく一連の思考テンプレート上で階層的な強化学習を行う,(iii)全く新しい推論スケーリングシステム,の3つの革新を紹介した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:51:47 GMT)
Powerformer: A Transformer with Weighted Causal Attention for Time-series Forecasting [50.3] 我々は,非因果重みをスムーズな重み付き崩壊に応じて再加重する因果重みに置き換える新しいトランスフォーマーであるPowerformerを紹介する。
我々の実証実験の結果,Powerformer は公開時系列ベンチマークで最先端の精度を達成できた。
分析の結果、トレーニング中にモデルの局所性バイアスが増幅され、時系列データとパワールールに基づく注意の相互作用が示されることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:42:11 GMT)
Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.9] 我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:59:27 GMT)
A ripple in time: a discontinuity in American history [49.8] 歴史的データセットの時間的側面(言語拡張と無関係)と人格的側面(著者帰属)を明らかにするための新しいアプローチを提案する。
我々は過去42人のアメリカ合衆国大統領によって与えられた連邦の住所に対する我々のアプローチを例示する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:14:44 GMT)
Towards Internet-Scale Training For Agents [49.8] 我々は、人間のアノテーションを使わずに、Webエージェントのインターネットスケールトレーニングを容易にするパイプラインを開発した。
Llama 3.1 70Bに基づくエージェントは150kサイトのタスクの16.7%を解決している。
パイプラインによって生成されたデータに関するトレーニングは、人間のデモに関するトレーニングと競合します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:54:05 GMT)
Guaranteed efficient energy estimation of quantum many-body Hamiltonians using ShadowGrouping [49.4] 量子多体系のエネルギーの推定は、様々な研究分野におけるパラダイム的な課題である。
本研究の目的は,全測定予算から最も高い証明可能な精度が得られる単一キュービット計測による最適戦略を見出すことである。
私たちはShadowGroupingと呼ばれる実用的で効率的な見積もり戦略を開発します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:29:30 GMT)
KARST: Multi-Kernel Kronecker Adaptation with Re-Scaling Transmission for Visual Classification [48.7] 特定のタスクのための微調整された事前学習された視覚モデルは、コンピュータビジョンにおいて一般的なプラクティスである。
近年,パラメータ効率向上のためのPEFT法が普及している。
本稿では,再スケーリングトランスミッション(KARST)を用いたマルチカーネル・クローネッカー適応手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:56:14 GMT)
From No to Know: Taxonomy, Challenges, and Opportunities for Negation Understanding in Multimodal Foundation Models [48.7] 否定は、欠如、否定、矛盾を含む言語構造であり、多言語多モーダル基盤モデルにとって重要な課題である。
本稿では, 否定構造を包括的に分類し, 構造的, 意味的, 文化的要因がマルチモーダル基盤モデルにどのように影響するかを考察する。
我々は、特別なベンチマーク、言語固有のトークン化、きめ細かい注意機構、高度なマルチモーダルアーキテクチャを提唱する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:55:13 GMT)
ProjectTest: A Project-level Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms [48.4] 単体テスト生成はLLMの有望かつ重要なユースケースとなっている。
ProjectTestは、Python、Java、JavaScriptをカバーするユニットテスト生成のためのプロジェクトレベルのベンチマークである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:24:30 GMT)
Focus On This, Not That! Steering LLMs With Adaptive Feature Specification [48.3] Focus Instruction Tuning (FIT)は、大きな言語モデルを訓練し、他を無視しながら特定の特徴に注目して応答を条件付けする。
焦点調整されたモデルは、推論時に異なる特徴に焦点を合わせることで適応的に操縦できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:03:19 GMT)
Steel-LLM:From Scratch to Open Source -- A Personal Journey in Building a Chinese-Centric LLM [47.6] Steel-LLMは、高品質のオープンソースモデルを作成することを目的として、スクラッチから開発された中国語中心の言語モデルである。
本稿では、データ収集、モデル設計、トレーニング方法論、その過程で遭遇した課題など、プロジェクトの主要なコントリビューションについて包括的に要約する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:31:37 GMT)
TimeDART: A Diffusion Autoregressive Transformer for Self-Supervised Time Series Representation [47.6] 我々は,新しい自己教師型時系列事前学習フレームワークであるTimeDARTを提案する。
TimeDARTは2つの強力な生成パラダイムを統合し、より伝達可能な表現を学ぶ。
時系列予測と分類のための公開データセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:31:08 GMT)
Safety is Essential for Responsible Open-Ended Systems [47.2] オープンエンドレスネス(Open-Endedness)とは、AIシステムが新規で多様なアーティファクトやソリューションを継続的に自律的に生成する能力である。
このポジションペーパーは、Open-Ended AIの本質的に動的で自己伝播的な性質は、重大な、未発見のリスクをもたらすと主張している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:27:12 GMT)
Beyond Any-Shot Adaptation: Predicting Optimization Outcome for Robustness Gains without Extra Pay [46.9] 本稿では,モデル予測タスクサンプリング(MPTS)を提案し,タスク空間と適応リスクランドスケープとの接続を確立する。
MPTSは、タスクエピソード情報を生成モデルで特徴付け、タスク固有の適応リスク値(タスク固有の適応リスク値)を後部推論から予測する。
MPTSはゼロショット、少数ショット、多ショットの学習パラダイムにシームレスに統合することができ、適応性の堅牢性を高め、余分なコストを伴わずに学習効率を維持する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:29:09 GMT)
The AI off-switch problem as a signalling game: bounded rationality and incomparability [45.8] 我々は、人間の意思決定者がAIエージェントにその好みを伝える合図ゲームとしてオフスイッチ問題をモデル化する。
我々は、AIシステムがオフスウィッチを無効にすることを避けるために必要な条件は、人間の実用性に対する不確実性であることを示した。
また、メッセージコストが最適な戦略にどのように影響するかを分析し、非互換性を含むシナリオまで分析を拡張します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:44:49 GMT)
SnipGen: A Mining Repository Framework for Evaluating LLMs for Code [45.0] 言語モデル(LLM)は、コードリポジトリを含む広範なデータセットに基づいてトレーニングされる。
それらの有効性を評価することは、トレーニングに使用されるデータセットと評価に使用されるデータセットとが重複する可能性があるため、大きな課題となる。
SnipGenは、コード生成のために、様々な下流タスクをまたいだ迅速なエンジニアリングを活用するように設計された包括的なリポジトリマイニングフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:28:15 GMT)
Diverse Preference Optimization [44.6] DivPO(Diverse Preference Optimization)は,従来のパイプラインよりもはるかに多様な応答を生成する最適化手法である。
DivPOでは、まず、反応のプールと、それら間の多様性の尺度を考慮し、選択された例を、よりレアだが高品質なものとして選択することで、好みのペアを選択する。
DivPOは45.6%のパーソナ属性を生成し、ストーリーの多様性は74.6%増加し、標準ベースラインと同じような勝利率を維持している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:22:52 GMT)
Position: Episodic Memory is the Missing Piece for Long-Term LLM Agents [43.9] 本稿では,多言語モデル(LLM)エージェントのためのエピソディックメモリフレームワークを提案する。
このポジションペーパーは、長期的なエージェントの開発を促進するために、明らかに統合されたエピソード記憶に焦点を合わせるのが正しい時だと論じている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:14:51 GMT)
Exploiting Sparsity for Long Context Inference: Million Token Contexts on Commodity GPUs [43.6] 極端なスケールでの推論は、かなりの計算資源を必要とする。
本稿では,各生成ステップにおいて最も関連性の高いトークンにのみ参加することで,フォワードパスのコストを低減できる可変機構を提案する。
実験結果から,鍵数や値の減少によって生じる疎結合をモデルが処理できることが判明した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:47:04 GMT)
Do we really have to filter out random noise in pre-training data for language models? [43.0] インターネットから収集された事前学習されたテキストデータは、必然的にデコードエラーや規制されていないウェブコンテンツに起因するランダムノイズを含む。
この現象を理論的に正当化し、多言語モデルの成功を解明する。
実験により、下流タスクにおけるモデルの性能はNTP損失のみに基づくものではなく、ランダムノイズが下流タスクのパフォーマンスを劣化させる可能性があることが示された。
本稿では,下流タスクヘッドの復調能力を明確に向上させる,新しいプラグアンドプレイ型局所勾配整合損失を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:01:55 GMT)
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering [42.9] 大規模言語モデル(LLM)は、言語固有の文化的知識と一般知識の両方を取得するために、多言語コーパスで事前訓練されている。
言語モデル(CALM)の言語間知識の整合性について検討する。
我々は、異なる言語間でモデルの知識を整合させるために、直接選好最適化(DPO)を用いる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:46:06 GMT)
Drivable 3D Gaussian Avatars [42.1] 人体用多層型3D制御モデルであるD3GAについて述べる。
3Dガウスのような原始体は自然に再配向し、核はカプセル化四面体の変形勾配によって拡張される。
ケージベースモデルを用いて,アバターを衣服,手,顔などの層に分解する合成パイプラインを導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:17:32 GMT)
No Trick, No Treat: Pursuits and Challenges Towards Simulation-free Training of Neural Samplers [41.9] サンプリング問題は,正規化定数までしか知られていない分布からサンプルを抽出することを目的としている。
近年、高次元データ分布を近似する生成モデリングのブレークスルーが、この問題に対するニューラルネットワークベースの手法の開発に大きな関心を喚起している。
本稿では,時間依存正規化フローの助けを借りてシミュレーション不要なトレーニングを可能にする,従来の手法のエレガントな修正を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:13:11 GMT)
LawGPT: Knowledge-Guided Data Generation and Its Application to Legal LLM [41.3] 法理推論のための知識誘導型データ生成フレームワークであるKgDGを提案する。
我々は、50Kの高品質な例を含む合成法的推論データセットを作成する。
我々の訓練されたLawGPTは、既存の法定LLMよりも優れています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:40:35 GMT)
Systematic Outliers in Large Language Models [41.2] 外乱はLarge Language Models (LLM) で広く観測されている。
LLMの生成過程,根本原因,機能について詳細な解析を行った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:54:17 GMT)
Habitizing Diffusion Planning for Efficient and Effective Decision Making [41.1] 強力だが遅い拡散計画モデルを高速な意思決定モデルに変換するフレームワークであるHabiを紹介します。
ラップトップのCPUを使っても、習慣化されたモデルは平均800Hz以上の意思決定周波数を達成できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:40:32 GMT)
Wandering around: A bioinspired approach to visual attention through object motion sensitivity [41.0] アクティブビジョンは動的視覚認識を可能にし、コンピュータビジョンにおける静的フィードフォワードアーキテクチャの代替を提供する。
哺乳類の網膜に触発されたイベントベースのカメラは、非同期シーンの変化を捉えてこの機能を強化する。
イベントベースのカメラが動いている間、移動物体を識別するためには、エージェントは物体の動きのセグメンテーション機構を必要とする。
本研究は、物体の運動感度を介して選択的注意を喚起するための、畳み込みニューラルネットワークバイオインスパイアされた注意システムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:16:30 GMT)
Testing software for non-discrimination: an updated and extended audit in the Italian car insurance domain [40.8] 価格アルゴリズムの公正さは、保護された属性に基づいて差別することなく、基本サービスへの公平なアクセスを可能にする。
我々は、ブラックボックステストを使ってイタリアの自動車保険会社が使用している価格アルゴリズムを監査する以前の実証研究を再現した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:16:01 GMT)
SAMRefiner: Taming Segment Anything Model for Universal Mask Refinement [40.4] マスク改善タスクにSAMを適用することで,汎用的で効率的なアプローチを提案する。
具体的には,SAMの多様な入力プロンプトをマイニングするためのマルチプロンプト掘削手法を提案する。
ターゲットデータセット上のジェネリックSAMRefinerのパフォーマンスをさらに向上するため、IoU適応ステップを追加してSAMRefiner++にメソッドを拡張します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:33:15 GMT)
Quantile Multi-Armed Bandits with 1-bit Feedback [40.2] リスク感度と通信制約の要素を含むベストアーム識別のバリエーションについて検討する。
本研究では,雑音の多い二分探索をサブルーチンとして利用し,学習者が1ビットフィードバックによって定量報酬を推定できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:03:33 GMT)
AppVLM: A Lightweight Vision Language Model for Online App Control [39.9] 軽量ビジョン言語モデル(VLM)であるAppVLMを紹介する。
まず、AndroidControlデータセットでオフラインでチューニングします。
そして、AndroidWorld環境からデータを収集することで、ポリシーを洗練します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:32:21 GMT)
Gradient-free variational learning with conditional mixture networks [39.8] 条件付き混合ネットワーク(CMN)の高速・勾配なし変分法であるCAVI-CMNを導入する。
CAVI-CMNは、バックプロパゲーションを伴う最大推定値(MLE)と比較して、競争力があり、しばしば優れた予測精度を達成する。
入力サイズや専門家の数が増加するにつれて、計算時間はMLEと競合的にスケールする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:54:25 GMT)
HumanDiT: Pose-Guided Diffusion Transformer for Long-form Human Motion Video Generation [39.7] 提案するHumanDiTは,14,000時間の高品質ビデオを含むデータセットに基づいてトレーニングされたポーズ誘導拡散変換器(DiT)ベースのフレームワークである。
HumanDiTは多数のビデオ解像度と可変シーケンス長をサポートし、長いシーケンスのビデオ生成の学習を容易にする。
実験では、様々なシナリオにまたがる長めの、ポーズの正確なビデオを生成する上で、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:51:29 GMT)
K-ON: Stacking Knowledge On the Head Layer of Large Language Model [39.6] 知識グラフ(KG)のシナリオでは、エンティティは基本的な単位であり、エンティティを特定するには少なくともいくつかのトークンが必要である。
我々は,次のkステップ予測に複数のヘッドレイヤを用いて,KGの知識をLLMに統合するK-ONを提案する。
K-ONは1ステップでエンティティレベルの結果を生成するだけでなく、エンティティに対する対照的な損失を可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:45:56 GMT)
Mining Your Own Secrets: Diffusion Classifier Scores for Continual Personalization of Text-to-Image Diffusion Models [39.5] 現実の世界では、ユーザーは複数の概念のモデルを一度に1つずつパーソナライズしたいと考えるかもしれない。
ほとんどのパーソナライズ手法は、新しい概念の獲得と以前の概念の維持のバランスを見つけることができない。
本稿では,テキスト・画像拡散モデルのパラメータ空間と関数空間の正規化を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:06:39 GMT)
Spectral-factorized Positive-definite Curvature Learning for NN Training [39.3] Adam(W) や Shampoo のような訓練手法は正定値の曲率行列を学習し、プレコンディショニングの前に逆根を適用する。
スペクトル分解正定曲率推定を動的に適用するリーマン最適化手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:07:04 GMT)
Embodied Red Teaming for Auditing Robotic Foundation Models [39.2] Embodied Red Teaming (ERT)は、言語条件ロボットモデルをテストするための多様で困難な命令を生成する。
ERTは、視覚言語モデル(VLM)による自動化されたレッドチーム化技術を使用して、文脈的に基礎があり、難しい命令を生成する。
実験結果から, 最先端の言語調和型ロボットは, ERT生成命令で不安全あるいは不安全に動作することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:32:27 GMT)
Joint Learning of Local and Global Features for Aspect-based Sentiment Classification [39.1] アスペクトベースの感情分類(ASC)は、与えられたアスペクト項によって与えられた感情の極性を評価することを目的としている。
本稿では,長距離情報を効果的に取得するためのグローバルエンコーダとして,デュアルレベルグラフアテンションネットワークを提案する。
我々のモデルはSemEval 2014とTwitterのデータセットの両方で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:01:30 GMT)
TANGLED: Generating 3D Hair Strands from Images with Arbitrary Styles and Viewpoints [39.0] 既存のテキストや画像誘導生成手法は、多様なスタイルの豊かさと複雑さに対処できない。
本稿では,3次元ヘアストランド生成の新しいアプローチであるTANGLEDについて述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:26:02 GMT)
Vertical Federated Learning with Missing Features During Training and Inference [37.4] 本稿では,ニューラルネットワークに基づくモデルの学習と推論を効率的に行うための垂直連合学習手法を提案する。
本手法は, 欠落した特徴がなくても, 最適近傍に線形収束することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:52:40 GMT)
Deciphering Functions of Neurons in Vision-Language Models [37.3] 本研究の目的は、視覚言語モデル(VLM)の内部を探索し、個々のニューロンの機能を理解することである。
入力された視覚トークンやテキストトークンに関してニューロンの活性化を観察し、いくつかの興味深い知見を明らかにした。
我々は、GPT-4oのアシスタントを用いて、ニューロンの説明を自動化するフレームワークを構築した。
視覚ニューロンに対しては,視覚ニューロンに対する説明の信頼性を評価するためのアクティベーションシミュレータを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:00:06 GMT)
Fuzzy to Clear: Elucidating the Threat Hunter Cognitive Process and Cognitive Support Needs [37.2] この研究は、脅威ハンターの生きた経験を理解するための人間中心のアプローチを強調した。
我々は、脅威ハンターが脅威ハンティングセッション中にどのようにメンタルモデルを構築し、洗練するかのモデルを導入する。
私たちは、それらをサポートするツールを強化するために、5つの実行可能な設計提案を提案します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:23:40 GMT)
ACECODER: Acing Coder RL via Automated Test-Case Synthesis [36.7] 既存のコードデータから広範な(問い合わせ、テストケース)ペアを生成するパイプラインを設計します。
我々は,Bradley-Terry損失を伴う報酬モデルをトレーニングするために,サンプルプログラムのパスレートに基づいて選好ペアを構築した。
RLトレーニングは,80段階の最適化ステップにおいて,HumanEval+を25%以上,MBPP+を6%以上改善できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:40:00 GMT)
Towards a Principled Framework for Disclosure Avoidance [36.6] データ利用者のニーズが変わるにつれて、機関は使用する開示回避システムを再設計する必要がある。
データの開示リスクに対応するために保護の強度を調整できるシステムの能力は、価値のある特徴である。
本稿では,これらの特徴を,選択したシステムから独立して行う必要がある実装決定とを区別する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:58:06 GMT)
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment [36.5] 大きな言語モデル(LLM)は印象的な能力を示すが、人間の好みに注意深く対応する必要がある。
テストタイムアライメント手法は、報酬モデル(RM)を使用して凍結したLLMを再トレーニングせずにガイドすることでこの問題に対処する。
我々は、Autoregressive Reward Modelを活用するテスト時間アライメントアプローチであるGenARMを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:20:07 GMT)
Progressive Collaborative and Semantic Knowledge Fusion for Generative Recommendation [36.5] 本稿では, ProRec という, 進化的協調的・意味的知識融合モデルを提案する。
最初の段階では、意味的知識を協調的な埋め込みに統合する、モダリティ間の知識アライメントタスクを提案する。
第2段階では,意味的・協調的なモダリティから知識を効果的に把握し,統合することを目的とした,モダリティ内知識蒸留タスクを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:08:37 GMT)
When, Where and Why to Average Weights? [36.1] トレーニング軌道に沿ってチェックポイントを平均化することは、機械学習モデルの一般化性能を改善するための強力なアプローチである。
平均化はトレーニングを著しく加速し、最小限の実装とメモリコストの価格でかなりの効率向上をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:40:48 GMT)
Leveraging Allophony in Self-Supervised Speech Models for Atypical Pronunciation Assessment [36.1] アロフォニー(Allophony)は、その音素環境に基づく音素の音素的実現のバリエーションを指す。
最近の音素ベースのアプローチは、様々な実現を単一音素として扱うことでこれを単純化することが多い。
複数のサブクラスタで音素分布をモデル化する新しい手法であるMixGoPを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:46:42 GMT)
Adaptive Perception for Unified Visual Multi-modal Object Tracking [35.8] APTrackは、マルチモーダル適応認識のために設計された新しい統合トラッカーである。
従来の方法とは異なり、APTrackは等価なモデリング戦略を通じて統一された表現を模索している。
我々のトラッカーは適応的なモーダリティ相互作用モジュールを統合し、モーダリティ間の相互作用を効率的にブリッジする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:50:26 GMT)
Communication-Efficient Federated Optimization over Semi-Decentralized Networks [35.7] 通信効率は、大規模ネットワークにおいて最も困難なボトルネックの1つである。
本稿では,エージェント間通信とエージェント間通信の両方を行う半分散通信プロトコルの通信効率について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:46:15 GMT)
From Image to Video: An Empirical Study of Diffusion Representations [35.5] 拡散モデルは生成モデルに革命をもたらし、画像合成やビデオ合成において前例のないリアリズムを可能にした。
この研究は、視覚的理解のための映像と画像の拡散目標の直接比較として初めて行われ、表現学習における時間情報の役割についての洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:53:46 GMT)
CoS: Chain-of-Shot Prompting for Long Video Understanding [35.4] Chain-of-Shot prompting (CoS)は、ショット選択をテスト時の視覚的プロンプト最適化としてフレーム化することを目的としており、ショットとタスクのアライメントを最適化することで、ビデオセマンティックタスクに適応したショットを選択する。
CoS は,(1) 擬似時間的グラウンドを行うバイナリビデオ要約機構,(2) タスク関連ショットを識別するバイナリコーディングの発見,(2) タスク関連ショットと無関係な負ショットとをペア(整列)に展開するビデオ共推論モジュール,の2つの重要な部分を有している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:03:05 GMT)
Trainable Weight Averaging: Accelerating Training and Improving Generalization [35.2] 提案手法は,候補重みを対象とする減量部分空間内で動作する新しい最適化手法であるTWAを導入する。
TWAは柔軟性が高く、異なるトレーニングシナリオに適用できる。
大規模アプリケーションでは,並列計算と低ビット圧縮を組み合わせた分散トレーニングフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:21:42 GMT)
Linear Bandits with Partially Observable Features [35.1] 本稿では,部分的に観測可能な特徴を持つ線形帯域問題を導入し,部分的な報奨情報と突発的な推定を行う。
遅延部分に対する適切なアドレスがなければ、後悔は、報酬に対する影響が不明であるため、決定の地平線上で線形に増加する可能性がある。
本稿では,潜在特徴を扱うための新しい解析法と,サブ線形後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:15:38 GMT)
Spindle: Efficient Distributed Training of Multi-Task Large Models via Wavefront Scheduling [35.1] Spindleは、マルチタスク(MT)マルチモーダル(MM)モデルのウェーブフロントスケジューリングによるリソース効率のトレーニングに適した、新しいトレーニングシステムである。
実験では、スピンドルの性能と効率が向上し、スピードアップ比は最先端のトレーニングシステムと比較して最大71%向上した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:00:47 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation in Low-Data Regimes [34.9] We show that best-distilled models are outperform the teacher model by 5-7 WER points and are on well as or outperform similar supervised data filtering setups。
私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算効率とメモリ効率も25~50%向上しています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:27:01 GMT)
A physics-based data-driven model for CO$_2$ gas diffusion electrodes to drive automated laboratories [34.8] 再生可能エネルギーを含む高エネルギー分子へのCO$$の電気化学的還元は、エネルギー貯蔵にとって有望な道である。
本稿では,GDE設計の高次元パラメータ空間をアクティブな学習コンテキストで効率的に探索するモデリングフレームワークを提案する。
我々は,AdaCarbon自動実験室が収集した実際の電気化学データを用いて,シミュレーションされた能動学習装置にモデルをデプロイする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:20:10 GMT)
Is It Navajo? Accurate Language Detection in Endangered Athabaskan Languages [34.8] ナヴァホのような絶滅危惧言語は、現代の言語技術では著しく不足している。
本研究では、現在ネイティブアメリカン言語をサポートしていないGoogleの言語識別(LangID)ツールを評価する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:42:15 GMT)
Position: It's Time to Act on the Risk of Efficient Personalized Text Generation [34.5] 近年、高品質なオープンソースAIテキストモデル(LLM)が急増し、高品質なパーソナライズされたモデルが作成できるようになった。
これらの進歩は、悪質なアクターが特定の個人を偽装することが事実上可能となることによって、新たな安全リスクももたらしたと論じる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:25:11 GMT)
Automated Data Augmentation for Few-Shot Time Series Forecasting: A Reinforcement Learning Approach Guided by a Model Zoo [34.4] 本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:54:27 GMT)
On the Emergence of Thinking in LLMs I: Searching for the Right Intuition [34.3] 自己学習による強化学習(RLSP)というポストトレーニングフレームワークを提案する。
RLSPは、推論プロセスの人間または合成的なデモンストレーションによる微調整、多種多様な効率的な推論行動を促進するための探索報酬信号の使用、報酬ハッキングを予防しながら正当性を確保するための結果検証器によるRLトレーニングの3段階を含む。
数学領域における実証的研究は、RLSPが推論を改善することを示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:52:04 GMT)
STRIDE: Automating Reward Design, Deep Reinforcement Learning Training and Feedback Optimization in Humanoid Robotics Locomotion [33.9] 我々は,人型ロボットの移動作業に対する報酬設計,DRLトレーニング,フィードバック最適化を自動化するために,エージェント工学に基づく新しいフレームワークSTRIDEを紹介する。
エージェントエンジニアリングの構造化された原則と大きな言語モデル(LLM)を組み合わせることで、STRIDEはタスク固有のプロンプトやテンプレートに頼ることなく報酬関数を生成し、評価し、反復的に洗練する。
ヒューマノイドロボットの形態を特徴とする多様な環境において、STRIDEは最先端の報酬設計フレームワークであるEUREKAよりも優れており、効率とタスクパフォーマンスが大幅に向上している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:52:51 GMT)
MeshUp: Multi-Target Mesh Deformation via Blended Score Distillation [33.4] 複数のターゲット概念に対して3Dメッシュを変形させる手法であるMeshUpを提案する。
概念はテキストクエリ、例えば「犬」や「カメ」、インスピレーションのあるイメージとして定義することができる。
概念の影響を効果的に制御し, 新規なスコア蒸留手法を用いて混合することができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:30:45 GMT)
Quantum Two-Way Protocol Beyond Superdense Coding: Joint Transfer of Data and Entanglement [33.3] 量子対を絡めて古典的なビットを伝送するための双方向通信プロトコルに一方向超深符号化の一般化を導入する。
提案プロトコルは, 絡み合ったペアとスーパーデンス符号化の提供に共同で対処し, 通信プロトコル内の絡み合いを管理するための統合的なアプローチを導入する。
本稿では,NetSquidフレームワークに基づく計算機シミュレーションにおけるプロトコルの実装結果について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:40:21 GMT)
Non-literal Understanding of Number Words by Language Models [33.2] 人間は自然に、文脈、世界知識、話者意図を組み合わせた、意味のない数字を解釈する。
大規模言語モデル (LLM) も同様に数字を解釈し, ハイパボラ効果と実効ハロ効果に着目した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:03:00 GMT)
FlexSP: Accelerating Large Language Model Training via Flexible Sequence Parallelism [33.2] 既存のシーケンス並列化法は、均質なシーケンス長(すなわち全ての入力シーケンスの長さが等しい)を仮定し、従って全ての入力シーケンスに対して単一の静的散乱戦略を利用する。
LLMトレーニングコーパスの配列長は,長い尾分布の後に大きく変動することがわかった。
この問題に対処する不均一適応列並列化法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:00:50 GMT)
Reparameterization invariance in approximate Bayesian inference [32.9] 線形化の成功を説明するために, 線形化の新たな幾何学的視点を構築した。
これらのreパラメータ化不変性は、元のニューラルネットワーク予測に拡張可能であることを実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:12:37 GMT)
Detecting Backdoor Samples in Contrastive Language Image Pretraining [32.9] 対照的に、CLIP (Contrastive Language-image Pretraining) は、バックドア攻撃の危険性が指摘されている。
これにより、CLIPを使用して未調査のWebデータ上で大規模なモデルを事前トレーニングする現在のプラクティスに対するセキュリティ上の懸念が高まる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:04:21 GMT)
Is a Peeled Apple Still Red? Evaluating LLMs' Ability for Conceptual Combination with Property Type [32.8] CCPT(Conceptual Combination with Property Type dataset)を導入する。
CCPTは12.3Kの注釈付き三つ子、名詞句、プロパティ、プロパティタイプから構成される。
CCPTを用いて,LLMを総合的に評価するための3種類のタスクを確立する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:52:17 GMT)
Confidence Elicitation: A New Attack Vector for Large Language Models [32.2] 数十億のパラメータを持つ大規模言語モデル(LLM)は、以前の小さな言語と同様、敵攻撃に苦しむ。
クローズドソースモデルの導入により、生成された出力とは別に、モデルに関する情報は得られない。
これは、現在のブラックボックス攻撃が最終予測を利用して攻撃が成功したかどうかを検出することを意味する。
本研究は,ブラックボックスアクセスのみを分類した状態で,出力確率を用いた攻撃誘導の可能性について検討し,実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:46:48 GMT)
Learning Counterfactual Outcomes Under Rank Preservation [32.2] 本稿では, 対実結果の同定と推定のための原則的アプローチを提案する。
我々の理論的解析は、ランク保存仮定が同質性や厳密な単調性仮定よりも強くないことを示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:36:57 GMT)
Enhancing Cost Efficiency in Active Learning with Candidate Set Query [31.8] 本稿では,候補集合クエリと呼ばれる新しいクエリ設計を特徴とする,コスト効率の高い能動学習フレームワークを提案する。
従来のALクエリとは異なり、オラクルはすべての可能なクラスを検査する必要があるが、我々のメソッドは、基底真実クラスを含む可能性のある候補クラスのセットを絞り込む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:20:28 GMT)
PiKE: Adaptive Data Mixing for Multi-Task Learning Under Low Gradient Conflicts [31.6] マルチタスク学習における鍵となる課題は、異なるデータソース間の最適なデータミキシングとサンプリング戦略を決定することである。
適応型データ混合アルゴリズムであるPiKEを導入し、トレーニングを通してタスクコントリビューションを動的に調整する。
我々は、PiKEの理論的収束保証を確立し、静的および非適応混合戦略よりも優位性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:23:05 GMT)
Compressed Image Generation with Denoising Diffusion Codebook Models [31.6] 本稿では,高品質な画像サンプルと非圧縮ビットストリーム表現を生成する新しい生成手法を提案する。
これは、逆拡散における標準ガウスノイズサンプリングを、固定イドガウスベクトルの予め定義されたコードブックから選択したノイズサンプルに置き換えることによって得られる。
DDCMを利用して、与えられた画像に最もよくマッチするコードブックからノイズを抽出し、生成モデルを高能率な損失画像に変換する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:11:20 GMT)
LANTERN++: Enhanced Relaxed Speculative Decoding with Static Tree Drafting for Visual Auto-regressive Models [31.2] LANTERN++は、静的ツリーのドラフトと緩和された受け入れ条件を統合する新しいフレームワークで、低信頼の予測とは独立してドラフトを選択できる。
最先端のビジュアルARモデルの実験では、LANTERN++は推論を著しく加速し、標準的なARデコーディングよりも最大$mathbftimes 2.56$のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:05:18 GMT)
Adaptive Prompting: Ad-hoc Prompt Composition for Social Bias Detection [30.8] 本稿では,与えられた入力に対する最適プロンプト合成アドホックを予測する適応的プロンプト手法を提案する。
我々は,意味的理解を必要とする文脈に依存した社会的偏見検出にアプローチを適用した。
我々の手法は高い検出性能を確実に保証し、いくつかの設定で最善である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:06:19 GMT)
DReSS: Data-driven Regularized Structured Streamlining for Large Language Models [30.5] 大規模言語モデル(LLM)は、様々な領域で大きな進歩を遂げているが、その規模が大きくなると高い計算とメモリコストがもたらされる。
本稿では,まず正規化,次にプーン,そして最後に微細構造を適用する新しいパラダイムを提案する。
プルーニングされるコンポーネントを正規化するために少量のデータを活用することで、DReSSは、重要な情報をモデルの残りの部分に前もって明示的に転送する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:07:04 GMT)
Weight-based Analysis of Detokenization in Language Models: Understanding the First Stage of Inference Without Inference [30.3] モデルの重みを解析することにより,デトケン化段階のいくつかの重要な側面を純粋に理解できることが示されている。
我々の分解は、位置関連、トークン関連、混合効果の相対的寄与を定量化する解釈可能な用語をもたらす。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:26:57 GMT)
Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance [30.2] Animate Anyone 2を紹介する。
本研究では,文字と環境の関係をより効果的に特徴づける形状に依存しないマスク戦略を提案する。
また、モデルがより多様な動きパターンを扱えるように、ポーズ変調戦略を導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:20:11 GMT)
A Review and Collection of Metrics and Benchmarks for Quantum Computers: definitions, methodologies and software [30.0] 本稿では,量子コンピュータのメトリクスとベンチマークについて概説する。
すべてのメトリクスにまたがる定義の一貫性のあるフォーマットと、メトリクスを評価に使用するオープンソースソフトウェアにリンクすることで再現可能なアプローチを含んでいる。
我々は国際標準化ワーキンググループを設立できる5つの分野を特定した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:48:27 GMT)
Post-detection inference for sequential changepoint localization [29.4] 本研究では,データ依存停止時間まで観測したデータのみを用いて,変化点の局所化の問題について検討する。
まず、事前および変更後分布が知られていると仮定した場合に、未知の変更点に対する信頼セットを構築する。
そして、私たちのフレームワークを、事前および変更後のシナリオに拡張します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:01:30 GMT)
Content-Driven Local Response: Supporting Sentence-Level and Message-Level Mobile Email Replies With and Without AI [29.1] マイクロタスキングにインスパイアされたCDLR(Content-Driven Local Response)と呼ばれる新しいUI概念を開発した。
これにより、ユーザーは文章を選択してメールに返信を挿入できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:06:25 GMT)
Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts [29.1] 医療用大規模言語モデルをローカル言語に適応させることで、医療サービスへのアクセス障壁を減らすことができる。
まず、高品質な医療データセットを構築し、その品質を確保するために分析を行う。
言語固有の専門家と言語間ルーティングを用いた新しいMoEルーティング手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:43:26 GMT)
Object Agnostic 3D Lifting in Space and Time [28.9] 時間的シーケンス上での2次元キーポイントのカテゴリーに依存しない3次元リフトについて、時間的視点を示す。
類似したオブジェクトに関する一般的な情報は、より良いパフォーマンスを達成するために利用することができる。
時間的に確率的なコンテキストウィンドウは、シーケンス全体の一貫性を達成するのに有利である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:39:44 GMT)
Efficient-vDiT: Efficient Video Diffusion Transformers With Attention Tile [28.9] 3次元フルアテンションを持つ拡散変換器(DiT)は、注意計算の複雑さと多数のサンプリングステップにより、高価な推論に悩まされる。
本稿では,1)ビデオデータの冗長性に基づく3Dフルアテンションの抽出,2)既存の多段整合蒸留によるサンプリングプロセスの短縮,の2つの側面から非効率性の問題に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:00:56 GMT)
Universal Approximation of Visual Autoregressive Transformers [28.9] 分析をVisual Auto Regressive Transformerに拡張します。
Varは、新しい、スケーラブルで粗い次世代の予測フレームワークを使って、画像を生成するための大きなステップである。
本研究は,効率的なVARトランスフォーマー戦略のための重要な設計原則を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:36:30 GMT)
The Nonlinear Filter Model of Stream Cipher Redivivus [28.9] 非線形フィルタモデルは、セキュアストリーム暗号の設計において、古くよく理解されたアプローチである。
我々は、既知の攻撃に対して$kappa$-bitセキュアなストリーム暗号の具体的な提案を行った。
80$-bit、28$-bit、2656$-bitのセキュリティレベルの場合、対応するストリーム暗号の回路はそれぞれ1743.5、2771.5、5607.5 NANDゲートが必要である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:19:03 GMT)
Model Diffusion for Certifiable Few-shot Transfer Learning [28.8] 大規模ディープラーニングにおいて、低データ問題を解決するための一般的な効果的なワークフローは、パラメータ効率の微調整(PEFT)を通じて、強力な事前学習基礎モデル(FM)を新しいタスクに適用することである。
実証的な効果はあるものの、結果として得られるソリューションは、その正確性を証明するための一般化保証を欠いている。
我々は,低ショット体制においても,下流タスクに対する非空き学習理論の一般化を保証するために,新しい伝達学習手法を開発した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:11:48 GMT)
Panza: Design and Analysis of a Fully-Local Personalized Text Writing Assistant [28.8] そこで我々は,Panzaと呼ばれる自動アシスタントの設計と評価を行う。
Panzaのパーソナライズ機能は、Retrieval-Augmented GenerationとともにReverse Instructionsテクニックの変種を使用した微調整の組み合わせに基づいている。
この組み合わせにより、非常に限られたリソース上で実行しながら、LLMを微調整して、限られたデータを使ってユーザの書き込みスタイルを反映できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:08:07 GMT)
How to Find the Exact Pareto Front for Multi-Objective MDPs? [28.7] 多目的マルコフ決定プロセス (MO-MDPs) は, 現実の意思決定問題は, 単一目的のMDPでは対応できない相反する目的を伴うことが多いため, 注目を集めている。
本研究では,パレートフロントの効率的な発見という課題に対処する。
MO-MDPにおけるパレートフロントの幾何学的構造を調べた結果,鍵となる性質が明らかになった。
この洞察は、すべての政策間でのグローバルな比較を、一つの状態-作用ペアによって異なる決定論的ポリシー間の局所的な探索に変換する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:28:55 GMT)
Preference Alignment on Diffusion Model: A Comprehensive Survey for Image Generation and Editing [28.2] 画像生成と編集機能を向上させるための変換手法として,拡散モデル (DM) との嗜好アライメントの統合が出現している。
本稿では、画像生成と編集における拡散モデルとの嗜好の整合性について広範囲に調査する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:25:11 GMT)
Sparse Autoencoders for Scientifically Rigorous Interpretation of Vision Models [27.8] 本稿では、スパースオートエンコーダ(SAE)を用いて、人間の解釈可能な視覚的特徴を発見する統一的なフレームワークを提案する。
そこで本研究では,SAEがモデル再学習を行なわずに,解釈可能な視覚特徴を確実に識別・操作できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:32:41 GMT)
Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models [27.6] モデル全体の品質を高めるために設計された推論時間安全機構である選択的偏り(elective debiasing)を提案する。
潜在的なバイアスのあるモデル予測を特定し、それらを捨てる代わりに、後処理のデバイアス法であるLEACEを使ってこれらの予測からバイアスを取り除く。
エンコーダに基づく分類モデルを用いたテキスト分類データセットの実験では、選択的デバイアスは、後処理手法とデバイアス技術のパフォーマンスギャップを低減するのに役立つことが示されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:18:25 GMT)
A Survey on Video Analytics in Cloud-Edge-Terminal Collaborative Systems [27.2] クラウドエッジ端末協調(CETC)システムは、効率的なビデオ処理、リアルタイム推論、プライバシ保存分析を可能にする。
この調査では、階層的、分散的、ハイブリッドなフレームワークを含む、基本的なアーキテクチャコンポーネントをまず分析します。
また、適応型タスクオフロードとリソース対応スケジューリングを取り入れたハイブリッドビデオ分析についても検討した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:48:11 GMT)
Self-Regulating Random Walks for Resilient Decentralized Learning on Graphs [27.1] 本稿では,グラフ上で所望数のランダムウォーク(RW)を維持するために,2つの分散アルゴリズムを提案する。
DecAForkとDecAFork+は、多くのRWをフォークすることで、ネットワークのオーバーロードを避けることができる。
我々は、DecAForkとDecAFork+の性能を示す広範な数値シミュレーションを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:06:43 GMT)
What I cannot execute, I do not understand: Training and Evaluating LLMs on Program Execution Traces [27.1] 本研究では,実世界のプログラム実行トレースを明示的にモデル化する訓練手順であるExecution Tuning(E.T.)について検討する。
我々は,異なる実行トレースの粒度(ラインレベルと命令レベル)のモデルと,出力予測のタスクに関する戦略を訓練し,評価する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:42:13 GMT)
Membership Inference Risks in Quantized Models: A Theoretical and Empirical Study [26.9] 機械学習モデルの量子化は、元のモデルに匹敵するパフォーマンスレベルを維持しながら、メモリと推論コストを下げる効果を示した。
本稿では,量子化処理がデータ駆動モデルのプライバシに与える影響について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:34:42 GMT)
Exploring Safety-Utility Trade-Offs in Personalized Language Models [26.8] 大規模言語モデル(LLM)はパーソナライズバイアスに悩まされており、ユーザのアイデンティティにパーソナライズされた場合のパフォーマンスに影響を及ぼす。
安全性と実用性という2つの軸に沿ってLLMの性能を評価することにより、パーソナライズバイアスを定量化する。
我々は、嗜好調整とプロンプトベースディフェンスを用いたパーソナライズバイアスを軽減するためのいくつかの戦略について議論する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:10:17 GMT)
Visual Agentic AI for Spatial Reasoning with a Dynamic API [26.8] 本稿では,3次元空間推論問題を解くためのエージェントプログラム合成手法を提案する。
我々の手法は、静的なヒューマン定義APIに依存する従来のアプローチの限界を克服する。
本手法は3次元の視覚的推論において,従来のゼロショットモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:59:35 GMT)
AiRacleX: Automated Detection of Price Oracle Manipulations via LLM-Driven Knowledge Mining and Prompt Generation [26.6] 分散金融アプリケーションは、安全な取引を確保するために正確な価格保証に依存している。
これらのオラクルは操作に非常に脆弱で、攻撃者はスマートコントラクトの脆弱性を悪用することができる。
本稿では,価格変動の検知を自動化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:58:09 GMT)
Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions [26.5] インメモリコンピューティング(AIMC)は、有望なエネルギー効率のソリューションとして出現する。
本稿ではまず,AIMCハードウェア上での勾配に基づくトレーニングの理論的基礎を提供する。
雑音の更新と非対称応答関数がAnalog SGDに悪影響を及ぼすことを示す。
この問題を解決するために、残差学習アルゴリズムであるTiki-Takaは、主配列と残差配列を双方向に最適化することにより、臨界点に正確に収束する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:56:15 GMT)
FCVSR: A Frequency-aware Method for Compressed Video Super-Resolution [26.4] 本稿では,移動誘導型適応アライメントネットワークと多周波特徴改善モジュールで構成される,深帯域圧縮ビデオSRモデル(FCVSR)を提案する。
提案モデルは3つの圧縮ビデオ圧縮超解像データセットで評価されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:08:57 GMT)
Tracezip: Efficient Distributed Tracing via Trace Compression [26.4] 分散トレースは、クラウドサービスシステムの監視とテストにおいて、ビルディングブロックとして機能する。
ヘッドベースサンプリングは、システムに入ると追跡するリクエストを無差別に選択する。
tailベースのサンプリングはすべてのリクエストをトレースし、エッジケーストレースを選択的に永続化する。
トレース圧縮による分散トレースの効率を向上させるため,Tracezipを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:13:57 GMT)
Multi-turn Evaluation of Anthropomorphic Behaviours in Large Language Models [26.3] ユーザーが大きな言語モデル(LLM)を人為的に形作る傾向は、AI開発者、研究者、政策立案者への関心が高まっている。
本稿では,現実的かつ多様な環境下での人為的 LLM の挙動を実証的に評価する手法を提案する。
まず,14の人為的行動のマルチターン評価を開発する。
次に,ユーザインタラクションのシミュレーションを用いて,スケーラブルで自動化されたアプローチを提案する。
第3に,対話型大規模人体調査(N=1101)を実施し,実際のユーザの人文的知覚を予測するモデル行動を検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:09:57 GMT)
Revisiting Dynamic Graph Clustering via Matrix Factorization [26.3] 行列分解に基づく手法はこの課題に対して有望なアプローチである。
堅牢性に欠ける傾向があり、現実世界の騒々しいデータに弱い。
本稿では,時間分割行列分解,二クラスタ化正規化,選択的埋め込み更新を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:57:46 GMT)
Scaling FP8 training to trillion-token LLMs [26.2] 最大2兆トークンのデータセット上でFP8精度を使用して、大規模な言語モデルをトレーニングします。
我々は,FP8トレーニングにおいて,より短い期間で観察できない重大な障害を発見した。
Smooth-SwiGLUは機能変更なしに安定したFP8トレーニングを実現する新しい修正である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:37:59 GMT)
On the Feasibility of In-Context Probing for Data Attribution [26.1] In-context Probing (ICP) は勾配に基づくデータ属性の高速プロキシとして機能することを示す。
ICPと勾配に基づくデータ属性は、トレーニングデータと類似したタスクタイプとコンテンツを共有するタスクに対して、影響のあるトレーニングデータを特定する上で、よく相関していることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:40:01 GMT)
Predictive Red Teaming: Breaking Policies Without Breaking Robots [26.0] 模倣学習によって訓練された視覚運動のポリシーは、困難な操作を行うことができるが、照明、視覚的注意散らし、物体の位置に対して非常に脆弱であることが多い。
そこで本研究では,環境要因に関する政策の脆弱性を発見し,ハードウェア評価を伴わずに性能劣化を予測することを目的とした,レッド・チームリングの課題を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:44:34 GMT)
Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form [26.0] 本稿では, 頑健な制約付きMDP (RCMDP) における準最適ポリシーの同定が保証された最初のアルゴリズムを提案する。
最適ポリシーは、一連の環境における最悪のシナリオにおける制約を満たしながら累積コストを最小化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:45:21 GMT)
TASAR: Transfer-based Attack on Skeletal Action Recognition [25.6] ヒト活動認識(HAR)における骨格配列の役割
既存のスケルトンベースのHAR(S-HAR)攻撃は、主にホワイトボックスのシナリオ用に設計されており、弱い対向性を示す。
textbfTransfer-based textbfAttack on textbfSkeletal textbfAction textbfRecognition, TASARを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:38:51 GMT)
Dynamic Pricing with Adversarially-Censored Demands [25.6] 我々は,各時点における潜在需要が$t=1,2,ldots,T$であり,価格に依存するオンライン動的価格問題について検討する。
一度に$t$が課せられ、在庫水準を超えた場合の潜在的な需要を検閲する。
本アルゴリズムは,逆在庫級数であっても,$tildeO(sqrtT)$Optimative regretを達成できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:37:39 GMT)
Facet-Aware Multi-Head Mixture-of-Experts Model for Sequential Recommendation [25.5] 逐次レコメンデーションのためのFAME(Facet-Aware Multi-Head Mixture-of-Experts Model for Sequential Recommendation)という新しい構造を提案する。
最後のマルチヘッドアテンション層における各頭部からのサブ埋め込みを活用して,次の項目を別々に予測する。
ゲーティングメカニズムは、各ヘッドからのレコメンデーションを統合し、それらの重要性を動的に決定する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:58:30 GMT)
Towards Unifying Interpretability and Control: Evaluation via Intervention [25.5] 我々は、介入が解釈可能性の基本的な目標であり、介入によるモデル行動の制御方法の評価に成功基準を導入することを論じる。
我々は4つの一般的な解釈可能性手法、スパースオートエンコーダ、ロジットレンズ、チューニングレンズ、および探索を抽象エンコーダデコーダフレームワークに拡張する。
モデルの動作を制御するための説明の正確性とその有用性を測定するために,介入成功率とコヒーレンス・インターベンショントレードオフという2つの新しい評価指標を導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:55:17 GMT)
Uniform Generalization Bounds on Data-Dependent Hypothesis Sets via PAC-Bayesian Theory on Random Sets [25.3] PAC-Bayesian framework on "random set" を厳密な方法で適用し、トレーニングアルゴリズムがデータ依存仮説セットを出力すると仮定する。
このアプローチにより、多くのコンテキストに適用可能な、データ依存のバウンダリを証明できます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:06:23 GMT)
FreeCap: Hybrid Calibration-Free Motion Capture in Open Environments [25.2] 我々のシステムは、単一のLiDARと拡張可能な移動カメラを組み合わせることで、柔軟で正確な動き推定を可能にする。
特に,ローカル・グローバル・ポーズ・アウェア・クロスセンサー・ヒューマン・マッチング・モジュールについて紹介する。
我々の手法は最先端のシングルモーダル法よりも優れています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:31:48 GMT)
Repository-level Code Search with Neural Retrieval Methods [25.2] 我々は、リポジトリレベルのコード検索のタスクを、ユーザの質問やバグに対処するのに最も関係のある、コードリポジトリの現在の状態からファイルの集合を検索するものとして定義する。
提案手法は,コミットメッセージに対するBM25ベースの検索と,CodeBERTを用いて関連するファイルを識別するニューラルリランクを組み合わせたものである。
7つの人気のあるオープンソースリポジトリから生成された新しいデータセットの実験では、MAP、MRR、P@1がBM25ベースラインに対して最大80%改善されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:59:01 GMT)
EfficientLLM: Scalable Pruning-Aware Pretraining for Architecture-Agnostic Edge Language Models [25.1] 大規模言語モデル(LLM)は法則のスケーリングによって駆動され、大規模なモデルサイズでインテリジェンス緊急を達成する。
本研究は、より大規模な最適化モデルの性能を維持することに焦点を当てたプルーニング対応事前学習を提案する。
我々は,LLM圧縮のスケールアップと境界の拡張により,高品質なエッジ言語モデルであるEfficientLLMを実現することを明らかにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:51:03 GMT)
Recent Advances in Discrete Speech Tokens: A Review [25.0] 離散的な音声トークンは、その離散的でコンパクトで簡潔な性質によって特徴づけられ、効率的な伝送と記憶に有利である。
現在の研究は、個別の音声トークンを音響トークンと意味トークンの2つの主要なクラスに分類し、それぞれがリッチな研究領域へと発展してきた。
本研究は,既存の分類学と最近の音声トークン化の革新を体系的に合成し,各パラダイムの長所と短所を批判的に検討し,トークンタイプ間での系統的比較を提示する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:08:25 GMT)
Recent Advances, Applications and Open Challenges in Machine Learning for Health: Reflections from Research Roundtables at ML4H 2024 Symposium [24.9] 第4回Machine Learning for Health(ML4H)シンポジウムは2024年12月15日と16日にカナダのバンクーバーで開催された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:17:09 GMT)
Understanding and Mitigating the Bias Inheritance in LLM-based Data Augmentation on Downstream Tasks [24.7] この研究は、バイアス継承を理解し、分析し、緩和する最初の体系的な研究である。
6種類のバイアスが、異なるバイアス比でどのように現れるかを分析する。
トークンベース,マスクベース,損失ベースの3つの緩和戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:34:03 GMT)
High-Resolution Speech Restoration with Latent Diffusion Model [24.4] 複数の歪みを扱う生成モデルは、電話の再構成や高周波高調波にしばしば苦労する。
複数の歪みを除去し、音声記録をスタジオ品質に復元する潜在拡散に基づく新しい生成モデルであるHi-ResLDMを提案する。
我々は、GANとCFM(Conditional Flow Matching)コンポーネントを活用する最先端手法に対してHi-ResLDMをベンチマークし、高周波帯域の詳細を再生する際の優れた性能を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:06:57 GMT)
Likelihood-Free Estimation for Spatiotemporal Hawkes processes with missing data and application to predictive policing [24.3] 時空間ホークスモデルにおける未報告犯罪を考慮に入れたWGAN(Wasserstein Generative Adrial Networks)による可能性のないアプローチを提案する。
本研究では、この手法がデータ不足の有無でパラメトリック推定の精度をいかに向上するかを実証分析により示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:09:12 GMT)
RALLRec: Improving Retrieval Augmented Large Language Model Recommendation with Representation Learning [24.3] 大規模言語モデル (LLM) は、ユーザの振る舞いを理解するためのレコメンデーションシステムに統合されている。
既存のRAGメソッドは主にテキストのセマンティクスに依存しており、しばしば最も関連性の高い項目を組み込むことができない。
検索強化大言語モデル推薦(RALLRec)のための表現学習を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:15:12 GMT)
SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps [24.3] 本稿では、カメラポーズ、画像、マップ間変換へのアクセスをゼロにするマルチロボット・ガウス・スプレイティング(GSplat)マップの登録について述べる。
実世界のデータセットにおける競合するベースラインと比較して,SIRENの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:41:38 GMT)
Predicting Molecular Ground-State Conformation via Conformation Optimization [24.2] 分子基底状態のコンフォメーションの予測は多くの化学応用において重要である。
本稿では,エネルギーに基づくシミュレーションと学習に基づく戦略を橋渡しする,新しい効果的手法を提案する。
我々の手法は一貫して最先端の競争相手を上回っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:54:15 GMT)
Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation [24.1] 一階述語論理(FOL)推論はインテリジェントシステムにおいて重要である。
既存のベンチマークは、広範囲の人間のアノテーションや手作りテンプレートに依存していることが多い。
本稿では,大言語モデルの生成強度を記号型プローサの厳密性と精度で相乗化するProverGenという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:31:54 GMT)
Generating Structured Outputs from Language Models: Benchmark and Studies [24.0] 制約付き復号化は、世代間構造的出力を強制する分野において支配的な技術として出現している。
本稿では,制約に順応した出力の生成効率,生成した出力の多様な品質のカバレッジという,3つの重要な領域にわたる制約付き復号手法を評価するための評価フレームワークを提案する。
我々の研究は、制約付きデコードフレームワークを改善し、制約付きデコード構造生成を評価するための新しい標準を設定するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:41:37 GMT)
Jailbreaking LLMs' Safeguard with Universal Magic Words for Text Embedding Models [23.9] テキスト埋め込みモデルに攻撃を与える汎用魔法語を探索する効率的な手法を提案する。
接尾辞としての普遍的なマジックワードは、任意のテキストの埋め込みをバイアス方向に移動させ、任意のテキストペアの類似性を操作し、誤った保護を誘導する。
また,このような攻撃に対する防御機構を提案し,列車のない方法でテキスト埋め込みのバイアス分布を補正する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:27:04 GMT)
An Online Learning Approach to Prompt-based Selection of Generative Models [23.9] 様々な入力プロンプトに対する最良の生成モデルのオンライン識別は、サブ最適モデルのクエリに関連するコストを削減できる。
与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:20:39 GMT)
DROP: Poison Dilution via Knowledge Distillation for Federated Learning [23.8] フェデレートラーニングは、悪意のあるクライアントが悪意のあるアップデートを注入して、グローバルモデルの振る舞いに影響を与える、敵の操作に対して脆弱である。
本稿では,クラスタリングとアクティビティ追跡技術を組み合わせた新しい防御機構DROPと,クライアントからの良質な振る舞いの抽出について紹介する。
提案手法は,幅広い学習環境における既存の防御法と比較して,優れたロバスト性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:15:43 GMT)
Pinning Is Futile: You Need More Than Local Dependency Versioning to Defend against Supply Chain Attacks [23.8] オープンソースソフトウェアにおける最近の顕著なインシデントは、ソフトウェアサプライチェーンの攻撃に実践者の注意を向けている。
セキュリティ実践者は、バージョン範囲に浮かぶのではなく、特定のバージョンへの依存性をピン留めすることを推奨する。
我々は,npmエコシステムにおけるバージョン制約のセキュリティとメンテナンスへの影響を,カウンターファクト分析とシミュレーションを通じて定量化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:50:48 GMT)
Improved YOLOv5s model for key components detection of power transmission lines [23.7] 本稿では, YOLOv5s(You Only Look Once Version 5 Small)モデルに基づくオブジェクト検出モデルを提案する。
改善手法のmAP(平均精度)は98.1%,精度は97.5%,リコールは94.4%,検出速度は84.8FPS(毎秒フレーム)に達した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:29:34 GMT)
RS-MoE: A Vision-Language Model with Mixture of Experts for Remote Sensing Image Captioning and Visual Question Answering [23.7] 本稿では,リモートセンシングに特化してカスタマイズされた,最初のMixture of ExpertベースのVLMであるRS-MoEを提案する。
従来のMoEモデルとは異なり、RS-MoEのコアとなるMoEブロックは、新しいインストラクションルータと複数の軽量言語モデル(LLM)をエキスパートモデルとして組み込んだものである。
本モデルでは, 精度, 文脈に関連のあるキャプションを生成する際に, 最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:14:09 GMT)
Identifying perturbation targets through causal differential networks [23.6] 本稿では,生物学的システムの変更に責任を持つ変数を同定する因果性に着想を得たアプローチを提案する。
まず、観測データと干渉データからノイズの多い因果グラフを推定する。
次に、これらのグラフ間の差分を、追加の統計的特徴とともに、介入された変数の集合にマッピングすることを学ぶ。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:21:03 GMT)
Who Taught You That? Tracing Teachers in Model Distillation [23.6] 学生の先生はアウトプットに基づいて特定できますか?
本稿では, 要約, 質問応答, 指示追従を含む実作業蒸留の目標について検討する。
語彙的特徴を用いた識別モデルの設計を行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:48:56 GMT)
Graph Pseudotime Analysis and Neural Stochastic Differential Equations for Analyzing Retinal Degeneration Dynamics and Beyond [23.6] そこで本研究では,新たに編集したJR5558マウス転写解析データから,被験者の経路グラフを効率的に構築する手法を開発した。
次に,グラフレベルのPseudotime Analysis (GPA)を開発し,人口レベルでの疾患の進行を示すグラフレベルの軌跡を推測する。
GPAに基づいて病期遷移を誘導する最も敏感な経路を同定する。
我々の理論は、経路が相互に相互作用できる場合にまで拡張し、病気の表現型をより包括的で多面的に特徴づけることを可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:25:14 GMT)
Reranking Laws for Language Generation: A Communication-Theoretic Perspective [23.4] 我々は、並列ノイズチャネルを通じてメッセージの複数の記述を送信する送信機としてジェネレータを概念化する。
リランカが不完全である場合であっても、このプロトコルがエラーのない条件を提供する。
我々は,大規模な言語モデルを用いて,実世界の2つの課題に対して経験的に検証する法則の再定式化のために,我々の枠組みを利用する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:07:49 GMT)
The Value of Information in Human-AI Decision-making [23.4] 情報の価値を特徴付けるための決定論的枠組みを提供する。
本稿では,新しい情報に基づくインスタンスレベルの説明手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:50:42 GMT)
Kronecker Mask and Interpretive Prompts are Language-Action Video Learners [23.3] 対照的な言語イメージ事前学習は、画像に基づく視覚学習を大幅に進歩させた。
近年の研究では、行動認識のためのCLIPのテキストまたは視覚分岐の調整に焦点が当てられている。
両ブランチの適応は不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:28:56 GMT)
Efficient Extensions for Asynchronous Byzantine Agreement via Weak Agreement [23.3] 多値BAから二値BAへの新たな還元効果を示す。
我々は,多値WAを用いて,$ell$-bit入力のための2つの効率的なWAプロトコルを設計する。
我々のWAプロトコルはバイナリBAを、ラウンドオーバーヘッドが一定で、通信オーバーヘッドが$$$2、セキュリティがほぼ最適である複数値BAに拡張します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:06:17 GMT)
On the Parameter Identifiability of Partially Observed Linear Causal Models [23.1] 因果構造と部分的に観察されたデータからエッジ係数を復元できるかどうかを検討する。
部分的に観察された線形因果モデルにおいて,パラメータの非決定性は3種類ある。
本稿では,潜伏変数の分散不確定性に特定の方法で対処する,確率に基づくパラメータ推定手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:09:34 GMT)
Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising [23.1] Prompt-SIDは、構造的詳細を保存することを強調する、素早い学習に基づく単一画像記述フレームワークである。
構造的エンコーディングを通じてオリジナルスケールの画像情報をキャプチャし、このプロンプトをデノイザに統合する。
本稿では, 合成, 実世界, 蛍光画像の総合的な実験を行い, Prompt-SIDの顕著な有効性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:09:47 GMT)
Unveiling the Capabilities of Large Language Models in Detecting Offensive Language with Annotation Disagreement [23.0] アノテーションの不一致を伴って攻撃言語を検出するLLMの能力を体系的に評価した。
アノテーション合意レベルの異なる複数のLPMのバイナリ精度を比較し,LCMの信頼度とアノテーション合意の関係を分析する。
この結果から,不一致サンプルによる課題が浮き彫りとなり,LLMによる攻撃言語検出の改善のためのガイダンスが得られた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:14:26 GMT)
SequentialAttention++ for Block Sparsification: Differentiable Pruning Meets Combinatorial Optimization [22.9] ニューラルネットワークプルーニングは、大規模で拡張性があり、解釈可能で、一般化可能なモデルを構築するための重要な技術である。
群スパース最適化の非正規化として,既存の微分可能なプルーニング手法がいくつあるかを示す。
我々は、ImageNetとCriteoデータセット上の大規模ニューラルネットワークブロックワイドプルーニングタスクの最先端技術であるSequentialAttention++を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:23:56 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [22.6] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
提案手法は,言語,画像,ビデオ生成など,さまざまなモデルにまたがる,無視可能なエンドツーエンドメトリクスの損失を生じさせる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:02:49 GMT)
Regional Weather Variable Predictions by Machine Learning with Near-Surface Observational and Atmospheric Numerical Data [22.5] 本稿では,ケンタッキー・メソネット駅の近地観測データを統合した新しい機械学習(ML)モデルであるMiMa(マイクロマクロのショート)を提案する。
MiMaは現在のモデルを大きく上回り、Re-MiMaは未完成の場所の正確な短期予測を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:39:17 GMT)
Right Time to Learn:Promoting Generalization via Bio-inspired Spacing Effect in Knowledge Distillation [22.4] 知識蒸留(KD)はディープニューラルネットワーク(DNN)を訓練するための強力な戦略である
ここでは、オンラインKDとセルフKDの両方の有効性を改善するために、Spaced KDという、アクセス可能で互換性のある戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:48:04 GMT)
Using Contextually Aligned Online Reviews to Measure LLMs' Performance Disparities Across Language Varieties [22.3] 本稿では,言語品種間でのベンチマークモデル性能に対する,新規で費用対効果の高いアプローチを提案する。
Booking.comのような国際的なオンラインレビュープラットフォームは効果的なデータソースとして機能する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:49:35 GMT)
Calibrating LLMs with Information-Theoretic Evidential Deep Learning [22.3] 微調整された大きな言語モデル(LLM)は、特に小さなデータセットでトレーニングされた場合、自信過剰を示すことが多い。
Evidential Deep Learning (EDL)は、不確実性を認識したアプローチであり、単一の前方通過における不確実性推定を可能にする。
情報ボトルネック(IB)を組み込んだEDLの正規化を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:00:24 GMT)
Online Scheduling for LLM Inference with KV Cache Constraints [22.2] 大規模言語モデル(LLM)推論は、レイテンシとリソース利用を最適化するための効率的なスケジューリングを必要とする集約的なプロセスである。
KVキャッシュのメモリを効果的に管理しながら、推論遅延を最小限に抑える新しいスケジューリングアルゴリズムを提案する。
我々の成果は、より持続的で費用対効果の高いLLMデプロイメントへの道筋を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:11:44 GMT)
GIST: Greedy Independent Set Thresholding for Diverse Data Summarization [21.7] 単調部分モジュラーユーティリティを用いたmin-distance diversificationと呼ばれる新しいサブセット選択問題を導入する(textsfMDMS$)。
計量空間内の点の集合が与えられたとき、$textsfMDMS$ の目標は、任意の選択された点間の単調部分モジュラー効用項と最小距離の多様性項を組み合わせた目的関数を最大化することである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:17:29 GMT)
Can ChatGPT Diagnose Alzheimer's Disease? [21.7] アルツハイマー病(英: Alzheimer's Disease、AD)は、65歳以上の9人に1人程度が発症する、壊滅的な神経変性疾患である。
本稿では、磁気共鳴イメージング(MRI)と認知テストから得られた9300個の電子健康記録を利用して、興味深い問題に対処する: ChatGPTは、EHRを用いてADを正確に検出できるか?
ゼロショット法とマルチショット法を併用したブラックボックス手法を用いて,ChatGPTの詳細な評価を行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:41:08 GMT)
VersaPRM: Multi-Domain Process Reward Model via Synthetic Reasoning Data [21.5] 本稿では,新しいデータ生成法とアノテーション法を用いて生成した合成推論データに基づいて学習したマルチドメインPRMであるVersaPRMを紹介する。
VersaPRMはさまざまなドメインで一貫したパフォーマンス向上を実現している。
VersaPRMのすべてのデータ、コード、モデルをオープンソース化することで、コミュニティにさらに貢献します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:03:36 GMT)
IceBerg: Debiased Self-Training for Class-Imbalanced Node Classification [21.3] 我々は,GNNにおけるクラス不均衡と少数ショットの問題に対処する,偏りのない自己学習フレームワークであるIceBergを提案する。
具体的には,自己学習におけるマシュー効果とラベル分布の変化を明らかにするために,ダブルバランシングを提案する。
その結果,未ラベルノードの活用により,クラス不均衡および少数ショットシナリオにおけるGNNの性能が著しく向上することが判明した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:23:22 GMT)
Continual Release Moment Estimation with Differential Privacy [21.3] JMEは、追加のプライバシーコストなしで第2モーメント推定を可能にするために、マトリックス機構とジョイント感度分析を使用する。
本稿では, ガウス密度推定のための平均値と共分散行列の推定と, CIFAR-10上でのDP-Adamを用いたモデルトレーニングの2つの応用におけるJMEの有効性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:58:26 GMT)
SparseFocus: Learning-based One-shot Autofocus for Microscopy with Sparse Content [21.3] オートフォーカスは顕微鏡画像における高スループットおよびリアルタイム走査に必要である。
最近の学習に基づくアプローチは、ワンショット環境で顕著な効果を示している。
SparseFocusという名前のコンテンツベースのソリューションを提案し、新しい2段階パイプラインを特徴とする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:31:32 GMT)
Learning an Optimal Assortment Policy under Observational Data [21.1] 我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:54:41 GMT)
Guided Exploration for Efficient Relational Model Learning [20.9] 効率的な探索は、複雑で長期のタスクを持つ大規模環境で関係モデルを学習するために重要である。
ゴールリテラルバブリング(GLIB)は、新しいゴールの設定と計画によってランダムな探索を改善する。
バキングラージ(Baking-Large)は、多岐にわたる状態-作用空間と長距離タスクを持つ挑戦的ドメインである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:23:01 GMT)
Prototype Contrastive Consistency Learning for Semi-Supervised Medical Image Segmentation [20.8] コントラスト学習は、半教師あり学習における医用画像のセグメンテーションに有効であることが証明されている。
半教師型医用画像セグメンテーションのためのプロトタイプコントラスト・コントラスト・コントラスト・コントラスト・コントラスト(PCCS)の試作手法を提案する。
PCCSは最先端の手法よりもセグメンテーション性能が高い。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:40:26 GMT)
LiveForesighter: Generating Future Information for Live-Streaming Recommendations at Kuaishou [20.7] ライブストリーミングは、ユーザーと著者を繋ぐ次世代メディアである。
ライブストリーミングコンテンツは、時間とともに動的に変化している。
コンテンツユーザーが現在興味を持っているライブストリーミングを見つけるにはどうすればいいのか?
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:24:55 GMT)
Planetarium: A Rigorous Benchmark for Translating Text to Structured Planning Languages [20.6] 計画タスクの自然言語記述からPDDLコードを生成する言語モデルの性能を評価するためのベンチマークである textitPlanetarium を紹介する。
textitPlanetariumは、生成したPDDLの正しさを柔軟に評価する新しいPDDL同値アルゴリズムと、145,918のテキスト-PDDLペアのデータセットを備える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:05:03 GMT)
Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models [20.6] 拡散モデルは、新規で高品質なサンプルを生成できることで知られている。
最近のメモリ緩和手法は、クロスモーダル生成タスクにおけるテキストモダリティ問題にのみ焦点をあてるか、あるいはデータ拡張戦略を利用するかのどちらかである。
本稿では,視覚的モダリティの観点からの拡散モデルのための新しいトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:45:21 GMT)
PLATTER: A Page-Level Handwritten Text Recognition System for Indic Scripts [20.4] 我々はPage-Level hAndwriTTen TExt Recognition(PLATTER)のエンドツーエンドフレームワークを提案する。
第2に,言語に依存しないHTDモデルの性能測定にPLATTERを用いることを実証する。
最後に、厳密にキュレートされたページレベルのインデックス手書きOCRデータセットである、手書きのIndic Scripts (CHIPS) のコーパスをリリースする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:50:26 GMT)
Diffusion Models for Computational Neuroimaging: A Survey [20.2] コンピュータ・ニューロイメージング(Computational Neuroimaging)は、人間の認知と行動に対する機械的な洞察と予測ツールを提供するため、脳画像や信号を解析することを含む。
拡散モデルでは、自然画像の安定性と高品質な生成が示されている。
データエンハンスメント、疾患診断、脳の復号化など、様々な神経学的タスクの脳データ分析に適応することへの関心が高まっている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:20:07 GMT)
Repetita Iuvant: Data Repetition Allows SGD to Learn High-Dimensional Multi-Index Functions [20.0] 勾配に基づくアルゴリズムを用いて学習した2層浅層ニューラルネットワークのトレーニング力学について検討する。
理想化シングルパス勾配勾配学習シナリオの簡単な修正により,その計算効率が大幅に向上することを示す。
この結果から,ネットワークが事前処理なしでデータから関連構造を学習できることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:33:48 GMT)
Confidence Diagram of Nonparametric Ranking for Uncertainty Assessment in Large Language Models Evaluation [20.0] 大きな言語モデル(LLM)のランク付けは、$N$のポリシーに基づいてアライメントを改善する効果的なツールであることが証明されている。
本稿では,言語モデルのランキングの中から仮説テストのための新しい推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:26:28 GMT)
A Preview of XiYan-SQL: A Multi-Generator Ensemble Framework for Text-to-SQL [20.0] XiYanは、マルチコンテキストアンサンブル戦略を用いて、候補生成を改善する革新的なフレームワークである。
本稿では,データベース構造を理解するための半構造化表現手法であるM-スキーマを紹介する。
全体として、提案したXiYan-the-artフレームワークは、Birdデータセットベンチマークで75.63%の最先端実行精度を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:28:55 GMT)
FEMBA: Efficient and Scalable EEG Analysis with a Bidirectional Mamba Foundation Model [19.9] 本稿では,脳波分析のための新たな自己組織化フレームワークであるFEMBA(Foundational EEG Mamba + Bidirectional Architecture)を紹介する。
2次時間とメモリの複雑さが原因のTransformerベースのモデルとは異なり、FEMBAはシーケンス長と線形にスケールする。
トランスモデルと比較して競争性能が向上し、計算コストは大幅に低下する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:15:52 GMT)
Unbiased Evaluation of Large Language Models from a Causal Perspective [19.9] 評価バイアスを理論的に定式化し、バイアスのない評価プロトコルの設計に関する貴重な洞察を提供する。
我々は,LLMのより包括的で,偏りのない,解釈可能な評価プロトコルであるUnbiased Evaluatorを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:45:18 GMT)
In-Context Learning (and Unlearning) of Length Biases [19.7] モデルが予測のためにコンテキストウィンドウで長さバイアスを学習することを示す。
さらに、モデルが示すバイアスのレベルを変調する要因を実験的に分析する。
これは、コストのかかるパラメータ更新を必要とせず、モデル予測の振る舞いを嫌う場合に、コンテキスト内学習のパワーを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:43:32 GMT)
Improving Model Evaluation using SMART Filtering of Benchmark Datasets [19.7] 本稿では,既存のベンチマークデータセットから高品質なサンプルのサブセットを選択する新しい手法を提案する。
提案手法は3つのフィルタリング基準を適用し, (i) 簡単な例, (ii) データ汚染例, (iii) 互いに類似した例を除去する。
SMARTの3つの選択QAデータセットに対する有効性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:17:54 GMT)
Is API Access to LLMs Useful for Generating Private Synthetic Tabular Data? [19.7] 差分プライベート(DP)合成データは、個人データの分析を可能にする汎用的なツールである。
大規模言語モデル(LLM)の最近の進歩は、DP合成データ生成を改善するための多くのアルゴリズム技術にインスピレーションを与えている。
あるアプローチの族は、基礎モデル重み付けにDP微調整を用いるが、最先端モデルのモデル重み付けは公開されていないかもしれない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:23:52 GMT)
When Witnesses Defend: A Witness Graph Topological Layer for Adversarial Graph Learning [19.6] 計算トポロジー、すなわちグラフの永続的ホモロジー表現から生まれたツールで、逆グラフ学習を橋渡しする。
グラフ上の逆解析に証人複体の概念を導入し、グラフの健全な形状特性にのみ焦点をあてる。
6つのデータセットにわたる実験により、Witness Graph Topological Layerは、さまざまな摂動や、さまざまな敵攻撃に対して、GNNの堅牢性を高めます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:52:39 GMT)
Sequence Transferability and Task Order Selection in Continual Learning [19.5] 連続学習では,タスクシーケンスの性質とモデル性能との関係を理解することが重要である。
本稿では,タスクシーケンスの総転送可能性を把握するための2つの新しい手法を提案する。
そこで我々は,連続学習におけるタスク順序選択問題に対する新しい手法を開発した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:09:56 GMT)
Dimension-free Regret for Learning Asymmetric Linear Dynamical Systems [19.4] 本稿では,行列の存在にもかかわらず,トレードオフのない非次元的後悔を克服する新しい手法を提案する。
本手法では,スペクトルフィルタリングと線形予測器を併用し,複素平面にチェビシェフを用いて新しいスペクトルフィルタリング基盤を構築する。
遷移行列が1/mathrmpoly log$で有界な複素成分を持つ固有値を持つ限り、我々の手法は後見の最良の線形予測子と比較して、後悔の$tildeO(9/10)$を達成できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:10:06 GMT)
Foundation Models for Anomaly Detection: Vision and Challenges [19.2] ファンデーションモデル(FM)は、異常検出を前進させる強力なツールとして登場した。
本調査では,FMによる異常検出の最近の進歩を概観する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:01:08 GMT)
Conformal Prediction Regions are Imprecise Highest Density Regions [19.2] クレダル集合に付随する不正確な高密度領域(Imprecise Highest Density Region)は,古典的等角予測領域に対応することを示す。
その結果,コンフォーマル予測と不正確(IP)理論の関連性を確立した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:31:13 GMT)
MARM: Unlocking the Future of Recommendation Systems through Memory Augmentation and Scalable Complexity [18.9] MARM(Memory Augmented Recommendation Model)を提案する。
RecSysモデルの場合、モデルパラメータと比較して計算複雑性のFLOPは、注意深い制御を必要とするより高価な要素である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:17:49 GMT)
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering [18.8] 大規模言語モデル(LLM)は、コード生成のような様々なソフトウェアエンジニアリング(SE)タスクに取り組むためにデプロイされている。
Pass@kメトリックは、広範囲なユニットテストと設定された環境を必要とし、LLM生成したテキストの評価には適していない。
BLEUのような従来のメトリクスは、意味的類似性ではなく語彙のみを測定するが、精査されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:49:29 GMT)
Provable Privacy Attacks on Trained Shallow Neural Networks [18.5] 我々は、トレーニングされた2層ReLUニューラルネットワーク上で、証明可能なプライバシ攻撃が示すものについて検討する。
2層ニューラルネットワークの暗黙バイアスに関する理論的結果は,集合を確実に再構成するために有効であることを示す。
私たちの知る限りでは、この暗黙のバイアス駆動設定で証明可能な脆弱性を最初に示すのは私たちの仕事です。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:48:49 GMT)
Window-based Channel Attention for Wavelet-enhanced Learned Image Compression [18.1] チャネルアテンションに初めてウィンドウパーティションを導入し、大きな受信フィールドを取得し、よりグローバルな情報を取得する。
実験の結果,4つの標準データセットに対してBDレートが18.54%,23.98%,22.33%,24.71%削減された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:32:08 GMT)
A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation [18.0] PASTAは、46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成するパン腫瘍CT基盤モデルである。
PASTA-Genは、ピクセルレベルのアノテート病変とペア構造レポートを備えた3万個のCTスキャンの包括的なデータセットを生成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:45:03 GMT)
UniDemoiré: Towards Universal Image Demoiréing with Data Generation and Synthesis [17.9] Image demoir'eingは、画像修復において最も恐ろしい課題の1つだ。
より優れた一般化能力を有するユニバーサル画像復号法UniDemoir'eを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:20:11 GMT)
UniMoD: Efficient Unified Multimodal Transformers with Mixture-of-Depths [17.7] UniMoDは、各タスクに個別のルータを使用して、どのトークンをプルーニングすべきかを決定するタスク対応トークンプルーニング手法である。
提案手法をShow-oとEmu3に適用し,Show-oでは約15%,Emu3では40%のトレーニングFLOPを削減した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:52:52 GMT)
Generalized Temporal Tensor Decomposition with Rank-revealing Latent-ODE [17.6] 我々は、アンダーラインRank-runderlineEvealing latenunderlineT-ODE(GRET)を用いたインダーライン一般化時間テンソル分解を提案する。
提案手法では,連続的な空間指標を学習可能な特徴としてエンコードし,潜時空間におけるニューラルODEを用いて時間的要因の軌跡を学習する。
GRETは、予測性能とノイズに対する堅牢性において、既存の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:27:11 GMT)
RoToR: Towards More Reliable Responses for Order-Invariant Inputs [17.5] 位置IDの変更を最小限に抑えた、真に順序不変な入力に対してゼロショット不変なLMを提案する。
Selective Routing を用いた RoToR は,ゼロショット方式で実用的なリストワイズ入力タスクを効果的に処理できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:34:15 GMT)
Señorita-2M: A High-Quality Instruction-based Dataset for General Video Editing by Video Specialists [17.5] 高品質なビデオ編集データセットであるSenorita-2Mを紹介する。
高品質で特殊な4つのビデオ編集モデルを構築することで構築される。
編集が不十分なビデオペアを除去するためのフィルタリングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:58:22 GMT)
An Appearance Defect Detection Method for Cigarettes Based on C-CenterNet [17.3] C-CenterNetに基づくタバコの外観欠陥検出手法を提案する。
この検出器はキーポイント推定を使用して中心点を特定し、他のすべての欠陥特性を回帰する。
オリジナルのCenterNetモデルと比較すると、モデルの成功率は6.14%向上している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:12:49 GMT)
Bridging Conversational and Collaborative Signals for Conversational Recommendation [17.2] Redditの会話とMovieLens 32Mのインタラクションを関連付けるデータセットであるReddit-ML32Mを紹介した。
Reddit-ML32M を用いて LLM 生成したレコメンデーションを CF 埋め込みと整合させる LLM ベースのフレームワークを提案する。
このアプローチは、ヒットレートの12.32%の増加、NDCGの9.9%の改善など、一貫した改善を実現しています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:34:00 GMT)
Detecting Neurodegenerative Diseases using Frame-Level Handwriting Embeddings [17.2] 我々は,CNNとCNN-BLSTMモデルを多チャンネル固定サイズおよびフレームベーススペクトログラムを用いたバイナリ分類に適用した。
最も高いF1スコアはAD対CTL、PD対CTLは74.5%、PD対PDMは77.97%だった。
1秒のウィンドウはADに最適で, 長いウィンドウではPD分類が改善し, ウィンドウ長はPDとPDMにはほとんど影響しなかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:35:28 GMT)
From Argumentation to Deliberation: Perspectivized Stance Vectors for Fine-grained (Dis)agreement Analysis [17.2] 本稿では,計算的議論設定における議論の熟考的分析のためのフレームワークを開発する。
我々は、ある問題に関して異なる議論者や利害関係者の議論で表される偏見的姿勢のきめ細かい分析を行う。
我々は、この分析を、ある問題に対する全ての議論者の個人的観念的姿勢を特徴付けるパースペクティブ化されたスタンスベクトルで定式化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:08:46 GMT)
SECURE: Semantics-aware Embodied Conversation under Unawareness for Lifelong Robot Learning [17.1] SECUREはこのような問題を解決するために設計された対話型タスク学習フレームワークである。
具体的会話を使って、その欠陥のあるドメインモデルを修正します。
エージェントが意味論的に認識されている場合、無意識で再配置を解決する学習がより効率的であることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:39:13 GMT)
FunduSAM: A Specialized Deep Learning Model for Enhanced Optic Disc and Cup Segmentation in Fundus Images [17.0] 本稿では,光ディスク(OD)とオプティカルカップ(OC)セグメンテーション用に設計されたディープネットワークを構築するために,いくつかのアダプタをSAMに組み込んだ新しいモデルFunduSAMを紹介する。
1200基の画像からなるREFUGEデータセットの実験は、主要な5つのアプローチと比較して、FunduSAMの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:52:47 GMT)
OmniSR: Shadow Removal under Direct and Indirect Lighting [16.9] 間接照明からのシャドウ除去における重要な課題は、シャドウ除去ネットワークを訓練するためのシャドウフリー画像を取得することである。
直接的および間接的な照明下で影のない画像を生成するための新しいレンダリングパイプラインを提案する。
また,結合と注意機構を通じて意味的および幾何学的先行を明示的に統合する,革新的なシャドウ除去ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:14:36 GMT)
Structured Conformal Inference for Matrix Completion with Applications to Group Recommender Systems [16.5] 本手法は, わずかに観察された行列内において, 与えられた不足成分群に対する連立信頼領域を構築するための共形推論法を開発した。
提案手法はモデルに依存しないため,どのブラックボックスの行列補完アルゴリズムと組み合わせて,グループレベルの推薦に対して信頼性の高い不確実性推定を行うことができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:55:42 GMT)
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement [16.5] 本稿では,自動BLASオフロードのための新しいツールであるSCILIB-Accelを紹介する。
このツールはCPUバイナリから直接BLASシンボルをインターセプトし、コード修正や再コンパイルは不要である。
SCILIB-Accelは、最大数百のGPUノード上の複数の量子物理学符号を用いて評価され、有望なスピードアップをもたらす。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:34:53 GMT)
End-to-End Multi-Microphone Speaker Extraction Using Relative Transfer Functions [16.4] 本稿では,残響環境における複数話者と指向性雑音を含む混合音から所望の話者を抽出するマルチマイクロホン手法を提案する。
音響シナリオの挑戦による実験結果から,空間的手がかりを用いることでスペクトルベースのキューよりも優れた性能が得られることが示され,その瞬間的な性能はDOAベースの空間的キューより優れていた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:27:44 GMT)
Gradient Multi-Normalization for Stateless and Scalable LLM Training [16.0] 大規模言語モデル(LLM)のトレーニングは通常、コンバージェンスを加速するために追加のステート情報を格納するAdamのようなアダプティブに依存している。
SWAN (Ma et al., 2024) のような最近の取り組みは、状態の必要性を排除し、瞬時勾配に適用したマルチステップ前処理手順により、Adamに匹敵する性能を達成することでこの問題に対処している。
複数の基準に従って勾配を正規化するステートレス勾配を設計するための新しいフレームワークを導入する。最大10億のパラメータを持つ事前学習LLaMAモデルの実験は、Adamよりも3倍のスピードアップを示し、メモリ要求を大幅に削減し、他のメモリ効率のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:09:53 GMT)
Dual Interior Point Optimization Learning [16.0] 本稿では,予備的アプローチを補完し,品質保証を提供する2つの実現可能な解の学習方法について検討する。
提案した双対完備化手法は、双対問題の構造を活用できない最適化プロキシの学習方法よりも優れている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:56:23 GMT)
Dual Conic Proxy for Semidefinite Relaxation of AC Optimal Power Flow [16.0] 本稿では,半定値緩和ACOPF問題に対する二重円錐プロキシアーキテクチャを提案する。
提案手法は, 双対SDP問題の構造を生かした, 微分可能な双対ニューラルネットワーク戦略を組み合わせたものである。
その結果、提案したSDPベースのプロキシは、より弱い円錐緩和より優れることが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:18:18 GMT)
LCQ: Low-Rank Codebook based Quantization for Large Language Models [16.0] 大規模言語モデルに対する低ランクコードブックに基づく量子化を提案する。
実験の結果,LCQ はストレージコストが比較的高い既存手法よりも精度がよいことがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:04:53 GMT)
A Systematic Review of NLP for Dementia -- Tasks, Datasets and Opportunities [15.9] 認知症関連にNLPを適用した240以上の論文をレビューする。
全論文の半数は、臨床データを用いた認知症検出のみに焦点を当てている。
信頼、科学的厳密さ、適用可能性、コミュニティ間のコラボレーションに関するギャップと機会を強調します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:39:24 GMT)
Private Federated Learning In Real World Application -- A Case Study [15.9] 本稿では,エッジデバイス上でのPFL(Private Federated Learning)を用いた機械学習モデルトレーニングの実装について述べる。
本稿では,ユーザのプライベートデータを用いたモデルトレーニングの課題に対処するために,PFLを用いた新しいフレームワークを提案する。
このフレームワークは、ユーザーデータが個々のデバイスに留まることを保証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:28:24 GMT)
Transparent NLP: Using RAG and LLM Alignment for Privacy Q&A [15.9] 一般データ保護規則では、正確な処理情報を明確でアクセスしやすいものにする必要がある。
本稿では,その義務を果たすためのアライメント技術によって強化された,最先端の検索生成システムについて検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:42:00 GMT)
Game of Coding With an Unknown Adversary [15.8] 新興の分散型アプリケーションによって動機づけられたコーディングフレームワークは、符号化されたシンボルに対する敵の制御が従来の符号化理論の基本的な限界を超えるシナリオに対処するために導入された。
デコーダは、データコレクタ(DC)として、受け入れと拒絶のメカニズムを持ち、次に推定モジュールが続くが、敵は、その実用性を最大化することを目指している。
我々は,直流が相手の効用関数を知らずに平衡付近で達成できる戦略にコミットできるアルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:06:10 GMT)
Zero-shot Depth Completion via Test-time Alignment with Affine-invariant Depth Prior [15.8] 本研究では,アフィン不変深度拡散モデルとテスト時間アライメントからなるゼロショット深度補完法を提案する。
提案手法では,アフィン不変深度を計量スケールのスパース測定と整合させ,テスト時に最適化ループを通した厳密な制約として適用する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:38:33 GMT)
When Data Manipulation Meets Attack Goals: An In-depth Survey of Attacks for VLMs [15.7] VLM(Vision-Language Models)に適した攻撃戦略を詳細に調査する。
我々はこれらの攻撃をその根底にある目的に基づいて分類する。
これらの脆弱性を軽減するために提案されている防衛機構について概説する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:20:08 GMT)
LLMmap: Fingerprinting For Large Language Models [15.7] LLMmapは、わずか8つのインタラクションで、95%以上の精度で42の異なるLLMバージョンを正確に識別することができる。
潜在的な軽減策について議論し、資源に満ちた敵に対して、効果的な対策が困難か、あるいは実現不可能であることを実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:42:35 GMT)
Large Language Model Enhanced Knowledge Representation Learning: A Survey [15.6] 知識表現学習(KRL)は、知識グラフから下流タスクへの記号的知識の適用を可能にするために重要である。
この研究は、これらの進化する領域における新たな研究方向を同時に特定しながら、下流のタスクの広範な概要を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:38:25 GMT)
LessLeak-Bench: A First Investigation of Data Leakage in LLMs Across 83 Software Engineering Benchmarks [15.6] 大規模言語モデル(LLM)は、コード生成やプログラムの自動修復といったソフトウェア工学(SE)タスクで広く利用されている。
広範囲かつしばしば開示されていない事前トレーニングデータセットへの依存は、データ漏洩に関する重大な懸念を提起する。
本稿では,LLM に関する 83 SE ベンチマークにおいて,データ漏洩の大規模解析を行った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:33:49 GMT)
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers [15.6] CustomVideoXは、LoRAパラメータをトレーニングして参照機能を抽出することで、事前トレーニングされたビデオネットワークを活用する。
本稿では,参照画像特徴の直接的かつ同時エンゲージメントを可能にする3D参照注意を提案する。
実験の結果, CustomVideoXはビデオの一貫性や品質という点で既存手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:50:32 GMT)
Do generative video models learn physical principles from watching videos? [15.5] AIビデオ生成は、品質とリアリズムが急速に進歩し、革命を遂げている。
ビデオモデルは、物理の法則を発見する「世界モデル」を学ぶのか、それとも、現実の物理原理を理解せずに視覚的リアリズムを達成するための高度なピクセル予測器なのか?
我々は,様々な物理原理の深い理解を得ることによってのみ解決できるベンチマークデータセットであるPhysical-IQを開発することで,この問題に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:31:57 GMT)
Learning to Communicate Through Implicit Communication Channels [15.4] Implicit Channel Protocol (ICP) は、エージェントが暗黙の通信チャネルを通じて通信することを可能にするプロトコルである。
ICPは、スカウティングアクションと呼ばれるアクションのサブセットと、メッセージのエンコードとデコードを行うこれらのスカウティングアクション間のマッピングを利用する。
ICPは、より効率的な情報伝送によってベースライン法を著しく上回る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:32:30 GMT)
TimeKAN: KAN-based Frequency Decomposition Learning Architecture for Long-term Time Series Forecasting [15.3] 複数の周波数混在に起因する複雑な予測問題に対処するために,kan-based Frequency Decomposition Learning Architecture (TimeKAN)を提案する。
TimeKANは主に、カスケード周波数分解(CFD)ブロック、M-KAN(Multi-order Kan Representation Learning)ブロック、周波数混合ブロックの3つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:51:26 GMT)
Is an Ultra Large Natural Image-Based Foundation Model Superior to a Retina-Specific Model for Detecting Ocular and Systemic Diseases? [15.1] RETFoundおよびDINOv2モデルは眼疾患検出および全身性疾患予知タスクのために評価された。
RETFoundは、心不全、梗塞、虚血性脳梗塞の予測において、すべてのDINOv2モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:31:39 GMT)
Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations [15.0] 幻覚に対処するために視覚言語モデル(VLM)の内部表現について検討する。
我々は,VLMの内部画像表現を言語語彙に投影し,実物体の出力確率を幻覚的物体よりも高い信頼度で観測する。
モデルが潜在する表現を対象とする編集は、COCO2014データセットで最大25.7%の幻覚を減少させることができることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:13:31 GMT)
Jakiro: Boosting Speculative Decoding with Decoupled Multi-Head via MoE [15.0] 投機的復号(SD)は、より小さなドラフトモデルを用いて複数のトークンを予測することで、大きな言語モデル推論を加速する。
本稿では,専門家の混在(Mixture of Experts, MoE)を利用したJakiroを提案する。
提案手法は予測精度を大幅に向上し,推論高速化を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:24:06 GMT)
ProSec: Fortifying Code LLMs with Proactive Security Alignment [14.9] コード固有の大規模言語モデル(LLM)は、現実世界のシステムに脆弱性をもたらす可能性がある。
コードLLMをセキュアなコーディングプラクティスと整合させるために設計された,新たなセキュリティアライメントアプローチであるProSecを提案する。
実験により、ProSecでトレーニングされたモデルは、以前の研究よりも25.2%から91.4%安全であることが示されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:59:18 GMT)
Train for the Worst, Plan for the Best: Understanding Token Ordering in Masked Diffusions [14.9] 仮面拡散モデル (MDMs) は、離散領域にまたがる生成的モデリングのための有望な代替手法として登場した。
適応推論は、事前訓練されたMDMの精度を7$%から90$%に向上させ、ARMを7times$のパラメータで上回ります。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:47:21 GMT)
Grounding Creativity in Physics: A Brief Survey of Physical Priors in AIGC [14.5] AI生成コンテンツの最近の進歩は、3Dおよび4D生成のリアリズムを著しく改善した。
既存の手法の多くは、基礎となる物理原理を無視しながら外観整合性を優先している。
本調査では,物理的制約が3次元および4次元生成にどのように組み込まれているかを体系的に解析する物理認識生成法について概説する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:13:16 GMT)
Who is Helping Whom? Analyzing Inter-dependencies to Evaluate Cooperation in Human-AI Teaming [14.5] 本稿では, エージェントが相互の行動にどの程度依存しているかを測定するために, 相互依存の概念を提案する。
私たちは、MARL for HATでトレーニングされた最先端のエージェントと、人気のあるオーバークッキングドメインの学習された人間モデルとをペアにし、これらのヒューマンエージェントチームのチームパフォーマンスを評価します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:16:20 GMT)
Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects [14.5] 様々な地形と変形可能な物体で物体を操作することは、ロボット工学における大きな課題である。
本研究では、より小さな部分グラフからなる不均一グラフのレンズを通してこの問題をフレーム化する。
本稿では,多種多様な物体の厳密な挿入を含む,新規で挑戦的な強化学習ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:10:25 GMT)
Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation [14.4] Think-on-Graph 2.0 (ToG-2) は、構造化されていない知識ソースと構造化されていない知識ソースの両方から情報を反復的に取得するハイブリッドRAGフレームワークである。
ToG-2は、グラフ検索とコンテキスト検索の交互に、質問に関連する詳細な手がかりを検索する。
GPT-3.5で7つの知識集約データセットのうち6つで、全体的なSOTA(State-of-the-art)のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:16:09 GMT)
Hybrid State-Space and GRU-based Graph Tokenization Mamba for Hyperspectral Image Classification [14.3] ハイパースペクトル画像(HSI)分類は, 環境モニタリング, 農業, 都市計画などの領域において重要な役割を担っている。
機械学習や畳み込みニューラルネットワーク(CNN)といった従来の手法は、複雑なスペクトル空間の特徴を効果的に捉えるのに苦労することが多い。
この研究は、スペクトル空間トークン生成、グラフベースのトークン優先順位付け、およびクロスアテンション機構を組み合わせたハイブリッドモデルであるGraphMambaを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:02:19 GMT)
Motion Forecasting for Autonomous Vehicles: A Survey [14.2] 我々は、自動運転車のシナリオベースと知覚ベースのモーション予測の両方に焦点をあてる。
本研究は,教師付き学習と自己指導型学習の2つの主要なカテゴリに分類する。
本稿は、このAV技術の重要領域における進歩を推進すべく、潜在的研究の方向性を結論し、議論する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:13:24 GMT)
Gaussian Approximation and Multiplier Bootstrap for Stochastic Gradient Descent [14.2] 我々は、勾配勾配のポリアック=ルパート平均的反復に対する中心極限定理において、非漸近収束率を確立する。
最適化問題に対する信頼度セットを構築するための乗算器ブートストラップの非漸近的妥当性を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:49:05 GMT)
Learning Invariant Causal Mechanism from Vision-Language Models [14.0] 学習環境における不変要因と変動要因の因果関係は,試験環境と異なることを示す。
CLIP(CLIP-ICM)フレームワークの不変因果機構を提案する。
提案手法は,CLIPの信頼性を高めるため,シンプルだが強力な拡張を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:14:17 GMT)
Unifying Two Types of Scaling Laws from the Perspective of Conditional Kolmogorov Complexity [14.0] 2020年、OpenAIは最初のタイプのスケーリング法則を提案し、モデル損失とパラメータ、データ、トレーニング計算のスケールの関係について説明した。
2024年、OpenAIは第2のスケーリング法則を提案し、モデル推論性能と推論計算の関係を説明した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:55:12 GMT)
NLGR: Utilizing Neighbor Lists for Generative Rerank in Personalized Recommendation Systems [13.8] ジェネレーティブリジェネレータの近隣リストモデルは、空間におけるジェネレータのパフォーマンスを改善することを目的としている。
本稿では,既存のリストから任意の隣接リストへ柔軟にジャンプ可能な,サンプリングに基づく非自己回帰生成手法を提案する。
NLGRの有効性を実証し,NLGRをMeituanフードデリバリープラットフォームに導入することに成功している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:06:17 GMT)
Aligning Large Language Models for Enhancing Psychiatric Interviews Through Symptom Delineation and Summarization: Pilot Study [13.8] 本研究は、北朝鮮の亡命者からのカウンセリングデータを分析することにより、精神科面接の強化に焦点を当てる。
本研究は,(1)精神医学的症状を示唆する会話の一部を識別し,その症状を認識することができるか,(2)面接書に基づいてストレスや症状を要約することができるかを検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:28:01 GMT)
SLM-Mod: Small Language Models Surpass LLMs at Content Moderation [13.8] 大規模言語モデル(LLM)は、コンテンツモデレーションを含む多くの自然言語理解タスクにおいて有望であることを示している。
コミュニティ固有のコンテンツモデレーションタスクにおいて,SLM(Small Language Model)のオープンソース利用について検討する。
15のRedditコミュニティからの150万のコメントを使って、SLMはコンテンツモデレーションにおいてゼロショットのLLMよりも優れています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:02:11 GMT)
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning [13.6] CleanUMambaは、生の波形に直接適応する因果音声を識別するために設計された時間領域ニューラルネットワークアーキテクチャである。
CleanUMamba は PESQ スコア 2.42 と STOI の 95.1% を 442K パラメータと 468M MAC で達成している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:07:54 GMT)
Humans Co-exist, So Must Embodied Artificial Agents [13.6] 本稿では, 人工エージェントの共存概念を紹介する。
我々は、人間と有意義で長期的な対話の前提であると主張している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:38:21 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [13.5] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
I-HallAを用いて5つのTTIモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できないことを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:10:32 GMT)
Unstable Unlearning: The Hidden Risk of Concept Resurgence in Diffusion Models [13.5] 一見無関係な画像にテキストから画像への拡散モデルを微調整することで、以前は「未学習」だった概念を「再学習」することができることを示す。
本研究は,インクリメンタルなモデル更新の脆弱さを浮き彫りにして,テキスト・ツー・イメージ拡散モデルの安全性と整合性を確保するための現在のアプローチに対する深刻な新たな懸念を提起するものである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:21:18 GMT)
Tighter Value-Function Approximations for POMDPs [13.4] 本稿では,一般的に用いられる高速情報境界よりも,新しい,証明可能な高値境界を導入する。
計算オーバーヘッドの増大にもかかわらず、新しい上限は幅広いベンチマークで最先端のPOMDPソルバを加速させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:48:09 GMT)
Physics-Guided Foundation Model for Scientific Discovery: An Application to Aquatic Science [13.3] 事前学習したMLモデルと物理モデルを組み合わせたtextittextbfPhysics-textbfGuided textbfFoundation textbfModel(textbfPGFM)を提案する。
実世界の湖沼における水温と溶存酸素動態のモデル化における本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:48:10 GMT)
C-3PO: Compact Plug-and-Play Proxy Optimization to Achieve Human-like Retrieval-Augmented Generation [13.1] C-3POは、レトリバーと大規模言語モデル間の通信を容易にするプロキシ中心のフレームワークである。
我々のフレームワークは、RAGパイプライン全体を協調的に最適化する3つの特殊エージェントを実装している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:04:32 GMT)
Constrained Decoding with Speculative Lookaheads [13.1] 我々は投機的ルックアヘッド(CSL)を用いた制約付き復号法を提案する。
CSLは、最近提案された投機的復号化のアイデアによって動機付けられている。
3つのLLMファミリーを持つ2つの制約デコードタスクにおけるCDSLの評価を行い、CDLHの2.2倍から12.15倍の高速化を実現した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:51:59 GMT)
User-Preference Meets Pareto-Optimality: Multi-Objective Bayesian Optimization with Local Gradient Search [13.1] PUB-MOBO(Presistal-utility- Balanced MOBO)を提案する。
PUB-MOBOは、ユーティリティベースのMOBOとローカルなマルチ段階の降下を組み合わせ、ユーザの好むソリューションをほぼパレート最適に洗練する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:12:12 GMT)
Zero-Knowledge Proof Frameworks: A Survey [12.9] Zero-Knowledge Proofs (ZKPs) は暗号プリミティブであり、証明者が秘密そのものについて何も明らかにせずに、秘密の値の知識を検証者に示すことができる。
ZKPは、業界と学術の両方で実証されているように、非常に強力なツールである。
これらのフレームワークの機能と実世界のアプリケーションを理解するには、依然として大きなギャップがあります。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:55:43 GMT)
DeepGate4: Efficient and Effective Representation Learning for Circuit Design at Scale [12.7] 本稿では,大規模回路のためのスケーラブルで効率的なグラフトランスであるDeepGate4を紹介する。
DeepGate4は最先端の手法をはるかに上回り、次世代モデルよりも15.5%の性能向上を実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:28:50 GMT)
Neural Lattice Reduction: A Self-Supervised Geometric Deep Learning Approach [12.7] 本稿では,ニューラルネットワークによる格子縮小問題に対するアルゴリズム空間のパラメータ化と,教師付きデータを持たないアルゴリズムの探索を行うことが可能であることを示す。
本研究では,一様行列の因子を出力する深層ニューラルネットワークを設計し,非直交格子基底をペナルライズして自己指導的に学習する。
提案手法は,一連のベンチマークにおいて,Lenstra-Lenstra-Lov'aszアルゴリズムに匹敵する複雑性と性能を持つアルゴリズムが得られることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:57:58 GMT)
Observation of Coherent Quantum Tunneling of a Massive Atomic Cluster with 435 u [12.6] トンネル現象(英: Tunneling)は、電子のような低質量の粒子で典型的に観測される真の量子現象である。
5つの超低温ルビジウム-87原子からなる結合クラスターのコヒーレント量子トンネルの観測を報告する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:24:17 GMT)
Shapley-PC: Constraint-based Causal Structure Learning with a Shapley Inspired Framework [12.5] 因果構造学習(CSL)は、データ中の変数間の因果関係を抽出する。
そこで本研究では,制約に基づくCSLアルゴリズムの改良手法であるShapley-PCを提案する。
我々はShapley-PCの健全性、完全性、一貫性を証明し、提案アルゴリズムが既存のPCよりも優れていることを示すシミュレーション研究を行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:19:38 GMT)
Preserving Privacy in Large Language Models: A Survey on Current Threats and Solutions [12.5] 大規模言語モデル(LLM)は、人工知能の大幅な進歩を表し、様々な領域にまたがる応用を見つける。
トレーニングのための大規模なインターネットソースデータセットへの依存は、注目すべきプライバシー問題を引き起こす。
特定のアプリケーション固有のシナリオでは、これらのモデルをプライベートデータで微調整する必要があります。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:42:08 GMT)
Large Language Models in Software Security: A Survey of Vulnerability Detection Techniques and Insights [12.4] 大規模言語モデル(LLM)は、ソフトウェア脆弱性検出のためのトランスフォーメーションツールとして登場している。
本稿では,脆弱性検出におけるLSMの詳細な調査を行う。
言語間の脆弱性検出、マルチモーダルデータ統合、リポジトリレベルの分析といった課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:33:38 GMT)
Low-dimensional Functions are Efficiently Learnable under Randomly Biased Distributions [12.4] 第一モーメントのランダムシフトにより、データ分布に小さなランダムな摂動を導入することで、任意のガウス指標モデルを線形関数として容易に学習できることを証明した。
この結果をマルチインデックスモデル、すなわちスパースブール関数のクラス、つまりユンタス(Juntas)に拡張する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:19:30 GMT)
DVFS-Aware DNN Inference on GPUs: Latency Modeling and Performance Analysis [12.4] ディープニューラルネットワーク(DNN)のレイテンシとエネルギー消費のバランスをとるための有望な技術として、ダイナミック電圧周波数スケーリング(DVFS)が登場している
本稿では,GPU上でのDNN推定時間を正確に特徴付けるDVFS対応遅延モデルを提案する。
評価の結果,提案モデルによる局所的推論最適化は,それぞれ66%,69%の時間とエネルギー消費を削減できることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:34:25 GMT)
Adaptive Generation of Privileged Intermediate Information for Visible-Infrared Person Re-Identification [12.2] 本稿では,Privileged Intermediate Information Trainingアプローチの適応生成について紹介する。
AGPI2は、VとIのモダリティ間で識別情報をブリッジする仮想ドメインを適応して生成するために導入された。
V-I ReIDを用いた実験の結果,AGPI2は余分な計算資源を使わずにマッチング精度を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:25:37 GMT)
ETA: Evaluating Then Aligning Safety of Vision Language Models at Inference Time [12.2] 対向的な視覚入力は、容易にVLM防御機構をバイパスすることができる。
本稿では,入力された視覚的内容と出力応答を評価する2相推論時間アライメントフレームワークを提案する。
実験の結果, ETAは無害性, 有用性, 効率の点で, ベースライン法よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:47:27 GMT)
Bidirectional Multi-Step Domain Generalization for Visible-Infrared Person Re-Identification [12.1] 可視赤外人物再識別(V-I ReID)における重要な課題は、モダリティ間の重要な相違を効果的に解決できるバックボーンモデルを訓練することである。
本稿では,多目的多段階領域一般化(Bidirectional Multi-step Domain Generalization)を提案する。
V-I ReIDデータセットを用いて行った実験は、BMDGアプローチが最先端のパーツベースおよび中間生成手法より優れていることを示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:04:53 GMT)
Bayesian Optimization by Kernel Regression and Density-based Exploration [12.1] 本稿では,カーネル回帰と密度に基づく探索(BOKE)アルゴリズムによるベイズ最適化を提案する。
BOKEは、効率的な関数近似、探索のためのカーネル密度、最適化プロセスを導くために改善されたカーネル回帰高信頼境界基準にカーネル回帰を用いる。
我々は,BOKEがガウスのプロセスベース手法と競合するだけでなく,計算効率も優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:16:51 GMT)
Closed-form Solutions: A New Perspective on Solving Differential Equations [12.0] 本稿では,様々な微分方程式に対する記号閉形式解の導出に強化学習を利用する,機械学習に基づく新しい解法SSDEを提案する。
一般偏微分方程式および偏微分方程式に対する評価は、SSDEが他の機械学習手法と比較して解析的解の達成に優れた性能を提供することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:01:34 GMT)
Serial Scammers and Attack of the Clones: How Scammers Coordinate Multiple Rug Pulls on Decentralized Exchanges [12.0] 最初に、UnixwapとPancakeswapのSimple Rug Pullsの背後に、約384,000のスキャマーアドレスの2つのデータセットを構築しました。
これらのパターンは、複数のRug Pullsを実行し、異なるアドレス間でマネーフローを整理する典型的な方法を示している。
次に、直接ETH/BNB転送または同じスカムプールの後方でリンクされたスカマーアドレスを含むスカムクラスタのより一般的な概念について検討した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:59:06 GMT)
The Elusive Pursuit of Reproducing PATE-GAN: Benchmarking, Auditing, Debugging [11.9] PATE-GANは、GAN(Generative Adversarial Networks)とPATEのプライベートトレーニングアプローチを組み合わせた、最も人気のあるアルゴリズムの1つとして登場した。
原著者の3つ(サブセット)を含む6つのオープンソースPATE-GAN実装を分析し,ベンチマークする。
DP監査を含む詳細なプライバシ評価を行い、すべての実装が意図したよりも多くのプライバシをリークしていることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:27:21 GMT)
Fully Exploiting Vision Foundation Model's Profound Prior Knowledge for Generalizable RGB-Depth Driving Scene Parsing [11.8] ビジョン基礎モデル(VFM)は多くのコンピュータビジョンタスクを進歩させた。
一般化可能なRGB深度運転シーン解析のためのVFMを完全に活用する手法を提案する。
HFITサイドアダプタの入力として使用されるVFMの相対的な深さ予測結果は、深さマップへの依存の限界を克服する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:50:22 GMT)
Learning in Zero-Sum Markov Games: Relaxing Strong Reachability and Mixing Time Assumptions [11.8] 無限水平ゼロサムマルコフゲームにおけるペイオフに基づく分散学習に対処する。
この設定では、各プレイヤーは、相手の戦略や行動を観察したり情報を共有したりすることなく、受信した報酬のみに基づいて決定を行う。
Tsallisエントロピー正規化器によって誘導される値とポリシーの更新の新たな性質を確立することにより、近似ナッシュ平衡への有限時間収束を証明できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:55:57 GMT)
Evaluating Entity Retrieval in Electronic Health Records: a Semantic Gap Perspective [11.8] EHRにおけるエンティティ検索評価のための新しいベンチマークの開発とリリースを提案する。
我々はMIMIC-IIIデータセットからの放電サマリーを使用し、1,246のクエリを生成し、77,000以上の関連アノテーションを提供する。
意味的ギャップを初めて評価するために,関連性マッチングのための新しい分類システムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:33:47 GMT)
Contextual Thompson Sampling via Generation of Missing Data [11.7] 我々は、Thompsonが文脈帯域幅アルゴリズムをサンプリングするフレームワークを提案する。
我々のアルゴリズムは、不確実性は、欠落しているが観測可能な将来的な結果から生じるものとして扱う。
この概念化にインスパイアされた我々のアルゴリズムは、各意思決定時に、生成モデルを用いて、将来の結果の欠落を示唆する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:57:00 GMT)
Solving Linear-Gaussian Bayesian Inverse Problems with Decoupled Diffusion Sequential Monte Carlo [11.6] 線形ガウス逆問題に対する連続モンテカルロ法を設計する。
合成データと画像再構成タスクにおけるDDSMCアルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:59:02 GMT)
Lotus: Creating Short Videos From Long Videos With Abstractive and Extractive Summarization [11.6] 短いビデオはTikTokやInstagramなどのプラットフォームで人気がある。
現在、クリエイターはビジュアルに新たに録音されたナレーションを追加することで、既存の長編ビデオクリップや抽象的短編ビデオからなる抽出的短編ビデオを作成している。
オリジナルコンテンツの保存とコンテンツの柔軟性のバランスを両立させるシステムであるLotusを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:40:34 GMT)
Deep Learning in Automated Power Line Inspection: A Review [11.3] 電力線メンテナンスはコンピュータビジョンを利用した自動検査への移行によってパラダイムシフトを経験している。
近年,電力線検査における深層学習技術の適用に注目が集まっている。
本稿では,電力線データ解析のためのディープラーニングシステムの改良を,研究者や産業が支援するための既存研究のレビューを行った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:13:45 GMT)
A Large-scale AI-generated Image Inpainting Benchmark [11.2] 本稿では,高品質な塗り絵データセットの作成手法を提案し,それをDiQuID作成に適用する。
DiQuIDは、MS-COCO、RAISE、OpenImagesから78,000個のオリジナル画像から生成された95,000枚のインペイント画像で構成されている。
我々は、最先端の偽造検出手法を用いて包括的なベンチマーク結果を提供し、検出アルゴリズムの評価と改善におけるデータセットの有効性を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:56:28 GMT)
On the Impact of the Utility in Semivalue-based Data Valuation [11.2] 機械学習(ML)における半値ベースのデータ評価は、下流のMLタスクに対する個々のデータポイントの寄与を定量化する。
このフレームワークは実際にデータ品質を評価するために使われてきましたが、実験ではさまざまなユーティリティで不整合な評価結果が明らかになりました。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:42:38 GMT)
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning [11.1] 低消費電力ロボットに効率的な空間推論を組み込んだ視覚言語ナビゲーション(VL-Nav)システムを提案する。
ロボットを誘導するための単一の画像レベルの特徴類似性に依存する従来の手法とは異なり、本手法は画素単位の視覚言語機能と好奇心駆動探索を統合している。
VL-Navは、全体の成功率86.3%に達し、以前の手法を44.15%上回った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:05:38 GMT)
Fast and High-Quality Auto-Regressive Speech Synthesis via Speculative Decoding [11.1] VADUSAは投機的復号化によって自動回帰TTSを高速化する最初のアプローチの一つである。
以上の結果から,VADUSAは推論速度を大幅に向上するだけでなく,将来的な音声コンテンツを自動回帰的に予測するためにドラフトヘッドを組み込むことにより,性能の向上を図っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:22:08 GMT)
Provably Near-Optimal Federated Ensemble Distillation with Negligible Overhead [11.1] フェデレートされたアンサンブル蒸留は、クライアント予測に基づいて、未ラベルのサーバデータセットの擬似ラベルを生成することによって、クライアントの不均一性に対処する。
本稿では,サーバ分散ジェネレータとローカルデータセットで学習したクライアント識別器を活用する,実証可能な近似重み付け手法を提案する。
様々な画像分類タスクに関する実験により,提案手法がベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:58:57 GMT)
Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification [11.1] ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインのパフォーマンスを評価することを目的としている。
相関型条件付スキームを用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:16:34 GMT)
IRepair: An Intent-Aware Approach to Repair Data-Driven Errors in Large Language Models [11.1] 大規模言語モデル(LLM)はデータセットのバイアスに弱いことで知られており、毒性などの問題を引き起こす。
本稿では,動的スライシングに基づく意図認識型LLM修復戦略であるIRepairを紹介する。
IRepairはエラーを43.6%効率よく修復する一方で,一般性能の46%低下を招いた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:07:02 GMT)
Accelerating Outlier-robust Rotation Estimation by Stereographic Projection [11.0] 本稿では,効率的かつロバストな回転推定法を提案する。
提案手法では,0.07秒以内に大規模(106$ポイント)と高度に破損した(90%外乱率)回転推定問題を解くことができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:37:36 GMT)
HODDI: A Dataset of High-Order Drug-Drug Interactions for Computational Pharmacovigilance [11.0] HODDIには2,506種類の薬物と4,569種類の副作用を含む109,744個の記録がある。
包括的統計分析は、HODDIの広範なカバレッジと堅牢な分析指標を示している。
薬物副作用予測における高次情報の有用性について検討した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:18:51 GMT)
Multitask Learning in Minimally Invasive Surgical Vision: A Review [11.0] 最小侵襲手術(MIS)は多くの手術に革命をもたらし、回復時間と患者の怪我のリスクを減らした。
データ駆動型外科的視覚アルゴリズムは、自律性を改善した将来のMISシステムの開発において重要な構成要素であると考えられている。
機械学習とコンピュータビジョンの最近の進歩は、MISビデオにおける課題の緩和を約束して、MISから得られたビデオを分析することに成功している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:35:58 GMT)
Debiasing Guidance for Discrete Diffusion with Sequential Monte Carlo [10.9] 本稿では,ターゲット分布から不均一に生成するSequential Monte Carloアルゴリズムを提案する。
我々は、低次元分布、制御された画像、テキスト生成に対するアプローチを検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:27:54 GMT)
Integrating Sequence and Image Modeling in Irregular Medical Time Series Through Self-Supervised Learning [10.9] シーケンス表現と画像表現の両方を組み込んだ共同学習フレームワークを提案する。
我々のアプローチは、3つの代表的な実世界の臨床データセットにおいて、他の7つの最先端モデルよりも優れています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:49:41 GMT)
Learning Musical Representations for Music Performance Question Answering [10.9] マルチモーダル学習法は音楽演奏の基本的問題に対処できない。
私たちのメインのバックボーンは、音楽データのコンテキストにマルチモーダルインタラクションを組み込むように設計されています。
本実験は,音楽AVQAデータセットに対する最先端効果を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:41:57 GMT)
POEX: Understanding and Mitigating Policy Executable Jailbreak Attacks against Embodied AI [10.9] 複雑な命令を実行可能なポリシに変換する計画モジュールとしてLLMを統合することで、Embodied AIシステムは急速に進化している。
本稿では,従来のLLMジェイルブレイク攻撃をEAIシステムに適用する可能性と理性について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:13:17 GMT)
LCIRC: A Recurrent Compression Approach for Efficient Long-form Context and Query Dependent Modeling in LLMs [10.8] 本稿では,長文列をモデルの長さ制限を超えて効率的に処理できるLCIRC(Long-form Context Injection with Recurrent Compression)を提案する。
また、クエリ依存コンテキストモデリングを導入し、クエリ関連情報を選択的に圧縮し、モデルが最も関連するコンテンツを保持することを保証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:02:18 GMT)
Data Assimilation with Machine Learning Surrogate Models: A Case Study with FourCastNet [10.8] 部分的・雑音的な観測を補足した機械学習サロゲートを用いたオンライン天気予報について検討した。
サロゲートの長期間の不安定性と観測の空間性にもかかわらず、フィルタリング推定は長期間の地平線において正確である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:12:13 GMT)
UniZyme: A Unified Protein Cleavage Site Predictor Enhanced with Enzyme Active-Site Knowledge [10.7] タンパク質切断部位予測法として, タンパク質切断部位予測法を導入し, 多様な酵素をまたいで一般化する。
方法は、未確認酵素を含む様々なタンパク質分解酵素の切断部位の予測において高い精度を達成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:46:26 GMT)
Uncertainty-Aware Adaptation of Large Language Models for Protein-Protein Interaction Analysis [10.7] 大規模言語モデル(LLM)は、タンパク質の構造や相互作用を予測する際、顕著な可能性を示している。
しかし、それらの固有の不確実性は再現可能な発見を導き出す上で重要な課題である。
微調整LLaMA-3とBioMedGPTモデルを利用して,PPI解析のためのLLMの不確実性を考慮した適応を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:54:36 GMT)
WyckoffDiff - A Generative Diffusion Model for Crystal Symmetry [10.7] 本稿では,結晶の対称性に基づく記述を生成する生成モデルWyckoff Diffusionを提案する。
これは全ての対称性を符号化する結晶構造表現を考えることで実現される。
構成による対称性の尊重に加えて、我々のモデルの離散的性質は高速な生成を可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:04:23 GMT)
Semiring Provenance for Lightweight Description Logics [10.6] 本研究は,データベース設定で定義したフレームワークであるprofence semiringについて,記述ロジックについて検討する。
セミリングのいくつかの制限の下で、セマンティクスは望ましい性質を満たすことを示す。
本稿では,アサーションや接続型問合せ応答の証明に関連する問題の複雑性について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:20:25 GMT)
A Variant of the Bravyi-Terhal Bound for Arbitrary Boundary Conditions [10.6] 商 $mathbbZD/Lambda$ of $mathbbZD$ of cardinality $n$ on a $D$-dimensional lattice quotient を考える。
すべての安定化器ジェネレータが半径$rho$の範囲内にある量子ビットに作用すると、コードの最小距離$d$は$d leq msqrtgamma_D(sqrtD + 4rho)nfracD-1D$である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:23:04 GMT)
FairDropout: Using Example-Tied Dropout to Enhance Generalization of Minority Groups [10.3] 経験的リスク最小化で訓練されたモデルは、少数派からの事例を記憶しながら、多数派からの例をうまく一般化する傾向があることを示す。
本研究は、FairDropoutという手法として、この記憶を推論中に削除した特定のニューロンにリダイレクトすることを目的として、サンプルタイドドロップアウトを適用した。
視覚,言語,医療タスクを含むサブポピュレーション・ベンチマーク・スイートを用いて,FairDropoutを実証的に評価した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:18:54 GMT)
Enhancing Performance of Explainable AI Models with Constrained Concept Refinement [10.2] 正確性と解釈可能性のトレードオフは、機械学習(ML)における長年の課題である。
本稿では,概念表現における偏差の影響について検討し,これらの効果を緩和するための新しい枠組みを提案する。
従来の説明可能な手法と比較して,提案手法は様々な大規模ベンチマークにおいてモデル解釈可能性を維持しながら予測精度を向上するだけでなく,計算コストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:53:15 GMT)
Boosting Self-Efficacy and Performance of Large Language Models via Verbal Efficacy Stimulations [10.2] 本稿では,VES(Verbal Efficacy Stimulations)を紹介する。
VESは、助力や能力といった6つの側面に対処する、励まし、挑発的、批判的な3つの言語プロンプトから構成される。
実験結果から,3種類のVESはLLMの性能を向上し,最も有効なVESはモデルによって異なることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:54:03 GMT)
Learning Dynamic Representations via An Optimally-Weighted Maximum Mean Discrepancy Optimization Framework for Continual Learning [10.1] 継続的な学習は、モデルを永続的に取得し、保持することを可能にする。
悲惨な忘れ物は モデルパフォーマンスを著しく損なう
本稿では,表現変更に対する罰則を課す,OPMMD(Optimally-Weighted Mean Discrepancy)と呼ばれる新しいフレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:53:34 GMT)
SMAB: MAB based word Sensitivity Estimation Framework and its Applications in Adversarial Text Generation [10.1] 単語レベルの局所(文レベル)とグローバル(集約)の感性を計算するために,感性に基づく多言語帯域幅フレームワーク(SMAB)を導入する。
このアルゴリズムは直感的に高感度かつ低感度な単語をキャプチャする。
また,ゴールドデータがない場合,感度が精度の指標となることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:46:57 GMT)
TOCTOU Resilient Attestation for IoT Networks [10.0] TRAIN(TOCTOU-Resilient for IoT Networks)は,デバイス毎の脆弱性ウィンドウの一定時間を最小限にする,効率的なテクニックである。
我々はTRAINの実用性を実証し、完全に機能的で一般公開されたプロトタイプを通じてその性能を評価する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:41:11 GMT)
Machine Learning Fleet Efficiency: Analyzing and Optimizing Large-Scale Google TPU Systems with ML Productivity Goodput [10.0] 本稿では,GoogleのTPUに基づくMLフリートを大規模に解析する。
MLプロダクティビティグッドプット(ML Productivity Goodput)"のメトリクスを使って、MLフリート効率を計測する方法を示します。
また,MPGを用いて性能ボトルネックを特定し,最適化する手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:20:02 GMT)
Cascade of phase transitions in the training of Energy-based models [9.9] 原型エネルギーベース生成モデルBernoulli-Bernoulli RBMの特徴符号化過程について検討した。
本研究は、その特異値分解によるモデルの重み行列の進化をトラックする。
我々はBernoulli-Bernoulli RBMを実データ集合上でトレーニングすることで理論的結果を検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:23:09 GMT)
Unveiling Interpretability in Self-Supervised Speech Representations for Parkinson's Diagnosis [9.9] 本稿では,パーキンソン病の診断を支援するための新しい枠組みを提案する。
提案するフレームワークは, 単純かつ効果的なクロスアテンション機構の設計を通じて, 2つの異なる相補的視点から解釈可能性を提供する。
提案手法は最先端の手法と競合すると同時に,言語間シナリオにおける堅牢性も実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:25:26 GMT)
Low-power Spike-based Wearable Analytics on RRAM Crossbars [9.8] 本研究では、RRAMクロスバーに基づくインメモリコンピューティングエンジン上にデプロイされたスパイキングニューラルネットワーク(SNN)を利用したスパイクベースのウェアラブル分析システムを導入する。
従来のバックプロパゲーション(BP)に対する直接フィードバックアライメント(DFA)を用いた事前学習SNNのオンライン適応を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:00:05 GMT)
Confidence Improves Self-Consistency in LLMs [9.8] 信頼性インフォームド・セルフ一貫性(CISC)について紹介する。
CISCは、モデルから直接得られる信頼度スコアに基づいて、重み付けされた多数決を行う。
9つのモデルと4つのデータセットでテストすると、CISCはほぼすべての構成で自己整合性を上回っます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:10:29 GMT)
Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty [9.7] 早期のトレーニング段階から重要なサンプルを特定するために,難易度と不確実性を考慮した軽量度スコア(DUAL)を導入する。
また, 極端破砕時の破滅的精度低下に対処するために, ベータ分布を用いた比適応サンプリングを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:18:40 GMT)
On the Computability of Multiclass PAC Learning [9.5] 最近導入された計算可能PAC(CPAC)学習フレームワークでは、学習者と出力する関数の両方が計算可能であることが求められている。
識別器の計算可能次元がCPAC学習を特徴付けることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:07:23 GMT)
Cardiverse: Harnessing LLMs for Novel Card Game Prototyping [9.4] カードゲームは創造的なアイデアとゲームプレイ評価において広範囲の人的努力を必要とする。
大規模言語モデルの最近の進歩は、これらのプロセスの自動化と合理化の機会を提供する。
本稿では,カードゲームの自動プロトタイピングフレームワークを導入することで,これらの課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:47:35 GMT)
DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion [9.4] DPD-NeuralEngine は Gated Recurrent Unit (GRU) Neural Network (NN) に基づく超高速、小型、電力効率の DPD 加速器である。
22nmのCMOS実装は2GHzで動作し、最大250MSpsのI/Q信号を処理できる。
我々の知る限り、この研究はAIベースのDPDアプリケーション固有集積回路(ASIC)アクセラレーターとしては初めてのものである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:16:18 GMT)
SpikingSoft: A Spiking Neuron Controller for Bio-inspired Locomotion with Soft Snake Robots [9.4] 本研究は, 柔らかいヘビの振動を利用した移動歩行の可能性を探るものである。
可変出力パターンを生成するために、調整可能なしきい値を持つDouble Threshold Spiking Neuronモデルを導入する。
当社のアプローチであるSpkingSoftが自然にペアリングし,強化学習と統合できることを実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:43:34 GMT)
An Interpretable Implicit-Based Approach for Modeling Local Spatial Effects: A Case Study of Global Gross Primary Productivity [9.4] 地球科学では、観測されていない要因は非定常分布を示し、特徴と対象の関係が空間的不均一性を示す。
地理的機械学習タスクでは、従来の統計学習手法は空間的不均一性を捉えるのに苦労することが多い。
我々は、深層ニューラルネットワークを用いた空間差と並行して、異なる場所で共通する特徴を同時にモデル化する、新しい視点を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:44:54 GMT)
Large Language Models for Multi-Robot Systems: A Survey [9.3] マルチロボットシステム(MRS)は、調整、スケーラビリティ、現実の適応性など、ユニークな課題を提起する。
このサーベイは、MSSへのLLM(Large Language Models)統合に関する最初の包括的な調査を提供する。
家庭用ロボティクス、建設、構成制御、目標追跡、ロボットゲームなど、さまざまな分野における重要な応用に焦点を当てる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:37:55 GMT)
Task Offloading in Vehicular Edge Computing using Deep Reinforcement Learning: A Survey [9.2] 適応的,リアルタイムな意思決定を通じて計算オフロードを最適化するために,強化学習(RL)と深層強化学習(DRL)フレームワークの可能性を検討する。
本稿では,車載ネットワークにおけるDRLの理解と適用を促進することを目的とした,標準化された学習モデル,最適化された報酬構造,協調型マルチエージェントシステムなどの重要な側面に焦点を当てる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:02:20 GMT)
End-to-End Learning Framework for Solving Non-Markovian Optimal Control [9.2] 理論的には、FOLTI(textitfractional-order linear time-invariant)システムの最適制御を導出する。
提案手法は厳密な数学的モデルを確立し,解析解を導出し,深層学習を取り入れてデータ駆動型最適制御を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:51:41 GMT)
Test-time Alignment of Diffusion Models without Reward Over-optimization [9.0] 拡散モデルは生成的タスクにおいて優れているが、特定の目的とそれらを整合させることは依然として困難である。
そこで本研究では,SMC(Sequential Monte Carlo)をベースとした学習自由なテスト時間手法を提案する。
単一逆最適化、多目的シナリオ、オンラインブラックボックス最適化において、その効果を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:16:42 GMT)
Efficient Scientific Full Text Classification: The Case of EICAT Impact Assessments [8.9] 我々は,入力文のサブセットを選択する手法の開発に注力し,入力サイズを削減する。
我々は、侵略生物学の分野から全文科学論文からなる新しいデータセットをコンパイルする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:19:22 GMT)
A Planning Framework for Adaptive Labeling [8.9] 本稿では,バッチで計測作業を再配置できる適応ラベリングフレームワークを提案する。
1段階のルックアヘッドポリシーでさえ、一般的な適応ラベルよりも大幅に優れることを示す。
本稿では,従来の非微分可能MDPのスムーズなバージョンに基づいて,直接バックプロパゲーションに基づくSmoothed-Autodiffを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:01:08 GMT)
InvestESG: A multi-agent reinforcement learning benchmark for studying climate investment as a social dilemma [8.9] InvestESGは、ESG開示義務が企業気候投資に与える影響を研究するための、新しいマルチエージェント強化学習ベンチマークである。
我々の実験は、十分な資本を持つESGを意識した投資家がいなければ、開示委任統治下での企業緩和努力は限定的であることを示している。
地球温暖化のリスクに関するより多くの情報を提供することで、投資家が関与しなくても、企業は緩和により多くの投資をすることができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:22:48 GMT)
Does Generative AI speak Nigerian-Pidgin?: Issues about Representativeness and Bias for Multilingualism in LLMs [8.8] ナイジャ語はナイジェリアのピジン語で、約120万人の話者によって話されている。
西アフリカ・ピジン英語(西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:08:20 GMT)
Client-Centered Federated Learning for Heterogeneous EHRs: Use Fewer Participants to Achieve the Same Performance [8.8] EHRFLは,1つのクライアントに適したモデルを開発するために設計された,EHRを用いた連合学習フレームワークである。
本フレームワークは,1)テキストベースのEHRモデリングを用いた異種EHRシステムを用いたクライアント間のフェデレーション学習の実現,2)平均的な患者埋め込みを用いた適切なクライアントの選択によるフェデレーション学習のコスト削減,の2つの課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:18:31 GMT)
Properties of Wasserstein Gradient Flows for the Sliced-Wasserstein Distance [8.8] 目的関数としてスライスされたワッサースタイン距離(SW)の特性について検討する。
本研究の目的は、SW目標の最適化から生じる臨界点を厳密に分析することである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:49:22 GMT)
Whole-Body Teleoperation for Mobile Manipulation at Zero Added Cost [8.7] MoMa-Teleopは、既存のインターフェースからエンドエフェクタ動作を推測する新しい遠隔操作手法である。
提案手法は,様々なロボットやタスクに対して,タスク完了時間が大幅に短縮されることを実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:50:14 GMT)
Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection [8.6] 深層学習は、RGB画像と熱画像(RGB-T画像)を併用したサルエント物体検出(SOD)を大幅に改善した。
既存のディープラーニングベースのRGB-T SODモデルには2つの大きな制限がある。
本稿では,DFENet(Deep Fourier-Embedded Network)という,純粋なフーリエ変換モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:15:57 GMT)
Circuit-tuning: A Mechanistic Approach for Identifying Parameter Redundancy and Fine-tuning Neural Networks [8.6] 本研究では,微調整のための解釈可能な手法を開発し,学習の背景にあるメカニズムを明らかにする。
まず,本質的な次元の拡張としてノード冗長性の概念を提案し,新しい視点から回路発見の背後にある概念を説明する。
この理論に基づいて、回路探索を反復的に行う2段階のアルゴリズムであるサーキットチューニングを提案し、無関係なエッジをマスクアウトし、特定のタスクに責任を負う残りのパラメータを更新する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:35:53 GMT)
Select before Act: Spatially Decoupled Action Repetition for Continuous Control [8.4] 強化学習(Reinforcement Learning, RL)は、ロボット操作や移動など、様々な連続的な制御タスクにおいて顕著な成功を収めている。
近年の研究では、RLにアクション繰り返しを組み込んで、サンプル効率の向上と性能の向上を図りつつ、アクション持続性の向上を実現している。
既存の方法は、繰り返しの間、すべてのアクション次元を全体として扱い、それらの違いを無視します。
本稿では,各アクション次元に対してクローズドループ・アク・オート・リピート・セレクションを個別に実装したSDARという新しい繰り返しフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:07:28 GMT)
How Humans Help LLMs: Assessing and Incentivizing Human Preference Annotators [8.2] 我々は,人間のアノテーションの性能を評価し,高品質なアノテーションを提供することにインセンティブを与えるという課題について検討する。
我々は,企業とアノテータの挙動と相互作用を特徴付けるプリンシパルエージェントモデルを開発した。
このモデルは、双方に利益をもたらすアノテータをインセンティブ化するボーナススキームの実践的なメカニズムを合理化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:15:27 GMT)
Interactive Data Harmonization with LLM Agents [8.2] 本稿では,LLMに基づく推論,対話型ユーザインタフェース,データ調和プリミティブのライブラリを組み合わせたシステムであるHarmoniaを紹介する。
これは、データセットを標準フォーマットにマッピングする再利用可能なパイプラインをインタラクティブに作成するのに役立つ。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:50:09 GMT)
Diffeomorphic Temporal Alignment Nets for Time-series Joint Alignment and Averaging [8.1] 時系列分析では、非線形時間的不整合は、森林労働者がより単純な平均化を行うための重要な課題である。
DTANは入力依存の方法で微分同相変換を予測し、適用することにより、時系列アンサンブルのジョイントアライメント(JA)と平均化を容易にする。
我々は、マルチタスク学習(MT-DTAN)を組み込むためにフレームワークを拡張し、同時調整と分類を可能にした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:55:08 GMT)
ConMeC: A Dataset for Metonymy Resolution with Common Nouns [7.9] 我々は、NLPシステムは、文脈における共通名詞のメトニム的使用を識別できるべきであると論じる。
6,000の文からなる新しいメトニミーデータセットConMeCを作成します。
本稿では,大規模言語モデルを用いたメトニミー検出のためのチェーン・オブ・ソートに基づくプロンプト手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:04:36 GMT)
Krum Federated Chain (KFC): Using blockchain to defend against adversarial attacks in Federated Learning [7.9] フェデレーテッド・ラーニング(Federated Learning)は、非集中的なデバイス間で協調的なモデルトレーニングを可能にする、マシンラーニングへの新たなアプローチである。
その分散した性質は敵の攻撃を受けやすいことを示している。
我々は、敵の攻撃からフェデレートラーニングを守るブロックチェーンの可能性に取り組む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:15:50 GMT)
Bridging the Quantum Divide: Aligning Academic and Industry Goals in Software Engineering [7.9] 本稿では,量子ソフトウェア工学における学術と産業の実質的な違いについて考察する。
この断絶は主に、産業界への限られたアクセスと、商業環境での量子開発の競争性によって生じる。
我々は,この隔たりを橋渡しするための実践的ツール,方法論,ベストプラクティスの開発を目的とした協調的な取り組みを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:17:41 GMT)
Fair-MoE: Fairness-Oriented Mixture of Experts in Vision-Language Models [7.8] フェアネスと有効性の両方を保証するために特別に設計されたモデルであるFair-MoEを提案する。
Fair-MoEは2つの重要なコンポーネントで構成されている: textitthe Fairness-Oriented Mixture of Experts (FO-MoE)と textitthe Fairness-Oriented Loss (FOL)である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:45:26 GMT)
Simulation as Reality? The Effectiveness of LLM-Generated Data in Open-ended Question Assessment [7.7] 本研究では,AIに基づくアセスメントツールの限界に対処するため,シミュレーションデータの可能性とギャップについて検討する。
シミュレーションデータから, 自動評価モデルのトレーニングにおいて有望な結果が得られたが, 有効性には顕著な限界があることが判明した。
過度に処理された実世界のデータにも存在する実世界のノイズとバイアスが存在しないことが、この制限に寄与する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:40:11 GMT)
Direct-CP: Directed Collaborative Perception for Connected and Autonomous Vehicles via Proactive Attention [7.6] 提案するDirect-CPは,特定の方向でCPを改善することを目的とした,プロアクティブで方向対応のCPシステムである。
我々のキーとなる考え方は、エゴ車両が関心のある方向を積極的に信号し、その注意を調整し、局所的な方向CP性能を向上させることである。
本手法は,3次元物体検出作業における最先端手法よりも,関心方向における局所的知覚精度19.8%,全体的知覚精度2.5%を達成している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:06:38 GMT)
Automatic Annotation Augmentation Boosts Translation between Molecules and Natural Language [7.5] 本稿では,Language-based Automatic AugmentationフレームワークであるLA$3$を紹介した。
LA$3$の有効性を示すために、LaChEBI-20という拡張データセットを作成し、確立したデータセットから分子のアノテーションを書き換える。
ベンチマークアーキテクチャに基づいてLaMolT5をトレーニングし、分子表現と拡張アノテーションのマッピングを学習する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:29:21 GMT)
Online Covariance Matrix Estimation in Sketched Newton Methods [7.4] ランダム化されたスケッチ技術を利用して各イテレーションで近似したニュートンステップを実行するオンラインスケッチNewton法について検討する。
また、制約された問題に対する推定器の拡張についても論じ、回帰問題に対する優れた性能を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:11:02 GMT)
Beyond Batch Learning: Global Awareness Enhanced Domain Adaptation [7.4] Global Awareness Enhanced Domain Adaptation (GAN-DA)は、従来のバッチベースの制限を超越した新しいアプローチである。
GAN-DAは、ドメイン間分布のアライメントを容易にするために、ユニークな事前定義された特徴表現(PFR)を統合する。
実験では, GAN-DA の優れた優位性を示し, 確立された 24 のDA 法を有意差で上回った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:13:11 GMT)
Sample-efficient Learning of Concepts with Theoretical Guarantees: from Data to Concepts without Interventions [7.4] 概念ベースモデル(CBM)は、ラベルの予測に使用される画像などの高次元データから解釈可能な概念を学習する。
CBMにおける重要な問題は、概念リーク、すなわち学習された概念の急激な情報であり、事実上「間違った」概念を学ぶことにつながる。
本稿では,学習概念の正しさと必要なラベル数に関する理論的保証を提供する枠組みについて述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:01:56 GMT)
Low-Rank Compression for IMC Arrays [7.3] 低ランク圧縮は、それ自身の課題、すなわち、最適なIMCアレイの利用と、妥協された精度を示す。
提案手法は,既存の刈り取り技術に比べて最大2.5倍の高速化または+20.9%の精度向上を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:57:39 GMT)
Adaptive Reconstruction for Graph Neural Networks [7.3] グラフニューラルネットワーク(GNN)は、グラフ表現のための半教師付き学習において基礎となっている。
GNNにおける最近の研究動向 : テクスブファダプティブkホップ構造学習を中心に
我々はk-hop構造学習を動的に洗練するテクスチャファダプティブ再構築フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:17:47 GMT)
Discourse-Driven Evaluation: Unveiling Factual Inconsistency in Long Document Summarization [7.2] 本研究では,事実整合性エラーを考察し,それらと談話分析の行を結びつける。
長文を談話にインスパイアされたチャンクに分解するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:30:15 GMT)
AI Alignment at Your Discretion [7.1] AIアライメントでは、人間かアルゴリズムのいずれかのアノテータに対して、どのモデル出力がより良いか、より安全かを判断するために、緯度を付与しなければならない」。
このような判断はほとんど検討されていないままであり、(i)アノテータは任意に判断の力を利用することができ、(ii)モデルはこの判断を模倣することができない。
安全アライメントデータセットに対する人間とアルゴリズムの両方の裁量を測定することで、これまで考慮されていなかったアライメントプロセスにおける裁量層を明らかにする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:19:52 GMT)
PDM-SSD: Single-Stage Three-Dimensional Object Detector With Point Dilation [7.1] 現在のポイントベースの検出器は、提供されたポイントからしか学べない。
単段3次元検出のための新しい点拡散機構(PDM-SSD)を提案する。
PDM-SSDは,68フレームの推論速度を持つ単一モード法において,マルチクラス検出の最先端性を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:41:13 GMT)
Online Experimental Design With Estimation-Regret Trade-off Under Network Interference [7.1] オンライン実験設計のための統合型干渉認識フレームワークを提案する。
既存の研究と比較して、露出マッピングの統計的概念を利用して腕の空間の定義を拡張した。
また、アルゴリズムの実装を提案し、異なる学習環境とネットワークトポロジにまたがる一般化について議論する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:18:01 GMT)
General-Purpose $f$-DP Estimation and Auditing in a Black-Box Setting [7.1] 統計的に$f$-Differential Privacy(f$-DP)を評価する新しい手法を提案する。
異なるプライベートメカニズムをデプロイする際の課題は、DPが検証しにくいことである。
我々は,このプライバシー概念に対する既存のアプローチとは異なり,研究対象アルゴリズムの事前知識を必要としない,$f$-DPのための新しいブラックボックス手法を導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:58:17 GMT)
Evaluating the Impacts of Swapping on the US Decennial Census [7.0] 我々は,Censusの出版物,裁判所文書,およびCensusの従業員に対する非公式なインタビューに基づいて,パラメータ化スワップアルゴリズムを記述し,実装する。
我々は、TopDownが導入したシフトのタイプをスワップして比較することで、シフトのタイプを直観する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:59:49 GMT)
Multimodal Task Representation Memory Bank vs. Catastrophic Forgetting in Anomaly Detection [7.0] 教師なし連続異常検出(UCAD)はマルチタスク表現学習において大きな課題に直面している。
本稿では,MTRMB(Multimodal Task Representation Memory Bank)方式を提案する。
MVtec AD と VisA データセットの実験では、MTRMB の優位性が示され、平均検出精度は 0.921 である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:49:54 GMT)
Emergent Response Planning in LLM [7.0] 我々は,大規模言語モデル (LLM) が将来,その隠れ表現に先んじることを示す。
この結果は、透明性と生成制御を改善するための潜在的な応用を示唆している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:48:10 GMT)
Free Record-Level Privacy Risk Evaluation Through Artifact-Based Methods [6.9] メンバーシップ推論攻撃(MIA)は機械学習モデルにおけるプライバシリスクを評価するために広く利用されている。
最先端の手法では、ターゲットモデルと同じアーキテクチャで数百のシャドウモデルをトレーニングする必要があります。
そこで本研究では,トレーニングプロセス中に自然に入手可能なアーティファクトを解析することにより,メンバシップ推論攻撃に最も脆弱なトレーニングサンプルを同定する手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:04:29 GMT)
MCQG-SRefine: Multiple Choice Question Generation and Evaluation with Iterative Self-Critique, Correction, and Comparison Feedback [6.7] 医療事例を高品質なUSMLEスタイルの質問に変換する枠組みを提案する。
MCQG-SRefineは、専門家主導のプロンプトエンジニアリングと反復的な自己批判と自己補正フィードバックを統合している。
複雑でコストのかかる専門家評価プロセスを置き換えるため, LLM-as-Judge を用いた自動計測手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:52:10 GMT)
Automation in Model-Driven Engineering: A look back, and ahead [6.5] モデル駆動工学(MDE)は多くの異なるエンジニアリングタスクの自動化に関する知識の体系を提供する。
人工知能(AI)における大きな進歩により、MDEの将来について疑問が浮かび上がっている。
我々は、MDEにおける自動化の歴史と、MDEにおける自動化をさらに改善する方法の展望について論じる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:09:59 GMT)
Improved Regret Analysis in Gaussian Process Bandits: Optimality for Noiseless Reward, RKHS norm, and Non-Stationary Variance [6.4] 我々は,未知の報酬関数の下で後悔を最小限に抑えることを目標とするガウス過程(GP)バンドイット問題について検討する。
本稿では,GPの雑音分散パラメータの依存性を改善するために,最大後方分散の新たな上限を示す。
MVR と PE に基づくアルゴリズムは雑音分散依存的後悔の上界を達成でき、これは我々の後悔の低い下界と一致する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:29:27 GMT)
A Survey on Class-Agnostic Counting: Advancements from Reference-Based to Open-World Text-Guided Approaches [6.4] CAC(class-agnostic counting, Class-Agnostic counting, CAC)法について概説した。
本稿では,CACアプローチを参照ベース,参照レス,オープンワールドの3つのパラダイムに分類する分類法を提案する。
本研究では, FSC-147データセット, 金標準指標を用いたリーダボード, CARPKデータセットを用いて一般化能力の評価を行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:47:32 GMT)
Hyperparameters in Score-Based Membership Inference Attacks [6.2] メンバーシップ推論攻撃(MIA)は、機械学習モデルによるプライバシー漏洩を評価する貴重なフレームワークとして登場した。
本稿では,攻撃者が事前知識を持っていない場合に,MIAのシャドウモデルを訓練するためのハイパーパラメータを選択する手法を提案する。
トレーニングデータを用いたHPOの実行がMIAの脆弱性を増大させるという統計的に有意な証拠は見つからない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:44:46 GMT)
Foundation Model of Electronic Medical Records for Adaptive Risk Estimation [6.2] 健康シミュレーションのための拡張トランスフォーマー(ETHOS)は、患者タイムライン(PHT)をEHRからトークン化する。
リスク推定システム(ARES)は、臨床医が定義した臨界事象に対するダイナミックでパーソナライズされたリスク確率を計算するためにETHOSを使用している。
ARESにはパーソナライズされた説明可能性モジュールが組み込まれており、個々の患者のリスク見積に影響を与える重要な臨床要因を特定する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:22:39 GMT)
Discriminative and Consistent Representation Distillation [6.2] 識別・一貫性蒸留(DCD)
DCDは、教師と生徒の表現の分布の相違を最小限に抑えるために、一貫性の規則化とともに対照的な損失を生んでいる。
本手法では,これらの相補的目的のバランスをとるために,訓練中に適応する学習可能な温度パラメータとバイアスパラメータを導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:53:09 GMT)
Multi-Level Decoupled Relational Distillation for Heterogeneous Architectures [6.2] MLDR-KD(Multi-Level Decoupled Knowledge Distillation)は、CodeAR-100で最大4.86%、Tiny-ImageNetデータセットで2.78%向上した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:41:20 GMT)
Building Rome with Convex Optimization [6.2] 本研究では2次元鍵点計測を学習深度で3次元に引き上げるスケールドバンドル調整(SBA)法を提案する。
我々は,証明可能な大域的最適性を解決するために,実証的に厳密な凸半有限プログラム (SDP) を設計する。
最適化エンジンとしてXMを用いた動き(SfM)パイプラインを構築する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:41:04 GMT)
MT2ST: Adaptive Multi-Task to Single-Task Learning [6.2] Multi-Task to Single-Task (MT2ST) は、単語埋め込みタスクの訓練効率と精度を高めるために設計された。
我々のフレームワークは、補助的なタスクの影響を徐々に減らす*Diminish*と、特定の時点でMTLからSTLへトレーニングを移行する*Switch*の2つの戦略を採用している。
実験の結果,MT2STはSTLと比較してトレーニング時間を67%削減し,従来のMTLに比べて13%短縮し,高い精度を維持した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:13:16 GMT)
YINYANG-ALIGN: Benchmarking Contradictory Objectives and Proposing Multi-Objective Optimization based DPO for Text-to-Image Alignment [6.1] YinYangAlignは、テキスト・トゥ・イメージ(T2I)システムのアライメント忠実度を体系的に定量化するフレームワークである。
6つの基本的かつ本質的に矛盾する設計目標に対処する。
YinYangAlignには、人間のプロンプト、アライメントされた(コセン)応答、AI生成出力のミスアライメント(拒絶)、根底にある矛盾の説明を含む詳細なデータセットが含まれている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:34:39 GMT)
Universality of High-Dimensional Logistic Regression and a Novel CGMT under Block Dependence with Applications to Data Augmentation [6.1] ガウス普遍性はブロック依存下での高次元ロジスティック回帰を保っていることを示す。
我々は、深層学習における広範な実践であるデータ強化がリスクに与える影響を確立する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:04:53 GMT)
Scaling Multi-Document Event Summarization: Evaluating Compression vs. Full-Text Approaches [5.9] 大規模なマルチドキュメント要約(MDS)のための2種類のシステムとは対照的に、圧縮とフルテキストである。
フルテキストメソッドは、長期コンテキスト推論の最近の進歩に頼って、損失のない要約を約束する。
圧縮に基づく手法は、中間段階において強い確証を示し、フルコンテキストよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:15:08 GMT)
Curriculum Reinforcement Learning for Complex Reward Functions [5.8] 本稿では,まず簡単な報奨関数を最大化し,次に完全かつ複雑な報奨に遷移する2段階の報奨カリキュラムを提案する。
我々はDeepMindコントロールスイート上で,報酬定義に付加的な制約項を含むように修正した手法を評価する。
以上の結果から, 複雑な報酬を伴う環境において, 効率的かつ安定したRLに対する2段階報酬キュリキュラの可能性が示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:42:49 GMT)
Multi-label Scandinavian Language Identification (SLIDE) [5.7] 我々は,デンマーク語,ノルウェー語,ノルウェー語,ニノルスク語,スウェーデン語の多ラベル文レベルスカンジナビア語識別(LID)に焦点を当てた。
我々は,スカンディナヴィア言語識別と評価,SLIDE,手作業による複数ラベル評価データセット,および速度精度のトレードオフが変化するLIDモデルの組について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:16:55 GMT)
Sentient: Multi-Scenario Behavioral Intent Analysis for Advanced Persistent Threat Detection [5.7] Sentientは,監査ログからノードレベルの脅威を検出する行動意図分析に基づく脅威検出システムである。
実世界とシミュレートされた攻撃の両方をカバーする3つの広く使われているデータセットに対して、Sentientを評価する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:43:15 GMT)
LegalViz: Legal Text Visualization by Text To Diagram Generation [5.7] 我々は23の言語と7,010の法的文書と視覚化ペアを用いたLegalVizの新しいデータセットを提案する。
LegalVizは、法的エンティティ、トランザクション、法的ソース、ステートメントを一目で識別する複雑な法定コーパスからの簡単な図を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:25:05 GMT)
Can AI Examine Novelty of Patents?: Novelty Evaluation Based on the Correspondence between Patent Claim and Prior Art [5.7] 本稿では,特許の新規性を評価するための大規模言語モデル(LLM)の能力を評価することで,新たな課題を提起する。
本研究は,特許試験事例から得られた新規性評価に特化して設計された最初のデータセットについて述べる。
本研究は, 分類モデルが新規性を効果的に評価するのに苦慮する一方で, 生成モデルは合理的な精度で予測を行うことを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:09:29 GMT)
Better Fair than Sorry: Adversarial Missing Data Imputation for Fair GNNs [5.7] 我々は保護属性に対する公正なデータ計算モデルであるSorryよりも優れたフェアを提案する。
BFtSの鍵となる設計原理は、不定詞はフェアネスの最悪のシナリオを近似すべきである。
合成データセットと実データセットを用いた実験は、BFtSが既存のデータセットよりも精度の高い公平度xのトレードオフを達成できることをしばしば示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:32:04 GMT)
Faster Language Models with Better Multi-Token Prediction Using Tensor Decomposition [5.6] 本稿では, 精度を損なうことなくサンプリング効率を向上させることを目的とした, 変圧器のマルチトークン予測のための新しいモデルを提案する。
階数=r$標準確率分解に一般化することにより、複数のトークンを同時に予測する改良されたモデルを開発する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:58:34 GMT)
Efficient Ranking, Order Statistics, and Sorting under CKKS [5.5] ホモモルフィック暗号化(FHE)は、暗号化されたデータの操作を可能にするため、プライバシ保護アプリケーションに極めて有用である。
計算オーバーヘッドの増大とFHEのネイティブ操作の制限により、これらのタスクの効率的な実装には大きな課題が生じる。
比較深度を最大2(コンスタント)まで向上させるランキング、順序統計、ソートのためのソリューションを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:57:44 GMT)
Rationalization Models for Text-to-SQL [5.5] 本稿では,テキスト・ツー・シークレット・モデルの微調整を強化するために,CoT(Chain-of-Thought)論理を生成するフレームワークを提案する。
プロセスは、手動でサンプルの小さなセットをアノテートすることから始まり、その後、大きな言語モデルを促すために使用される。
その後、検証されたクエリに基づいて合理化モデルをトレーニングし、広範な合成CoTアノテーションを可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:38:57 GMT)
Synthetic Audio Helps for Cognitive State Tasks [5.4] テキスト音声合成モデルでは,自然な音声を生成するために,認知状態の側面の追跡を学習する。
我々は、認知状態モデリングに関連する7つのタスクがマルチモーダルトレーニングの恩恵を受けることを示すフレームワークであるSynthetic Audio Data Fine-tuning(SAD)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:16:24 GMT)
Occam's model: Selecting simpler representations for better transferability estimation [5.3] 本稿では,事前学習したモデルの伝達可能性を評価するための2つの新しい指標を提案する。
さまざまな問題設定にまたがる最先端の代替手段に対して、提案した指標を厳格に評価する。
我々は、我々の測定値が最先端のベースラインと比較して、KendallのTauを最大32%増加させることを実験的に示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:23:24 GMT)
Universal Vessel Segmentation for Multi-Modality Retinal Images [5.3] 多モード網膜画像に対する基礎的ユニバーサル血管分割モデル(UVSM)を提案する。
これは、クロスモダリティ網膜血管のセグメンテーションを達成する最初の研究であり、また、いくつかの新しいモダリティで網膜血管のセグメンテーションを研究する最初の研究である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:28:20 GMT)
Simplified derivations for high-dimensional convex learning problems [5.3] 本稿では,機械学習と神経科学における重要な結果の非複製的導出について述べる。
我々は,高次元学習問題であるポイントのパーセプトロン分類とカーネルリッジ回帰を解析する。
パーセプトロン・キャパシティ問題に対しては、Na" 法による正しいキャパシティの導出を可能にする対称性を同定する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:06:30 GMT)
How to Make LLMs Forget: On Reversing In-Context Knowledge Edits [5.3] In-context knowledge editing (IKE) は、パラメータの変更なしに、かつゼロコストで、大規模言語モデル(LLM)出力の効率的な修正を可能にする。
誤った情報や攻撃的な内容の挿入など、不適切な応答を操作するために誤用することができる。
特別に調整された逆転トークンを用いたIKE-editsの逆転タスクについて紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:04:12 GMT)
Has this Fact been Edited? Detecting Knowledge Edits in Language Models [5.3] 知識編集手法(KEs)は、事前学習から学んだ言語モデルの古いまたは不正確な知識を更新することができる。
生成されたアウトプットが編集された知識に基づいているか、あるいは事前学習からのファーストハンド知識に基づいているかを知ることは、生成モデルに対するユーザの信頼を高めることができる。
本稿では,言語モデルにおける編集された知識を検出する新しい課題を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:35:49 GMT)
Type2Branch: Keystroke Biometrics based on a Dual-branch Architecture with Attention Mechanisms and Set2set Loss [5.2] この記事では、KVC-onGoingコンペティションで最も低いエラー率を達成したモデルとテクニックであるType2Branchについて説明する。
約50文字が入力された被験者あたりの5つの登録サンプルを考えると、提案したType2Branchは最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:52:42 GMT)
EARN Fairness: Explaining, Asking, Reviewing, and Negotiating Artificial Intelligence Fairness Metrics Among Stakeholders [5.2] 我々は、AIの専門知識を必要とせず、利害関係者間でのメトリクスの集合的決定を促進する新しいフレームワークEARN Fairnessを提案する。
このフレームワークは、適応可能なインタラクティブシステムと、公正度指標を説明するステークホルダ中心のEARNフェアネスプロセス、利害関係者の個人的メトリック選好、総括的メトリクス、メトリクス選択に関するコンセンサスを交渉する。
我々の研究によると、EARN Fairnessフレームワークは、利害関係者が個人の好みを表現し、合意に達することを可能にし、リスクの高い状況下で人間中心のAIフェアネスを実装するための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:41:14 GMT)
FlexDeMo: Decoupled Momentum Optimization for Fully and Hybrid Sharded Training [5.2] 大規模なニューラルネットワークモデルのトレーニングには、広範な計算リソースが必要である。
最近の知見は、勾配の高速移動成分を交換するだけで十分かもしれないことを示唆している。
本稿では,異なるGPU間でノードが完全に同期するハイブリッド戦略FlexDeMoを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:55:59 GMT)
Estimation of Food Intake Quantity Using Inertial Signals from Smartwatches [5.2] 本稿では,市販スマートウォッチの噛み込み重量を推定するための新しいアプローチを提案する。
私たちの公開データセットには、10人の参加者によるスマートウォッチ慣性データが含まれています。
提案手法は,食材を装填するのに要する時間などの抽出された行動特徴と慣性信号の統計的特徴を組み合わせ,噛み重量を推定するための支持ベクトル回帰モデルへの入力として機能する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:38:13 GMT)
Beautiful Images, Toxic Words: Understanding and Addressing Offensive Text in Generated Images [5.2] 我々は、画像内に埋め込まれたNSFWテキストの生成という、新たな脅威を識別する。
これには侮辱、人種的暴行、性的暴行といった攻撃的な言葉が含まれる。
既存の緩和技術は、テキスト生成を著しく劣化させながら有害なテキスト生成を防ぐことができない。
この領域の研究を進めるために、画像中のNSFWテキスト生成を評価するためのオープンソースのベンチマークであるToxicBenchを紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:58:43 GMT)
Are all models wrong? Fundamental limits in distribution-free empirical model falsification [5.1] モデルクラス上で達成可能な最良のテストエラーに対して,下位境界を構築する問題に対して,モデルに依存しない基本硬度結果を確立する。
木に基づく手法や線形回帰といった特定のモデルクラスにその意味を考察する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:44:30 GMT)
A Novel Multi-Teacher Knowledge Distillation for Real-Time Object Detection using 4D Radar [5.0] 3Dオブジェクト検出は、安全で自律的なナビゲーションに不可欠であり、多様な気象条件にまたがって信頼性の高い性能を必要とする。
従来のレーダーは標高データがないため制限がある。
4Dレーダーは、距離、方位、ドップラー速度とともに高度を測定することでこれを克服し、自動運転車にとって貴重なものとなっている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:48:56 GMT)
Incentivizing Honesty among Competitors in Collaborative Learning and Optimization [5.0] 協調学習技術は、単一のエンティティのデータでトレーニングされたモデルよりも優れた機械学習モデルを可能にする可能性がある。
多くの場合、このような協調的なスキームの潜在的な参加者は、下流のタスクで競合する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:12:19 GMT)
Incentivizing Desirable Effort Profiles in Strategic Classification: The Role of Causality and Uncertainty [5.0] エージェントが分類結果を改善するために特徴を変更できるバイナリ因果関係における戦略的分類について検討する。
以上の結果から,ドライブエージェントは,主嗜好に反する可能性のある,期待された重要度と重要性の低い特徴を優先することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:22:22 GMT)
LEAD: Large Foundation Model for EEG-Based Alzheimer's Disease Detection [4.9] 脳波を用いたアルツハイマー病検出のための基礎モデルLEADを提案する。
私たちは11のEEGデータセットでモデルを事前トレーニングし、5つのADデータセットで微調整します。
サンプルレベルではF1スコアが9.86%増加し,被験者レベルでは9.31%向上したAD検出性能を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:11:15 GMT)
Image Intrinsic Scale Assessment: Bridging the Gap Between Quality and Resolution [4.9] 画像内在性尺度 (IIS) は,画像が最も知覚される品質を示す最大規模の尺度である。
人的判断に基づいてIISを主観的に測定・予測する画像固有スケールアセスメント(IISA)タスクを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:54:55 GMT)
Microcanonical Langevin Ensembles: Advancing the Sampling of Bayesian Neural Networks [4.9] 本稿では,最適化からの戦略を活用するアンサンブル手法と,より効率的で堅牢で予測可能なサンプリング性能を実現するためのサンプリング手法を提案する。
最先端のNo-U-Turnサンプルを用いた手法と比較して,本手法は大幅な高速化を実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:36:42 GMT)
A Uniform Concentration Inequality for Kernel-Based Two-Sample Statistics [4.8] これらの指標はカーネルベースの2サンプル統計学の一般的な枠組みの下で統一可能であることを示す。
本稿では、上記のカーネルベースの統計量に対して、新しい一様濃度不等式を確立する。
図示的応用として,これらの境界が距離共分散に基づく次元減少などの手順における誤差境界の構成をどのように促進するかを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:27:47 GMT)
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models [4.7] HRV(Head Relevance Vectors)の構築による拡散モデルに対する機械論的解釈可能性のアプローチを提案する。
所与の視覚概念に対するHRVは、所与の視覚概念に対する対応する頭部の重要性を表す各要素の総数に等しい長さを有する。
以上の結果から,HRVは画像生成における多文単語の誤解釈を減らし,画像編集における5つの難解な属性を修正し,多概念生成における破滅的無視を軽減できることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:57:09 GMT)
Thought2Text: Text Generation from EEG Signal using Large Language Models (LLMs) [4.7] 本稿では、この目的を達成するために、脳波データを微調整した命令調整大型言語モデル(LLM)を用いたThought2Textを提案する。
本手法は, 視覚的特徴抽出のための脳波エンコーダのトレーニング, 2) 画像およびテキストデータ上での微調整, マルチモーダル記述生成, (3) 脳波エンコーダのさらなる微調整により, 推論中に直接脳波からテキストを生成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:09:12 GMT)
CSR-Bench: Benchmarking LLM Agents in Deployment of Computer Science Research Repositories [4.6] 大規模言語モデル(LLM)は、コンピュータ科学研究の様々な分野において大きな進歩を見せている。
我々はコンピュータサイエンス研究プロジェクトのベンチマークであるCSR-Benchを紹介する。
また、複数のLLMエージェントを使用してGitHubコードリポジトリのデプロイを自動化する新しいフレームワーク、CSR-Agentsも導入しました。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:46:29 GMT)
Multi-Scale Transformer Architecture for Accurate Medical Image Classification [4.6] 本研究では,トランスフォーマーアーキテクチャを改良したAIによる皮膚病変分類アルゴリズムを提案する。
マルチスケールな特徴融合機構の統合と自己認識プロセスの洗練により、このモデルはグローバルな特徴とローカルな特徴の両方を効果的に抽出する。
ISIC 2017データセットのパフォーマンス評価は、改良されたTransformerが既存のAIモデルを上回ることを示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:22:25 GMT)
iLOCO: Distribution-Free Inference for Feature Interactions [4.6] 本稿では,高次特徴相互作用の重要性を測定するための新しいモデル非依存指標を提案する。
We developed distribution-free and assumption-light confidence intervals for our iLOCO metric。
我々は,iLOCO測定値と信頼区間を,合成データと実データの両方で検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:49:46 GMT)
MediSyn: A Generalist Text-Guided Latent Diffusion Model For Diverse Medical Image Synthesis [4.5] MediSynは6つの専門医と10種類の画像から合成画像を生成することができるテキスト誘導潜在拡散モデルである。
合成画像と実画像との直接比較により,本モデルが新規画像の合成を行い,患者のプライバシを重要視する可能性が確認された。
本研究は,一般画像生成モデルが医学におけるアルゴリズム研究と開発を加速する大きな可能性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:00:24 GMT)
A Locally Adaptive Algorithm for Multiple Testing with Network Structure [4.4] 本稿では,広い範囲の補助情報を推論プロセスに統合するフレキシブルなフレームワークを提案する。
LASLAは、ネットワーク構造データによって引き起こされる課題によって、特に動機付けられている。
また、空間的位置や複数の補助的なシーケンスなど、他の種類の側情報に対して非常に効果的であることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:42:09 GMT)
A Framework for Supervised and Unsupervised Segmentation and Classification of Materials Microstructure Images [4.4] このフレームワークは、位相/クラスに応じてマイクログラフを分類するための教師なしおよび教師なしの学習手法を統合する。
特定のプロセスや材料群に関連するマイクロ構造クラスのデータベースを徐々に構築するために使用することができる。
本発明の枠組みは、データベースを拡張して性能を高めるとともに、新しい均質又は多相材料を反復的に特徴付けることができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:05:35 GMT)
Convex Split Lemma without Inequalities [4.4] 我々は、最大相互情報を衝突相互情報に置き換えることにより、凸分割補題に改良を導入する。
この改良により、量子ソース符号化タスクのより厳密な達成性バウンダリが得られる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:49:48 GMT)
Position: Continual Learning Benefits from An Evolving Population over An Unified Model [4.3] 本研究では,新しいPCLフレームワークを提案する。
PCLは、ニューラルネットワークアーキテクチャの集団を維持し、進化させることで、継続的学習をアーキテクチャレベルまで拡張する。
PCLは、統一モデルを用いた最先端のリハーサルのないCLメソッドよりも優れている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:21:44 GMT)
Implicit Language Models are RNNs: Balancing Parallelization and Expressivity [4.3] 状態空間モデル(SSM)とトランスフォーマーが言語モデリングのランドスケープを支配している。
固定点に収束するまで変換を繰り返す暗黙のSSMを提案する。
提案手法は, 正規言語における状態追跡能力に優れ, トランスフォーマーやSSMよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:59:31 GMT)
Modeling of a continuous superradiant laser on the sub-mHz $^1$S$_0\,\rightarrow\,^3$P$_0$ transition in neutral strontium-88 [4.3] mHzライン幅のクロック遷移における超放射能放出が示されているが、真の連続動作は極めて困難であることが判明した。
本稿では,超低温ストロンチウム原子の高流動連続ビームとボウティキャビティを組み合わせることで,この問題を克服できるマシンの設計について議論する。
我々は、原子番号の変動によって制限された100mHz未満のレーザー光線幅を推定し、数百fWの出力パワーを得る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:23:56 GMT)
Generative Distribution Prediction: A Unified Approach to Multimodal Learning [4.3] 本稿では、構造的および非構造的モダリティ間の予測性能を高めるために、生成分布予測(GDP)を導入する。
GDPはモデルに依存しず、どんな高忠実な生成モデルとも互換性があり、ドメイン適応のためのトランスファーラーニングをサポートする。
我々は,4つの教師付き学習課題(タブラルデータ予測,質問応答,イメージキャプション,適応的量子回帰)におけるGDPの有効性を実証的に検証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:30:35 GMT)
FoodMem: Near Real-time and Precise Food Video Segmentation [4.3] 現在の制限は、不正確な栄養分析、非効率な作物管理、最適な食品加工に繋がる。
本研究では,高品質でほぼリアルタイムなセグメンテーションとビデオ中の食品の追跡のための堅牢なフレームワークの開発を紹介する。
私たちは、360度シーンのビデオシーケンスから食品を分割する新しいフレームワーク、FoodMemを紹介します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:26:06 GMT)
Rateless Joint Source-Channel Coding, and a Blueprint for 6G Semantic Communications System Design [4.2] 本稿では、レートレスJSCC(rateless J SCC)について紹介する。
また、レートレスJSCCに対応するために、レート適応型および安定した通信リンク操作を導入する。
本論文の第2部では,セマンティックコミュニケーションに関する実践的な懸念を掘り下げ,セマンティックネットワーキングシステム設計の青写真を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:49:16 GMT)
LapisGS: Layered Progressive 3D Gaussian Splatting for Adaptive Streaming [4.2] XRは3Dオンライン世界の効率的なストリーミングを必要とし、帯域幅に制約のある環境に適応するために現在の3DGS表現に挑戦する。
本稿では,適応ストリーミングとプログレッシブレンダリングをサポートする階層型3DGSであるLapisGSを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:59:52 GMT)
Multi-Order Hyperbolic Graph Convolution and Aggregated Attention for Social Event Detection [4.2] ソーシャルイベント検出(Social Event Detection、SED)は、特定の現実世界のイベントを特定することに焦点を当てたタスクであり、様々な領域にまたがる幅広いアプリケーションを持つ。
本稿では,SEDの性能向上を目的とした,MOHGCAA(Multi-Order Hyperbolic Graph Convolution with Aggregated Attention)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:08:51 GMT)
Decentralized Inference for Spatial Data Using Low-Rank Models [4.2] 本稿では,空間的低ランクモデルにおけるパラメータ推論に適した分散化フレームワークを提案する。
重要な障害は、観測中の空間的依存から生じ、ログのような状態が要約として表現されるのを防ぐ。
提案手法では,効率的なパラメータ最適化のために,マルチセンサと動的コンセンサス平均化を統合したブロック降下法を用いる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:56:04 GMT)
ALPINE: An adaptive language-agnostic pruning method for language models for code [4.1] コードの言語モデルは、様々なソフトウェアエンジニアリングとソースコード解析タスクで最先端のパフォーマンスを示している。
ALPINEは、これらのモデルの計算オーバーヘッドを大幅に削減するために設計された適応型プログラミング言語に依存しないプルーニング技術である。
CodeBERT、GraphCodeBERT、UnixCoderの2つのソフトウェアエンジニアリングタスクの実験では、ALPINEはFLOPの最大50%の削減、メモリフットプリントの58.1%の削減、平均スループットの28.1%の改善を実現している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:18:04 GMT)
RideKE: Leveraging Low-Resource, User-Generated Twitter Content for Sentiment and Emotion Detection in Kenyan Code-Switched Dataset [4.1] 我々は、ケニアのコード変更データを分析し、感情分類と感情分類のための4つの最先端トランスフォーマー(SOTA)モデルを評価する。
感情分析では、XLM-Rは最高精度(69.2%)、F1スコア(66.1%)、XLM-R半教師(67.2%、64.1%)を達成する。
感情分析では、DistilBERTは精度59.8%、F1は31%、mBERTは半監督的(精度59%、F1は26.5)である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:18:07 GMT)
Online Social Support Detection in Spanish Social Media Texts [4.1] 本研究では、スペイン語のソーシャルメディアテキストにおけるオンラインソーシャルサポートを検出するための革新的なアプローチを提案する。
このタスクのために特別に作成された最初の注釈付きデータセットを導入し、サポート的または非サポート的に分類される3,189のYouTubeコメントを含む。
次に、従来の機械学習モデル、ディープラーニングアーキテクチャ、GPT-4oを含むトランスフォーマーベースモデルを用いたソーシャルサポート分類の評価を行った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:04:23 GMT)
Joint Cutting for Hybrid Schrödinger-Feynman Simulation of Quantum Circuits [4.1] ジョイントカット」は標準的なHSFシミュレーションを最大$approx 4000times$で上回ります。
提案された改良はシミュレーション時間を短縮し、残りの課題を強調するのに役立つ。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:01:04 GMT)
Threat Me Right: A Human HARMS Threat Model for Technical Systems [4.1] 従来の脅威モデリング手法とその欠点について論じる。
我々は,非技術的・人的要因を識別する新たな脅威モデリングフレームワーク(HARMS)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:13:41 GMT)
Extract-QD Framework: A Generic Approach for Quality-Diversity in Noisy, Stochastic or Uncertain Domains [4.1] 第1にExtract-QD Framework(EQD Framework)、第2にExtract-ME(EME)という2つのコントリビューションを提示します。
EQD Frameworkはモジュールビュー内の既存のアプローチを統一し、モジュールの交換による新しいメソッドの開発を促進する。
新しい不確実なタスクに対して、私たちのコントリビューションは、信頼できる"第一の推測"メソッドとしてEMEを提供し、タスク固有のアプローチを開発するためのツールとしてEQD Frameworkを提供しています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:52:58 GMT)
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation [4.0] 人間のフィードバックからの強化学習は、重度で体系的なミスアライメントを引き起こす可能性があることを示す。
本稿では,Reinforcement Learning from Hindsight Simulation (RLHS)を紹介する。
我々はTruthfulQAベンチマークのポストホック評価を行い、単一タスクの微調整をしても、RLHFのミスアライメントとRLHSのアライメントは、実質的に異なる設定を継続することを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:17:01 GMT)
Evaluation of Multilingual Image Captioning: How far can we get with CLIP models? [3.9] この研究は、多言語設定におけるCLIPScore変種の評価に関連する、いくつかの戦略と広範な実験を提示する。
機械翻訳データを用いたテストでは、多言語CLIPScoreモデルは、異なる言語にわたる人間の判断と高い相関を維持することができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:00:00 GMT)
Guidance-base Diffusion Models for Improving Photoacoustic Image Quality [3.9] 光音響(英: Photoacoustic、PA)は、体内の微小血管構造を可視化するための非破壊的、非侵襲的な技術である。
単写画像の画質は低く、多数の単写画像の平均化によって画質を向上させる必要がある。
本研究では,拡散モデルを用いたPA画像の品質向上手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:09:31 GMT)
Accelerating Data Processing and Benchmarking of AI Models for Pathology [3.9] 本稿では,全スライダー画像処理,基礎モデルベンチマーク,公開タスクのキュレーションを行うための新しいソフトウェアツールを紹介する。
我々は、これらの資源が透明性を促進し、この分野の継続的な進歩を促進し、その強み、限界、そしてさらなる発展の可能性を評価するのがますます複雑になることを期待している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:23:55 GMT)
CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis [3.8] 大規模解析のための総合的高分解能同定と再同定を行う。
CHIRLAは、戦略的に配置されたカメラから7ヶ月にわたって記録され、時間特性と外観特性の両方において重要な変化を捉えている。
私たちは5時間以上のビデオを半自動でラベル付けして、アイデンティティアノテーション付きで100万のバウンディングボックスを生成しました。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:07:43 GMT)
Confidence Intervals for Evaluation of Data Mining [3.8] データマイニングに使用される一般的なパフォーマンス対策に関する統計的推測を考察する。
信頼区間に対する有限サンプルカバレッジ確率について検討した。
また, ばらつきを補正する「ぼやけた補正」を提案し, 有限サンプル性能を向上する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:22:02 GMT)
AstroLoc: Robust Space to Ground Image Localizer [3.8] 宇宙飛行士の写真を訓練に活用できる最初のパイプラインを提示する。
AstroLocは2つの損失を通して地球の表面の特徴の堅牢な表現を学習する。
AstroLocは以前のSOTAよりも平均35%のリコール改善を実現しています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:06:14 GMT)
Logical Maneuvers: Detecting and Mitigating Adversarial Hardware Faults in Space [3.8] 衛星は敵のグリッチや宇宙での高エネルギー放射線に弱いため、搭載コンピューターの故障を引き起こす可能性がある。
この研究は、部分的に損傷したプロセッサチップに対処するための検出および応答に基づく対策を導入する。
我々は、ターゲットプロセッサのチップにデジタル互換の遅延ベースのセンサーを組み込んで、入射を確実に検出する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:15:49 GMT)
Covariates-Adjusted Mixed-Membership Estimation: A Novel Network Model with Optimal Guarantees [3.7] 本稿では,ネットワークにおける推定の問題に対処し,ネットワークから潜在混合メンバーシップ構造を効率的に推定することを目的とする。
本稿では,情報とノード共メンバシップモデルとの類似性の両方を取り入れた新しいモデルを提案する。
提案手法は類似度行列とフロベニウスノルムのエントリー損失の両方に対して最適精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:56:00 GMT)
Err on the Side of Texture: Texture Bias on Real Data [3.6] テクスチャ・アソシエーション・バリュー(TAV)は、オブジェクトを分類する際に特定のテクスチャの存在に依存するモデルがいかに強く依存しているかを定量化する新しいメトリクスである。
以上の結果から, テクスチャバイアスは, その90%以上は, 学習したテクスチャと真のラベルとが一致していないテクスチャを含む自然対逆例の存在を説明できることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:53:37 GMT)
Illegal Waste Detection in Remote Sensing Images: A Case Study [3.6] 超高分解能リモートセンシング画像の高可用性化とコスト削減により, 現在では不適切な廃棄物管理がより容易になっている。
本稿では, 地域環境機関の専門家と共同で, 不法投棄候補地を検出するパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:04:54 GMT)
Benchmarking Vision-Language Models on Optical Character Recognition in Dynamic Video Environments [3.6] 本稿では、動的ビデオ環境における光学的文字認識(OCR)タスクの視覚言語モデル(VLM)を評価するためのオープンソースのベンチマークを提案する。
コードエディタ,ニュースブロードキャスト,YouTubeビデオ,広告など,さまざまな領域にまたがる1,477の注釈付きフレームを含むキュレートデータセットを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:20:19 GMT)
Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging [3.6] SPECT画像における少数ショット分類とローカライゼーションに適応したプロトタイプネットワークとPRNet。
ResNet-18バックボーンをトレーニング済みで、心室、心筋、肝組織に96.67%のトレーニングと93.33%の精度で分類されている。
PRNetはエンコーダ・デコーダアーキテクチャで2Dイメージングに適応し、接続をスキップすることで1.395のトレーニング損失を達成し、パッチを正確に再構築し、空間的関係を捉えた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:28:35 GMT)
Inferring High-Order Couplings with Neural Networks [3.6] 本稿では,制限ボルツマンマシンを一般化ポッツモデルにマッピングし,任意の順序の相互作用を抽出する手法を提案する。
合成データセットに対する検証では,2体と3体の相互作用を正確に再現できることが確認された。
タンパク質配列データに適用すると、このフレームワークはタンパク質接触マップを能動的に再構築し、最高の逆ポッツモデルに匹敵する性能を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:28:53 GMT)
Krutrim LLM: Multilingual Foundational Model for over a Billion People [3.5] クルトリム(Krutrim)は、インドの言語景観のために設計された2兆トークン多言語モデルである。
最大のIndicデータセットが組み込まれており、データの不足を軽減し、方言間でのバランスの取れたパフォーマンスを確保する。
16タスク中10タスクでLAMA-2のようなモデルと一致またはオーバーし、平均スコアは0.57対0.55である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:32:08 GMT)
A Family of Distributions of Random Subsets for Controlling Positive and Negative Dependence [3.4] 本稿では,行列点過程とボルツマンマシンの一部を含む離散カーネル点過程 (DKPP) を新たに導入する。
DKPPに対する正負依存の制御性と計算手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:52:07 GMT)
Unsupervised Meta-Learning via In-Context Learning [3.4] 本稿では,教師なしメタ学習における教師なしメタ学習の一般化能力を活用した新しい手法を提案する。
提案手法は,メタラーニングをシーケンスモデリング問題として再設計し,トランスフォーマーエンコーダがサポート画像からタスクコンテキストを学習できるようにする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:12:27 GMT)
Is Long Range Sequential Modeling Necessary For Colorectal Tumor Segmentation? [3.4] TransformersやMambaのような長距離ボリュームシーケンスモデリング機構は、3次元画像分割において高い精度を実現する能力に注目を集めている。
我々は,これらのグローバルトークンモデリング手法の有効性を,提案したMambaOutUNetに比較して評価した。
本研究は,ロバストな局所トークン相互作用が,関心領域が小さく,解剖学的に複雑である場合に,長距離モデリング技術より優れていることを示唆する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:24:01 GMT)
SylloBio-NLI: Evaluating Large Language Models on Biomedical Syllogistic Reasoning [3.4] SylloBio-NLIは自然言語推論のための多様なシロメトリクスを体系的にインスタンス化するフレームワークである
有効結論の特定と28のシロメトリックスキーム間の証拠の抽出について,Large Language Models (LLMs) の評価を行った。
バイオメディカル・シロジック推論はゼロショットLLMでは特に困難であり, 一般化したモダスポネンでは70%, 解離性シロジズムでは23%の精度が得られた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:11:58 GMT)
Federated Continual Learning: Concepts, Challenges, and Solutions [3.4] Federated Continual Learning (FCL)は、動的環境における協調的なモデルトレーニングのための堅牢なソリューションとして登場した。
この調査は、異質性、モデル安定性、通信オーバーヘッド、プライバシー保護といった重要な課題に焦点を当てている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:51:02 GMT)
Large Language Model for Qualitative Research -- A Systematic Mapping Study [3.3] 先進的な生成AIを駆使した大規模言語モデル(LLM)がトランスフォーメーションツールとして登場した。
本研究は, LLMを用いた定性的研究に関する文献を体系的にマッピングする。
LLMは様々な分野にまたがって利用されており、プロセスの自動化の可能性を示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:30:03 GMT)
Cognitive Paradigms for Evaluating VLMs on Visual Reasoning Task [3.2] 機械の視覚的推論を改善するには、ビジョン・ランゲージ・モデル(VLM)がどのように複雑な視覚的パターンを処理し、解釈するかを深く理解する必要がある。
本研究は,自然画像に基づくボナード問題に基づくVLM推論を体系的に解析する,認知に着想を得た新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:59:13 GMT)
Structure-preserving contrastive learning for spatial time series [3.1] 本研究では,空間時系列のコントラスト学習に2つの構造保存正規化器を組み込んだ。
対照的な学習と構造保存のバランスをとるために,トレードオフを適応的に重み付けし,トレーニングを安定化する動的メカニズムを提案する。
提案手法は任意のエンコーダに適用可能であり,空間的特徴や地理的特徴を持つ時系列に対して特に有用である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:01:05 GMT)
Early Operative Difficulty Assessment in Laparoscopic Cholecystectomy via Snapshot-Centric Video Analysis [3.1] 限定的なビデオ観察による早期LCOD評価の臨床的課題を提案する。
我々は,グローバルな時間分解能と局所的な時間分解能から特徴を分析し,LCODを評価する深層学習モデルであるSurgPrODを設計する。
ビデオレベルのLCODラベルを特徴とするColeScoreデータセットを導入し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:14:01 GMT)
AIMS.au: A Dataset for the Analysis of Modern Slavery Countermeasures in Corporate Statements [3.1] オーストラリア近代奴隷登録簿(Australian Modern Slavery Register)から得られた5,731の近代的奴隷制度のステートメントからなるデータセットを,文レベルで注釈付けした。
本稿では,オーストラリア近代奴隷法(Australian Modern Slavery Act)が定める強制報告要件に関連する文を検出するための機械学習手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:30:32 GMT)
Agentic AI and the Cyber Arms Race [3.0] エージェントAIは、アタッカーやディフェンダーがAIエージェントを利用して人間を強化し、共通のタスクを自動化することによって、サイバーセキュリティの世界を変えつつある。
本稿では,エージェントAIがより強力になるにつれて,サイバー戦争とグローバル政治がもたらす意味を考察し,現在最も豊富なアクターにのみ利用可能な能力の広範な普及を可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:06:29 GMT)
TEMSET-24K: Densely Annotated Dataset for Indexing Multipart Endoscopic Videos using Surgical Timeline Segmentation [3.0] 現在のビデオ分析は、手作業によるインデックス作成に依存している。
TEMSET-24Kは,経肛門的内視鏡的マイクロサマリー(TEMS)ビデオマイクロクリップからなるオープンソースデータセットである。
各クリップは、新しい階層的ラベリング分類を用いて、臨床専門家によって慎重に注釈付けされる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:37:34 GMT)
Quantum Supercritical Crossover with Dynamical Singularity [3.0] 我々は、この顕著な超臨界の概念を古典的から量子臨界点に近い量子系へと拡張する。
我々は、応答関数だけでなく、量子情報量によって決定される量子超臨界(QSC)クロスオーバー線の存在を明らかにする。
我々の研究は、量子多体系におけるQSCクロスオーバーの平衡内および外への探索の道を開いた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:08:42 GMT)
A Lightweight Attention-based Deep Network via Multi-Scale Feature Fusion for Multi-View Facial Expression Recognition [3.0] これらの問題に対処するために,マルチスケール機能融合(LANMSFF)を取り入れた軽量な注意ネットワークを導入する。
本稿では,マスアテンション(MassAtt)とポイントワイズ機能選択(PWFS)という2つの新しいコンポーネントを提案する。
提案手法は,パラメータ数やロバスト性の観点から,最先端手法に匹敵する結果を得た。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:57:42 GMT)
Reducing Alert Fatigue via AI-Assisted Negotiation: A Case for Dependabot [2.9] 本稿では,人工知能(AI)エージェントを依存ネゴシエータとして使用する立場について述べる。
本稿では,AIエージェントが依存交渉を容易にする特定のユースケースについて検討する。
私たちの目標は、メンテナが圧倒されたと感じなくなり、プルリクエストを歓迎するほど、アラートの疲労を軽減することです。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:58:21 GMT)
Boosting of Classification Models with Human-in-the-Loop Computational Visual Knowledge Discovery [2.9] 本稿では, クラス重複領域のすべてのケースに対して, 誤分類事例のみに焦点をあてることから, クラス重複領域への移動促進手法を提案する。
分割と分類のプロセスは、ケースを単純で複雑なものに分割し、計算分析とデータの視覚化を通じて個別に分類する。
純粋なクラス領域と重複クラス領域を見つけた後、純粋な領域における単純なケースを分類し、命題論理や一階論理などの決定規則のような解釈可能なサブモデルを生成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:09:19 GMT)
Chinese Remainder Theorem Approach to Montgomery-Type Algorithms [2.9] 本稿では,モンゴメリー型アルゴリズムをモデル化するための中国語のRemainder Theorem形式について検討する。
Qinのアイデンティティに基づくCRTの導出は、直ちにモンゴメリー還元アルゴリズムを与える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:07:32 GMT)
Logarithmic Regret of Exploration in Average Reward Markov Decision Processes [2.9] 後悔のための最先端のアルゴリズムは、確立されたフレームワークに従う。
我々は、Doubleling Trick(DT)ルールをVanishing Multiplicative(VM)ルールに置き換える上で、大きな利点があることを示します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:59:00 GMT)
Neumann eigenmaps for landmark embedding [2.9] NeuMapsは、ランドマークを使用した標準拡散マップの埋め込みを強化するための新しいアプローチである。
我々は,1) 部分グラフ上の反射ランダムウォークに関連する拡散距離を正確に復元する計算効率の良い埋め込みを提供し,(2) 離散ノイマン境界条件を通じて拡散マップフレームワークにNystr"om拡張を自然に組み込む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:15:11 GMT)
Volumetric medical image segmentation through dual self-distillation in U-shaped networks [2.9] 医用画像分割のためのU字型ネットワークにおける二重自己蒸留(DSD)フレームワークを提案する。
DSDは、基底構造セグメンテーションラベルからデコーダ層への知識を蒸留する。
また, 心臓下層構造, 脳腫瘍, 海馬セグメンテーションの質的改善がみられた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:49:45 GMT)
Conditional diffusion model with spatial attention and latent embedding for medical image segmentation [2.9] 医用画像分割のための空間的注意と潜伏埋め込み(cDAL)を備えた新しい条件拡散モデルを提案する。
cDALでは、拡散過程のすべての段階で、畳み込みニューラルネットワーク(CNN)ベースの判別器を使用して、生成されたラベルと実際のラベルを区別する。
現状のアルゴリズムよりも高いDiceスコアとmIoUで有意な質的,定量的な改善が見られた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:47:28 GMT)
Towards Identity-Aware Cross-Modal Retrieval: a Dataset and a Baseline [2.9] アイデンティティを意識したクロスモーダル検索は、自然言語クエリに基づいて、特定の文脈の人物の画像を取得することを目的としている。
我々は、広く使われているCOCOデータセットから派生した新しいデータセットCOCO Person FaceSwapを導入し、VGGFace2のディープフェイク生成顔に富んだ。
我々の貢献は、長い尾のアイデンティティと文脈のニュアンスを認識することができるより堅牢なクロスモーダル検索システムの基礎を築いた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:55:18 GMT)
Scaling Public Health Text Annotation: Zero-Shot Learning vs. Crowdsourcing for Improved Efficiency and Labeling Accuracy [2.8] 本研究では,大規模言語モデル(LLM)を用いたゼロショットラベリングが,睡眠障害,身体活動,鎮静行動に関連するTwitter投稿の従来のクラウドソースアノテーションと一致するか,あるいは超えるかを検討する。
以上の結果から, LLMは, 素早い分類作業において人的パフォーマンスと競合し, ラベル付け時間を大幅に短縮するが, その精度は, より曖昧なドメイン知識を必要とするタスクに対して低下することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:33:27 GMT)
Regularized Q-Learning with Linear Function Approximation [2.8] 線形汎関数近似を用いた正規化Q-ラーニングの2段階最適化について検討する。
特定の仮定の下では、提案アルゴリズムはマルコフ雑音の存在下で定常点に収束することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:59:05 GMT)
Choroidal image analysis for OCT image sequences with applications in systemic health [2.7] 脈絡膜は網膜の裏側にある非常に血管状の層である。
全身性疾患の病態を反映した脈絡膜血流に対する関心が高まっている。
この論文は、コロイド測定の標準化のための多くのオープンソースツールに貢献している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:14:09 GMT)
Broadband light extraction from near-surface NV centers using crystalline-silicon antennas [2.7] 結晶シリコン(Si)アンテナを用いて、ダイヤモンド中の浅い窒素空孔(NV)中心からブロードバンド単光子蛍光を自由空間に抽出する。
本設計では、ダイヤモンド表面の高インデックスSi共振器を比較的容易に構成し、全内部反射を克服し、ダイヤモンド-空気界面でのフレネル反射を克服して光子抽出を促進する。
シミュレーションでは、アンテナのない場合と比較して1つのNV中心から17倍の光子が収集され、実験では、NVとアンテナの間の空間的アライメントによって制限された9倍の強度が観察される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:22:41 GMT)
MambaPlace:Text-to-Point-Cloud Cross-Modal Place Recognition with Attention Mamba Mechanisms [2.7] 視覚言語位置認識(VLVPR)は、画像から自然言語記述を組み込むことで、ロボットのローカライズ性能を向上させる。
言語情報を利用することで、VLVPRはロボットの位置マッチングを指示し、視覚のみに依存する制約を克服する。
本稿では,MambaPlace と呼ばれる相互接続型位置認識フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:03:13 GMT)
CS-SHAP: Extending SHAP to Cyclic-Spectral Domain for Better Interpretability of Intelligent Fault Diagnosis [2.7] ニューラルネットワークを用いた知的故障診断(IFD)のための新しいポストホックな説明形式を開発した。
より明確で正確な説明を提供するために、Shapley加法的説明(SHAP)を巡回スペクトル(CS)領域に拡張する。
オープンソースコードと優れた解釈可能性により、CS-SHAPは広く採用され、IFDのポストホック解釈性ベンチマークとなる可能性がある。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:00:49 GMT)
Towards bandit-based prompt-tuning for in-the-wild foundation agents [2.7] 本稿では,タスク性能を向上させるための推論時間帯域幅に基づくプロンプトチューニングフレームワークを提案する。
実験の結果,バンディットに基づくプロンプトチューニングによる性能向上だけでなく,サンプルの複雑さ,拡張性,空間探索の迅速化などが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:20:10 GMT)
Enhancing Pre-Trained Decision Transformers with Prompt-Tuning Bandits [2.7] 本稿では,高速なトラジェクトリ・プロンプトを構築するために,スケーラブルなバンディットベースのプロンプトチューニング手法を提案する。
我々の手法は、トレーニング済みのTransformerのバックボーンを変更することなく、ダウンストリームタスクのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:48:31 GMT)
One-Shot Learning for k-SAT [2.6] 我々は、$k$-SATのワンショット学習が、満足度しきい値を大きく下回っていることを示す。
学習アルゴリズムの解析を単純化し、$d$のより強いバウンダリを$beta$で取得する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:56:08 GMT)
Learning Time-Varying Multi-Region Communications via Scalable Markovian Gaussian Processes [2.6] 我々はマルコフ的ガウス過程を用いて時間変化の時間的遅延で脳のコミュニケーションを学習する新しい枠組みを提案する。
この研究は、分散ニューラルネットワークの理解を深め、動的脳ネットワークを解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:33:03 GMT)
Exponentially Improved Dispersive Qubit Readout with Squeezed Light [2.6] IESとICSを併用することで、任意の測定時間でSNRを指数関数的に改善できることを示す。
短時間の測定では、SNRは2倍のスクイーズパラメータで指数関数的に改善される。
この研究は、量子エラー補正とフォールトトレラント量子計算にすぐに応用できる、分散量子ビットの読み出しのために、シャープされた光を探索するための有望な道を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:45:26 GMT)
Privacy of the last iterate in cyclically-sampled DP-SGD on nonconvex composite losses [2.5] 微分プライベート勾配(DP-SGD)は、微分プライベートモデルパラメータの列を生成するために反復する反復機械学習アルゴリズムのファミリーである。
最終段階の会計は困難であり、既存の作業はほとんどの実装で満たされていない強い仮定を必要とする。
損失関数の小さなステップサイズとリプシッツ滑らかさの現実的な仮定の下で、最後のイテレーションに対して新しいRenyi差分プライバシー(R)上限を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:01:43 GMT)
Data Augmentation and Regularization for Learning Group Equivariance [2.5] データ拡張によるトレーニングによる学習集団の同値性について考察する。
そこで本研究では,従来の論文から得られた結果を要約し,正規化に伴う拡張データのトレーニングにより,トレーニング対象モデルの等価性を達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:16:25 GMT)
Epistemic Uncertainty in Conformal Scores: A Unified Approach [2.4] 等角予測法は、分布のない保証を持つ予測帯域を生成するが、不確実性を明示的に捉えることはできない。
モデルに依存しないアプローチである $texttEPICSCORE$ を導入する。
$texttEPICSCORE$は、限られたデータを持つ領域の予測間隔を適応的に拡張し、データが豊富であるコンパクト間隔を維持します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:42:54 GMT)
PrismAvatar: Real-time animated 3D neural head avatars on edge devices [2.4] 資源制約のあるエッジデバイス上でリアルタイムのアニメーションとレンダリングを可能にするように設計された3DヘッドアバターモデルであるPrismAvatarを提案する。
モバイルデバイスでのメモリ使用率の低い60fpsで動作することに加えて、トレーニングされたモデルでは、デスクトップデバイス上での最先端の3Dアバターモデルに匹敵する品質が得られます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:50:12 GMT)
On the query complexity of sampling from non-log-concave distributions [2.4] 密度$p(x)propto e-f(x)$を持つ$d$次元分布からサンプリングする問題を、必ずしも良好な等尺条件を満たすとは限らない。
L,M$ を満たす $LMge dge 5$, $epsilonin left0,frac132right$ および $f(x)$ と $nabla f(x)$ の値にクエリアクセス可能なアルゴリズムに対して、$L$ が存在することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:54:16 GMT)
Do Users' Explainability Needs in Software Change with Mood? [2.4] 本研究では,ユーザの主観的感情と客観的人口統計学的側面が説明要求に与える影響について,頻度とタイプの説明による検討を行った。
我々は、説明の必要性は非常に主観的であり、部分的には客観的な要因にのみ依存していると結論づける。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:12:41 GMT)
How Does Users' App Knowledge Influence the Preferred Level of Detail and Format of Software Explanations? [2.4] 本研究では,ユーザが好む詳細度とソフトウェアにおける説明形式に影響を及ぼす要因について検討する。
結果は、ユーザーは短いテキスト形式で適度に詳細な説明を好んでいることを示している。
分析の結果,説明の嗜好はアプリ固有の知識に弱い影響を受けているが,人口統計学的要因や心理的要因によって形成されていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:18:04 GMT)
It's All in The [MASK]: Simple Instruction-Tuning Enables BERT-like Masked Language Models As Generative Classifiers [2.4] 生成分類にマスク付き言語モデリングヘッドを利用するエンコーダモデルであるModernBERT-Large-Instructを導入する。
当社のアプローチでは、重度の事前処理を必要としない、意図的な単純なトレーニングループと推論メカニズムを採用しています。
ModernBERT-Large-Instructは、分類と知識に基づくタスクの両方において強力なゼロショット性能を示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:08:19 GMT)
On the Limitations of Combining Sentiment Analysis Tools in a Cross-Platform Setting [2.4] 投票分類器における3つの感情分析ツールの組み合わせを信頼性と性能に応じて分析する。
結果として、この種のツールの組み合わせは、プラットフォーム内設定において良い選択であることが示された。
しかし、多数決は必ずしもクロスプラットフォームのドメインに適用する場合により良い結果をもたらすとは限らない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:51:51 GMT)
Guided and Variance-Corrected Fusion with One-shot Style Alignment for Large-Content Image Generation [2.3] 一般的なアプローチでは、一連の重複したイメージパッチを共同生成し、隣接するパッチをマージして大きなイメージを取得する。
既存の手法による結果は、しばしば目立った成果物、例えば、縫い目や一貫性のないオブジェクトやスタイルを示す。
重み付き平均を重なり合う領域に適用することにより、遠方の画像領域からの負の影響を緩和する誘導核融合(GF)を提案する。
また,遅延補正型核融合 (VCF) も提案し, 劣化後のデータの分散を補正し, より正確な拡散確率モデルの融合を生成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:55:08 GMT)
Robust Scatter Matrix Estimation for Elliptical Distributions in Polynomial Time [2.3] 我々はフロベニウスノルムで次元非依存誤差を実現する時間アルゴリズムを設計する。
散乱行列 $Sigma$, for every $t in mathbbN$, we design an estimator that, given $n = dO(t)$ sample, in time $nO(t)$ finds $hatSigma。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:31:57 GMT)
On the utility of the switching theorem for adiabatic state preparation [2.2] 断熱量子計算はハミルトンのゆっくりとした進化に依存する。
本稿では, 単純な低次元状態における断熱と過断熱の遷移について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:57:53 GMT)
Can We Trust AI Benchmarks? An Interdisciplinary Review of Current Issues in AI Evaluation [2.2] 本稿では,定量的なベンチマーク手法の欠点を論じる,約100の学術研究の学際的メタレビューを示す。
これは、より広範な社会技術的問題を伴うベンチマークの設計と適用において、多くのきめ細かい問題をもたらす。
レビューではまた、不正なインセンティブ、妥当性の問題の構築、未知の未知、ベンチマーク結果のゲームに関する問題など、現在のプラクティスにおける一連のシステム的欠陥についても取り上げている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:25:06 GMT)
Reducing Variance Caused by Communication in Decentralized Multi-agent Deep Reinforcement Learning [2.1] 政策グラデーションにおけるコミュニケーションによって引き起こされる分散について検討する。
トレーニング中の方針勾配のばらつきを低減するためのモジュラー手法を提案する。
その結果,提案手法により分散MADRL通信方式が拡張された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:53:13 GMT)
Hallucination Detection: A Probabilistic Framework Using Embeddings Distance Analysis [2.1] 本稿では,幻覚を推論するための数学的に健全な方法論を導入し,それを利用して幻覚を検出するツールを構築する。
我々の知る限りでは、幻覚的内容が正しい内容に関して構造的な違いを持つことを示すのが最初である。
これらの構造的差異を利用して幻覚応答を検出するツールを開発し、システムパラメータの特定の構成に対して66%の精度を達成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:44:13 GMT)
Biomechanical Reconstruction with Confidence Intervals from Multiview Markerless Motion Capture [2.1] 特定のカメラ構成を用いて分析した特定の個人から特定のキネマティック推定値に対する信頼区間を示す。
我々は、異なる生体力学モデルを用いて、軌道の最適化されたエンドツーエンドの暗黙の表現を用いて、これまでの研究を拡張した。
この後続確率は変動近似によって学習され、試行において各時点における個々の関節に対する信頼区間を推定する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:04:57 GMT)
The Case for Cleaner Biosignals: High-fidelity Neural Compressor Enables Transfer from Cleaner iEEG to Noisier EEG [2.1] 我々は高忠実度脳波とiEEGニューラル圧縮器であるBrainCodecを提案する。
iEEGでBrainCodecをトレーニングし、EEGに移行すると、EEGで直接トレーニングするよりも高い再現品質が得られることがわかりました。
BrainCodecは、最終的な圧縮比と再構築忠実度の両方において、最先端の圧縮モデルを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:05:06 GMT)
A Linearly Convergent Algorithm for Computing the Petz-Augustin Information [2.1] 次数$alphain (1/2,1)cup (1,infty)$のPetz-Augustin情報を計算するための反復アルゴリズムを提案する。
最適化エラーは$Oleft(vert 1-1/alpha vertTright)$で収束することが保証されている。
我々の知る限りでは、これはペッツ=アウグスティンの情報を非漸近収束保証で計算する最初のアルゴリズムである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:37:10 GMT)
Ignore the KL Penalty! Boosting Exploration on Critical Tokens to Enhance RL Fine-Tuning [2.0] 簡単な算術課題における小言語モデルの探索力学について検討する。
事前学習による影響の度合いの変化が「クリティカルトークン」の重要性を如何に示すかを示す。
我々は、臨界トークンの探索を優先し、RL微調整ステージの効率を高めるため、KLペナルティの簡単な修正を導入する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:56:25 GMT)
Inference-Time-Compute: More Faithful? [2.0] 思考の長い連鎖(CoT)を生成するために特別に訓練されたモデルは、最近、印象的な結果を得た。
ITCモデルのCoTは、従来の非ITCモデルよりも忠実なのでしょうか?
既存のCoTテストに基づいて,3つのITCモデル(Qwen-2.5,Gemini-2,DeepSeek-V3-Base)を評価した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:09:23 GMT)
Enhancing Ground-to-Aerial Image Matching for Visual Misinformation Detection Using Semantic Segmentation [1.9] 近年のジェネレーティブAI技術の進歩は、インターネット上で利用可能なデジタルメディアの信頼性に関する深刻な懸念を引き起こしている。
これらの懸念に対処するため、GPS座標などの外部情報のない非ジオタグ付き地上画像の位置情報化がますます重要になっている。
本研究は、GPSデータを使わずに、さまざまな視野(FoV)と対応する衛星画像とを関連付けるという課題に取り組む。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:31:12 GMT)
Onion Routing Key Distribution for QKDN [1.9] 量子コンピューティングの進歩は、古典暗号に重大な脅威をもたらす。
量子暗号とポスト量子暗号の2つの主要なアプローチが登場した。
量子鍵配信ネットワーク(QKDN)のためのセキュア鍵配信プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:47:42 GMT)
Fast Clustering of Categorical Big Data [1.8] 分類データのクラスタリングのために開発されたK-Modesアルゴリズムは、クラスタリング品質とクラスタリング効率の信頼性の低いパフォーマンスに悩まされている。
我々は、クラスタを見つけるための連続的な二分法プロセスであるBisecting K-Modes (BK-Modes) を調査し、クラスタが二分法プロセスからどのくらいの精度で出発するかを調べる。
実験結果から,大規模データセットのクラスタリング品質と効率の両面で,BK-Modsの優れた性能が示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:19:08 GMT)
DGNO: A Novel Physics-aware Neural Operator for Solving Forward and Inverse PDE Problems based on Deep, Generative Probabilistic Modeling [1.8] Deep Generative Neural Operator (DGNO)は、PDEベースの逆問題を解決するための物理学的なフレームワークである。
新しいイノベーションは、DGNOを特にPDEベースの問題に挑戦する上で効果的にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:28:46 GMT)
DebateBench: A Challenging Long Context Reasoning Benchmark For Large Language Models [1.8] DebateBenchを紹介します。このデータセットは、世界で最も権威ある競争上の議論のいくつかから、広範な写本とメタデータのコレクションで構成された、新しいデータセットです。
このデータセットは、様々なトピックに関する高名な討論会から英国議会で議論され、詳細なスピーチレベルスコアと公式の判断データから得られた家格ランキングが注釈付けされている。
我々は32の討論で256のスピーチをキュレートし、各討論は1時間以上、各入力は平均32,000のトークンである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:23:03 GMT)
Graph Neural Networks at a Fraction [1.8] 本稿では、四元数空間を利用してノード表現を計算するフレームワークである四元数メッセージパッシングニューラルネットワーク(QMPNN)を紹介する。
GNN や QMPNN のコンテキストにおける適用性を再定義する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:55:09 GMT)
MaterialFusion: High-Quality, Zero-Shot, and Controllable Material Transfer with Diffusion Models [1.8] 本稿では,高品質な物質移動のための新しいフレームワークであるMaterialFusionを紹介する。
ユーザーは、新しい材料特性とオブジェクトの本来の特徴の最適なバランスを保ちながら、材料応用の度合いを調整できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:04:33 GMT)
Improved Accreditation of Analogue Quantum Simulation and Establishing Quantum Advantage [1.7] 我々は[A. Jackson et al. Proc. Acad. U.S. U.S.A 121 (6. 2024)] のアナログ量子シミュレータの検証において、普遍ハミルトニアンの使用を排除して改善する。
もはや誤差を仮定することは、シミュレーション全体で同じマップで表されることはない。
新しいプロトコルは、既存のアナログシミュレータの現実をよりよく反映している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:44:27 GMT)
Unsupervised Particle Tracking with Neuromorphic Computing [1.7] 突発的ヒットによる顕著なノイズの存在下で、荷電粒子が残した信号を完全に教師なしの方法で識別することのできる、スパイクニューラルネットワークの方法を示す。
これらの結果は、ニューロモルフィックコンピューティングの粒子追跡への応用への道を開き、将来の高エネルギー物理学実験におけるリアルタイム、低消費電力粒子追跡の可能性に関するさらなる研究を動機付けている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:50:50 GMT)
Compilation Techniques for Spin Qubits in a Shuttling Bus Architecture [1.7] 量子アルゴリズムのベンチマークを用いて5つのマッピングアルゴリズムを提案し評価する。
Swap Return戦略は最も堅牢なソリューションとして登場し、実行時間とエラーの最小化のバランスが向上した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:57:52 GMT)
Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data [1.7] 本稿では,プライバシ制約下での自由テキストデータにおける所定のトピックのラベル付けを強化する枠組みを提案する。
我々は,摂食障害関連フォーラムから公開されているRedditデータと摂食障害患者の自由テキスト応答を用いて,アンサンブルアプローチを評価した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:57:27 GMT)
Cell Nuclei Detection and Classification in Whole Slide Images with Transformers [1.7] 我々は,CellNuc-DETRが最も高速なセグメンテーション法であるHoVer-NeXtの2倍高速であり,精度は極めて高いことを示した。
これは精度でCellViTを超え、WSIの推論速度の約10倍の効率である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:52:02 GMT)
Spin dependent fluorescence mediated by anti-symmetric exchange in triplet exciton pairs [1.7] シングルトフィッションとトリプルトリップレット消滅(TTA)は、光エレクトロニクスにとって重要なスピン依存現象である。
DMI(Dzyaloshinskii-Moriya interaction)はスピン多様体間の水平交差を誘導し、スピン集団とTTA速度に影響を及ぼすことを示す。
本研究は,三重項励起子の光学特性に対するDMIの顕著な影響を強調し,これらの系におけるスピンダイナミクスの理解を深めた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:07:20 GMT)
KARMA: Leveraging Multi-Agent LLMs for Automated Knowledge Graph Enrichment [1.7] KARMAは、構造化されていないテキストの構造解析を通じて知識の豊か化を自動化するために、多エージェントの大規模言語モデル(LLM)を利用する新しいフレームワークである。
このアプローチでは、エンティティ発見、関係抽出、スキーマアライメント、コンフリクト解決の9つの協調エージェントを使用します。
3つの異なるドメインから1200のPubMedの記事に対する実験は、知識グラフの富化におけるKARMAの有効性を実証している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:51:36 GMT)
Unsupervised deep learning for semantic segmentation of multispectral LiDAR forest point clouds [1.7] 本研究では,高密度レーザー走査点雲の葉木分離のための教師なし深層学習手法を提案する。
GrowSP-ForMS の平均精度は84.3%、mIoU平均交点は69.6%であった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:58:49 GMT)
Universal graph representation of stabilizer codes [1.6] 安定化器符号の表現を特定の構造を持つグラフとして導入する。
グラフ表現は、コード構築とアルゴリズムの両方について洞察を与える。
距離、重み、符号化回路深さなどの鍵符号特性はすべてグラフ次数によって制御される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:15:22 GMT)
Complete Upper Bound Hierarchies for Spectral Minimum in Noncommutative Polynomial Optimization [1.6] この研究は、有限個の非可換制約に対する非可換対象のスペクトル最小値を求めることに焦点をあてる。
Navascu'es-Pironio-Ac'in 階層はラッサールの正方形のモーメントサムの非可換類似である。
本稿では,スペクトル最小値に対する上界の相補的完全階層を導出する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:16:36 GMT)
DATCloud: A Model-Driven Framework for Multi-Layered Data-Intensive Architectures [1.6] DATCloudは、多層アーキテクチャのモデリング、検証、洗練を容易にするために設計されたモデル駆動フレームワークである。
Uffizi GalleryのVASARIシステムによる初期検証では、モデリング時間が40%削減され、手作業による手法に比べて柔軟性が32%向上した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:17:46 GMT)
Evaluation of Deep Audio Representations for Hearables [1.6] このデータセットは、30秒ごとに1,158曲のオーディオトラックを含み、空間的にプロプライエタリなモノローグと、日々の音響シーンの高品質な録音を混合して作成されている。
本ベンチマークでは,音声シーンの一般的な文脈,音声ソース,技術的音響特性を評価する8つのタスクを網羅する。
この優位性は、様々なオーディオコレクションで訓練されたモデルの利点を強調し、聴取可能なステアリングに必要な環境特性の符号化を含む幅広い聴覚タスクに適用可能であることを確認する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:51:11 GMT)
The reliable quantum master equation of the Unruh-DeWitt detector [1.5] 本論文では,Unruh-DeWitt検出器に適用した量子マルコフマスター方程式の妥当性範囲を推定する手法を提案する。
我々は、緩和されたファン・ホーブ極限(すなわち、深夜極限)を提案し、オープン量子力学の標準導出過程から生じる誤差順序の摂動的推定を与える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:51:23 GMT)
LinkQ: An LLM-Assisted Visual Interface for Knowledge Graph Question-Answering [1.5] LinkQは,大規模言語モデル(LLM)を活用して,自然言語質問応答による知識グラフ(KG)クエリ構築を容易にするシステムである。
LLMはユーザーの質問を解釈し、その質問を体系的に整形したクエリに変換する。
LinkQは、ユーザの質問が真実のKGデータからのみ回答されることを保証することで、LCMの幻覚的なアウトプットに対してガードする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:35:29 GMT)
Automatic ISA analysis for Secure Context Switching [1.5] Sailで書かれた機械可読ISA仕様を使用して、コンテキストスイッチ中に交換するために必要なISA状態を決定する。
Sailは4つのオープンソースシークレット・コンピューティング・システムにまたがる3つの異なるISA状態の分類を決定する。
不正処理されたISA状態を使って悪用できる5つの異なるセキュリティ脆弱性を明らかにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:07:55 GMT)
Cutting circuits with multiple two-qubit unitaries [1.4] 任意の数の2量子ユニタリを切断するための最適なサンプリングオーバーヘッドの式を導出する。
任意の2ビットのユニタリをひとつに分割する方が、個々のユニタリをカットするよりも安いことが分かりました。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:12:25 GMT)
Text2Net: Transforming Plain-text To A Dynamic Interactive Network Simulation Environment [1.4] Text2Netはテキストベースのネットワークシミュレーションエンジンで、ネットワークトポロジの平文記述を動的でインタラクティブなシミュレーションに変換する。
繰り返しタスクを自動化し、直感的な対話を可能にすることで、Text2Netは学生、教育者、専門家のアクセシビリティを向上させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:45:57 GMT)
Fine-tuning Multimodal Transformers on Edge: A Parallel Split Learning Approach [1.3] Split Learningは、指定されたカット層でモデルをパーティションして、計算集約的な操作をサーバにオフロードする。
本稿では,マルチモーダル変圧器を分散的に微調整する並列SL手法MPSLを提案する。
MPSLは軽量なクライアント側トークンライザと統一されたモダリティ非依存エンコーダを採用しており、タスク固有のニーズへの柔軟な適応を可能にしている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:10:41 GMT)
Event Vision Sensor: A Review [1.2] イベントベースの視覚センサは、低消費電力と回路構造の単純さを維持しながら、高時間分解能と低レイテンシを提供する。
バックイルミネート(BSI)技術、ウェハ積み重ね技術、産業用インターフェースは、イベントベースの視覚センサの性能向上に新たな機会をもたらした。
本稿では,ニューロモルフィック工学から最先端のイベントベース視覚センサ技術への進展について概説する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:50:57 GMT)
deCIFer: Crystal Structure Prediction from Powder Diffraction Data using Autoregressive Language Models [1.2] 粉末回折データから結晶構造予測(CSP)を行う自己回帰言語モデルを提案する。
提示されたモデルであるdeCIFerは、広く使われているCrystallographic Information File (CIF)フォーマットで結晶構造を生成する。
我々は、DeCIFerを2.3M近いユニークな結晶構造で訓練し、挑戦的な無機結晶系を特徴づけるために様々なPXRDパターンの集合を検証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:39:50 GMT)
An Automated Machine Learning Framework for Surgical Suturing Action Detection under Class Imbalance [1.2] 解釈可能なアウトプットによる外科的動作のリアルタイム検出は,自動的かつリアルタイムな指導フィードバックとスキル開発に不可欠である。
本稿では,経験者および研修医双方から収集した手術行動データに基づいて,自動機械学習手法を用いた迅速な展開手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:47:36 GMT)
Quantum circuit for exponentiation of Hamiltonians: an algorithmic description based on tensor products [1.2] ハミルトニアンの指数化(英: Exponentiation of Hamiltonian)とは、ハミルトニアン作用素に対する数学的演算のことであり、H はハミルトニアン、t は時間パラメータである。
アディアバティック法やQAOAのような量子アルゴリズムでは、指数化は系力学の効率的なシミュレーションを可能にする。
実装が容易なコンパクト回路を構築するための単純で効率的な手法を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:59:28 GMT)
Protecting Heralded Single Photons Generated from Double-$Λ$ Biphoton Sources with Doppler-Broadened Atomic Media [1.1] 熱原子を用いた双光子源は、狭い線幅、安定した周波数、調整可能な線幅の利点を提供する。
本研究では,熱原子SFWMの2-$Lambda$双光子源について検討した。
本稿では、未解明の物理機構のための新しい理論枠組みを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:54:58 GMT)
Quantum Computing Based Design of Multivariate Porous Materials [1.1] 構成,構造,バランスの制約を直接ハミルトニアンに組み込む量子コンピューティングのハミルトニアンモデルを提案する。
我々のフレームワークは、最適な構成を特定するために、リンカの広大な探索空間を指数関数的に効率的に探索する。
実験的に知られたMTV多孔質材料のシミュレーションは、その基底状態の再現に成功した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:40:22 GMT)
Learning-based estimation of cattle weight gain and its influencing factors [1.0] 牛の農家はいまだに一定間隔で牛の生体重の利得を測定する手動の方法に依存している。
機械学習(ML)やディープラーニング(DL)を用いた遠隔かつ自律的なモニタリングシステムは、より効率的で侵襲的な方法を提供することができる。
本研究は,CWG推定における現在のツール,手法,特徴,およびその強度と弱点について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:45:57 GMT)
Study on Downlink CSI compression: Are Neural Networks the Only Solution? [1.0] 大量多入力多出力(MIMO)システムにより、ダウンリンク(DL)における高いデータレートを実現する
高いDLデータレートは、空間多重化とビームフォーミングの効果的な実装によって達成される。
周波数分割二重化(FDD)システムでは、DLチャネル状態情報(CSI)をユーザ機器(UE)からgNBに送信する必要がある。
オーバヘッド問題に対処するため、自動エンコーダを用いたAI/ML手法が検討され、UEのエンコーダニューラルネットワークモデルがCSIを圧縮し、gNBのデコーダニューラルネットワークモデルがそれを再構成する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:00:14 GMT)
The 2021 Tokyo Olympics Multilingual News Article Dataset [1.0] 2021年オリンピックの1,350のサブイベントをカバーする1,918の異なる出版社から、合計で10,940のニュース記事が集められた。
これらの記事は、異なる言語族と異なるスクリプトの9つの言語で書かれています。
このデータセットの開発は、多言語ニュースクラスタリングアルゴリズムの性能を評価するためのリソースを提供することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:38:03 GMT)
DP-SGD with weight clipping [0.9] 従来の勾配クリッピングから生じるバイアスを緩和する新しい手法を提案する。
探索領域内における現在のモデルのリプシッツ値の公開上界と現在の位置を有効利用することにより、改良されたノイズレベル調整を実現することができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:05:34 GMT)
Enhancing Document Key Information Localization Through Data Augmentation [0.9] 本研究の目的は,デジタル文書と手書き文書の両方にオブジェクトをローカライズする手法を開発することである。
我々は手書き文書の出現を模倣してデジタル文書のトレーニングセットを強化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:46:39 GMT)
Compact Quantum Dot Models for Analog Microwave co-Simulation [0.9] 量子ドット系システムに着目したVerilog-Aコンパクトモデルを提案する。
我々のモデルは、標準電子回路シミュレータ内でコヒーレントな量子挙動を忠実に再現することができる。
我々の研究は、量子システムの設計における新しいパラダイムの道を開いた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:15:27 GMT)
TWICE: What Advantages Can Low-Resource Domain-Specific Embedding Model Bring? - A Case Study on Korea Financial Texts [0.9] FinMTEBのような既存のベンチマークは、主に高リソース言語向けに設計されている。
韓国金融ドメインの新しいベンチマークであるKorFinMTEBを紹介する。
実験結果から,FinMTEBの翻訳版ではモデルが頑健に動作する一方で,KorFinMTEB上での性能は微妙に重要な相違点を明らかにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:49:39 GMT)
Two-detector reconstruction of multiphoton states in linear optical networks [0.9] 本稿では,2つのバケット光子数分解(PNR)検出器のみを用いた線形光ネットワーク(LON)における多光子状態の部分的状態再構成法を提案する。
再構成されたハイゼンベルク・ワイル還元密度行列は、ハイゼンベルク・ワイル作用素に対する量子コヒーレンスと対称性を捉える。
この方法は、大規模LONにおける状態評価のための資源効率の高いソリューションを提供し、フォトニック量子技術の進歩を図っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:27:54 GMT)
What makes a good feedforward computational graph? [0.8] フィードフォワード計算グラフの望ましい性質について検討し、忠実度と混合時間という2つの重要な相補的尺度を探索する。
我々の研究は、様々なグラフに対するメトリクスの振る舞いに関する理論的分析と、これらのメトリクスをトレーニングされたニューラルネットワークモデルの性能に関連付けることの両方から裏付けられている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:26:40 GMT)
Differentially Private Empirical Cumulative Distribution Functions [0.8] 差分プライベートな経験分布関数を計算するための戦略を提案する。
完全な機能を明らかにすることは、プライバシー予算の観点からはより高価であるが、学習者により豊かで価値のある情報を提供することもできる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:41:49 GMT)
Combining Large Language Models with Static Analyzers for Code Review Generation [0.8] 知識ベースシステム(KBS)と学習ベースシステム(LBS)の強みを組み合わせたハイブリッドアプローチを提案する。
本手法は,言語モデルパイプラインの3つの異なる段階における知識を統合する。
以上の結果から,これらのハイブリッド戦略がレビューコメントの関連性,完全性,全体的な品質を高めることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:29:12 GMT)
Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling [0.8] 生体補綴制御の文脈における人間の行動モデルを提案する。
本稿では、時間とともに動きを予測・洗練するマルチタスク・継続的適応モデルを提案する。
我々は,トランスティバイアル・アンプを含む実世界の人間の歩行データセットの実験を通じて,我々のモデルを検証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:13:51 GMT)
CoverUp: Coverage-Guided LLM-Based Test Generation [0.8] CoverUpは、ハイカバレッジPython回帰テストを生成するための新しいアプローチである。
オープンソースのPythonプロジェクトから派生した挑戦的なコードのベンチマークで,CoverUp実装のプロトタイプを評価した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:15:52 GMT)
Autonomous Deep Agent [0.7] Deep Agentは、複雑なマルチフェーズタスクを管理するために設計された高度な自律AIシステムである。
システムの基盤は階層型タスクDAGフレームワーク上に構築されています。
Deep Agentは、自己管理型AIシステムにおいて、新しいパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:46:54 GMT)
Generalizable automated ischaemic stroke lesion segmentation with vision transformers [0.7] 拡散強調画像(DWI)は虚血性脳梗塞において最も高い発現率を示す。
したがって、現在のU-Netベースのモデルは、不適切な評価指標によってアクセント付けられる問題として、性能が劣っている。
本稿ではこれらの課題に対処する高性能なDWI病変分割ツールを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:00 GMT)
Fat-Tree QRAM: A High-Bandwidth Shared Quantum Random Access Memory for Parallel Queries [0.7] 本稿では,複数の量子クエリを同時にパイプライン化可能な新しいクエリアーキテクチャであるFat-Tree QRAMを紹介する。
Fat-Tree QRAMは$O(log (N))$Independent query in $O(log (N))$ time using $O(N)$ qubits.
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:47:16 GMT)
Generating Privacy-Preserving Personalized Advice with Zero-Knowledge Proofs and LLMs [0.7] ゼロ知識証明技術,特にzkVMを大規模言語モデル(LLM)と統合するフレームワークを提案する。
この統合により、機密情報を開示することなく、ユーザの特性を検証することにより、プライバシ保護データ共有が可能になる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:02:00 GMT)
Falsification of Unconfoundedness by Testing Independence of Causal Mechanisms [0.7] 本研究では,観測データを用いた設定において,未測定の共起の仮定をfalsifyするアルゴリズムを提案する。
提案手法は, 未測定の凹凸が観察因果機構に依存性を生じさせる可能性を秘めている。
本手法は,シミュレーションデータと実世界データの両方の共起を効率的に検出できることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:05:44 GMT)
Tailoring indistinguishability of photons using longitudinal spatial coherence [0.7] 調整不能な光子を生成する方法は、フォトニック量子技術を開発し、量子物理学の基礎的なテストを行うために重要である。
本研究では,両光子の有効縦方向コヒーレンス(LSC)の操作方法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:34:09 GMT)
Introspective Planning: Aligning Robots' Uncertainty with Inherent Task Ambiguity [0.7] 大規模言語モデル(LLM)は高度な推論能力を示し、ロボットが自然言語の指示を理解し、高レベルの行動を戦略的に計画することを可能にする。
LLMの幻覚は、ロボットがユーザー目標と不一致の計画を実行したり、クリティカルなシナリオでは安全でないりする可能性がある。
本稿では,LLMの不確かさとタスク固有のあいまいさを一致させる系統的手法であるイントロスペクティブプランニングを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:28:39 GMT)
Optimal Visual Search with Highly Heuristic Decision Rules [0.7] 視覚探索は人間や他の動物にとって基本的な自然課題である。
そこで,本研究では,ヒトが隠蔽(単固定)探索に使用する決定過程について検討した。
驚くべきことに、ヒトは胎児の感度が著しく低下しているにもかかわらず、最適よりもわずかに良く行動した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:19:02 GMT)
MoETuner: Optimized Mixture of Expert Serving with Balanced Expert Placement and Token Routing [0.6] Mixture-of-Experts (MoE)モデルアーキテクチャは、トランスフォーマーモデルを効率的にスケーリングするための有望なソリューションとして登場した。
MoEモデルはGPUデバイスに分散する必要があるため、重要なパフォーマンスボトルネックに直面している。
本稿では,トークンルーティングコストとデバイス間のトークン処理バランスを最小化する,最適専門家対GPU割り当てを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:34:36 GMT)
evclust: Python library for evidential clustering [0.6] 証拠クラスタリングは、不確実性を表すためにデンプスター・シェーファー理論(英語版)を用いる。
Pythonフレームワークのevclustは、効率的なエビデンスクラスタリングアルゴリズムと、クレダルパーティションを視覚化、評価、分析するためのツールを提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:53:26 GMT)
Scalable k-Means Clustering for Large k via Seeded Approximate Nearest-Neighbor Search [0.6] 非常に大きな$k$の場合、高次元で107sim109$ポイントの大規模データセットを高速にクラスタリングする方法を検討する。
この問題に対する現在の実用的なメソッドには、少なくとも$Omega(k2)$のランタイムがある。
提案手法は, 提案手法として"Seeded Approximate Nearest-Neighbor Search"を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:22:08 GMT)
Label-free segmentation from cardiac ultrasound using self-supervised learning [0.6] コンピュータビジョン,臨床領域知識,深層学習を用いた自己教師型(手動ラベルなし)セグメンテーションのためのパイプラインを構築した。
8,393枚の心エコー画像(4,476,266枚,平均61年,女性51%)を用いて,450枚の心エコー画像(93,000枚)をトレーニングし,生体計測値の算出を行った。
本研究は,超音波からのセグメンテーションのための手動ラベルフリー,臨床的に有効な,高度にスケーラブルな方法であることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:34:10 GMT)
XAMBA: Enabling Efficient State Space Models on Resource-Constrained Neural Processing Units [0.6] 状態空間モデル(SSM)は、シーケンシャルなデータタスクのためのトランスフォーマーの効率的な代替手段として登場した。
XAMBAは、商用オフザシェルフ(COTS)のSOTA(State-of-the-art)NPU上でSSMを有効にし、最適化する最初のフレームワークである。
XAMBAはCumBAとReduBAを使用して鍵ボトルネックを緩和し、シーケンシャルなCumSumとReduceeSumを行列ベースの計算に置き換える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:33:30 GMT)
GraNNite: Enabling High-Performance Execution of Graph Neural Networks on Resource-Constrained Neural Processing Units [0.6] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するために不可欠であり、ネットワーク分析、レコメンデーションシステム、音声分析の応用を可能にする。
GraNNiteは、COTS(Commercial-off-the-Shelf) SOTAアクセラレータ上でGNNの実行を最適化する最初のハードウェア対応フレームワークである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:03:02 GMT)
Deep Reinforcement Learning based Triggering Function for Early Classifiers of Time Series [0.5] 時系列の早期分類(ECTS)は、すぐに決定を下さなければならない多くの領域において重要な問題として認識されている。
様々なトリガー関数をベースとした多くの手法が提案されており、それぞれが入ってくる時系列に関連する様々な情報を考慮に入れている。
scAlertと呼ばれるこのシステムは、最先端の競合他社よりもはるかに優れています。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:52:55 GMT)
Enhanced Hybrid Deep Learning Approach for Botnet Attacks Detection in IoT Environment [0.5] BotnetはIoTデバイスやシステムに対する信頼の喪失を攻撃し、セキュリティ、信頼性、整合性への信頼を損なう。
ディープラーニング技術は、データの複雑なパターンを分析して学習する能力により、ボットネット攻撃の検出を大幅に強化した。
本研究では、ボットネット攻撃検出のためのディープ畳み込みニューラルネットワーク、Bi-Directional Long Short-Term Memory(Bi-LSTM)、Bi-Directional Gated Recurrent Unit(Bi-GRU)、Recurrent Neural Networks(RNN)の積み重ねを提案した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:59:27 GMT)
Locally Convex Global Loss Network for Decision-Focused Learning [0.5] 意思決定中心学習(DFL)は、予測モデルを統合してより良い意思決定を行うタスク指向の予測フレームワークである。
意思決定中心学習(DFL)は、予測モデルを統合してより良い意思決定を行うタスク指向の予測フレームワークである。
本稿では,一般DFLで実装可能なグローバルサロゲート損失モデルであるConvex Global Loss Network (LCGLN)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:48:40 GMT)
Indoor Light and Heat Estimation from a Single Panorama [0.5] 本稿では,室内外空間パノラマ画像から室内光と熱マップを直接推定する新しい手法を提案する。
本手法では,室内パノラマを用いて室内の3次元空間配置を推定する。
対応する屋外パノラマは、空間的に変化する光と材料特性を推測する環境マップとして機能する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:12:41 GMT)
Hamiltonian formulations of centroid-based clustering [0.5] 我々は、ハミルトニアン基底状態の探索としてクラスタリング問題を定式化する。
我々は、異なるクラスタリング目的に対応するために、様々なハミルトン的手法を提案する。
D-Wave量子アニールの数値シミュレーションと実装によるクラスタリング性能の評価を行った。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:08:22 GMT)
Automatic Evaluation of Healthcare LLMs Beyond Question-Answering [0.4] オープンとクローズなベンチマークとメトリクスの相関について検討する。
衛生チェックの更新として、オープン版とクローズド版の両方を備えた新しい医療ベンチマーク、CareQAをリリースする。
本稿では,その制約を緩和するため,オープンエンド評価のための新しい指標であるRelaxed Perplexityを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:52:39 GMT)
Unsupervised Learning for Feature Extraction and Temporal Alignment of 3D+t Point Clouds of Zebrafish Embryos [0.4] ゼブラフィッシュ胚の3D+t点雲から記述的特徴を抽出するための教師なしのアプローチ。
実験時間5.3時間において平均ミスマッチ3.83分で高いアライメント精度を実現する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:09:29 GMT)
Evaluating the performance of quantum process units at large width and depth [0.4] 簡単なベンチマーク手法として線形ランプ量子近似最適化(LR-QAOA)プロトコルを用いる。
ベンチマークは量子プロセス単位(QPU)を異なる幅(キュービット数)と2-キュービットゲート深さで評価する。
5つのベンダーから19の異なるQPU上で、1Dチェーン、ネイティブレイアウト、および完全に接続されたグラフという3つのグラフトポロジを使ってこの方法論をテストする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:50:50 GMT)
Surrogate models for diffusion on graphs via sparse polynomials [0.4] コミュニティ構造を持つグラフ上のパラメトリック拡散方程式に対するスパースベースサロゲートモデルを提供する。
我々の理論的な発見には、合成グラフと実世界のグラフの両方で行われた一連の数値実験が伴っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:57:33 GMT)
Direct Estimation of Pediatric Heart Rate Variability from BOLD-fMRI: A Machine Learning Approach Using Dynamic Connectivity [0.4] 多くの小児fMRI研究では、心臓の信号が欠如しているか、品質が悪いことがしばしばある。
周辺記録装置を必要とせずに、fMRIデータから直接心拍変動(HRV)波形を抽出するツールは、非常に有益である。
我々は,小児科領域のHRVを正確に再構築する機械学習フレームワークを開発した。
1次元畳み込みニューラルネットワーク (1D-CNN) と Gated Recurrent Units (GRU) を組み合わせたハイブリッドモデルは、628ROIからBOLD信号を解析し、過去と将来のデータを統合する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:24:18 GMT)
Effect of disorder and strain on the operation of planar Ge hole spin qubits [0.3] 歪んだ$textGe/textSi_1-xtextGe_x$ヘテロ構造におけるゲルマニウム量子ドットは実験において高速でコヒーレントな量子ビット制御を示す。
平面Ge孔スピン量子ビットの動作に対するランダム合金障害とゲート誘起ひずみの影響を数値的に解決する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:03 GMT)
Fine-Tuning Federated Learning-Based Intrusion Detection Systems for Transportation IoT [0.3] フェデレートラーニング(FL)は、分散エッジデバイス上でIDSモデルの分散トレーニングを可能にするための有望な方法として登場した。
本稿では,エッジデバイス上での軽量な微調整を実現しつつ,事前学習を中央サーバにオフロードするハイブリッドサーバエッジFLフレームワークを提案する。
このアプローチはメモリ使用量を最大42%削減し、トレーニング時間を最大75%削減し、競合IDSの精度を最大99.2%向上させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:12:05 GMT)
Electrical control of a Kondo spin screening cloud [0.3] コンド雲(Kondo cloud)は、単一局在スピンを遮蔽する伝導電子の量子多体物体である。
我々は、雲の一部を量子ボックスに閉じ込めることで、金堂雲の変形の工学を報告する。
我々は,箱内の量子干渉を調整し,コンドの絡みをモニタリングする方法を開発し,コンド雲の定量的制御を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:33:54 GMT)
Automatic Identification of Samples in Hip-Hop Music via Multi-Loss Training and an Artificial Dataset [0.3] 人工データセットでトレーニングされた畳み込みニューラルネットワークは、商用ヒップホップ音楽の実際のサンプルを識別できることを示す。
共同分類とメートル法学習損失を用いてモデルを最適化し,実世界のサンプリングの精度を13%向上することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:30:35 GMT)
Tokenization Standards for Linguistic Integrity: Turkish as a Benchmark [0.3] トークン化はNLPの基本的な前処理ステップであり、大きな言語モデルが構文、形態素合成、意味構造をキャプチャする能力に直接影響を及ぼす。
本稿では,形態的にリッチで低リソースな言語における課題に対処する,トークン化戦略を評価するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:47:49 GMT)
Leveraging GPT-4o Efficiency for Detecting Rework Anomaly in Business Processes [0.3] GPT-4o-2024-08-06は、イベントログを構造化フォーマットに変換し、再作業異常を識別できるツールである。
この分析は、リワーク異常を含むがループのない合成データセット上で行われた。
このモデルは、単発の精度が96.14%、正規分布が97.94%、単発の精度が97.94%、単発の精度が74.21%、指数分布が74.21%であった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:34:37 GMT)
SincPD: An Explainable Method based on Sinc Filters to Diagnose Parkinson's Disease Severity by Gait Cycle Analysis [0.3] パーキンソン病診断(PD)のための適応型シンクフィルタに基づく説明可能な深層学習型分類器を提案する。
PDが歩行周期に及ぼす影響を考慮し, 被験者の靴底に装着したウェアラブルセンサによって測定された垂直地中反応力(vGRF)の生データを用いた。
提案手法は適応帯域通過フィルタをモデル化し,健常者とともに歩行周期において重要な周波数帯域を抽出するSinc層からなる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:52:26 GMT)
Photon pair generation via down-conversion in III-V semiconductor microrings: modal dispersion and quasi-phase matching [0.3] III-V半導体マイクロリング共振器は、自発的なパラメトリックダウン変換により、光子対と圧縮された真空状態を生成することができる。
本稿では、弱いポンプパルスによって生成される光子対の双光子波関数の解析式を示し、より強いポンプ条件下で生じる圧縮状態の特徴付けを行う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:45:00 GMT)
RustMC: Extending the GenMC stateless model checker to Rust [0.3] RustMCは、並行するRustプログラムの検証を可能にするステートレスモデルチェッカーである。
本ツールでは,GenMCの拡張に対処する上で重要な課題について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:33:24 GMT)
Runtime Tunable Tsetlin Machines for Edge Inference on eFPGAs [0.2] eFPGAはエッジ機械学習(ML)アプリケーションのハードウェアアクセラレータを低消費電力で設計することができる。
限られたeFPGA論理とメモリは計算能力とモデルサイズを著しく制限した。
提案するeFPGAアクセラレータは、リソース使用量の最小化と、スループットに対するオンフィールドリカバリの柔軟性の実現に重点を置いている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:49:22 GMT)
Conversation Routines: A Prompt Engineering Framework for Task-Oriented Dialog Systems [0.2] 本研究では,Large Language Models (LLMs) を用いたタスク指向対話システムの開発のための,構造化されたプロンプトエンジニアリングフレームワークである Conversation Routines (CR) を紹介する。
提案したCRフレームワークは,自然言語仕様による会話エージェントシステム(CAS)の開発を可能にする。
このフレームワークの有効性を,Train Booking SystemとInteractive Ticket Copilotという2つの概念実証実装を通じて実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:35:22 GMT)
The Minimal Search Space for Conditional Causal Bandits [0.2] 因果知識は意思決定問題を支援するのに使える。
本稿では、最適条件介入を含むことが保証される最小限のノードのグラフィカルな特徴について述べる。
次に、この最小のノード群を特定するために、O(|V| + |E|)$の時間複雑性を持つ効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:45:18 GMT)
Automated Consistency Analysis of LLMs [0.2] 大きな言語モデル(LLM)を備えたジェネレーティブAIは、業界、アカデミック、政府で広く採用されている。
LLMの信頼性と信頼性に対する重要な課題の1つは、LLMがその応答においていかに一貫性があるかである。
本稿では,複数のLSM間での自己検証と検証という,一貫性を検証するための2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:03:24 GMT)
Visual Prompt Engineering for Vision Language Models in Radiology [0.2] Contrastive Language-Image Pretraining (CLIPP) は、大規模な事前訓練を通じてゼロショット分類を可能にするソリューションを提供する。
ビジュアルマーカーはAUROC2013$を0.185まで改善し、分類性能を向上させる効果を強調した。
我々はコードと前処理パイプラインを公開し、医用画像の局所分類に関する今後の研究の基準点を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:12:04 GMT)
The exponential distribution of the orders of demonstrative, numeral, adjective and noun [0.2] 好む24の順序の実際の分布について検討する。
指数関数分布や電力法分布に適合するかどうかについては意見の一致がない。
24の順序がすべてゼロでない指数モデルに対する強い支持が得られます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:45:00 GMT)
Facial Analysis Systems and Down Syndrome [0.1] ダウン症候群患者の顔における顔分析システムの限界について報告する。
その結果、ダウン症候群の人の顔に当てはまると、顔の分類を変えるバイアスに新たな光が当てられた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:43:55 GMT)
TivNe-SLAM: Dynamic Mapping and Tracking via Time-Varying Neural Radiance Fields [0.1] 本稿では,動的シーンの追跡と再構成を行うための時間変化表現を提案する。
トラッキングプロセスとマッピングプロセスという2つのプロセスは、当社のフレームワークで同時に管理されます。
従来のNeRFベースの動的SLAMシステムと比較すると,提案手法はトラッキングとマッピングの両面で競合する結果が得られることが検証された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:14:12 GMT)
Do Attention Heads Compete or Cooperate during Counting? [0.1] 初等課題における小型変圧器の深部機械的解釈可能性解析について述べる。
我々は、注目ヘッドが擬似アンサンブルとして振る舞うのか、すべて同じサブタスクを解くのか、それとも異なるサブタスクを実行するのかを問う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:21:39 GMT)
Many-body density of states of bosonic and fermionic gases: a combinatorial approach [0.1] 等間隔単一粒子スペクトルを持つフェルミオンおよびボゾンガスの状態の多体密度の正確な式を得る。
我々は、フェルミオンとボソニックの気体が同じ多体状態の密度を持ち、基底状態エネルギーに対応するシフトを持つという顕著な性質を示す写像を同定する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:19:29 GMT)
Fully optimised variational simulation of a dynamical quantum phase transition on a trapped-ion quantum computer [0.0] 我々は量子化されたH1-1トラップイオン量子プロセッサ上で、変換不変な量子状態を時間発展させる。
この物理は多体波動関数の位相の微妙なキャンセルを必要とし、現在の量子デバイスにとって難しい課題である。
本結果は,変分量子時間進化の実現可能性を示し,逆場イジングモデルの進化の隠れた単純さを明らかにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:01:28 GMT)
What Kind of Relationality does Quantum Mechanics Exhibit? [0.0] 私は、量子力学のリレーショナルな側面は本質的にも動的でもあると論じる。
私は、このアプローチを正統的なRQMと比較し、多くの利点があると主張する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:37:25 GMT)
Vibrational parametric arrays with trapped ions: non-Hermitian topological phases and quantum sensing [0.0] トラップ電位の局所的パラメトリック変調と連続レーザー冷却による捕捉イオンの線形配列を考察する。
我々は、捕捉されたイオンアレイが振動励起の方向増幅器として振る舞うトポロジカル増幅器の出現を予測する。
アレイの一方の端に閉じ込められたイオンが超弱力のセンサとして作用し、その振動信号が検出器として働く最後の閉じ込められたイオンに向かって増幅されるスキームを考える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:01:14 GMT)
ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models [0.0] 地球系モデル (ESM) は、大気、海、陸、氷、生物圏の相互作用を統合し、地域気候と地球気候の状態を推定する。
本研究では,視覚変換器の正弦波表現ネットワーク(ViSIR)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:09:45 GMT)
Utilizing Novelty-based Evolution Strategies to Train Transformers in Reinforcement Learning [0.0] NS-ESおよびNSR-ESアルゴリズムであるOpenAI-ESの新規性に基づく変種を評価する。
また、事前訓練されたモデルによるトレーニングをシードすることで、より大規模なモデルの新規性に基づくトレーニングを加速できるかどうかも検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:44:10 GMT)
Unsupervised Learning in Echo State Networks for Input Reconstruction [0.0] 我々は、教師なし学習(UL)を用いて入力再構成(IR)を行うために、ESN読み出し層の学習アルゴリズムを再構成する。
以上の結果から,理論上は健全で普遍的に適用可能なIR定式化が確立され,ERSにおける関連する課題が明らかになった。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:09:31 GMT)
Universal Neural Optimal Transport [0.0] UNOT(Universal Neural Optimal Transport)は、OT距離と計画を正確に予測できる新しいフレームワークである。
我々のネットワークは、幅広いデータセットにわたる最適な輸送距離と計画を正確に予測するだけでなく、ワッサーシュタイン空間の幾何学を正確に捉えることも示している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:08:02 GMT)
Unconstrained Body Recognition at Altitude and Range: Comparing Four Approaches [0.0] 我々は、時間とともに安定している永続的な身体形状の特徴を学習することに集中する。
視覚変換器(ViT)とSwin-ViTモデルに基づく身体識別モデルを提案する。
すべてのモデルは、9つのデータベースにまたがる約5Kアイデンティティの190万以上の画像の大規模で多様なデータセットでトレーニングされている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:49:06 GMT)
Time-dependent radiative heat flux after the beginning of thermal radiation [0.0] 我々は、ある物体から別の物体への時間依存放射熱フラックスの理論的な定式化を開発する。
2つの単離ナノ粒子間の熱流束の時間依存性が示される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:14:27 GMT)
Time Evolution of the Symmetry Resolved Entanglement Entropy after a Mass Quench [0.0] 対称性を分解したエントロピーは全エントロピーと同じ速度で線形に成長する。
この結果は、量子論におけるツイスト場を用いた対称性分解エントロピーの平衡外力学の最初の明示的な計算を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:11:19 GMT)
The quantum relative entropy of the Schwarzschild black-hole and the area law [0.0] 任意のシュワルツシルト半径に対するシュヴァルツシルトブラックホールの量子相対エントロピーの領域法則を導出する。
量子相対エントロピーはアラキエントロピーを一般化し、ゼロ形式、一形式、二形式の間の計量を量子作用素として扱う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:35:51 GMT)
The impact of allocation strategies in subset learning on the expressive power of neural networks [0.0] 一定数の学習可能な重みの割り当てがニューラルネットワークの容量に与える影響について検討する。
線形リカレントニューラルネットワークと線形多層フィードフォワードネットワークにおいて、アロケーションが最大または最小表現力を持つ条件を確立する。
その結果,学習可能なウェイトをネットワーク全体に戦略的に分散する上で重要な役割が強調され,より広範なアロケーションがネットワークの表現力を高めることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:43:43 GMT)
The digital labour of artificial intelligence in Latin America: a comparison of Argentina, Brazil, and Venezuela [0.0] この記事では、グローバル化されたAI生産の影の中で、トレーニング、テスト、チェック、その他のモデルをサポートするためのデータ準備を行う、非現実的で低賃金の「データワーカー」に関するベールを取り上げます。
データ処理は、経済的困難、不平等、非公式性に絡み合っていることを示す。
我々は、すべての利害関係者に対して肯定的な結果を達成することを目的として、AIの規制と仕事の未来に対する洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:10:30 GMT)
Symmetries and Wigner representations of operational theories [0.0] 我々は、ウィグナー表現を構成するのに使用される観測値の結果を変換する対称性を導入する。
これらの対称性が適切に定義されたときと、それらがウィグナー表現を一意に指定するときのいくつかの結果を得る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:59:02 GMT)
Symmetric Clifford twirling for cost-optimal quantum error mitigation in early FTQC regime [0.0] 量子ゲートに影響を及ぼすノイズのツイリングは、エラーの理解と制御に不可欠である。
本研究では,大域ホワイトノイズに近い指数関数的にパウリノイズをスクランブルすることができることを示す。
これらの結果から,サンプリングオーバーヘッドが最小限に抑えられた非クリフォード演算における誤差を軽減することができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 07:19:21 GMT)
Structural Reformation of Large Language Model Neuron Encapsulation for Divergent Information Aggregation [0.0] 構造化ニューロンカプセル化(Structured Neuron encapsulation)は、情報のより効果的な集約と特殊化を可能にするモジュラーフレームワークを導入する。
このフレームワークによって修正されたモデルでは、パープレキシティスコアの改善、語彙の変動性の向上、論理的推論における一貫性の向上が示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:37:39 GMT)
String Breaking in the Heavy Quark Limit with Scalable Circuits [0.0] 非アベリア格子ゲージ理論のヒルベルト空間の重クォーク極限における物質との切り離しを開発する。
1つの$qoverlineq$ペアを持つ状態は量子ハードウェア上で準備され、IBMのHeron量子コンピュータibm_torino上の104$キュービットを使用して$qoverlineq$ペアの非弾性生産が観測される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:00:56 GMT)
Some things to know about achieving artificial general intelligence [0.0] 現時点および予見可能なGenAIモデルは、人為的負債に悩まされているため、人工知能を達成できない。
十分に構造化された問題やアーキテクチャ、トレーニングデータを提供するには、人間の入力に大きく依存する。
彼らは全ての問題を言語パターン学習の問題とみなし、人工知能を実現するために必要な自律性は持っていない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:10:26 GMT)
Simulating Non-Markovian Quantum Dynamics on NISQ Computers Using the Hierarchical Equations of Motion [0.0] オープン量子系の非マルコフ力学をシミュレートする量子アルゴリズムを提案する。
提案手法により,雑音型中間スケール量子コンピュータ上での任意の量子マスター方程式の実装が可能となる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:13:21 GMT)
Semi-classical limit of the massive Klein-Gordon-Maxwell system toward the relativistic Euler-Maxwell system via an adapted modulated energy method [0.0] 我々は、巨大なクラインゴードン・マクスウェル方程式に関連する運動量、密度、および電磁場が、相対論的オイラー・マクスウェル方程式に付随するそれぞれの等価点に対して半古典的極限に収束することを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:18:01 GMT)
Scalable and Ethical Insider Threat Detection through Data Synthesis and Analysis by LLMs [0.0] 本研究では,大規模言語モデル(LLM)によるインサイダー脅威感情の分析と検出の可能性について検討する。
LLMによる感情スコアの比較分析は、専門家の人間のスコアと比較する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:27:06 GMT)
SFFT-Based Homogenization: Using Tensor Trains to Enhance FFT-Based Homogenization [0.0] 均質化(英:homogenization)は、マイクロスケールの不均一性を持つ材料のマクロ特性を推定する手法である。
FFTをベースとした工業用途の均質化は、依然として過度に時間がかかる。
量子インスパイアされたSFFTに基づくホモジェナイゼーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:24:58 GMT)
Robust Quantum Control for Bragg Pulse Design in Atom Interferometry [0.0] 我々は、低温原子系を様々な運動量状態に転送できる最小エネルギーパルスを合成するために、ロバストな最適制御アルゴリズムを定式化する。
超低温原子干渉計における原子ビーム動作の最適化にアルゴリズムを適用した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:58:34 GMT)
Resurrecting saturated LLM benchmarks with adversarial encoding [0.0] WMDP-bio(英語版)、GPQA(英語版)、MMLU(英語版)の3つのベンチマークで、ペアリング質問と回答オプションの追加について検討する。
より有能なモデルでは、これらのモデルがパフォーマンスを予測的に低下させ、本質的にベンチマークのパフォーマンスの天井を高くし、再び飽和させません。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:07:09 GMT)
Recommendations to OSCE/ODIHR (on how to give better recommendations for Internet voting) [0.0] エストニアのインターネット投票におけるOSCE/ODIHRの推奨事項について調べる。
我々は、まったく達成できないレコメンデーションの例を示すだけでなく、レコメンデーションの履行が非自明なトレードオフを必要とする例も提示する。
我々はOSCE/ODIHRが、この特性によって正確に何を意味するのかを定義し、また、エンドツーエンドの検証が達成されたかどうかを判断するための明確な基準を与えることを期待している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:14:33 GMT)
RSAttAE: An Information-Aware Attention-based Autoencoder Recommender System [0.0] 顧客満足度を高めるために,未知のユーザ移動率を予測する新しい手法を提案する。
提案手法では,有意義な表現を生成するアテンションベースのオートエンコーダと,評価予測のためのXGBoost法を導入している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:33:22 GMT)
RAILS: Risk-Aware Iterated Local Search for Joint SLA Decomposition and Service Provider Management in Multi-Domain Networks [0.0] 5G技術はモバイルネットワークをマルチサービス環境に変え、多様なサービスレベル合意(SLA)を満たすために効率的なネットワークスライシングを必要とした。
本稿では,リスク・アウェア・イテレーテッド・ローカル・サーチ(RAILS, Risk-Aware Iterated Local Search)を紹介する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:00:32 GMT)
Qudit encoding in Rydberg blockaded arrays of atoms [0.0] 本稿では,Rydbergブロックされた3レベル原子列の装束状態に符号化されたqudit上での任意の状態合成とユニタリ演算を実現するプロトコルを提案する。
我々の研究は、原子量子ビット配列の代替として、Rydbgergブロックされた原子配列を用いて量子情報を処理する方法を舗装している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:47:08 GMT)
Quantum entanglement dynamics in a three-qubit system interacting with a spin chain [0.0] 我々は、初期状態としてGHZ、W、W_zeta量子状態に焦点を当てる。
種々のパラメータに基づいて,これらの状態の絡み合いのダイナミクスを探索し,解析する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:03:21 GMT)
Quantum circuits with free fermions in disguise [0.0] スピン鎖モデルの複数の族は、ジョルダン・ウィグナー変換によって解けなくても自由フェルミオンスペクトルを持つ。
各モデルの局所ハミルトニアン項から構築した局所ユニタリゲートを用いて回路を構築する。
ある場合には自由フェルミオン性を証明するが、他の測地では数値的に確認する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:57:56 GMT)
Quantum Turbulence Across Dimensions: Crossover from two- to three-dimension [0.0] 本研究では,量子乱流(QT)のポテンシャル場における動的遷移について検討する。
この遷移はケルビン波の励起と密接に関連している。
遷移領域では、崩壊速度と渦クラスター相関関数の連続的な変動を観測する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:47:00 GMT)
Probing spectral features of quantum many-body systems with quantum simulators [0.0] 我々は,量子シミュレータを用いた量子多体系の励起スペクトルを探索する枠組みを確立する。
遷移エネルギー推定の時間的複雑さは、シミュレーション精度に対数的依存を持つことを示す。
スピン格子モデルの励起スペクトルをIBM量子デバイスで実験的に探索する方法を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:23:43 GMT)
Pointwise bounds on confined states in non-relativistic QED [0.0] 固有状態が非相対論的量子電磁力学におけるサブソリューション推定を満たすことを示す。
また、電子配置における点方向の指数減衰の証明を与える。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:56:30 GMT)
Perturbative study of wave function evolution from source to detection of a single particle and the measurement [0.0] 波動関数の進化を解明するために,2つのスリットの間に余分な開口スリットを考える。
すべてのスリットが長くて薄いとき、1Dシュレーディンガー方程式は最後の検出まで波動関数の進化を与える。
この関数は振幅と位相情報を持つ実数値であり,波動関数と密接に関連していることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:26:28 GMT)
Operator Growth in Disordered Spin Chains: Indications for the Absence of Many-Body Localization [0.0] 我々は、ハミルトニアン$H$を持つ一次元系における局所作用素$A$の拡散を考える。
作用素ノルムのほぼ因子的な成長は、指数的局所化が$A$と矛盾することを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 00:04:23 GMT)
Operation of a high-frequency, phase-slip qubit [0.0] 窒化チタンを用いた相すべり接合に基づく超伝導量子ビットの動作を実証した。
我々は超伝導量子ビットの読み出しとコヒーレント制御を行い、量子ビット寿命を測定する。
その結果, 量子情報処理の超伝導ツールとして位相スリップ接合が加えられた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 21:22:24 GMT)
On the Unknowable Limits to Prediction [0.0] 多くのドメインは、測定、構築の妥当性、モデリングの反復的な拡張の恩恵を受ける。
我々のアプローチは、データの改善によって‘予測不可能な’結果がより魅力的になることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:34:34 GMT)
On the Expressiveness of Rational ReLU Neural Networks With Bounded Depth [0.0] 重みが十進分数であるReLUネットワークにおいて、$F_n$は少なくとも$lceillog_3 (n+1)rceil隠蔽層を持つネットワークでしか表現できないことを示す。
実用的に関係のあるReLUネットワークの深さの非定常下界を初めて提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:26:35 GMT)
Observation of Magnon-Polarons in the Fermi-Hubbard Model [0.0] 鍵となる理論的問題は、磁気絶縁体をドーピングするときに、集合スピン励起であるマグノン準粒子の再正規化を理解することである。
寒冷原子Fermi-Hubbard系のドープ孔を有するマグノンのドレッシングから生じる新しい準粒子の観察を報告する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:37:43 GMT)
Nonstabilizerness in U(1) lattice gauge theory [0.0] 非安定化器性(Nonstabilizerness)は、量子コンピューティングの枠組みにおける状態複雑性を定量化する基本的な量子資源である。
非安定化器性は常に体積に広まっており、臨界点の存在と直接関係がないことを示す。
この結果から, 限界連続点に近い格子ゲージ理論の誤差補正シミュレーションは, 有限相関長の場合と計算コストが類似していることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:43:10 GMT)
Next-Gen Software Engineering. Big Models for AI-Augmented Model-Driven Software Engineering [0.0] 本稿は、AIに強化されたソフトウェア工学の現状の概要を提供し、対応する分類学であるAI4SEを開発する。
SEにおけるAI支援ビッグデータのビジョンは、ソフトウェア開発の文脈において両方のアプローチに固有の利点を活かすことを目的としている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:35:49 GMT)
Network Intrusion Datasets: A Survey, Limitations, and Recommendations [0.0] データ駆動型サイバー脅威検出は、現代のサイバーセキュリティにおいて重要な防御技術となっている。
その重要性にもかかわらず、データ不足はNIDS研究の大きな障害として長年認識されてきた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:14:37 GMT)
Multispectral Indices for Wildfire Management [0.0] 本稿では,山火事管理におけるマルチスペクトル空中・衛星画像の適用について検討する。
可燃性植生や水の特徴など、山火事の行動に影響を及ぼす重要な要因の同定と分析を強調している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:05:55 GMT)
Multi-Scale Feature Fusion with Image-Driven Spatial Integration for Left Atrium Segmentation from Cardiac MRI Images [0.0] 本稿では,DINOv2をエンコーダとしてUNetスタイルのデコーダと統合するフレームワークを提案する。
LAScarQS 2022データセットに対する我々のアプローチを検証するとともに、92.3%のDiceと84.1%のIoUスコアで巨大なアーキテクチャの性能向上を実証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:12:46 GMT)
Measuring entanglement along collective operators [0.0] 本稿では,集団変数の挙動を解析し,多党間の絡み合いを研究するための枠組みを提案する。
我々はその性質と混合状態にどのように拡張できるかを徹底的に分析する。
これは、エンタングルメント量子化器の様々な性質が直接ピクトロリアル解釈を持つスペクトル空間を導入することで実現される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:30:17 GMT)
Many-Body Localization in the Age of Classical Computing [0.0] 本総説では,MBL相の解明を目的とした最近の数値調査について述べる。
ドリフトは、多体系の力学で観察される熱化や非消滅輸送の傾向に関連している。
混乱した多体システムにおける熱化とその故障に関する疑問は、さらなる探査のために開放された領域である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:34:49 GMT)
Majorana quasiparticles in atomic spin chains on superconductors [0.0] マヨラナ準粒子は、トポロジカル量子計算におけるエキサイティングな応用を提供する。
マヨラナ準粒子は、トポロジカル超伝導体の境界におけるゼロエネルギーモードとして実現可能であるという理論的予測によって動機づけられた。
原子的にクリーンな超伝導基板上での無秩序な原子スピン鎖のボトムアップ原子生成は、最近、トポロジカルサブギャップ・芝バンドの出現について深い洞察を与えている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:30:33 GMT)
Macroscopic Thermalization for Highly Degenerate Hamiltonians After Slight Perturbation [0.0] 純粋な状態 $psi$ の孤立したマクロ量子系について、$psi$ がヒルベルト空間の適当な部分空間 $mathcalH_eq$ の内か近くにある場合、それはマクロ熱平衡であると言う。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:00:00 GMT)
Machine Learning for Ground State Preparation via Measurement and Feedback [0.0] そこで本研究では,中間回路計測とフィードバックを利用したニューラルネットワークによる地中準備手法を提案する。
本研究では,アシラ量子ビットのサブセットが測定やフィードバックに使用されることにより,性能が体系的に向上することが実証された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:37:34 GMT)
Machine Learning for Everyone: Simplifying Healthcare Analytics with BigQuery ML [0.0] 機械学習(ML)は、予測分析、パーソナライズされた治療、そして患者の成果を改善することで、医療を変革している。
従来のMLは専門的なスキル、インフラ、リソースを必要とし、多くの医療専門家のアクセシビリティを制限する。
本稿では、Google CloudのBigQuery MLが、sqlを使用してMLモデルの開発とデプロイを簡単にする方法について説明する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:38:53 GMT)
LemmaHead: RAG Assisted Proof Generation Using Large Language Models [0.0] 我々は、関連する数学的文脈でモデルにクエリを補足する知識ベースであるLemmaHeadを開発した。
数学的推論におけるモデルの性能を測定するため、我々のテストパラダイムは自動定理証明の課題に焦点を当てている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:31:43 GMT)
Learning from Summarized Data: Gaussian Process Regression with Sample Quasi-Likelihood [0.0] 本研究では,ガウス過程回帰の枠組みにおける要約データのみを用いた学習と推論に取り組む。
本稿では,要約データのみを用いた学習と推論を容易にするサンプル準類似概念を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:30:12 GMT)
Latent Convergence Modulation in Large Language Models: A Novel Approach to Iterative Contextual Realignment [0.0] 隠れ状態遷移を制御する構造変調機構が導入された。
格子調整は、パープレキシティ変動、エントロピー分散、および語彙不安定の低減に寄与した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:46:33 GMT)
Language Shift or Maintenance? An Intergenerational Study of the Tibetan Community in Saudi Arabia [0.0] 本研究の目的は、3つの年齢層がチベットの維持やヒジャージのアラビア語への移行に関して異なる慣行を採ったかどうかを判断することであった。
データは、アラビア語への移行の程度で、コミュニティのメンバー間で大きな世代間差があることを明らかにした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:24:21 GMT)
LLM-based SPARQL Query Generation from Natural Language over Federated Knowledge Graphs [0.0] バイオインフォマティクス知識グラフ(KGs)上でユーザ質問を正確なSPARQLクエリに変換するための検索型拡張生成(RAG)システムを提案する。
クエリ生成における精度の向上と幻覚の低減を目的として,クエリ例やスキーマ情報を含むメタデータをKGから活用し,生成したクエリの修正に検証ステップを組み込んだ。
このシステムは chat.expasy.org で公開されている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:55:08 GMT)
LLM Agent Honeypot: Monitoring AI Hacking Agents in the Wild [0.0] 我々は,自律型AIハッキングエージェントを監視するシステムであるLLM Honeypotを紹介する。
約3ヶ月のトライアルで8,130,731件のハッキングと8人のAIエージェントを収集しました。
我々の研究は、AIによる脅威の出現とその現在の使用レベルを実証し、悪意のあるLLMエージェントの早期警告として役立ちます。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:06:36 GMT)
KG-oscillators in Eddington-inspired Born-Infeld gravity: Wu-Yang magnetic monopole and Ricci scalar curvature effects [0.0] Ricci scalar curvature $R=R_upsilon upscitationの存在下での重力効果について論じる。
リッチスカラーの曲率の存在は、効果的かつ明白に、対応する量子力学的反発コアをより反発させる力場を導入することが観察された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:44:45 GMT)
Investigating an approach of robustly self-testing two-qubit entangled states [0.0] 本研究では,これらの手法を2量子交絡量子状態の自己テストのシナリオに適用する。
参照状態との忠実性に関する新しい境界は他の方法と比較する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:36:41 GMT)
Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0] 我々は人工ニューラルネットワークを訓練し、シミュレーションと実際のジェノタイプフェノタイプデータセットの両方を用いて複雑な特徴を予測する。
統合失調症に合併した多発性座位を指摘された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:55:58 GMT)
Integrating Artificial Intelligence and Geophysical Insights for Earthquake Forecasting: A Cross-Disciplinary Review [0.0] レビューでは、堅牢で物理インフォームドな予測モデルを作成するために、AIと物理知識を組み合わせることの重要性を強調している。
我々は、地球物理学者に、慎重にAIアーキテクチャを実験するよう促し、AI専門家に地震学の理解を深めるよう促す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:26:05 GMT)
Incentive Allocation in Vertical Federated Learning Based on Bankruptcy Problem [0.0] 垂直連合学習(VFL)は、機械学習モデルを協調訓練するための有望なアプローチである。
本稿では,能動的政党による受動的政党へのインセンティブ付与の問題に焦点をあてる。
タルムード分割則(英語版)を用いることで、我々はインセンティブの公平な分配を確実にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:10:45 GMT)
Hyper Compressed Fine-Tuning of Large Foundation Models with Quantum Inspired Adapters [0.0] emphQuantum-Inspired Adaptersは、量子機械学習文学のハミング級量子回路にインスパイアされたPEFTアプローチである。
提案するアダプタは,ベンチマークデータセットに大規模言語モデルと大規模視覚変換器を適用して検証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:06:56 GMT)
How to Entangle or Disentangle Gaussian States with Hong-Ou-Mandel Interference [0.0] バランスの取れたビームスプリッター上の光子対からの2つの区別できない光子の干渉。
分離性の概念は光子の存在に対する選択後の結果であることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:39:04 GMT)
Heisenberg-limited calibration of entangling gates with robust phase estimation [0.0] 頑健な位相推定により,複数ビットゲートにおけるコヒーレント誤差の高精度,ハイゼンベルク限定推定が可能となることを示す。
超伝導プロセッサ上での2ビット制御Zゲートの動作を改善することでキャリブレーションプロトコルを実験的に実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:21:42 GMT)
Headline-Guided Extractive Summarization for Thai News Articles [0.0] タイ語ニュース記事の見出しの文脈情報を組み込んだ抽出要約モデルであるCHIMAを提案する。
我々のモデルは、事前訓練された言語モデルを用いて、複雑な言語意味をキャプチャし、要約に含まれる各文に確率を割り当てる。
公開されたタイのニュースデータセットの実験では、CHIMAはROUGE、BLEU、F1のスコアでベースラインモデルを上回っている。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:28:46 GMT)
Group-CLIP Uncertainty Modeling for Group Re-Identification [0.0] Group ReIDは、重複しないカメラで歩行者のグループをマッチングすることを目的としている。
ほとんどの手法は、群像の特定のグループ構造のみを考慮した、確実性に基づくモデルに依存している。
本稿では,グループテキスト記述をメンバーとレイアウトのバリエーションに適応させるGCUM(Group-CLIP UncertaintyModeling)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:41:35 GMT)
Grounding Text-to-Image Diffusion Models for Controlled High-Quality Image Generation [0.0] テキスト・ツー・イメージ(T2I)生成拡散モデルは,テキストキャプションから多種多様な高品質な視覚を合成する際,優れた性能を示した。
我々は,意味的および空間的接地情報に基づいて,T2I拡散モデルを記述するモデルであるObjectDiffusionを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:54:23 GMT)
Genuine tripartite entanglement in graviton-matter interactions [0.0] 量子重力系における真の三部構造非ガウス交絡の存在を示す。
我々は、ここで分析された重力-物質相互作用によく適合する新しい絡み合いの証人を紹介した。
証人は、システムが基底状態から始まるとき、ハミルトニアンによって生成される3つのモード状態に対してゼロではないことを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:41:42 GMT)
Generating Samples to Question Trained Models [0.0] 学習したモデルを探索し、好みのサンプルを識別する数学的枠組みを提案する。
フレームワークを紹介するために、これらのクエリを、分類タスクや回帰タスクで訓練されたさまざまなモデルに適用し、生成されたデータの形式で回答を受け取る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:48:48 GMT)
Free Agent in Agent-Based Mixture-of-Experts Generative AI Framework [0.0] 強化学習自由エージェント (Reinforcement Learning Free Agent, RLFA) アルゴリズムは、永続的な過パフォーマンスを示すエージェントを検出し、除去するための報酬に基づくメカニズムを導入する。
第一のユースケースは不正検出であり、RLFAは事前に設定された閾値以下で検出精度が低下するエージェントを即座に交換する。
このダイナミックでフリーの緊急サイクルは、持続的な正確さ、出現する脅威への迅速な適応、進行中の運用に対する最小限の中断を保証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:13:08 GMT)
Fourier-enhanced Neural Networks For Systems Biology Applications [0.0] システム生物学では、微分方程式は生物学系のモデル化に一般的に用いられる。
この問題に対する解決策として、新しい物理情報ニューラルネットワーク(PINN)が提案されている。
これらの問題に対処するために,システム生物学のためのフーリエ強化ニューラルネットワーク(SB-FNN)を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:48:10 GMT)
Finding Words Associated with DIF: Predicting Differential Item Functioning using LLMs and Explainable AI [0.0] 項目テキストからディファレンシャルアイテム機能(DIF)を予測するために,いくつかのエンコーダベースのトランスフォーマー大言語モデルを微調整し,比較した。
次に、これらのモデルに説明可能な人工知能(XAI)手法を適用し、DIFに関連する特定の単語を特定する。
以上の結果から,DIFに関連する単語の多くは,設計によるテスト青写真に含まれるマイナーなサブドメインを反映していることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 20:22:32 GMT)
Exploring Audio Editing Features as User-Centric Privacy Defenses Against Large Language Model(LLM) Based Emotion Inference Attacks [0.0] 既存のプライバシ保護手法はユーザビリティとセキュリティを侵害し、現実的なシナリオでの採用を制限する。
本稿では,ユーザビリティを犠牲にすることなく,感情的プライバシを保護するために,親しみやすい音声編集技術,特にピッチとテンポ操作を活用する,ユーザ中心のアプローチを提案する。
3つの異なるデータセットを用いて実験を行い、ピッチとテンポの操作が感情データを効果的に難なくすることを示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:27:03 GMT)
Exploiting Precision Mapping and Component-Specific Feature Enhancement for Breast Cancer Segmentation and Identification [0.0] 乳房病変の分類・分類のための新しいDeep Learning(DL)フレームワークを提案する。
本稿では,PMAD-LinkNetセグメンテーションフレームワークの高精度マッピング機構(PMM)を提案する。
また、コンポーネント固有の特徴拡張モジュール (CSFEM) を導入し、コンポーネント固有の特徴強化分類器 (CSFEC-Net) を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:10:33 GMT)
Expect the Unexpected: FailSafe Long Context QA for Finance [0.0] FailSafeQAは、金融におけるヒューマン・インタフェース・インタラクションの6つのバリエーションに対して、LLMの堅牢性とコンテキスト認識性をテストするように設計されている。
我々は,Qwen2.5-72B-Instruct を用いた LLM-as-a-Judge 手法を採用し,ロバストネス,コンテキストグラウンド,コンプライアンススコアを24個のオフザシェルフモデルで定義・算出するために,きめ細かい評価基準を用いた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:29:28 GMT)
Exact solvability of the Gross-Pitaevskii equation for bound states subjected to general potentials [0.0] 我々はGross-Pitaevskii(GP)方程式が一階非自律力学系に写像可能であることを示す。
本稿では,量子系の可積分性と波動方程式の可解性との差について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:12:56 GMT)
Exact full-RSB SAT/UNSAT transition in infinitely wide two-layer neural networks [0.0] 我々は,典型的な状態の重なり合いの有無にかかわらず,グラディエントDescentはキャパシティに到達できないことを示す。
この発見は勾配に基づくアルゴリズムが極めて非定型な状態に偏っていることを示唆している。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:01:04 GMT)
Exact collective occupancies of the Moshinsky model in two-dimensional geometry [0.0] 本稿では,2次元の等方性調和トラップに閉じ込められたN$ボソニック原子の基底状態について検討する。
極座標における一階還元密度行列の正確な対角表現を導出し、そこでは自然軌道の角成分が角運動量作用素の固有状態となる。
我々は、角運動量$l$の自然軌道の集合占有率を正確に表現し、角運動量を持つ粒子の分画を定量化する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:58:50 GMT)
Exact NESS of XXZ circuits boundary driven with arbitrary resets or fields [0.0] アンザッツは、正式には無限の結合次元を持ち、基本的に以前の構成と異なる。
回路は境界量子ビットに印加された一対のリセット量子チャネルによって駆動され、量子ビットを任意の純粋ターゲット状態に分極する。
我々は、スピンヘリックス状態の回路拡張と見なせる比較的頑健な分離性非平衡定常状態(NESS)の族を得る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:56:37 GMT)
Evaluating the Systematic Reasoning Abilities of Large Language Models through Graph Coloring [0.0] 本研究では,LLMの計算能力を評価するためのグラフカラー化手法について検討する。
我々は、$k$-coloringのデータセット上で、Claude 3.5 Sonnet、Llama 3.1 405B、Gemini 1.5 Pro、GPT-4o、o1-mini、DeepSeek-R1をテストする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:27:02 GMT)
Entanglement and Stabilizer entropies of random bipartite pure quantum states [0.0] 絡み合いと魔法には強い依存があるが、驚くべきことに全く無関係である。
最初の近似で、絡み合いはシュミット軌道上の平均的な魔法を決定する。
しかし、エンタングルメントスペクトルの平坦度が関与する異なる軌道を区別する平均的な魔法には、より微細な構造がある。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:34:14 GMT)
Entanglement Generation and Stabilization by Coherent Collisions [0.0] 反復電子による繰り返し衝突は、2つのリモートスピン量子ビットを絡み合った状態に散逸的に駆動することができる。
どちらのクビットとのコヒーレントスピン交換は絡み合いの発生を促進する。
我々のモデルは単一電子源を用いて実験的に実装できる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:41:22 GMT)
Enhancing kidney transplantation through multi-agent kidney exchange programs: A comprehensive review and optimization models [0.0] 本稿では,過去20年間のキドニー交換プログラム(KEP)研究の総合的なレビューを紹介する。
腎移植の量と品質を改善することを目的とした3つの数学的モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 04:21:42 GMT)
Enhancing Trust in Language Model-Based Code Optimization through RLHF: A Research Design [0.0] 本研究の目的は、人間のフィードバックを効果的に統合する、信頼性の高いLMを用いたコード最適化手法を開発することである。
この作業は、ソフトウェアエンジニアリングの協力的側面と人間中心の側面を前進させるという、より広範な目標と一致します。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:48:45 GMT)
Enhancing Pneumonia Diagnosis and Severity Assessment through Deep Learning: A Comprehensive Approach Integrating CNN Classification and Infection Segmentation [0.0] 肺疾患は世界的な健康上の課題であり、肺炎が主な関心事である。
本研究は,肺炎の検出と評価に深層学習技術を活用することに焦点を当て,相互接続した2つの目的に対処する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:58:58 GMT)
Energy exchange and fluctuations between a dissipative qubit and a monitor under continuous measurement and feedback [0.0] 連続量子測定とフィードバックは、定常状態であっても、散逸量子ビットとモニターの間のエネルギー交換を誘導する。
これらのプロセスによって誘導されるクビット冷却を実証する。
この結果は,連続測定とフィードバックによって制御される量子冷凍機の開発に潜在的な応用をもたらす。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:50:33 GMT)
Energy dynamics in a class of local random matrix Hamiltonians [0.0] 近辺のランダム行列項を1乗に二乗した数体および1次元鎖におけるエネルギーの輸送について検討する。
少数だが大きな局所ヒルベルト空間次元の場合、エネルギー力学を単一粒子ホッピング図形にマッピングする。
1D鎖では、小さな局所ヒルベルト空間次元のエネルギー輸送を数値的に研究する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:40:29 GMT)
Emotion estimation from video footage with LSTM [0.0] 本稿では,ライブラリMediaPipeが生成したブレンド・サップを処理するLSTMモデルを提案し,顔の表情から主感情を推定する。
このモデルはFER2013データセットに基づいてトレーニングされ、71%の精度と62%のf1スコアを提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:37:12 GMT)
Electricity Demand Forecasting in Future Grid States: A Digital Twin-Based Simulation Study [0.0] 我々は,今日の電力需要と将来のグリッド状態の予測に機械学習アプローチが適しているかを検討する。
我々はこのデータを、ローカルエネルギーシステムのデジタルツインに基づいて、将来のグリッド状態と比較する。
以上の結果から,LSTM(Long Short-Term Memory)はSLPよりも優れており,ベンチマーク推定値の68.5%がRoot Mean Squared Errorより1日当たりの予測よりも68.5%も低いことが示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:28:08 GMT)
Efficient Quantum Cooling Algorithm for Fermionic Systems [0.0] フェルミオンハミルトニアンの基底状態調製のための冷却アルゴリズムを提案する。
自由理論のはしご作用素に由来する適切な相互作用ハミルトニアンを導出する。
このアルゴリズムを一般化して熱状態を作成し,Fermi-Hubbardモデルで得られた知見を実証する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:06:03 GMT)
EdgeMLBalancer: A Self-Adaptive Approach for Dynamic Model Switching on Resource-Constrained Edge Devices [0.0] エッジデバイス上の機械学習は、リソース制約のある環境でリアルタイムAIアプリケーションを可能にする。
計算資源を管理する既存のソリューションは、しばしば正確さやエネルギー効率に焦点を絞っている。
エッジデバイス上でのCPU利用とリソース管理を最適化する自己適応型アプローチを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:11:29 GMT)
ENFORCE: Exact Nonlinear Constrained Learning with Adaptive-depth Neural Projection [0.0] ENFORCEは、非線形制約を正確に満たす予測を保証するニューラルネットワークアーキテクチャである。
適応深度ニューラルプロジェクションモジュールを構築し、その複雑さを動的に調整し、特定の問題と必要な許容レベルに適合させる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:52:22 GMT)
Does Entanglement Correlation in Ground State Guarantee Quantum Energy Teleportation? [0.0] 基底状態からのエネルギーの抽出は禁止されているが、エネルギー抽出には量子エネルギーテレポーテーション(QET)プロトコルを利用することができる。
トーリック・コードの場合、この信念は真実ではないかもしれない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:40:42 GMT)
Dimer problem on a spherical surface [0.0] 結合エネルギーと波動関数は全角運動量に敏感である。
ダイマーは質量中心運動の方向に押され、その幾何学を2次元から1次元に質的に変化させることができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:54:11 GMT)
Detecting entanglement in any measurement using quantum networks [0.0] 量子状態の絡み合いは、量子物理学で最もよく研究されている領域の1つである。
我々は、複合量子計測を、絡み合いと分離可能な測定の2つのクラスに分類する。
階数1の射影的絡み合った量子測定が量子的優位性を示すことを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:26:02 GMT)
DefTransNet: A Transformer-based Method for Non-Rigid Point Cloud Registration in the Simulation of Soft Tissue Deformation [0.0] 我々は,非剛点クラウド登録のための新しいエンドツーエンドトランスフォーマーアーキテクチャであるDefTransNetを提案する。
DefTransNetは、大きな変形、外れ値、ノイズ、部分データなど、変形可能な登録に関する重要な課題に対処する。
提案手法の一般化を実証するため,本手法を4つのデータセット上で検証した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:37:21 GMT)
Deep in the Knotted Black Hole [0.0] 我々は、スピンレスバナドス・タイテルボイム・ザネリ(BTZ)ブラックホールにおける検出器の遷移速度を、地平線上および水平線上を自由に下降すると見なしている。
地平線の外では定性的に類似しているが、BTZの場合よりもジオンの時空の振幅が大きい。
一般的には、検出器はブラックホールの地平線を見つけ、内部のトポロジーを識別する早期警報システムとして機能する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:27:36 GMT)
Decoherence time of the ground state spin of $V_{B}$ centers in hexagonal boron nitride [0.0] 六方晶窒化ホウ素の欠陥の基底状態スピンは、量子情報応用のための有望なプラットフォームを提供する。
量子ビットの重要な特徴はデコヒーレンス時間であり、その持続時間と制御性は量子技術における実践的応用において重要である。
双極子超微粒子相互作用の存在下では、V_B$電子スピンのハーン・エチョコヒーレンス時間は、室温で約30:mathrmmu s$である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:42:40 GMT)
Deciding Local Unitary Equivalence of Graph States in Quasi-Polynomial Time [0.0] グラフ状態の局所ユニタリ(LU)同値性を決定するために準多項式ランタイム$nlog_2(n)+O(1)$のアルゴリズムを記述する。
LU等価性は、指数的爆発を避けるために、擬多項式的に多くの線形方程式の系を解くことに還元されることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:34:41 GMT)
Critically slow Hilbert-space ergodicity in quantum morphic drives [0.0] 我々は、Thue-Morse ドライブが、長時間の極限における量子エルゴディディティの非常に強い概念を達成することを証明した。
一方、このダイナミクスは有限時間にもかかわらず、任意の長さのフロケドライブも近似する。
我々の研究は、時間依存量子システムにおいて、完全なエルゴディディティが最終的に達成される新しい種類の力学を提示する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:00 GMT)
Correlation hypergraph: a new representation of a quantum marginal independence pattern [0.0] 我々は,ある相関ハイパーグラフに基づいて,境界独立のパターンを新たに表現する。
これらの相関ハイパーグラフは任意の量子系に一般化されることを示す。
ホログラフィーの文脈では、エントロピーベクトルの実現に必要条件を導出するためにこれらの手法を適用する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:40:04 GMT)
Cooperative Evolutionary Pressure and Diminishing Returns Might Explain the Fermi Paradox: On What Super-AIs Are Like [0.0] 物質資源へのアクセスの増加による利益の減少は、全体として、銀河全体を植民地化する動機がない可能性を示唆している。
適応されたアルゴリズムは、例えば銀河を素早く植民地化するアルゴリズム、減少するリターンの下での協調と公正性の進化のモデル、およびシグナル発生をシミュレートするソフトウェアである。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:10:24 GMT)
Conformal Predictions for Human Action Recognition with Vision-Language Models [0.0] Conformal Predictions (CP) は、基底真理包含確率を厳格に保証するラベルセットを提供する。
本研究では,現在最先端のヒューマンアクション認識(HAR)手法におけるCPの適用について検討する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:27:20 GMT)
Conditioning through indifference in quantum mechanics [0.0] このような測定を行う上で、量子システムの状態条件に関する不確実性を記述する方法について検討する。
条件付けに関する一般的なルールを導出することで, 望ましさ, コヒーレンス, 無関心の相互作用を生かして, 条件付けの一般的なルールを導出できることが示される。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:27:02 GMT)
Conditioning and AGM-like belief change in the Desirability-Indifference framework [0.0] 本稿では, AGM の信念変化フレームワークをどのように拡張して,いわゆる Desirability-Indifference フレームワークの条件付けに対処するかを示す。
このレベルの抽象化により、古典的および量子的確率論を同時に扱うことができる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:11:00 GMT)
Computing Quantum Resources using Tensor Cross Interpolation [0.0] 本稿では,この課題に対処するために,クロス補間(TCI)アルゴリズムのファミリに基づく一般的な手順を提案する。
我々は1次元および2次元強磁性イジングモデルを考慮した非安定化器性 R'enyi entropy (SRE) と Relative Entropy of Coherence (REC) を計算した。
この手法はその汎用性を示すだけでなく、複雑なシステムにおいて他の量子情報量化器を探索するための一般的なフレームワークも提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:24 GMT)
Comprehensive Framework for Evaluating Conversational AI Chatbots [0.0] 本稿では,認知的・会話的知性,ユーザエクスペリエンス,運用効率,倫理的・規制的コンプライアンスの4つの側面にまたがるチャットボットの評価を行う,新たな評価フレームワークを提案する。
高度なAI方法論と金融規制を統合することで、このフレームワークは理論的基盤と現実のデプロイメント課題を橋渡しする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:27:34 GMT)
Comparing Image Segmentation Algorithms [0.0] ノイズの多い画像 y と所望のクリーンな画像 x の関係を捉えるエネルギー関数 E(x, y) を提案する。
提案手法の性能を従来の反復条件に対して評価する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 06:54:30 GMT)
Charging a Dimerized Quantum XY Chain [0.0] 量子電池はエネルギーを蓄え、必要に応じて放出するように設計されている。
量子多体系は量子電池としてどのように機能するのか?
我々は、エネルギー貯蔵装置のプロトタイプとして、横方向の場の量子XY鎖を解析する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:21:04 GMT)
Case for a unified surrogate modelling framework in the age of AI [0.0] 我々は,サロゲートモデルの開発と評価をガイドする統合フレームワークの必要性を論じる。
本稿では,サロゲートモデリングの信頼性の向上,学際的知識伝達の促進,科学的な進歩の促進を図る。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:31:15 GMT)
Calibrated Unsupervised Anomaly Detection in Multivariate Time-series using Reinforcement Learning [0.0] 本稿では,自己エンコーダの潜伏空間における強化学習(RL)を用いた時系列データにおける教師なし異常検出について検討する。
我々はウェーブレット解析を用いて異常検出を強化し、時系列データを時間領域と周波数領域の両方に分解する。
我々は、合成異常を生成し、モデル内に教師付きフレームワークを埋め込むことで、決定境界を校正する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:09:52 GMT)
Breaking Quantum Key Distributions under Quantum Switch-Based Attack [0.0] 我々は,eavesdropperのEveが不確定因果順序を用いて量子通信チャネルをインターセプトし,操作する量子スイッチを利用する新たな攻撃シナリオを提案する。
以上の結果から,従来見過ごされた脆弱性を浮き彫りにし,量子制御された敵戦略に対する対策の必要性を強調した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:56:47 GMT)
Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models [0.0] 自己教師付き学習は、効果的に訓練された場合、多数の画像や言語処理の問題を解決することができる。
本研究では, セマンティックセグメンテーションタスクに対して, 以前に学習した基礎モデルを適用するための簡易かつ効率的な手法について検討した。
本研究は,少数の画像分割データを用いて,凍結画像表現と言語概念を融合する軽量トランスフォーマーベース融合モジュールであるBeyond-Labelsを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:24:22 GMT)
Arrhythmia Classification Using Graph Neural Networks Based on Correlation Matrix [0.0] 抽出した特徴の相関行列を用いて隣接行列を生成し,不整脈の分類にグラフニューラルネットワークを適用した。
その結果,不整脈分類の精度は50%以上であり,不整脈分類のアプローチである可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:40:49 GMT)
Apriori_Goal algorithm for constructing association rules for a database with a given classification [0.0] リレーショナルデータベースにおける関連ルール構築に有効なApriori_Goalアルゴリズムを提案する。
生成したルールの質は、ルール周波数を2つ、ルールの信頼性を2つ、ルールの4つの基準を重み付けした合計である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 15:43:01 GMT)
Application of quantum machine learning using quantum kernel algorithms on multiclass neuron M type classification [0.0] この研究は、ニューロン形態を分類するための量子システムの利用を初めて提案した。
特徴工学が分類精度に与える影響を検討した結果,量子カーネル法は古典的手法と類似した性能を示した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 09:23:32 GMT)
Application of Artificial Intelligence (AI) in Civil Engineering [0.0] 本稿では,土木工学の欠点を解決するために,ソフトコンピューティング手法と人工知能を探求する必要性について検討する。
人工知能(ANN)、ファジィ論理、遺伝的アルゴリズム(GA)、確率推論を含む高度な計算モデルの統合は、土木工学の領域に革命をもたらした。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:55:52 GMT)
Anisotropic resonance energy transfer with strained phosphorene [0.0] 一軸ひずみの影響下で, 蛍光体/SiC界面近傍の量子エミッタ間の共振エネルギー伝達(RET)速度を解析した。
ホスホレンの異方性電子構造により,RET速度はQEが分離される方向に大きく依存することが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 23:26:32 GMT)
Analog classical simulation of closed quantum systems [0.0] 我々は、ノイズレス量子力学のアナログ古典シミュレーションアルゴリズムを開発した。
このようなパラダイムでシュル「オーディンガー方程式」をシミュレートする方法を説明する。
これは、物理コンピューティングデバイスで量子アルゴリズムをエミュレートする方法を舗装するかもしれない。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 10:01:36 GMT)
An exactly solvable tight-binding billiard in graphene [0.0] 三角形のグラフェンビリヤードは、H "uckeloid approximation of $pi-$band electrons" の平面炭素ポリマーとして定義される。
任意の大きさとジグザグエッジの等辺三角形は、関連するスペクトル問題の正確な解を可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 01:30:18 GMT)
An Efficient Security Model for Industrial Internet of Things (IIoT) System Based on Machine Learning Principles [0.0] 本稿では、エッジデバイスが様々な内部および外部の脅威に対して防御するためのセキュリティパラダイムを提案する。
提案したセキュリティパラダイムは、様々な内部および外部の脅威に対して有効であり、低コストのシングルボードコンピュータに適用可能である。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 14:20:13 GMT)
Amnesia as a Catalyst for Enhancing Black Box Pixel Attacks in Image Classification and Object Detection [0.0] 我々は、強化学習(RFPAR)を用いたリマイン・アンド・フォーゲット・ピクセルアタックと呼ばれる画素ベースのブラックボックスアタックを提案する。
RFPARは、一段階のRLアルゴリズムで生成された報酬を利用して乱雑なピクセルを摂動させることにより、ランダム性を軽減し、パッチ依存を避ける。
分類のためのImageNet-1Kデータセットの実験では、RFPARは最先端のクエリベースのピクセル攻撃よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 11:49:41 GMT)
Advance sharing for stabilizer-based quantum secret sharing schemes [0.0] 安定化器ベースの量子シークレット共有スキームでは、ディーラーにシークレットが与えられる前に、一部のシェアを参加者に分配することができる。
既に、一組の株が、禁止セットである場合に限り、事前共有可能であることが知られている。
本稿では,量子秘密の量子秘密共有方式を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 08:24:36 GMT)
AdaPhish: AI-Powered Adaptive Defense and Education Resource Against Deceptive Emails [0.0] AdaPhishはAIを利用してフィッシングメールを自動的に匿名化し分析するフィッシュボウルプラットフォームだ。
フィッシングトレンドの長期追跡を可能にしながら、新しいフィッシング戦術へのリアルタイム検出と適応を実現している。
AdaPhishは、フィッシング検出とサイバーセキュリティ教育のためのスケーラブルでコラボレーティブなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:12:41 GMT)
AdaPRL: Adaptive Pairwise Regression Learning with Uncertainty Estimation for Universal Regression Tasks [0.0] 回帰タスクのための適応型ペアワイズ学習フレームワーク(AdaPRL)を提案する。
AdaPRLは、データポイントと深い確率モデルの間の相対的な差異を利用して、予測に関連する不確実性を定量化する。
実験により、AdaPRLが最近提案された回帰フレームワークにシームレスに統合され、パフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 03:15:41 GMT)
Acceleration-induced radiation from a qudit particle detector model [0.0] 放射率は、検出器の初期状態に依存する因子に乗じてラーモアの公式と書くことができる。
ラーモアの公式の出現は古典的な現象を示唆するかもしれないが、結果として生じる放射は構造のない古典的な情報源と根本的に異なると論じる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 19:00:01 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 12:09:23 GMT)
AI Enhanced Ontology Driven NLP for Intelligent Cloud Resource Query Processing Using Knowledge Graphs [0.0] 本稿では、オントロジーに基づくセマンティクスによって強化された高度な自然言語処理(NLP)を提案する。
提案フレームワークは,Latent Semantic Indexing (LSI) とAIモデルを用いた動的インテント抽出と関連性ランキングを可能にする。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 02:15:13 GMT)
A note on the physical interpretation of neural PDE's [0.0] 機械学習(ML)アルゴリズムと離散力学系(DDS)の緩和形式における形式的および実質的な類似点を強調した。
この類似性は、重みを減らした新しいクラスMLアルゴリズムの開発を促進する可能性がある。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 18:07:51 GMT)
A Survey of Theory of Mind in Large Language Models: Evaluations, Representations, and Safety Risks [0.0] 心の理論 (Theory of Mind, ToM) とは、心の状態を他人に説明し、その行動を予測する能力である。
本稿では,大規模言語モデルにおける行動的および表現的ToMの評価について調査する。
我々は,高度なLLM ToM能力から重要な安全性リスクを特定し,これらのリスクを効果的に評価し緩和するためのいくつかの研究方向を提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 13:50:25 GMT)
A Frontier AI Risk Management Framework: Bridging the Gap Between Current AI Practices and Established Risk Management [0.0] 最近の強力なAIシステムの開発は、堅牢なリスク管理フレームワークの必要性を強調している。
本稿では,フロンティアAI開発のための包括的リスク管理フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 16:47:00 GMT)
A Faster Quantum Fourier Transform [0.0] 本稿では,量子フーリエ変換(QFT)を高精度かつ近似的に実装するアルゴリズムについて述べる。
量子ビットの2つの分割に再帰するQFTの新たな定式化を活用することで、これらのコストを削減することができることを示す。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 05:05:17 GMT)
A Case Study in Gamification for a Cybersecurity Education Program: A Game for Cryptography [0.0] ゲーミフィケーションは実践的なハンズオン体験を提供する革新的なアプローチを提供する。
本稿では,ゲーミフィケーション暗号教育ツールの実例について述べる。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 17:36:46 GMT)
"Once Upon a Time..." Literary Narrative Connectedness Progresses with Grade Level: Potential Impact on Reading Fluency and Literacy Skills [0.0] 本研究では,学校における文学テキストの物語的ダイナミクスについて考察する。
13年間にわたる文文1,627のデータセットについて検討した。
論文参考訳(メタデータ) (Mon, 10 Feb 2025 22:21:29 GMT)