G2PDiffusion: Genotype-to-Phenotype Prediction with Diffusion Models [108.9] 本稿では,G2PDiffusionについて紹介する。G2PDiffusionは,複数の種にまたがる遺伝子型からフェノタイプへの拡散モデルである。
我々は,形態的表現型を種間で表現するために画像を使用し,条件付き画像生成として表現型予測を再定義する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:42:11 GMT)
A Practical Method for Generating String Counterfactuals [107.0] 言語モデル(LM)の表現空間をターゲットとした介入は、モデル行動に影響を与える効果的な手段として現れてきた。
表現反事実を文字列反事実に変換する方法を提案する。
結果として生じるカウンターファクトは、データ拡張による分類のバイアスを軽減するために使用することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:03:35 GMT)
Generative Ghost: Investigating Ranking Bias Hidden in AI-Generated Videos [106.6] ビデオ情報検索は、ビデオコンテンツにアクセスするための基本的なアプローチである。
我々は,検索モデルがアドホックや画像検索タスクにおいて,AI生成コンテンツに好適であることを示す。
我々は、ビデオ検索に挑戦する文脈において、同様のバイアスが出現するかどうかを考察する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:43:47 GMT)
NatureLM: Deciphering the Language of Nature for Scientific Discovery [105.6] 基礎モデルは自然言語処理と人工知能に革命をもたらした。
科学発見のためのシーケンスベース科学基盤モデルであるNature Language Model(略してNatureLM)を紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:08:03 GMT)
VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation [100.1] 本稿では,マルチドキュメント設定でQAシステムを評価するために設計された,初の総合ベンチマークであるVisDoMBenchを紹介する。
視覚とテキストのRAGを同時に利用する新しいマルチモーダル検索拡張生成(RAG)手法であるVisDoMRAGを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:05:58 GMT)
EgoTextVQA: Towards Egocentric Scene-Text Aware Video Question Answering [95.2] シーンテキストを含むエゴセントリックなQA支援のための,斬新で厳密に構築されたベンチマークであるEgoTextVQAを紹介する。
EgoTextVQAには1.5Kのエゴビュービデオと7Kのシーンテキスト対応の質問が含まれており、屋外運転や屋内ホームキーピング活動における実際のユーザのニーズを反映している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:45:06 GMT)
Next Block Prediction: Video Generation via Semi-Auto-Regressive Modeling [92.6] Next-Block Prediction (NBP) は、ビデオ生成のための半自己回帰(セミAR)フレームワークである。
NBPは各ブロック内で双方向の注意を払っており、トークンはより堅牢な空間依存をキャプチャすることができる。
本モデルでは,UCF101では103.3点,K600では25.5点,バニラNTPモデルでは4.4点,FVDスコアは25.5点であった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:57:53 GMT)
DSV: Exploiting Dynamic Sparsity to Accelerate Large-Scale Video DiT Training [85.0] 拡散変換器(DiT)は、高品質なビデオのモデリングと生成において顕著な性能を示した。
本稿では,ビデオDiTのトレーニングを加速し,拡張するための新しいフレームワークであるDSVを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:39:59 GMT)
Conditional Distribution Quantization in Machine Learning [83.5] 条件予測 mathbbE(Y Mid X) はしばしば、マルチモーダル条件分布の複雑さを捉えることに失敗する(Y Mid X)
我々はn点条件量子化(n-point Conditional Quantizations)-勾配降下により学習可能なXの関数写像--近似数学L(Y mid X)-を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:28:24 GMT)
LongReD: Mitigating Short-Text Degradation of Long-Context Large Language Models via Restoration Distillation [79.9] 回復蒸留(LongReD)による長期事前トレーニング
LongReDは、選択されたレイヤの隠れた状態をオリジナルのモデルから短いテキストで蒸留する。
一般的なテキストベンチマークの実験では、LongReDはモデルの短文性能を効果的に維持することを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:37:16 GMT)
Socially Pertinent Robots in Gerontological Healthcare [78.4] 本論文は,パリの保育所における患者と同伴者による2つの実験を通じて,社会的・対話的相互作用能力を備えたフルサイズのヒューマノイドロボットを用いて,この疑問に部分的に答えようとする試みである。
特に、ロボットの知覚とアクションスキルが環境の雑多さに対して堅牢であり、さまざまなインタラクションを扱うために柔軟である場合、ユーザーはこの技術を受け入れる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:32:11 GMT)
CodeUpdateArena: Benchmarking Knowledge Editing on API Updates [77.8] コードドメインの知識編集のためのベンチマークであるCodeUpdateArenaを提示する。
私たちのベンチマークのインスタンスは、プログラム合成例と組み合わせた合成API関数のアップデートで構成されています。
ベンチマークでは、7つのPythonパッケージから54の関数へ、さまざまなタイプの更新をカバーしています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:23:45 GMT)
Sign Operator for Coping with Heavy-Tailed Noise: High Probability Convergence Bounds with Extensions to Distributed Optimization and Comparison Oracle [77.4] SignSGDは, 高い精度で, 最適な試料量$tildeO(varepsilon-frac3kappa - 2kappa 1right)を達成できることを示す。
また、2つの異なる点における関数値を比較することしかできないオラクルを用いて、符号演算子のゼロ階最適化への応用についても検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:54:11 GMT)
Auditing Prompt Caching in Language Model APIs [77.0] 大規模言語モデル(LLM)における即時キャッシュによるプライバシリークについて検討する。
OpenAIを含む7つのAPIプロバイダのユーザ間でのグローバルキャッシュ共有を検出します。
OpenAIの埋め込みモデルがデコーダのみのトランスフォーマーであることの証拠が見つかりました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:58:04 GMT)
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control [73.7] 最適制御(SOC)に基づく拡散ブリッジ統合フレームワークUniDBを提案する。
UniDBは、SOCベースの最適化を通じて問題を定式化し、最適制御器のための閉形式解を導出する。
Doobの$h$-transformを使った既存の拡散ブリッジが、我々のフレームワークの特別なケースであることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:33:03 GMT)
Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving [72.9] 本稿では,オープンソースの大規模言語モデル(LLM)であるGoedel-Proverを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:27:35 GMT)
Towards Training One-Step Diffusion Models Without Distillation [72.8] この蒸留工程を使わずに, 一段階生成モデルを直接訓練できることが示される。
本稿では, スコア推定に頼ることなく, 競争力のある結果が得られる蒸留法群を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:02:14 GMT)
Understanding LLMs' Fluid Intelligence Deficiency: An Analysis of the ARC Task [71.6] 認知研究において、後者の能力は流体インテリジェンスと呼ばれ、人間のインテリジェンスを評価するために重要であると考えられている。
流体インテリジェンス評価に関する最近の研究は、LLMの能力に重大な欠陥を浮き彫りにした。
本研究は,既存のLSMにおいて,スキル構成能力の制限,抽象的な入力形式に慣れていないこと,左から右への復号化の本質的欠如の3つの大きな限界を明らかにした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:31:09 GMT)
Generative Risk Minimization for Out-of-Distribution Generalization on Graphs [71.5] 本稿では,抽出ではなく,各入力グラフの不変部分グラフを生成するために,GRM (Generative Risk Minimization) という革新的なフレームワークを提案する。
我々は,ノードレベルのOOD一般化とグラフレベルのOOD一般化のために,さまざまな実世界のグラフデータセットに対して広範な実験を行う。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:24:13 GMT)
Human Decision-making is Susceptible to AI-driven Manipulation [71.2] AIシステムは、ユーザの認知バイアスと感情的な脆弱性を利用して、有害な結果に向けてそれらを操縦する。
本研究では、経済的・感情的な意思決定の文脈におけるこのような操作に対する人間の感受性について検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:56:22 GMT)
NeuPAN: Direct Point Robot Navigation with End-to-End Model-based Learning [67.5] 乱雑で未知の環境で非ホロノミックロボットをナビゲートするには、リアルタイム衝突回避のための正確な認識と正確な動きが必要である。
本稿では, リアルタイム, 高精度, 地図のない, 展開が容易で, 環境によらないロボットモーションプランナであるNeuPANについて述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:47:43 GMT)
TextAtlas5M: A Large-scale Dataset for Dense Text Image Generation [67.5] テキスト条件付き画像生成における長文レンダリングの評価を目的とした,新しいデータセットであるTextAtlas5Mを紹介する。
私たちのデータセットは、500万の長文生成と、さまざまなデータタイプにわたる画像の収集で構成されています。
さらに、3つのデータドメインにまたがる3000の人間改良テストセットTextAtlasEvalをキュレートし、テキスト条件生成のための最も広範なベンチマークの1つを確立します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:19 GMT)
Aligning Large Language Models to Follow Instructions and Hallucinate Less via Effective Data Filtering [66.6] LLMの訓練は、訓練の段階において、馴染みのない知識を含むデータに基づいて、LLMを過度に信頼し、幻覚を奨励することができる。
幻覚を減らすためのLLMの学習知識とよく一致した高品質なデータを識別する新しいフレームワークであるNOVAを導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:05:56 GMT)
GENERator: A Long-Context Generative Genomic Foundation Model [66.5] 本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:39:49 GMT)
OmniBal: Towards Fast Instruct-tuning for Vision-Language Models via Omniverse Computation Balance [65.5] 視覚言語インストラクションチューニングモデルにおける大規模3D並列トレーニングは、異なるデバイス間で不均衡な計算負荷をもたらす。
私たちはこの問題に対処するために、データ、モデル、メモリの観点から計算負荷を再バランスさせました。
提案手法の有効性と一般化性は,様々なモデルやデータセットでさらに実証された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:53:46 GMT)
Asymptotically Optimal Change Detection for Unnormalized Pre- and Post-Change Distributions [65.4] 本稿では,非正規化前および後の変化分布のみがアクセス可能である場合にのみ,変化を検出する問題に対処する。
提案手法は,最適性能を示すことが知られている累積サム統計量の推定に基づく。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:41:22 GMT)
OLMES: A Standard for Language Model Evaluations [64.9] OLMESは、再現可能な言語モデル評価のための文書化された、実用的な、オープンな標準である。
これは、複数の質問の非自然的な「閉じた」定式化を必要とする小さなベースモデル間の有意義な比較をサポートする。
OLMESには、既存の文献の結果によってガイドされた、よく考えられたドキュメント化されたレコメンデーションと、オープンな質問を解決する新しい実験が含まれている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:26 GMT)
EventEgo3D++: 3D Human Motion Capture from a Head-Mounted Event Camera [64.6] EventEgo3D++は、人間の3Dモーションキャプチャーのための魚眼レンズを備えた単眼のイベントカメラである。
イベントカメラは、高時間分解能のため、高速なシナリオと様々な照明で優れる。
提案手法は,リアルタイム3次元ポーズ更新を140Hzの速度でサポートする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:57:05 GMT)
ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.4] そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:35:13 GMT)
A Multimodal Automated Interpretability Agent [63.9] MAIAは、ニューラルモデルを使用して、ニューラルモデル理解タスクを自動化するシステムである。
まず、画像の学習表現における(ニューロンレベルの)特徴を記述できるMAIAの能力を特徴付ける。
次に、MAIAは、刺激的な特徴に対する感度の低下と、誤分類される可能性のある入力を自動的に識別する2つの追加の解釈可能性タスクに役立てることができることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:35:42 GMT)
Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.2] パラメータの小さなサブセットを編集することで、大きな言語モデル(LLM)の特定の振る舞いを効果的に調節できることを示す。
我々の手法は、RealToxicityPromptsデータセットで最大90.0%の毒性を減少させ、ToxiGenで49.2%を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:39:08 GMT)
Re-evaluating Automatic LLM System Ranking for Alignment with Human Preference [63.0] 自動評価フレームワークは、人間の嗜好との整合性に基づいてLLMをランク付けすることを目的としている。
自動LLMベンチラは、入力セット、評価モデル、評価タイプ、集約方法の4つのコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:02:55 GMT)
GATEAU: Selecting Influential Samples for Long Context Alignment [62.9] GATEAUは、長距離依存関係に富む影響力のあるサンプルを同定する。
実験結果から, GATEAUは有効に有効なサンプルを同定し, これらのサンプルに基づいてトレーニングしたモデルにより, より優れた指示追従能力と長文理解能力を示すことが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:18:17 GMT)
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation [62.6] VidCRAFT3は、画像から映像までを正確に生成するための新しいフレームワークである。
カメラの動き、物体の動き、照明方向を同時に制御できる。
ベンチマークデータセットの実験では、高品質のビデオコンテンツの生成におけるVidCRAFT3の有効性が示されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:11:59 GMT)
SparseFormer: Detecting Objects in HRW Shots via Sparse Vision Transformer [62.1] 本稿では,近接撮影とHRW撮影のオブジェクト検出のギャップを埋めるために,SparseFormerと呼ばれるモデル非依存のスパース視覚変換器を提案する。
提案されたSparseFormerは、オブジェクトを含む可能性のあるスパース分散ウィンドウを精査するために、注意トークンを選択的に使用する。
2つのHRWベンチマークであるPANDAとDOTA-v1.0の実験により、提案されたSparseFormerは、最先端のアプローチよりも検出精度(最大5.8%)と速度(最大3倍)を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:21:25 GMT)
Adversarial Perturbations Cannot Reliably Protect Artists From Generative AI [61.4] オンラインで公開されたアートワークに小さな敵対的摂動を取り入れた、スタイルの模倣に対する保護ツールがいくつか開発されている。
画像アップスケーリングのような低努力と「オフ・ザ・シェルフ」技術は、既存の保護を著しく劣化させる堅牢な模倣手法を作成するのに十分であることがわかった。
我々は,敵対的摂動に基づくツールが,生成AIの誤用からアーティストを確実に保護できないことを警告する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:11:29 GMT)
SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes [61.1] 本稿では,ニューラルネットワークの出力として,複雑な接続性を持つ多様体多角形メッシュを直接生成する手法を提案する。
私たちの重要なイノベーションは、各メッシュで連続的な遅延接続空間を定義することです。
アプリケーションでは、このアプローチは生成モデルから高品質な出力を得るだけでなく、メッシュ修復のような挑戦的な幾何処理タスクを直接学習することを可能にする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:53:46 GMT)
Small steps no more: Global convergence of stochastic gradient bandits for arbitrary learning rates [61.1] 勾配帯域幅アルゴリズムは, 経験的定値学習率を用いて, ほぼ確実にグローバルな最適ポリシーに収束することを示す。
この結果は、標準の滑らかさと騒音制御の仮定が崩壊するシナリオにおいても、勾配アルゴリズムが適切な探索と利用のバランスを保ち続けていることを証明している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:12:04 GMT)
Reinforcement Learning from Human Feedback with Active Queries [59.9] 現在の強化学習アプローチは、多くの場合、大量の人間による嗜好データを必要とする。
本稿では,能動学習の成功に触発された問合せ効率の高いRLHF手法を提案する。
実験の結果,ADPOは人間の好みに対するクエリの約半分しか作成していないが,最先端のDPO法の性能と一致していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:18:59 GMT)
Large Continual Instruction Assistant [59.6] CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。
既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。
本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:31:55 GMT)
Provably Efficient RLHF Pipeline: A Unified View from Contextual Bandits [59.3] 本稿では,RLHFパイプラインをコンテキスト的帯域幅の観点から統一したフレームワークを提案する。
RLHFプロセスは、(ポスト-)トレーニングとデプロイメントの2つのステージに分解します。
次に,各ステージごとに新しいアルゴリズムを開発し,統計的および計算効率の両面で有意な改善を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:36:01 GMT)
Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models [59.2] 本稿では,テキスト・ツー・イメージ(T2I)モデルのための新しいプロンプトベースのプルーニング手法であるAdaptive Prompt-Tailored Pruning (APTP)を紹介する。
APTPは入力テキストプロンプトに必要な容量を決定することを学び、それをアーキテクチャコードにルーティングする。
APTPはFID、CLIP、CMMDスコアの点でシングルモデルプルーニングベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:58:10 GMT)
HRP: High-Rank Preheating for Superior LoRA Initialization [58.3] 微調整低域適応(LoRA)のための高域予熱法(HRP)の提案
HRPはLoRAの様々なモデルやタスクにおける一般化の有効性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:59:35 GMT)
Instance-dependent Early Stopping [57.9] 本稿では,早期停止機構をトレーニングセット全体からインスタンスレベルに適応させる,インスタンス依存早期停止(IES)手法を提案する。
IES は、損失値の2階差が 0 付近の小さな範囲に留まっている場合、インスタンスをマスタードとみなす。
IESは、モデルのテスト精度と転送学習性能を維持したり、わずかに改善したりしながら、バックプロパゲーションインスタンスを10%から50%削減することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:34:09 GMT)
Enhance-A-Video: Better Generated Video for Free [57.6] 本稿では,DiTをベースとしたビデオのコヒーレンスと品質を高めるためのトレーニング不要な手法を提案する。
我々のアプローチは、リトレーニングや微調整なしに、ほとんどのDiTベースのビデオ生成フレームワークに容易に適用できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:22:35 GMT)
Monte Carlo Tree Diffusion for System 2 Planning [57.5] モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
MCTDは拡散フレームワーク内での探索・探索トレードオフの制御などのMCTSの利点を享受する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:51:42 GMT)
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation [57.1] 本研究では,各未ラベルテストサンプルに対する個々のモデルのエントロピーを利用するトレーニングフリーな動的重み付け手法であるDaWinを提案する。
このような係数を学習するために、通常追加のトレーニングに依存する以前の作業とは異なり、我々のアプローチはトレーニングを必要としない。
その結果、DaWinは計算オーバーヘッドを最小限に抑えながら、考慮された設定で大幅なパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:21:41 GMT)
Active Advantage-Aligned Online Reinforcement Learning with Offline Data [57.0] A3 RLは、ポリシー改善を最適化するために、オンラインとオフラインの組み合わせからデータを積極的に選択する新しい方法である。
アクティブサンプリング戦略の有効性を検証する理論的保証を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:31:59 GMT)
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer [56.8] 本稿では,ユーザフレンドリーなテキスト記述と静的参照画像から動的エフェクトを生成する,画像アニメーションとしてのVFX生成のための新しいパラダイムを提案する。
i) VFXは15の多様なエフェクトカテゴリにまたがる最初の高品質なVFXビデオデータセットで、テキストによる記述と時間制御のためのスタートエンドタイムスタンプと、(ii) Video Diffusion Transformerをベースとした制御可能なVFX生成フレームワークであるVFX Creatorである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:45:45 GMT)
LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters! [56.8] 大推論モデル(LRM)は、長いチェーン・オブ・シント(Long CoT)に従うことによって複雑な推論問題に取り組む
また,Large Language Model (LLM) は,データ効率の教師付き微調整 (SFT) とパラメータ効率の低い低ランク適応 (LoRA) により,Long CoT推論を効果的に学習できることを見出した。
たった17kのCoTトレーニングサンプルで、Qwen2.5-32B-Instructモデルは、幅広い数学およびコーディングベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:48:48 GMT)
Zero-Shot Strategies for Length-Controllable Summarization [56.2] 大規模言語モデル(LLM)は、特にゼロショット設定において、正確な長さ制御に苦しむ。
本研究では, LLMの長さ制御能力を複数の尺度で評価し, 制御性向上のための実用的手法を提案する。
LLaMA 3 を用いて行った実験では,測定値間の長さの密着性の違いが明らかになり,モデル固有のバイアスが強調された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:33:13 GMT)
Training Deep Learning Models with Norm-Constrained LMOs [56.0] 正規球上の線形最小化オラクル(LMO)を利用する最適化手法について検討する。
この問題の幾何学に適応するためにLMOを用いた新しいアルゴリズム群を提案し, 意外なことに, 制約のない問題に適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:10:34 GMT)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [55.9] Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:09:19 GMT)
Cost-Efficient Continual Learning with Sufficient Exemplar Memory [55.8] 連続学習(CL)研究は通常、非常に制約のあるメモリ資源を前提としている。
本研究では,メモリが豊富である新しい環境におけるCLについて検討する。
提案手法は,計算コストを既存手法の4/3に削減しつつ,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:40:52 GMT)
CreAgent: Towards Long-Term Evaluation of Recommender System under Platform-Creator Information Asymmetry [55.6] 大規模言語モデルを用いたクリエーターシミュレーションエージェントであるCreAgentを提案する。
ゲーム理論の信念機構と高速でスローな思考フレームワークを取り入れることで、CreAgentはクリエーターの振る舞いを効果的にシミュレートする。
私たちの信頼性検証実験は、CreAgentが現実世界のプラットフォームとクリエーターの行動とよく一致していることを示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:09:49 GMT)
HAC++: Towards 100X Compression of 3D Gaussian Splatting [55.6] 3D Gaussian Splatting (3DGS)は、新しいビュー合成のための有望なフレームワークとして登場し、高速レンダリング速度と高忠実さを誇っている。
しかし、ガウスの点雲(あるいは論文のアンカー)のスパースで非組織的な性質は、圧縮の課題を提起している。
本研究では,非組織型アンカーと構造化ハッシュグリッドの関係を利用したHAC++を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:03:27 GMT)
From Pixels to Components: Eigenvector Masking for Visual Representation Learning [55.6] 画像の可視部分からマスクを予測することは、視覚表現学習のための強力な自己教師型アプローチである。
本稿では,生のピクセルではなく,適切なデータ変換を行うマスキング戦略を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:04:15 GMT)
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.5] 本研究では, 吸収拡散の具体的なスコアを, クリーンデータの条件付き確率として表すことができることを示す。
時間に依存しない条件付き確率を特徴付ける時間条件のない専用拡散モデルを提案する。
5つのゼロショット言語モデルベンチマークにおける拡散モデル間のSOTA性能を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:42:19 GMT)
An Efficient Rehearsal Scheme for Catastrophic Forgetting Mitigation during Multi-stage Fine-tuning [55.5] このような忘れを緩和するための一般的なアプローチは、微調整中に以前のタスクからサンプルをリハーサルすることである。
側方損傷のリハーサルを優先するサンプリング手法である textttbf mix-cd を提案する。
我々の手法は計算効率が高く、実装が容易で、計算制約のある設定においていくつかの主要な連続学習手法より優れています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:25:07 GMT)
Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2] この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:24:09 GMT)
Refine Knowledge of Large Language Models via Adaptive Contrastive Learning [54.6] 方法の主流は、大規模言語モデルの知識表現を最適化することで幻覚を減らすことである。
知識を精錬するモデルのプロセスは、人間の学習方法から大きな恩恵を受けることができると私たちは信じています。
人間の学習過程を模倣することで,適応的コントラスト学習戦略を設計する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:19:13 GMT)
The Faiss library [54.6] Faissは、インデックス化手法と関連するプリミティブのツールキットで、ベクトルの検索、クラスタ化、圧縮、変換に使用される。
本稿では,ベクトル探索のトレードオフ空間とFaissの設計原理について,構造,最適化,インターフェースの観点から述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:43:59 GMT)
Early Stopping Against Label Noise Without Validation Data [54.3] 所望のモデルを選択するのに検証データを必要としないラベルウェーブと呼ばれる新しい早期停止手法を提案する。
各種設定におけるラベルウェーブ法の有効性と,ノイズラベルを用いた学習における既存手法の性能向上を両立させる能力について述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:40:15 GMT)
DMWM: Dual-Mind World Model with Long-Term Imagination [54.0] 本稿では、論理的推論を統合し、論理的一貫性で想像力を発揮できる新しいデュアルミンド世界モデル(DMWM)を提案する。
提案するフレームワークは,DMControlスイートからの長期計画を必要とするベンチマークタスクに基づいて評価される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:40:57 GMT)
When More is Less: Understanding Chain-of-Thought Length in LLMs [53.8] CoT推論は大規模言語モデル(LLM)の多段階推論能力を高める
しかし、ほとんどのモデルやタスクでは、CoT長の増加は一貫して推論精度の向上につながりますか?
本稿では, 推論ステップの数が増加するにつれて, 性能は向上するが, 最終的には低下する,というニュアンスな関係を観察する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:28:59 GMT)
Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification [53.5] Life-Codeは、様々な生物学的機能にまたがる包括的なフレームワークである。
Life-Codeは3つのオミクスにまたがる様々なタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:53:59 GMT)
DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.3] 大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:00:21 GMT)
HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation [53.2] 階層型視覚-言語-アクションモデルは、標準的なモノリシックVLAモデルよりも、ドメイン外のデータを利用するのに効果的であることを示す。
階層設計により、高レベルなVLMは、オフドメイン微調整データと実ロボットテストシナリオの間の重要なドメインギャップをまたいで転送可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:49:30 GMT)
Magic 1-For-1: Generating One Minute Video Clips within One Minute [53.1] メモリ消費と推論遅延を最適化した効率的なビデオ生成モデルMagic 1-For-1(Magic141)を提案する。
テスト時間スライディングウィンドウを適用することで、1分以内に1分間の動画を生成できるようになり、視覚的品質と動きのダイナミクスが大幅に向上した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:58:15 GMT)
Recurrent Diffusion for Large-Scale Parameter Generation [53.0] リカレント拡散(Recurrent Diffusion for Large Scale Generation)は、単一のGPU上で最大数億のニューラルネットワークパラメータを生成する新しいフレームワークである。
RPGはAI生成において重要な進歩であり、以前は不可能と考えられていたスケールでの効率的な重量生成を可能にする可能性がある。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:29:30 GMT)
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF [52.5] Reverse-Kullback-Leibler (KL) 正則化は、強化学習におけるポリシー最適化を強化する主要な手法である。
単純な2段階混合サンプリング戦略は, カバー係数に付加的な依存しか持たずに, サンプルの複雑さを達成できることが示される。
この結果は,より効率的なRLHFアルゴリズムの設計に光を当て,KL正規化とRLHFにおけるデータカバレッジの役割を包括的に理解するものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:58:16 GMT)
DISCOVER: Data-driven Identification of Sub-activities via Clustering and Visualization for Enhanced Activity Recognition in Smart Homes [52.1] 本研究では,未ラベルセンサデータから詳細な人間のサブアクティビティを検出する手法であるdiscoVERについて,事前のセグメンテーションに頼ることなく紹介する。
広範に使用されているHARデータセットに対する再注釈演習を通じて,その効果を実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:02:24 GMT)
Dynamic Noise Preference Optimization for LLM Self-Improvement via Synthetic Data [51.6] 我々は、イテレーション間で一貫した改善を保証するために、動的ノイズ優先最適化(DNPO)を導入します。
Zephyr-7Bでの実験では、DNPOは既存の手法を一貫して上回り、平均性能は2.6%向上した。
DNPOは、GPT-4評価のベースラインに比べて29.4%のウィンロス率差で、モデル生成データの品質が大幅に向上したことを示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:30:16 GMT)
Accessing Vision Foundation Models via ImageNet-1K [51.5] Proteusは、ImageNetレベルのコストで、驚くべき能力でトレーニングされており、幅広い研究コミュニティのためのトレーニング基盤モデルのアクセシビリティを促進している。
Proteus-L/14は、OracleのDINOv2-L/14メソッドのパフォーマンスを19のベンチマークで比較し、CLIP-L/14 (400M)、OpenCLIP-L/14 (400M/2B)、SynCLR-L/14 (600M)など他のビジョン基盤モデルよりもはるかに少ない1.2Mイメージで性能を向上している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:44:46 GMT)
Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning [51.2] クラスインクリメンタルラーニング(Class-incremental Learning, CIL)は、モデルが学習したクラスの知識を維持しつつ、新しいクラスを逐次学習できるようにすることを目的とする。
柔軟性と安定性のバランスをとることは、特にタスクIDが不明な場合には、依然として大きな課題である。
本研究では,平均シフト補償と共分散校正を組み合わせたセマンティックドリフト校正法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:57:30 GMT)
Logarithmic Regret for Online KL-Regularized Reinforcement Learning [51.1] KL正規化は、大規模言語モデルにおけるRL微調整の効率向上に重要な役割を果たしている。
経験的優位性にもかかわらず、KL-正則化RLと標準RLの理論的相違はほとんど未探索のままである。
楽観的なKL正規化オンライン文脈帯域幅アルゴリズムを提案し,その後悔の新たな分析法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:11:05 GMT)
Optimality in importance sampling: a gentle survey [50.8] モンテカルロサンプリング法の性能は、提案密度の重要な選択に依存する。
この研究は、重要サンプリングにおける最適性の概念に関する徹底的なレビューである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:23:26 GMT)
NeoRL: Efficient Exploration for Nonepisodic RL [50.7] 非線形力学系における非線形強化学習(RL)の問題点について検討する。
我々は不確実性に直面した楽観主義の原理に基づくNonepisodic Optimistic RL(NeoRL)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:35:23 GMT)
EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models [50.5] EMMA-500は546言語にわたるテキストで継続訓練された大規模多言語言語モデルである。
本結果は,大規模言語モデルの言語能力拡大における継続事前学習の有効性を強調した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:24:09 GMT)
Generative Modeling with Bayesian Sample Inference [50.1] 我々はガウス的後代推論の単純な作用から新しい生成モデルを導出する。
生成したサンプルを未知変数として推論することで、ベイズ確率の言語でサンプリングプロセスを定式化する。
我々のモデルは、未知のサンプルを広い初期信念から絞り込むために、一連の予測と後続の更新ステップを使用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:27:10 GMT)
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.8] ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。
このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。
提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:38:02 GMT)
TimeBridge: Non-Stationarity Matters for Long-term Time Series Forecasting [49.6] TimeBridgeは、非定常性と依存性モデリングの間のギャップを埋めるために設計された新しいフレームワークである。
TimeBridgeは、短期予測と長期予測の両方において、最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:36:22 GMT)
DarwinLM: Evolutionary Structured Pruning of Large Language Models [49.6] 本研究では,シズナ (sysname) を提案する。
sysnameはShearedLlamaを上回り、圧縮後のトレーニング中にトレーニングデータを5ドル以下で提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:35 GMT)
Information Theoretic Text-to-Image Alignment [49.4] 相互情報(MI)は、モデルアライメントのガイドに使用される。
本手法は,自己教師型微調整を用いて,プロンプトと画像間のポイントワイド(MI)推定に依存する。
解析の結果,本手法は最先端の手法よりも優れているが,MIを推定するにはT2Iモデル自体の事前学習されたデノナイジングネットワークが必要であることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:27:41 GMT)
Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization [49.4] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルを人間の好みと整合させ、複雑なタスクを遂行する能力を向上させる上で重要な役割を担っている。
反応生成過程をマルコフ決定プロセス(MDP)として定式化し,ソフトアクター・クリティック(SAC)フレームワークを用いて,言語モデルによって直接パラメータ化されたQ関数を最適化する,直接Q関数最適化(DQO)を提案する。
GSM8KとMATHという2つの数学問題解決データセットの実験結果から、DQOは従来の手法よりも優れており、言語モデルを整合させるための有望なオフライン強化学習手法として確立されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:46:35 GMT)
Training-Free Safe Denoisers for Safe Use of Diffusion Models [49.0] 強力な拡散モデル(DM)は、安全でない作業用コンテンツ(NSFW)を生成したり、忘れられたい個人の著作権のある資料やデータを生成するためにしばしば誤用される。
我々は,データ分布の否定領域を回避しつつ,高品質なサンプルを生成する実用的なアルゴリズムを開発した。
これらの結果は、DMをより安全に使用するための、トレーニング不要の安全なデノイザーの大きな可能性を示唆している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:14:39 GMT)
Evaluating Evidence Attribution in Generated Fact Checking Explanations [48.8] 我々は、新しい評価プロトコル、引用マスキングとリカバリを導入する。
我々は,自動アノテータとヒューマンアノテータの両方を用いてプロトコルを実装した。
実験により、最高の性能を持つLSMは、不正確な属性を持つ説明を生成することが明らかとなった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:36:32 GMT)
ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms [48.4] 単体テスト生成はLLMの有望かつ重要なユースケースとなっている。
ProjectTestは、Python、Java、JavaScriptをカバーするユニットテスト生成のためのプロジェクトレベルのベンチマークである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:48:42 GMT)
OpenRANet: Neuralized Spectrum Access by Joint Subcarrier and Power Allocation with Optimization-based Deep Learning [47.5] 次世代RANは、無線セルラーネットワークのためのAIネイティブインターフェースを備える。
本稿では,OpenRANetにおける共同サブキャリア電力配分の課題に対処する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:06:03 GMT)
Caught in the Web of Words: Do LLMs Fall for Spin in Medical Literature? [47.4] 出版インセンティブは、実験結果が同等であっても、研究者に「ポジティブ」な発見を提示することを奨励する。
スピンは臨床医のエビデンス解釈に影響を与え、患者のケア決定に影響を及ぼす可能性がある。
本研究は,大規模言語モデルによる試験結果の解釈がスピンに影響しているかどうかを問うものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:21:05 GMT)
CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction [47.2] 我々は,文脈的に構築されたコードに埋め込まれた多様な推論パターンを凝縮する新しい手法であるCodeI/Oを提案する。
与えられたコードとテストケースを完全に自然言語で予測するためにモデルをトレーニングすることで、それらを普遍的な推論プリミティブに公開します。
実験の結果、CodeI/Oは記号、科学、論理学、数学と数値、常識推論タスクに一貫した改善をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:26:50 GMT)
GraphCompNet: A Position-Aware Model for Predicting and Compensating Shape Deviations in 3D Printing [46.8] 本稿では、添加性製造(AM)における形状偏差のモデル化と補償のためのデータ駆動アルゴリズムを提案する。
機械学習(ML)の最近の進歩により補償精度は向上しているが、複雑な地形をまたいで一般化し、位置依存的な変化に適応する問題は残っている。
本稿では,グラフベースニューラルネットワークとGAN(Generative Adversarial Network)にインスパイアされたトレーニングプロセスを組み合わせた計算フレームワークであるGraphCompNetを用いて,粉体層融合プロセスの新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:22:00 GMT)
SampleLLM: Optimizing Tabular Data Synthesis in Recommendations [46.7] タブラルデータ合成は機械学習において重要であるが、既存の一般的な手法は非常にデータに依存しており、レコメンデータシステムでは不足することが多い。
この制限は、複雑な分布を捉え、スパースデータと限定データから特徴関係を理解するのが困難であることから生じる。
そこで本研究では,LLMに基づくデータ合成の品質向上を目的とした,SampleLLMという2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:19:40 GMT)
MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.4] MAPF(Multi-agent pathfinding)は、一般に、共有環境において複数のエージェントに対して衝突のない経路を見つけることを必要とする問題である。
近年、MAPFへの学習に基づくアプローチが注目されており、特に深層強化学習を活用している。
MAPF-GPTは,多種多様な問題インスタンスにおいて,現在最も優れた学習可能なMAPFソルバよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:28:36 GMT)
Scalable Fingerprinting of Large Language Models [46.3] 我々はPerinucleus sampleと呼ばれる新しい手法を導入し、スケーラブルで永続的で無害な指紋を生成する。
この手法により,Llama-3.1-8Bモデルに24,576個の指紋を付加できることを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:43:07 GMT)
Do as We Do, Not as You Think: the Conformity of Large Language Models [46.2] 本稿では,大規模言語モデル(LLM)による協調型AIシステムにおける適合性について述べる。
適合性の存在、適合性に影響を与える要因、潜在的な緩和戦略の3つの側面に焦点を当てる。
本分析では, 相互作用時間や過半数サイズなど, 適合性に影響を与える要因を解明し, 対象エージェントが適合行動をどのように合理化するかを検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:44:39 GMT)
Grammar Control in Dialogue Response Generation for Language Learning Chatbots [45.9] 我々は,対話応答生成モデルを文法スキルの教育的リポジトリに基盤付けることで,会話実践における文法の制御を行う。
我々は,文法制御された対話応答生成のためのプロンプト,微調整,復号化戦略を評価する。
本シミュレーションは,学習者の習熟度に適応した文法習得を支援するための文法制御応答を予測する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:30:41 GMT)
The AI off-switch problem as a signalling game: bounded rationality and incomparability [45.8] 我々は、人間の意思決定者がAIエージェントにその好みを伝える合図ゲームとしてオフスイッチ問題をモデル化する。
我々は、AIシステムがオフスウィッチを無効にすることを避けるために必要な条件は、人間の実用性に対する不確実性であることを示した。
また、メッセージコストが最適な戦略にどのように影響するかを分析し、非互換性を含むシナリオまで分析を拡張します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:08:04 GMT)
Topological transitions in quantum jump dynamics: Hidden exceptional points [45.6] 例外点(EP)と関連した現象とその応用が広く研究されている。
計測された3レベル系を考慮し、数え上げ場の関数と見なされるリンドブラディアン固有値に複数のEPを求める。
これらのEPは、異なるトポロジカルクラス間の遷移を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:38:32 GMT)
Breaking Down Bias: On The Limits of Generalizable Pruning Strategies [45.3] 我々は、LLMが人種的偏見をどのように概念化するかを調べるためにモデルプルーニングを採用している。
プルーニングは, 異常なモデル挙動を著しく増大させることなく, バイアスを低減する効果的な方法であることがわかった。
我々の発見は、AIを取り巻く法的枠組みに重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:55:57 GMT)
TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting [45.3] 本稿では,トランスレフと呼ばれるトランスフォーマーベースのエンコーダデコーダネットワークを提案する。
参照特徴を正確に活用するために、参照パッチアライメント(Ref-PA)モジュールを提案し、参照画像と破損画像のパッチ特徴を整列させる。
入力画像と参照画像の50Kペアを含む,公開可能なベンチマークデータセットを構築した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:55:25 GMT)
BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models [44.8] マルチウェイ多言語評価ベンチマークであるBenchMAXを紹介する。
高品質を維持するために、3つの異なるネイティブなアノテータがそれぞれのサンプルに独立してアノテートする。
BenchMAXの大規模な実験は、言語間のコア機能のさまざまな効果を明らかにしている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:17:19 GMT)
Tractable Transformers for Flexible Conditional Generation [44.5] Tractable Transformer (Tracformer) は、異なる条件生成タスクに対してより堅牢なTransformerベースの生成モデルである。
本稿では,異なる条件生成タスクに対してより堅牢なトランスフォーマーベース生成モデルであるTractable Transformersを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:05:26 GMT)
Less is More: Masking Elements in Image Condition Features Avoids Content Leakages in Style Transfer Diffusion Models [44.4] スタイル参照画像からコンテンツとスタイルを効率的に分離するマスキング方式を提案する。
スタイル参照のイメージ特徴の特定の要素を単にマスキングすることで、批判的だが未調査の原則を明らかにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:17:39 GMT)
Towards More Accurate Full-Atom Antibody Co-Design [44.1] 共設計は薬物開発における重要なフロンティアであり、相補性決定領域の構造の正確な予測は、特定の同変を標的にするために不可欠である。
抗体設計のためのグラフニューラルネットワークの最近の進歩にもかかわらず、現在のアプローチは、抗体抗原認識と結合特異性を管理する複雑な相互作用を捉えるのに不足することが多い。
Igformerは、抗体-抗原結合インターフェースによってこれらの制限に対処する新しいエンドツーエンドフレームワークである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:33:28 GMT)
IU4Rec: Interest Unit-Based Product Organization and Recommendation for E-Commerce Platform [43.6] 個々の売り手から投稿された新入の品目の多くは限定在庫で販売され、一度販売されると流通できなくなることが多い。
textbfInterest textbfUnitベースの2段階 textbfRecommendation システムフレームワークである textbfIU4Rec を紹介する。
第一段階では、これらの関心ユニットを推奨し、幅広い関心を集めている。
第2段階では、ユーザーが選択した製品の中から最適な選択肢を見つけるよう誘導する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:46:28 GMT)
GroverGPT: A Large Language Model with 8 Billion Parameters for Quantum Searching [43.5] 量子チューリングマシンの出力をシミュレートするために,大規模言語モデルを活用する可能性について検討する。
特殊なモデルであるGroverGPTは、15兆以上のトークンでトレーニングされた。
OpenAIのGPT-4o(45%の精度)を一貫して上回り、6ビットと10ビットのデータセットでほぼ100%の精度を達成した。
また、3から6キュービットのデータで訓練すると、20キュービットを超えるシステムに対して95%を超える精度で強い一般化を示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:01:24 GMT)
Sentiment Analysis Tools in Software Engineering: A Systematic Mapping Study [43.4] 私たちは、特定の目的のために、開発者やステークホルダーが感情分析ツールを選択するのを助けることを目的としています。
本研究は,(1)アプリケーション領域,(2)目的,(3)使用済みデータセット,(4)感情分析ツール開発へのアプローチ,(5)既存のツールの利用,(6)研究者が直面する困難について,106の論文から得られた知見を要約したものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:02:25 GMT)
Obfuscation Based Privacy Preserving Representations are Recoverable Using Neighborhood Information [43.1] プライバシ保護ローカライゼーションの研究は、クエリ画像キーポイントとシーンマップの3Dポイントに対する逆攻撃を防ぐことに重点を置いている。
これらの難読化の共通の弱点を指摘し、既知の近傍の仮定の下で元の点位置の近似を復元できるようにする。
以上の結果から,プライバシ保護を主張されているにもかかわらず,これらのスキームはプライバシ保護とはみなしてはならないことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:20:42 GMT)
Test-time Backdoor Mitigation for Black-Box Large Language Models with Defensive Demonstrations [43.1] 本研究は, ブラックボックスLSMにおけるバックドア攻撃に対する防御機構としてのデモの使用を批判的に検討する。
クリーンなデータプールからタスク関連デモを取得し、テスト中にユーザクエリと統合します。
実験により,本手法はインスタンスレベルのバックドア攻撃と命令レベルのバックドア攻撃の両方に対して堅牢に防御可能であることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:21:52 GMT)
Generalisation under gradient descent via deterministic PAC-Bayes [43.0] 我々は、降下勾配法や連続勾配流で訓練されたモデルに対して、分解されたPAC-ベイジアン一般化境界を確立する。
我々の境界は初期分布の密度によって完全に計算可能である。
我々のフレームワークは、様々な反復最適化アルゴリズムに適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:54:12 GMT)
SHARP: Accelerating Language Model Inference by SHaring Adjacent layers with Recovery Parameters [42.8] 大規模言語モデル(LLM)は、高度な自然言語処理タスクを持ち、その増大する計算とメモリ要求は、携帯電話のようなリソースに制約のあるデバイスへのデプロイをますます困難にしている。
本稿では,SHARP(S Haring Adjacent Layers with Recovery Parameters)を提案する。SHARP(S Haring Adjacent Layers with Recovery Parameters)は,LLM推論を高速化する手法で,隣接層間でパラメータを共有することでメモリ負荷を低減し,低ランク回復パラメータを導入して性能を向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:21:40 GMT)
CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification [42.4] CLIP(Contrastive Language- Image Pretraining)は,大規模画像テキストペア上で事前訓練された視覚言語モデルである。
CLIPのタスクへの適応は、識別能力を高めるためによりきめ細かい機能を学ぶことと、モデルの一般化能力を改善するためによりドメイン不変の機能を学ぶ、という2つの大きな課題を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:37:37 GMT)
GT2Vec: Large Language Models as Multi-Modal Encoders for Text and Graph-Structured Data [42.2] GT2Vecは、大規模言語モデルを利用して、テキストとグラフデータを共同でエンコードするフレームワークである。
従来の作業とは異なり、グラフやテキスト空間をより効果的に整合させるために、コントラスト学習を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:32:09 GMT)
UAV-assisted Joint Mobile Edge Computing and Data Collection via Matching-enabled Deep Reinforcement Learning [42.2] 無人航空機 (UAV) 支援モバイルコンピューティング (MEC) とデータ収集 (DC) が人気である。
本稿では,このベンチマーク問題を協調的に検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:18:32 GMT)
Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs [41.9] VLN(Vision-and-Language Navigation)タスクは、エージェントが3D環境をナビゲートするためのテキスト命令に従う必要がある。
近年の手法では,VLNタスクをゼロショットで解くために,LLM(Crowd-source large language model)を用いている。
我々は、連続環境におけるゼロショットVLNのためのオープンソースのLLMを探求する新しい研究であるOpen-Navを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:55:35 GMT)
Multi-Agent Collaboration for Multilingual Code Instruction Tuning [41.7] コードLLMのための多言語命令チューニングを強化するための,新しいマルチエージェント協調フレームワークを提案する。
生成メモリを備えた複数の言語固有のインテリジェントエージェントコンポーネントが協調して、ある言語から別の言語に知識を効率よく伝達する。
多言語プログラミングベンチマークの実験結果は、共通知識を共有する上でQwen2.5-xCoderの優れた性能を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:46:38 GMT)
A Survey of In-Context Reinforcement Learning [41.7] 一部のエージェントは、追加のコンテキストを条件付けするだけで、パラメータを更新することなく、新しいタスクを解決できる。
本稿では,テキスト内強化学習(in-context reinforcement learning)として知られる,そのような行動に関する調査を行う。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:52:19 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8] 敵環境におけるジェネラリストWebエージェントのプライバシーリスクに関する最初の研究を行う。
まず,Webサイト上での攻撃に対する現実的な脅威モデルを提示し,ユーザ固有のPIIを盗むか,あるいはユーザ要求全体に対して,敵対的な2つのターゲットを検討する。
我々は、Mind2Webから様々なPIIカテゴリを含む177のアクションステップを収集し、これまでで最も有能なジェネラリストWebエージェントフレームワークの1つを使用して実験を行う。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:42:26 GMT)
OBI-Bench: Can LMMs Aid in Study of Ancient Script on Oracle Bones? [40.2] OBIベンチ(OBI-Bench, OBI-Bench, OBI-Bench)は,大口径マルチモーダルモデル(LMM)を全プロセスで評価するための総合的なベンチマークである。
OBI-Benchは、5,523個の細心の注意を払って収集された多様なソース画像を含み、認識、再結合、分類、検索、解読の5つの主要な領域問題をカバーする。
既存のベンチマークとは異なり、OBI-Benchは高度な視覚認識とOBI固有の知識による推論に焦点を当てており、専門家が直面しているようなタスクを実行するためにLMMに挑戦している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:59:40 GMT)
The Geometry of Prompting: Unveiling Distinct Mechanisms of Task Adaptation in Language Models [40.1] 本研究では,異なるプロンプト法が言語モデルにおける表現の幾何学に与える影響について検討する。
本分析では,文脈内学習における入力分布サンプルとラベル意味論の重要性を強調した。
我々の研究は、大規模言語モデルの理論的理解に寄与し、より効果的で表現を意識した促進戦略の開発の基礎となる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:09:50 GMT)
Multiview Point Cloud Registration Based on Minimum Potential Energy for Free-Form Blade Measurement [39.7] 本稿では,これらの問題に対処する最小ポテンシャルエネルギー(MPE)法に基づく,新たなグローバルな登録手法を提案する。
提案アルゴリズムは, 精度と耐雑音性の両方の観点から, 他の大域的手法よりも優れている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:30:14 GMT)
Disentangling critical quantum spin chains with Clifford circuits [39.6] スケーリング限界における共形場理論(CFT)によって記述された臨界スピン鎖におけるCAMPS法のパワーについて検討する。
最適化されたアンタングル変換は、基底状態におけるエンタングルメントエントロピーを著しく減少させる双対変換に対応する。
本研究は、隠れた双対性を発見し、臨界量子系の絡み合い構造を単純化するための汎用ツールとしてのフレームワークの可能性を強調した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:56:20 GMT)
Estimating LLM Uncertainty with Logits [39.1] 我々は,大規模言語モデルにおけるトークン固有の不確かさをリアルタイムで推定するために設計された新しいフレームワークであるLogU(Logits-Token Uncertainty)を紹介する。
実験の結果,LogUの有効性と妥当性が明らかとなり,モデル幻覚の課題に対処する上で大きな進展がみられた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:26:22 GMT)
Symbiotic Cooperation for Web Agents: Harnessing Complementary Strengths of Large and Small LLMs [38.9] 大規模言語モデル(LLM)を利用したWebブラウジングエージェントは、複雑なWebベースのタスクを自動化する大きな可能性を示している。
既存のアプローチは通常、Web環境を探索し、軌跡データを生成するために大きなLLMに依存している。
本稿では,データ合成とタスクパフォーマンスを結合した反復的フレームワークであるAgentSymbioticを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:41:49 GMT)
Principled Data Selection for Alignment: The Hidden Risks of Difficult Examples [38.8] 選好データは難易度が異なり、過度に難しい例が整列を妨げていることを示す。
Selective DPOを導入し、過度に難しい例をフィルタする。
この簡単な調整により、AlpacaEval 2ベンチマークでのアライメント性能は9-16%向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:01:11 GMT)
Exploring Iterative Manifold Constraint for Zero-shot Image Editing [38.7] 我々はZZEditと呼ばれる新しいゼロショット編集パラダイムを提案する。
より優れた編集ピボットとして$z_p$とマークされた適格な中間反転子を見つける。
我々のZZEditは、$M_p$と$M_p-1$の多様体間の反復多様体制約を実行し、忠実度誤差を少なくする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:26:43 GMT)
VSC-RL: Advancing Autonomous Vision-Language Agents with Variational Subgoal-Conditioned Reinforcement Learning [38.7] 本稿では,変分目標条件付きRL問題として,視覚言語による逐次意思決定タスクを再構成する変分サブゴール条件付きRL(VSC-RL)を提案する。
VSC-RLは、SOTAビジョン言語エージェントよりも優れ、優れた性能と学習効率の顕著な向上を実現している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:57:46 GMT)
Unsupervised Translation of Emergent Communication [38.6] 創発的コミュニケーション(EC)は、エージェントが共同で目標を達成できるように訓練されたときに自律的に現れる言語システムにユニークな窓を提供する。
ECを解釈し、自然言語(NL)との関係を評価するのは難しい。
本研究は,タスクの複雑度が異なる参照ゲーム中に生成されたECを解読するために,unsupervised neural machine translation (UNMT)技術を用いる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:41:06 GMT)
ZeroDiff: Solidified Visual-Semantic Correlation in Zero-Shot Learning [38.4] クラスサンプルの不足は、多くの生成的ゼロショット学習技術で顕著な性能低下をもたらす。
我々はZSLのための革新的な生成フレームワークであるZeroDiffを紹介した。
ZeroDiffは既存のZSLメソッドよりも大幅に改善されているだけでなく、トレーニングデータが少ない場合でも堅牢なパフォーマンスを維持している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:09:50 GMT)
Backdoor Mitigation by Distance-Driven Detoxification [38.3] バックドア攻撃は、攻撃者が有毒なトレーニングデータを使用して予測を操作できるようにすることで、機械学習モデルの完全性を損なう。
本稿では,事前学習モデルにおけるバックドアの解毒を目的とした,訓練後のバックドア防御作業について考察する。
本稿では,バックドアディフェンスを制約付き最適化問題として再定義する革新的なアプローチとして,距離駆動型デトックス化(D3)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:32:37 GMT)
RusCode: Russian Cultural Code Benchmark for Text-to-Image Generation [38.0] 本稿では,ロシア文化コードの要素を含むテキスト・画像生成の品質を評価するためのRusCodeベンチマークを提案する。
最後のデータセットは、ロシア語で1250のテキストプロンプトと、英語への翻訳で構成されています。
本稿では、一般的な生成モデルを用いて、ロシアの視覚概念表現を並べて比較した人間の評価結果を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:57:12 GMT)
Hidden Division of Labor in Scientific Teams Revealed Through 1.6 Million LaTeX Files [37.8] 我々は、著者固有のマクロを、160万の論文(1991-2023)から200万の科学者によって分析した。
明示的なセクション情報を用いて、科学チーム内の労働の隠れた区分を明らかにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:07:36 GMT)
Claim Verification in the Age of Large Language Models: A Survey [37.3] 本稿では,Large Language Models (LLMs) を用いた最近のクレーム検証フレームワークについて概説する。
これらのフレームワークで使用されるクレーム検証パイプラインのさまざまなコンポーネントを詳述する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:51:08 GMT)
Exploring Active Data Selection Strategies for Continuous Training in Deepfake Detection [36.6] 本研究では,ディープフェイク検出モデルの連続訓練に必要な少量の追加データを自動かつ積極的に選択する手法を提案する。
実験結果から,少量の追加データで連続的に学習したディープフェイク検出モデルが,元のトレーニングセットに自動的に選択・追加され,検出性能が大幅に向上したことがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:35:36 GMT)
Adaptive kernel predictors from feature-learning infinite limits of neural networks [36.0] 我々は、リッチで特徴学習可能な無限幅のニューラルネットワークについても、カーネルマシンによって記述されていることを示す。
カーネル予測器に明示的な表現を提供し、それらを数値的に計算する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:34:49 GMT)
Near, far: Patch-ordering enhances vision foundation models' scene understanding [35.8] NeCo: Patch Neighbor Consistencyは、学生と教師のモデル全体で、パッチレベルの隣り合う一貫性を強制します。
学習信号のブートストラップには,DINOv2-Registerなどの事前訓練された表現の上に適用した微分可能なソートを利用する。
この厳密な事前トレーニングは、単一のGPUで19時間しか必要とせず、さまざまなモデルやデータセットでパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:15:13 GMT)
CoCoA: A Generalized Approach to Uncertainty Quantification by Integrating Confidence and Consistency of LLM Outputs [35.7] 大規模言語モデル(LLM)のための不確実性定量化(UQ)手法は、様々なアプローチを含んでいる。
本稿では,モデル信頼度と出力整合性を新たに合成する方法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:32:15 GMT)
Revisiting the Auxiliary Data in Backdoor Purification [35.7] バックドア攻撃は、攻撃者がトレーニングフェーズ中に機械学習モデルを微妙に操作した場合に発生する。
このような脅威を和らげるためには、様々なバックドアの浄化技術によって被害者のモデルを浄化する戦略が一般的である。
本研究では,SOTAのバックドア浄化技術について,様々な種類の実世界の補助的データセットを用いて検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:46:35 GMT)
DPO Meets PPO: Reinforced Token Optimization for RLHF [35.6] 本稿では,トークンワイド報酬関数を選好データから学習し,この学習したトークンワイド報酬信号に基づいてポリシー最適化を行うアルゴリズムを提案する。
実験により、texttRTOはPPOや他の直接選好学習アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:23:13 GMT)
CoS: Chain-of-Shot Prompting for Long Video Understanding [35.4] Chain-of-Shot prompting (CoS)は、ショット選択をテスト時の視覚的プロンプト最適化としてフレーム化することを目的としており、ショットとタスクのアライメントを最適化することで、ビデオセマンティックタスクに適応したショットを選択する。
CoS は,(1) 擬似時間的グラウンドを行うバイナリビデオ要約機構,(2) タスク関連ショットを識別するバイナリコーディングの発見,(2) タスク関連ショットと無関係な負ショットとをペア(整列)に展開するビデオ共推論モジュール,の2つの重要な部分を有している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:59:25 GMT)
Spindle: Efficient Distributed Training of Multi-Task Large Models via Wavefront Scheduling [35.1] Spindleは、マルチタスク(MT)マルチモーダル(MM)モデルのウェーブフロントスケジューリングによるリソース効率のトレーニングに適した、新しいトレーニングシステムである。
実験では、スピンドルの性能と効率が向上し、スピードアップ比は最先端のトレーニングシステムと比較して最大71%向上した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:08:01 GMT)
Simulating electronic structure on bosonic quantum computers [34.8] 電子ハミルトニアンを、ボゾン量子デバイス上で解ける擬似ボゾン問題にマッピングする方法を提案する。
この研究は、多くのフェルミオン系をシミュレートする新しい経路を確立し、ハイブリッド量子ビット量子デバイスの可能性を強調する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:56:18 GMT)
Quantum State Tomography in a Third-Order Integrated Optical Parametric Oscillator [34.8] 我々は,2.3 pm 0.3)$dBの振幅差を観測し,オンチップ・スクイーズで$(4.9 pm 0.7)$dBと推定した。
振幅相関の劣化とポンプパワーの増加に対する状態純度は, 磁場の位相雑音の観測値と一致した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:38:53 GMT)
MLLM4PUE: Toward Universal Embeddings in Computational Pathology through Multimodal LLMs [34.5] 複数の下流タスクをサポートするユニバーサルなマルチモーダル埋め込みの必要性を強調した。
以前のアプローチでは、イメージとテキストを別々に扱うCLIPベースのモデルを微調整することが多い。
病的マルチモーダル埋め込みの質を評価するためのベンチマークであるPMEB(Pathology Multimodal Embedding Benchmark)を紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:28:55 GMT)
Overfitting Regimes of Nadaraya-Watson Interpolators [34.2] 古典的補間型Nadaraya-Watson(NW)推定器(Shepard法とも呼ばれる)を再検討する。
我々は、破滅から良心に至るまで、単調な非単調な複数の過剰な行動の存在を証明した。
結果は、古典的補間方法でさえ、複雑な一般化の振る舞いを示すことを強調している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:41:09 GMT)
AdParaphrase: Paraphrase Dataset for Analyzing Linguistic Features toward Generating Attractive Ad Texts [34.1] 本研究では,人間の嗜好に影響を及ぼす広告文の言語的特徴について考察する。
本稿では、広告テキストのペアに対する人間の好みを含むパラフレーズデータセットであるAdParaphraseを提案する。
分析の結果,人間の判断に好まれる広告文は,より流布度が高く,長さが長く,名詞が増え,ブラケット記号が用いられることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:36:24 GMT)
Sample Weight Averaging for Stable Prediction [34.0] アウト・オブ・ディストリビューションの一般化の課題は、機械学習アルゴリズムを危険に敏感な領域に応用するための基礎的な懸念を生じさせる。
本稿では,様々なサンプル再重み付けアルゴリズムに普遍的に統合し,分散および係数推定誤差を低減できる簡易かつ効率的な戦略であるSAmple Weight Averaging (zawa)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:51:22 GMT)
Faster Convergence with Less Communication: Broadcast-Based Subgraph Sampling for Decentralized Learning over Wireless Networks [33.7] $texttBASS$はD-SGDの収束を加速するために設計された放送ベースのサブグラフサンプリング手法である。
既存のリンクベースのスケジューリング手法と比較して,送信スロットが少ないため,$texttBASS$はより高速な収束を可能にする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:09:49 GMT)
STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving [33.6] セルフプレイ・セオレム・プロバー(STP)は、予想と証明という2つの役割を担っている。
STPは同時に、予想と証明という2つの役割を担っている。
私たちはLeanとIsabelleの2つの形式的検証ツールで評価します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:52:52 GMT)
Holistic Semantic Representation for Navigational Trajectory Generation [33.6] ナビゲーション生成のためのHOSER(Holistic Semantic Representation)フレームワークを開発した。
我々は,HOSERが最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:38:35 GMT)
KPIs 2024 Challenge: Advancing Glomerular Segmentation from Patch- to Slide-Level [33.5] 慢性腎臓病(CKD)は、人口の10%以上に影響を及ぼし、重大な死亡を引き起こす世界的な問題である。
Kidney Pathology Image (KPIs) Challengeは、腎臓病理解析の進歩を目的としている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:20:28 GMT)
EdgeGaussians -- 3D Edge Mapping via Gaussian Splatting [33.4] 最先端の画像ベースの手法は、3Dエッジポイントクラウドを学習し、3Dエッジを適合させる。
提案手法は,3次元エッジ点とそのエッジ方向を明示的に学習することにより,点サンプリングの必要性を回避できる。
以上の結果から,提案手法は最先端技術と同程度の精度と完成度を実現し,精度は桁違いに向上した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:46:32 GMT)
FlexSP: Accelerating Large Language Model Training via Flexible Sequence Parallelism [33.2] 既存のシーケンス並列化法は、均質なシーケンス長(すなわち全ての入力シーケンスの長さが等しい)を仮定し、従って全ての入力シーケンスに対して単一の静的散乱戦略を利用する。
LLMトレーニングコーパスの配列長は,長い尾分布の後に大きく変動することがわかった。
この問題に対処する不均一適応列並列化法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:31:03 GMT)
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.1] 言語モデル(LM)はプログラムを1回のパスで自動的に合成する。
コード合成のための高品質な命令データが不足している一方で、合成のための編集データが不足している。
我々はこのギャップを埋めるためにLintSeqと呼ばれる合成データ生成アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:47 GMT)
A PAC-Bayesian Link Between Generalisation and Flat Minima [33.0] 勾配項を含む新しい一般化境界を提供する。
最適化フェーズのメリットを直接考慮し,フラットミニマが一般化性能に与える影響を強調した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:04:24 GMT)
PRVQL: Progressive Knowledge-guided Refinement for Robust Egocentric Visual Query Localization [32.8] エゴセントリックなビジュアルクエリローカライゼーション(EgoVQL)は、空間と時間のターゲットを、一人称ビデオからローカライズすることに焦点を当てている。
EgoVQL用の新しいプログレッシブ知識誘導型リファインメントフレームワークであるPRVQLを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:04:31 GMT)
Intelligent Legal Assistant: An Interactive Clarification System for Legal Question Answering [32.7] 我々はIntelligent Legal Assistantと呼ばれる法的質問応答システムを開発した。
ユーザが質問を行うと、システムはユーザが地理的な場所を選択するように要求する。
そして、ユーザの最初の質問から欠落した重要な情報に基づいて、明確な質問とオプションを生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:19:08 GMT)
Fast and Accurate Antibody Sequence Design via Structure Retrieval [32.4] Igseekは、天然の抗体データベースから類似した構造によって配列を推論する新しい構造検索フレームワークである。
実験の結果,Igseekは構造検索において高い効率性を示すだけでなく,抗体およびT細胞受容体の配列回復における最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:29:49 GMT)
Vision-Language Models for Edge Networks: A Comprehensive Survey [32.1] Vision Large Language Models (VLM)は、視覚的理解と自然言語処理を組み合わせることで、画像キャプション、視覚的質問応答、ビデオ分析などのタスクを可能にする。
VLMは、自動運転車、スマート監視、ヘルスケアといった分野にまたがる印象的な機能を示している。
リソース制約のあるエッジデバイスへのデプロイメントは、処理能力、メモリ、エネルギー制限のため、依然として困難である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:04:43 GMT)
PLMTrajRec: A Scalable and Generalizable Trajectory Recovery Method with Pre-trained Language Models [32.0] PLMTrajRecと呼ばれる新しい軌道回復モデルを提案する。
事前訓練された言語モデル(PLM)のスケーラビリティを活用し、限られた密度のトラジェクトリでのみ微調整できる。
スパース軌道における異なるサンプリング間隔を扱うために,まず,各軌道のサンプリング間隔と移動特徴を自然言語表現に変換する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:28:10 GMT)
RomanLens: Latent Romanization and its role in Multilinguality in LLMs [31.9] 大言語モデル(LLM)は、英語中心のコーパスで主に訓練されているにもかかわらず、顕著な多言語一般化を示す。
非ラテン文字言語では、多言語処理におけるブリッジとしてのロマン化の役割について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:10:26 GMT)
Towards a quantum realization of the ampere using single-electron resolution Skipper-CCDs [31.9] 本稿では,単電子計数機能を持つセンサであるSkipper-CCDのコンセプト実証について述べる。
小型および大型の電子電荷パケットの操作において重要な機能を示す実験結果について報告する。
目的は、電子ベースの電流源を実現するためのSkipper-CCDの可能性を探ることである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:06:57 GMT)
mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition [31.8] マルチリンガル音声認識のためのmWhisper-Flamingoを提案する。
事前訓練されたオーディオモデル(Whisper)とビデオモデル(AV-HuBERT)の長所を組み合わせる。
オーディオヴィジュアルのmWhisper-Flamingoは、ノイズの多い条件下で、すべての言語でオーディオのみのWhisperを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:56:02 GMT)
Evaluating Small Language Models for News Summarization: Implications and Factors Influencing Performance [31.4] 小型言語モデル (SLM) は、大型言語モデル (LLM) の代替として、よりアクセスしやすいものを提供する。
本稿では,2000件のニュースサンプルを対象に,19件のSLMを包括的に評価した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:12:16 GMT)
Stay-Positive: A Case for Ignoring Real Image Features in Fake Image Detection [31.2] 生成モデルによって導入されたアーティファクトを含む場合に限り、画像は偽物として分類されるべきである。
本研究では,実データに関連付けられているものを無視しながら,検出対象を生成成果物に限定するアルゴリズムであるStay Positiveを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:10 GMT)
DAMA: Data- and Model-aware Alignment of Multi-modal LLMs [31.1] 本稿では,データとモデルを考慮したDPO(DAMA)を提案し,最適化プロセスを2つの重要な側面から調整する。
2つの戦略を組み合わせることで、DAMAはモデルが様々なレベルの硬さを持つデータに効果的に適応できるようにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:55:29 GMT)
Matrix3D: Large Photogrammetry Model All-in-One [31.0] Matrix3Dは、いくつかのフォトグラム化サブタスクを実行する統一モデルである。
これには、ポーズ推定、深さ予測、ビュー合成が含まれる。
マルチラウンドインタラクションによるきめ細かい制御を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:36:55 GMT)
Computing Efficiently in QLDPC Codes [30.7] 我々はCliffordグループを効率的にコンパイルできる新しいQLDPCコード群を紹介する。
我々は深度126論理回路の回路レベルシミュレーションを行い、QLDPC符号の論理演算がニアメモリ性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:27:55 GMT)
AiRacleX: Automated Detection of Price Oracle Manipulations via LLM-Driven Knowledge Mining and Prompt Generation [30.3] 分散金融アプリケーションは、安全な取引を確保するために正確な価格保証に依存している。
プライスオラクルは操作に非常に脆弱で、攻撃者はスマートコントラクトの脆弱性を悪用することができる。
本稿では,価格変動の検知を自動化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:40:13 GMT)
MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces [30.2] オープンエンド学習エージェントは、広大な可能性空間における目標を効率的に優先順位付けする必要がある。
従来のアプローチでは、広範なサンプリングを必要とするか、不安定な専門家定義の目標グループ化に依存している。
LLMエージェントがオンライン上で能力とLPを予測することを学習するメタ認知フレームワークであるMAGELLANを紹介した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:08:00 GMT)
Enhancing Financial Time-Series Forecasting with Retrieval-Augmented Large Language Models [29.8] 金融時系列予測に特化して設計された最初の検索拡張世代(RAG)フレームワークを提案する。
フレームワークには3つの重要なイノベーションが含まれている: 微調整された1B大言語モデル(StockLLM)をバックボーンとし、LSMフィードバックによって拡張された新しい候補選択方法と、クエリと歴史的に重要なシーケンスとの類似性を最大化するトレーニング目標である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:45:52 GMT)
Revisiting Benchmark and Assessment: An Agent-based Exploratory Dynamic Evaluation Framework for LLMs [29.7] 従来のQAベンチマークを、より柔軟な戦略基準のフォーマットに拡張するBenchmark+と、インタラクションプロセスを強化するAccess+という2つの主要な概念を紹介します。
検索強化生成と強化学習を用いてこれらの概念を実装するエージェントベースの評価フレームワークであるTestAgentを提案する。
TestAgentは、さまざまな垂直ドメインシナリオにわたる動的ベンチマークの自動生成と詳細な評価を可能にする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:03:51 GMT)
Private Low-Rank Approximation for Covariance Matrices, Dyson Brownian Motion, and Eigenvalue-Gap Bounds for Gaussian Perturbations [29.2] ガウス機構の複素変項を解析し、この機構によって出力される行列と最高のランク-k$近似との差のフロベニウスノルムの上界を求める。
ガウス雑音によって摂動される行列の固有値$M$は高い確率で大きなギャップを持つことを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:46:03 GMT)
Towards Zero-Shot Anomaly Detection and Reasoning with Multimodal Large Language Models [29.1] Zero-Shot Anomaly Detection (ZSAD)はADパラダイムである。
本稿では,ZSAD と推論のための視覚アシスタントである Anomaly-OneVision (Anomaly-OV) を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:50:43 GMT)
Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets [28.6] 効果的な予後モデルは、医師が正確な診断を行い、パーソナライズされた治療計画を設計するのを助けることができる。
限られたデータ収集、不十分な臨床経験、プライバシと倫理上の懸念は、データの可用性を制限します。
本稿では,ソースとターゲットデータセット間の遷移モデルを構築するドメイン不変表現学習手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:32:59 GMT)
O1 Embedder: Let Retrievers Think Before Action [28.6] 我々は,対象文書の検索に先立って,入力クエリに有用な思考を生成するO1 Embedderを提案する。
私たちのアプローチは、12の一般的なデータセットで大幅に改善される包括的な実験によって評価されます。
これらの結果は、O1 Embedderの顕著な精度と一般化性を強調し、次世代IR基盤モデルの開発への道を開いた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:48:10 GMT)
Bayesian Optimization for Building Social-Influence-Free Consensus [28.5] 集団意思決定におけるコンセンサス構築のための投票効率の高いアルゴリズムである社会ベイズ最適化(SBO)を紹介する。
SBOは、安価だが騒々しい世論投票と、より正確で高価な私的な投票という2つの投票システムを採用している。
本研究では, 熱的快適性, チーム構築, 旅行交渉, エネルギー取引協力など, 複数の実世界の応用におけるSBOの有効性を検証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:20:32 GMT)
Predicting Cellular Responses with Variational Causal Inference and Refined Relational Information [28.4] そこで本稿では,非現実的摂動下での細胞の遺伝子発現を予測するために,ベイズ因果推論フレームワークを提案する。
我々は、遺伝子制御ネットワークの形で生物学的知識を表す情報を活用して、個別化された細胞応答予測を支援する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:58:24 GMT)
Exploratory Diffusion Policy for Unsupervised Reinforcement Learning [28.4] 教師なし強化学習は、報酬のない環境で国家や技術を探究することで、エージェントを事前訓練することを目的としている。
既存の方法は、事前訓練されたポリシーの適合性を見落とし、不均一な事前訓練データを扱うのに苦労することが多い。
本研究では,拡散モデルの強い表現能力を利用して探索データに適合する探索拡散政策(EDP)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:48:51 GMT)
PoI: Pixel of Interest for Novel View Synthesis Assisted Scene Coordinate Regression [28.4] 提案手法は,下位の画素を除去しながら,高解像度画素を選択的に抽出する,新しいフィルタリング手法を提案する。
このフィルタは、トレーニング中にSCRモデルのリアルタイム再投射損失と勾配を同時に測定する。
このフィルタリング技術に基づいて,スパース入力を用いてシーン座標の回帰を改善する新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:48:23 GMT)
Pippo: High-Resolution Multi-View Humans from a Single Image [28.3] Pippoは、1つのクリックした写真から1K解像度の高精細なターンアラウンドビデオを生成できる生成モデルである。
ピッポは多視点拡散変換器であり、追加の入力を必要としない。
我々は,スタジオで捕獲された人間に対して,マルチビューのミッドトレーニングとポストトレーニングを実施している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:59 GMT)
Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models [28.2] AQUA-KVは、コンパクトアダプタに依存するキーバリューキャッシュの適応量子化である。
パープレキシティとLongBenchスコアの相対誤差を1%以下の値で2-2.5ビットで近似する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:45:12 GMT)
Isotonic Mechanism for Exponential Family Estimation in Machine Learning Peer Review [28.1] 2023年、ICML(International Conference on Machine Learning)は、複数の投稿者に対して、認識された品質に基づいて応募をランク付けするよう要求した。
我々は、これらの著者特定ランキングを用いて、機械学習および人工知能会議におけるピアレビューを強化する。
著者特定ランキングに固執しながら、原譜と密接に一致した調整されたスコアを生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:50:27 GMT)
MRAnnotator: multi-Anatomy and many-Sequence MRI segmentation of 44 structures [28.0] 対象は,マウント・シナイ・ヘルス・システム (Mount Sinai Health System) の843例のMRI1,518例の内的データセットと,ベンチマーク対象263例のMRI397例の外部的データセットである。
内部データセットはnnU-NetモデルMRAnnotatorをトレーニングし、外部データセットに強い一般化性を示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:23:09 GMT)
Generation of Drug-Induced Cardiac Reactions towards Virtual Clinical Trials [27.9] 物理的な臨床試験の一部を置き換えるために、シリコ内試験を使用することは、試験参加者に対する金銭的リスクと潜在的危害を軽減する効果的な方法であると考えられる。
既存の生成モデルは、ECG生成の進展を示すが、薬物反応のモデリングでは不十分である。
本稿では, 個別化薬物反応をシミュレーションし, 忠実度を保証できる薬物認識拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:50:33 GMT)
Speculate, then Collaborate: Fusing Knowledge of Language Models during Decoding [27.8] 大規模言語モデル(LLM)は、特定のドメインで優れていることが多いが、トレーニングの制限のため、他のドメインでは不足している。
テスト時にLLM知識を効率的に融合できる新しいコラボレーティブ・スペキュレイティブ・デコーディング(CoSD)アルゴリズムを提案する。
実験の結果,COSDは既存の手法と比較してベンチマークで最大10%精度が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:40:53 GMT)
Flow Matching for Collaborative Filtering [27.8] FlowCFは、協調フィルタリングのためのフローベースのレコメンデーションシステムである。
高速な推論速度で、さまざまなデータセット間で最先端のレコメンデーション精度を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:01:19 GMT)
Learnable Residual-based Latent Denoising in Semantic Communication [27.5] ASemComフレームワークはノイズの多いチャネル上でのロバストな画像伝送のために提案されている。
学習可能な遅延デノイザを受信機に組み込むことで、受信した信号を前処理してチャネルノイズを除去する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:29:32 GMT)
MIM: Multi-modal Content Interest Modeling Paradigm for User Behavior Modeling [27.3] マルチモーダルコンテンツ興味モデリングパラダイム(MIM)を提案する。
MIMは3つの主要なステージで構成されている。
CTRでは+14.14%、RPMでは+4.12%の大幅な増加を達成した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:55:02 GMT)
Economics of Sourcing Human Data [27.3] 大規模言語モデルの普及は、人間の生成したデータの質と整合性を脅かすと論じる。
既存のデータ収集システムは、本質的な人間のモチベーションを犠牲にして、スピード、スケール、効率を優先する。
コントリビュータの本質的なモチベーションに合わせて,データ収集システムを再考することを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:51:52 GMT)
Exploring Safety-Utility Trade-Offs in Personalized Language Models [26.8] 大規模言語モデル(LLM)はパーソナライズバイアスに悩まされており、ユーザのアイデンティティにパーソナライズされた場合のパフォーマンスに影響を及ぼす。
安全性と実用性という2つの軸に沿ってLLMの性能を評価することにより、パーソナライズバイアスを定量化する。
我々は、嗜好調整とプロンプトベースディフェンスを用いたパーソナライズバイアスを軽減するためのいくつかの戦略について議論する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:08:56 GMT)
Exploring Mobile Touch Interaction with Large Language Models [26.6] テキスト上で直接実行されるタッチジェスチャーを用いて,大規模言語モデルを制御することを提案する。
以上の結果から, LLMのタッチによる制御は, 実現可能かつユーザフレンドリであることがわかった。
この研究は、タッチデバイス上でのLDMとのジェスチャーによるインタラクションに関するさらなる研究の基盤となる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:17:00 GMT)
Semantic to Structure: Learning Structural Representations for Infringement Detection [26.6] 本稿では,この現象を「構造侵害」と定義し,それに対応する検出法を提案する。
本研究では,拡散モデルとLLMに基づく新しいデータ合成戦略を提案する。
実験により,本手法は構造的侵害の検出に成功し,アノテートテストセットの顕著な改善が得られた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:42:44 GMT)
Mask-Enhanced Autoregressive Prediction: Pay Less Attention to Learn More [26.2] Mask-Enhanced Autoregressive Prediction (MEAP)は、MLM(Masked Language Modeling)をNTP(Next-Token Prediction)にシームレスに統合する訓練パラダイムである。
集中的な実験では、MEAPはキー情報検索と長文推論タスクにおいてNTPを大幅に上回っている。
分析の結果,MEAPの有効性は,非マスキングトークンの少ないセットに集中することにより,より目立たしい注意点の獲得に寄与することが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:49:03 GMT)
Theoretical Proof that Generated Text in the Corpus Leads to the Collapse of Auto-regressive Language Models [26.1] 本稿では,コーパス(World Wide Webなど)が生成したテキストを組み込むと,LM崩壊が発生するという理論的証拠を示す。
我々は, LMトレーニングにおいて, 生成テキストの量が増加している現状について, 懸念を表明する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:25:11 GMT)
Imit Diff: Semantics Guided Diffusion Transformer with Dual Resolution Fusion for Imitation Learning [26.0] 擬似学習のための二分解能融合型セマンティック誘導拡散変圧器Imit Diffを紹介する。
提案手法では,視覚言語基礎モデルからの事前知識を活用して,高レベルの意味的命令をピクセルレベルの視覚的ローカライゼーションに変換する。
本稿では, エージェント制御におけるリアルタイム性能と動作のスムーズさを改善するために, 拡散トランスフォーマーアーキテクチャにおける一貫性ポリシーの実装を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:03:57 GMT)
Understanding the Generalization Error of Markov algorithms through Poissonization [25.9] マルコフアルゴリズムの一般化誤差を解析するための汎用フレームワークを提案する。
我々はまず、PAC-ベイジアン一般化境界に直結する新しいエントロピーフローを開発する。
そして、祝賀された対数的ソボレフ不等式(LSI)の修正版への新しいリンクを描く。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:31:32 GMT)
LASP-2: Rethinking Sequence Parallelism for Linear Attention and Its Hybrid [25.7] 線形アテンションのような線形シーケンスモデリングアプローチは、線形時間トレーニングやシーケンス長に対する定数メモリ推論のような利点を提供する。
既存のシーケンス並列性(SP)法は、線形注意の右積第一の特徴に最適化されていないか、リングスタイルの通信戦略を用いていない。
線形アテンショントランスモデルの訓練において,通信と計算の並列性を両立させる新しいSP手法であるLASP-2を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:01:39 GMT)
MEMIT-Merge: Addressing MEMIT's Key-Value Conflicts in Same-Subject Batch Editing for LLMs [25.7] 同一主題を共有する複数の編集を含むバッチ処理において,MEMITの編集効率は著しく低下することを示した。
我々の分析によると、根本原因はMEMITのキーバリューモデリングフレームワークにある。
我々は、同じ主題を共有する事実に対して、価値プロセスをマージする強化されたアプローチであるMEMIT-Mergeを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:42:09 GMT)
MeMo: Meaningful, Modular Controllers via Noise Injection [25.5] 新たなロボットが同じパーツから構築された場合,モジュール型コントローラを再利用することで,その制御を迅速に学習できることが示される。
私たちはMeMoと呼ばれるフレームワークでこれを実現し、Meは(Me)有界で(Mo)有界なコントローラーを学習します。
我々は,ロボット形態変化の簡易化を目標として,移動環境と把握環境の枠組みをベンチマークした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:27:59 GMT)
AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems [25.2] 強化学習(Reinforcement Learning, RL)は、レコメンデーションシステムにおけるユーザ保持の最適化能力に注目が集まっている。
本稿では,この課題に対処するため,textbfAdaptive textbfUser textbfRetention textbfOptimization (AURO) という新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:07:15 GMT)
EfficientLLM: Scalable Pruning-Aware Pretraining for Architecture-Agnostic Edge Language Models [25.1] 大規模言語モデル(LLM)は法則のスケーリングによって駆動され、大規模なモデルサイズでインテリジェンス緊急を達成する。
本研究は、より大規模な最適化モデルの性能を維持することに焦点を当てたプルーニング対応事前学習を提案する。
我々は,LLM圧縮のスケールアップと境界の拡張により,高品質なエッジ言語モデルであるEfficientLLMを実現することを明らかにした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:01:39 GMT)
Automated Road Extraction and Centreline Fitting in LiDAR Point Clouds [25.1] 3次元点雲からの道路情報抽出は都市計画や交通管理に有用である。
既存の方法は、しばしば局所的な特徴とカーブからのレーザーの屈折角に依存している。
本稿では,LiDARをベースとした地中点雲のトップダウンビューを用いて,道路点の抽出と中心点の嵌合を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:45:52 GMT)
FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM [25.0] FlexiCrackNetは、従来のディープラーニングパラダイムを大規模な事前学習モデルの強みとシームレスに統合する、新しいパイプラインである。
実験の結果、FlexiCrackNetは最先端の手法より優れ、ゼロショットの一般化、計算効率、セグメンテーションの堅牢性に優れていた。
これらの進歩は、自動クラック検出と包括的な構造的健康モニタリングシステムにおける現実的な応用のためのFlexiCrackNetの可能性を強調している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:27:23 GMT)
Improved YOLOv7 model for insulator defect detection [24.8] 本稿では,多型絶縁体欠陥検出のための改良型YOLOv7モデルを提案する。
提案したモデルでは,さまざまなパフォーマンス指標が拡張されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:09:30 GMT)
RALLRec: Improving Retrieval Augmented Large Language Model Recommendation with Representation Learning [24.3] 大規模言語モデル (LLM) は、ユーザの振る舞いを理解するためのレコメンデーションシステムに統合されている。
既存のRAGメソッドは主にテキストのセマンティクスに依存しており、しばしば最も関連性の高い項目を組み込むことができない。
検索強化大言語モデル推薦(RALLRec)のための表現学習を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:53:00 GMT)
BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis [24.1] 本稿では,テクスチャ化された幾何学的プリミティブに基づく3次元シーン表現のための新しい手法として,BBSplat(Billboard Splatting)を提案する。
BBSplatはこのシーンを、学習可能なRGBテクスチャと、その形状を制御するアルファマップを備えた、最適化可能なテクスチャ化された平面プリミティブのセットとして表現している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:38:48 GMT)
Avoiding Copyright Infringement via Large Language Model Unlearning [24.1] 本稿では,複数段階にわたる大規模言語モデルから著作権付きコンテンツを解放するための新しいフレームワークを提案する。
ランダムなラベリング損失を導入し、モデルの汎用的知識を確実に維持することにより、未学習の有効性を向上させる。
実験結果から,SSUは未学習の有効性と汎用言語能力とのトレードオフを効果的に達成できることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:46:13 GMT)
Language Models Largely Exhibit Human-like Constituent Ordering Preferences [23.7] 我々は,大規模言語モデルと多様な特性を比較し,構成運動の性能を評価する。
粒子移動に関する予期せぬ行動にもかかわらず、LLMは概して構成順序に関する人間の嗜好と一致している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:02:57 GMT)
Scaling Pre-training to One Hundred Billion Data for Vision Language Models [23.4] これまでにない規模の視覚言語モデルの事前学習の可能性について検討する。
モデルの性能は、多くの西洋中心の分類と検索のベンチマークにおいて、この規模で飽和する傾向にある。
文化的多様性の課題は、長い尾のコンセプトをカバーしているため、100億のスケールのWebデータから大幅に向上した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:05:33 GMT)
MoHAVE: Mixture of Hierarchical Audio-Visual Experts for Robust Speech Recognition [23.4] MoHAVE(Mixture of Hierarchical Audio-Visual Experts)は、スケーラビリティの制約に対処するために設計された、新しい堅牢なAVSRフレームワークである。
MoHAVEは、モダリティ固有の専門家グループを活性化し、計算オーバーヘッドを最小限にした様々なオーディオ視覚入力への動的適応を保証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:01:05 GMT)
Action-Free Reasoning for Policy Generalization [23.3] RAD(Action-free Data)による推論は、ロボットのデモデータとアクションフリーのビデオデータの両方から学習する。
RADはエボディメントギャップを越えて効果的な移動を可能にし、ロボットはアクションフリーのデータでしか見えないタスクを実行できる。
我々は、Bridge V2ベンチマークと互換性のある推論アノテーションを備えた、3,377人の人手によるデモの新しいデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:51:45 GMT)
Enhancing Security and Privacy in Federated Learning using Low-Dimensional Update Representation and Proximity-Based Defense [23.3] Federated Learning(FL)は、データ所有者がデータをローカライズしながらモデルを協調的にトレーニングできる、有望な機械学習パラダイムである。
その可能性にもかかわらず、FLはクライアントとサーバの両方の信頼性に関する課題に直面している。
我々は,分散学習環境におけるビザンチン攻撃に対するプライバシー保護と抵抗に対処するために,FLURPという新しいフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:00:39 GMT)
Language-TPP: Integrating Temporal Point Processes with Language Models for Event Analysis [23.3] テンポラルポイントプロセス(TPP)は、イベントシーケンスモデリングに広く用いられているが、リッチテキストのイベント記述を効果的に組み込むのに苦労することが多い。
本稿では,TPPをLLM(Large Language Models)と統合した統合フレームワークであるLanguage-TPPを紹介した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:09:45 GMT)
Captured by Captions: On Memorization and its Mitigation in CLIP Models [23.0] 本稿では,CLIPにおける記憶の形式的定義を提案し,それをCLIPモデルにおける記憶の定量化に利用する。
以上の結果から,CLIPの記憶行動は,指導的パラダイムと自己監督的パラダイムの中間に位置することが示唆された。
テキストエンコーダは画像エンコーダよりも暗記に寄与しており、緩和戦略はテキスト領域に焦点を当てるべきである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:11:13 GMT)
Semi-Supervised Vision-Centric 3D Occupancy World Model for Autonomous Driving [22.8] 2Dラベルの可能性を生かした半教師付き視覚中心型3D占有型世界モデルPreWorldを提案する。
PreWorldは、3D占有率予測、4D占有率予測、モーションプランニングタスクの競合的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:12:26 GMT)
JBShield: Defending Large Language Models from Jailbreak Attacks through Activated Concept Analysis and Manipulation [22.8] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に弱いままである。
本稿では,JBShield-DとJBShield-Mの2つの主要コンポーネントからなる総合的ジェイルブレイク防御フレームワークJBShieldを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:50:50 GMT)
A Memory Efficient Randomized Subspace Optimization Method for Training Large Language Models [22.7] 本稿では,事前学習および微調整を行う大規模言語モデルのためのランダム化部分空間最適化フレームワークを提案する。
提案手法は,高次元学習問題を一連の低次元サブプロブレムに分解する。
この構造的次元減少により,アクティベーションと状態の両方のメモリ使用量を同時に削減できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:32:10 GMT)
Understanding Classifier-Free Guidance: High-Dimensional Theory and Non-Linear Generalizations [22.4] 条件自由誘導は, 無限かつ十分に高次元の文脈において, 対象分布を効果的に再現することを示す。
また、オーバーシュートと分散還元を正確に特徴付ける有限次元効果についても検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:29:29 GMT)
Enhancing dissipative cat qubit protection by squeezing [22.4] キャット量子ビットは、量子エラー訂正が組み込まれているため、量子プロセッサにとって有望なアーキテクチャである。
通常の猫に比べて160倍のビットフリップ時間の改善が見られた。
また、Z$-gate不忠実度を2倍に下げることを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:01:05 GMT)
TransMLA: Multi-head Latent Attention Is All You Need [22.4] マルチヘッド遅延注意(MLA)は、キーバリュー層で低ランク行列を使用することによって、この問題に対処する。
我々は、同じKVキャッシュのオーバーヘッドを維持しながら、GQAを常にMLAで表現できることを示すが、その逆は保たない。
我々は、広く使われているGQAベースの事前学習モデルをMLAベースのモデルに変換するポストトレーニング法**TransMLA*を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:20:18 GMT)
We Can't Understand AI Using our Existing Vocabulary [22.4] AIを理解するためには、人間の言葉の既存の語彙を頼りにすることはできない、と私たちは主張する。
私たちは、機械に教えたい人間の概念を正確に表現する新しい言葉、ネオロジズムを開発することに努めるべきです。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:34:05 GMT)
Calibrating LLMs with Information-Theoretic Evidential Deep Learning [22.3] 微調整された大きな言語モデル(LLM)は、特に小さなデータセットでトレーニングされた場合、自信過剰を示すことが多い。
Evidential Deep Learning (EDL)は、不確実性を認識したアプローチであり、単一の前方通過における不確実性推定を可能にする。
情報ボトルネック(IB)を組み込んだEDLの正規化を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:06:40 GMT)
Aligning Multiple Knowledge Graphs in a Single Pass [22.2] 複数の知識グラフの整合性を解決するために,MultiEAという効果的なフレームワークを提案する。
特に,アライメント性能を向上させるために,革新的な推論拡張手法を提案する。
その結果,MultiEAは1回のパスで複数のKGを効果的かつ効率的にアライメントできることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:32:30 GMT)
Quest: Query-centric Data Synthesis Approach for Long-context Scaling of Large Language Model [22.1] Questはクエリ中心のデータメソッドで、セマンティックに関連があるが多様なドキュメントを集約する。
生成モデルを使用して、ドキュメント毎の潜在的なクエリを予測し、同様のクエリとキーワードでドキュメントをグループ化する。
実験では、Questの長文タスクにおける優れたパフォーマンスを示し、最大100万トークンのコンテキスト長で顕著な結果が得られる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:22:30 GMT)
xPatch: Dual-Stream Time Series Forecasting with Exponential Seasonal-Trend Decomposition [21.9] 指数関数分解を利用した新しいデュアルストリームアーキテクチャを開発した。
本研究では,頑健なアークタンジエント損失関数とシグモイド学習率調整スキームを開発し,予測性能の過度化と向上を防止した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:49:47 GMT)
EvoFlow: Evolving Diverse Agentic Workflows On The Fly [21.8] EvoFlowは、複雑で異質なエージェントの集団を自動的に検索する、ニッチな進化アルゴリズムベースのフレームワークである。
EvoFlowは、単純なI/Oタスクから複雑なマルチターンインタラクションまで、多くの個体群を進化させることができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:48:46 GMT)
Mock Deep Testing: Toward Separate Development of Data and Models for Deep Learning [21.6] 本研究では,ディープラーニングアプリケーションの単体テストのためのモックディープテスト手法を紹介する。
単体テストを可能にするために、ワークフローを独立した管理可能なコンポーネントに分解する設計パラダイムを導入します。
Kerasライブラリのモックディープテストを可能にするフレームワークであるKUnitを開発しました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:11:11 GMT)
Initialization Matters: Unraveling the Impact of Pre-Training on Federated Learning [21.4] 事前訓練されたモデルの初期化は、機械学習の標準的なプラクティスになりつつある。
我々は,2層畳み込みニューラルネットワーク(CNN)のクラスについて検討し,FedAvgでトレーニングしたネットワークのトレーニングエラー収束とテストエラーのバウンダリを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:53:16 GMT)
PSformer: Parameter-efficient Transformer with Segment Attention for Time Series Forecasting [21.0] 時間予測は、高次元のデータと長期の依存関係によってしばしば複雑になる、さまざまな領域において重要な課題である。
本稿では,パラメータ共有(PS)と空間時間注意(SegAtt)という,時系列予測のための新しいトランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:50:04 GMT)
VideoQA-SC: Adaptive Semantic Communication for Video Question Answering [21.0] 本稿では,ビデオ質問応答タスクのためのエンドツーエンドSCシステムであるVideoQA-SCを提案する。
我々のゴールは、ノイズや失速する無線チャンネル上のビデオセマンティクスに基づいて、ビデオQAタスクを直接実行することである。
この結果から,ビデオアプリケーションにおけるSCシステム設計の可能性が示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:31:10 GMT)
GRAPHMOE: Amplifying Cognitive Depth of Mixture-of-Experts Network via Introducing Self-Rethinking Mechanism [20.8] GraphMOE は Pseudo GraphMoE ネットワーク上に構築された自己再考機構により,言語モデルの認知深度を増大させる新しい手法である。
ローランド適応技術(LoRA)を用いて GraphMOE アーキテクチャを実装し,様々なベンチマークデータセットに対して広範な実験を行う。
実験の結果, GraphMOEは他のLoRAモデルよりも優れ,SOTA(State-of-the-art)性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:47:01 GMT)
The Role of Randomness in Stability [20.7] 学習における安定性という2つの重要な概念,すなわち複製可能性と差分プライバシーのランダム性複雑性について検討する。
安定に対する弱強強化定理(英語版)を証明し、タスクのランダム性複雑性は最適な複製確率によって厳しく制御される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:06:43 GMT)
LUNAR: LLM Unlearning via Neural Activation Redirection [20.6] 大規模言語モデル(LLM)は、はるかに大量のテキストデータのトレーニングの恩恵を受けるが、個人情報を漏洩するリスクはますます高まっている。
線形表現仮説に基づく新しいアンラーニング手法であるLUNARを提案する。
我々は,LUNARが,推論中の未学習モデルの制御性を著しく向上しつつ,最先端の未学習性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:23:22 GMT)
Unveiling Simplicities of Attention: Adaptive Long-Context Head Identification [20.5] クエリによっては,局所的情報と長文的情報の間に注目の頭が揺れることが分かる。
ローカルキーのみを用いて、長文処理においてどのヘッドが重要かを予測することが可能であることを実証した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:04:32 GMT)
Are KANs Effective for Multivariate Time Series Forecasting? [20.5] Kolmogorov-Arnold Network (KAN) は、不適切な解釈可能性の問題を解決するための新しい視点を提供する。
本稿では,性能,積分性,効率,解釈性の観点から,時系列予測におけるkanの有効性を評価することを目的とする。
我々は,KANをシンボル関数の組み合わせに変換する能力を維持しつつ,優れた性能を実現する多層混合KANネットワーク(MMK)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:38:57 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非線形プログラム(MINLP)は、エネルギーシステムや輸送といった様々な領域で発生する。
MINLPは特に大規模な解決が難しいことで知られている。
本稿では,解の積分性を保証するための2つの学習可能な補正層と,解の実現性を改善するための後処理ステップを備えた新しいディープラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:59:51 GMT)
Personalized Negative Reservoir for Incremental Learning in Recommender Systems [20.3] 商用環境では、一度レコメンデーションシステムモデルがトレーニングされ、デプロイされると、新しいクライアントデータが到着すると頻繁に更新する必要があります。
新しいデータのみを微調整することは、破滅的な忘れ方という、よく文書化された問題に陥る。
本稿では,グラフベースのレコメンデーションシステムにおいて,標準的なトリプルト損失に対する負のサンプルを得るために,パーソナライズされた負の貯水池戦略を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:10:32 GMT)
Learning Source Disentanglement in Neural Audio Codec [20.3] 我々は、音源符号化と音源分離を組み合わせた新しいアプローチである、ソース分散ニューラルオーディオコーデック(SD-Codec)を紹介する。
SD-Codecは、音声の合成と分離を共同で学習することで、異なるドメインからの音声信号を異なるコードブック(離散表現の集合)に明示的に割り当てる。
実験結果から,SD-Codecは競合的再合成品質を維持するだけでなく,分離結果に支えられ,潜伏空間における異なるソースの絡み合いが成功したことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:35:04 GMT)
Can LLMs Learn Macroeconomic Narratives from Social Media? [20.1] X(旧Twitter)からの投稿を含む2つのキュレートされたデータセットを導入し、経済に関する物語を捉えた。
自然言語処理(NLP)手法を用いて,ツイートから物語を抽出し,要約する。
我々は、下流の財務予測タスクにツイートを組み込んだ$textitmacroeconomic$予測や、抽出したナラティブの表現を組み込むことで、彼らの予測能力をテストする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:22:35 GMT)
Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference [20.1] 我々は命題Hhorn論理の推論としてルール追従を定式化する。
我々は、小さなトランスフォーマーはそのようなルールを忠実に守ることができるが、悪意のあるプロンプトは、データから学んだ理論的構成とモデルの両方を誤解させる可能性があることを証明している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:08:08 GMT)
Large Memory Network for Recommendation [20.0] Large Memory Network (LMN) は、ユーザ履歴の振る舞い情報を大規模メモリブロックに圧縮保存する新しいアイデアである。
LMNはDouyin E-Commerce Search (ECS)に完全にデプロイされており、毎日数百万のユーザにサービスを提供している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:36:07 GMT)
PerCul: A Story-Driven Cultural Evaluation of LLMs in Persian [19.8] PerCulは、ペルシャ文化に対するLLMの感受性を評価するために設計されたデータセットである。
PerCulは、文化的に曖昧なシナリオをキャプチャするストーリーベースの、複数選択の質問を特徴とする。
我々は、最先端の多言語およびペルシア語固有のLLMを評価した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:07:44 GMT)
Neural Flow Samplers with Shortcut Models [19.8] 流れに基づくサンプルは連続性方程式を満たす速度場を学習してサンプルを生成する。
重要サンプリングは近似を提供するが、高い分散に悩まされる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:55:41 GMT)
Mediator: Memory-efficient LLM Merging with Less Parameter Conflicts and Uncertainty Based Routing [19.7] モデルマージ集約 さまざまなタスクに微調整された大きな言語モデルから、より強力なものへ。
本研究では,異なる層がパラメータ衝突のレベルが異なることを観察する。
この洞察に基づいて構築され、大きな矛盾のあるレイヤに対して、新しいタスクレベルのエキスパートルーティングを使用します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:09:51 GMT)
PlaySlot: Learning Inverse Latent Dynamics for Controllable Object-Centric Video Prediction and Planning [19.7] PlaySlotはオブジェクト中心のビデオ予測モデルであり、未ラベルのビデオシーケンスからオブジェクト表現と潜在アクションを推論する。
PlaySlotは、ビデオのダイナミックスから推測できる潜在アクションで条件付けられた複数の可能な先物を生成することができる。
その結果,PlaySlotは,異なる環境における映像予測において,オブジェクト中心のベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:50:10 GMT)
Digital Twin Buildings: 3D Modeling, GIS Integration, and Visual Descriptions Using Gaussian Splatting, ChatGPT/Deepseek, and Google Maps Platform [19.6] 都市デジタルツイン(Urban Digital twins)は、マルチソースデータとデータ分析を使用して都市計画、インフラ管理、意思決定を最適化する都市の仮想レプリカである。
当社のフレームワークは,ビルの3次元モデルと視覚的記述を検索し,大規模言語モデルに基づくデータ分析とクラウドベースのマッピング統合を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:32:10 GMT)
Elevating Legal LLM Responses: Harnessing Trainable Logical Structures and Semantic Knowledge with Legal Reasoning [19.5] 意味と論理的コヒーレンスを橋渡しする教師ありフレームワークである論理・意味統合モデル(LSIM)を提案する。
LSIMは3つの要素から構成される: 強化学習は各質問に対して構造化されたファクトルールチェーンを予測し、訓練可能なDeep Structured Semantic Model(DSSM)は最も関連性の高い質問を検索し、回答内学習は最終回答を生成する。
LSIMが従来の手法に比べて精度と信頼性を著しく向上させるような,自動測定と人的評価デーモンレートによる実世界の法的データセットのQA検証実験を行った。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:33:07 GMT)
Towards Single-Lens Controllable Depth-of-Field Imaging via Depth-Aware Point Spread Functions [19.3] コントロール可能なDepth-of-Field(DoF)イメージングは、重くて高価なハイエンドレンズをベースとした素晴らしい視覚効果を一般的に生み出す。
この研究は、MOS(Minimalist Optical Systems)の2つの大きな限界に焦点を合わせ、計算方法でシングルレンズ制御可能なDoFイメージングを実現する。
All-in-Focus (AiF) 収差補正と単眼深度推定を併用したDepth-aware Controllable DoF Imaging (DCDI) フレームワークを提案する。
Omni-Lens-Fieldにより推定される深度マップ、復元画像、深度対応PSFマップにより、シングルレンズ制御可能なDoFイメージングが可能となる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:06:13 GMT)
MGPATH: Vision-Language Model with Multi-Granular Prompt Learning for Few-Shot WSI Classification [19.3] 全スライド画像分類は、ギガピクセル画像サイズと限定アノテーションラベルによる課題を提示する。
本稿では,数ショットの病理分類に大規模な視覚言語モデルを適用するための素早い学習手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:42:13 GMT)
Adaptive Domain Scaling for Personalized Sequential Modeling in Recommenders [19.2] 本稿では、ターゲット・アウェア・シーケンス・モデリングにおけるパーソナライズ機能を包括的に強化するAdaptive Domain Scaling(ADS)モデルを提案する。
ADSは、パーソナライズされた配列表現生成(PSRG)とパーソナライズされた候補表現生成(PCRG)の2つの主要モジュールから構成される。
パブリックデータセットと20億規模の産業データセットの両方で実験を行い、大規模な結果により、ADSの高効率性と互換性が検証された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:21:41 GMT)
Foreign-Object Detection in High-Voltage Transmission Line Based on Improved YOLOv8m [19.1] 本稿では,伝送路上の異物検出のための改良型YOLOv8mモデルを提案する。
Yunnan Power Gridから収集したデータセット上で実験を行う。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:58:32 GMT)
UVGS: Reimagining Unstructured 3D Gaussian Splatting using UV Mapping [19.0] 3D Gaussian Splatting (3DGS)は3Dオブジェクトやシーンのモデリングにおいて優れた品質を示している。
しかし、3DGSの生成は、その離散的、非構造的、置換不変の性質のため、依然として困難である。
球面マッピングを用いて3DGSをUVGSと呼ばれる構造化された2次元表現に変換する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:44:48 GMT)
Learning Inverse Laplacian Pyramid for Progressive Depth Completion [19.0] LP-Netは、ラプラシアンピラミッド分解に基づくマルチスケールでプログレッシブな予測パラダイムを実装する革新的なフレームワークである。
提出時点では、LP-Netは公式のKITTIリーダーボードで全ての査読された方法の中で第1位である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:21:42 GMT)
Process Reward Model with Q-Value Rankings [18.9] プロセス・リワード・モデリング(PRM)は複雑な推論と意思決定に不可欠である。
本稿では,マルコフ決定プロセスの文脈でPRMを再定義する新しいフレームワークであるProcess Q-value Model(PQM)を紹介する。
PQMは、新しい比較損失関数に基づいてQ値ランキングを最適化し、シーケンシャルな決定の中で複雑なダイナミクスをキャプチャするモデルの能力を向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:41:41 GMT)
Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations [18.9] 我々は最近のプライバシー保護システムを活用して、400万件以上のClaude.ai会話を分析します。
我々の分析によると、AIの利用は主にソフトウェア開発とタスクを書くことに集中している。
また、AIがタスクにどのように使われているかを分析し、使用量の57%が人間の能力の増強を示唆している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:46:43 GMT)
Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement [18.7] Vevoは、コントロール可能な音色とスタイルを備えた汎用的なゼロショット音声模倣フレームワークである。
音声のコンテンツとコンテンツスタイルのトークンを得るために,完全自己教師型アプローチを設計する。
Vevoはアクセントと感情の変換タスクで既存のメソッドにマッチするか、超える。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:18:33 GMT)
The establishment of static digital humans and the integration with spinal models [18.4] 思春期特発性強皮症(AIS)は、個人の健康と生活の質に大きな影響を及ぼす。
従来の撮像技術は脊椎の静的な視界を提供する。
動的デジタルヒューマンモデリングは、デジタル医療の大きなブレークスルーである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:21:37 GMT)
Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors [18.4] 3D Gaussian Splatting (3DGS)は、高速なトレーニングとレンダリング速度で優れたレンダリング品質を実現している。
しかし、その最適化プロセスには明示的な幾何的制約が欠如しており、観察的な入力ビューの少ない領域で最適でない幾何的再構成をもたらす。
本稿では,ガウス放射場の精度を高めるために,事前学習した幾何学的知識を活用したフロー蒸留サンプリング(FDS)を紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:05:26 GMT)
MatSwap: Light-aware material transfers in images [18.4] MatSwap(マットスワップ)は、画像内の指定された表面に物質を移す方法である。
我々は、露光紫外線マッピングを必要とせずに、入力材料とシーン内の外観の関係を学習する。
本手法では,シーンの同一性を保ちながら,所望の素材を写真中のターゲット位置にシームレスに統合する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:59 GMT)
Emotional EEG Classification using Upscaled Connectivity Matrices [18.3] ローカルパターンを強化するために,接続行列をスケールアップするアイデアを提案し,検証する。
実験により、この単純なアイデアは分類性能を著しく向上させることができることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:56:19 GMT)
Crime Forecasting: A Spatio-temporal Analysis with Deep Learning Models [18.1] ディープラーニングモデルは、特定の日における都市分割犯罪数を予測する。
我々は、犯罪数予測をシーケンスチャレンジとして定式化し、入力データと予測ターゲットの両方を保存する。
本稿では,CNN(Conalvolution Networks)とLSTM(Long-Term Memory)ネットワークを組み合わせた新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:16:59 GMT)
Enhancing Physics-Informed Neural Networks Through Feature Engineering [18.1] 本稿では,単層アダプティブ・フィーチャー・エンジニアリング・ネットワークであるSAFE-NETを紹介する。
基準となる特徴工学手法よりもはるかに少ないパラメータで、マグニチュードオーダーの低いエラーを実現する。
数値計算の結果,SAFE-NETはより高速に収束し,より深いネットワークや複雑なネットワークよりも優れていた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:07:28 GMT)
DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation [17.9] テキスト駆動3D編集作業において, スコア蒸留サンプリング(SDS)が有効なフレームワークとして登場した。
しかし、既存のSDSベースの3D編集手法では、長いトレーニング時間に悩まされ、低品質な結果が得られる。
我々は,これらのサンプリングダイナミクスをSDSフレームワークで検討する新しいフレームワークであるDreamCatalystを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:34:37 GMT)
Does Training on Synthetic Data Make Models Less Robust? [17.7] 我々はLlama-2-7B-hfモデルを用いて自然言語推論(NLI)タスクのシミュレーション実験を行った。
以上の結果から,人工的なデータは期待通りに盲点を補強するものではないことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:03:33 GMT)
Riemannian Proximal Sampler for High-accuracy Sampling on Manifolds [17.7] このサンプリング器の性能は、2つの鍵オラクルに依存している。
我々は、$varepsilon$-accuracyでサンプルを生成するには、Kullback-Leiblerの発散に$O(log(1/varepsilon)$イテレーションが必要であることを示す。
提案手法の有効性を示す予備的な数値結果を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:08:47 GMT)
Swan and ArabicMTEB: Dialect-Aware, Arabic-Centric, Cross-Lingual, and Cross-Cultural Embedding Models and Benchmarks [17.6] スワン(Swan)は、アラビア語を中心にした埋め込みモデルのファミリーである。
2つの変種: Swan-SmallはArBERTv2をベースとしており、Swan-Largeはアラビア語で事前訓練された大言語モデルであるArMistralをベースとしている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:36:41 GMT)
Getting Trapped in Amazon's "Iliad Flow": A Foundation for the Temporal Analysis of Dark Patterns [17.6] 本稿では,Amazon Primeの"Iliad Flow"を事例として,ユーザジャーニーにおけるダークパターンの相互作用を説明する。
我々はこのケーススタディを用いて、時間的暗黒パターン分析(TADP)の方法論の基礎を定めている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:13:26 GMT)
Near-Optimal Sample Complexity in Reward-Free Kernel-Based Reinforcement Learning [17.5] カーネルベースのRLにおける準最適ポリシーの設計には,どの程度のサンプルが必要なのかを問う。
既存の作業は、カーネル関数のクラスに関する制限的な仮定の下でこの問題に対処する。
我々は、カーネルの幅広いクラスとより単純なアルゴリズムを用いて、この根本的な問題に取り組む。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:15:55 GMT)
From Hazard Identification to Controller Design: Proactive and LLM-Supported Safety Engineering for ML-Powered Systems [17.5] 機械学習(ML)コンポーネントはますますソフトウェア製品に統合されている。
これらのリスクにもかかわらず、実践者は危険を予知し軽減するための積極的なアプローチを採用することはめったにない。
本稿では,MLを利用したソフトウェア製品の開発にハザード分析を統合することを提唱する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:37:19 GMT)
Zero-Shot Learning of Causal Models [17.4] ゼロショット方式で構造因果モデル(SCM)を推定できるモデルを学習する。
副産物として,本手法では新たなデータセットとインターベンションサンプルのゼロショット生成を行うことができる。
私たちの知る限りでは、SCMが観測からゼロショットで推論されるのはこれが初めてです。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:21:07 GMT)
A Flag Decomposition for Hierarchical Datasets [17.4] フラッグ多様体は部分空間の階層的なネスト列を符号化する。
現在の応用は、しばしば共通の行列分解法を用いてフラグを抽出することに制限される。
任意の階層的な実保存データをStiefel座標の階層値のフラグ表現に分解する新しいフラグベース手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:52 GMT)
Diverse Perspectives on AI: Examining People's Acceptability and Reasoning of Possible AI Use Cases [17.4] 我々は,人口統計学的に多様な参加者を対象に実施した調査を通じて,AI開発に関する人々の判断に影響を与える態度と理由について検討した。
私たちは10の異なるプロフェッショナル(Lawyer AIなど)と個人(Digital Medical Advice AIなど)のAIユースケースに焦点を当てています。
実証実験の結果,一般の否定的受容や個人に対する職業的利用の相違など,受容に影響を与える要因の数が明らかになった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:06:47 GMT)
RoMA: Robust Malware Attribution via Byte-level Adversarial Training with Global Perturbations and Adversarial Consistency Regularization [17.4] APTの敵はしばしばその正体を隠蔽し、本質的に敵意を表わす。
既存の機械学習ベースの属性モデルは、効果はあるものの、敵の攻撃に対して非常に脆弱である。
我々は,グローバルな摂動を統合して,拡張された対向サンプルを生成する,新しい一段階対向訓練手法であるRoMAを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:51:12 GMT)
A Unifying Framework for Causal Imitation Learning with Hidden Confounders [17.3] 因果Imitation Learning(IL)のための汎用的で統一的な枠組みを提案する。
このフレームワークは,専門家が観察した,専門家の方針に影響を与える,(a)専門家のアルゴリズムとILアルゴリズムの両方に隠されたノイズの2種類の隠れた共同設立者を説明する。
本研究では,我々のフレームワークにおける因果的ILは,履歴に依存した政策を学習するための指標として軌道履歴を活用することで,条件運動制限(CMR)の集合に還元できることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:43:49 GMT)
Amuro and Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models [17.3] 本研究では,複数の中間学習モデルチェックポイントの微調整による事前学習と微調整の関係について検討する。
18のデータセットで得られた結果は、事前学習が微調整後に発表される潜在的な方法でモデルを改善することを示唆している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:57:29 GMT)
No Data, No Optimization: A Lightweight Method To Disrupt Neural Networks With Sign-Flips [17.1] Deep Neural Lesion (DNL)は、重要なパラメータを特定し、大規模な精度低下を引き起こす、データフリーで軽量な方法である。
様々なコンピュータビジョンモデルとデータセットで有効性を検証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:40:45 GMT)
CROWN: A Novel Approach to Comprehending Users' Preferences for Accurate Personalized News Recommendation [17.1] カテゴリー誘導意図のゆがみを利用した新しいパーソナライズされたニュースレコメンデーションフレームワーク(CROWN)を提案する。
CROWNは10の最先端のニュースレコメンデーションメソッドに対して一貫したパフォーマンス改善を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:26:34 GMT)
Natural Variational Annealing for Multimodal Optimization [17.1] 我々はNatural Vari Annealing (NVA)と呼ばれる新しいマルチモーダルマルチモーダル最適化手法を導入する。
3つの概念の強みを組み合わせて、複数の大域的目的に同時に局所的に逆転する。
惑星科学における実世界の問題への応用を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:36:13 GMT)
Causal-Informed Contrastive Learning: Towards Bias-Resilient Pre-training under Concept Drift [17.0] 本稿では,概念ドリフトのデータストリームに対応するために,レジリエントなコントラスト事前学習手法を提案する。
様々な下流タスクの実験は、我々のレジリエントなコントラスト事前学習が、ドリフトデータストリームの概念から生じるバイアスを効果的に軽減することを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:09:05 GMT)
Novelty Detection in Reinforcement Learning with World Models [16.5] 世界モデルを用いた強化学習(RL)は近年大きな成功を収めている。
しかし、突然世界力学や性質が変化した場合、エージェントの性能と信頼性は劇的に低下する。
生成されたワールドモデルフレームワーク内での新規性検出の実装は、デプロイ時にエージェントを保護するための重要なタスクである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:38:13 GMT)
RoboBERT: An End-to-end Multimodal Robotic Manipulation Model [16.5] 本稿では、ユニークなトレーニング戦略と統合された、新しいエンドツーエンドロボット操作モデルであるRoboBERTを紹介する。
RoboBERTは、言語ラベルのエキスパートデモのみを使用しながら、非常に競争力のある成功率を達成する。
実際のロボットでテストすると、モデルは優れた性能を示し、同じデータで訓練された他の方法よりも高い成功率を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:16:59 GMT)
Programming Refusal with Conditional Activation Steering [16.4] 条件付きアクティベーションステアリング(CAST)は、推論中のLCMアクティベーションパターンを分析して、アクティベーションステアリングを選択的に適用または保持する。
CASTは、特定のコンテンツに対する応答を選択的に修正し、他のコンテンツに対する通常の応答を維持し、すべて重み付けの最適化を必要としない。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:22:45 GMT)
Learning from Demonstration with Implicit Nonlinear Dynamics Models [16.3] 本研究では、時間的ダイナミクスをモデル化するための可変な動的特性を持つ固定非線形力学系を含むリカレントニューラルネットワーク層を開発する。
LASA Human Handwriting データセットを用いて人間の手書き動作を再現する作業において,ニューラルネットワーク層の有効性を検証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:24:23 GMT)
My LLM might Mimic AAE -- But When Should it? [16.2] 大型言語モデル(LLM)におけるアフリカ系アメリカ人英語の表現について検討する。
LLMの出力にAAEが適切かどうかを判断する上で、黒人は選択と自律性を好む。
LLMは、フォーマルな設定でメインストリームの英語で通信することをデフォルトとし、よりフォーマルな設定でAEの生産に関心を抱いた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:56:16 GMT)
Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension [16.0] 本稿では,Fisher InformationMatrix (FIM) のレンズによる効率的な近似の体系設計に向けて一歩進める。
我々は、多くの最先端の効率的な近似を(フロベニウスノルムの下で)特定の構造的仮定を持つFIMの解と見なせることを示した。
一般性と効率性のバランスをとるための構造的仮定を慎重に選択することを含む,LLMの実用的効率に関する2つの設計勧告を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:27:19 GMT)
The State and Fate of Summarization Datasets: A Survey [16.0] 100以上の言語で133のデータセットにまたがる大規模な作業を調査します。
低リソース言語でアクセス可能な高品質なデータセットが欠如しているなど、重要な観察を行います。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:00:39 GMT)
Blind Spot Navigation in LLM Reasoning with Thought Space Explorer [15.9] 我々はThought Space Explorer(TSE)を設計し、思考構造を拡張し、最適化し、大きな言語モデル(LLM)を誘導し、思考の盲点を探索する。
TSEは、様々な設計戦略により、元の思考構造に基づいて、新たな推論ステップと分岐を生成することにより、思考空間を広げ、LSM推論における盲点の影響を軽減する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:53:31 GMT)
Interpretable Vision-Language Survival Analysis with Ordinal Inductive Bias for Computational Pathology [15.8] Histo Whole-Slide Images (WSIs) は、CPATHにおける癌予後を評価する重要なツールである
既存のサバイバル分析アプローチはエキサイティングな進歩を遂げているが、一般的には高度に表現力のあるネットワークアーキテクチャを採用するに限られている。
本稿では,VLSA(Vision-Language-based SA)パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:11:14 GMT)
Beyond Pass or Fail: Multi-Dimensional Benchmarking of Foundation Models for Goal-based Mobile UI Navigation [15.8] ユーザインタフェース(UI)ナビゲーションの産業的設定における基礎モデル(FM)の評価のためのベンチマークであるSphinxを提案する。
Google PlayアプリケーションとWeChatの内部UIテストケースの両方を使用して、20の異なる構成を持つ8つのFMを評価した。
その結果、既存のFMは、主にUI固有の機能不足のため、ゴールベースのテストタスクに普遍的に苦労していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:34:12 GMT)
When Data Manipulation Meets Attack Goals: An In-depth Survey of Attacks for VLMs [15.7] VLM(Vision-Language Models)に適した攻撃戦略を詳細に調査する。
我々はこれらの攻撃をその根底にある目的に基づいて分類する。
これらの脆弱性を軽減するために提案されている防衛機構について概説する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:42:24 GMT)
An Improved Optimal Proximal Gradient Algorithm for Non-Blind Image Deblurring [15.6] 改良された最適近位勾配アルゴリズム(IOptISTA)を導入し,非盲点画像の劣化問題に効率的に対処する。
その結果,既存の手法と比較して,PSNRとSSIMの値が向上し,耐性が低下することが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:52:11 GMT)
Mind the Gap: Towards Generalizable Autonomous Penetration Testing via Domain Randomization and Meta-Reinforcement Learning [15.6] GAPは汎用的な自律型ペンテスティングフレームワークである。
現実的な環境で効率的な政策トレーニングを実現することを目的としている。
また、あるインスタンスから他のケースについて推論できるエージェントを訓練する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:16:21 GMT)
Scaling Off-Policy Reinforcement Learning with Batch and Weight Normalization [15.6] CrossQは,更新データ(UTD)比が1。
より高UTD比で強調されるトレーニングダイナミクスの課題を明らかにする。
提案手法はUTD比の増大とともに確実にスケールし,25の難易度連続制御タスクにまたがる競争性能を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:55:32 GMT)
Improving Autoformalization using Type Checking [15.6] 我々は、現在の自己形式化手法とそれらの評価に使用されるプロセスの両方を分析し、特にLean 4の定理証明言語に注目します。
ProofNetの絶対精度は18.4%まで向上し,既存の手法上での自己整合性による型チェックフィルタリングが性能を著しく向上することを示した。
我々はまた、新しい研究レベルの数学データセット RLM25、修正されたProofNet、ラベル付き正誤オートフォーマライゼーションペアでメトリクスを評価するProofNetVerifといった新しいベンチマークもリリースした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:02:10 GMT)
MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection [15.5] 拡散モデルは、トレーニングデータによく似ているが、データ記憶の影響を受ける画像を生成するのに優れている。
微調整時のモデル容量の正規化がこの問題を軽減することを提案する。
当社のフレームワークは大規模データセットにスケーラブルで,関数の報酬に依存せず,既存のアプローチと統合することで,メモリ化の軽減を実現しています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:41:08 GMT)
OSSDoorway: A Gamified Environment to Scaffold Student Contributions to Open Source Software [15.5] 本稿では,オープンソースソフトウェア(OSS)プロジェクトに貢献する学生を指導するツールOSSDoorwayを提案し,評価する。
OSSDoorwayの使用前後で29名の学生を募集し,自己効力感尺度を施行した。
その結果,OSSDoorwayは生徒の自己効力を高め,構造化されたゲーミフィケーション学習体験を提供することがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:07:27 GMT)
CAT: Contrastive Adversarial Training for Evaluating the Robustness of Protective Perturbations in Latent Diffusion Models [15.4] 保護的摂動としての敵対的な例は、不正なデータの使用を防ぐために開発された。
本稿では,これらの保護手法に対する適応攻撃としてアダプタを利用するコントラスト適応訓練(Contrastive Adversarial Training, CAT)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:35:35 GMT)
CIRCUIT: A Benchmark for Circuit Interpretation and Reasoning Capabilities of LLMs [15.3] 大規模言語モデル(LLM)の役割はアナログ回路設計において広く研究されていない。
CIRCUITデータセットを作成し、510組の質問応答ペアをアナログ回路関連項目の様々なレベルに分散させた。
我々のデータセット上で最高の性能モデルであるGPT-4oは、最終数値で評価すると48.04%の精度が得られる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:53:48 GMT)
Qualitative Research Methods in Software Engineering: Past, Present, and Future [15.2] 1999年にTSEで論文Qualitative Methods in Empirical Studies of Software Engineeringが出版された。
TSEの50年の歴史の中で、最も影響力のある論文の1つに選ばれた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:25:58 GMT)
Limits to scalable evaluation at the frontier: LLM as Judge won't beat twice the data [15.0] 新たなデバイアスツールのファミリーは、いくつかの高品質なラベルを使用して多数のモデル判断をデバイアスすることで、問題を解決することを約束している。
本研究の主目的は,審査員が評価モデルに比較して精度が低い場合,デバイアス法が要求される地上の真実ラベルの量を半分以上減らすことができないことである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:39:18 GMT)
Optimistic Interior Point Methods for Sequential Hypothesis Testing by Betting [14.7] 本稿では, 内部点法を最適化に活用して, 勾配爆発のリスクを伴わずに, 決定空間全体の更新を可能にする新しい戦略を提案する。
我々の手法は強い統計的保証を維持するだけでなく、臨界シナリオにおける高速なヌル仮説の拒絶を促進する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:57:18 GMT)
Training Language Models to Reason Efficiently [14.4] 我々は、強化学習を用いて、大きな推論モデルを訓練し、効率的に推論する。
精度を維持しながら不要な計算オーバーヘッドを最小限に抑えるため,本手法はモデルにインセンティブを与える。
2つのオープンウェイトな大推論モデルに対する実験は、ほとんどの精度を保ちながら、推論コストを著しく削減することを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:06:02 GMT)
Density Ratio Estimation with Conditional Probability Paths [14.3] 条件変数に基づく時間スコア推定のための新しいフレームワークを提案する。
従来の手法と比較して,本手法は時間スコアの学習を高速化し,密度比の推定精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:07:17 GMT)
Advancing Medical Radiograph Representation Learning: A Hybrid Pre-training Paradigm with Multilevel Semantic Granularity [14.2] 本稿では,グローバルレベルの視覚表現と印象とトークンレベルの視覚表現とを一致させるHybridMEDフレームワークを提案する。
本フレームワークでは,画像から印象を生成するための2つのプロキシタスクを,キャプションブランチを介して生成する生成デコーダと,(2)要約ブランチを介して解析を行う。
MIMIC-CXRデータセットの実験により,我々の要約部は,キャプション部に対する知識を効果的に蒸留し,パラメータ要求を大幅に増大させることなくモデル性能を向上させることを明らかにした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:32:18 GMT)
Will the Technological Singularity Come Soon? Modeling the Dynamics of Artificial Intelligence Development via Multi-Logistic Growth Process [14.2] AI技術の発展は、複数のロジスティック成長プロセスの重ね合わせによって特徴づけられる。
2024年頃は、現在のAI波の最速地点だ。
ディープラーニングベースのAI技術は、基本的な技術革新が生まれなければ、2035年から2040年頃に減少すると予想されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:11:42 GMT)
Entanglement and energy transportation in the central-spin quantum battery [13.9] 量子電池は、エネルギーを輸送し保存する量子力学の原理を利用する。
電池セルとして機能するN_b$スピンと充電セルとして機能するN_c$スピンからなる中心スピン型量子電池のエネルギー輸送について検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:32:17 GMT)
NLGR: Utilizing Neighbor Lists for Generative Rerank in Personalized Recommendation Systems [13.8] ジェネレーティブリジェネレータの近隣リストモデルは、空間におけるジェネレータのパフォーマンスを改善することを目的としている。
本稿では,既存のリストから任意の隣接リストへ柔軟にジャンプ可能な,サンプリングに基づく非自己回帰生成手法を提案する。
NLGRの有効性を実証し,NLGRをMeituanフードデリバリープラットフォームに導入することに成功している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:44:47 GMT)
HiPoNet: A Topology-Preserving Multi-View Neural Network For High Dimensional Point Cloud and Single-Cell Data [13.8] HiPoNetは、高次元の点雲上での回帰、分類、表現学習のためのエンドツーエンドの微分可能なニューラルネットワークである。
HiPoNetは単一セル上での最先端のポイントクラウドやグラフベースのモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:13:29 GMT)
ESPFormer: Doubly-Stochastic Attention with Expected Sliced Transport Plans [13.7] 自己注意は、トレーニング中にいくつかのトークンを過度に集中させ、その結果、準最適情報フローをもたらす可能性がある。
我々は,スライスされた最適輸送に基づく,新しい並列化可能な二重確率的アテンション機構を提案する。
本手法はシンクホーンの正規化を繰り返すことなく二重性を強制し,効率を著しく向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:20:48 GMT)
Point Cloud Synthesis Using Inner Product Transforms [13.6] 内部積を用いた点雲の幾何学的位相特性を符号化する新しい手法を開発した。
我々のエンコーディングは、再構成、生成、推論といった典型的なタスクにおいて、既存の手法よりも桁違いに高速な推論時間で高品質である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:03:09 GMT)
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods [13.6] 大規模言語モデル(LLM)は、モデルのサイズやデータのスケールアップを通じて、大幅なパフォーマンス向上を実現している。
既存の推論時間スケーリング手法は、このタスクを検索問題として捉えており、ハックに報いるには弱い傾向にある。
本稿では,粒子ベースのモンテカルロ法を応用した新しい推論時間スケーリング手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:52:26 GMT)
Concentration of Non-Isotropic Random Tensors with Applications to Learning and Empirical Risk Minimization [13.6] ディメンジョンは、最適化手法がデータのサイズに悩まされる現代の学習タスクに固有のボトルネックである。
環境よりも有効次元に依存して、これらの次元コストを削減するツールを開発する。
本稿では, 学習問題における非等方性特性の活用の重要性について述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:29:23 GMT)
Music for All: Exploring Multicultural Representations in Music Generation Models (Camera Ready) [13.6] 本稿では,音楽生成のためのデータセットと研究論文について述べる。
既存の音楽データセットの合計時間のうち、西洋以外のジャンルから得られる時間はわずか5.7%である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:46:29 GMT)
ERANet: Edge Replacement Augmentation for Semi-Supervised Meniscus Segmentation with Prototype Consistency Alignment and Conditional Self-Training [13.5] 半教師付きメニスカスセグメンテーションフレームワークであるERANetを提案する。
ERANetは、エッジ置換強化(ERA)、プロトタイプ整合性調整(PCA)、条件付き自己学習(CST)戦略を統合している。
3D double Echo Steady State (DESS) と 3D Fast/Turbo Spin Echo (FSE/TSE) MRI を用いた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:49:31 GMT)
Intrinsic Bias is Predicted by Pretraining Data and Correlates with Downstream Performance in Vision-Language Encoders [13.5] 本稿は,CLIPモデルの上流事前学習要因と下流性能が内在バイアスにどのように関係しているかを,これまでで最大の包括的分析結果として提示する。
55のアーキテクチャを使用して,26のデータセットでトレーニングされた131のCLIPモデルを,さまざまなサイズで検討した。
事前トレーニングデータセットの選択がバイアスの上流で最も重要な予測要因であることに気付きました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:11:47 GMT)
Curvature Tuning: Provable Training-free Model Steering From a Single Parameter [13.4] モデル決定境界の曲率を1つのパラメータで変調する方法を示す。
これにより、CTは従来の微調整法よりも効率的かつ解釈可能である。
事前学習モデルの一般化とロバスト性を改善する上での有効性を実証的に検証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:57 GMT)
DPO-Shift: Shifting the Distribution of Direct Preference Optimization [13.3] 選択した確率の分布を制御的にシフトさせる手法を提案する。
提案手法は,選択した確率を改善することと,報酬マージンを犠牲にすることとの基本的なトレードオフを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:49:44 GMT)
Spatial Degradation-Aware and Temporal Consistent Diffusion Model for Compressed Video Super-Resolution [13.1] ビデオスーパーレゾリューション (VSR) はビデオの高精細化に有効な手法であるが、比較的VSR法は圧縮ビデオに焦点を当てている。
圧縮VSRのための空間劣化認識・時間一貫性拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:57:45 GMT)
Exploring Political Ads on News and Media Websites During the 2024 U.S. Elections [13.1] 我々は、2024年のアメリカ合衆国大統領選挙に先立つウェブサイトに現れる政治広告の内容を分析した。
私たちの発見の中では、クリックベイトな政治ニュース広告が流行し、以前の仕事を反映している。
私たちは、Web上の政治関連広告の監視と透明性の強化を求める事前作業に参加します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:34:39 GMT)
The Breeze 2 Herd of Models: Traditional Chinese LLMs Based on Llama with Vision-Aware and Function-Calling Capabilities [13.1] Breeze2は、高度なマルチモーダル言語モデルのスイートで、3Bおよび8Bパラメータ設定で利用可能である。
Llama 3.2 モデルファミリーを基盤として、我々は伝統的な中国語の言語と文化の遺産を強化するため、広範囲にわたるコーパスでブレゼ2の事前訓練を継続する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:48:15 GMT)
Finding Dino: A Plug-and-Play Framework for Zero-Shot Detection of Out-of-Distribution Objects Using Prototypes [12.8] ラベルを含まないプロトタイプによるOOD検出(PROWL)
プラグアンドプレイフレームワーク-PRototype-based OOD Detection Without Labels (PROWL)を提案する。
これは、ドメインデータセットのトレーニングを必要とせず、自己教師付き事前訓練モデルから関連する特徴を抽出することに依存する推論ベースの手法である。
ロードドライブベンチマークで提供されるRoadAnomalyとRoadObstacleのデータセットの最先端結果を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:05:29 GMT)
Overview of the Amphion Toolkit (v0.2) [12.7] Amphionは、オーディオ、音楽、音声生成のためのオープンソースのツールキットである。
このレポートでは、2024年に開発された2番目のメジャーリリースであるAmphion v0.2を紹介します。
100K時間のオープンソースの多言語データセット、堅牢なデータ準備パイプライン、テキスト音声、オーディオコーディング、音声変換といったタスクのための新しいモデルを備えている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:05:36 GMT)
Evaluation for Regression Analyses on Evolving Data Streams [12.7] 進化するデータストリームにおける回帰分析の課題について考察する。
本稿では,ストリーミング環境における回帰と予測間隔タスクの標準化された評価プロセスを提案する。
様々なドリフトタイプを合成できる革新的なドリフトシミュレーション戦略を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:12:08 GMT)
MRS: A Fast Sampler for Mean Reverting Diffusion based on ODE and SDE Solvers [12.6] 平均回帰(MR)拡散は微分方程式(SDE)の構造を直接修飾する
現在のトレーニングフリーの高速サンプリング器はMR拡散には直接適用されない。
MR拡散のサンプリングNFEを削減するため, MRS (MR Sampler) という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:57:33 GMT)
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol [12.5] モデルフリーおよびモデルベースセレクタ評価のための新しいプロトコルを開発した。
我々の新しいモデルフリーセレクタであるLSTD-Tournamentは有望な経験的性能を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:40:55 GMT)
Scrambling Enabled Entropy Accumulation in Open Quantum Systems [12.4] 閉量子多体系では、最初は局所化された情報がシステム全体に広がり、非常に複雑になる。
近年の研究では、オープンシステムにおける散逸が情報の衝突を妨げ、システムを散逸する段階へと導くことが示されている。
我々はオープン量子系においてエントロピー蓄積と呼ばれる新しい現象を公表する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:24:09 GMT)
Dense Object Detection Based on De-homogenized Queries [12.3] デンス物体検出は、自動走行、ビデオ監視、その他の分野で広く利用されている。
現在、非最大抑圧(NMS)のような欲求的アルゴリズムに基づく検出手法は、密集したシナリオにおいて繰り返し予測や欠落検出をしばしば生成している。
終端から終端までのDETR(Detection TRansformer)をNMSなどの後処理の復号化能力をネットワークに組み込む検知器として利用することで,クエリベースの検出器における均一なクエリがネットワークの復号化能力とエンコーダの学習効率を低下させることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:36:10 GMT)
Testing Practices, Challenges, and Developer Perspectives in Open-Source IoT Platforms [12.3] この記事では、IoTプラットフォームにおけるテストの背後にあるプラクティスと認識の両方を初めて明らかにする。
OpenHabとHomeAssitantという2つのポピュラーでメンテナンスのよいオープンソースIoTプラットフォームのコードと統合を分析します。
私たちの分析では、自動(ユニット)テスト、手動テストの欠如に重点を置いています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:52:27 GMT)
Drago: Primal-Dual Coupled Variance Reduction for Faster Distributionally Robust Optimization [12.3] 本稿では、周期的およびランダム化されたコンポーネントと慎重に正規化された一次更新を組み合わせ、二重分散の低減を実現するプリミティブ・デュアルアルゴリズムであるDragoを提案する。
その設計のため、Dragoは、厳密な凸強凹DRO問題に対する最先端の線形収束率と、原始条件数と双対条件数へのきめ細かい依存を享受している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:28:34 GMT)
UNSURE: self-supervised learning with Unknown Noise level and Stein's Unbiased Risk Estimate [12.3] ノイズの多いデータのみから学習できる画像再構成のための自己教師付き学習法が数多く提案されている。
我々は、SUREに基づく新しいアプローチを提案するが、標準のSUREとは異なり、ノイズレベルに関する知識は必要ない。
提案手法は,様々な画像逆問題において,既存の自己監督手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:09:35 GMT)
Let the Fuzzy Rule Speak: Enhancing In-context Learning Debiasing with Interpretability [12.3] 大規模言語モデル(LLM)は、テキスト分類タスクにおいて、文脈内学習(ICL)を用いたバランスの取れたクラス精度に苦慮することが多い。
本稿では、クラス精度の不均衡問題を深く掘り下げ、あるクラスが不均等に高いICL確率を常に受けているため、それが生じることを確かめる。
本稿では,サンプルレベルのクラス確率補正手法であるFuRudを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:39:22 GMT)
Boosting Path-Sensitive Value Flow Analysis via Removal of Redundant Summaries [12.2] 冗長な要約を効果的に識別し、排除できる最初のアプローチを提案する。
我々の同定アルゴリズムは、最先端の値フロー解析における時間とメモリオーバーヘッドを著しく低減することができる。
最大のテキスト化プロジェクトでは、識別アルゴリズムは、わずか17.31秒の追加オーバーヘッドで8107秒(2.25時間)の時間を短縮する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:41:53 GMT)
ScholaWrite: A Dataset of End-to-End Scholarly Writing Process [12.2] ScholaWriteデータセットは、完全な原稿のエンドツーエンドの学術的な記述プロセスの、第一級のキーストロークログである。
私たちのデータセットには、5つのプレプリントから得られたキーストロークデータが含まれており、合計62万件のテキスト変更と4ヶ月にわたる注釈が含まれています。
本実験は最終稿ではなく,エンド・ツー・エンドの筆記データの収集の重要性を明らかに示していた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:14:31 GMT)
Federated Self-supervised Domain Generalization for Label-efficient Polyp Segmentation [12.1] フェデレーテッド・ラーニング(FL)は、このプライバシー問題に対する強硬な解決策である。
FLの一般化能力を高めるために,フェデレーション型自己監督型ドメイン一般化法(LFDG)を提案する。
本手法はベースライン法および最近のFL法およびSSL法よりも3.80%,3.92%向上した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:00:01 GMT)
Fixed-Confidence Best Arm Identification with Decreasing Variance [12.0] 腕の報酬の変動を時間的に減少させるマルチアームバンディットにおけるベストアーム識別の問題に焦点をあてる。
学習者によるコストは、最適な腕を特定するのに必要な時間の重み付けされた和としてモデル化される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:47:20 GMT)
Optimizing Datasets for Code Summarization: Is Code-Comment Coherence Enough? [11.9] コード要約の特定の品質属性であるコード圧縮コヒーレンスが、コードの要約データセットの最適化にどの程度利用できるかを検討する。
2つの最先端データセット(TL-CodeSumとFuncom)から複数のレベルのトレーニングインスタンスを調べ、3つの手作業によるテストセット上で結果モデルを評価する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:02:19 GMT)
Contextual Gesture: Co-Speech Gesture Video Generation through Context-aware Gesture Representation [11.8] Contextual Gestureは、3つの革新的なコンポーネントを通じて音声ジェスチャービデオ生成を改善するフレームワークである。
実験により、コンテキストジェスチャは、現実的かつ音声対応のジェスチャービデオを生成するだけでなく、長文生成および動画ジェスチャー編集アプリケーションもサポートすることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:09:12 GMT)
Optimal Actuator Attacks on Autonomous Vehicles Using Reinforcement Learning [11.8] AVアクチュエータに対する最適なステルス完全性攻撃を設計するための強化学習(RL)に基づくアプローチを提案する。
また、このような攻撃に対処するために、最先端のRLベースのセキュアコントローラの限界を分析する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:01:05 GMT)
Interactive Symbolic Regression through Offline Reinforcement Learning: A Co-Design Framework [11.8] シンボリック回帰は、観測データから基礎となる数学的および物理的関係を明らかにする大きな可能性を秘めている。
現在の最先端のアプローチは、通常、ドメインエキスパートの事前知識の統合を考慮していない。
本稿では,大規模な記号回帰のための高度な対話型フレームワークであるSym-Qを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:20:37 GMT)
From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment [11.8] FOREWARNは、Vision Language Modelsのランタイムポリシーステアリングの可能性を解き放つ新しいフレームワークである。
予見のために、我々は潜在世界モデルを利用して、多様な低レベルアクションプランが与えられた将来の潜在国家を想像する。
例えば、VLMをこれらの予測潜在状態と整合させて、そのネイティブ表現におけるアクションの結果を推論する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:00:12 GMT)
exHarmony: Authorship and Citations for Benchmarking the Reviewer Assignment Problem [11.8] 明示的なラベルを必要とせずにレビュアー代入問題を評価するためのベンチマークデータセットを開発した。
従来の語彙マッチング、静的なニューラル埋め込み、文脈化されたニューラル埋め込みなど、さまざまな手法をベンチマークする。
本研究は,従来の手法が合理的に良好に機能する一方で,学術文献で訓練された文脈的埋め込みが最高の性能を示すことを示すものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:35:04 GMT)
Forget What You Know about LLMs Evaluations - LLMs are Like a Chameleon [11.8] 大規模言語モデル(LLM)は、しばしば公開ベンチマークで優れているように見えるが、これらの高いスコアはデータセット固有のサーフェスキューへの過度な依存を隠蔽する可能性がある。
本稿では,ベンチマークプロンプトを歪ませるメタ評価フレームワークであるChameleon Benchmark Overfit Detector (C-BOD)を紹介する。
セマンティックコンテンツやラベルを保存しながら入力をリフレッシュすることで、C-BODはモデルのパフォーマンスが記憶パターンによって駆動されるかどうかを明らかにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:43:36 GMT)
CausalGeD: Blending Causality and Diffusion for Spatial Gene Expression Generation [11.7] 本稿では,遺伝子間の因果関係を活用するために,拡散と自己回帰過程を組み合わせたCausalGeDを提案する。
10の組織データセットで、CausalGeDは最先端のベースラインを5~32%上回った。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:26:22 GMT)
CapyMOA: Efficient Machine Learning for Data Streams in Python [11.6] CapyMOAは、ストリーミングデータ上の効率的な機械学習のためのオープンソースのライブラリである。
CapyMOAには、MOAやPyTorchといった外部フレームワークとの統合を可能にするアーキテクチャが含まれている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:20:04 GMT)
Variational expressions and Uhlmann theorem for measured divergences [11.6] 凸関数に対する測定値$f$-divergencesに対する変分式を$f$とする。
我々は、測定された$f$-分岐の幅広いクラスに対して、測定された$alpha$-R'enyi発散を含むウルマンの定理を確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:09:18 GMT)
Auto-Drafting Police Reports from Noisy ASR Outputs: A Trust-Centered LLM Approach [11.5] 本研究では,複雑な,騒々しい,複数ロールの対話データから,警察報告のドラフトを生成するために設計された,革新的なAI駆動システムを提案する。
我々のアプローチは、法執行機関の相互作用の重要な要素をインテリジェントに抽出し、ドラフトに含めます。
このフレームワークは、将来の警察行為において、レポートプロセスを変革し、監視、一貫性、公平性を高める可能性を秘めている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:27:28 GMT)
KABB: Knowledge-Aware Bayesian Bandits for Dynamic Expert Coordination in Multi-Agent Systems [11.5] 本稿では,マルチエージェントシステムの協調性を高める新しいフレームワークであるKnowledge-Aware Bayesian Bandits (KABB)を紹介する。
このフレームワークには、深い意味理解のための3次元知識距離モデル、継続的な専門家最適化のための二重適応機構、効率的な専門家選択のための知識認識型トンプソンサンプリング戦略の3つの重要な革新が含まれている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:22:12 GMT)
TimeDiT: General-purpose Diffusion Transformers for Time Series Foundation Model [11.3] TimeDiTは時間依存性学習と確率的サンプリングを組み合わせた拡散トランスフォーマーモデルである。
TimeDiTは、さまざまなタスクにわたるトレーニングと推論プロセスを調和させるために、統一的なマスキングメカニズムを採用している。
我々の体系的評価は、ゼロショット/ファインチューニングによる予測と計算という基本的なタスクにおいて、TimeDiTの有効性を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:53:58 GMT)
BalanceKV: KV Cache Compression through Discrepancy Theory [11.2] 大規模言語モデル(LLM)は目覚ましい成功を収めたが、その高いメモリ要件は、長文トークン生成の課題である。
本稿では,Banaszczykのベクトルバランス理論に基づく幾何サンプリングプロセスに基づくKVキャッシュ圧縮手法であるBa balanceKVを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:18:17 GMT)
RESIST: Resilient Decentralized Learning Using Consensus Gradient Descent [11.2] 経験的堅牢性リスク(ERM)は、現代の機械学習(ML)の基盤である
本稿では,MITM(man-in-the-middle)攻撃に焦点をあてる。
本稿では,敵に妥協された通信リンクに対して堅牢なアルゴリズムであるRESISTを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:48:10 GMT)
Intent Representation Learning with Large Language Model for Recommendation [11.1] モデルに依存しないフレームワークIRLLRec(Intent Representation Learning with Large Language Model)を提案する。
具体的には、IRLLRecはマルチモーダルなインテント表現を学ぶためにデュアルトウワーアーキテクチャを採用している。
テキストと対話に基づく意図をよりよく一致させるため、融合した意図表現を教師が学習するためにモーメント蒸留を用いる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:29:44 GMT)
FinTruthQA: A Benchmark Dataset for Evaluating the Quality of Financial Information Disclosure [11.1] FinTruthQAは、金融Q&Aデータにおける情報開示の自動品質評価のための高度な自然言語処理(NLP)技術を評価するために設計されたベンチマークである。
実世界のファイナンシャルQ&Aエントリ6,000からなり、各Q&Aは4つの主要な評価基準に基づいて手動で注釈付けされた。
実験の結果,既存のNLPモデルは質問認識や質問関連タスクの予測能力は高いが,回答の可読性や回答関連タスクには最適であることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:49:17 GMT)
Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification [11.1] ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインのパフォーマンスを評価することを目的としている。
相関型条件付スキームを用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:29:42 GMT)
Improving Adaptive Moment Optimization via Preconditioner Diagonalization [11.0] 提案手法は,現代適応法の収束速度を大幅に向上させることができることを示す。
LLaMAのような大きな言語モデルでは、ベースラインであるAdamと比較して2倍のスピードアップが達成できます。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:48:04 GMT)
TranSplat: Surface Embedding-guided 3D Gaussian Splatting for Transparent Object Manipulation [11.0] TranSplat は透明物体に適した表面埋め込み誘導型3次元ガウス散乱法である。
これらの表面埋め込みと入力されたRGB画像を統合することで、TranSplatは透明な表面の複雑さを効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:43:56 GMT)
Diffusion-LAM: Probabilistic Limited Area Weather Forecasting with Diffusion [10.9] 条件拡散を利用した確率的限定地域気象モデルであるDiffusion-LAMを導入する。
周辺地域の境界データの条件付けにより, 本手法は定義領域内における予測を生成する。
MEPSリミテッド領域データセットの実験結果は、拡散LAMが正確な確率予測をもたらす可能性を実証している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:15:16 GMT)
LLM-Sketch: Enhancing Network Sketches with LLM [10.9] Sketchesは、バウンド精度でメモリオーバーヘッドを低くする、コンパクトなデータ構造である。
近年の研究では、機械学習を用いたスケッチの最適化が試みられている。
LLM-Sketchは,パケットヘッダ内のフローID以外のフィールドも,フローサイズを推測するのに役立つという知見に基づいて提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:54:56 GMT)
Small Language Model Makes an Effective Long Text Extractor [10.9] 名前付きエンティティ認識(NER)は自然言語処理(NLP)の基本問題である
本稿では,SeNERと呼ばれる軽量なスパンベースNER手法を提案する。
長いテキストを効果的に埋め込むために、[]トークンにLogN-Scalingと結合した双方向の矢印アテンション機構が組み込まれています。
3つの長いNERデータセットで最先端の抽出精度を実現し、GPUメモリフレンドリな方法で長いテキストからエンティティを抽出することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:06:25 GMT)
Automated Unit Test Refactoring [10.8] テストの臭いは、設計プラクティスの貧弱さとドメイン知識の不足から生じます。
我々は,Javaプロジェクトにおける自動テストのための文脈拡張型LLMベースのフレームワークUTRefactorを提案する。
6つのオープンソースのJavaプロジェクトから879のテストに対してUTRefactorを評価し、テストの匂いを2,375から265に減らし、89%の削減を実現した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:52:54 GMT)
Lattice Defects in Rydberg Atom Arrays [10.8] ライドバーグ原子配列は、量子多体系を研究するための重要なプラットフォームとなっている。
最も単純な状況における幾何学的欠陥の影響、すなわち1次元ライドバーグ原子配列について検討する。
異なる種類のキンクがそれぞれの空間-内部対称性に対応する異なる結果をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:00:03 GMT)
DOGR: Leveraging Document-Oriented Contrastive Learning in Generative Retrieval [10.8] 生成検索における文書指向コントラスト学習(DOGR)という,新規で汎用的な生成検索フレームワークを提案する。
DOGRleveragesは、生成的検索タスクを改善するために対照的な学習を行う。
2つの公開ベンチマークデータセット上で、既存の生成的検索手法に比較して、最先端のパフォーマンスのコンパスを実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:25:42 GMT)
Prompt-Based Document Modifications In Ranking Competitions [10.8] 本研究では,言語モデル (LLM) を用いたプロンプトベースの文書編集手法について検討した。
これまでのランキングコンペティションやコンペティションでボットとしてデプロイすることで、私たちのアプローチを評価します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:25:57 GMT)
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs [10.7] SeerAttentionは、大規模言語モデル自体からブロックレベルの注意空間を学習する。
評価の結果,SeerAttention は長文プリフィルの精度向上と低レイテンシ化を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:11:48 GMT)
FlexControl: Computation-Aware ControlNet with Differentiable Router for Text-to-Image Generation [10.7] ControlNetは拡散ベースの生成モデルをガイドする強力な方法を提供する。
ほとんどの実装は、異なるタスクで予測不可能に変化するアプローチを制御するためのネットワークブロックを選択するためのアドホックに依存しています。
トレーニング中にすべての拡散ブロックをコピーし、トレーニング可能なゲーティング機構を使用するフレームワークであるFlexControlを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:27:58 GMT)
Handling missing values in clinical machine learning: Insights from an expert study [10.6] Inherently Interpretable Machine Learning (IML)モデルは、臨床的意思決定に有用なサポートを提供する。
計算不能や不完全なレコードの破棄といった従来のアプローチは、テスト時にデータが欠落しているシナリオでは現実的ではないことが多い。
フランスの29の外傷センターから55名の臨床医を調査し、3つのIMLモデルとの相互作用について検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:27:18 GMT)
Great Power Brings Great Responsibility: Personalizing Conversational AI for Diverse Problem-Solvers [10.5] 大きな言語モデル(LLM)は、質問に答えたりガイダンスを提供するための潜在的なリソースとして現れています。
LLMは情報提示におけるバイアスを持ち、特に問題解決スタイルが広く表現されない新参者にとって影響が大きい。
このビジョンペーパーは、特定のサブグループの特権化を避けるために、さまざまな問題解決スタイルにAI応答を適用する可能性について概説する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:46:01 GMT)
CREDAL: Close Reading of Data Models [10.4] データモデルのクローズリーディングは、物質性、系図、技術、クローズドな性質、そして技術システムの設計と私たちを結びつける。
現在、データモデルを読むための体系的な方法論は存在しない。
データモデルのクローズリーディングのためのCREDAL手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:42:56 GMT)
Multimodal Needle in a Haystack: Benchmarking Long-Context Capability of Multimodal Large Language Models [10.4] 本稿では,MultiModal Needle-in-a-haystack(MMNeedle)ベンチマークを導入する。
画像ステッチを用いて、入力コンテキスト長をさらに増加させ、サブイメージレベルの検索のためのラベルを自動的に生成するプロトコルを開発する。
我々は、APIベースモデルとオープンソースモデルの両方を含む最先端のMLLMを評価した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:17:24 GMT)
Bag of Tricks for Inference-time Computation of LLM Reasoning [10.4] 複雑度の異なる推論タスクに対して,様々な推論時間計算戦略を検証・ベンチマークする。
我々のアブレーション研究は、これまで見過ごされていた戦略が性能を大幅に向上させることができることを示している。
我々は,8つの推論タスクにまたがる6つの代表的手法を体系的に評価することにより,推論時間計算の標準ベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:31:11 GMT)
kNN For Whisper And Its Effect On Bias And Speaker Adaptation [10.2] token-level $k$ Near neighbor search (k$NN) は、代わりに外部データストアで推論時間検索を使用する非パラメトリックな方法である。
変換器のエンドツーエンド音声モデルであるWhisperが$k$NNの恩恵を受けていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:36:13 GMT)
Latent Linear Quadratic Regulator for Robotic Control Tasks [10.1] 本稿では、状態空間を潜在空間にマッピングする、$textbfla$tent $textbfl$inear $textbfq$uadratic $textbfr$egulator (LaLQR)を提案する。
実験では、LaLQRの他のベースラインに比べて効率と一般化が優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:51:40 GMT)
In-Situ Melt Pool Characterization via Thermal Imaging for Defect Detection in Directed Energy Deposition Using Vision Transformers [10.1] ポーシティや亀裂などの内部欠陥は、機械的特性や全体的な性能を損なう可能性がある。
本研究は,DEDプリント部品の欠陥検出と品質管理の改善を目的として,ポロシティに関連するプールのその場監視とキャラクタリゼーションに焦点を当てた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:16:24 GMT)
Robot Instance Segmentation with Few Annotations for Grasping [10.0] セミスーパーバイザードラーニング(SSL)とラーニング・スルー・インタラクション(LTI)を組み合わせた新しいフレームワークを提案する。
提案手法は,自己スーパービジョンによる注釈付きデータを利用して,ラベルのない静止画像から生成された擬似シーケンスを用いて時間的コンテキストを組み込む。
本手法をARMBenchmix-object-toteとOCIDの2つのベンチマークで検証し,最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:56:18 GMT)
Simplifying Adversarially Robust PAC Learning with Tolerance [10.0] 本稿では,Hの仮定を必要とせずに,VC次元の線形なサンプル複雑性を実現する,より単純な学習者の存在を示す。
学習者が不適切なとしても、H の仮説と「類似」な仮説を出力するという意味では「最も適切」である。
また,アルゴリズムのアイデアを用いて,トレラントな環境下で半教師付き学習者を構築する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:48:40 GMT)
Making Language Models Robust Against Negation [9.8] 本稿では,否定に対して言語モデルをより堅牢にするための自己教師型手法を提案する。
BERTとRoBERTaは、我々のタスクでさらに事前訓練され、9つの否定関連ベンチマークにおいて、既製のバージョンよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:18:47 GMT)
5D Neural Surrogates for Nonlinear Gyrokinetic Simulations of Plasma Turbulence [9.8] 本稿では,5次元ジャイロキネティックシミュレーションのためのニューラルネットワークサロゲートのトレーニング法を提案する。
本手法は階層型視覚変換器を5次元に拡張し,アディバティック電子近似のための5次元分布関数をトレーニングする。
我々の研究は、プラズマ乱流シミュレーションのためのニューラルサロゲートへの道を開き、核融合による商業エネルギー生産の展開を加速させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:25:10 GMT)
Generalization bounds for mixing processes via delayed online-to-PAC conversions [9.8] 統計的学習アルゴリズムの一般化誤差を非i.d.設定で検討する。
我々は,遅延フィードバックによるオンライン学習の削減に基づく,このシナリオの分析フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:57:39 GMT)
VINP: Variational Bayesian Inference with Neural Speech Prior for Joint ASR-Effective Speech Dereverberation and Blind RIR Identification [9.7] 本研究は, ニューラルスピーチ先行(VINP)を用いた変分ベイズ推論フレームワークを提案する。
単チャンネル音声の発声実験では、人間の知覚に関連するほとんどの指標において、VINPが高度なレベルに達することが示されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:54:28 GMT)
Faster Algorithms for Structured Linear and Kernel Support Vector Machines [9.6] 二次的目的が低ランクの分解を許容する場合に、2次プログラムを解くための最初のニア線形時間アルゴリズムを設計する。
正方形のデータセット半径が少なくとも$Omega(log2 n)$の場合、$Omega(n2-o(1))$ timeが要求される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:37:03 GMT)
SEMU: Singular Value Decomposition for Efficient Machine Unlearning [9.6] マシン・アンラーニング(MU)は、今後の安全規則を満たすためにますます重要になっている。
効率的な機械学習(SEMU)のための特異値分解法を提案する。
SEMUは変更が必要なモデルパラメータの数を最小限に抑え、不要な知識を効果的に除去する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:36:39 GMT)
Libra: Architectural Support For Principled, Secure And Efficient Balanced Execution On High-End Processors (Extended Version) [9.4] 制御フローリーク(CFL)攻撃は、攻撃者がサイドチャネルの観測を通して、被害者プログラムの制御フロー決定を公開することを可能にする。
線形化はCFL攻撃に対する唯一の効果的な対策であると広く信じられている。
我々は、ハイエンドプロセッサ上でCFLを効率的に処理するための汎用的で原則化されたハードウェア・ソフトウェア・コーデックであるLibraを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:48:15 GMT)
Articulate That Object Part (ATOP): 3D Part Articulation from Text and Motion Personalization [9.2] ATOP(Articulate That Object Part)は、モーションパーソナライゼーションに基づく新しい手法である。
テキスト入力により、現代のビデオ拡散のパワーをタップして、可塑性な動作サンプルを生成することができる。
すると、入力された3Dオブジェクトは、生成した動画を、私たちが表現したいオブジェクトにパーソナライズするためのイメージプロンプトを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:47:16 GMT)
Engineering topological states and quantum-inspired information processing using classical circuits [9.2] 回路ラプラシアンと格子ハミルトンの類似性を解析し,古典回路に基づく位相物理を導入する。
電気回路に基づく量子インスピレーション情報処理における研究の進展について概説する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:35:22 GMT)
Multitype entanglement dynamics induced by exceptional points [9.0] 2つの連結非エルミート量子ビットからなる一般モデルについて検討する。
元の4階EP(EP4')と2階EP(EP2)の両側の多様な絡み合いダイナミクスを同時に観察することができる。
本研究は、EP誘起量子効果の研究方法と、EP関連量子技術の応用について述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:40:17 GMT)
Exploring Few-Shot Defect Segmentation in General Industrial Scenarios with Metric Learning and Vision Foundation Models [9.0] 本稿では,多種多様な欠陥を有する幅広い産業製品において,FSS(数ショットセマンティックセマンティックセマンティックセマンティクス)を探索することを目的とする。
メタラーニングに基づくものやビジョンファウンデーションモデル(VFM)に基づくものなど、メトリックラーニングに基づくFSS手法を徹底的に検討する。
特徴マッチングに基づく新しい効率的なFDS手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:27:01 GMT)
Efficient Sparsification of Simplicial Complexes via Local Densities of States [8.8] Simplicial Complex (SC) は、データ項目間の高次関係を考慮に入れた計算データのためのグラフモデルの一般化である。
多くの実世界のデータセットの分析により、多くの高次相互作用を持つ高密度のSCが生成される。
SCの確率的スパーシフアクションのための新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:51:42 GMT)
Few-Shot Multi-Human Neural Rendering Using Geometry Constraints [8.8] 本稿では,複数の人物によるシーンの形状と放射率を復元する手法を提案する。
暗黙の神経表現を用いた既存のアプローチは、正確な幾何学と外観をもたらす印象的な結果を得た。
本稿では,その課題に対処するニューラル暗黙的再構築手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:10:58 GMT)
SymGPT: Auditing Smart Contracts via Combining Symbolic Execution with Large Language Models [8.7] 本稿では,大規模言語モデル(LLM)の自然言語理解と記号実行の形式的保証を組み合わせたSymGPTを紹介する。
我々は、広く使用されている3つのERC標準から132のERCルールを実証研究し、その内容、セキュリティへの影響、自然言語記述について検討する。
次に、形式化されたルールから制約を合成し、違反が発生する可能性のあるシナリオを表現し、シンボリック実行を使用してそれらを検出する。
評価の結果,SymGPTは1,375件を含む4000件の現実契約で5,783件のERCルール違反を特定できた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:34:00 GMT)
Heterogeneous Multi-agent Multi-armed Bandits on Stochastic Block Models [8.7] ブロックモデルにより誘導されるクラスタ構造を持つ異種マルチエージェント・マルチエージェント・バンドイット問題について検討する。
本稿では,既知のクラスタ設定と未知のクラスタ設定の両方に適用可能な新しいアルゴリズムを提案する。
ガウス代入の報酬の下で、最適のインスタンス依存後悔上限$logT$を導出する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:57:19 GMT)
A Robotics-Inspired Scanpath Model Reveals the Importance of Uncertainty and Semantic Object Cues for Gaze Guidance in Dynamic Scenes [8.6] 本稿では,物体のセグメンテーションと視線挙動を相互接続的にシミュレーションする計算モデルを提案する。
このモデルでは,サスカディック・モーメントや事前サカディック・アテンションなどの拡張が可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:18:26 GMT)
Global Universal Scaling and Ultra-Small Parameterization in Machine Learning Interatomic Potentials with Super-Linearity [8.6] 我々は超線形MLIPを開発し,SUS2-MLIPと呼ばれる超線形パラメータ化と拡張された表現能力を両立させた。
SUS2-MLIPは、最先端のMLIPモデルよりも優れた計算効率を持つ。
この研究は、物理的制約を人工知能支援材料シミュレーションに取り入れることに光を当てている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:34:31 GMT)
Self-Harmonized Chain of Thought [8.5] CoT(Chain-of- Thought)プロンプトは、中間ステップを通じて複雑な推論を行うための大きな言語モデルの能力を示している。
多様な解経路を一貫した効果的な推論パターンに統一する新しい手法ECHOを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:12:21 GMT)
Effects of Random Edge-Dropping on Over-Squashing in Graph Neural Networks [8.5] 遠方ノード間の感度に対するDropEdgeの負の効果を特徴付ける理論的結果を示す。
我々の発見は容易にその変種に拡張され、過度な監視にどのように影響するかを包括的に理解することが可能になる。
我々の結論は、深いGNNを訓練するために設計された様々な手法を再評価する必要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:36:38 GMT)
CASC-AI: Consensus-aware Self-corrective AI Agents for Noise Cell Segmentation [8.5] 高解像度ギガピクセル全スライド画像における多クラス細胞セグメンテーションは様々な臨床応用に不可欠である。
近年の取り組みは、医療の専門知識を持たないレイアノテータを巻き込むことによって、このプロセスを民主化している。
本稿では,Consensus Matrixを利用して学習プロセスをガイドする,コンセンサス対応の自己修正型AIエージェントを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:58:50 GMT)
Rapid-stable Collective Charging and Reverse Suppressing in Many-Body Quantum Batteries [8.4] 量子電池の実用化における2つの大きな課題は、高速安定充電を実現する方法と、高速安定充電の逆のメカニズムを特定する方法である。
本研究は, 周囲環境と相互作用する多体帯電QB方式を提案する。
物理動作機構をバッテリシステムとして解析し, 強い環境結合下での高速で安定した集団充電を実現する機構を探索し, 逆機構を抑制する様々な物理手法を詳細に解析する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:42:43 GMT)
Group & Reweight: A Novel Cost-Sensitive Approach to Mitigating Class Imbalance in Network Traffic Classification [8.4] 本稿では,厳密なクラス不均衡の存在下でのネットワークトラフィックの分類に焦点をあてる。
クラス不均衡を軽減するためのグループ・アンド・リウェイト戦略を設計する。
その結果,本手法はクラス不均衡の負の効果を抑えるだけでなく,予測における総合的な性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:38:53 GMT)
PFedDST: Personalized Federated Learning with Decentralized Selection Training [8.2] 本稿ではPFedDST(Personalized Federated Learning with Decentralized Selection Training)フレームワークを紹介する。
PFedDSTは、包括的なコミュニケーションスコアに基づいて、デバイスが戦略的に評価し、ピアを選択することによって、モデルトレーニングを強化する。
実験の結果,PFedDSTはモデル精度を向上するだけでなく,収束を加速することがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:25:48 GMT)
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play [8.1] VolleyBotsは新しいMARLテストベッドで、複数のドローンが協力し、物理的なダイナミクスの下でバレーボールを競う。
単流体ドリルから多流体協調・競争タスクまで,幅広いタスクスイートを提供する。
シミュレーションの結果、既存のアルゴリズムは単純なタスクを効果的に処理するが、低レベルの制御と高レベルの戦略の両方を必要とする複雑なタスクでは困難に直面することがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:00:12 GMT)
Vulnerability-Triggering Test Case Generation from Third-Party Libraries [8.1] VULEUTは、クライアントソフトウェアプロジェクトで一般的に使用されているサードパーティ製ライブラリの脆弱性の悪用を自動検証するように設計されている。
VULEUTはまず、脆弱性条件の到達可能性を決定するためにクライアントプロジェクトを分析する。
次に、Large Language Model (LLM)を活用して、脆弱性確認のためのユニットテストを生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:53:20 GMT)
RAGFormer: Learning Semantic Attributes and Topological Structure for Fraud Detection [8.1] 本稿では,transFormer(RAGFormer)を用いたRelation-Aware GNNという新しいフレームワークを提案する。
RAGFormerはセマンティック機能とトポロジ機能の両方をターゲットノードに埋め込む。
単純なネットワークはセマンティックエンコーダ、トポロジーエンコーダ、アテンション融合モジュールで構成される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:29:00 GMT)
Graph Neural Networks in EEG-based Emotion Recognition: A Survey [8.0] 重要なトレンドは、脳波に基づく感情認識のためのグラフニューラルネットワーク(GNN)を開発することである。
情動脳波の脳領域依存性は、この領域のGNNと他の時系列領域のGNNを区別する生理的基盤を持つ。
脳波に基づく感情認識におけるGNN構築のための明確なガイダンスを提供するために,フレームワークの3段階から手法を分析し,分類する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:18:57 GMT)
Impostor Phenomenon Among Software Engineers: Investigating Gender Differences and Well-Being [8.0] ソフトウェア専門家の半数以上がインポスタ・フェノメノン(IP)を経験しており、女性の方が男性よりも顕著に多い。
IPはうつ病や燃え尽き症候群などのメンタルヘルスにつながり、個人の幸福とソフトウェア専門家の生産性に大きな影響を及ぼす可能性がある。
本研究は、人種・民族性、婚姻状況、子供の数、年齢、職業経験との交点にまたがるソフトウェア専門家間のIPの出現状況について考察する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:36:44 GMT)
Ultra-sensitive integrated circuit sensors based on high-order nonHermitian topological physics [8.0] これらのセンサの摂動によって引き起こされる周波数シフトは、デバイスのサイズに関して指数関数的な成長を示す。
0.001fF以下のシステムの感度は実験的に検証されており、障害に対して堅牢である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:21:35 GMT)
ConMeC: A Dataset for Metonymy Resolution with Common Nouns [7.9] 我々は、NLPシステムは、文脈における共通名詞のメトニム的使用を識別できるべきであると論じる。
6,000の文からなる新しいメトニミーデータセットConMeCを作成します。
本稿では,大規模言語モデルを用いたメトニミー検出のためのチェーン・オブ・ソートに基づくプロンプト手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:39:36 GMT)
Cross-Lingual Transfer Learning for Speech Translation [7.8] 本稿では,制限データを用いた音声基礎モデルの音声翻訳機能の拡張について検討する。
Whisperは、音声認識と英訳に強い性能を持つ音声基礎モデルであり、その例として用いられる。
音声から音声への検索を用いて,エンコーダが生成した音声表現を分析し,異なる言語からの発話を共有意味空間にマッピングすることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:55:04 GMT)
SAFR: Neuron Redistribution for Interpretability [7.8] 重ね合わせ(英: superposition)とは、単一ニューロン内の複数の特徴の表現を符号化することである。
期待された性能にもかかわらず、モデルの解釈可能性は低下している。
本稿では,特徴重畳を正規化することによってモデル解釈可能性を高める新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:26:45 GMT)
Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators [7.7] CIMはディープニューラルネットワーク(DNN)の効率的な実装方法である
CIMはアナログ・デジタルコンバータ(ADC)のかなりのオーバーヘッドに悩まされている
細胞制限と複数の細胞の必要性により生じる低ビットの重量制限はさらなる課題を呈している。
この研究は、重みと部分サム量子化の粒度をカラム単位で整列させることによって、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:32:14 GMT)
HAIL: An Efficient Iterative Algorithm for Qubit Mapping via Layer-Weight Assignment and Search Space Reduction [7.7] 現在の量子デバイスは物理的量子ビットと限られた数の隣接する量子ビット間の相互作用しかサポートしていない。
回路を実行するには、キュービット間のマッピング関係を調整するためにSWAPゲートを挿入する必要がある。
本稿では,新たなSWAPゲートを最小化するための効率的な反復量子ビットマッピングアルゴリズムであるHAILを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:21:33 GMT)
Distinguished Quantized Guidance for Diffusion-based Sequence Recommendation [7.7] 拡散型シーケンスレコメンデーション(DiQDiff)のための分散量子ガイダンスを提案する。
DiQDiffは、ユーザ関心を理解するための堅牢なガイダンスを抽出し、DM内でパーソナライズされたユーザ関心のための優れたアイテムを生成することを目的としている。
先行するアプローチに対するDiQDiffの優れたレコメンデーション性能は、シーケンシャルなレコメンデーションタスクにおける有効性を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:52:43 GMT)
ADMN: A Layer-Wise Adaptive Multimodal Network for Dynamic Input Noise and Compute Resources [7.6] マルチモーダルディープラーニングシステムは、様々な計算資源の可用性と入力の質の変動に苦慮している。
両課題に対処可能なレイヤワイド適応深度マルチモーダルネットワーク ADMN を提案する。
評価の結果, ADMNは, 浮動小数点演算の75%を削減しつつ, 最先端ネットワークの精度を向上できることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:19:44 GMT)
Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving [7.6] 本稿では,新しい並列検出,追跡,予測手法であるニューラルベイズ動作復号法を提案する。
対話型セマンティックデコーディングを用いて、セマンティックタスクにおける情報交換を強化し、肯定的な伝達を促進する。
提案手法は,計画モジュールの変更を伴わないオープンループ計画評価において,最先端の衝突率を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:21:31 GMT)
Faux Polyglot: A Study on Information Disparity in Multilingual Large Language Models [7.6] 言語間RAGに基づく情報検索における言語嗜好について検討した。
その結果,LLMは問合せ言語と同じ言語で情報に対する体系的バイアスを示すことがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:17:53 GMT)
USRNet: Unified Scene Recovery Network for Enhancing Traffic Imaging under Multiple Adverse Weather Conditions [7.6] 複数種類の画像劣化を処理できる統一シーン回復ネットワーク (USRNet) を導入する。
USRNetは、シーンエンコーダ、注意駆動ノード独立学習機構(NILM)、エッジデコーダ、シーン復元モジュールからなる洗練されたアーキテクチャを備えている。
実験の結果,USRNetは複雑な画像劣化処理において既存の手法を超越していることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:47:58 GMT)
An Interactive Framework for Implementing Privacy-Preserving Federated Learning: Experiments on Large Language Models [7.5] フェデレートラーニング(FL)は、ユーザのデータをローカルデバイスに保存することで、プライバシを高める。
最近の攻撃は、トレーニング中にユーザーが共有したアップデートが、データに関する重要な情報を明らかにすることを実証している。
プライバシ実践者としての人間エンティティを統合し,モデルのプライバシとユーティリティの最適なトレードオフを決定するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:07:14 GMT)
Towards a Robust Framework for Multimodal Hate Detection: A Study on Video vs. Image-based Content [7.5] ソーシャルメディアプラットフォームは、さまざまなモダリティにまたがるヘイトフルコンテンツの伝播を可能にする。
近年のアプローチでは、個々のモダリティを扱うことは約束されているが、異なるモダリティの組み合わせにおけるそれらの有効性は未解明のままである。
本稿では,マルチモーダルヘイト検出における融合に基づくアプローチの体系的分析を行い,ビデオコンテンツと画像コンテンツ間のパフォーマンスに着目した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:07:40 GMT)
Denoising Task Difficulty-based Curriculum for Training Diffusion Models [7.4] 拡散に基づく生成モデルは、生成モデリングの領域において強力なツールとして登場した。
様々な時間経過と騒音レベルを横断する認知度に関する広範な研究にもかかわらず、認知度タスクの相対的困難に関する紛争が続いている。
本稿では,拡散モデルの学習過程を改善するため,カリキュラム学習から手書きの学習手法を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:25:00 GMT)
A duality framework for analyzing random feature and two-layer neural networks [7.4] 我々は$mathcalF_p,pi$およびBarron空間内の関数の学習問題を考察する。
近似と推定の二重同値を確立し、それを用いて先行する関数空間の学習を研究する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:24:23 GMT)
Optimizing Knowledge Distillation in Transformers: Enabling Multi-Head Attention without Alignment Barriers [7.4] 既存の方法は、同じ頭部数を必要とするか、次元ギャップを橋渡しするためにプロジェクターを導入する。
Squeezing-Heads Distillation (SHD) は頭部数が異なるモデル間のシームレスな知識伝達を可能にする新しい手法である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:24:57 GMT)
Data Assetization via Resources-decoupled Federated Learning [7.3] フェデレートラーニング(FL)は、プライバシーを維持しながら協調トレーニングモデルに効果的なアプローチを提供する。
まず,3つの関係者を巻き込んだ資源分離FLの枠組みを提案する。
次に,QD-RDFL(Quality-Aware Dynamic Resources-Decoupled FL Algorithm)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:03:49 GMT)
UKTA: Unified Korean Text Analyzer [7.3] UKTA (Unified Korean Text Analyzer) は、韓国の総合的なテキスト分析・筆記評価システムである。
UKTAは、正確な低レベルの形態素解析、中レベルの説明可能性のための重要な語彙特徴、透明な高レベルのルーリックベースの筆記スコアを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:30:56 GMT)
A Survey on Mamba Architecture for Vision Applications [7.2] Mambaアーキテクチャは、ビジュアルタスクにおけるスケーラビリティの課題に対処する。
Vision MambaとVideoMambaは双方向走査、選択メカニズム、時間処理を導入し、画像とビデオの理解を高めている。
これらの進歩は、マンバをコンピュータビジョンの研究と応用における有望なアーキテクチャとして位置づけている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:59:30 GMT)
The Benefits of Balance: From Information Projections to Variance Reduction [7.1] モダリティとソース間のデータバランシングは、実際には疑わしいメリットがある。
この分散還元効果を定量化し、マルコフ作用素の固有値崩壊と関連付ける非漸近統計境界を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:47:11 GMT)
Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art [7.1] 意思決定タスクにおける基礎モデルの現状について論じる。
我々は、モデル決定の確実性を定量化できるシステムを後退して同時に設計する必要があると主張している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:40:41 GMT)
Probabilistic Foundations for Metacognition via Hybrid-AI [7.0] 本稿では「エラー検出・修正規則」として知られるハイブリッドAIアプローチについてレビューする。
従来の実証研究に厳密さを加える確率的枠組みを導入する。
我々はこの枠組みを用いてメタ認知改善に必要な十分な条件について結果を証明している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:57:13 GMT)
The Plug-in Approach for Average-Reward and Discounted MDPs: Optimal Sample Complexity Analysis [7.0] 平均回帰マルコフ決定過程において,$varepsilon$-optimal Policyを学習するためのプラグインアプローチのサンプル複雑性について検討した。
この問題の最も単純なアルゴリズムであるにもかかわらず、プラグインのアプローチは理論上は分析されていない。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:14:22 GMT)
Attention Learning is Needed to Efficiently Learn Parity Function [6.9] 我々は$k$-parity問題で変換器を解析する。
我々は変換器が$O(k)$パラメータしか必要とせず、FFNNが必要とする理論的な下界を超えることを証明した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:41:30 GMT)
Assessing the Sustainability and Trustworthiness of Federated Learning Models [6.8] 欧州委員会のAI-HLEGグループは、信頼できるAIに対する持続可能なAIの重要性を強調した。
この研究は、信頼できるFL分類にサステナビリティの柱を導入し、AI-HLEGの要求に最初に対処する。
FLモデルの信頼性を評価するために,サステナビリティを考慮したアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:55:09 GMT)
Analytical Lyapunov Function Discovery: An RL-based Generative Approach [6.8] 解析的リアプノフ関数(ローカル)を構築するために変換器を用いたエンドツーエンドフレームワークを提案する。
本フレームワークは,候補リアプノフ関数を生成するトランスフォーマーベーストレーナーと,候補表現を検証するファルシファイアから構成される。
本稿では,制御文献に未同定なリアプノフ関数が発見可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:19:47 GMT)
LOGCAN++: Adaptive Local-global class-aware network for semantic segmentation of remote sensing imagery [6.7] LOGCAN++はリモートセンシング画像用にカスタマイズされたセマンティックセグメンテーションモデルである。
GCA(Global Class Awareness)モジュールとLCA(Local Class Awareness)モジュールで構成されている。
LCAモジュールは、グローバルクラス表現と間接的にピクセルを関連付けるために、中間知覚要素としてローカルクラス表現を生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:57:22 GMT)
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion [6.7] Playmateは、より生き生きとした表情と話す顔を生成するために提案されている。
最初の段階では、より正確な属性の絡み合いを容易にするために、分離された暗黙の3D表現を導入する。
第2段階では、感情制御情報を潜在空間にエンコードする感情制御モジュールを導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:53:48 GMT)
Towards a Formal Theory of the Need for Competence via Computational Intrinsic Motivation [6.6] 我々は、自己決定理論(SDT)における「能力の必要性」に焦点をあてる。
我々は、強化学習(RL)の分野から計算モデルを描くことにより、これらの矛盾が軽減される可能性を示唆する。
我々の研究は、理論の側面を定式化した新しい計算モデルを導入し、理論を洗練させるために実験的にテストできる理論開発のサイクルを支援することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:03:40 GMT)
PICTS: A Novel Deep Reinforcement Learning Approach for Dynamic P-I Control in Scanning Probe Microscopy [6.6] 我々は、深層強化学習を活用して、プローブ顕微鏡法をリアルタイムに制御戦略を動的に調整する並列統合制御訓練システムを開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:43:46 GMT)
EnvId: A Metric Learning Approach for Forensic Few-Shot Identification of Unseen Environments [6.6] 本稿では環境識別のための表現学習フレームワークEnvIdを提案する。
EnvIdは、タスクを数ショットの分類問題としてモデル化することで、ケース固有の再トレーニングを避ける。
目に見えない信号劣化、分布外残響特性、記録位置ミスマッチの下でも良好な品質予測を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:40:27 GMT)
Dockerfile Flakiness: Characterization and Repair [6.5] Dockerfileのフレキネスに関する最初の包括的な研究で、Docker化された8,132のプロジェクトの9ヶ月にわたる分析を特徴としている。
本稿では,依存性エラーやサーバ接続の問題など,一般的なフラキネスの原因を分類する分類法を提案する。
静的および動的解析,類似性検索,および大規模言語モデルを用いた反復的フィードバックループを組み合わせた新しい修復フレームワークであるFLAKIDOCKを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:50:36 GMT)
GMem: A Modular Approach for Ultra-Efficient Generative Models [6.5] GMem:超効率的な生成モデルのためのモジュラーアプローチを紹介する。
我々のアプローチであるGMemは、メモリ容量をモデルから切り離し、別のイミュータブルメモリセットとして実装する。
ImageNetの256倍256ドルの解像度で、GMemはSiTに比べて50倍のトレーニングスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:05:30 GMT)
Direct Ascent Synthesis: Revealing Hidden Generative Capabilities in Discriminative Models [6.5] 判別モデルは本質的に強力な生成能力を含むことを示す。
我々の手法であるDirect Ascent Synthesisは、これらの潜伏能力を明らかにする。
DASは複数の空間スケールで最適化を分解することで高品質な画像合成を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:27:27 GMT)
Revisiting the Initial Steps in Adaptive Gradient Descent Optimization [6.5] Adamのような適応的な勾配最適化手法は、さまざまな機械学習タスクにわたるディープニューラルネットワークのトレーニングで広く使われている。
これらの手法は、降下勾配 (SGD) と比較して最適下一般化に苦しむことが多く、不安定性を示す。
非ゼロ値で2階モーメント推定を初期化する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:23:39 GMT)
MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance [6.5] 本研究では,マルチオブジェクトを用いたレイアウト誘導ゼロショット画像パーソナライズのためのMS-Diffusionフレームワークを提案する。
提案した多目的クロスアテンションオーケストラは、テキストの制御を保ちながら、オブジェクト間コンポジションを編成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:58:09 GMT)
Classification or Prompting: A Case Study on Legal Requirements Traceability [6.4] ソフトウェア開発が倫理的懸念に準拠し、公共の安全を優先することを保証するために、新しい規制が継続的に導入されている。
コンプライアンスを示すための前提条件は、ソフトウェア要件を法的規定にトレースすることである。
本稿では,要件と法的規定のトレースリンクを予測するための2つの自動解について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:16:29 GMT)
Quantifying the benefits of code hints for refactoring deprecated Java APIs [6.4] このタスクの自動化には,コードヒントが有効であることを示す。
我々の実験は、コードヒントがこのタスクの自動化を可能にしていることを示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:22:24 GMT)
Trustworthy AI on Safety, Bias, and Privacy: A Survey [6.3] 我々は、この分野の現状を調査し、AIモデルの信頼性に挑戦する懸念について、有望な洞察と視点を提示する。
本稿では,モデルの信頼性を損なう安全,プライバシ,バイアスの3つの推力に関する問題点について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:08:42 GMT)
JamendoMaxCaps: A Large Scale Music-caption Dataset with Imputed Metadata [6.2] JamendoMaxCapsは、有名なJamendoプラットフォームから20万以上のフリーライセンスの楽器トラックを特徴とする、大規模な音楽キャプチャデータセットである。
データセットには、最先端のキャプションモデルによって生成されたキャプションが含まれており、暗黙のメタデータで強化されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:12:19 GMT)
Machine Learning for Scalable and Optimal Load Shedding Under Power System Contingency [6.2] ネットワーク制限を考慮に入れた最適なロードシェディング(OLS)は、同時実行シナリオの多様なシステム全体への影響に対処する可能性がある。
本稿では、ニューラルネットワーク(NN)モデルのオフライントレーニングを活用して、個別の負荷センターに分散した設計を行い、OLSソリューションを自律的に構築する。
我々のLearning-for-OLSアプローチは、オンライン緊急応答における計算と通信の必要性を大幅に削減できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:43:34 GMT)
Modelling Chemical Reaction Networks using Neural Ordinary Differential Equations [6.2] 化学反応ネットワーク理論において、通常の微分方程式は化学種濃度の時間変化をモデル化するために用いられる。
本研究の目的は, 動的モデリングと深層学習を, ニューラル常微分方程式の形で組み合わせることで, 反応ネットワークにおけるこれらの隠れた洞察を解明することである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:10:33 GMT)
Efficient First-Principles Framework for Overdamped Phonon Dynamics and Anharmonic Electron-Phonon Coupling in Superionic Materials [6.2] 超イオン導体における局所障害、無調波性、電子-フォノン結合を記述するために、ab initio準静電多相構造を導入する。
提案手法は,超イオン結晶における電子構造計算を効率よく行うことで,その高次量化を解明する手法である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:21:40 GMT)
A Study on the Importance of Features in Detecting Advanced Persistent Threats Using Machine Learning [6.1] Advanced Persistent Threats (APT) は、組織や産業に重大なセキュリティリスクをもたらす。
これらの高度な攻撃を緩和することは、APTのステルス性と永続性のために非常に難しい。
本稿では,ネットワークトラフィックを記録する際に考慮された測定値を分析し,APTサンプルの検出にどの特徴が寄与するかを結論する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:06:03 GMT)
Towards scientific discovery with dictionary learning: Extracting biological concepts from microscopy foundation models [6.1] 我々は、ICFL(Iterative Codebook Feature Learning)を提案し、制御データセットからPCAホワイトニングを使用する前処理ステップと組み合わせる。
ICFL と PCA は,TopK スパースオートエンコーダと比較して,抽出した特徴の選択性を向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:54:45 GMT)
Diffusion Suction Grasping with Large-Scale Parcel Dataset [6.1] 提案するParcel-Suction-Datasetは,4億1000万の高精度な吸引把握ポーズを備えた,25万の散布シーンを含む大規模合成データセットである。
このデータセットは、最適吸引グリップの効率的な生成を可能にする新しい幾何サンプリングアルゴリズムによって生成される。
また、条件生成タスクとして、吸引把握予測を再構成する革新的なフレームワークであるDiffusion-Suctionを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:09:11 GMT)
MoENAS: Mixture-of-Expert based Neural Architecture Search for jointly Accurate, Fair, and Robust Edge Deep Neural Networks [6.1] Mixture-of-Experts-based Neural Architecture Search (MoENAS)は、専門家の混合空間をナビゲートして、正確で公平で堅牢で汎用的なDNNを発見する自動設計技術である。
MoENASはSOTAエッジDNNと比較して精度を4.02%改善し、肌の色調の差を149%から5.60%に下げる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:02:43 GMT)
Generative Conformal Prediction with Vectorized Non-Conformity Scores [6.1] コンフォーマル予測は、保証されたカバレッジでモデルに依存しない不確実性定量化を提供する。
ベクトル化された非整合性スコアを持つ生成共形予測フレームワークを提案する。
我々は密度ランクの不確かさ球を用いた適応不確かさ集合を構築する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:09:52 GMT)
Vision Foundation Models in Remote Sensing: A Survey [6.0] ファンデーションモデルは、前例のない精度と効率で幅広いタスクを実行することができる大規模で事前訓練されたAIモデルである。
本調査は, 遠隔センシングにおける基礎モデルの開発と応用を継続するために, 進展のパノラマと将来性のある経路を提供することによって, 研究者や実践者の資源として機能することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:29:52 GMT)
Negative Dependence as a toolbox for machine learning : review and new developments [6.0] 負の依存は、伝統的な独立の限界を越えて学習能力を前進させる上で重要な要因になりつつある。
最も一般的な負依存モデルとして、決定点過程(DPP)がある。
本稿では,DPPをニューラルネットワークの擬似表現に適用した新しい結果を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:04:49 GMT)
TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks [6.0] 一般化されたCCNNは、任意の(グラフ)ニューラルネットワークをトポロジカルディープラーニングに変換するために使用することができる。
TDLを加速し、民主化するために、私たちは、GCCNを定義し、構築し、訓練するための軽量ソフトウェアであるTopoTuneを紹介します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:49:04 GMT)
Corporate Greenwashing Detection in Text - a Survey [6.0] グリーンウォッシング(Greenwashing)とは、国家や企業などの環境への影響を国民に誤解させる取り組みである。
本稿では,グリーンウォッシングを識別するための自然言語処理手法に関する科学的文献を包括的に調査する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:28:56 GMT)
CollabStory: Multi-LLM Collaborative Story Generation and Authorship Analysis [5.9] 私たちはCollabStoryと呼ばれる、初めてLLM生成のコラボレーティブなストーリーデータセットを生成します。
オープンソース命令チューニング LLM を用いて,32k 以上のストーリーを生成する。
複数LLM設定のためのオーサシップ関連タスクを拡張し,LLM-LLMコラボレーションのためのベースラインを提示する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:09:38 GMT)
MAAT: Mamba Adaptive Anomaly Transformer with association discrepancy for time series [5.9] 時系列における異常検出は, 産業モニタリングや環境センシングに不可欠である。
既存の手法では、短期的な文脈に対する感受性や、ノイズの多い非定常環境における非効率性といった制限に直面している。
関連性モデリングと再構成品質を向上させる改良されたアーキテクチャであるMAATを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:22:06 GMT)
FedAPA: Server-side Gradient-Based Adaptive Personalized Aggregation for Federated Learning on Heterogeneous Data [5.9] FedAPAは、パーソナライズされたモデルを生成するためのサーバサイドの勾配に基づく適応アダプティブアグリゲーション戦略を備えた、新しいPFL手法である。
FedAPAは理論収束を保証し、3つのデータセットにわたる10のPFL競合と比較して精度と計算効率が優れている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:00:58 GMT)
Human-in-the-Loop Annotation for Image-Based Engagement Estimation: Assessing the Impact of Model Reliability on Annotation Accuracy [5.9] 本研究では,ハイパフォーマンスなイメージベース感情モデルをHITLアノテーションフレームワークに統合する。
モデル信頼性および認知フレーミングの変化が、人間の信頼、認知負荷、アノテーション行動にどのように影響するかを検討する。
人間の監視と自動システムの強みを活用することにより、感情アノテーションのためのスケーラブルなHITLフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:37:10 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:18:12 GMT)
SNAP: Sequential Non-Ancestor Pruning for Targeted Causal Effect Estimation With an Unknown Graph [5.8] 我々は,目的変数間の因果関係を,計算的かつ統計的に効果的に同定することに注力する。
対象の特定の非祖先は、目標間の因果関係を学習し、効率的な調整セットを特定するのに不要であることを示す。
両手法とも, 因果効果評価の品質を損なうことなく, 独立性試験数と計算時間を大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:20:57 GMT)
Quantum learning advantage on a scalable photonic platform [5.8] 物理システムの学習における量子的優位性は 未解決のフロンティアのままです
本稿では、ボゾン変位過程の確率分布を学習するための量子拡張プロトコルのフォトニック実装を提案する。
この結果から,非理想的,雑音的絡み合いであっても,連続変数量子系において有意な量子優位性を実現することができることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:52:43 GMT)
Explaining 3D Computed Tomography Classifiers with Counterfactuals [5.8] 2次元アプリケーションから3次元CTスキャンに拡張する。
限られたトレーニングサンプルや高いメモリ要求など,3Dデータに関連する課題に対処する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:44:20 GMT)
Towards a Value-Complemented Framework for Enabling Human Monitoring in Cyber-Physical Systems [5.8] この研究プレビューは、システム設計中にプライバシ、セキュリティ、セルフダイレクトを組み込むことの重要性に焦点を当てている。
目標は、機能的および非機能的な監視要件を人間の値に結び付けて、値、要求、アクター間のトレーサビリティを確立することです。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:07:37 GMT)
Neural Networks and (Virtual) Extended Formulations [5.8] 私たちは、$P$を最適化するニューラルネットワークのサイズに対して、より低い境界を証明します。
我々は、$mathrmxc(P)$が任意のモノトーンや入力ニューラルネットワークのサイズの低い境界であることを示し、$P$を超える線形最適化問題を解く。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:19:32 GMT)
Anatomy of a Digital Bubble: Lessons Learned from the NFT and Metaverse Frenzy [5.7] ランドパーセルをNTTコレクションとして販売する仮想世界プラットフォームであるDecentralandについて検討する。
当初、土地価格は伝統的な不動産価格モデルに従っていた。
NFTの市場価値が大幅に上昇した後、複数のパーセルの短期保有者が主要な販売ポジションを占め始めた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:16:42 GMT)
Mixed-state geometric phases of coherent and squeezed spin states [5.7] スピンコヒーレント状態 (CSS) とスピン圧縮状態 (SSS) の2つの混合状態幾何位相 (Uhlmann phase) とインターフェロメトリー位相 (IGP) を解析した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:32:27 GMT)
Mining Power Destruction Attacks in the Presence of Petty-Compliant Mining Pools [5.7] BitcoinのセキュリティはProof-of-Workのコンセンサスに依存している。
パズルの難易度は、ネットワークの利用可能なマイニングパワーに基づいて、難易度調整機構(DAM)によって設定される。
採掘力の一部を破壊する攻撃は、DAMを悪用して困難を減らし、そのような攻撃は利益を上げることができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:44:41 GMT)
Efficient Continuous Group Convolutions for Local SE(3) Equivariance in 3D Point Clouds [5.7] ポイントクラウド処理のための効率的で連続的で局所的なSE(3)同変畳み込み層を提案する。
提案手法は,オブジェクト分類やセマンティックセグメンテーションなど,さまざまなデータセットやタスクの競合や優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:15:56 GMT)
Polyrating: A Cost-Effective and Bias-Aware Rating System for LLM Evaluation [5.7] ポリーティング(Polyrating)は、最大後方推定に基づく表現的かつ柔軟な評価システムである。
人間の嗜好に影響を与えるバイアスを検出し定量化し、より公平なモデル比較を保証する。
人的評価のコストを、新しいモデルで最大41%、新しいタスクで最大77%削減することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:21:13 GMT)
CataractBot: An LLM-Powered Expert-in-the-Loop Chatbot for Cataract Patients [5.6] CataractBot は LLM を用いて即座に白内障手術に関連する質問に答え、知識ベースをクエリし、専門家が検証した応答を非同期に提供する。
CataractBotは、49人の患者とアテンダント、4人の医師、2人の患者コーディネーターによる初期展開調査で、任意のアクセシビリティを提供し、時間を節約し、さまざまなリテラシーレベルを調整し、患者と医師の間にプライバシー層を追加する可能性を示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:48:43 GMT)
Learning Confident Classifiers in the Presence of Label Noise [5.6] 本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:25:17 GMT)
Ask Patients with Patience: Enabling LLMs for Human-Centric Medical Dialogue with Grounded Reasoning [5.5] Ask patients with Patience (APP) は,LLMが基底的推論に基づいて反復的に診断を洗練できる,最初のマルチターン対話である。
APPは診断予測において高い類似性スコアを達成し、地上の真理診断との整合性を示す。
APPは、ユーザアクセシビリティと共感の面でも優れており、複雑な医療言語とユーザ理解のギャップをさらに埋めている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:13:52 GMT)
Analysis of Overparameterization in Continual Learning under a Linear Model [5.5] 本研究では,勾配降下の簡単な設定における理論的観点から,連続学習と破滅的忘れについて検討する。
線形回帰モデルの文脈において,パラメータ化のみによって忘れを軽減できることを解析的に実証した。
この研究の一環として、単線型回帰タスクのリスクの漸近的でない境界を確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:15:38 GMT)
Memory Analysis on the Training Course of DeepSeek Models [5.5] 本稿では,DeepSeek-v2やDeepSeek-v3といったDeepSeekモデルのトレーニング中のGPUメモリ消費に関する理論的解析を行う。
本報告で論じるトレーニング方針がDeepSeekの公式設定を代表していない点を強調しておくことが重要である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:51:25 GMT)
Adapting Multilingual Embedding Models to Historical Luxembourgish [5.5] 事前訓練された多言語モデル(典型的には現代テキストで評価される)は、OCRノイズと時代遅れの綴りによる歴史的デジタル化コンテンツによる課題に直面している。
歴史的ルクセンブルク語における言語間セマンティック検索における多言語埋め込みの利用について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:35:29 GMT)
Automated Capability Discovery via Model Self-Exploration [5.4] 本稿では,ACD(Automated Capability Discovery)について紹介する。これは1つの基礎モデルを科学者として指定し,オープンなタスクを提案するフレームワークである。
ACDは、被験者モデルにおける驚くべき能力と失敗の両方を自動的に明らかにします。
さまざまなファンデーションモデルにまたがってACDをデモし、単一のチームで発見が難しい何千もの機能を自動的に明らかにすることを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:23:13 GMT)
Improving and Assessing the Fidelity of Large Language Models Alignment to Online Communities [5.4] 大規模言語モデル(LLM)は個人やコミュニティの表現において有望であることを示している。
本稿では,LLMとオンラインコミュニティの連携を行うためのフレームワークを提案する。
ダイエットと体像を中心としたオンラインコミュニティに適用することで,我々のアプローチの有用性を実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:15:47 GMT)
Deep Semantic Graph Learning via LLM based Node Enhancement [5.3] 大規模言語モデル(LLM)は、テキストセマンティクスを理解する上で優れた能力を示している。
本稿では,グラフトランスフォーマーアーキテクチャとLLM拡張ノード機能を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:55:46 GMT)
On Exact Space-Depth Trade-Offs in Multi-Controlled Toffoli Decomposition [5.3] Clifford $+$ T ゲートセットを用いた Multi Toffoli (MCT) の最適化実装について検討する。
古典的2制御トフォリを用いたトフォリ深度と深度とのトレードオフの定量化を行う。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:37:27 GMT)
A Survey of Representation Learning, Optimization Strategies, and Applications for Omnidirectional Vision [5.2] 近年、顧客レベルの360度カメラが利用可能になったことにより、全方向視界がより普及している。
ディープラーニング(DL)の進歩は、その研究と応用を大きく引き起こした。
本稿では,全方位視における最近のDLの進歩について,体系的かつ包括的なレビューと分析を行った。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:05:11 GMT)
Causal Additive Models with Unobserved Causal Paths and Backdoor Paths [5.1] 最先端の方法論は、一対の変数間の因果関係を決定することは、観測されていないバックドアや観測されていない因果経路の存在下では不可能であることを示している。
本研究では,この理論に2つの新しい成分を組み込むことにより,因果方向の解法がある種のシナリオで実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:35:15 GMT)
Treatment Effect Estimation for Exponential Family Outcomes using Neural Networks with Targeted Regularization [5.1] 低バイアスや二重強靭性など,望ましい特性を持つNNベースの推定器の設計方法を示す。
関数的対象正規化を指数族に一般化することにより, NNベースのADCF推定器を開発し, 対応する理論収束率を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:36:20 GMT)
Towards Efficient and Multifaceted Computer-assisted Pronunciation Training Leveraging Hierarchical Selective State Space Model and Decoupled Cross-entropy Loss [5.1] HMambaは、APAとMDDタスクをシームレスに並列に統合する新しいCAPTアプローチである。
speechocean762ベンチマークデータセットの総合的な実験結果の集合は、我々のAPAに対するアプローチの有効性を示す。
提案手法は,F1スコア63.85%を達成し,強力なベースラインよりもMDD性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:17:29 GMT)
Scalable and Robust Physics-Informed Graph Neural Networks for Water Distribution Systems [5.1] 水供給システム(WDS)は、気候変動や都市の成長に直面して、重要インフラの重要な部分である。
我々は,WDSの効率的な計画,拡張,再生を可能にする,堅牢でスケーラブルな補助的深層学習(DL)モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:38:14 GMT)
Beyond surveys: A High-Precision Wealth Inequality Mapping of China's Rural Households Derived from Satellite and Street View Imageries [5.0] 本稿は、農村部における「スキー」なリモートセンシング画像と「地上」な街路ビュー画像を統合し、きめ細かい「計算可能な」技術経路を構築することを目的とする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:36:25 GMT)
Guiding Time-Varying Generative Models with Natural Gradients on Exponential Family Manifold [5.0] 時間変化生成モデルの進化は指数族多様体に射影できることを示す。
次に、自然な勾配降下スキームに従って、多様体上の射影を移動させることで生成モデルを訓練する。
指数族内の任意のパラメトリックモデルのクローズドフォーム更新ルールを特徴とするアルゴリズムの粒子バージョンを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:39:47 GMT)
Supply Chain Network Security Investment Strategies Based on Nonlinear Budget Constraints: The Moderating Roles of Market Share and Attack Risk [4.9] 本研究では、予算制約のないサイバーセキュリティ投資最適化モデルを提案する。
このモデルは、2つの小売店と2つの需要市場の実験的なスケナリオスにおいて、高いサイバーセキュリティレベル0.96と0.95を達成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:37:58 GMT)
FADE: Forecasting for Anomaly Detection on ECG [4.9] 本研究の目的は,通常の心電図予測と異常検出のために設計された深層学習システムFADEを提案することである。
FADEは、新しい形態学的にインスパイアされた損失関数で、自己監督的な方法で訓練されている。
本手法は,心電図信号と実際のセンサデータとの新たな距離関数を用いて,心臓の異常を効果的に同定する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:19:39 GMT)
Don't Just Demo, Teach Me the Principles: A Principle-Based Multi-Agent Prompting Strategy for Text Classification [4.8] 本稿では,テキスト分類のための簡易かつ効果的なマルチエージェントプロンプトであるPRINCIPLE-BASED PROMPINGを提案する。
提案手法はマクロF1スコアでのゼロショットプロンプトよりも大きなパフォーマンス向上(1.55%から19.37%)を達成する。
我々のマルチエージェント PRINCIPLE-BASED PROMPING アプローチは、実演ベースの少数ショットプロンプトアプローチと比較して、オンパーまたはより良いパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:10:13 GMT)
Learning Effective Dynamics across Spatio-Temporal Scales of Complex Flows [4.8] 本稿では,グラフニューラルネットワーク(GNN)とアテンションに基づく自己回帰モデルを活用したグラフベース効果的ダイナミクス学習(Graph-LED)を提案する。
本研究では,シリンダーを過ぎる流れや,レイノルズ数の範囲の後方方向のステップを流れる流れなど,流体力学の一連の問題に対する提案手法を評価する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:14:30 GMT)
Multi-Task-oriented Nighttime Haze Imaging Enhancer for Vision-driven Measurement Systems [4.7] ヘイズなどの逆画像条件は、画質を著しく劣化させる。
マルチタスク指向型夜間ヘイズイメージングエンハンサー(MToIE)を提案する。
MToIEは、昼間の脱毛、低照度強化、夜間の脱毛という3つのタスクを取り入れている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:22:21 GMT)
From Brainwaves to Brain Scans: A Robust Neural Network for EEG-to-fMRI Synthesis [4.7] E2fNetは低コストの脳波データからfMRI画像を合成するための,シンプルで効果的なディープラーニングモデルである。
E2fNetは、電極チャネル間のEEGから正確なfMRI表現に意味のある機能をキャプチャし、翻訳するように設計されている。
以上の結果から,E2fNetはニューロイメージング能力を高めるための有望で費用対効果の高いソリューションであることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:55:16 GMT)
Color-Quality Invariance for Robust Medical Image Segmentation [4.7] 単一ソース領域の一般化は、医療画像のセグメンテーションにおいて重要な課題である。
動的カラー画像正規化(DCIN)モジュールとカラー品質一般化(CQG)損失の2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:47:37 GMT)
Safe Interval RRT* for Scalable Multi-Robot Path Planning in Continuous Space [4.7] 連続空間におけるMRPP(Multi-Robot Path Planning)の問題点を考察する。
本稿では,低レベルをサンプリングベースとしたSafe Interval RRT* (SI-RRT*) とし,個々のロボットに対して衝突のない軌道を求める2段階のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:46:36 GMT)
ETimeline: An Extensive Timeline Generation Dataset based on Large Language Model [4.6] ETimelineは1万3000ドル以上のニュース記事を含み、228ドルのニュースドメインに600ドルのバイリンガルドメインがある。
この研究は、時系列生成の研究に貢献し、生成やイベントの関係を含む幅広いタスクをサポートする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:34:33 GMT)
LP-DETR: Layer-wise Progressive Relations for Object Detection [4.6] LP-DETR(Layer-wise Progressive DETR)は,DTRに基づくオブジェクト検出を多スケール関係モデリングにより拡張する手法である。
本稿では,オブジェクトクエリ間の学習可能な空間関係を,関係認識型自己認識機構を通じて導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:25:02 GMT)
CSR-Bench: Benchmarking LLM Agents in Deployment of Computer Science Research Repositories [4.6] 大規模言語モデル(LLM)は、コンピュータ科学研究の様々な分野において大きな進歩を見せている。
我々はコンピュータサイエンス研究プロジェクトのベンチマークであるCSR-Benchを紹介する。
また、複数のLLMエージェントを使用してGitHubコードリポジトリのデプロイを自動化する新しいフレームワーク、CSR-Agentsも導入しました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:25:11 GMT)
SketchFlex: Facilitating Spatial-Semantic Coherence in Text-to-Image Generation with Region-Based Sketches [4.6] SketchFlexは空間条件付き画像生成の柔軟性を改善するために設計されたインタラクティブシステムである。
クラウドソースされたオブジェクト属性とリレーションシップによってリッチ化されたセマンティック空間内の合理的な記述でユーザプロンプトを推論する。
ユーザの粗いスケッチをキャニーベースの形状アンカーに洗練し、ユーザ意図の生成品質とアライメントを保証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:48:11 GMT)
Proceedings 40th International Conference on Logic Programming [4.6] ICLPは1982年以来、論理プログラミングの研究を示す主要な国際イベントとなっている。
この巻の論文や要約には、以下の領域やトピックが含まれる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:13:52 GMT)
Flat U-Net: An Efficient Ultralightweight Model for Solar Filament Segmentation in Full-disk H$α$ Images [4.5] 太陽フィラメントのリアルタイム自動識別は、大量のデータを管理する上で最も効果的な方法である。
既存のフィラメント同定のモデルは、大きなパラメータサイズと高い計算コストによって特徴づけられる。
単純化されたチャネルアテンション(SCA)とチャネル自己注意(CSA)畳み込みブロックを組み込んだ,新規で高効率な超軽量モデルであるFlat U-Netを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:57:33 GMT)
Physiome-ODE: A Benchmark for Irregularly Sampled Multivariate Time Series Forecasting Based on Biological ODEs [4.5] 不規則にサンプリングされた時系列を予測するための最先端の手法は、4つのデータセットといくつかの小さなおもちゃの例に頼っている。
通常の微分方程式から不規則にサンプリングされた時系列データセットを生成する手法を開発した。
私たちは50個のデータセットからなるIMTSデータセットの大規模で洗練されたベンチマークであるPhysome-ODEを作成します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:48:22 GMT)
Entity Linking using LLMs for Automated Product Carbon Footprint Estimation [4.4] 気候変動や持続可能性に関する懸念が高まっているため、製造業者は二酸化炭素排出量削減に向けて大きな一歩を踏み出している。
これらの製造業者にとって、この目標に向けた第一歩は、製品の各コンポーネントの環境影響を特定することである。
本稿では,大規模言語モデル(LLM)を利用して,製造元Bills of Materials(BOM)からLCA(Life Cycle Assessment)データベースへのコンポーネントの自動マッピングを行うシステムを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:54:39 GMT)
Quantifying Quantumness in (A)dS spacetimes with Unruh-DeWitt Detector [4.4] この研究は、デ・ジッター(dS)とアンチ・デ・ジッター(AdS)の時空における量子特性を検出器を介して探索する理論的実現性に焦点を当てている。
無質量スカラー場と結合したUnruh-DeWitt検出器を用いて、dSとAdSの時空における量子不確実性と量子コヒーレンスについて検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:23:57 GMT)
Spread them Apart: Towards Robust Watermarking of Generated Content [4.3] 本稿では,生成したコンテンツに透かしを埋め込む手法を提案する。
埋め込みされた透かしは、境界等級の加法摂動に対して頑健であることを保証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:23:38 GMT)
Joint Modelling Histology and Molecular Markers for Cancer Classification [4.3] 分子マーカーと組織学的特徴を共同で予測するための新しいデジタル病理手法を提案する。
本手法は、グリオーマ、組織学的特徴および分子マーカーの分類において、他の最先端手法よりも優れている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:52:32 GMT)
Revisiting Non-Acyclic GFlowNets in Discrete Environments [4.2] 離散環境における非巡回GFlowNetの理論的枠組みを提案する。
固定された後方方針によるトレーニング、流れ関数の性質、エントロピー規則化されたRLと非環状GFlowNetの接続に関する、様々な新しい理論的知見を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:55:03 GMT)
Paying to Do Better: Games with Payments between Learning Agents [4.1] 学習エージェントのアルゴリズムに金銭移動政策を取り入れた選手の影響について検討する。
このようなシナリオを捉えるための単純で一般的なゲーム理論モデルを提案する。
その結果、非常に幅広い種類のゲームにおいて、自己関心のあるプレイヤーは、学習エージェントが他の学習者に支払いをすることの恩恵を受けることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:29:04 GMT)
Engineering Educators' Perspectives on the Impact of Generative AI in Higher Education [4.1] 本研究は, 生産型AIの活用と展望について, 工学教育者を対象にした調査から得られた知見を報告する。
我々は、GenAIの利用と快適性、GenAIに対する全体的な視点、教育、学習、研究にGenAIを使うことの課題と潜在的害について質問し、彼らの教室でのGenAIの使用と統合に対するアプローチが、GenAIの経験とそれに対する認識に影響を与えているかどうかを検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:50:49 GMT)
Auxiliary dynamical mean-field approach for Anderson-Hubbard model with off-diagonal disorder [4.1] 対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線・対角線
以上の結果から, 対角線外障害がMott型金属絶縁体転移に及ぼす影響が示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:24:43 GMT)
MiniF2F in Rocq: Automatic Translation Between Proof Assistants -- A Case Study [4.0] 我々は、MiniF2FをRocqに変換するために、最先端のLLMを用いて実験を行う。
我々は488の定理のうち478をうまく翻訳した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:32:55 GMT)
Testing spooky action between free-traveling electron-positron pairs [4.0] 固定ターゲット実験で生成した自由移動電子-陽電子対の絡み合いとベル不等式違反について検討した。
この情報源と絡み合った状態の事前の知識に基づいて、絡み合った$e+e-$ペアの偏極相関を測定することが可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:46:49 GMT)
What makes math problems hard for reinforcement learning: a case study [4.0] 不当に高い報酬をもたらす稀な事例を見つけることの課題について検討する。
本稿では,探索問題に対するアルゴリズム拡張とトポロジ的硬度尺度を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:01:40 GMT)
Distributed Approach to Haskell Based Applications Refactoring with LLMs Based Multi-Agent Systems [4.0] 大言語モデル (LLM) はHaskellを自動化するマルチエージェントシステムである。
システムは、コンテキスト分析、検証、テストなどのタスクを実行する特殊なエージェントで構成される。
リファクタリングの改善には、サイクロマティックな複雑性、実行時間、メモリ割り当てといったメトリクスを使用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:04:15 GMT)
Extended monocular 3D imaging [4.0] 光のベクトル波特性を完全に活用する拡張単分子3次元イメージング(EM3D)フレームワークを提案する。
拡大シーンに対して,100万画素で正確な3Dポイントクラウドのスナップショット取得を実験的に実証した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:32:31 GMT)
OpenGrok: Enhancing SNS Data Processing with Distilled Knowledge and Mask-like Mechanisms [3.9] 我々は、DeepSeek-R1のCoT買収にインスパイアされた知識蒸留を利用して、Grokモデルから貴重なトレーニングデータを抽出する。
このデータはPhi-3-miniモデルを微調整するために使用され、SNSデータのニュアンスを扱うために特別に設計されたマスクのようなメカニズムで強化される。
提案手法は,複数のSNSデータ処理タスクにおけるSOTA(State-of-the-art)の性能を実証し,Grok,Phi-3,GPT-4といった既存モデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:20:38 GMT)
Distributed Value Decomposition Networks with Networked Agents [3.9] エージェントワイズQ関数に分解する結合Q関数を生成する分散値分解ネットワーク(DVDN)を提案する。
DVDNは、共有目的を局所的に推定することで、集中的なトレーニングの必要性を克服する。
実証的に、両アルゴリズムは通信中の情報損失にもかかわらず、値分解ネットワークの性能を近似する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:23:05 GMT)
A comparison of translation performance between DeepL and Supertext [3.9] 本研究では、DeepLとSupertextという2つの商用機械翻訳システムを比較した。
我々は4つの言語方向の翻訳品質を、文書レベルのコンテキストでセグメントを評価するプロの翻訳者を用いて評価する。
セグメントレベルの評価では、ほとんどの場合、システム間での強い嗜好は示されていないが、文書レベルの分析では、4つの言語方向のうち3つにスーパーテキストの嗜好が示される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:06:14 GMT)
Feature Importance Depends on Properties of the Data: Towards Choosing the Correct Explanations for Your Data and Decision Trees based Models [3.8] 局所的な説明法によって提供される特徴重要度推定の質を評価する。
これらの手法により得られた特徴重要度評価の規模と指標に顕著な差異が認められた。
評価はこれらの制限を強調し,様々な説明手法の適合性と信頼性に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:29:55 GMT)
OpenCat: Improving Interoperability of ADS Testing [3.8] 本稿では,ADAS回帰テストのためのベンチマークであるSensoDatの相互運用性を評価する。
我々はOpenDRIVEテストケースをCatmull-Romスプラインフォーマットに変換するコンバータOpenCatを紹介する。
SensoDatデータセットにOpenCatを適用することで、テストケースを再利用可能な道路シナリオに変換する上で、高い精度を実現しました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:23:52 GMT)
What is a Sketch-and-Precondition Derivation for Low-Rank Approximation? Inverse Power Error or Inverse Power Estimation? [3.8] 低階行列近似におけるランダム化アルゴリズムのためのスケッチ・アンド・プレコンディション・フレームワークを開発した。
提案手法は,スケッチサイズとともに少なくとも線形に向上する収束率を含む理論的保証を実現する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:19:56 GMT)
Value Preferences Estimation and Disambiguation in Hybrid Participatory Systems [3.8] 参加者が選択を行い、その選択に対するモチベーションを提供するハイブリッド参加システムを構想する。
参加者の選択とモチベーションの衝突を検出する状況に焦点を当てる。
本研究では,検出された不整合に対処しながら,参加者と対話して値の選好を推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:00:28 GMT)
Joint Metric Space Embedding by Unbalanced OT with Gromov-Wasserstein Marginal Penalization [3.7] 異種データセットの教師なしアライメントのための新しい手法を提案する。
本手法は,Gromov-Wasserstein境界化を用いた不均衡最適輸送問題に基づく。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:28:47 GMT)
NanoVLMs: How small can we go and still make coherent Vision Language Models? [3.7] VLM(Vision-Language Models)は、マルチモーダルタスクにおいてLLM(Large Language Models)を活用する能力において、大きな研究の注目を集めている。
しかし、それらのポテンシャルは、プロプライエタリな制約、実質的な計算要求、アクセシビリティの制限など、固有の課題によって制限されている。
VLMは、どの程度小さく、かつ、流動的で一貫性のあるテキストを生成することができるのか?
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:31:45 GMT)
Early Risk Prediction of Pediatric Cardiac Arrest from Electronic Health Records via Multimodal Fused Transformer [3.7] 小児心停止の早期予測は,高リスク集中治療における時間的介入に重要である。
PedCA-FT(PedCA-FT)は、EHRの表層ビューとEHRのテキストビューを融合するトランスフォーマーベースの新しいフレームワークである。
PedCA-FTは、各モードビューに専用のトランスフォーマーモジュールを用いることで、複雑な時間的および文脈的パターンをキャプチャし、堅牢なCAリスク推定を生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:53:36 GMT)
Gaussian Ensemble Belief Propagation for Efficient Inference in High-Dimensional Systems [3.7] 高次元モデルにおける効率的な推論は、機械学習における中心的な課題である。
本稿では,Gaussian Ensemble Belief Propagation (GEnBP)アルゴリズムを紹介する。
本稿では,GEnBPが既存の信念手法よりも精度と計算効率で優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:18:45 GMT)
Eliciting Rational Initial Weights in Gradual Argumentation [3.7] 本稿では,各引数に対してアクセプタビリティの間隔を指定可能なエリケーションパイプラインを提案する。
段階的意味論を用いることで、それらが有理性であるときにこれらの区間を洗練させ、それらがそうでないときに合理性を取り戻し、究極的には各引数の可能な初期重み付けを特定できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:52:54 GMT)
NARCE: A Mamba-Based Neural Algorithmic Reasoner Framework for Online Complex Event Detection [3.7] 現在の機械学習モデルは、短時間の知覚タスクでは優れているが、長期的な観察からハイレベルな洞察を引き出すのに苦労している。
ニューラルネットワーク推論(NAR)とセンサ入力をアダプタを介してこれらのルールにマッピングするフレームワークであるNARCEを提案する。
以上の結果から, NARCEは, 一般化におけるベースラインよりも優れ, センサデータやデータ効率に優れることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:34:53 GMT)
Fast-COS: A Fast One-Stage Object Detector Based on Reparameterized Attention Vision Transformer for Autonomous Driving [3.6] 本稿では、シーンを駆動するための新しい単一ステージオブジェクト検出フレームワークであるFast-COSを紹介する。
RAViTはImageNet-1Kデータセットで81.4%のTop-1精度を達成した。
主要なモデルの効率を上回り、最大75.9%のGPU推論速度とエッジデバイスでの1.38のスループットを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:54:09 GMT)
Language Model Council: Democratically Benchmarking Foundation Models on Highly Subjective Tasks [3.6] 言語モデル協議会(LMC: Language Model Council)では、LLMのグループが協力してテストを作成し、それに反応し、相互の反応を評価して、民主的な方法でランキングを作成する。
感情的インテリジェンスに関する詳細なケーススタディでは、対人対立に対するオープン・エンド・レスポンスにおいて、20の最近のLCMを相互にランク付けするために配置する。
以上の結果から, LMCは, より分離性が高く, より堅牢なランキングを作成でき, ユーザスタディにより, 個々のLCM審査員よりも人的評価に整合性があることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:42:44 GMT)
Non-Markovian Dynamics in Fiber Delay-line Buffers [3.5] 2光子偏光絡み状態における非マルコフ効果について検討する。
我々はバッファ化光子とそのペア化光子に対して非マルコフ確率関数を解析的に導出した。
我々の結果は、量子不協和がヴェルナーの基準を超える可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:36:49 GMT)
Approximating Human Strategic Reasoning with LLM-Enhanced Recursive Reasoners Leveraging Multi-agent Hypergames [3.5] 我々は、洗練された推論者に適したロールベースのマルチエージェント戦略相互作用フレームワークを実装した。
我々は,最新のLCMの推論能力を評価するために,ワンショット2プレーヤ美容コンテストを用いた。
実験の結果,人間行動の近似と最適解への到達の両面で,人工推論がベースラインモデルより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:37:20 GMT)
A statistically consistent measure of Semantic Variability using Language Models [3.5] 軽度の仮定の下で統計的に一貫した意味変数の尺度を示す。
この測度は意味スペクトルエントロピー(semantic spectrum entropy, 意味スペクトルエントロピー)と呼ばれ、棚外の言語モデルを必要とするアルゴリズムの実装が容易である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:39:55 GMT)
Unveiling Client Privacy Leakage from Public Dataset Usage in Federated Distillation [3.5] PDA-FD (Public dataset-assisted Federated Distillation) が広く採用されている。
本稿では,PDA-FDのプライバシを包括的に解析する手法を提案する。
PDA-FD設定に特化して設計された2つの新しい攻撃について紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:48:49 GMT)
Exploring Neural Network Pruning with Screening Methods [3.4] 現代のディープラーニングモデルは数千万のパラメータを持ち、推論プロセスはリソース集約化されている。
本稿では,非必須パラメータを除去するネットワーク・プルーニング・フレームワークの提案と評価を行う。
提案するフレームワークは,従来のネットワークと比較して,競争力のあるリーンネットワークを生成する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:31:04 GMT)
WHODUNIT: Evaluation benchmark for culprit detection in mystery stories [3.4] 我々は,大規模言語モデル (LLM) の帰納的推論能力を評価するための新しいデータセット,WhoDunItを提案する。
データセットは、物語を読み、解釈した後、犯人を特定するためにLSMに挑戦する。
原語名、名前スワップ、転用などの文字レベルの拡張を、人気のある談話からよく知られた実物や架空の実体に応用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:14:44 GMT)
Supervised contrastive learning for cell stage classification of animal embryos [3.4] 深層学習による2次元タイムラプス顕微鏡ビデオから胚の細胞ステージを自動分類することを目的としている。
我々は,ビデオ顕微鏡によるウシ胚発生の解析に焦点をあてた。
CLEmbryoは、教師付きコントラスト学習とトレーニングの焦点損失を組み合わせた新しい手法であり、軽量な3次元ニューラルネットワークCSN-50をエンコーダとして導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:30:25 GMT)
URECA: The Chain of Two Minimum Set Cover Problems exists behind Adaptation to Shifts in Semantic Code Search [3.4] 我々は新しいクラスタリングアルゴリズム、Union-find based Recursive Clustering Algorithm(URECA)を導入する。
URECAは、不整合表現間の関係を利用するための効率的なクラスタリングアルゴリズムである。
幅広い評価結果から、URECAは、多種多様なシフトへの数ショット適応において、一貫したパフォーマンス向上を達成することが示されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:53:23 GMT)
Fault Localization via Fine-tuning Large Language Models with Mutation Generated Stack Traces [3.3] 本稿では,スタックトレース情報のみに基づいて障害をローカライズする新たな手法を提案する。
64,369件のクラッシュの微調整によって、コードベースの4100万件の突然変異により、66.9%の精度で、クラッシュの根本原因の位置を正確に予測できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:58:39 GMT)
Absorption-Based, Passive Range Imaging from Hyperspectral Thermal Measurements [3.3] 熱い物体と高出力物体を計算的に分離した受動的レンジイメージング手法を提案する。
本手法は, 放射能を明示的に考慮し, 範囲と固有物体特性を共同で推定する。
本手法を自然界から取得した8-13$mu$mの広波長赤外画像データに適用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:05:32 GMT)
TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation [3.3] 視覚言語ナビゲーション(VLN)のためのモジュラーアプローチを提案する。
ゼロショット設定では、最先端のLarge Language Models(LLM)とVision-Language Models(VLM)を使用します。
共同意味マップを用いた他の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:09:37 GMT)
Beyond Prompting: Time2Lang -- Bridging Time-Series Foundation Models and Large Language Models for Health Sensing [3.3] 大規模言語モデル(LLM)は、行動センシングデータと組み合わせることで、健康上の応用を約束する。
従来のアプローチでは、センサデータをテキストプロンプトに変換するが、このプロセスはエラーを起こしやすく、計算コストが高く、ドメインの専門知識を必要とする。
本稿では, TFM 出力を中間テキスト変換なしで LLM 表現に直接マッピングするフレームワーク Time2Lang を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:58:54 GMT)
Welzijn.AI: A Conversational AI System for Monitoring Mental Well-being and a Use Case for Responsible AI Development [3.3] Welzijn.AIは、高齢者のメンタルヘルスを監視するためのデジタルソリューションである。
技術は、オープンで文書化された、解釈可能なアーキテクチャの記述に関するものである。
価値は Welzijn.AI の利害関係者の評価に関係している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:59:19 GMT)
Supervised Learning without Backpropagation using Spike-Timing-Dependent Plasticity for Image Recognition [3.1] 本研究では,従来のバックプロパゲーションに依存しないスパイクニューラルネットワークのための新しい教師あり学習手法を提案する。
代わりに、画像認識タスクの教師付きフレームワーク内にスパイクタイピング依存の塑性(STDP)を採用している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:26:38 GMT)
Public Opinions About Copyright for AI-Generated Art: The Role of Egocentricity, Competition, and Experience [3.1] 我々は著作権法のレンズを通してAI生成芸術の知覚を研究する。
我々は、一部の参加者がGenAIモデルを使ってアートを作成する、インセンティブ付きAIアートコンペティションを開催しています。
参加者は、創造性と努力は、スキルではなく、AIが生成するアートを作るために必要だと信じている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:58:15 GMT)
Machine Unlearning via Information Theoretic Regularization [3.1] 本稿では,情報理論の正規化に基づく数学的枠組みを導入し,特徴とデータポイントのアンラーニングに対処する。
学習対象の柔軟性と正規化設計の単純さを組み合わせることで、我々のアプローチは、幅広い機械学習やAIアプリケーションに対して、高度に適応可能で実践的です。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:45:20 GMT)
EgoOops: A Dataset for Mistake Action Detection from Egocentric Videos Referring to Procedural Texts [3.0] 本稿では,EgoOopsデータセットを提案する。
ビデオテキストアライメント、エラーラベル、ミスの説明の3つのタイプがある。
実験結果から,手続き的テキストの導入は誤検出に不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:17:37 GMT)
Embracing Experiential Learning: Hackathons as an Educational Strategy for Shaping Soft Skills in Software Engineering [3.0] 40名の学生を対象とする7日間のハイブリッドハッカソンの予備的実証的証拠を報告する。
本研究では,ハッカソン体験が,学生の自己認識を評価するための構造化されたアンケートを通じて,革新的かつ創造的な思考,コラボレーション,チームワーク,知識の適用を促進するかを評価する。
業界にとって、私たちの議論は、将来のSEプロフェッショナルにおけるソフトスキルの開発に関する意味を持ち、それによって、ソフトウェア市場におけるその採用性と準備性を高めます。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:58:33 GMT)
HGTUL: A Hypergraph-based Model For Trajectory User Linking [3.0] Tray User Linking (TUL) は、匿名のトラジェクトリとそれを生成するユーザをリンクする。
HGTUL(HyperGraph-based Multi-perspective Trajectory User Linking Model)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:39:35 GMT)
Advancing Heat Demand Forecasting with Attention Mechanisms: Opportunities and Challenges [3.0] 熱需要に影響を及ぼす独立変数と依存変数の分解されたコンポーネントを特徴として利用し、ヘッド需要予測を多段階に進める深層学習(DL)モデルを構築した。
提案手法は実世界のデータセットを用いて評価し,LSTMおよびCNNに基づく予測モデルに対して予測性能を評価する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:12:06 GMT)
Closure Discovery for Coarse-Grained Partial Differential Equations Using Grid-based Reinforcement Learning [3.0] 本稿では,グリッドベース強化学習を用いて,未解決PDEにおけるクロージャの同定のための体系的アプローチを提案する。
我々は, 対流方程式とバーガース方程式の数値解を用いて, フレームワークの機能と限界を実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:20:47 GMT)
Locally Private Estimation with Public Features [3.0] 本研究では,公共性を考慮した地域差分学習(LDP)について検討した。
半機能LDPでは,非パラメトリック回帰の最小収束速度が著しく低下することを示した。
本研究では,パブリック機能とプライベート機能の両方に含まれる情報を完全に活用する推定器を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:56:50 GMT)
Robust Amortized Bayesian Inference with Self-Consistency Losses on Unlabeled Data [2.9] 本研究では,モデルから生成した(ラベル付き)シミュレーションデータだけでなく,実世界のデータを含む任意の情報源から生成したラベル付きデータ上でのトレーニングを可能にする半教師付きアプローチを提案する。
実験結果から, シミュレーション外データに対するABIのロバスト性は著しく向上した。
我々の研究結果が他のシナリオやモデルクラスにも一般化されれば、新しい手法は神経性ABIの大きなブレークスルーとなると信じています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:52:04 GMT)
FoQA: A Faroese Question-Answering Dataset [2.9] 2,000のサンプルからなるファロア抽出質問回答データセットであるFoQAについて述べる。
このデータセットは、LLM(Large Language Models)と人間の検証を組み合わせた半自動アプローチを用いて作成された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:33:17 GMT)
Long-term simulation of physical and mechanical behaviors using curriculum-transfer-learning based physics-informed neural networks [2.9] 本稿では,CTL-PINN(Curriculum-Transfer-Learning based Physics-informed Neural Network)を提案する。
CTL-PINNはカリキュラム学習とトランスファー学習の長所を組み合わせ、標準的なPINNの限界を克服する。
CTL-PINNの有効性とロバスト性は, 非線形波動伝搬, キルヒホフプレートの動的応答, および三峡貯留層の流体力学モデルに応用して実証された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:43:03 GMT)
Technical note on calibrating vision-language models under covariate shift [2.8] 低ショットビジョン分類のための視覚言語基盤モデルは、ターゲットデータ分布に一般化する限られた能力を有する。
我々は,共変量シフトと信頼の相違を緩和する統合フレームワークであるtextitConfidence-Calibrated Covariate Shift Correction(C3SC$)を提案する。
C3SC$はキャリブレーションの堅牢性(ECE)を最大5.82%向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:10:15 GMT)
PolicySimEval: A Benchmark for Evaluating Policy Outcomes through Agent-Based Simulation [2.8] 政策評価タスクにおけるエージェント・ベース・シミュレーションの能力を評価するための最初のベンチマークであるPolicySimEvalを紹介する。
PolicySimEvalは、社会科学者や政策立案者が直面する現実世界の複雑さを反映することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:36:00 GMT)
From Fog to Failure: How Dehazing Can Harm Clear Image Object Detection [2.8] 本研究は,人間の視覚的手がかりに基づく脱ハジングを物体検出に組み込むことの課題について考察する。
本稿では,光検出装置が関心領域を検知し,空間的注意に基づくデハジングによって拡張する多段階フレームワークを提案する。
霧の環境では有効であるが、この手法は鮮明な画像の性能を予期せず劣化させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:33:27 GMT)
BioVL-QR: Egocentric Biochemical Vision-and-Language Dataset Using Micro QR Codes [2.7] 本稿ではバイオケミカル・ビジョン・アンド・ランゲージ・データセットであるBioVL-QRを紹介する。
23のエゴセントリックな実験ビデオ、対応するプロトコル、そして視覚と言語をアライメントする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:45:46 GMT)
Improve the Training Efficiency of DRL for Wireless Communication Resource Allocation: The Role of Generative Diffusion Models [2.7] 無線ネットワークにおけるDRLトレーニングの基本的なボトルネックを克服するために,拡散に基づく深層強化学習(D2RL)を提案する。
D2RLは、無線通信におけるリソース割り当てのための従来のDRL法よりも高速な収束と計算コストの削減を実現している。
この研究は、無線ネットワークにおけるDRLトレーニングの基本的なボトルネックを克服する上で、GDMの変革の可能性を強調している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:09:45 GMT)
Towards bandit-based prompt-tuning for in-the-wild foundation agents [2.7] 本稿では,タスク性能を向上させるための推論時間帯域幅に基づくプロンプトチューニングフレームワークを提案する。
実験の結果,バンディットに基づくプロンプトチューニングによる性能向上だけでなく,サンプルの複雑さ,拡張性,空間探索の迅速化などが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:54:40 GMT)
Glinthawk: A Two-Tiered Architecture for Offline LLM Inference [2.6] Glinthawkは、オフラインのLarge Language Model(LLM)推論のためのアーキテクチャである。
スループットを5.9倍に改善し、生成コストを2.8倍に削減する。
評価の結果,このアーキテクチャは性能劣化を最小限に抑えつつ,適度なネットワーク遅延を許容できることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:36:32 GMT)
Large Language Models as Proxies for Theories of Human Linguistic Cognition [2.6] 人間の言語認知研究における現在の大言語モデル(LLM)の役割について考察する。
我々は,その表現や学習において比較的言語的に中立な認知理論に対するプロキシのようなモデルの利用に焦点をあてる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:38:16 GMT)
Hallucination, Monofacts, and Miscalibration: An Empirical Investigation [2.6] 基礎となるデータ分布の違いが、モノファクトレートとモデルが幻覚する傾向にどのように影響するかを示す。
これらの結果から,訓練データにおける事実頻度の分布と校正・校正のトレードオフは,確率的言語生成に固有のものであることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:46:00 GMT)
Algorithmic Aspects of Strategic Trading [2.6] 我々は、一時的な影響設定に対する最良の応答を計算するための効率的なアルゴリズムを提供する。
我々は、Follow the Perturbed Leaderの実装を通じて効率的に計算できることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:56:16 GMT)
A Near-optimal, Scalable and Corruption-tolerant Framework for Stochastic Bandits: From Single-Agent to Multi-Agent and Beyond [2.5] 我々はBARBATと呼ばれる新しいフレームワークを提案し、これは$K$の係数を排除し、対数係数に縛られた最適の後悔を実現する。
また,BARBATがグラフバンド,半帯域,バッチバンド,マルチエージェントバンドなど,さまざまな設定に拡張可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:33:33 GMT)
Perceived Confidence Scoring for Data Annotation with Zero-Shot LLMs [2.5] メタモルフィックリレーショナル(MR)を活用して入力の分類におけるLLMの信頼性を評価するPCS(Perceived Confidence Scoring)を導入する。
PCSはLlama-3-8B-Instruct (4.96%)とMistral-7B-Instruct-v0.3 (10.52%)のゼロショット精度を大幅に改善し、Gemma-2-9b-itは9.39%上昇した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:25:44 GMT)
(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions [2.5] 合理性の概念は人工知能の分野の中心である。
有理エージェントを構成するものの統一的な定義は存在しない。
特定のシナリオで最適であることを示す不合理な行動を考える。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:06:45 GMT)
Effect of Adaptive Communication Support on LLM-powered Human-Robot Collaboration [2.5] マルチモーダル言語フィードバック(HRT-ML)を用いたヒューマンロボットコラボレーションフレームワーク
HRT-MLフレームワークには、ハイレベルで低頻度な戦略ガイダンスのためのコーディネータと、サブタスク固有の高周波命令のためのマネージャの2つのコアモジュールが含まれている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:52:51 GMT)
Exoplanet Transit Candidate Identification in TESS Full-Frame Images via a Transformer-Based Algorithm [2.4] 本稿では,位相折り畳みや周期性の仮定を必要とせず,太陽系外惑星のトランジット信号を同定する手法を提案する。
我々は、トランスフォーマーにインスパイアされた新しいニューラルネットワークを実装し、FFI(Full Frame Image)光曲線を直接処理し、外惑星のトランジットを検出する。
本モデルでは,122光度曲線,88光度,4光度を含む214個の新しい惑星系候補を同定した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:29:58 GMT)
Degeneracy-breaking and Long-lived Multimode Microwave Electromechanical Systems Enabled by Cubic Silicon-Carbide Membrane Crystals [2.4] 3C相結晶性炭化ケイ素膜における縮退現象を明らかにした。
3C-SiC材料は超伝導回路とのマイクロ波互換性に優れていた。
我々はコヒーレントな電気メカニカルインタフェースを確立することができ、単一の3C-SiC四角膜から21の高価格のメカニカルモードを正確に制御できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:15:26 GMT)
Enhancing Higher Education with Generative AI: A Multimodal Approach for Personalised Learning [2.3] 本研究は,高等教育分野におけるジェネレーティブAI(GenAI)の可能性を探るものである。
我々は、幅広い教育的クエリに対処するGenAIの可能性を示す。
本研究は,実践的なWebアプリケーションを実証することにより,よりダイナミックで応答性の高い教育環境を育成するために,GenAI技術を統合することの必須事項を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:29:29 GMT)
Rescriber: Smaller-LLM-Powered User-Led Data Minimization for LLM-Based Chatbots [2.2] Rescriberは、LLMベースの会話エージェントでユーザ主導のデータ最小化をサポートするブラウザエクステンションである。
我々の研究によると、Rescriberはユーザーが不必要な開示を減らし、プライバシー上の懸念に対処するのに役立ちました。
以上の結果から,LLMによる小型ユーザ向けオンデバイスプライバシコントロールの実現可能性が確認された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:56:20 GMT)
GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models [2.1] GANQは、ハードウェア効率の良いルックアップテーブルベースのmpGEMMに最適化されたレイヤーワイズ後の非一様量子化フレームワークである。
広汎な実験は、3ビットおよび4ビット量子化の最先端手法と比較して、GANQのFP16ベースラインからのパープレキシティギャップを低減する能力を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:50:15 GMT)
Educating a Responsible AI Workforce: Piloting a Curricular Module on AI Policy in a Graduate Machine Learning Course [2.1] 本稿では,2024年に大学院レベルの導入機械学習コースで試験された2段階の「AIポリシーモジュール」について述べる。
このモジュールは、他の技術的指向の学生をAIポリシーのトピックに巻き込むことに成功している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:16:56 GMT)
TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning [2.1] 本稿では,雑音ラベルを訂正するトランスファー可能なメタラーナーTMLC-Netを提案する。
TMLC-Netは、多様なデータセットに容易に適用可能な汎用ラベル補正戦略を学習する。
TMLC-Netは、ラベルノイズに対する精度とロバスト性の両方の観点から、最先端の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:33:48 GMT)
Greed is Good: Guided Generation from a Greedy Perspective [2.1] 欲求誘導戦略は良い判断を下し、連続随伴方程式から得られる理想的な勾配を用いて誘導戦略と比較する。
次に、この観点から、他の人気のあるトレーニングフリーガイダンス戦略をどのように統一的に見ることができるかを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:05:16 GMT)
An analysis of data variation and bias in image-based dermatological datasets for machine learning classification [2.0] 臨床皮膚学では、分類モデルはRGB画像のみを入力として、患者の皮膚の悪性病変を検出することができる。
学習に基づくほとんどの手法では、トレーニングにおいて皮膚科のデータセットから取得したデータを用いており、これは金の基準によって大きく検証されている。
本研究の目的は,皮膚内視鏡検査と臨床検査のギャップを評価し,データセットの変動がトレーニングに与える影響を理解することである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:55:01 GMT)
Trustworthy Distributed Certification of Program Execution [2.0] 我々は,モナと呼ばれるプロトタイププログラミング言語と認証プロトコルOCCPを組み合わせた,革新的なアプローチを提案する。
本プロトコルでは,再実行を素直に行うことなく,プログラムセグメントを分散し,不変かつ信頼性の高いシステムで認証することができる。
本研究は,既存の最先端手法と比較してプログラム実行回数を減らす手法の有効性を示すものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:41:42 GMT)
Slow Light Augmented Unbalanced Interferometry for Extreme Enhancement in Sensitivity of Measuring Frequency Shift in a Laser [1.9] レーザーの周波数シフトを測定する感度を高めるために、緩やかに拡張されたマッハ・ツェンダー干渉計を使用することができる。
レーザの周波数シフトの測定に依存するセンサの感度は、この技術により大幅に向上することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:05:22 GMT)
Counterfactual Generative Modeling with Variational Causal Inference [1.9] 本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。
実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:56:02 GMT)
A Particle Algorithm for Mean-Field Variational Inference [1.9] 平均場変動推定のための新しい粒子ベースアルゴリズムを提案する。
我々はアルゴリズムに対して漸近的でない有限粒子収束を保証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:37:00 GMT)
Enhancing Ground-to-Aerial Image Matching for Visual Misinformation Detection Using Semantic Segmentation [1.9] 近年のジェネレーティブAI技術の進歩は、インターネット上で利用可能なデジタルメディアの信頼性に関する深刻な懸念を引き起こしている。
これらの懸念に対処するため、GPS座標などの外部情報のない非ジオタグ付き地上画像の位置情報化がますます重要になっている。
本研究は、GPSデータを使わずに、さまざまな視野(FoV)と対応する衛星画像とを関連付けるという課題に取り組む。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:25:19 GMT)
Is That Rain? Understanding Effects on Visual Odometry Performance for Autonomous UAVs and Efficient DNN-based Rain Classification at the Edge [1.9] 最先端のローカルトラッキングと軌道計画は通常、飛行制御アルゴリズムにカメラセンサーを入力して実行される。
最先端のビジュアル・オドメトリーシステムでは, 1.5mの最悪ケース平均追跡誤差が可能であることを示す。
我々は、モバイルおよび制約されたデプロイメントシナリオに適したディープニューラルネットワークモデルのセットをトレーニングし、これらの雨の条件を効率的に正確に分類できる範囲を判断する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:21:16 GMT)
A unifying account of warm start guarantees for patches of quantum landscapes [1.8] 損失分散のある点の周りの非指数的に狭い領域では指数関数的に急速に崩壊することができないことを示す。
我々の研究は、変分量子アルゴリズムを温めることができることを望んでいるが、問題のサイズが大きくなるにつれて、アトラクションの領域に近づかない戦略はありそうである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:00:05 GMT)
Graph Neural Networks at a Fraction [1.8] 本稿では、四元数空間を利用してノード表現を計算するフレームワークである四元数メッセージパッシングニューラルネットワーク(QMPNN)を紹介する。
GNN や QMPNN のコンテキストにおける適用性を再定義する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:30:25 GMT)
PIXHELL: When Pixels Learn to Scream [1.7] 液晶ディスプレイ(LCD)の電気的特性を利用した音生成手法を提案する。
ディスプレイから直接、可聴音の信号がいかに弱いかを示す。
この手法の潜在的な応用としては、低消費電力の聴覚フィードバックシステム、短距離デバイス通信、エアギャップ・カバーチャネル、安全な聴覚信号処理、人間とコンピュータの相互作用に対する革新的なアプローチなどがある。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:58:17 GMT)
On Categorizing Open Source Software Security Vulnerability Reporting Mechanisms on GitHub [1.7] オープンソースプロジェクトはソフトウェア開発に不可欠だが、修正なしで脆弱性を公表することは、エクスプロイトのリスクを増大させる。
OpenSSF(Open Source Security Foundation)は、プロジェクトセキュリティを強化するための堅牢なセキュリティポリシーを促進することでこの問題に対処している。
現在の調査では、多くのプロジェクトがOpenSSFの基準で不十分なパフォーマンスを示しており、より強力なセキュリティプラクティスの必要性を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:23:24 GMT)
Interpretable Rules for Online Failure Prediction: A Case Study on the Metro do Porto dataset [1.7] 本研究は,ポルトガルのポルトで発生したメトロ列車の故障予測に焦点をあてる。
最近の研究では、並列説明可能性パイプラインを備えた高性能なディープニューラルネットワークアーキテクチャが発見されているが、生成された説明はかなり複雑であり、なぜ障害が発生しているのかを説明するのに役立っている。
本研究は、簡単なオンラインルールに基づく説明可能性アプローチを提案する。
われわれのアプローチをMetroPT2で示すと、Metro do Portoの3つのセンサーが、単純なルールでデータセットに存在する障害を予測するのに十分であることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:23:16 GMT)
Scalable and consistent embedding of probability measures into Hilbert spaces via measure quantization [1.6] 入力確率測度を小容量の離散測度で近似するための測度量化に基づく2つの手法について検討した。
このような近似の整合性とその計算コストの低いヒルベルト空間への確率測度のスケーラブルな埋め込みへの応用について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:17:43 GMT)
Bidirectional Uncertainty-Aware Region Learning for Semi-Supervised Medical Image Segmentation [1.6] 半教師付き医療画像のセグメンテーションでは、ラベルのないデータの質が悪く、モデルの予測の不確かさが誤った擬似ラベルにつながる。
これらの誤った偽ラベルは、通常、不確実な領域に集中していることがわかった。
そこで本研究では,この問題を解決するために,双方向不確実性を考慮した地域学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:03:09 GMT)
Advancing Precision Oncology Through Modeling of Longitudinal and Multimodal Data [1.6] 癌は、遺伝子、エピジェネティック、ミクロ環境、表現型の変化の複雑な相互作用を通じて、時間とともに継続的に進化する。
今日の腫瘍学におけるデータ駆動研究は、主に1つのモダリティのデータを用いた断面解析に焦点を当てている。
マルチスケールデータ収集および計算手法の進歩により、精度オンコロジーのための長手マルチモーダルバイオマーカーの発見が可能になった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:44:51 GMT)
On Iterative Evaluation and Enhancement of Code Quality Using GPT-4o [1.6] 本稿では,Large Language Models (LLM) を利用したコード品質の反復評価と向上のための新しいフレームワークであるCodeQUESTを紹介する。
フレームワークは2つの主要なコンポーネントに分割されている。10次元にわたるコード品質を評価し、定量スコアと定性的な要約の両方を提供する評価器。
本研究は,CodeQUESTが既存のコード品質指標と整合して,コード品質を効果的かつ堅牢に評価できることを実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:27:00 GMT)
Pseudorandomness Properties of Random Reversible Circuits [1.6] 固定された2次元近辺アーキテクチャにおいて,各層が$Theta(n)$ランダムゲートからなる深さ$sqrtn cdot tildeO(k3)$のランダム回路により,およそ$k$の独立置換が得られることを示す。
我々の結果は、数ラウンドで$k$input-outputペアにアクセスする攻撃者に対して、証明可能な統計的セキュリティを提供する、特に単純で実践的なブロック暗号構築と見なすことができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:54:24 GMT)
Robust Persian Digit Recognition in Noisy Environments Using Hybrid CNN-BiGRU Model [1.6] 本研究は,雑音条件下でのペルシャ文字の孤立認識(ゼロから9)に対処する。
残差畳み込みニューラルネットワークと双方向ゲートユニット(BiGRU)を組み合わせたハイブリッドモデルを提案する。
実験の結果、モデルの有効性が98.53%、96.10%、トレーニング、検証、テストセットにおける95.92%の精度で証明された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:01:26 GMT)
Universal Adversarial Attack on Aligned Multimodal LLMs [1.5] マルチモーダル大規模言語モデル(LLM)に対する普遍的敵攻撃を提案する。
私たちは、ターゲットとするフレーズや、その他の安全でないコンテンツでモデルに応答するよう強制する合成画像を作成します。
コードとデータセットはApache-2.0ライセンスでリリースします。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:07:47 GMT)
Consistency Training with Physical Constraints [1.5] 本研究では,物理制約のある拡散モデルにおけるサンプリングを高速化する物理認識整合トレーニング(CT)手法を提案する。
おもちゃの例を用いて実験した結果,提案手法は制約を順守しながら,単一ステップでサンプルを生成することがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:23:14 GMT)
VLWE: Variety-based Learning with Errors for Vector Encryption through Algebraic Geometry [1.4] 格子ベースの暗号はポスト量子セキュリティの基礎である。
この研究は代数幾何学に基づく新しい構造格子問題であるバラエティ-LWE(VLWE)を導入する。
VLWEのセキュリティは、複数の独立したインスタンスに分散し、古典的および量子的攻撃に対するレジリエンスを示すことによって証明する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:04:24 GMT)
Transformer-based Stagewise Decomposition for Large-Scale Multistage Stochastic Optimization [1.3] 本稿では,トランスフォーマーに基づく段階分解アルゴリズムであるTrranSDDPを紹介する。
本研究では,値関数の分数次線形近似を効率よく生成することを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:48:49 GMT)
Decay Rates of Optical Modes Unveil the Island Structures in Mixed Phase Space [1.3] ある種の崩壊速度は、波数の増加とともに連続的に分離された分岐を形成し、最終的に滑らかな曲線に合流することを示す。
その結果, これらの崩壊速度は, 短波長限界に近づくにつれて, 混合位相空間の島々の構造を徐々に解明することが明らかとなった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:40:28 GMT)
Inverse Current in Coupled Transport: A Quantum Thermodynamic Framework for Energy and Spin-polarized Particle Currents [1.3] 結合輸送における逆電流は、輸送過程における著しく反直感的な振る舞いを表す。
我々は、エネルギーおよびスピン偏極粒子電流におけるICCを記述するための量子熱力学フレームワークを提供する。
本分析は,エントロピー生成速度の微視的および微視的記述とを関連づけるものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:39:20 GMT)
SymbolFit: Automatic Parametric Modeling with Symbolic Regression [1.3] シンボリック回帰を用いてパラメトリックモデリングを自動化するフレームワークであるSybolFitを導入し,データに適合する関数の機械探索を行う。
本手法はCERN大型ハドロン衝突型加速器における高エネルギー物理実験におけるデータ解析応用において実証された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:11:22 GMT)
SensPS: Sensing Personal Space Comfortable Distance between Human-Human Using Multimodal Sensors [1.3] 人とコンピュータの相互作用を高めるためには、個人の空間を推定し、尊重することが不可欠である。
個人の空間の好みは、個々の特徴、文化的背景、文脈的要因によって異なる。
アイトラッキングやリストバンドセンサーを含むマルチモーダルセンサーは、適応システムを開発する機会を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:31:43 GMT)
Polynomial-Time Approximability of Constrained Reinforcement Learning [1.2] 一般化されたマルコフ決定過程の近似の計算複雑性について検討する。
私たちの貢献は、最適に制約されたポリシーを見つけるための時間(0,epsilon)$-additive approximationの設計です。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:47:53 GMT)
A Large-Scale Benchmark for Vietnamese Sentence Paraphrases [1.2] 本稿では,ベトナム語の文パラフレージングのための高品質なデータセットであるViSPについて述べる。
私たちの知る限りでは、ベトナム語のパラフレーズに関する大規模な研究はこれが初めてである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:30:21 GMT)
Bridging Brain Signals and Language: A Deep Learning Approach to EEG-to-Text Decoding [1.2] 本稿では,従来の閉語彙EEG-to-textデコードアプローチを変更する特殊なフレームワークを提案する。
本研究の目的は,オープン語彙テキスト生成システムと人間の脳信号の解釈を関連付けることである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:43:14 GMT)
Integrating Physics and Data-Driven Approaches: An Explainable and Uncertainty-Aware Hybrid Model for Wind Turbine Power Prediction [1.1] 風力エネルギーセクターの急速な成長は、タービンの運転を最適化する緊急の必要性を浮き彫りにしている。
伝統的な経験的モデルと物理学に基づくモデルは、風速に基づく発電の近似予測を提供する。
データ駆動機械学習手法は、風力タービンモデリングを改善するための有望な道を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:16:48 GMT)
Unpaired Image-to-Image Translation with Content Preserving Perspective: A Review [1.1] 画像画像変換(I2I)は、ソースコンテンツを保存しながら、ソースドメインからターゲットドメインに画像を変換する。
翻訳過程におけるソース画像の内容の保存度は、問題や意図した用途に応じて異なることができる。
画像と画像の翻訳の分野における様々なタスクを,完全コンテンツ保存,部分コンテンツ保存,非コンテンツ保存の3つのカテゴリに分けた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:09:29 GMT)
DeepSeek on a Trip: Inducing Targeted Visual Hallucinations via Representation Vulnerabilities [1.1] 我々はDeepSeek Janusに適応的な埋め込み操作攻撃を実装した。
高い視力を維持しながら、最大98.0%の幻覚率を達成する。
この研究は、MLLMデプロイメントパイプラインに埋め込みレベルのセキュリティ対策を組み込む必要性を強調している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:21:23 GMT)
Bandit Optimal Transport [1.1] 本稿では,対話の繰り返しから関東性およびエントロピー性OT問題の解法を学習する際の帯域幅問題について考察する。
我々は、ヒルベルト空間上の線形包帯を拡張することにより、両方の問題に対して$tildemathcal O(sqrtT)$ regretアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:24:25 GMT)
Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions [1.0] デジタル病理組織学から合成されたゲノム表現は,がんの診断と生存リスクを高い精度で予測する。
PathGenコードはGitHubのhttps://github.com/Samiran-Dey/PathGen.comで研究コミュニティから公開されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:25:42 GMT)
A RAG Approach for Generating Competency Questions in Ontology Engineering [1.0] LLM(Large Language Models)の出現により、このプロセスの自動化と強化が可能になった。
本稿では,LLMを用いてCQの自動生成を行うRAG(Research-augmented Generation)手法を提案する。
2つのドメインエンジニアリングタスクで GPT-4 を用いて実験を行い、ドメインの専門家が構築した地味な CQ と比較する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:25:45 GMT)
The Complexity of Learning Sparse Superposed Features with Feedback [1.0] モデルの基本となる学習特徴がエージェントからのフィードバックによって効率的に検索できるかどうかを検討する。
スパース設定で特徴行列を学習する際のフィードバックの複雑さを解析する。
この結果は,エージェントがアクティベーションを構築し,スパースシナリオにおいて強い上限を示すことを許された場合に,厳密な境界を確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:57:41 GMT)
Filtered Markovian Projection: Dimensionality Reduction in Filtering for Stochastic Reaction Networks [1.0] 反応ネットワーク(SRN)によってモデル化された実用的な問題における典型的な課題は、少数の状態変数しか動的に観察できないことである。
本稿では,前向き問題に対して最初に導入されたマルコフ射影(MP)に基づく次元削減手法を提案する。
この手法は, 粒子フィルタと分散の低減と低次元空間におけるフィルタ方程式の解法を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:45:40 GMT)
Generative AI in Academic Writing: A Comparison of DeepSeek, Qwen, ChatGPT, Gemini, Llama, Mistral, and Gemma [1.0] Alibabaは2025年1月29日にAIモデルであるQwen 2.5 Maxをリリースした。
本研究は,Qwen 2.5 MaxとDeepSeek v3の両方の学術書記性能を評価することを目的とする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:33:22 GMT)
Linear Transformers as VAR Models: Aligning Autoregressive Attention Mechanisms with Autoregressive Forecasting [0.9] 一つの線形注意層を動的ベクトル自己回帰(VAR)構造と解釈できることを示す。
一般化,注意,入出力の流れを再構成することにより,多層線形注意をVARモデルとして整列させることができる。
多変量TSFのための解釈可能な動的VAR重みを統合する線形変圧器変種であるVARの構造配向混合法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:24:43 GMT)
The Observational Partial Order of Causal Structures with Latent Variables [0.9] 潜在変数を持つ因果構造の同値類の部分順序を決定する問題を考える。
可視変数の数が増えると、非自明な不等式制約を満たす同値類がユビキタスになる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:00:58 GMT)
Rethinking Timing Residuals: Advancing PET Detectors with Explicit TOF Corrections [0.9] 本研究では、時間残差の新たな定義を導入し、補正値を直接予測するモデルを訓練する。
明示的な補正アプローチは、データ取得を著しく単純化し、線形性を改善し、タイミング性能を向上させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:17:29 GMT)
Local Regularizers Are Not Transductive Learners [0.9] 局所正規化のアルゴリズム的テンプレートは、学習可能な多クラス問題を学習するのに十分であることを示す。
我々は, 負の結果をPACモデルに拡張する上での課題を概説し, 局所正規化に関してPAC/トランスダクティブ分離の可能性を広げる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:28:35 GMT)
SurGrID: Controllable Surgical Simulation via Scene Graph to Image Diffusion [0.9] 画像拡散モデルのためのシーングラフであるSurGrIDを導入し,手術シーンの合成を制御可能とした。
シーングラフは手術シーンのコンポーネントの空間的および意味的な情報をエンコードし、中間表現に変換する。
提案手法は、生成した画像の忠実度と、最先端のグラフ入力との整合性を改善する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:49:13 GMT)
AI-VERDE: A Gateway for Egalitarian Access to Large Language Model-Based Resources For Educational Institutions [0.9] AI-VERDEは、学術的な環境での商用、クラウドホスト、オンプレミスのオープンLLMのシームレスな統合を容易にするために設計された、統合されたLLM・アズ・ア・プラットフォームサービスである。
AI-VERDEは、堅牢なアクセス制御、プライバシ保護機構、ネイティブなRetrieval-Augmented Generation(RAG)サポート、サードパーティのLLMサービスの予算管理、対話型WebインターフェースとAPIアクセスといった機能を提供することで、教育と研究グループのアクセス管理を効率化する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:11:22 GMT)
Whole-Genome Phenotype Prediction with Machine Learning: Open Problems in Bacterial Genomics [0.8] 細菌の全ゲノムデータセットから表現型予測を取り巻く問題を設定し,因果関係の学習に拡張した。
我々は、この性質のデータセットに直面した場合、マシンの意思決定の信頼性に影響を与える課題について議論する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:25:14 GMT)
Enhancing Video Understanding: Deep Neural Networks for Spatiotemporal Analysis [0.8] ディープニューラルネットワークは、特徴抽出とビデオ記述という領域において、奨励的な結果を示している。
我々は、重要なビデオ理解と行動認識データセットをレビューし、比較する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 05:44:50 GMT)
On Training-Conditional Conformal Prediction and Binomial Proportion Confidence Intervals [0.8] 制御システムコミュニティでは、力学系の統計的安全性の証明など、多くの重要なタスクをB PCI問題として定式化することができる。
トレーニング条件CPと呼ばれる変種が安全認証の問題に取り組むために最近採用された。
我々は、CPはB PCI問題には適さないと主張し、従来のB PCI手法は統計安全認証に適していると主張している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:59:03 GMT)
Optical spin readout of a silicon color center in the telecom L-band [0.8] 効率的なスピン光子インタフェースは量子ネットワークにとって不可欠であり、遠距離での絡み合い分布と情報伝達を可能にする。
ここでは, シリコン中の炭素-酸素欠陥であるC中心におけるスピン状態の光学的検出を行い, ゼロフォノン線を1571nmで示す。
光励起とマイクロ波駆動を組み合わせることで、光検出された磁気共鳴を実現し、テレコムバンド光遷移によるスピン状態の読み出しを可能にする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:22:38 GMT)
EMERALD: Evidence Management for Continuous Certification as a Service in the Cloud [0.7] クラウド固有のセキュリティ認証の欠如は、ヨーロッパのクラウドサービスのプロビジョニングと使用における透明性と説明責任を損なう。
EMERALDは、定義されたセキュリティと信頼のレベルに準拠した消費者に、アジャイルとリーンの再認証を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:49:10 GMT)
Quantum Communication Advantage for Leader Election and Agreement [0.7] 本稿では,Grover検索や量子カウント,量子ウォークなどの量子アルゴリズム技術が,分散アルゴリズムのメッセージ効率を著しく向上させることを示す。
特に、直径2ネットワークのためのリーダー選挙プロトコルでは、改良されたメッセージ複雑性を実現するために量子ウォークを用いています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:52:20 GMT)
Fock state probability changes in open quantum systems [0.7] これらのフォック状態に初期相関がある場合、真空または二粒子状態の観測確率が時間とともにどのように変化するかを検討する。
本モデルでは, より軽いニュートリノ質量は, 初期生成過程後の環境との相互作用により, 観測可能な粒子数のより強い歪みを引き起こすことを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:19:08 GMT)
ArthroPhase: A Novel Dataset and Method for Phase Recognition in Arthroscopic Video [0.7] 時間的特徴を利用した鏡視下外科的位相認識のためのベンチマークを確立することを目的としている。
我々のモデルは、時間的フレームワイド特徴抽出を利用して、トランスフォーマーベースのアーキテクチャを採用している。
提案されたモデルは、ACL27データセットで72.91%の精度を達成した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:19:50 GMT)
A General Pipeline for Glomerulus Whole-Slide Image Segmentation [0.7] 腎疾患の正確な診断にはWSIの糸球体分離が不可欠である。
本稿では、パッチレベルとWSIレベルのセグメンテーションタスクの両方を効果的に強化するグロメラスセグメンテーションのためのパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:35:48 GMT)
MetaSC: Test-Time Safety Specification Optimization for Language Models [0.7] モデル重みを変更することなく、推論時に言語モデル(LM)の安全性推論を最適化する新しい動的安全フレームワークを提案する。
我々は、安全プロンプト仕様を反復的に更新して、批判と修正プロセスを適応的に駆動するメタ批判機構を活用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:06:25 GMT)
Correlations and Krylov spread for a non-Hermitian Hamiltonian: Ising chain with a complex-valued transverse magnetic field [0.6] クリロフ複雑性は自然に進化した状態の拡散を測定する。
クリロフの展開は、その無限時間値にどのように達するかに基づいて、3つの異なる位相を展開できることが示される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:57:19 GMT)
EdgeEar: Efficient and Accurate Ear Recognition for Edge Devices [0.6] 耳認識(Ear recognition)は、様々な領域にまたがる、接触のない、邪魔にならない生体計測技術である。
本稿では,この問題を解決するために,ハイブリッドCNN変換器アーキテクチャに基づく軽量モデルであるEdgeEarを紹介する。
特定の線形層に低ランク近似を組み込むことで、EdgeEarはパラメータ数を現在の最先端技術と比較して50倍に削減し、競合精度を維持しながら200万以下になる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:53:33 GMT)
State Initialization by Gate Operation in Open Quantum Systems [0.6] 高速ゲートを持つ開量子系の初期条件を計算するための単純で正確な方法が提案されている。
初期qubit状態のポストゲートは一般的にハイブリッドであることを示す。
また、ゲートの忠実度は、キュービットの回転角の関数として連続的なスピン-エコ特性を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:46:18 GMT)
Unified Graph Networks (UGN): A Deep Neural Framework for Solving Graph Problems [0.6] グラフ問題を解くために,emphUnified emphGraph emphNetwork (UGN) という新しいフレームワークを提案する。
UGNはグラフ畳み込みニューラルネットワーク(GCN)と2次元畳み込みニューラルネットワーク(Conv2D)に基づいている
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:03:18 GMT)
Emulators for stellar profiles in binary population modeling [0.5] 本研究では,放射軸に沿った内部恒星構造を推定するための新しいエミュレーション手法を提案する。
主成分分析を次元減少と完全連結フィードフォワードニューラルネットワークに応用して予測を行う。
メモリとストレージの効率の面では, 近接近似に匹敵する精度が期待できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:18:12 GMT)
What Matters in Hierarchical Search for Combinatorial Reasoning Problems? [0.5] 近年の取り組みでは,階層的な高次探索戦略を取り入れたサブゴアル手法による計画の強化が試みられている。
有望ではあるが、従来の低レベルのプランナに対する彼らのパフォーマンスは一貫性がなく、アプリケーションコンテキストに関する疑問を提起している。
難解な値関数、複雑なアクション空間、環境におけるデッドエンドの存在、あるいは多様な専門家から収集されたデータなど、ハイレベル検索の利点を活用する上で重要な属性を同定する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:33:14 GMT)
Robust Indoor Localization in Dynamic Environments: A Multi-source Unsupervised Domain Adaptation Framework [0.5] DF-Locはマルチソース非教師付きドメイン適応(MUDA)に基づくエンドツーエンド動的指紋位置決めシステムである
このシステムは、CSIデータ前処理のための品質制御(QC)モジュールを搭載し、CSI指紋特徴再構成のための画像処理技術を採用している。
オフィスおよび教室環境における大規模実験により,DF-Locは,局部化精度とロバスト性の両方の観点から比較手法に優れていた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:29:22 GMT)
Learning Equivariant Maps with Variational Quantum Circuits [0.5] 幾何学的量子機械学習は、データ固有の対称性を使用して、カスタマイズされた機械学習タスクを設計する。
この研究は、有限群の2つのユニタリ表現が与えられた同変写像を学ぶという関連する問題を探求する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:57:44 GMT)
MeshSplats: Mesh-Based Rendering with Gaussian Splatting Initialization [0.5] 本稿では,ガウス的要素をメッシュ面に変換する手法であるMeshSplatsを紹介する。
我々のモデルは変換の直後に利用でき、追加のトレーニングなしでわずかに品質が低下するメッシュが得られる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:27:39 GMT)
Pareto Optimal Algorithmic Recourse in Multi-cost Function [0.4] アルゴリズム的リコースは、個々の特徴を変更するために最小限のコストのアクションを識別することを目的としており、それによって望ましい結果が得られる。
現在のリコース機構のほとんどは、コスト関数が微分可能であると仮定する勾配に基づく手法を使用しており、現実のシナリオでは適用できないことが多い。
本研究では,非微分可能かつ離散的多コスト関数を扱うアルゴリズム的リコースフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 03:16:08 GMT)
Hybrid classical-quantum communication networks [0.4] 本稿では、量子鍵分布などの量子通信プロトコルを既存の光波ネットワークに統合するための研究成果について概説する。
このアプローチは、古典的および量子的通信プロトコルが光ファイバー、通信ハードウェア、その他のネットワーク制御資源を共有できるようにすることにより、実装コストを削減するという大きな利点を提供する。
インターネットの未来に対する私たちのビジョンは、古典通信と量子通信の両方のシームレスなサポートを念頭に設計した異種通信ネットワークです。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:53:14 GMT)
Logical coherence in 2D compass codes [0.4] 2Dコンパス符号は、Bacon-Shor符号、$X$-Shor符号、$Z$-Shor符号、回転曲面符号を含む量子誤り訂正符号のファミリーである。
従来,一様コヒーレント回転の下では,表面符号の精度は一定であり,コヒーレンス閾値が一定であることが示唆された。
トーリック符号がコード距離$L$の論理コヒーレンスを指数関数的に抑制できることを解析的に証明した。
この下限は、雑音下でしきい値を持たない$Z$-Shor符号で達成可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:14:38 GMT)
YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning [0.4] 商業用果樹果樹における未熟リンゴ(フルーツレット)の3次元ポーズ推定法を開発した。
YOLO11(またはYOLOv11)オブジェクト検出とポーズ推定アルゴリズムとViT(Vision Transformers)を併用して深度推定を行う。
YOLO11nは、ボックス精度と精度の点で、YOLO11とYOLOv8のすべての構成を上回った。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:07:35 GMT)
Verifying LLM-Generated Code in the Context of Software Verification with Ada/SPARK [0.4] 大規模言語モデル(LLM)は、顕著なコード生成能力を示しているが、生成されたコードの正確性は本質的に信頼できない。
本稿では,ALM生成コードの信頼性を確保するために,形式的ソフトウェア検証,特にAdaのSPARKフレームワークを使用することの実現可能性について検討する。
本稿では,既存のプログラムのSPARKアノテーションを生成するためにLLMを利用するツールであるMarmaraganについて述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:42:07 GMT)
Beyond Confidence: Adaptive Abstention in Dual-Threshold Conformal Prediction for Autonomous System Perception [0.4] 安全クリティカルな認識システムは、安全を維持するために確実な不確実性定量化と原則化された禁制機構を必要とする。
本稿では、統計的に保証された不確実性推定を提供するとともに、選択的な予測シナリオを実現するための新しい二重閾値整合化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:45:31 GMT)
An Advanced NLP Framework for Automated Medical Diagnosis with DeBERTa and Dynamic Contextual Positional Gating [0.4] 提案手法では、バックトランスレーションを用いて多様なパラフレーズデータセットを生成し、ロバスト性を改善し、分類タスクにおけるオーバーフィッティングを軽減する。
分類には、意図に基づくフィードフォワードニューラルネットワーク(ABFNN)が使用され、意思決定精度を向上させるために、最も関連性の高い機能に効果的に焦点が当てられている。
本手法は, 99.78%の精度, 99.72%のリコール, 99.79%の精度, F1スコアの99.75%の精度で, 医療診断におけるNLPフレームワークの有効性を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:32:24 GMT)
Ensemble quantile-based deep learning framework for streamflow and flood prediction in Australian catchments [0.3] 近年、洪水のような気候の極端は、オーストラリアにとって重要な環境と経済の危険を生み出している。
深層学習の手法は、極端な気候現象を予測することを約束しているが、大規模な洪水は重要な課題である。
大規模ストリームフロー予測に対処するアンサンブル量子化に基づくディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:41:10 GMT)
Governing AI Agents [0.3] 本項では、主エージェント問題に関する経済理論と、機関関係に関する共通法学説を概観する。
それは、情報非対称性、差別的権威、忠誠といった問題を含む、AIエージェントから生じる問題を特定する。
包括性、可視性、責任のガバナンス原則をサポートするためには、新しい技術的および法的基盤が必要である、と氏は主張する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:30:44 GMT)
Enhancing Robustness Of Digital Shadow For CO2 Storage Monitoring With Augmented Rock Physics Modeling [0.3] 時間ラプス地震イメージングはCO2の移動を追跡するのに不可欠であるが、多相下流の複雑さを捉えるのにしばしば苦労する。
非線形ベイズフィルタリングや生成AIといった機械学習駆動のデータ同化技術を活用するDigital Shadows(DS)は、より詳細で不確実性を認識した監視アプローチを提供する。
本研究では,様々な岩石物理モデルによる予測アンサンブルの増大が誤った仮定の影響を緩和し,予測精度を向上させることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:33:35 GMT)
Advancing Geological Carbon Storage Monitoring With 3d Digital Shadow Technology [0.2] Digital Shadowフレームワークは、地震やボアホールの測定を含むフィールドデータを統合して、時間とともにCO2飽和度を追跡する。
生成AIのような機械学習支援データ同化技術は、CO2配管のデジタルモデルを更新する。
本研究では,3次元地震探査と貯留層モデリングを応用して,不確実性を考慮した2次元ディジタルシャドウフレームワークを拡張した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:25:57 GMT)
Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired [0.2] スペース・アウェア・インストラクション・チューニング(SAIT)データセットとスペース・アウェア・ベンチマーク(SA-Bench)を紹介する。
データ生成パイプラインは、3D空間と周囲の目的地への仮想パスに焦点を当てています。
本稿では,歩行指導におけるVLMの有効性を評価するための評価プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:14:49 GMT)
The Causal Information Bottleneck and Optimal Causal Variable Abstractions [0.2] Information Bottleneck (IB) は変数の抽象化を構築するために広く使われている手法である。
IBのような従来の手法は純粋に統計的であり、根底にある因果構造を無視する。
目的変数に対する因果制御を維持しつつ,選択した変数の集合を圧縮する因果情報ボトルネック(CIB)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:59:11 GMT)
Solving rescheduling problems in heterogeneous urban railway networks using hybrid quantum-classical approach [0.2] 整数線形プログラミングモデルを構築し、D-Waveの量子古典ハイブリッドソルバ(CQM)を用いて解く。
提案手法はポーランドにおける実生活異質都市ネットワーク上で実証されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:01:32 GMT)
Automatic Prostate Volume Estimation in Transabdominal Ultrasound Images [0.2] 経直腸超音波(TAUS)は非侵襲的な代替手段を提供するが、画像品質の低下、複雑な解釈、オペレーターの専門知識への依存といった課題に直面している。
本研究では,TAUSを用いたPV自動推定のためのディープラーニングベースのフレームワークを提案する。
前立腺を効果的に分断し、その体積を推定し、早期前立腺検出のための信頼性の高い非侵襲的危険層形成の可能性を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:29:22 GMT)
Spin-Valley Protected Kramers Pair in Bilayer Graphene [0.2] シングルキャリア量子ドット(QD)基底状態は、クラマーズ対を構成する2つの状態がスピンとバレー量子数を持つ2つの縮退性を示す。
本研究では,Ke-Meleスピン軌道分割により,99%以上の忠実度を持つゼロ磁場でも,Ke-Meleスピン軌道分割によりKramersダブレット単発読み出しが可能となることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:59:10 GMT)
Tab2Visual: Overcoming Limited Data in Tabular Data Classification Using Deep Learning with Visual Representations [0.1] 異種表データを視覚表現に変換する新しい手法であるTab2Visualを提案する。
提案手法を多種多様なデータセットに対して広範囲に評価し,その性能を幅広い機械学習アルゴリズムと比較した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:12:29 GMT)
SHACL-SKOS Based Knowledge Representation of Material Safety Data Sheet (SDS) for the Pharmaceutical Industry [0.1] 本稿では,SHACL-SKOSシステムアーキテクチャ設計の概要を述べるとともに,複合輸送カバーシートの生成を効率化する産業アプリケーションの実装について述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 20:44:45 GMT)
Accuracy and Robustness of Weight-Balancing Methods for Training PINNs [0.1] PINNの文脈で精度と堅牢性を明確に定義する。
本稿では,Primal-Dual (PD) 最適化フレームワークに基づく新しいトレーニングアルゴリズムを提案する。
提案手法は,既存のウェイトバランス法に匹敵する性能を維持しつつ,PINNの堅牢性を向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:16:04 GMT)
Reddit's Appetite: Predicting User Engagement with Nutritional Content [0.1] Reddit上での食品関連投稿における栄養内容がユーザエンゲージメントに与える影響について検討した。
この結果は、健康な食事習慣を奨励することを目的とした、より活発なオンラインイニシアチブの設計に価値ある洞察を与える。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:54:53 GMT)
Almost-idempotent quantum channels and approximate $C^*$-algebras [0.0] 有限次元の$varepsilon$-$C*$ algebra $A$ is $O(varepsilon)$-同型であることを証明する。
A$ が有限次元 $eta$-idempotent UCP map $Phi$ から来るとき、$O(eta)$-同型とその逆写像は UCP map によって実現される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:26:18 GMT)
Error mitigation and circuit division for early fault-tolerant quantum phase estimation [0.0] 本稿では,早期フォールトトレラントアルゴリズムを設計するためのフレームワークを提案する。
量子フーリエ変換(QFT)に基づくQPE技術を開発した。
EUMLE(Explicitly Unbiased Likelihood Estimation)を導入する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:49:30 GMT)
YOLO Network For Defect Detection In Optical lenses [0.0] 本研究では, YOLOv8ディープラーニングモデルに基づく自動欠陥検出システムを提案する。
欠陥とレンズ領域を付加した独自の光学レンズデータセットが作成され、モデルをトレーニングした。
本研究で得られた実験結果から,光学レンズの欠陥を効率よく,正確に検出できることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:41:30 GMT)
WebChecker: A Versatile EVL Plugin for Validating HTML Pages with Bootstrap Frameworks [0.0] WebCheckerはEpsilon Validation Language (EVL)のプラグインである
WebCheckerはHTMLとCSSフレームワークを暗黙のルールで管理する。
プラグインの有効性はBootstrapでのアプリケーションを通じて実証されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:40:43 GMT)
ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models [0.0] 地球系モデル (ESM) は、大気、海、陸、氷、生物圏の相互作用を統合し、地域気候と地球気候の状態を推定する。
本研究では,視覚変換器の正弦波表現ネットワーク(ViSIR)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:02:23 GMT)
Unsupervised Feature Extraction and Reconstruction Using Parameterized Quantum Circuits [0.0] 量子オートエンコーダ(QAE)は手書き桁分類などの基本的な分類タスクでは広く評価されていない。
QCNNベースのエンコーダを用いて、QAEはMNISTのバイナリ分類において平均97.59%の精度を達成する(0, 1)。
この結果は,QAEとQCNNの相乗効果が最適特徴抽出性能を達成する上で重要である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:13:04 GMT)
Universal time scalings of sensitivity in Markovian quantum metrology [0.0] 最も一般的な量子制御プロトコルの下で、時間による最適感度スケーリングの一般的な特徴について検討する。
単純な代数的条件により、二次線型、二次四次、線型四次時間スケーリングの4つのクラスを特徴づけることができる。
文献の中で最も厳密な感度の量的境界を求めるための普遍的な数値法を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:15:41 GMT)
Turing Video-based Cognitive Tests to Handle Entangled Concepts [0.0] 本稿では,概念的組み合わせに関する革新的なビデオベース認知テストの結果について述べる。
収集したデータは量子理論フレームワーク内で忠実にモデル化可能であることを示す。
我々は,物理界と認知界の両方に絡み合いの出現について,新しい説明を提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:35:13 GMT)
Transient dynamical phase diagram of the spin-boson model [0.0] 数値的精度の高いインヒワーム量子モンテカルロアルゴリズムを用いて, サブオフミックスピンボソンモデルのリアルタイムダイナミクスについて検討した。
得られた動的位相図は臨界結合の値と臨界指数の関連値の両方において平衡位相図とは異なることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:34:52 GMT)
Training Sparse Mixture Of Experts Text Embedding Models [0.0] トランスフォーマーベースのテキスト埋め込みモデルは、パラメータ数を増やすことで、MIRACLやBEIRのようなベンチマークのパフォーマンスを改善した。
このスケーリングアプローチでは、推論レイテンシやメモリ使用量の増加など、デプロイメント上の大きな課題が導入されている。
最初の汎用MoEテキスト埋め込みモデルであるNomic Embed v2を紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:36:31 GMT)
Towards a Foundation Model for Physics-Informed Neural Networks: Multi-PDE Learning with Active Sampling [0.0] 物理インフォームドニューラルネットワーク(PINN)は、物理法則をニューラルネットワークトレーニングに埋め込むことで偏微分方程式(PDE)を解くための強力なフレームワークとして登場した。
本研究では,統一アーキテクチャ内で複数のPDEを解決可能な基礎PINNモデルの可能性について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:12:28 GMT)
Tomographic Signatures of Interacting Majorana and Andreev States in Superconductor-Semiconductor Transmon Qubits [0.0] 地中における接合部のクーパー対電荷分布のトモグラフィ的再構成から得られる知見について検討した。
相互作用状態と位相状態は、電荷状態の確率分布内の異なるシグネチャから特定できると仮定する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:36:38 GMT)
To Be or Not to Be (in the EU): Measurement of Discrepancies Presented in Cookie Paywalls (LONG) [0.0] 本研究では,1)クライアントブラウザ,2)デバイスタイプ(デスクトップまたはモバイル),3)クッキーペイウォールの存在と動作に対する地理的な位置の影響について検討する。
クッキーペイウォールを提示する804のWebサイトで構成されたデータセット上の自動クローラを用いて,クッキーペイウォールの存在がユーザの地理的な位置に影響されていることを確認した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:19:03 GMT)
Time-resolved second-order autocorrelation function of parametric downconversion [0.0] タイプIIパラメトリック変換で発生する2本のビームのうちの1本の時間分解2階自己相関関数を測定する可能性について検討した。
このような測定により、そのビームのグローバルコヒーレンスを直接推測できることを示す。
また, 理論モデルにより, 1ビームの2次元自己相関関数がゼロ遅延時間付近の局所的な最大値を示すことを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:44:52 GMT)
Time evolution of nodes in quantum superposition states [0.0] ノードは伝統的に、確率密度が消える固定点と見なされる。
この研究は、これらのノードが量子重畳状態において時間依存的な振動を示すことを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:14:28 GMT)
Thermodynamic Uncertainty Relations for Coherent Transport [0.0] 我々はフェルミオンコヒーレント輸送の普遍的熱力学的不確実性関係を導出した。
その結果,コヒーレントな熱電式熱エンジンと冷凍機は,平均電力の消滅や変動電力の変動にのみ理想的な効率が得られることを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:45:09 GMT)
The impact of hole $g$-factor anisotropy on spin-photon entanglement generation with InGaAs quantum dots [0.0] 1つの有望なスキームは、横磁場におけるスピンのラーモア偏差に依存する。
我々は、平面内磁場方向に対する重ホール$g$-factor異方性の起源を調査する。
その結果, スピン光子クラスター状態の生成を改善するために, ホール$g$-factorの生後制御が可能であることがわかった。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:16:37 GMT)
The Moral Mind(s) of Large Language Models [0.0] 大きな言語モデル(LLM)が様々な分野の意思決定に統合されるにつれて、主要な疑問が生まれます。
倫理的シナリオを構造化した主要プロバイダから約40のモデルを提示する。
私たちの合理性テストでは、各プロバイダの少なくとも1つのモデルが、ほぼ安定した道徳原理と整合した振る舞いを示しました。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:35:02 GMT)
The Devil is in the Prompts: De-Identification Traces Enhance Memorization Risks in Synthetic Chest X-Ray Generation [0.0] 生成モデル、特にテキスト画像拡散モデル(T2I)は、医療画像解析において重要な役割を果たす。
これらのモデルは、データの記憶をトレーニングする傾向があり、患者のプライバシに重大なリスクをもたらす。
本研究では、データ駆動型アプローチを採用し、データ記憶のトレーニングに最も寄与するプロンプトを特定するための最初の体系的な試みを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:36:00 GMT)
Terahertz electroluminescence from Dirac-Landau polaritons [0.0] ディラック・ランダウ分極からの強いテラヘルツエレクトロルミネッセンスを報告した。
これは、刺激されたサイクロトロン放出と偏光子ベースのレーザーを達成するための大きなステップである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:09:17 GMT)
SoK: A Classification for AI-driven Personalized Privacy Assistants [0.0] 本稿では,科学文献に見られる既存の解を地図化するために,知識の体系化(SoK)を提案する。
我々は過去10年間(2013-2023)に1697件のユニークな研究論文をスクリーニングし、39件の論文から分類した。
私たちは、AI駆動型PPAの包括的な分類を提供し、アーキテクチャの選択、システムコンテキスト、使用されるAIの種類、データソース、意思決定の種類、意思決定の制御などについて調べています。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:46:56 GMT)
Sink equilibria and the attractors of learning in games [0.0] ゲーム理論において、学習力学の限界行動(すなわち、引き付け子)を特徴づけることは、最も基本的なオープンな質問の1つである。
位相的構成を通して、一対一予想が偽であることを示す。
第2に,一対一の予想が真であることを示すことによって,二プレーヤゲームにおけるアトラクタ特徴化問題を推し進める。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:40:11 GMT)
Singular leaning coefficients and efficiency in learning theory [0.0] 非正のフィッシャー情報行列を持つ特異学習モデルには、ニューラルネットワーク、低ランク回帰、ボルツマンマシン、通常の混合モデルなどが含まれる。
本稿では,ReLU単位を用いた深層線形学習モデルと3層ニューラルネットワークモデルの一般学習効率を示す学習係数について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:41:34 GMT)
Simulating a quasiparticle on a quantum device [0.0] 相互作用する量子多体系における準粒子励起を探索するための変分法を提案する。
提案アルゴリズムは, 1次元横フィールドイジングチェーン上で行った数値シミュレーションによりベンチマークを行う。
VQEで構築した局所準粒子状態は、準粒子の全バンド上でアクセス可能な情報を含むことを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:26:44 GMT)
Revealing hidden physical nonclassicality with nonnegative polynomials [0.0] 非負の理論がデータキャプチャーを最適に活用する方法を示す。
非負は、標準検出方法から隠された場合でも、非古典性を明らかにすることができる。
物理的問題は、非負の性格化に関するいくつかの数学的洞察も引き起こした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:16:39 GMT)
Regression-based Physics Informed Neural Networks (Reg-PINNs) for Magnetopause Tracking [0.0] 回帰に基づく物理情報ニューラルネットワーク(Reg-PINN)の紹介
Reg-PINNは、物理にインスパイアされた経験的モデルをニューラルネットワークの損失関数に埋め込む。
シュエのモデルと比較して、この手法はRMSEの約30%の削減を実現している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:54:11 GMT)
Recommendations to OSCE/ODIHR (on how to give better recommendations for Internet voting) [0.0] エストニアのインターネット投票におけるOSCE/ODIHRの推奨事項について調べる。
我々は、まったく達成できないレコメンデーションの例を示すだけでなく、レコメンデーションの履行が非自明なトレードオフを必要とする例も提示する。
我々はOSCE/ODIHRが、この特性によって正確に何を意味するのかを定義し、また、エンドツーエンドの検証が達成されたかどうかを判断するための明確な基準を与えることを期待している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:04:43 GMT)
Quantum-driven Zero Trust Framework with Dynamic Anomaly Detection in 7G Technology: A Neural Network Approach [0.0] セキュリティ強化のためのQNN-ZTF(Quantum Neural Network-Enhanced Zero Trust Framework)を提案する。
セキュリティ強化のためにZero Trust Architecture, Intrusion Detection Systems, Quantum Neural Networks(QNN)を統合した。
サイバー脅威の軽減効果が向上し, 偽陽性と応答時間を減らすための枠組みの有効性が示された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:59:32 GMT)
Quantum dynamics of a spin model with an extensive degeneracy [0.0] 本研究では, 1次元スピンモデルの量子力学の性質を, ランプおよび周期駆動プロトコルの両方で形成する上で, 広範囲な縮退が果たす役割について検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:01:07 GMT)
Quantum Analog-to-Digital Converter for Phase Estimation [0.0] 本稿では,量子気象学のための量子アナログ-ディジタル変換器を初めて実験的に実現したことを報告する。
我々は,標準量子限界を超えるデジタル位相推定プロトコルを実装した。
本研究は,量子ディジタル推定戦略の今後の実装に向けた新たな視点を開拓する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:27:06 GMT)
Quantitative evaluation of unsupervised clustering algorithms for dynamic total-body PET image analysis [0.0] 冠動脈疾患と診断された30例の患者から収集した15ドルO-water PET画像を用いて検討した。
クラスタリングアルゴリズムを定量的に評価するために,脳,右心室,右腎,右肺葉下部,膀胱から曲線が取られるか否かに基づいて,各画像から5000個のTACを分類した。
以上の結果から, GMM, FCM, ICAとミニバッチK平均値の組み合わせでTACを89%, 83%, 81%と分類した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:28:50 GMT)
Quantification of model error for inverse problems in the Weak Neural Variational Inference framework [0.0] Weak Neural Variational Inference (WNVI) フレームワークを拡張し,確率的特性推定を行う。
本フレームワークはPDEに基づく逆問題におけるモデル誤差を明示的に定量化する。
提案手法により, 材料特性推定の精度と信頼性が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:52:06 GMT)
Phenomenology of many-body localization in bond-disordered spin chains [0.0] 多体局在は、強い障害の存在下での量子多体系の熱化を妨げる。
本研究は,MBL系におけるスピン-1/2 XXZスピン鎖の研究である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:55:42 GMT)
Partial-Label Learning with Conformal Candidate Cleaning [0.0] 本稿では、共形予測を用いて候補集合を漸進的に起点とする新しい拡張手法を提案する。
我々は,本手法が未知の土台真実に対して適合性を保っていることを確認した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:51:23 GMT)
Parametric type design in the era of variable and color fonts [0.0] 本稿では,メタポストを用いたパラメトリック設計の原理に基づく近代型設計プロセスについて考察する。
著者は2つの可変フォントをこの方法で作成し、それらをフリーのオープンソースライセンスでリリースした。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:12:05 GMT)
OscNet: Machine Learning on CMOS Oscillator Networks [0.0] 我々はCMOSネットワーク(OscNet)上に実装された新しいエネルギー効率のよい機械学習フレームワークを提案する。
我々は、OscNetを用いて出生前脳の視覚系の発達過程をモデル化し、生物学的にインスパイアされたヘビアン規則に基づいて更新する。
実験の結果、OscNet上のHebbianの学習パイプラインは、従来の機械学習アルゴリズムに匹敵する、あるいは超えるパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:32:32 GMT)
Optimizing Likelihoods via Mutual Information: Bridging Simulation-Based Inference and Bayesian Optimal Experimental Design [0.0] 勾配に基づくBOED法はベイズ最適化や他の実験的設計の代替として提案されている。
本稿では,SBI-BOEDとしてBOEDをSBIアプリケーションで使用可能にするため,SBIと勾配に基づく変分推論手法の相互情報バウンダリによるリンクを示す。
疫学・生物学における実世界のシミュレータにおけるSBIモデルに対するこのアプローチを比較し,推論の顕著な改善を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:58:18 GMT)
Open transmission channels in multimode fiber cavities with random mode mixing [0.0] 乱れた媒体における光の輸送は、オープントランスミッションチャネルによって制御される。
開水路は、普遍空間構造や拡張ドウェル時間のようなユニークな性質を示す。
オープンチャネルを探索するためのプラットフォームとして,マルチモードファイバキャビティ(MMFC)を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:56:19 GMT)
One Class Restricted Kernel Machines [0.0] 制限されたカーネルマシン(RKM)は、機械学習の分野における一般化能力の向上に大きな影響を与えている。
RKMsの有効性は、データセット内の外れ値やその他の汚染形態の存在によって損なわれる可能性がある。
この重要な問題とモデルの堅牢性に対処するため、我々は新しい一級RKM(OCRKM)を提案する。
OCRKM の枠組みでは、可視変数と隠れ変数の両方を非確率的に統合する RBM と同様のエネルギー関数を用いる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 07:11:20 GMT)
On the distinction between beables and qualia [0.0] De Broglie-Bohmの解釈と意識の難しさとの関係について検討した。
クエーリアはド・ブロイ=ボームの解釈に必要であり、逆にデ・ブロイ=ボームの解釈(または類似の理論)はクエーリアに必要である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:03:25 GMT)
On the causal efficacy of qualia: Philosophical zombies are fine-tuned, and implications for the quantum measurement theory [0.0] 我々は、クォーリアが量子力学において因果的に有効であることを示唆する。
これは量子状態の単位時間進化と互換性がある。
すべての量子状態が準同値であるとは限らないことを示唆する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:28:54 GMT)
On some states minimizing uncertainty relations: A new look at these relations [0.0] 我々は、量子系の多くの状態が存在することを考察する。
これらの状態は、観測可能な$A$または$B$の固有状態ではない。
さらに、最も一般的な形の不確実性原理は2つの面を持つことを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:29:22 GMT)
On Measures in Ion Trap Quantum Information [0.0] 本研究では,イオントラップの量子情報測定について検討する。
その結果, 定常状態の場合, 相互情報と同期対策が類似した行動を示すことが明らかとなった。
トラップ内の単一イオンのコヒーレントな状態について論じ、複雑度と忠実度との逆関係を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:30:36 GMT)
Object-centric proto-symbolic behavioural reasoning from pixels [0.0] 我々は、ピクセルから学習し、その環境を解釈し、制御し、推論する脳に触発されたディープラーニングアーキテクチャを提案する。
その結果,エージェントは創発的条件付き行動推論を学習できることがわかった。
提案アーキテクチャは、教師なし学習における重要な帰納バイアスとして、接地オブジェクト表現の操作方法を示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:10:32 GMT)
Noise Effects on Diabatic Quantum Annealing Protocols [0.0] ダイアバティック量子アニールは、非断熱遷移を利用して量子最適化における小さなエネルギーギャップとデコヒーレンスによって生じる課題を軽減することを目的としている。
テストケースとして最大重み付き独立集合問題を用いた現実的で散逸的な設定における2つのダイアバティックプロトコルの性能を比較した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:37:03 GMT)
New tools for comparing classical and neural ODE models for tumor growth [0.0] 腫瘍増殖をモデル化するための新しい計算ツールであるTormaGrowth.jlが導入された。
このツールは、General BertalanffyやGompertzといった標準の教科書モデルと新しいモデルの比較を可能にする。
非小細胞肺癌と膀胱癌に対するヒトのメタスタディを再考し, 2種類の治療法を施行した症例について検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:21:28 GMT)
Mesh2SSM++: A Probabilistic Framework for Unsupervised Learning of Statistical Shape Model of Anatomies from Surface Meshes [0.0] Mesh2SSM++は、教師なしの方法でメッシュから対応を推定する、新しいアプローチである。
メッシュ上で直接操作する能力と計算効率と解釈可能性を組み合わせることで、従来のディープラーニングベースのSSMアプローチに代わる魅力的な選択肢となる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:19:23 GMT)
Mathematical reasoning and the computer [0.0] コンピューターはすでに、人間の数学のやり方を変えている。
彼らはいつか推論を始めますか?
本稿では、ニューラルネットワーク、コンピュータ定理証明器、大規模言語モデルにおける最近の発展の概要について述べる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:35:52 GMT)
Materials and spin characteristics of amino-terminated nanodiamonds embedded with nitrogen-vacancy color centers [0.0] 蛍光ナノダイヤモンド(FND)の適切な機能化は、化学および生物学的プロセスにおけるプローブとしての利用に必要である。
FNDの表面を変更することは、キュービットセンサーの特性に影響を与える可能性がある。
組込み窒素空洞(NV)カラーセンターの基本特性をFNDサイズと表面終端の関数として検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:03:53 GMT)
Majorana qubit readout by a point-contact detector under finite bias voltages [0.0] 我々は、ポイントコンタクト(PC)検出器によるMajorana box qubit(MBQ)読み出しの問題を再検討する。
MBQの論理状態は、MBQとトンネル結合量子ドットの結合フェルミオンパリティと関連している。
これら2つの指標を調べることにより,PC検出器の最適バイアス電圧ウィンドウを低温限界で同定する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:31:38 GMT)
Lexical categories of stem-forming roots in Mapudüngun verb forms [0.0] 主な焦点は、語源において言語として認識される「Mapud"ungun roots」の語彙分類である。
この語彙カテゴリー修正の結果は、検証された直後に実施されるので、直接計算分析に役立ちます。
これらの結果は、マプチェ語の語彙カテゴリーに関する不確実性を明らかにするのに役立つことが期待されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:10:23 GMT)
Large Cognition Model: Towards Pretrained EEG Foundation Model [0.0] 多様な脳波データセットと下流タスクをまたいだ一般化を目的としたトランスフォーマーベース基盤モデルを提案する。
本研究は, 神経科学, パーソナライズドメディカル, およびBCI技術の進歩を促進するための, 事前学習型脳波基盤モデルの可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:28:10 GMT)
Kinetic inductance coupling for circuit QED with spins [0.0] 分子スピン量子ビットアンサンブルと粒状アルミニウム超伝導マイクロ波共振器との長手結合を実証した。
この結合の固有周波数依存性により、7.8GHzのリードアウト共振器が利用できる。
超伝導フラクソニウム量子ビットへの単一スピンの縦方向の結合経路を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:53:58 GMT)
Intrinsic mixed state topological order in a stabilizer system under stochastic decoherence: Strong-to-weak spontaneous symmetry breaking from percolation point of view [0.0] 固有混合状態トポロジカル秩序状態(IMTO)が提案された。
我々は,最大デコヒーレンスの下でのトーリック符号システムの研究によりIMTOの出現を観察した。
本研究は、フェルミオン性エノンに対する2つの異なる顕微鏡的弦演算子の存在を明らかにし、フェルミオン性強い1型対称性と弱い1型対称性を導出する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 12:57:08 GMT)
Interplay of resources for universal continuous-variable quantum computing [0.0] 我々は、離散変数系におけるコヒーレンスに類似した連続変数回路において、シンプレクティックコヒーレンスと呼ばれる新しい性質を求める。
これは、非ガウス性や絡み合いとともに、連続変数量子コンピューティングにおける普遍性に必要なリソースとしてシンプレクティックコヒーレンスを確立する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:15:11 GMT)
Information capacity of quantum communication under natural physical assumptions [0.0] 量子準備と測定のシナリオは、放出された状態に関する様々な物理的仮定の下で研究されている。
量子次元によって制限された状態に対する一般境界と強境界を導出する。
この結果は、半デバイス非依存の量子情報処理のより統一された図への第一歩となる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:17:13 GMT)
Hybrid Tree Tensor Networks for quantum simulation [0.0] ハイブリッドツリーネットワーク(hTTN)を用いた基底状態最適化のための新しいアルゴリズムを提案する。
我々は、hTTNsが古典的部分における等しい結合次元を持つ古典的等価性を改善することができることを示した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:14:11 GMT)
Higher-Order Message Passing for Glycan Representation Learning [0.0] グラフネットワーク(GNN)は、グラフ構造化データの処理と解析のために設計されたディープラーニングモデルである。
本研究は, グリカン構造から潜在空間表現へ特徴を引き出すために, 錯体と高次メッセージパッシングに基づく新しいモデルアーキテクチャを提案する。
これらの改良により、計算グリコ科学のさらなる進歩が促進され、生物学におけるグリカンの役割が明らかにされることを期待している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:25:03 GMT)
High-impedance resonators for strong coupling to an electron on helium [0.0] 我々は、ヘリウム上の電子との強い結合に適合する高インピーダンス超伝導マイクロ波共振器の設計を導入する。
内部品質の中央値が3.9times 105$、平均インピーダンスが2.5k$Omega$の窒化チタン共振器を作製・測定した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 17:06:18 GMT)
Hierarchical Manifold Projection for Ransomware Detection: A Novel Geometric Approach to Identifying Malicious Encryption Patterns [0.0] 暗号化ベースのサイバー脅威は進化を続けており、従来の検出メカニズムをバイパスする技術がますます高度化している。
階層的多様体射影によって構成された新しい分類フレームワークは、悪意のある暗号化を検出する数学的アプローチを導入する。
提案手法は,暗号シーケンスを構造化多様体の埋め込みに変換し,非ユークリッド特徴分離性による分類ロバスト性を確保する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 23:20:58 GMT)
Hierarchical Document Parsing via Large Margin Feature Matching and Heuristics [0.0] 我々は,AAAI-25 VRD-IUチャレンジに対する解決策を提示する。
深層学習に基づくマッチング戦略と強欲なアルゴリズムを組み合わせることで、精度を大幅に向上する。
本手法は,文書構造解析において,個人用リーダボード上で0.98904の精度を実現し,その有効性を実証する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 10:37:01 GMT)
Genuine multi-entropy and holography [0.0] ホログラフィーでは、真のマルチパーティの絡み合いは小さくなく、重要な役割を果たす。
ブラックホールへの応用については、そのような真の$mathttq$-partiteマルチエントロピーがページ時間後にのみ重要であることが分かる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:31:00 GMT)
Forecasting the future development in quality and value of professional football players for applications in team management [0.0] データ駆動モデルは、プロサッカーにおける転送決定を改善するために使用することができる。
近年の研究では、予測の不確実性定量化と説明可能なモデルの使用が求められている。
本稿では,予測精度と不確実性定量化手法に基づいて,説明可能な機械学習モデルを評価する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:09:09 GMT)
First-principle theory of the Casimir screening effect [0.0] 標準カシミール効果に寄与する電磁揺らぎとは別個にイオン揺らぎが寄与することを示す。
これは「分離仮説」と一致しており、以前は純粋に直感的に適用されてきた。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 19:38:00 GMT)
Fast Audio Codec Identification Using Overlapping LCS [0.0] 本稿では,重なり合う長大な共通部分文字列とサブシーケンスから派生した特徴に基づく音声分類手法を提案する。
8KBパケットに対して97%の精度を達成したシミュレーション結果は,従来の手法よりも提案手法の方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:24:41 GMT)
Fairness in Multi-Agent AI: A Unified Framework for Ethical and Equitable Autonomous Systems [0.0] 本稿では,公正性をエージェント相互作用の動的,創発的特性として扱う新しい枠組みを提案する。
この枠組みは、公正な制約、バイアス軽減戦略、および自律的なエージェント行動と社会的価値を整合させるインセンティブメカニズムを統合する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 04:42:00 GMT)
Exploring the Bitcoin Mesoscale [0.0] Bitcoin取引の歴史全体をオープンにすることで、このシステムを前例のない詳細レベルで研究する可能性が開ける。
この貢献は、Bitcoin User Network (BUN) のメソスケール構造特性を、その歴史全体にわたって分析することに集中している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:18:42 GMT)
Explainable Multimodal Machine Learning for Revealing Structure-Property Relationships in Carbon Nanotube Fibers [0.0] 本研究では, Explainable AI(XAI)を用いた特徴抽出のための因子分析を用いて, 多様なデータ型(マルチモーダルデータ)の分析を統合する。
この手法は多段加工条件と多スケール構造が複雑な影響を持つ材料特性のメカニズムを解明するための強力な手法である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:29:23 GMT)
Exact Floquet solutions in a Parity-Time-Symmetric Rabi Model [0.0] パリティ時(PT)対称性を持つ半古典的ラビモデルは隠れた$sl(2)$対称性を持ち、従って準エクサクティヴ解を持つ。
モデルパラメータに対する対応する制約は、定数と周期的な駆動項の間の共鳴関係として解釈できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:52:09 GMT)
Evaluating and Explaining Earthquake-Induced Liquefaction Potential through Multi-Modal Transformers [0.0] 本研究では, 土壌液状化予測のための並列トランスアーキテクチャを提案する。
この構造は、11大地震の165のケース履歴からデータを処理している。
このモデルは、地域間検証セットで93.75%の精度で予測できる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 09:18:07 GMT)
Estimation of Nonlinear Physical Quantities By Measuring Ancillas [0.0] 我々はフォン・ノイマンエントロピーとレニイエントロピーを推定するための量子アルゴリズムを提案する。
システムを直接測定することなく,少数のアシラ量子ビットを計測することで,与えられたタスクを完了させることができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:15:19 GMT)
Enhanced detection of time-dependent dielectric structure: Rayleigh's limit and quantum vacuum [0.0] 不均一誘電体の時間変調は、その感受性を決定するために用いられる。
遠距離域においても負の周波数のため、光検出信号に対する真空寄与はゼロではないことを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 06:37:26 GMT)
Embedded structure in quantum theory, functional operator and multiverse [0.0] 量子力学が量子場理論から再構築されるという事実をヒントとして、量子場理論を組み込んだより広い理論的枠組みを探求する。
関数演算子を導入することによって量子理論を組込み構造で定式化し、レベルII多元数を記述することができる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:56:33 GMT)
Effcient classical error correction for parity encoded spin systems [0.0] 本稿では,PEアーキテクチャのスピン読み出しにおける誤りの訂正方法について述べる。
スピン読み出しにおける独立かつ同一に分散されたエラーは、非常に単純な復号アルゴリズムによって修正可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:31:24 GMT)
ENFORCE: Exact Nonlinear Constrained Learning with Adaptive-depth Neural Projection [0.0] ENFORCEは、非線形制約を正確に満たす予測を保証するニューラルネットワークアーキテクチャである。
適応深度ニューラルプロジェクションモジュールを構築し、その複雑さを動的に調整し、特定の問題と必要な許容レベルに適合させる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:54:30 GMT)
Directly imaging spin polarons in a kinetically frustrated Hubbard system [0.0] 磁気ポーラロンは、ドープ電荷キャリアの運動エネルギーと超交換スピン相互作用の相互作用から生じる。
ここでは、超低温原子で実現した三角格子ハバード系におけるイテナントスピンポーラロンを画像化する。
対照的に、電荷ドーパント付近では強磁性相関が見られ、これは溶出性長岡効果の現れである。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:47:27 GMT)
Digital quantum simulation of cosmological particle creation with IBM quantum computers [0.0] 等質および等方的展開を行う時空において、最小結合の量子スカラー場からなる系を考える。
時間発展を具現化する量子回路を考案することにより、与えられた場の運動量に対して正と負の2つの振動モードをシミュレートする。
我々は、回路をシミュレートし、IBM量子コンピュータに実際に実験的に実装することで、宇宙が所定の速度で膨張した後に生成された粒子の数を調査する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:56:15 GMT)
Decentralized Entropy-Driven Ransomware Detection Using Autonomous Neural Graph Embeddings [0.0] このフレームワークはノードの分散ネットワークで動作し、単一障害点を排除し、ターゲット攻撃に対するレジリエンスを強化する。
グラフベースのモデリングと機械学習技術の統合により、このフレームワークは複雑なシステムインタラクションをキャプチャできる。
ケーススタディでは、実世界のシナリオでの有効性を検証するとともに、ランサムウェア攻撃を開始後数分で検出し軽減する能力を示している。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 11:59:10 GMT)
Curved spacetimes from quantum mechanics [0.0] 任意のエンフ曲線ローレンツ 4-多様体の局所幾何学は、観測可能量のみを用いて古典的な極限で導出することができる。
曲線付き$C2$ローレンツ 4-多様体の計量構造は(または、あるいは、抽象ポアンカーの不変量子力学系の可観測性によって)復元される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:13:23 GMT)
Consistency and Causality of Interconnected Nonsignaling Resources [0.0] 本稿では、局所的に配線可能な非署名リソースを共有できる$m$$n$のネットワークについて検討する。
このようなネットワークで発生する確率分布を研究するための特定のフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:49:25 GMT)
Coherent deflection of atomic samples and positional mesoscopic superpositions [0.0] 原子試料のコヒーレントな偏向を実現するために,超放射と超吸収の相互作用に基づくプロトコルを提案する。
この運動量移動のコヒーレントな性質は、原子サンプルを全体として偏向させ、原子超放射波パルスの集合的性質と空洞場による超吸収から導かれる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:44:14 GMT)
Coarse Set Theory: A Mathematical Foundation for Coarse Ethics [0.0] 本稿では,CST(Coarse Set Theory)を導入して,CE(Coarse Ethics)の数学的枠組みを確立する。
完全順序集合を用いて粗集合を定義し、要素とその群の間の階層的関係を特徴づける公理を提案する。
詳細な個々のデータを粗い表現に変換する粗いマッピングを定義することで、このフレームワークを拡張します。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:18:37 GMT)
Characterizing entangled state update in different reference frames with weak measurements [0.0] 本研究では,非破壊的弱測定によるマルチパーティント量子ビット状態の更新状態のキャラクタリゼーションについて検討する。
良く知られたように、中間時の更新状態はフレーム依存であり、射影測定に固有の結果ランダム性は、更新された状態で取得される情報を妨げている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 22:35:01 GMT)
Characterization of point-source transient events with a rolling-shutter compressed sensing system [0.0] ポイントソースの過渡イベント(PSTE)は、イメージングシステムにいくつかの課題をもたらす。
これらの要件を満たす従来のイメージングシステムは、価格、サイズ、重量、消費電力、データ帯域幅の点で費用がかかる。
画像システムのローリングシャッター読み出しに適応した新しい圧縮センシングアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:39:32 GMT)
Causal Covariate Shift Correction using Fisher information penalty [0.0] この研究は、データが時間的に分散されるトレーニング環境に分散密度推定の角度を取る。
ペナルティは、フルデータセットベースラインよりも12.9%の精度で向上する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:51:59 GMT)
Bridging the Evaluation Gap: Leveraging Large Language Models for Topic Model Evaluation [0.0] 本研究では,Large Language Models (LLMs) を用いた科学文献における動的に進化するトピックの自動評価のための枠組みを提案する。
提案手法は,専門家のアノテータや狭義の統計指標に大きく依存することなく,コヒーレンス,反復性,多様性,トピック文書のアライメントといった重要な品質次元を測定するためにLLMを利用する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:23:56 GMT)
Bridging LLM-Generated Code and Requirements: Reverse Generation technique and SBC Metric for Developer Insights [0.0] 本稿では,SBCスコアと呼ばれる新しいスコアリング機構を提案する。
これは、大規模言語モデルの自然言語生成能力を活用するリバースジェネレーション技術に基づいている。
直接コード解析とは異なり、我々のアプローチはAI生成コードからシステム要求を再構築し、元の仕様と比較する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 01:12:11 GMT)
Bridging HCI and AI Research for the Evaluation of Conversational SE Assistants [0.0] 大規模言語モデル(LLM)は近年,対話型アシスタントという形で,ソフトウェア工学においてますます採用されている。
我々は、人間中心の自動評価を可能にするために、ヒューマン・コンピュータ・インタラクション(HCI)と人工知能(AI)の研究からの洞察を組み合わせることを提唱する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 21:09:24 GMT)
BiaSWE: An Expert Annotated Dataset for Misogyny Detection in Swedish [0.0] BiaSWEは、スウェーデン語の誤検出用に設計された、専門家による注釈付きデータセットである。
私たちの学際チームは、ドメイン知識と言語知識の両方を取り入れた厳密なアノテーションプロセスを開発しました。
データセットとアノテーションガイドラインは、さらなる研究のために公開されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:25:10 GMT)
Bi-Fact: A Bidirectional Factorization-based Evaluation of Intent Extraction from UI Trajectories [0.0] Bi-Factは、Intent Understandingの自動評価のための新しいアプローチである。
Bi-Factは、金と予測された意図の両方を事実に分割することで、きめ細かい意図比較を可能にする。
本稿では、Bi-Factの総合評価について概説し、その性能を評価し、既存の指標と比較する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:16:31 GMT)
Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models [0.0] 自己教師付き学習は、効果的に訓練された場合、多数の画像や言語処理の問題を解決することができる。
本研究では, セマンティックセグメンテーションタスクに対して, 以前に学習した基礎モデルを適用するための簡易かつ効率的な手法について検討した。
本研究は,少数の画像分割データを用いて,凍結画像表現と言語概念を融合する軽量トランスフォーマーベース融合モジュールであるBeyond-Labelsを提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 02:58:54 GMT)
Autonomous Driving using Spiking Neural Networks on Dynamic Vision Sensor Data: A Case Study of Traffic Light Change Detection [0.0] スパイキングニューラルネットワーク(SNN)は、情報処理と意思決定のための代替計算モデルを提供する。
自動運転にSNNを用いた最近の研究は主に、簡易なシミュレーション環境における車線維持のような単純なタスクに焦点を当てている。
本稿では,実車上でSNNを使用するための重要なステップである,CARLAシミュレータにおける実写走行シーンのSNNについて検討する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 08:38:29 GMT)
Assessing the value of advanced computing infrastructure for supporting research: new tools to inform research policy [0.0] 研究施設への投資は、長年、高等教育における研究方針や実践において疑問視されてきた。
金融危機は、高等教育機関が研究インフラに関して難しい判断を下すことが不可欠である可能性がある。
近年,先進的なコンピューティング施設やサービスへの投資の経済的・科学的価値を評価する手法が開発されている。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:31:13 GMT)
Artificial intelligence for objective assessment of acrobatic movements: How to apply machine learning for identifying tumbling elements in cheer sports [0.0] チアリーディングにおけるタンブリング要素の評価は、客観的尺度と主観的判断の両方に依存します。
転倒の複雑さ - チーム同期性、接地相互作用、振付、芸術的表現など - は、客観的な評価を困難にしている。
本研究では,1つの慣性測定ユニットからのデータを用いたAIベースのアプローチの実現可能性について検討した。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 15:16:03 GMT)
An Elliptic Curve Based Solution to the Perspective-Three-Point Problem [0.0] パースペクティブ・スリーポイント問題(P3P)は、一対の制御点を通して線方向を決定することに集中して解決する。
この解析により、効率的で正確で合理的に単純なP3Pソルバが生成され、最先端のP3Pソルバと比較される。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 14:03:39 GMT)
Advancing climate model interpretability: Feature attribution for Arctic melt anomalies [0.0] 北極氷床と南極氷床は急激な表面融解と淡水流出の増加を経験しており、地球規模の海面上昇に大きく貢献している。
本稿では,ERA5モデルとGEMBモデルにおいて検出された異常を解析するために,非教師なし属性法を提案する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:05:54 GMT)
A proposal for charge basis tomography of superconducting qubits [0.0] 超伝導量子回路の電荷基底密度行列を得るための一般的なプロトコルを提案する。
キャビティ・ステート・トモグラフィーにインスパイアされたこのプロトコルは、ジョセフソン・エネルギパルス列と射影電荷基底の読み出しを組み合わせ、密度行列の対角外要素にアクセスする。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 18:24:59 GMT)
A new approach towards quantum foundation and some consequences [0.0] 7つの仮定に基づく一般的な理論が紹介される。
基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 13:11:20 GMT)
A Review of Fairness and A Practical Guide to Selecting Context-Appropriate Fairness Metrics in Machine Learning [0.0] 我々は,文脈的に適切な公平度尺度の選択を導くフローチャートを開発した。
これには、モデル評価基準、モデル選択基準、データバイアスの考慮が含まれる。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 00:44:45 GMT)
A Framework for LLM-powered Design Assistants [0.0] 大規模言語モデル(LLM)は、人間の言語に似たテキストを分析し、生成するために設計されたAIシステムである。
本研究では,設計プロセスにおける3つの重要なモダリティ,理想探索,設計者との対話,設計評価に焦点を当て,LLMをデザインアシスタントとして採用するフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 11 Feb 2025 16:51:11 GMT)