Fugu-MT: arxivの論文翻訳(概要)

Enhanced Multi-Scale Cross-Attention for Person Image Generation [140.9]
課題のある人物画像生成タスクに対して,新たにGAN(cross-attention-based generative adversarial network)を提案する。クロスアテンション(Cross-attention)は、異なるモードの2つの特徴写像間で注意/相関行列を計算する、新しく直感的なマルチモーダル融合法である。異なる段階における外観・形状特徴を効果的に融合させるために, 密結合型コアテンションモジュールを新たに導入する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:08:25 GMT)
2 OLMo 2 Furious [126.7]
OLMo 2には、アーキテクチャとトレーニングのレシピを改善した密集した自己回帰モデルが含まれている。我々の最新の事前学習データミックスは、Dolmino Mix 1124と呼ばれる新しい特殊なデータミックスを導入しました。完全にオープンなOLMo 2-Instructモデルは、同等の大きさのオープンウェイトモデルに匹敵するか、上回っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:44:16 GMT)
Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.8]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。 Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:51:55 GMT)
Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion [116.4]
事前訓練されたテキスト・ツー・ビデオモデルに基づいて構築されたファースト・イン・ファースト・アウト(FIFO)ビデオ拡散は,近年,チューニング不要な長ビデオ生成に有効なアプローチとして浮上している。 We propose Ouroboros-Diffusion, a novel video denoising framework designed to enhance structure and content (ject) consistency。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:59:15 GMT)
Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports [104.4]
スポーツビデオQAタスク用に特別に設計された最初のデータセットであるSports-QAを紹介する。 Sports-QAデータセットには、説明、時系列、因果関係、反事実条件など、さまざまな種類の質問が含まれている。質問応答のための時間的情報の特定の尺度に自動的にフォーカスできる新しいオートフォーカス変換器(AFT)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:31:57 GMT)
Efficient Long Video Tokenization via Coordinate-based Patch Reconstruction [93.7]
CoordTokは、座標ベースの表現から入力ビデオの対応するパッチへのマッピングを学ぶビデオトークンである。 CoordTokは、ビデオを分解された三面体表現にエンコードし、ランダムにサンプリングされた$(x,y,t)$座標に対応するパッチを再構築する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:53:38 GMT)
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents [92.5]
非参照画像品質評価(NR-IQA)モデルは、知覚された画像品質を効果的に定量化することができる。 NR-IQAモデルは、画像強調のための最大後部推定(MAP)フレームワークにプラグイン可能であることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:36:24 GMT)
Admitting Ignorance Helps the Video Question Answering Models to Answer [82.2]
モデルはしばしばショートカットを定め、結果として質問と回答の間に急激な相関関係が生じる、と我々は主張する。そこで本研究では,モデルに不明瞭さを認めざるを得ない新たな学習手法を提案する。実際に、我々のフレームワークに最先端のモデルを統合することで、その有効性を検証する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:44:52 GMT)
Adaptive Sampled Softmax with Inverted Multi-Index: Methods, Theory and Applications [79.5]
MIDX-Samplerは、逆多重インデックスアプローチに基づく新しい適応型サンプリング戦略である。本手法は, サンプリングバイアス, 勾配バイアス, 収束速度, 一般化誤差境界などの重要な問題に対処するため, 厳密な理論的解析によって裏付けられている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:09:21 GMT)
Computing Game Symmetries and Equilibria That Respect Them [77.7]
ゲームにおける対称性の同定と利用の計算について検討する。ゲーム対称性とグラフ自己同型の間には強い関係がある。与えられた対称性の集合を尊重するナッシュ均衡を求めることは、ブラウワーの不動点や勾配降下問題と全く同じほど難しいことを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:15:16 GMT)
Ensemble sampling for linear bandits: small ensembles suffice [75.4]
アンサンブルサイズは$d log T$ incurs regrets the most of the order $(d log T)5/2 sqrtT$。アンサンブルのサイズが$T$で線形にスケールする必要がなくなるような構造化された設定の最初の結果です。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:41:09 GMT)
MGF: Mixed Gaussian Flow for Diverse Trajectory Prediction [72.7]
本稿では,軌道予測のための正規化フローモデルに対して,混合ガウス前駆体を構築することを提案する。提案手法は,一般的な UCY/ETH および SDD データセットにおける軌道アライメントと多様性の評価において,最先端の性能を実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:52:13 GMT)
Diffusion Models as Network Optimizers: Explorations and Analysis [71.7]
生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。本研究ではまず,生成モデルの本質的な特徴について考察する。本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:18:43 GMT)
GenAI Content Detection Task 3: Cross-Domain Machine-Generated Text Detection Challenge [71.7]
モデルが巨大な、固定された、多数のドメインとLLMから生成されたテキストを検出できるかどうかを問う。 3ヶ月の間に、23の検出器を提出した9つのチームによって、我々のタスクが試みられた。その結果, RAID から生成したテキストに対して, 5% の偽陽性率を維持しながら, 精度が 99% を超えることが判明した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:21:09 GMT)
Enhancing Novel Object Detection via Cooperative Foundational Models [68.9]
本稿では,既存のクローズドセット検出器をオープンセット検出器に変換する新しい手法を提案する。私たちは、新しいクラスに対して7.2$ textAP_50 のマージンで現在の最先端を越えています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:28:27 GMT)
The Devil is in Temporal Token: High Quality Video Reasoning Segmentation [68.3]
ビデオ推論の方法は、ビデオ内のオブジェクトを表現するために単一の特別なトークンに大きく依存する。エンドツーエンドの動画推論セグメンテーション手法であるVRS-HQを提案する。提案手法の強い時間的推論とセグメンテーション能力について検討した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:17:24 GMT)
OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3]
OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。 OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:30:29 GMT)
Cancer-Net PCa-Seg: Benchmarking Deep Learning Models for Prostate Cancer Segmentation Using Synthetic Correlated Diffusion Imaging [65.8]
前立腺癌(PCa)は米国で最も多いがんであり、約30,000人、全診断の29%、2024年に35,000人が死亡した。前立腺特異的抗原 (PSA) 検査やMRI (MRI) などの従来のスクリーニング法は診断において重要であるが、特異性や一般化性には限界がある。我々はU-Net、SegResNet、Swin UNETR、Attention U-Net、LightM-UNetといった最先端のディープラーニングモデルを用いて、200ドルのCDIからPCa病変を抽出する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:23:41 GMT)
CityLoc: 6 DoF Localization of Text Descriptions in Large-Scale Scenes with Gaussian Representation [65.8]
大規模3Dシーンにおけるテキスト記述のローカライズは曖昧な作業である。このような概念に基づく推論を容易にするためには、配布形態のテキストローカライゼーションが必要である。本研究では,ノイズの多い6DoFカメラの撮影位置を条件付きで拡散する拡散型アーキテクチャを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:59:32 GMT)
Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation [65.3]
そこで本研究では,潜在的な人的原因を考慮に入れた各種命令誤りを導入した新しいベンチマークデータセットを提案する。我々のベンチマークで最先端のVLN-CE法を評価する場合、成功率において顕著な性能低下(最大-25%)が観測される。また, エラー検出とローカライゼーションにおいて, 最適な性能を実現するための, クロスモーダルトランスフォーマーアーキテクチャに基づく効率的な手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:45:24 GMT)
MSA-ASR: Efficient Multilingual Speaker Attribution with frozen ASR Models [59.8]
話者分布自動音声認識(SA-ASR)は,対応する話者に文字を正確に割り当てながら音声を転写することを目的としている。本稿では,凍結した多言語ASRモデルを用いて話者属性を転写に組み込む新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:34:13 GMT)
Learning Optimal Tax Design in Nonatomic Congestion Games [56.9]
マルチプレイヤーゲームでは、プレイヤー間の利己的な行動が社会福祉を損なうことがある。我々は、渋滞ゲームにおいて、限られたフィードバックで社会福祉を誘導できる最適税を学習する最初のステップを採っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:02:51 GMT)
T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation [55.6]
コンポジションテキスト・ビデオ生成に関する最初の体系的研究を行う。合成テキスト・ビデオ生成に適した最初のベンチマークであるT2V-CompBenchを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:57:31 GMT)
SeQUeNCe GUI: An Extensible User Interface for Discrete Event Quantum Network Simulations [55.2]
SeQUeNCeは、量子ネットワーク通信のオープンソースシミュレータである。我々はSeQUeNCeの中核となる原則を維持できるグラフィカルユーザインタフェースを実装している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:36:09 GMT)
STORM: A Spatio-Temporal Factor Model Based on Dual Vector Quantized Variational Autoencoders for Financial Trading [55.0]
金融取引では、ファクターモデルが資産の価格設定や過大なリターンの獲得に広く利用されている。双対ベクトル量子化変分オートエンコーダを用いた時空間ファクトラーモデルSTORMを提案する。ストームは時間的および空間的な視点からストックの特徴を抽出し、これらの特徴を微細で意味的なレベルで融合し整列させ、その要素を多次元の埋め込みとして表現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:25:35 GMT)
Continual Diffuser (CoD): Mastering Continual Offline Reinforcement Learning with Experience Rehearsal [54.9]
強化学習のロボット制御のような現実世界の応用では、タスクが変化し、新しいタスクが順次発生する。この状況は、タスクの変更に適応し、獲得した知識を保持するエージェントを訓練する上で、可塑性-安定トレードオフという新たな課題を生じさせる。本研究では,連続拡散器(Continuous diffuser,CoD)と呼ばれるリハーサルに基づく連続拡散モデルを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:23:39 GMT)
The Conformer Encoder May Reverse the Time Dimension [53.9]
我々は,デコーダのクロスアテンション機構の初期動作を分析し,コンバータエンコーダの自己アテンションを促進する。本稿では,このフリップを回避する方法とアイデアを提案し,ラベル・フレーム配置アライメントを得るための新しい手法について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:18:25 GMT)
RepVideo: Rethinking Cross-Layer Representation for Video Generation [53.7]
テキスト・ビデオ拡散モデルのための拡張表現フレームワークであるRepVideoを提案する。近隣層からの機能を蓄積してリッチな表現を形成することで、このアプローチはより安定したセマンティック情報をキャプチャする。我々の実験は、RepVideoが正確な空間的外観を生成する能力を著しく向上するだけでなく、ビデオ生成における時間的一貫性も向上することを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:20:37 GMT)
Towards Understanding Extrapolation: a Causal Lens [53.2]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。この定式化の下では、外挿問題を潜在変数識別問題にキャストする。この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:29:29 GMT)
Noise-powered Multi-modal Knowledge Graph Representation Framework [53.0]
マルチモーダル・プレトレーニングの台頭は、統合されたマルチモーダル知識グラフ表現学習フレームワークの必要性を強調している。モードレベルのノイズマスキングを備えたトランスフォーマーアーキテクチャを用いた新しいSNAG手法を提案する。提案手法は10個のデータセットにまたがってSOTA性能を実現し,その汎用性を実証する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:30:19 GMT)
A Closer Look at Deep Learning Methods on Tabular Datasets [52.5]
タブラルデータは、機械学習のさまざまな領域で広く使われている。 Deep Neural Network(DNN)ベースの手法は最近、有望なパフォーマンスを実証した。我々は,32種類の最先端の深部・木質の手法を比較し,その平均性能を複数の基準で評価した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:19:30 GMT)
The Inherent Limits of Pretrained LLMs: The Unexpected Convergence of Instruction Tuning and In-Context Learning Capabilities [51.6]
本研究は,インコンテキストの例を用いて誘導されるベースモデルと,命令調整モデルが根本的に異なる機能を持つかどうかを考察する。命令調整モデルの性能は,基本モデルのコンテキスト内性能と大きく相関していることを示す。具体的には、この理解を命令付きモデルに拡張し、事前学習データも同様に、解決可能なタスクの制限境界を設定することを示唆する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:57:55 GMT)
SPEQ: Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning [51.1]
最近のオフポリシーアルゴリズムは、更新からデータへの比率を高め、環境相互作用ごとにより勾配の更新を行うことで、サンプル効率を向上させる。これにより、サンプル効率が向上するが、必要な勾配更新の数が増えるため、計算コストが大幅に向上する。本稿では,学習を異なる学習段階に分割することで,計算効率を向上させるためのサンプル効率向上手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:04:19 GMT)
A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding [51.0]
観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。大規模観測データと小型RTTデータの両方を用いた2段階事前学習ファインタニング(TSPF)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:58:16 GMT)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.1]
LlamaRestTestは、2つのカスタムLCMを使って現実的なテストインプットを生成する新しいアプローチである。 LlamaRestTestは、RESTGPTで強化された仕様でさえ、コードカバレッジとエラー検出において最先端のツールを上回っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:51:20 GMT)
Parallelizing Linear Transformers with the Delta Rule over Sequence Length [49.9]
この研究は、デルタ則で線形変圧器を訓練するためのハードウェア効率の良いアルゴリズムについて述べる。我々は100Bトークンに対して1.3Bモデルをトレーニングし、最近の線形時間ベースラインよりも優れていることを発見した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:41:40 GMT)
TextSleuth: Towards Explainable Tampered Text Detection [49.9]
本稿では,大規模なマルチモーダルモデルを用いて,自然言語による改ざんテキスト検出の基礎を説明する。このタスクのデータギャップを埋めるため,大規模な包括的データセットETTDを提案する。 GPT4oで高品質な異常記述を生成するために、共同クエリが導入された。低品質なアノテーションを自動的にフィルタリングするために、GPT4oに改ざんされたテキストを認識するよう促すことも提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:54:36 GMT)
Spatio-Temporal Foundation Models: Vision, Challenges, and Opportunities [48.5]
ファンデーションモデル(STFM)は、人工知能に革命をもたらし、パフォーマンスの新たなベンチマークを設定し、幅広いビジョンと言語タスクにわたる変換機能を実現する。本稿では,STFMの今後の展望を概説し,その本質的特徴と汎用性について概説する。我々は,STFMを効果的かつ広範に適用する目的で研究を進める可能性や方向性を探究する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:52:28 GMT)
SelectIT: Selective Instruction Tuning for LLMs via Uncertainty-Aware Self-Reflection [47.2]
インストラクションチューニング(IT)を用いた大規模言語モデル(LLM)の調整手法を提案する。 LLMに存在する本質的な不確実性を利用して、余分なリソースを必要とせずに、より効果的に高品質なITデータを選択する。以上の結果から,より長く,より計算集約的なITデータが,ITの優れた情報源となる可能性が示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:20:19 GMT)
Generative Visual Commonsense Answering and Explaining with Generative Scene Graph Constructing [46.7]
我々はtextittextbfG2 という新しいビジュアルコモンセンス推論手法を提案する。まず、画像パッチとLCMを使用して、位置のないシーングラフを構築し、シーングラフの情報に基づいて回答と説明を行う。また、トレーニング中に貴重なシーングラフ情報を吸収するためのシーングラフの自動フィルタリングと選択戦略を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:00:36 GMT)
AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL [46.7]
AutoRestTestは、REST APIをテストするための新しいツールだ。セマンティック操作依存グラフ(SODG)とマルチエージェント強化学習(MARL)と大規模言語モデル(LLM)を統合している。オペレーションカウントの成功、ユニークなサーバエラーの検出、時間経過に関する継続的なテレメトリを提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:54:33 GMT)
Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation [46.6]
金属腐食測定によるCT画像の再構成は, 難解な非線形逆問題となる。既存のSOTA(State-of-the-art)メタルアーティファクトリダクション(MAR)アルゴリズムは、多数のペアCTサンプルによる教師あり学習に依存している。本研究では,新しい教師なしMAR法である密度ニューラル表現(ダイナー)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:47:35 GMT)
SA-MLP: A Low-Power Multiplication-Free Deep Network for 3D Point Cloud Classification in Resource-Constrained Environments [46.3]
ポイントクラウド分類は、LiDARのような3Dセンサーからのデータの処理と分析において重要な役割を果たす。乗算演算に大きく依存する従来のニューラルネットワークは、高い計算コストとエネルギー消費の観点から、しばしば課題に直面している。本研究では,ポイントクラウド分類タスクの計算効率向上を目的とした,効率的な乗算型アーキテクチャのファミリーを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:07:13 GMT)
Counterfactual Debating with Preset Stances for Hallucination Elimination of LLMs [45.4]
大規模言語モデル(LLM)は様々な自然言語処理タスクに優れるが、幻覚に苦しむ。本稿では, LLM 固有のバイアスをオーバーライドして解答検査を行うために, CFMAD フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:20:24 GMT)
A General Framework for Inference-time Scaling and Steering of Diffusion Models [45.3]
Feynman Kac (FK) ステアリングは、報酬関数を持つ拡散モデルをステアリングするための推論時フレームワークである。 FKステアリングは、粒子と呼ばれる複数の相互作用する拡散過程の系をサンプリングし、中間ステップで粒子を再サンプリングすることで機能する。テキスト・ツー・イメージとテキスト拡散モデルを用いたFKステアリングの評価を行った。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:28:37 GMT)
Enhanced Large Language Models for Effective Screening of Depression and Anxiety [44.8]
本稿では,臨床面接を合成するためのパイプラインを導入し,対話型対話を1,157件紹介する(PsyInterview)。 EmoScanは、粗末(不安やうつ病など)と微妙な障害(うつ病など)を区別し、高品質な面接を行う。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:42:09 GMT)
Industrial Anomaly Detection and Localization Using Weakly-Supervised Residual Transformers [44.3]
Weakly-supervised RESidual Transformer (WeakREST) という新しいフレームワークを導入し,高い異常検出精度を実現する。画素単位の異常局所化タスクをブロック単位の分類問題に再構成する。弱いラベルと残差に基づく表現との相互作用を処理できるResMixMatchアルゴリズムを開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:26:03 GMT)
CityDreamer4D: Compositional Generative Model of Unbounded 4D Cities [44.2]
本研究では,4次元都市を創出するのに適した構成生成モデルを提案する。 CityDreamer4Dは、インスタンス編集、都市スタイル化、都市シミュレーションなど、さまざまなダウンストリームアプリケーションをサポートしている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:59:56 GMT)
Do Large Language Models Mirror Cognitive Language Processing? [43.7]
大規模言語モデル(LLM)は、テキスト理解と論理的推論において顕著な能力を示した。脳認知処理信号は、典型的には人間の言語処理を研究するために使用される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:47:36 GMT)
What Limits LLM-based Human Simulation: LLMs or Our Design? [43.5]
我々は, LLMに基づく人間シミュレーションの進展には, LLM固有の制約とシミュレーションフレームワークの設計課題の両方に対処する必要があると論じている。この分野でのさらなる研究を支援するため、我々はLLMに基づく人体シミュレーションリソースのキュレートされたコレクションを提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:59:49 GMT)
CookingDiffusion: Cooking Procedural Image Generation with Stable Diffusion [43.5]
textbfCookingDiffusionは,調理工程のリアルな画像を生成する新しい手法である。これらのプロンプトは、テキストプロンプト、画像プロンプト、マルチモーダルプロンプトを含み、一貫したプロシージャ画像の生成を保証する。実験結果から, 高品質な調理用プロシージャ画像の生成に優れたモデルが得られた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:58:53 GMT)
Embodied Scene Understanding for Vision Language Models via MetaVQA [42.7]
視覚言語モデル(VLM)は、様々なモビリティアプリケーションにAIエージェントを組み込む可能性を示している。本稿では,VLMの空間的関係とシーンダイナミクスに対する理解度を評価するための総合的なベンチマークであるMetaVQAを提案する。実験の結果,MetaVQAデータセットを用いた微調整VLMは,安全クリティカルシミュレーションにおける空間的推論と環境理解を著しく改善することがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:36:19 GMT)
Taint Analysis for Graph APIs Focusing on Broken Access Control [42.3]
本稿では,アクセス制御の故障に着目したグラフAPIに対して,静的および動的テナント解析のための第1の体系的アプローチを提案する。 Graph APIのノードは、検索や操作のために特定の特権を必要とするデータを表現している場合のものだ。次に、APIソースとシンクコール間の汚染された情報フローが発生するかどうかを分析する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:49:32 GMT)
Prethermal Floquet time crystals in chiral multiferroic chains and applications as quantum sensors of AC fields [41.9]
乱れた多鉄鎖鎖における予熱フロケット時間結晶(pFTC)の出現について検討した。我々はモデルの位相図を導出し、系の磁化、絡み合い、コヒーレンスダイナミクスを特徴づける。また、交流場の量子センサとしてのpFTCの適用についても検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:27:22 GMT)
Deep Self-Supervised Disturbance Mapping with the OPERA Sentinel-1 Radiometric Terrain Corrected SAR Backscatter Product [41.9]
地表面の乱れのマッピングは、災害対応、資源と生態系の管理、気候適応の取り組みを支援する。合成開口レーダ(SAR)は、気象や照明条件に関わらず、地上の連続した時系列画像を提供する、外乱マッピングのための貴重なツールである。 NASAのRemote Sensing Analysis (OPERA)プロジェクトは2023年10月にSentinel-1 (RTC-S1)データセットからほぼグローバルな測地線補正SAR後方散乱器をリリースした。本研究では,地表面の乱れを体系的に解析するために,この新たなデータセットを利用する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:24:18 GMT)
Balanced cross-Kerr coupling for superconducting qubit readout [41.9]
超伝導量子ビットの標準的な測定方法である分散可読化は、多光子量子ビット共振器プロセスによって制限される。本研究では「ジャンクション・リードアウト」と呼ばれる新しい読み出し手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:52:08 GMT)
Enhancing Skin Disease Diagnosis: Interpretable Visual Concept Discovery with SAM [41.4]
現在のAIによる皮膚画像診断は、皮膚がんの分類において皮膚科レベルのパフォーマンスを達成している。皮膚病変診断のための新しいクロス・アテテーティブ・フュージョン・フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:21:06 GMT)
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling [40.8]
ACE++は、様々な画像生成と編集タスクに取り組む命令ベースの拡散フレームワークである。我々は、強力なテキスト・画像拡散モデルを微調整する作業を最小化するために、2段階のトレーニングスキームを開発する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:07:56 GMT)
3VL: Using Trees to Improve Vision-Language Models' Interpretability [40.7]
VLM(Vision-Language Model)は、画像とテキストの表現の整列に有効であることが証明されており、多くの下流タスクに転送すると、より優れたゼロショット結果が得られる。これらの表現は、オブジェクトの属性、状態、異なるオブジェクト間の関係を認識するなど、構成言語概念(CLC)を理解する際のいくつかの重要な欠点に悩まされる。本稿では,木拡張ビジョンランゲージ(3VL)モデルのアーキテクチャとトレーニング手法を紹介する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:46:07 GMT)
Integrated Push-and-Pull Update Model for Goal-Oriented Effective Communication [40.6]
センサエージェントがソースを観測し、アクティベーションエージェントに更新を生成し、送信するエンドツーエンドのステータス更新システムについて検討する。我々はプッシュ・アンド・プル・モデルを得るためにプッシュ・アンド・プル・アップデート・コミュニケーション・モデルを統合する。提案したプッシュ・アンド・プルモデルでは,プッシュ・アンド・プル・モデルはプッシュ・アンド・プル・ベースの更新のみに基づくモデルよりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:44:02 GMT)
Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity Recognition [40.2]
本稿では, Open NER における LLM の一般化を導くためのコンパクトデータセット B2NERD を提案する。 B2NERDは、既存の54の英語と中国語のデータセットから2段階のプロセスで洗練されている。総合評価では、B2NERDはLLMのオープンNER能力を著しく向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:38:01 GMT)
Debiasing Synthetic Data Generated by Deep Generative Models [40.2]
合成データ生成のための深部生成モデル(DGM)は、合成データ解析においてバイアスと不正確性を誘導する。本稿では,DGMが生成する合成データを,特定のデータ解析のためにターゲットとする新たな戦略を提案する。提案手法は, 偏差を考慮し, 収束率を向上し, 容易に近似された大きなサンプル分散を持つ推定器の計算を容易にする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:47:22 GMT)
RoME: A Robust Mixed-Effects Bandit Algorithm for Optimizing Mobile Health Interventions [39.8]
本稿では,環境に合ったモバイルヘルス介入のためのコンテキスト的帯域幅アルゴリズムであるRoMEを提案する。シミュレーションと2つのオフ政治評価研究において,RoMEアルゴリズムの優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:21:46 GMT)
Multi-modal and Multi-scale Spatial Environment Understanding for Immersive Visual Text-to-Speech [39.7]
M2SE-VTTSは、環境イメージを音声コンテンツに対する残響音声の合成のプロンプトとすることを目的としている。没入型VTTSを実現するためのマルチモーダル・マルチスケール空間環境理解手法を提案する。本モデルは,環境音声生成における先進的ベースラインよりも優れる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:59:02 GMT)
Boosting Tool Use of Large Language Models via Iterative Reinforced Fine-Tuning [39.7]
大規模な言語モデルを外部ツールで拡張することは、その機能を強化するための有望なアプローチである。本稿では,モデルを継続的にガイドして緩和するための反復強化微調整戦略を提案する。当社のモデルは、同じパラメトリックモデルを超えて、多くの大規模なオープンソースモデルとクローズドソースモデルより優れています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:52:34 GMT)
MAGNET: Augmenting Generative Decoders with Representation Learning and Infilling Capabilities [38.8]
デコーダのみの大規模言語モデル(LLM)は、双方向モデリングに適応しつつある。 MozartはデコーダのみのLLMの適応で、ロバストな表現を生成し、行方不明のテキストスパンを埋め込む能力を高める。モーツァルトは3つの自己指導的な訓練目標を採用し、双方向と因果的注意を組み合わせた注意機構を導入している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:24:03 GMT)
Scopes of Alignment [38.7]
AIアライメントに焦点をあてた研究の多くは、大きな言語モデルを、有用性、無害性、誠実性の一般的な価値に合わせることを目指している。本稿では,このような限られた概念を超えて進む必要がある理由を動機付け,それを行うための3つの次元を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:06:59 GMT)
LeMo: Enabling LEss Token Involvement for MOre Context Fine-tuning [38.4]
LeMoはLLMファインチューニングシステムで、長いコンテキストシナリオに固有の新しいトークンレベルのスペーサ性メカニズムを利用する。 LeMoは最大1.93倍のメモリ消費を削減し、最大1.36倍のスピードアップを実現し、最先端の微調整システムより優れている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:17:12 GMT)
Time-bin encoding quantum key distribution in free-space horizontal links during nighttime and daytime [36.1]
水平乱流自由空間チャネルを介してCバンドで動作する時間ビン符号化QKDプロトコルの実現可能性を示す。その結果、自由空間とファイバベースインフラストラクチャ間の相互運用性のさらなる探求が促進された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:01:58 GMT)
Efficient Traffic Prediction Through Spatio-Temporal Distillation [36.1]
グラフベースのネットワーク(GNN)は、グラフベースのメッセージパッシングフレームワークを通じてパターンパターンを学習することができる。 GNNはトラフィックフロー予測の処理において大きな可能性を秘めているが、実際のアプリケーションへの展開はスケーラビリティの制約によって妨げられている。本研究では,高能力教師から軽量学生への時間的知識提供を支援する新しい知識蒸留パラダイムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:23:10 GMT)
A Non-autoregressive Model for Joint STT and TTS [36.0]
音声とテキストのモダリティを個別に、あるいは一緒に入力できる新しいフレームワークを開発する。 STT と TTS の両方のタスクを効果的に実行し、全てのタスクにおいて STT 固有のベースラインを上回り、幅広い評価指標で TTS 固有のベースラインと競合的に実行可能であることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:42:41 GMT)
PACE: Marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization [35.9]
PACE は PArameter- efficient fine-tuning with Consistency rEgularization の一般化である。拡張一般化のための勾配を暗黙的に正規化するが、知識を保持するために微調整されたモデルや事前訓練されたモデルも暗黙的に整列する。また、テキスト分類(GLUE)や数学的推論においてLoRAを改善している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:56:26 GMT)
A Unified Confidence Sequence for Generalized Linear Models, with Applications to Bandits [35.7]
我々は,任意の(自己調和型)一般化線形モデル(GLM)に対して,統一度比に基づく信頼シーケンス(CS)を提案する。ガウシアン,ベルヌーイ,ポアソンなど,様々な GLM の既知の CS と同等あるいは同等であることを示す。分析の結果,有意な楽観的アプローチは,さまざまな自己協和性(必ずしも有界ではない)GLBに対して,同時に最先端の後悔を達成できることが示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:25:02 GMT)
Natural Language Outlines for Code: Literate Programming in the LLM Era [35.5]
我々は、開発者がAI支援を提供するための新しいモダリティとインタラクションサーフェスとして、自然言語のアウトラインを使うことを提案する。コード関数のNLアウトラインは、簡潔な散文で書かれた複数のステートメントを含み、コードを分割し、その主要なアイデアをリテラトプログラミングのスタイルで要約する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:43:22 GMT)
OpenMLDB: A Real-Time Relational Data Feature Computation System for Online ML [35.2]
本稿では,4ParadigmのSageOneプラットフォームにデプロイされた機能計算システムであるOpenMLDBを提案する。技術的には、OpenMLDBは最初、オフラインおよびオンラインステージにわたる一貫した計算結果に統一的なクエリプランジェネレータを使用する。 OpenMLDBは、長いウィンドウ計算によるパフォーマンスボトルネックを解決するオンライン実行エンジンを提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:20:01 GMT)
PACF: Prototype Augmented Compact Features for Improving Domain Adaptive Object Detection [35.0]
クラス内特徴の分布を正規化するためのプロトタイプ拡張コンパクト特徴量フレームワークを提案する。相互正則化戦略は、線形およびプロトタイプベースの分類器が互いに学習できるように設計されている。各種適応設定の結果は最先端であり,提案手法のボード適用性と有効性を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:05:57 GMT)
Deep learning for temporal super-resolution 4D Flow MRI [34.9]
本研究の目的は,時間的超解像4D Flow MRIのための残像ネットワークの実装と評価である。患者固有のシリコモデル由来の合成4次元フローMRIデータと、in-vivoデータセットを用いてトレーニングおよび試験を行った。以上の結果から, 時空間超解像4次元フローMRIにおけるデータ駆動型ニューラルネットワークの有用性が示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:01:47 GMT)
Scalable and High-Quality Neural Implicit Representation for 3D Reconstruction [34.3]
これらの問題に対処するために,汎用的でスケーラブルで高品質なニューラル暗黙表現を提案する。オブジェクトやシーンを複数の独立した局所神経SDFと重なり合う領域の融合としてモデル化する。地域ごとの独立表現により,我々は高忠実度表面再構成を達成できるだけでなく,スケーラブルなシーン再構築を実現することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:56:26 GMT)
Securities Transaction Settlement Optimization on superconducting quantum devices [34.0]
提案アルゴリズムは、IBMの超伝導量子ビットマシンをターゲットとした、雑音中間スケール量子デバイス向けに設計されている。我々は、量子ハードウェア上のアルゴリズムを古典的および量子に着想を得た解法に対してベンチマークするために、実際のトランザクションデータから得られる最大40の取引のバッチを検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:37:41 GMT)
Monte Carlo Tree Search for Comprehensive Exploration in LLM-Based Automatic Heuristic Design [33.6]
大規模言語モデル(LLM)に基づく自動設計(AHD)手法は,手作業による介入なしに高品質な言語を生成することを約束している。木構造中のLLM生成物を保存しながら, LLMに基づく進化にMCTS(Monte Carlo Tree Search)を適用することを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:00:50 GMT)
The Artificial Scientist -- in-transit Machine Learning of Plasma Simulations [33.0]
シミュレーションデータを機械学習(ML)フレームワークに直接ストリーミングするストリーミングワークフローを実演する。提示されたワークフローでは、データ操作は共通で使いやすいプログラミング言語で実行できる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:16:18 GMT)
Understanding Emergent Abilities of Language Models from the Loss Perspective [32.8]
モデルサイズやトレーニング計算の代わりに,事前学習損失のレンズの創発能力について検討した。モデルが,メトリクスの連続性に関係なく,特定のタスクに創発的能力を示すことがわかった。これにより、事前学習の損失が低いモデルで現れるような、創発的能力を再定義するインスピレーションがもたらされる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:48:59 GMT)
VECT-GAN: A variationally encoded generative model for overcoming data scarcity in pharmaceutical science [32.7]
既存のデータセットは小さく、ノイズが多いため、有効性は制限されることが多い。我々は、小型でノイズの多いデータセットを増強するために特別に設計された生成モデルを開発する。我々は,PipパッケージとしてChEMBLで事前訓練したVECT GANを含む手法を開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:23:33 GMT)
Transformed Low-rank Adaptation via Tensor Decomposition and Its Applications to Text-to-image Models [32.7]
Low-Rank Adaptation (LoRA)とその変種は、その有効性から大きな注目を集めている。本稿では,2種類の適応,すなわち変換と残留適応を組み合わせた新しいPEFT法を提案する。主観駆動・制御可能ジェネレーションにおける微調整安定拡散モデルの実験を行った。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:10:37 GMT)
A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following [32.7]
大きな言語モデルは複雑な自然言語命令の解釈に優れており、幅広いタスクを実行できる。 InstructCellは、自然言語を媒体として活用し、より直接的で柔軟な単細胞分析を行うマルチモーダルAIコラボロである。 InstructCellは、細胞型アノテーション、条件付き擬似細胞生成、薬物感受性予測を用いた単純な自然言語コマンドなどの重要なタスクを研究者に実行させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:59:32 GMT)
Making AI Less "Thirsty": Uncovering and Addressing the Secret Water Footprint of AI Models [32.0]
世界のAI需要は2027年に4.2-6.6億立方メートルの水が流出すると予想されている。これはデンマークの年間降水量4-6以上、イギリスの半分以上である。グローバルな水の課題に対処するためには、AIは社会的責任を負い、例によってリードする必要がある。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:07:44 GMT)
Multiple Information Prompt Learning for Cloth-Changing Person Re-Identification [31.2]
布を交換するReIDのためのMIPL(Multiple Information prompt Learning)方式を提案する。 CISモジュールは、衣料品情報を元のRGBイメージ機能から切り離すように設計されている。 The Bio-guided attention (BGA) module is proposed to increase the learning intensity of the model for key information。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:57:25 GMT)
Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation [30.9]
DETRISは、低ランクな視覚的特徴伝達を強化するために設計されたパラメータ効率のチューニングフレームワークである。我々の単純で効率的なアプローチは、最先端のメソッドを大きく上回り、0.9%から1.8%のバックボーンパラメーターが更新される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:00:03 GMT)
Trusted Machine Learning Models Unlock Private Inference for Problems Currently Infeasible with Cryptography [30.6]
有能な機械学習モデルは信頼できるサードパーティの役割を果たすことができると我々は主張する。このアプローチは、プライバシと計算効率のバランスを達成することを目的としている。単純な古典的暗号問題でさえ、すでにTCMEで解決できることが示されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:28:53 GMT)
Continual Test-Time Adaptation for Single Image Defocus Deblurring via Causal Siamese Networks [29.7]
SIDD (Single Image Defocus Deblurring) は、フォーカス内イメージを非焦点画像から復元することを目的としている。非焦点画像における分布シフトは、一般に既存の手法の性能低下につながる。本稿では,新しいシームズネットワークを用いた連続テスト時間適応フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:42:39 GMT)
Enhancing Graph Representation Learning with Localized Topological Features [29.6]
永続ホモロジー理論に基づいてグラフのリッチ接続情報を抽出する原理的手法を提案する。本手法は,グラフニューラルネットワークの表現学習を強化するためにトポロジ的特徴を利用する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:12:27 GMT)
Feature-based One-For-All: A Universal Framework for Heterogeneous Knowledge Distillation [28.7]
知識蒸留(KD)は、事前訓練された重教師モデルからより軽い学生モデルに知識を移す。多様なアーキテクチャにまたがる機能蒸留を可能にする機能ベースの1-for-all(FOFA)KDフレームワークを提案する。まず、学生のフィードバックを取り入れたプロンプトチューニングブロックを設計し、教師が生徒モデルの学習プロセスに適応できるようにする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:56:06 GMT)
Mitigating Domain Shift in Federated Learning via Intra- and Inter-Domain Prototypes [28.5]
本稿では,$textbfI$ntraドメインと$textbfI$nterドメインを組み込んだ新しいプロトタイプ学習手法を提案する。局所領域の多様性を捉え,局所特徴の一般化を促進するために,MixUpベースの拡張プロトタイプの機能アライメントを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:17:38 GMT)
Compression with Global Guidance: Towards Training-free High-Resolution MLLMs Acceleration [28.3]
マルチモーダルな大言語モデル(MLLM)は、視覚的コンテンツ理解と推論における例外的な性能から注目されている。視覚トークンの数を減らしたトークン圧縮技術は,計算コストの削減に有効であることを示した。本稿では,高分解能MLLMに適した新しいトークン圧縮手法,GlobalCom$2$を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:34:26 GMT)
CSL-L2M: Controllable Song-Level Lyric-to-Melody Generation Based on Conditional Transformer with Fine-Grained Lyric and Musical Controls [28.1]
CSL-L2Mは、インアテンショントランスフォーマーデコーダに基づく、制御可能な歌声レベル・歌詞・メロディ生成法である。 REMI-Alignedは、歌詞と旋律の間の厳格な音節と文レベルのアライメントを含む新しい音楽表現である。事前学習したVQ-VAEから抽出した人間のラベル付き音楽タグ、文レベルの統計的音楽属性、学習された音楽特徴について紹介する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:46:18 GMT)
Make-A-Character 2: Animatable 3D Character Generation From a Single Image [27.3]
Make-A-Character 2は、1枚の肖像画から高品質な3D文字を生成する高度なシステムである。画像から3D文字を生成するのに2分もかからない。これらの技術は、私たちの会話型AIアバター製品に統合されました。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:23:10 GMT)
Continuous Concepts Removal in Text-to-image Diffusion Models [27.3]
著作権を侵害したり、乱暴な主題を描写するコンテンツを作成するためのテキスト・ツー・イメージモデルの可能性について懸念が高まっている。本稿では,知識蒸留パラダイムを設計したCCRTという新しい手法を提案する。一連のテキストプロンプトを使用することで、連続的な概念削除プロセス中のテキストイメージのアライメント動作を制限します。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:30:24 GMT)
KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model [27.3]
KaLM-Embeddingは、よりクリーンで、より多様な、ドメイン固有のトレーニングデータを活用する一般的な多言語埋め込みモデルである。我々のモデルは、性能を向上させることが証明された重要な技術で訓練されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:02:22 GMT)
Diffusion-based Unsupervised Audio-visual Speech Enhancement [26.9]
本稿では,新しい教師なし音声-視覚音声強調(AVSE)手法を提案する。拡散に基づく音声視覚音声生成モデルと非負行列分解(NMF)ノイズモデルを組み合わせる。実験結果から,提案手法は音声のみのアプローチより優れているだけでなく,近年の教師付き生成型AVSE法よりも優れていたことが確認された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:42:42 GMT)
Resource-Constrained Federated Continual Learning: What Does Matter? [26.8]
Federated Continual Learning (FCL)は、エッジデバイスで異なる入ってくるデータのストリーム上で、シーケンシャルにプライバシ保護モデルトレーニングを可能にすることを目的としている。現在のFCLの文献は、トレーニングのオーバーヘッドに制約を課すことなく、データプライバシの制限と、以前見たデータへのアクセスに重点を置いている。本稿では,この問題を大規模ベンチマークで再検討し,資源制約の異なる条件下での最先端FCL手法の性能解析を行う。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:33:52 GMT)
Machine unlearning through fine-grained model parameters perturbation [26.7]
そこで本研究では,不エクササイズマシンの非学習戦略であるTop-KパラメータとRandom-kパラメータの微粒化を提案する。また,機械学習の有効性を評価する上での課題にも取り組む。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:00:17 GMT)
Multi-Context Temporal Consistent Modeling for Referring Video Object Segmentation [26.6]
ビデオオブジェクトのセグメンテーションの参照は、所定のテキスト記述に対応するビデオ内のオブジェクトをセグメンテーションすることを目的としている。既存の変換器に基づく時間的モデリング手法は、クエリの不整合とコンテキストの限定的考慮に関連する課題に直面している。本稿では, Aligner と Multi-Context Enhancer で構成される Multi-context Temporal Consistency Module (MTCM) を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:12:29 GMT)
RealVVT: Towards Photorealistic Video Virtual Try-on via Spatio-Temporal Consistency [26.4]
RealVVTは、動的ビデオコンテキスト内の安定性とリアリズムを高めるために設計されたフォトリアリスティックビデオ仮想トライオンフレームワークである。我々のアプローチは、シングルイメージとビデオVTOの両方のタスクにおいて、既存の最先端モデルよりも優れています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:22:38 GMT)
MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents [26.4]
この研究はMMDocIRと呼ばれる新しいベンチマークを導入し、ページレベルとレイアウトレベルの検索という2つの異なるタスクを含んでいる。 MMDocIRベンチマークは,1,685問の注釈付きラベルと173,843問の自己ストラップ付きラベルを備えた,豊富なデータセットで構成されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:30:13 GMT)
Self-supervised Transformation Learning for Equivariant Representations [26.2]
教師なし表現学習は、様々な機械学習タスクを大幅に進歩させた。本稿では,変換ラベルを画像ペアから派生した変換表現に置き換える自己教師あり変換学習(STL)を提案する。さまざまな分類タスクと検出タスクにまたがって、アプローチの有効性を実証し、11のベンチマークのうち7つで既存の手法より優れています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:54:21 GMT)
A Closer Look at the Learnability of Out-of-Distribution (OOD) Detection [25.8]
我々は,OOD検出が一様で,一様ではない条件下で特徴付ける。いくつかのケースでは、非一様学習性は、多くの負の結果を肯定的なものにしている。 OOD検出が学習可能なすべての場合において、具体的な学習アルゴリズムとサンプル・複雑度解析を提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:19:03 GMT)
Molecular Graph Contrastive Learning with Line Graph [25.7]
グラフコントラスト学習(GCL)は、分子特性予測や薬物設計に利用できる。分子意味論を省略せずに符号化するための新しい手法である textitLEMON を提案する。ビュー生成のための最新技術(SOTA)手法と比較して,分子特性予測における優れた性能は,提案手法の有効性を示唆している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:17:38 GMT)
ToMATO: Verbalizing the Mental States of Role-Playing LLMs for Benchmarking Theory of Mind [25.5]
ToMATOは、会話よりもマルチチョイスQAとして定式化された新しいToMベンチマークである。私たちは、信念、意図、欲望、感情、知識の5つのカテゴリにまたがって、一階と二階の精神状態を取ります。 ToMATOは5.4kの質問、753の会話、15の性格特性パターンで構成されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:47:02 GMT)
ARMOR: Shielding Unlearnable Examples against Data Augmentation [25.3]
我々は、データ拡張の潜在的な侵害からデータプライバシを保護するためのフレームワークARMORを提案する。 ARMORは、強化された保護されたサンプルでトレーニングされたモデルのテスト精度を、ベースラインよりも60%以上削減する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:22:57 GMT)
DynamicFace: High-Quality and Consistent Video Face Swapping using Composable 3D Facial Priors [24.7]
顔交換は、ターゲット顔の表情、ポーズ、髪、背景などの属性を保持しながら、ソース顔のアイデンティティをターゲット顔に転送する。本稿では,拡散モデルとプラグイン・アンド・プレイ時層を利用した映像面スワップを実現するDynamicFaceを提案する。本手法は,顔のスワップ,画像の画質,アイデンティティの保存,表情の正確性を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:28:14 GMT)
Improved Algorithms for Contextual Dynamic Pricing [24.5]
コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:07:59 GMT)
Predicting Long-Term Student Outcomes from Short-Term EdTech Log Data [24.2]
初回使用時間における学生のログを用いた機械学習予測器について検討した。以上の結果から,2～5時間以内の短期ログ利用データを用いて,学生の長期外部パフォーマンスに関する貴重な情報を提供することが可能であることが示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:11:07 GMT)
MEMO: Fine-grained Tensor Management For Ultra-long Context LLM Training [24.1]
大規模言語モデル(LLM)は、よりクリエイティブなアプリケーションを促進するために、拡張コンテキスト長を使用して訓練されている。本稿では,メモリ管理を微粒化するための新しいフレームワークであるMEMOを提案する。 MeMOはMegatron-LMやDeepSpeedと比べて平均1.97倍と1.80倍のMFUを達成している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:03:55 GMT)
Computerized Assessment of Motor Imitation for Distinguishing Autism in Video (CAMI-2DNet) [23.9]
運動模倣障害は自閉症スペクトラム(ASC)の患者で一般的に報告される伝統的な運動模倣の評価方法は主観的で労働集約的であり、人間の訓練を必要とする。 CAMI-2DNetは、ビデオデータにおけるモータ模倣評価のための、スケーラブルで解釈可能なディープラーニングベースのアプローチである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:15:15 GMT)
Nonsmooth Nonconvex-Nonconcave Minimax Optimization: Primal-Dual Balancing and Iteration Complexity Analysis [23.8]
PLDAの新たな解析手法を導入し,その鍵となるのは,新たに開発された非滑らかかつ二重なエラー反復である。 PLDA が $thetain [0,12]$ のとき、緩やかな仮定の下で最適な $mathcalO()$ を達成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:43:18 GMT)
Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution [23.8]
拡散誘導フレームワークに統合可能な劣化認識モデルを導入する。提案手法は,ブラインドSRベンチマークにおける最先端手法よりも優れた性能を有する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:17:13 GMT)
IDEA: Image Description Enhanced CLIP-Adapter [23.4]
画像分類タスクにCLIPを適用するための画像記述強化CLIP-Adapter (IDEA) 手法を提案する。 IDEAは、画像の視覚的特徴とテキスト記述の両方を活用することで、きめ細かい機能をキャプチャする。重要な貢献の一つとして、Llamaモデルを採用し、11データセットの画像のテキスト記述を生成する包括的なパイプラインを設計する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:12:59 GMT)
Homophily-aware Heterogeneous Graph Contrastive Learning [23.4]
我々は,同種ノード表現を学習するために,HGMSと呼ばれる新しい異種グラフコントラスト学習フレームワークを提案する。具体的には、拡張ビューのホモフィリティーを高めるヘテロジニアスエッジドロップ増強戦略を設計する。実際に,自己表現行列を解くための2つの手法を開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:56:50 GMT)
The Mathematics of Artificial Intelligence [23.0]
本稿では,人工知能(AI)における数学の役割について概説する。数学はAIシステムをよりよく理解し、拡張するためのツールを提供する、と強調する。逆に、AIは新しい問題を提起し、様々な分野の交差点で新しい数学の開発を進める。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:00:23 GMT)
Towards A Hybrid Quantum Differential Privacy [22.6]
量子微分プライバシー(QDP)は、固有の量子ノイズを利用してプライバシーを保護する。本稿では,QDPに有用なノイズタイプを特定し,理論的モデルを超えた実用的な実装の必要性を強調した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:10:13 GMT)
SHYI: Action Support for Contrastive Learning in High-Fidelity Text-to-Image Generation [22.6]
コントラスト学習(Contrastive Learning)を用いて,複数のオブジェクトに対して生成した画像の精度を向上するConformフレームワークを構築した。そこで我々は,意味的ハイパーグラフィック・コントラスト・アジャシエンス・ラーニング,強化されたコントラスト構造と"コントラスト・バイン・リンク(contrast but link)"技術を用いた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:39:03 GMT)
GS-LIVO: Real-Time LiDAR, Inertial, and Visual Multi-sensor Fused Odometry with Gaussian Mapping [22.4]
LiDAR-Inertial-Visual (LIV) センサの構成は、ローカライゼーションと高密度マッピングにおいて優れた性能を示している。本稿では,新しいリアルタイムガウス型同時ローカライズ・マッピングシステムを提案する。このフレームワークは、堅牢なマルチセンサー融合機能を維持しながら、リアルタイムのパフォーマンスを実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:04:56 GMT)
A Survey on Facial Image Privacy Preservation in Cloud-Based Services [22.4]
顔認識モデルは、アイデンティティ認証、消費者サービス、監視のために、商業企業、政府機関、クラウドサービスプロバイダーによってますます採用されている。ユーザーの顔画像は同意なしに悪用され、潜在的なデータ漏洩や誤用につながる可能性がある。本調査では,クラウドベースのサービスにおける顔画像のプライバシ保護を目的とした現在の手法を概観する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:00:32 GMT)
Rethinking Post-Training Quantization: Introducing a Statistical Pre-Calibration Approach [22.3]
ポストトレーニング量子化(PTQ)技術は、精度を維持するためにキャリブレーションプロセスに依存する。本稿では,キャリブレーションに基づくPTQ手法の先駆者と見なせる重み適応型PTQ法を提案する。提案手法は,最も一般的なキャリブレーションに基づくPTQ法と同等に動作可能であることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:44:15 GMT)
LoRS: Efficient Low-Rank Adaptation for Sparse Large Language Model [22.0]
既存のローランク適応法 (LoRA) は、スパース大言語モデル (LLM) においてスパーシティを維持できないため、課題に直面している。近年の研究では、LoRAテクニックをマスク機構を追加して拡張することで、空間性を維持する手法が導入されている。 LLMを微調整する際のメモリ効率と計算効率を両立させる革新的な手法であるLoRSを導入する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:07:06 GMT)
Human Pose-Constrained UV Map Estimation [21.9]
UVマップ推定は、人間の姿勢や活動の詳細な分析にコンピュータビジョンで用いられる。本稿では,2次元人物のポーズを画素間割り当てプロセスに統合したPC-CSE(Pose-Constrained Continuous Surface Embeddings)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:12:55 GMT)
Augmenting Smart Contract Decompiler Output through Fine-grained Dependency Analysis and LLM-facilitated Semantic Recovery [21.2]
SmartHaloは、静的解析(SA)と大規模言語モデル(LLM)を組み合わせることで、デコンパイラ出力を強化する新しいフレームワークである。 SmartHaloは、SOTAデコンパイラ(例えばGigahorse)と比較して、デコンパイルされたコードの品質を大幅に改善する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:04:30 GMT)
Joint Learning of Depth and Appearance for Portrait Image Animation [20.8]
拡散型ポートレート画像生成装置において,視覚的外観と深度を同時に学習することを提案する。我々のフレームワークは、顔深度画像生成や画像深度生成など、様々な下流アプリケーションに効率的に適応することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:24:35 GMT)
Salmon: A Suite for Acoustic Language Model Evaluation [20.8]
SALMonは、背景雑音、感情、話者識別、室内インパルス応答を含む新しい評価スイートである。 SALMon 上で複数の言語モデルを評価し,評価手法の長所と短所を強調した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:39:57 GMT)
Exploring Task-Level Optimal Prompts for Visual In-Context Learning [20.3]
本稿では,推論段階におけるプロンプトの探索コストを削減するためのタスクレベルプロンプトを提案する。提案手法は最適に近いプロンプトを同定し,最小限のコストで最高のVICL性能が得られることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:52:20 GMT)
Generative Planning with 3D-vision Language Pre-training for End-to-End Autonomous Driving [20.3]
GPVLという名前の3次元言語事前学習モデルによる生成計画がエンドツーエンドの自動運転のために提案されている。クロスモーダル言語モデルを導入し、総合的な駆動決定と微粒な軌跡を生成する。 GPVLの効果的で堅牢で効率的な性能は、将来の自動運転システムの実用化に不可欠であると考えられている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:20:46 GMT)
Testing Noise Assumptions of Learning Algorithms [20.3]
我々は計算学習理論に根本的な疑問を呈する。トレーニングセットが与えられたノイズモデルの仮定を満たすかどうかを効率的にテストできるだろうか? トレーニングデータ上で様々なノイズ仮定をテストするための,最初の効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:33:55 GMT)
CGCOD: Class-Guided Camouflaged Object Detection [20.0]
我々は,従来のCODタスクを拡張したCGCOD(Class-Guided Camouflaged Object Detection)を導入する。本稿では,プラグイン・アンド・プレイのクラス・プロンプト・ジェネレータと,シンプルで効果的なクラス・ガイダンス・ディテクターを組み込んだマルチステージ・フレームワークCGNetを提案する。これはCODの新しいパラダイムを確立し、コンテキスト理解とクラス誘導検出のギャップを埋める。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:22:45 GMT)
Towards Aligned Data Forgetting via Twin Machine Unlearning [19.8]
「データの忘れ」はしばしば、そのようなデータに対する分類精度をゼロにするものとして解釈される。本稿では,2つの未学習問題を元の未学習問題に対応付けて定義する,TMU(Twin Machine Unlearning)アプローチを提案する。提案手法は未学習モデルと金モデルとのアライメントを著しく向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:30:26 GMT)
The Silent Majority: Demystifying Memorization Effect in the Presence of Spurious Correlations [19.8]
本稿では,ネットワーク内の小さなニューロンの集合において,突発的特徴のユビキタスな存在を体系的に示す。少数集団情報を記憶するニューロンやチャネルの小さなサブセットの性質を見いだす。この仮説を裏付けるために,これらの不要な急激な記憶パターンをトレーニング中に新たな枠組みによって排除することは,マイノリティグループにおけるモデル性能に顕著に影響を及ぼすことを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:46:51 GMT)
Learning Joint Denoising, Demosaicing, and Compression from the Raw Natural Image Noise Dataset [19.8]
本稿ではRawNIND(Raw Natural Image Noise dataset)を紹介する。 RawNINDは、センサー、画像開発ペア、スタイルにまたがる一般化モデルの開発を支援するために設計された、多様な生画像のコレクションである。 2つのデノナイズ法が提案され、一方は生のベイアデータを直接操作し、他方は計算効率を活用し、もう一方は異なるセンサに改良された線形RGB画像を処理する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:30:05 GMT)
SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis [19.8]
一般的なリズム運動と稀だが本質的なセマンティックモーションを慎重に統合しなければ、良好な音声合成が達成できない。本稿では,フレームレベルのセマンティクスを重視した音声合成のためのSemTalkを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:34:12 GMT)
Multilingual LLMs Struggle to Link Orthography and Semantics in Bilingual Word Processing [19.6]
本研究は、英語・スペイン語・英語・フランス語・英語・ドイツ語のコニャート、非コニャート、および言語間ホモグラフに焦点を当てる。我々は,多言語大言語モデル (LLM) がこのような現象にどう対処するかを,英語・スペイン語・英語・フランス語・英語・ドイツ語のコニャート,非コニャート,言語間ホモグラフに焦点をあてて評価する。我々は、英語と非英語のホモグラフを理解するための異なる戦略を選択するモデルを見つけ、言語間のあいまいさを扱う統一的なアプローチが欠如していることを強調した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:22:35 GMT)
Multimodal LLMs Can Reason about Aesthetics in Zero-Shot [19.6]
美術品の審美性を評価するために,マルチモーダルLLM(MLLMs)推論能力の付与について検討する。本研究では、人間の嗜好モデリングの原理的手法を開発し、MLLMの反応と人間の嗜好の体系的相関分析を行う。実験の結果, MLLMは, 応答主観性に関連し, 美術評価において固有の幻覚的問題であることが明らかとなった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:56:22 GMT)
Human Activity Recognition in an Open World [19.5]
認識に基づく人間行動認識(HAR)における新規性の管理は、現実的な環境において重要である。 HARを最適に実行するには、アルゴリズム的な解はニュアンス・ノベルティに寛容でなければならない。本稿では,HARにおける新規性の定義を,分類タスクにおける新規性の定義に基づいて定式化する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:44:23 GMT)
Maximizing Uncertainty for Federated learning via Bayesian Optimisation-based Model Poisoning [19.4]
悪意のあるユーザは、悪意のあるモデルパラメータを作成して、予測と生成能力を損なうことができる。我々は,グローバルモデル出力の不確実性を最大化することを目的とした,Delphiという新しいモデル中毒攻撃手法を提案する。数値的な結果から,Delphi-BOはDelphi-LSTRよりも高い不確実性を誘導することが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:52:29 GMT)
Deep Learning-Based Feature Fusion for Emotion Analysis and Suicide Risk Differentiation in Chinese Psychological Support Hotlines [18.8]
本研究では,ホットライン相互作用中に表現される感情を分析し理解するために,ピッチ音響特徴と深層学習に基づく特徴を組み合わせる手法を提案する。中国最大の心理支援ホットラインのデータを用いて、負のバイナリ感情分類においてF1スコア79.13%を達成した。本研究は, 心理的評価尺度と自殺リスク予測の新たな特徴として, 感情変動強度と頻度が有効であることが示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:09:38 GMT)
Reward Machines for Deep RL in Noisy and Uncertain Environments [18.4]
雑音および不確実な環境下での深部RLに対するReward Machinesの使用について検討した。ドメイン固有語彙の不確定な解釈の下でタスク構造を利用するRLアルゴリズムの組を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:30:12 GMT)
Demonstrating quantum error mitigation on logical qubits [18.4]
量子コンピューティングにおける長年の課題は、量子ビットの避けられないノイズを克服する技術を開発することである。本稿では,実効的な量子誤り軽減手法であるゼロノイズ外挿法(ゼロノイズ外挿法)の応用を実験的に提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:33 GMT)
MambaLRP: Explaining Selective State Space Sequence Models [18.1]
選択状態空間列モデル(マンバモデルと呼ばれる)を用いた最近のシーケンスモデリング手法は、関心が高まりつつある。これらのモデルは、線形時間における長いシーケンスの効率的な処理を可能にし、言語モデリングのような広範囲のアプリケーションで急速に採用されている。現実のシナリオにおける信頼性の高い利用を促進するためには、透明性を高めることが重要です。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:18:10 GMT)
A Reinforcement Learning Approach to Quiet and Safe UAM Traffic Management [18.0]
アーバン・エア・モビリティ(UAM)は、都市環境で様々な小型航空機を運用するトランスフォーメーションシステムである。 UAMの運用制約の最近の分析は、UAMシステム実装の鍵となるハードルとして航空機の騒音とシステムの安全性を強調している。本稿では,UAMトラフィックを管理するためのマルチエージェント強化学習手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:44:35 GMT)
A Foundation Language-Image Model of the Retina (FLAIR): Encoding Expert Knowledge in Text Supervision [17.9]
広義網膜基底画像理解のための学習済み視覚言語モデルFLAIRについて述べる。各種ソースから38個のオープンアクセスデータセットを収集した。我々は、事前学習とゼロショット推論の両方において、専門家のドメイン知識を記述的テキストプロンプトの形で統合する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:19:36 GMT)
StereoGen: High-quality Stereo Image Generation from a Single Image [17.6]
StereoGenは高品質なステレオ画像生成のための新しいパイプラインである。トレーニング不要な信頼生成と適応的格差選択を提案する。実験により、パイプライン下でトレーニングされたモデルは、最先端のゼロショット一般化結果が得られることが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:43:48 GMT)
MANTA: Diffusion Mamba for Efficient and Effective Stochastic Long-Term Dense Anticipation [17.4]
本稿では,長期にわたる密集予測の問題に対処する。本課題の目的は,提供された映像観測に基づいて,行動とその継続時間を予測することである。この不確実性に対処するために、モデルはいくつかの将来のアクションシーケンスを予測するように設計されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:46:44 GMT)
CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network [17.3]
CrossFiはシアムネットワークベースのアプローチで、ドメイン内シナリオとクロスドメインシナリオの両方に優れています。私たちは、クラスごとにテンプレートを生成することができる余分なWeight-Netを開発し、CrossFiがさまざまなシナリオで機能できるようにします。ジェスチャー認識タスクでは、ドメイン内シナリオで98.17%、ワンショットクロスドメインシナリオで91.72%、ゼロショットクロスドメインシナリオで64.81%、ワンショット新しいクラスシナリオで84.75%の精度を達成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:17:58 GMT)
Real-time Indexing for Large-scale Recommendation by Streaming Vector Quantization Retriever [17.2]
Streaming Vector Quantization Modelは検索パラダイムの新しい世代である。ストリームVQはインデックス付きのアイテムをリアルタイムでアタッチし、即時に付与する。軽量で実装に優しいアーキテクチャとして、ストリーミングVQがデプロイされ、DouyinとDouyin Liteのすべてのメジャーレトリバーに置き換えられた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:09:15 GMT)
ImageNet-Patch: A Dataset for Benchmarking Machine Learning Robustness against Adversarial Patches [17.1]
ImageNet-Patchは、機械学習モデルを敵のパッチに対してベンチマークするためのデータセットである。パッチのセットで構成され、異なるモデルにまたがる一般化に最適化され、事前処理後にImageNetデータに容易に適用できる。本稿では,127モデルに対する計算パッチの有効性を検証することで,このデータセットの有用性を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:46:30 GMT)
Towards Lightweight and Stable Zero-shot TTS with Self-distilled Representation Disentanglement [17.0]
軽量で安定なテキスト音声合成システム(TTS)を提案する。本稿では,音源音声から言語内容や話者属性を効果的にモデル化する新しいTSアーキテクチャを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:17:48 GMT)
DualOpt: A Dual Divide-and-Optimize Algorithm for the Large-scale Traveling Salesman Problem [16.8]
大規模旅行セールスマン問題(T)を解決するための二分割最適化アルゴリズム(DualOpt)を提案する。 DualOptは、ソリューションの品質と計算効率の両方を改善するための2つの補完戦略を組み合わせる。提案したDualOptは、文学における10の最先端アルゴリズムと比較して非常に競争力のある結果が得られる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:16:28 GMT)
GauFRe: Gaussian Deformation Fields for Real-time Dynamic Novel View Synthesis [16.7]
インプシット変形可能表現は、通常、標準空間と時間依存の変形場を持つ運動をモデル化する。 GauFReは、フォワードウォーピング変形を使用して、シーン幾何学の非剛体変換を明示的にモデル化する。実験により,提案手法は従来の最先端のNeRF法やガウス法よりも高い効率と競争結果が得られることが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:17:24 GMT)
Disjoint Processing Mechanisms of Hierarchical and Linear Grammars in Large Language Models [16.1]
我々は英語、イタリア語、日本語、あるいはナンス語を用いて入力を生成する。我々は,言語モデルが階層的,線形的に構造化された入力に対して異なる振る舞いを示すことを観察した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:34:34 GMT)
Incrementally Learning Multiple Diverse Data Domains via Multi-Source Dynamic Expansion Model [16.0]
継続学習は、事前知識を維持しつつ、新たな情報を漸進的に同化できるモデルの開発を目指している。本稿では,複数の異なるドメインから抽出されたデータサンプルを特徴とする,より複雑で現実的な学習環境に焦点を移す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:49:46 GMT)
Fusion Self-supervised Learning for Recommendation [16.0]
グラフコントラスト学習(GCL)ベースの手法は、様々なデータ拡張技術を通じてコントラストビューを作成することでCLを実装するのが一般的である。既存のCLベースの手法では、自己教師付き信号のキャプチャに従来のCLの目的を用いている。本稿では,高次Fusion Graph Contrastive Learningフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:04:59 GMT)
BloomScene: Lightweight Structured 3D Gaussian Splatting for Crossmodal Scene Generation [16.0]
3Dシーンは非常に複雑な構造を持ち、出力が密度が高く、一貫性があり、必要な全ての構造を含むことを保証する必要がある。現在の3Dシーン生成法は、事前訓練されたテキスト・画像拡散モデルと単眼深度推定器に依存している。クロスモーダルシーン生成のための軽量な3次元ガウススプラッティングであるBloomSceneを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:33:34 GMT)
Trustworthy, Responsible, and Safe AI: A Comprehensive Architectural Framework for AI Safety with Challenges and Mitigations [15.9]
AI安全性は、AIシステムの安全な採用とデプロイにおいて重要な領域である。私たちの目標は、AI安全研究の進歩を促進し、究極的には、デジタルトランスフォーメーションに対する人々の信頼を高めることです。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:21:30 GMT)
A Theory of Optimistically Universal Online Learnability for General Concept Classes [15.8]
我々は、0, 1$ラベルで楽観的にオンライン学習可能な概念クラスの完全な特徴付けを提供する。楽観的に普遍的なオンライン学習の概念は[Hanneke, 2021]で定義され, 最小限の仮定の下で学習可能性を理解する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:20:16 GMT)
TimeFlow: Longitudinal Brain Image Registration and Aging Progression Analysis [15.7]
TimeFlowは経時的脳MRI登録のための新しいフレームワークである。明示的な滑らかさ正規化子と高密度なシーケンシャルデータに依存する従来の方法とは異なり、TimeFlowはこれらの制約なしに時間的一貫性と連続性を達成する。 TimeFlowは、新しい生物学的脳老化解析をサポートし、神経変性状態と健康な老化を効果的に区別する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:02:04 GMT)
An Accelerated Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness [15.7]
本稿では,上層関数が非凸であり,下層関数が強凸である二層最適化問題のクラスについて検討する。これらの問題は、非有界ネットワークを用いたテキスト分類など、データ学習に大きな応用がある。本稿では,AccBO という新しい高速化バイレベル最適化アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:18:27 GMT)
Floquet controlled-phase gates in Rydberg atoms [15.5]
フロケット周波数変調(Floquet frequency modulation、FFM)は、レジリエントな量子ゲートを実現するための強力なアプローチである。この研究は、リドベルク原子における制御された任意の位相ゲートを実現する方法を導入する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:52:36 GMT)
Unseen Horizons: Unveiling the Real Capability of LLM Code Generation Beyond the Familiar [15.4]
我々は,大規模な言語モデルを評価するために,コード難読化ベースのベンチマークOBFUSEVALを構築した。私たちは3段階の戦略を使って、記述やコード、コンテキストの依存関係を曖昧にしています。その結果, 難燃後, 試験合格率の平均低下率は62.5%に達することがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:57:34 GMT)
Guiding Retrieval using LLM-based Listwise Rankers [15.4]
本稿では,リストワイズ設定をサポートする既存適応検索手法の適応性を提案する。具体的には、提案アルゴリズムは、初期ランキングとフィードバック文書の両方から結果をマージする。我々は,適応プロセスの最小化によるLLM推論の総数とオーバーヘッドを一定に保ちながら,nDCG@10を最大13.23%改善し,28.02%リコールできることを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:23:53 GMT)
TANQ: An open domain dataset of table answered questions [15.3]
TANQは、複数のソースにまたがる情報からテーブルを構築する必要がある、最初のオープンドメイン質問応答データセットである。結果の表にあるすべてのセルに対する完全なソース属性を公開し、オープン、オラクル、クローズドブックのセットアップで最先端の言語モデルをベンチマークします。最も優れたベースラインであるGPT4は、全体的なF1スコア29.1に達し、人間のパフォーマンスを19.7ポイント遅れています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:29:20 GMT)
Mitigating Knowledge Conflicts in Language Model-Driven Question Answering [15.3]
2つの基本的な知識源は、文書ベースの質問応答と文書要約システムにおいて重要な役割を担っている。近年の研究では、モデル固有の知識とトレーニングデータにおける基礎的真理解との間に不整合が存在する場合、システムは推論中に問題のある振る舞いを示す可能性があるという重要な課題が明らかにされている。本研究は,ソース入力と出力との明示的な接続を構築することで,幻覚を最小化する手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:46:15 GMT)
Zero-shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model [15.2]
本稿では,事前学習した画像拡散モデルに基づいて,ゼロショット映像の復元と拡張を行うための第1のフレームワークを提案する。本手法は,任意の拡散型画像復元・拡張手法に挿入可能なプラグアンドプレイモジュールである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:06:31 GMT)
Meta-UAD: A Meta-Learning Scheme for User-level Network Traffic Anomaly Detection [15.0]
ユーザレベルのネットワークトラフィック異常検出のためのメタラーニング手法である textitMeta-UAD を提案する。我々はCICFlowMeterを使って81のフローレベルの統計的特徴を抽出し、いくつかの無効な特徴を取り除く。既存のモデルと比較すると,Meta-UADはF1スコアで15%から43%向上した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:16:51 GMT)
FADE: Towards Fairness-aware Augmentation for Domain Generalization via Classifier-Guided Score-based Diffusion Models [15.0]
FairDG(Fairness-Aware Domain Generalization)は、信頼できるAIシステムを展開する上で重要な課題である。フェアネスに対処する伝統的な手法は、分布シフトに対する考慮の欠如により、領域一般化において失敗している。フェアネスを意識したスコアガイド拡散モデル(FADE)をFairDG問題に効果的に対処するための新しいアプローチとして提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:47:05 GMT)
HAFix: History-Augmented Large Language Models for Bug Fixing [14.6]
バグ修正におけるヒストリ拡張LDMを表すHAFixを提案する。 11のオープンソースプロジェクトからソースを得た51の単一行バグのデータセットにCode Llamaを採用し、バグの歴史的コンテキストデータをマイニングしています。評価の結果,歴史的Llamasはバグ修正性能を著しく向上させることがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:39:32 GMT)
FlexiClip: Locality-Preserving Free-Form Character Animation [14.5]
AniClipartのような既存の手法は、幾何学的変形を効果的にモデル化するが、しばしばスムーズな時間遷移を保証するのに失敗する。本稿では,時間的整合性や幾何的整合性といった課題に対処することで,これらの制約を克服する新しいアプローチであるFlexiClipを紹介する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:07:12 GMT)
Few-Shot Learner Generalizes Across AI-Generated Image Detection [14.1]
フーショット検出器(Few-Shot Detector, FSD)は、未知の偽画像を効果的に識別するために、特殊な距離空間を学習するAI生成画像検出器である。実験の結果、FSDのパフォーマンスは、GenImageデータセット上で平均ACC$+7.4%向上した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:33:11 GMT)
MonSter: Marry Monodepth to Stereo Unleashes Power [13.9]
既存の手法は、限られたマッチング手段で不適切な領域を扱うのに苦労している。 MonSterは単分子深度とステレオマッチングをデュアルブランチアーキテクチャに統合する。モンスターは5つの最もよく使われるリーダーボードの中で1位である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:11:24 GMT)
A Learning Algorithm That Attains the Human Optimum in a Repeated Human-Machine Interaction Game [13.9]
本稿では,人間の行動を観察して最小限のコストを求めるゲーム理論学習アルゴリズムについて述べる。我々は,広範囲な被験者実験において,アルゴリズムの性能を評価する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:07:48 GMT)
Multimodal Fake News Video Explanation Generation [13.8]
FNVE(Fake News Video Explanation)という新しい問題を提案する。ビデオテキストとキャプションテキストの両方を含むマルチモーダルニュースを考慮し、予測の真相を明らかにするために自然言語の説明を生成することを目的とする。マルチモーダルトランスをベースとしたアーキテクチャを用いてFakeNVEをベンチマークし,BARTベースの自己回帰デコーダをジェネレータとして使用する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:52:54 GMT)
Towards Scalable and Stable Parallelization of Nonlinear RNNs [13.7]
そこで我々は, 非線形RNNを並列に評価するDEERという手法を開発した。準ニュートン近似を適用し、それらをニュートンに可逆収束させ、メモリを少なくし、より高速であることを示す。これらの革新は、より大規模でより安定な非線形RNNの並列評価を可能にする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:18:35 GMT)
Finite-Sample Bounds for Adaptive Inverse Reinforcement Learning using Passive Langevin Dynamics [13.4]
本稿では,受動勾配ランゲヴィンダイナミクス(PSGLD)アルゴリズムの有限サンプル解析を行う。 Adaptive IRLは、勾配アルゴリズムを実行する前方学習者のコスト関数を推定することを目的としている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:19:34 GMT)
Better by Default: Strong Pre-Tuned MLPs and Boosted Trees on Tabular Data [13.4]
本稿では,改良された多層パーセプトロンであるRealMLPと,GBDTとRealMLPのメタチューニングデフォルトパラメータについて紹介する。ベンチマークの結果,RealMLPは他の神経ベースラインと比較して,良好な時間精度のトレードオフを提供することが示された。 RealMLPの改善点は、デフォルトパラメータでTabRのパフォーマンスを大幅に向上させることもできる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:02:08 GMT)
Leveraging LLM Agents for Translating Network Configurations [13.4]
本稿では,Large Language Model (LLM) Agentを用いたネットワーク構成の翻訳のための意図に基づくフレームワークを提案する。このアプローチのコアとなるのは、構成ファイルをフラグメントに分割し、インテントを抽出し、正確な翻訳を生成する、IntentベースのRetrieval Augmented Generation(IRAG)モジュールです。実世界のネットワーク構成に対して提案手法を実装し, 実験結果から, 本手法が97.74%の構文正当性を達成し, 翻訳精度に優れることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:25:56 GMT)
Fully Distributed, Flexible Compositional Visual Representations via Soft Tensor Products [13.3]
我々は,構成構造を本質的に分散した柔軟な方法でエンコードする表現形式であるSoft TPRを紹介する。我々は、ソフトTPRが従来の非絡み合いの代替よりも一貫して優れていることを示す。これらの知見は、構成構造を表現するための分散的で柔軟なアプローチの可能性を浮き彫りにしている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:01:09 GMT)
Metric Space Magnitude for Evaluating the Diversity of Latent Representations [13.3]
我々は,潜伏表現の内在的多様性の等級に基づく尺度群を開発する。我々の測度はデータの摂動下で確実に安定しており、効率的に計算でき、厳密なマルチスケールのキャラクタリゼーションと潜在表現の比較を可能にする。 i) 多様性の自動推定, (ii) モード崩壊の検出, (iii) テキスト, 画像, グラフデータの生成モデルの評価など, さまざまな領域やタスクにおけるそれらの実用性と優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:57:47 GMT)
DATransNet: Dynamic Attention Transformer Network for Infrared Small Target Detection [12.3]
赤外線小目標検出(ISTD)は、民間や軍事用途で広く用いられている。 ISTDは、小さなターゲットと薄暗いターゲットが複雑な背景によって隠蔽される傾向など、いくつかの課題に直面している。小型ターゲットのエッジ情報を抽出・保存する動的注意変換ネットワーク(DATransNet)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:40:31 GMT)
Generating Realistic Synthetic Head Rotation Data for Extended Reality using Deep Learning [12.1]
我々は、よく知られたジェネレーティブ・アドバイサル・ネットワークの拡張であるTimeGANに基づくヘッドローテーション・時系列生成器を提案する。このアプローチは、測定された時系列の分布と密接に一致する新しいサンプルで、ヘッドローテーションのデータセットを拡張することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:14:15 GMT)
Multispectral Pedestrian Detection with Sparsely Annotated Label [12.1]
Sparsely Annotated Multispectral Pedestrian Detection (SAMPD) と呼ばれる新しいフレームワークを提案する。 SAMPDはマルチスペクトル領域内の疎アノテート環境における性能を著しく向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:41:38 GMT)
AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages [12.0]
AfriHateは15のアフリカの言語におけるヘイトスピーチと虐待的な言語データセットのコレクションである。 AfriHateの各インスタンスは、地元の文化に詳しいネイティブスピーカーによって注釈付けされている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:55:50 GMT)
BRIGHT-VO: Brightness-Guided Hybrid Transformer for Visual Odometry with Multi-modality Refinement Module [11.9]
視覚計測(VO)は、自律運転、ロボットナビゲーション、その他の関連するタスクにおいて重要な役割を果たす。本稿では,トランスフォーマーアーキテクチャに基づく新しいVOモデルであるBrightVOを紹介し,フロントエンドの視覚的特徴抽出を行う。ポーズグラフ最適化を用いて、このモジュールは、エラーを減らし、精度とロバスト性の両方を改善するために、ポーズ推定を反復的に洗練する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:50:52 GMT)
Taming the Long Tail in Human Mobility Prediction [11.8]
移動予測のためのLong-Tail Adjusted Next POI Prediction (LoTNext) フレームワークを提案する。 2つの実世界の軌道データセットによる実験により、LoTNextが既存の最先端の作業を大幅に上回っていることが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:35:22 GMT)
Diagonal Over-parameterization in Reproducing Kernel Hilbert Spaces as an Adaptive Feature Model: Generalization and Adaptivity [11.6]
対角適応カーネルモデルは、トレーニング中にカーネル固有値と出力係数を同時に学習する。適応性は、トレーニング中に正しい固有値を学ぶことから生じることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:20:02 GMT)
Doc-Guided Sent2Sent++: A Sent2Sent++ Agent with Doc-Guided memory for Document-level Machine Translation [11.4]
本稿では,インクリメンタルな文レベル強制デコード戦略を利用するエージェントであるDoc-Guided Sent2Sent++を紹介する。私たちは、Sent2Sent++が他のメソッドよりも品質、一貫性、レイテンシで優れていることを実証します。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:25:35 GMT)
XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework [11.3]
本稿では,一般化されたシンボリック音楽生成フレームワークであるXMusicについて述べる。 XMusicは柔軟なプロンプト(画像、ビデオ、テキスト、タグ、ハミング)をサポートし、感情的に制御可能で高品質な象徴音楽を生成する。 XMusicは、現在の最先端の手法と、印象的な音楽クオリティを著しく上回っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:08:44 GMT)
Leveraging Large Language Models as Knowledge-Driven Agents for Reliable Retrosynthesis Planning [11.2]
大規模言語モデル(LLM)と知識グラフ(KG)を統合するエージェントシステムを提案する。新しいMulti-branched Reaction Pathway Search (MBRPS)アルゴリズムは、全ての経路の探索を可能にする。この研究は、LLMを動力とするマクロ分子に特化して、完全に自動化された再合成計画薬を開発する最初の試みである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:06:10 GMT)
Smart Contract Fuzzing Towards Profitable Vulnerabilities [10.9]
VERITEは利益中心のスマートコントラクトファジィフレームワークである。スクラッチから完全に開発され、61個の実世界のDeFiプロジェクトからなるデータセットで評価されている。検出(29/9)とエクスプロイト(平均利益の58倍)の両方において、最先端のファズー ITYFUZZ よりもはるかに優れている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:38:18 GMT)
Get Rid of Isolation: A Continuous Multi-task Spatio-Temporal Learning Framework [10.3]
我々は,都市の総合的知能を高めるために,連続マルチタスク時空間学習フレームワーク(CMuST)を提案することが不可欠であると主張する。 CMuSTは、都市時間学習を単一ドメインから協調マルチタスク学習に改革する。マルチタスク時間学習のための3つの都市のベンチマークを作成し,CMuSTの優位性を実証的に実証した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:17:01 GMT)
Complexity Control Facilitates Reasoning-Based Compositional Generalization in Transformers [10.2]
本研究では,コンポジションタスクにおけるトランスフォーマーの振舞いのメカニズムについて検討する。複雑性制御戦略は,分布外(推論に基づく解)を一般化するプリミティブレベルのルールを学習するか,あるいは記憶されたマッピング(メモリベースの解)にのみ依存するかに影響を及ぼす。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:54:52 GMT)
EdgeSight: Enabling Modeless and Cost-Efficient Inference at the Edge [10.1]
We propose EdgeSight, a system that a cost- efficient modeless inference at the edge。実験の結果、EdgeSightは、モードレスサービスのP99レイテンシーにおいて、既存のシステムよりも1.6倍性能が高いことがわかった。我々のFPGAプロトタイプは、消費電力を最大3.34倍に抑えながら、ある程度の精度で同様の性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:17:38 GMT)
Ultra-High-Definition Image Deblurring via Multi-scale Cubic-Mixer [10.1]
トランスフォーマーベースのアルゴリズムは、画像劣化の領域に飛び散っている。これらのアルゴリズムはトークン間の長距離依存関係をモデル化するためにCNNステムによる自己保持機構に依存する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:32:05 GMT)
Score-based 3D molecule generation with neural fields [10.1]
連続原子密度場に基づく3次元分子の新しい表現法を提案する。ニューラルフィールドを用いた連続空間における無条件3次元分子生成のためのウォークジャンプサンプリングに基づく新しいモデルを提案する。我々のモデルであるFuncMolは、条件付きニューラルネットワークを用いて分子場を潜時符号に符号化する。 FuncMolは分子構造を仮定せずに全原子で3D分子を生成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:10:59 GMT)
Consistency of Responses and Continuations Generated by Large Language Models on Social Media [9.8]
大規模言語モデル(LLM)は、テキスト生成において顕著な能力を示すが、ソーシャルメディアの文脈における感情的一貫性とセマンティック・コヒーレンス(セマンティック・コヒーレンス)は十分に理解されていない。本研究では,2つのオープンソースモデル,Gemma と Llama を用いて,LLM が情緒的内容をどのように処理し,セマンティックな関係を維持するかを検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:10:00 GMT)
Comprehensive Subjective and Objective Evaluation Method for Text-generated Video [9.7]
我々は,textbfTextで生成されたtextbfVideo textbfevaluation, textbfT2VEval-Bench のベンチマークデータセットを構築した。主観評価では, 全体的な印象, 映像品質, 審美的品質, 現実性, テキスト・ビデオの一貫性の5つの重要なスコアを収集した。客観的評価のために, 品質, 信頼性, 一貫性の3分野にわたるビデオの評価を行うtextbfT2VEval モデルを開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:11:33 GMT)
Yuan: Yielding Unblemished Aesthetics Through A Unified Network for Visual Imperfections Removal in Generated Images [9.6]
textitYuanは、テキストと画像の合成において視覚的欠陥を自律的に補正する新しいフレームワークである。提案手法は, NIQE, BRISQUE, PIなどの測定値において, 常に高いスコアを達成している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:54:33 GMT)
How Do Generative Models Draw a Software Engineer? A Case Study on Stable Diffusion Bias [9.6]
我々は,ソフトウェア工学タスクに対する安定拡散モデルの3つのバージョンで表される性別と民族性バイアスを評価する。結果は、すべてのモデルが、ソフトウェアエンジニアを代表する男性の数字に大きく偏っていることを示している。しかしながら、すべてのモデルは、使用するプロンプトスタイルに関係なく、黒とアラブのフィギュアを著しく下回っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:57:17 GMT)
DNMDR: Dynamic Networks and Multi-view Drug Representations for Safe Medication Recommendation [9.5]
本稿では、動的ネットワークとマルチビュードラッグ表現(DNMDR)を統合した新しい医薬勧告(MR)手法を提案する。 DNMDR法は,PRAUC, Jaccard, DDIレートなど,様々な指標において,最先端のベースラインモデルよりも優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:36:55 GMT)
When Uncertainty Leads to Unsafety: Empirical Insights into the Role of Uncertainty in Unmanned Aerial Vehicle Safety [9.4]
本研究では,UAVの行動不確実性と飛行の危険度との関係について検討した。オートエンコーダに基づく実行時不確実性検出であるSuperialistを実装した。スーパーリアリストは、96%の精度と93%のリコールで不確実な振る舞いを検出することで高いパフォーマンスを達成した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:18:13 GMT)
Relational Reasoning Networks [9.3]
本稿では,深層建築の潜伏空間における推論を行う新しいエンドツーエンドモデルであるニューロ・シンボリック・ネットワーク(R2N)を提案する。 R2Nは、学習と推論を異種問題に統合する神経象徴的なプラットフォームとして純粋に象徴的またはタスクに適用することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:33:52 GMT)
MADiff: Text-Guided Fashion Image Editing with Mask Prediction and Attention-Enhanced Diffusion [9.1]
編集領域をより正確に識別するためにMADiffモデルを提案する。 Atention-Enhanced Diffusion Model は編集サイズを強化するために提案されている。提案手法は,編集領域のマスクを正確に予測し,ファッション画像編集における編集サイズを大幅に向上させることができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:53:13 GMT)
Assessing the Alignment of FOL Closeness Metrics with Human Judgement [9.1]
FOL評価における既存の指標の感度と人的判断との整合性について検討した。メトリクスを組み合わせることで、個々のメトリクスに比べてアライメントと感度が向上することを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:22:35 GMT)
Self Pre-training with Adaptive Mask Autoencoders for Variable-Contrast 3D Medical Imaging [9.0]
Masked Autoencoder (MAE) は、視覚変換器 (ViT) が自然画像の解析に有効であることを最近証明した。本稿では,3次元入力コントラストの可変数に対応可能な3次元適応マスク付きオートエンコーダ(AMAE)アーキテクチャを提案する。この性能は、この適応マスク付きオートエンコーダの自己事前トレーニングにより、ViTベースのセグメンテーションモデルにおいて、梗塞セグメンテーション性能を2.8%-3.7%向上させることができることを示している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:29:31 GMT)
Magnon cat states in a cavity-magnon-qubit system via two-magnon driving and dissipation [8.9]
本研究では,キャビティ-マグノン-クビットハイブリッドシステムにおけるマグノニック・キャット状態の散逸生成を効率的に行う方法を提案する。短時間の進化の間にマグノンの収縮状態が出現する可能性がある。マグノニック・キャットとスクリュッド・ステートは、マクロ的な量子状態であり、マクロ的な量子研究や量子センシングに応用されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:07:09 GMT)
Automated Review Generation Method Based on Large Language Models [8.9]
大規模言語モデル(LLM)に基づく自動レビュー生成手法を提案する。提案手法は高速に343項目を解析し,LLMアカウント1項目あたり平均秒を計測し,35項目にわたる総合的なレビューを行い,1041項目を拡張分析した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:10:57 GMT)
Few-Shot Adaptation of Training-Free Foundation Model for 3D Medical Image Segmentation [8.8]
FATE-SAM (Few-shot Adaptation of Training-frEe SAM) は、3次元医用画像セグメンテーションに高度なセグメンテーションモデル2 (SAM2) を適用するために設計された新しい手法である。 FATE-SAMはSAM2の事前訓練されたモジュールを再組み立てし、少数のサポート例を活用する。複数の医用画像データセット上でFATE-SAMを評価し、教師付き学習方法、ゼロショットSAMアプローチ、微調整医療SAM手法と比較した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:44:21 GMT)
ANSR-DT: An Adaptive Neuro-Symbolic Learning and Reasoning Framework for Digital Twins [8.8]
我々はANSR-DTと呼ばれるデジタルツイン技術のための適応型ニューロシンボリック学習フレームワークを提案する。パターン認識アルゴリズムと強化学習とシンボリック推論を組み合わせることで,リアルタイム学習と適応知性を実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:04:57 GMT)
How Developers Interact with AI: A Taxonomy of Human-AI Collaboration in Software Engineering [8.7]
開発者とAIツール間のインタラクションタイプを分類し,11種類のインタラクションタイプを識別する。この分類に基づいて、AIインタラクションの最適化、開発者のコントロールの改善、AI支援開発における信頼とユーザビリティの課題への対処に焦点を当てた研究課題を概説する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:53:49 GMT)
OMEGA: A Low-Latency GNN Serving System for Large Graphs [8.5]
グラフニューラルネットワーク(GNN)は、グラフデータセットにおける表現ノード表現の計算能力に広く採用されている。既存のトレーニングにおける近似技術はオーバーヘッドを軽減することができるが、サービスでは高いレイテンシと/または精度の損失につながる。本稿では,低遅延GNNを最小限の精度でグラフに役立てるシステムであるOMEGAを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:14:18 GMT)
Fine-grained Spatio-temporal Event Prediction with Self-adaptive Anchor Graph [8.4]
本稿では,詳細な事象予測のためのグラフ時空間点(GSTPP)モデルを提案する。エンコーダ・コーダアーキテクチャを採用し、空間的局所化領域の状態ダイナミクスを共同でモデル化する。提案したGSTPPモデルは,微細なイベント予測の精度を大幅に向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:38:07 GMT)
Product of Gaussian Mixture Diffusion Model for non-linear MRI Inversion [8.4]
本稿では,ガウス混合拡散モデルの軽量かつパラメータ効率,解釈可能な積を画像として提案し,コイル感度の古典的滑らかさを優先する。提案手法は, 高速な推測と, 分布外データとサンプリングトラジェクトリを対比する頑健性を実証しながら, 有望な結果を提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:57:41 GMT)
Delay Sensitive Hierarchical Federated Learning with Stochastic Local Updates [8.4]
通信遅延の有無で,局所平均化がフェデレート学習(FL)システムの性能に及ぼす影響について検討した。遅延の影響を最小限に抑えるため、クライアントは異なるグループに割り当てられ、それぞれがクライアントのモデルを集約する独自のローカルパラメータサーバ(LPS)を持つ。グループのモデルは、LPSとのみ通信するグローバルパラメータサーバ(GPS)に集約される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:45:04 GMT)
The Surprising Ineffectiveness of Pre-Trained Visual Representations for Model-Based Reinforcement Learning [8.4]
視覚強化学習法は、しばしば大量のデータを必要とする。モデルベースRL(MBRL)は、プランニングによる効率的なデータ利用の潜在的なソリューションを提供する。 MBRLには現実世界のタスクの一般化機能が欠けている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:24:32 GMT)
Dynamic Localisation of Spatial-Temporal Graph Neural Network [8.3]
空間時空間グラフニューラルネットワーク(ASTGNN)は、依存関係をモデル化するための貴重なツールとして登場した。本稿では,空間依存は時間とともに動的に進化するべきだという革新的な視点を紹介する。 textitDynAGSは、分散デプロイメントにおける効率性と精度の最大化を目的とした、ローカル化ASTGNNフレームワークである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:59:39 GMT)
Practical security of twin-field quantum key distribution with optical phase-locked loop under wavelength-switching attack [8.2]
TFクラスQKDシステムに対する波長スイッチング攻撃を実演する。平均光子数の最大増加率は8.7%であり、TFクラスQKDシステムのセキュリティを損なうことが理論的に証明されている。 TFクラスQKD実装における実用セキュリティにおけるシステムキャリブレーションの重要性を強調した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:18:06 GMT)
Key-Exchange Convolutional Auto-Encoder for Data Augmentation in Early Knee Osteoarthritis Detection [8.2]
Key-Exchange Convolutional Auto-Encoder (KECAE)は、初期のKOA分類のためのAIベースのデータ拡張戦略である。我々のモデルは、合成画像を生成する新しいキー交換機構を備えた畳み込みオートエンコーダを用いる。実験結果から,KECAEが生成したデータはKOA分類モデルの性能を大幅に向上することが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:50:17 GMT)
Confidence-Driven Deep Learning Framework for Early Detection of Knee Osteoarthritis [8.2]
膝関節症 (KOA) は筋骨格障害の1つで、運動量や生活の質に深刻な影響を及ぼす。我々は,KL-0およびKL-2ステージの識別に焦点をあてた,早期のKOA検出のための信頼性駆動型ディープラーニングフレームワークを提案する。実験により,提案フレームワークは専門家の放射線学者に匹敵する,競争精度,感度,特異性を達成できることが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:41:42 GMT)
Sound Scene Synthesis at the DCASE 2024 Challenge [8.2]
本稿では,DCASE 2024 Challenge: Sound scene synthesis のタスク7について述べる。音声合成と生成モデルの最近の進歩は、現実的で多様なオーディオコンテンツの作成を可能にしている。目的と主観の両方を取り入れた,異なる音場合成システムを比較するための標準化された評価フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:15:54 GMT)
Who is Responsible? The Data, Models, Users or Regulations? Responsible Generative AI for a Sustainable Future [8.1]
責任人工知能(Responsible Artificial Intelligence, RAI)は、AIシステムの開発と展開における倫理的懸念に対処するための重要なフレームワークとして登場した。本稿では、ChatGPT後における倫理的、透明性があり、説明可能なAIシステムを実装する上での課題と機会について考察する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:59:42 GMT)
Dynamic-Aware Spatio-temporal Representation Learning for Dynamic MRI Reconstruction [7.7]
InRに基づく動的MRI再構成モデルであるDynamic-Aware INR (DA-INR)を提案する。画像領域におけるダイナミックMRIデータの空間的・時間的連続性を捉え、データの時間的冗長性をモデル構造に明示的に組み込む。その結果、DA-INRは極端アンサンプ比でも復元品質で他のモデルより優れる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:11:33 GMT)
Normalize Then Propagate: Efficient Homophilous Regularization for Few-shot Semi-Supervised Node Classification [7.7]
グラフニューラルネットワーク(GNN)は、半教師付きノード分類において顕著な能力を示した。既存のGNNの多くは、トレーニングのために大量のラベル付きデータに大きく依存している。我々は、ラベルのないノードのホモフィリーな仮定を利用して、追加の監視信号を生成する、NormPropという新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:01:14 GMT)
Training-Aware Risk Control for Intensity Modulated Radiation Therapies Quality Assurance with Conformal Prediction [7.2]
測定品質保証の実践は、がん治療における強度変調放射線療法(IMRT)の安全利用において重要な役割を担っている。これらのプラクティスにより、測定ベースのIMRT QA障害が1%以下になった。そこで本研究では,共形リスク制御と共形トレーニングの利点を組み合わせることで,新たな訓練適応型共形リスク制御手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:19:51 GMT)
Detecting Wildfire Flame and Smoke through Edge Computing using Transfer Learning Enhanced Deep Learning Models [7.2]
本研究は、山火事の煙や炎を識別する対象検出器の性能を高める上で、トランスファーラーニング(TL)の重要性を裏付けるものである。本稿では,D-Fire あるいは FASDD を初期目標データセットとして,AFSE をその後の段階として利用する2段階の TL 手法について検討する。微調整により、TLは検出精度を大幅に向上し、平均平均精度(mAP@0.5)は79.2%まで向上し、トレーニング時間を短縮し、モデルの一般化性を高める。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:04:44 GMT)
Modeling Melt Pool Features and Spatter Using Symbolic Regression and Machine Learning [7.1]
AMの重要な課題の1つは、一貫した印刷品質を達成することである。部分的にスパッタによって生じる溶融プールのダイナミクスは欠陥を引き起こす可能性がある。我々はAMオペレーションにおける意思決定を支援するフレームワークを開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:26:01 GMT)
Constructing Confidence Intervals for 'the' Generalization Error -- a Comprehensive Benchmark Study [7.1]
機械学習では、一般化誤差に対する信頼区間(CI)が重要なツールである。 7種類のインデューサと合計8個の損失関数を用いて,合計19個の回帰および分類問題に対する13種類のCI手法の評価を行った。一般化エラーのためのCI構築の方法論的基礎と固有の課題について概説し、統一されたフレームワークにおける13のメソッド全てを簡潔にレビューする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:02:02 GMT)
Scalable Similarity-Aware Test Suite Minimization with Reinforcement Learning [6.9]
TripRLは、多種多様なテストスイートを高いテスト効率で生成する新しい技術である。本稿では,TripRLのランタイムは,Multi-Criteria Test Suite Minimization問題の規模と線形にスケール可能であることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:36:05 GMT)
SuperSAM: Crafting a SAM Supernetwork via Structured Pruning and Unstructured Parameter Prioritization [6.8]
視覚変換器(ViT)に基づくアーキテクチャの検索空間設計戦略を提案する。特に,Segment Anything Model(SAM)をSuperSAMと呼ばれる重み共有スーパーネットワークに変換する。提案手法では,階層的に構造化されたプルーニングとパラメータ優先順位付けによる探索空間設計の自動化を行う。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:54:12 GMT)
SWSC: Shared Weight for Similar Channel in LLM [6.8]
大規模言語モデル(LLM)は、複数の産業で発展を加速させている。類似チャネルに対する共有重みの概念に基づくLLM圧縮手法であるSWSCを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:36:19 GMT)
Reassessing the Role of Chain-of-Thought in Sentiment Analysis: Insights and Limitations [6.8]
推論技術が意味理解を促進するかどうかを考察する。推論手法としてチェーン・オブ・シークレット・プロンプトを採用しています。実験によると、思考の連鎖は感情分析タスクに最小限の影響を与える。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:07:22 GMT)
Lights, Camera, Matching: The Role of Image Illumination in Fair Face Recognition [6.6]
コーカサスとアフリカ系アメリカ人の女性画像対の類似度スコア分布の精度ギャップを小さくすることを目的としている。中央の明るさのみに基づくバランスは、d'が46.8%減少し、輝度分布に基づくバランスは57.6%減少する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:19:37 GMT)
Supervised Kernel Thinning [6.6]
Dwivedi & Mackey (2024) のカーネルスライニングアルゴリズムは、一般的な点集合のより優れた圧縮を提供する。我々はKTアルゴリズムを一般化し、カーネルメソッドを含む教師付き学習問題を高速化する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:50:11 GMT)
Learning Hyperplane Tree: A Piecewise Linear and Fully Interpretable Decision-making Framework [6.6]
LHTの構造は単純で効率的であり、複数の超平面を用いてデータを分割し、ターゲットと非ターゲットの標本を段階的に区別する。 LHTは, 各分岐ブロックの透過度が高く, 解釈可能であり, 各特徴の分類への寄与が明らかである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:59:24 GMT)
Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning [6.5]
本研究では,顔提示検出(PAD)の代替手段としてのChatGPT(特にGPT-4o)の可能性を明らかにする。以上の結果から, GPT-4oは高一貫性を示すことが示唆された。注目すべきは、このモデルは創発的な推論能力を示し、数ショットのシナリオで高い精度で攻撃タイプ(プリントまたはリプレイ)を正確に予測する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:46:33 GMT)
On the challenges of detecting MCI using EEG in the wild [6.5]
近年の研究では,脳波(EEG)データを用いた軽度認知障害(MCI)の検出に有望な結果が示されている。 2つのコントラストデータセットを用いた堅牢なMCI検出手法の開発における潜在的な限界と課題について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:20:11 GMT)
WhiSPA: Semantically and Psychologically Aligned Whisper with Self-Supervised Contrastive and Student-Teacher Learning [6.3]
この研究は、対照的な学生-教師の学習目標で訓練された新しいオーディオエンコーダであるWhiSPAを提案することによってギャップを埋める。我々は,SBERTエンコーダのテキスト表現とWhisperオーディオ埋め込みの協調性および心理的次元のテキストベース評価の有用性を評価する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:30:17 GMT)
ASTER: Natural and Multi-language Unit Test Generation with LLMs [6.3]
静的解析を組み込んだジェネリックパイプラインを記述し,コンパイル可能な高カバレッジテストケースの生成においてLCMをガイドする。コードカバレッジとテスト自然性の観点から,生成したテストの品質を評価するための実証的研究を行った。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:46:19 GMT)
Efficient wireless charging of a quantum battery [6.2]
量子電池のワイヤレス充電を、$n$の充電ユニットで調べる。その結果, 結合強度の増加に伴い充電性能が向上することが判明した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:53:06 GMT)
LoL-PIM: Long-Context LLM Decoding with Scalable DRAM-PIM System [6.2]
大規模言語モデル(LLM)は数万のトークンのシーケンスを処理する。 Processing-in-Memory (PIM) は、計算をデータに移動させることでメモリ帯域幅を最大化する。 LoL-PIM はマルチノード PIM アーキテクチャであり、ハードウェアとソフトウェアの共同設計により長期のコンテキスト LLM を高速化する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:34:46 GMT)
Customizable LLM-Powered Chatbot for Behavioral Science Research [6.1]
LLM(Large Language Models)は、人間のコミュニケーションによく似たテキストを生成する。チャットボットの潜在的な実用性は、特に研究の文脈において、従来のアプリケーションを超越している。本研究では,行動科学研究を支援するためのCLPC(Customizable LLM-Powered)システムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:23:23 GMT)
Integrating Multi-Physics Simulations and Machine Learning to Define the Spatter Mechanism and Process Window in Laser Powder Bed Fusion [6.0]
本研究では, LPBFにおける多物理現象をシミュレートするために構築した高忠実度モデリングツールを用いて, スパッタ形成機構について検討した。スパッタの挙動と生成を理解するため, 噴出時の特性を明らかにし, 生成源である溶融プールからの変動を評価する。分類タスクの相関解析と機械学習(ML)アルゴリズムを用いて,スパッタとメルトプールの関係を評価した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:29:38 GMT)
Riemannian quantum circuit optimization based on matrix product operators [6.0]
量子系のハミルトニアンシミュレーションのための初期トロッター回路のシミュレーション精度を著しく向上する。本手法は, 量子系に対して, 翻訳不変性などの対称性の仮定を課さない。分子系,特に水素化リチウムに応用し,最大8桁の誤差改善を実現することで,本手法の汎用性を実証した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:42:34 GMT)
Optical information encryption using general temporal ghost imaging with practical experimental condition [6.0]
テンポラルゴーストイメージングは、遅い検出器を用いて高速の時間信号を再構成する。画像品質に及ぼす遅い検出器の実験パラメータの影響を理論的に検討する。量子および古典的TGI手法の両方に基づくマルチビット情報伝送方式を実装した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:27:36 GMT)
Identifying Spurious Correlations using Counterfactual Alignment [5.8]
急激な相関によって駆動されるモデルは、しばしば一般化性能が劣る。本稿では,突発的相関を検出・定量化するためのCFアライメント手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:11:20 GMT)
Conformal-in-the-Loop for Learning with Imbalanced Noisy Data [5.7]
大規模なデータセットでは、クラス不均衡とラベルノイズが広まっています。機械学習の研究の多くは、よくラベル付けされたバランスの取れたデータを前提としている。コンフォーマル・イン・ザ・ループ(Conformal-in-the-Loop, CitL)は,コンフォーマルな予測に基づく手法を用いて,両課題に対処する新しいトレーニングフレームワークである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:51:48 GMT)
Applying the maximum entropy principle to neural networks enhances multi-species distribution models [5.7]
我々は、ニューラルネットワークを利用して種間の共有機能を自動的に学習するDeepMaxentを提案する。我々は、その空間的サンプリングバイアスで知られるベンチマークデータセットでDeepMaxentを評価する。以上の結果から,DeepMaxentはすべての地域やグループでMaxentよりも優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:21:16 GMT)
Multi-view Correlation-aware Network Traffic Detection on Flow Hypergraph [5.6]
ネットワークトラフィック検出のための多視点相関対応フレームワークFlowIDを提案する。 FlowIDは時間的およびインタラクションの認識を通じてマルチビュートラフィックの特徴をキャプチャし、ハイパーグラフエンコーダはフロー間の高次関係をさらに探求する。 FlowIDは,様々なネットワークシナリオにおいて,既存の手法よりも精度,堅牢性,一般化に優れることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:17:06 GMT)
Transformer-based Multivariate Time Series Anomaly Localization [5.6]
時空間異常スコア(英: Space-Time Anomaly Score、STAS)は、変圧器の潜在表現と時空間統計モデルとの接続にインスパイアされた新しい計量である。統計的特徴異常スコア(SFAS)は、異常に関する統計的特徴を分析してSTASを補完し、それらの組み合わせは誤報を減らすのに役立つ。実世界の実験と合成データセットは、検出タスクとローカライゼーションタスクの両方において、最先端の手法よりもモデルの方が優れていることを示している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:18:51 GMT)
A Unifying Information-theoretic Perspective on Evaluating Generative Models [5.5]
最近のいくつかのアプローチでは、分類領域から借用された「精度」と「リコール」を利用して、出力の忠実度(リアリズム)と出力の多様性(実データ変動の表現)を個別に定量化している。我々は、kNN密度推定のアプローチを用いて、kth-nearest-neighbors(kNN)ベースのメトリクスのクラスを情報理論レンズの下に統一する。高精度クロスエントロピー(PCE)、リコールクロスエントロピー(RCE)、リコールエントロピー(RE)からなる3次元計量を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:02:00 GMT)
MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.4]
医用画像注意に基づく特徴抽出器 (MIAFEx) を提案する。 MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:07:06 GMT)
RouteNet-Gauss: Hardware-Enhanced Network Modeling with Machine Learning [5.4]
本稿では、これらの課題に対処するために、テストベッドネットワークと機械学習(ML)モデルとの新たな統合であるRouteNet-Gaussを紹介する。ハードウェアアクセラレータとしてテストベッドを使用することで、RouteNet-Gaussはトレーニングデータセットを高速に生成し、実世界の条件に対する忠実度の高いネットワークシナリオをシミュレートする。実験結果から,RouteNet-Gaussは予測誤差を最大95%削減し,最新のDES法に比べて推論時間の488倍の高速化を実現していることがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:00:11 GMT)
Comparative Analysis of Listwise Reranking with Large Language Models in Limited-Resource Language Contexts [5.3]
本研究では,リミテッド・ソース・アフリカ言語を対象としたリストワイド・リランクにおける大規模言語モデル(LLM)の性能を評価する。 RankGPT3.5, Rank4o-mini, RankGPTo1-mini, RankClaude-sonnetを言語間の文脈で比較した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:15:13 GMT)
How to Build an AI Tutor That Can Adapt to Any Course Using Knowledge Graph-Enhanced Retrieval-Augmented Generation (KG-RAG) [5.3]
本稿では,知識グラフ強化検索生成(KG-RAG)を用いた適応型AI教師のための新しいフレームワークを提案する。このアプローチは,大規模言語モデルで広く普及している情報と限定的なコース特化の難しさに対処する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:12:26 GMT)
Extended convexity and smoothness and their applications in deep learning [5.3]
本稿では,複合最適化問題のクラス,特にディープラーニングにおける理論的基礎を提供するための最適化フレームワークを提案する。我々は、$mathcalH(Phi)$-smoothness である対象関数に対するリプシッツの降下法と降下法の滑らかさを解析する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:53:49 GMT)
MVTamperBench: Evaluating Robustness of Vision-Language Models [5.3]
ビデオ改ざん効果に対するVLMのレジリエンスを評価するためのベンチマークであるMVTamperBenchを紹介する。 MVTamperBenchは、InternVL2-8Bのようなモデルで高い性能を実現している。 MVTamperBenchはモジュール評価ツールキットであるVLMEvalKitに統合されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:04:48 GMT)
Multi-Class Traffic Assignment using Multi-View Heterogeneous Graph Attention Networks [5.2]
我々は,多クラス車両が関与する場合に,交通代行のための革新的なサロゲートモデルを開発する。本モデルは,リンクフローと利用率の高精度な予測を行いながら,流れの保存に固執する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:53:14 GMT)
Inferring stochastic low-rank recurrent neural networks from neural data [5.2]
計算神経科学における中心的な目的は、大きなニューロンの活動と基礎となる力学系を関連付けることである。低ランクリカレントニューラルネットワーク(RNN)は、トラクタブルダイナミクスを持つことによって、そのような解釈可能性を示す。そこで本研究では,低ランクRNNをモンテカルロ変分法に適合させる手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:40:12 GMT)
Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design [5.0]
本研究では,Large Language Models (LLM) を用いた自律型シミュレーションエージェント (ASA) の実現可能性について検討する。実験ケースとして, 高分子鎖配座のよく研究されたシミュレーション問題を用いて, 異なるLCMを用いたASAの長期化と信頼性について検討した。その結果,ASA-GPT-4oは指定された研究ミッションでほぼ不当に実行された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:12:02 GMT)
Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning [5.0]
オフラインの強化学習では、環境からの高価なフィードバックがなければ、静的なデータセットを使ってポリシーが学習される。我々は,観察と行動の連関分布の生成モデルを学習する制約付き潜在行動ポリシー(C-LAP)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:24:49 GMT)
IndoNLP 2025: Shared Task on Real-Time Reverse Transliteration for Romanized Indo-Aryan languages [5.0]
本稿は、インド・アーリア語族における低リソース言語を母国語に翻訳することに焦点を当てている。この課題は、ローマ字化したインド・アーリア語を彼らのネイティブスクリプトに変換するリアルタイムのリバース・トランスリテータを導入し、評価することを目的としている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:10:01 GMT)
GLow -- A Novel, Flower-Based Simulated Gossip Learning Strategy [4.9]
本稿では,最先端のフラワーフレームワークを活用することで,独自のゴシップ学習システムをシミュレートする新しい手法を提案する。具体的には、GLowを導入し、研究者はデバイスのスケーラビリティと収束性をトレーニングし、評価することができる。 MNISTデータセットとCIFAR10データセットでGLowが達成した結果は、それぞれ0.98以上と0.75以上である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:35:32 GMT)
EVAL: EigenVector-based Average-reward Learning [4.9]
ニューラルネットワークによる関数近似に基づくアプローチを開発する。エントロピー正則化を使わずに, 平均回帰RL問題を解く方法を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:45 GMT)
Average-Reward Reinforcement Learning with Entropy Regularization [4.9]
本研究では,関数を用いたエントロピー規則化平均回帰RL問題の解法を開発した。 RLの標準ベンチマークで既存のアルゴリズムと比較し,提案手法を実験的に検証した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:46 GMT)
Photon-Number Conserved Universal Quantum Logic Employing Continuous-Time Quantum Walk on Dual-Rail Qubit Arrays [4.8]
超伝導回路における量子論理を実現するために,デュアルレール量子ビット符号化と連続時間量子ウォーク(CTQW)の相乗効果を示す。我々は、現在の超伝導量子ビットプラットフォームと互換性のあるチューナブルカプラ強度によって促進されるデュアルレール符号化を保ちながら、シングルビット、2ビット、3ビット演算を構築した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:12:53 GMT)
Improving the Ability of Pre-trained Language Model by Imparting Large Language Model's Experience [4.8]
大規模言語モデル (LLM) と事前訓練型言語モデル (LM) は多くのソフトウェア工学のタスクにおいて驚くべき成功を収めた。我々は、LLMを用いてドメイン固有のデータを生成し、目標タスクにおける事前学習されたLMの性能を向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:37:00 GMT)
Augmenting Human-Annotated Training Data with Large Language Model Generation and Distillation in Open-Response Assessment [4.8]
大規模言語モデル(LLM)は、テキスト分類タスクを低コストで自動化するのに役立つ。対照的に、人間のコーディングは一般的により信頼性が高いが、大規模な調達には高価である。両者の強みを生かしたハイブリッドソリューションを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:13:46 GMT)
Interpreting Equivariant Representations [4.7]
本稿では,同変モデルによる帰納バイアスも潜在表現を用いて考慮する必要があることを示す。インダクティブバイアスを考慮しないと下流タスクのパフォーマンスが低下することを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:30:18 GMT)
Salient Information Preserving Adversarial Training Improves Clean and Robust Accuracy [4.7]
SIP-AT(Salient Information Preserving Adversarial Training)を紹介する。 SIP-ATは、従来の敵の訓練によって引き起こされる堅牢性-正確性トレードオフを緩和するための直感的な方法である。 SIP-ATは、複数のエプシロンレベルの攻撃に対して高い堅牢性を保ちながら、モデルのクリーンな精度を高めることができることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:12:59 GMT)
Automatic tuning of communication protocols for vehicular ad hoc networks using metaheuristics [4.7]
車両用アドホックネットワーク(VANET)は、自発的に相互接続可能な通信車両の集合を扱う。最終のネットワーク展開に先立って,通信プロトコルを最適に設定することが重要である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:59:00 GMT)
SAIF: A Comprehensive Framework for Evaluating the Risks of Generative AI in the Public Sector [4.7]
生成AI(SAIF)のリスクを評価するためのシステムdAta generatIon Frameworkを提案する。 SAIFには、リスクのブレークダウン、シナリオの設計、Jailbreakメソッドの適用、プロンプト型探索の4つの重要なステージがある。我々は、この研究が、生成AIの公共部門への安全かつ責任ある統合を促進する上で重要な役割を担っていると信じている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:12:38 GMT)
Aegis2.0: A Diverse AI Safety Dataset and Risks Taxonomy for Alignment of LLM Guardrails [4.7]
大規模言語モデル(LLM)と生成AIが普及している。 LLM関連の安全リスクの完全なスペクトルに対処する、高品質で人間による注釈付きデータセットの欠如は明らかです。安全リスクを分類するための包括的かつ適応可能な分類法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:37:08 GMT)
Learning to Extract Cross-Domain Aspects and Understanding Sentiments Using Large Language Models [4.6]
アスペクトベースの感情分析(ASBA)は、感情分析の洗練されたアプローチである。製品、サービス、エンティティの特定の側面や特徴に基づいて感情を抽出し、分類することを目的としています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:36:56 GMT)
Tracking the Takes and Trajectories of English-Language News Narratives across Trustworthy and Worrisome Websites [4.6]
我々は、4000以上の事実が信頼できない、混合信頼性があり、事実が信頼できる英語ニュースサイトにおいて、ニュースの物語とその態度を特定し、追跡する。本研究では, ニュース物語の経路と, 特定のエンティティに対するウェブサイトの姿勢が, ゆがんだプロパガンダネットワークの解明に有効であることを示す。分散ニュースエコシステムの可視性の向上が,プロパガンダや偽情報の報告や事実確認に役立つことを願っています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:37:44 GMT)
Adapting Beyond the Depth Limit: Counter Strategies in Large Imperfect Information Games [4.6]
オンラインプレイ中に、合理的な対戦相手に頑健なまま、既知のサブリレーショナルな対戦相手に適応する問題について検討する。既存の手法では、奥行き制限を超えた合理的なプレーを前提としており、相手の行動の極めて限られた部分しか適応できない。本稿では,行列値状態と呼ばれる戦略ポルフォリオ手法を用いて,深度限定探索を行うアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:04:27 GMT)
Relation U-Net [4.6]
推定された関係図間の差から、地絡のないテスト画像の信頼性スコアを推定することができる。 4つの公開データセットによる実験結果から,リレーショナルU-NetはバニラU-Netよりも精度が高いだけでなく,テスト画像上のセグメンテーション精度と線形に相関する信頼スコアを推定できることがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:37:18 GMT)
GOTLoc: General Outdoor Text-based Localization Using Scene Graph Retrieval with OpenStreetMap [4.5]
GOTLOCは,GPS信号が利用できない屋外環境でも動作可能な,ロバストな位置決め手法である。本手法は,テキスト記述と地図から生成されたシーングラフの比較を利用して,ロバストなローカライゼーションを実現する。提案手法は,ポイントクラウドマップに依存するアルゴリズムに匹敵する精度を実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:51:10 GMT)
Graph Counterfactual Explainable AI via Latent Space Traversal [4.3]
反実的な説明は、分配の代替入力の「アレスト」を見つけることによって予測を説明することを目的としている。本稿では, 識別可能なブラックボックスグラフ分類器に対して, 反実的説明を生成する手法を提案する。我々は3つのグラフデータセットに対するアプローチを実証的に検証し、我々のモデルはベースラインよりも一貫してハイパフォーマンスで堅牢であることを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:04:10 GMT)
Quantum State Transfer via a Multimode Resonator [4.3]
大規模フォールトトレラント超伝導量子計算は高速な量子通信を必要とする。チャネルの自由スペクトル範囲に匹敵する結合強度を用いた量子状態移動のための非マルコフ形式を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:10:55 GMT)
Clarify Confused Nodes via Separated Learning [4.3]
グラフニューラルネットワーク(GNN)は,グラフ指向タスクにおいて顕著な進歩を遂げている。実世界のグラフは、必ずある種の不均一なノードを含み、伝統的なGNNのホモフィリーな仮定に挑戦する。我々は,ノードのより信頼性の高い分離を容易にするため,Nighborhood Confusion(NC)と呼ばれる新しいメトリクスを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:53:54 GMT)
LAMS: LLM-Driven Automatic Mode Switching for Assistive Teleoperation [4.2]
LLM-Driven Automatic Mode Switching (LAMS)を導入し,タスクコンテキストに基づいて制御モードを自動的に切り替える手法を提案する。既存の方法とは異なり、LAMSは事前のタスクデモを必要とせず、ユーザー生成モードスイッチングの例を統合することで漸進的に改善する。我々は,LAMSが手動モードスイッチを効果的に減らし,代替手法よりも好まれることを示すとともに,時間とともにパフォーマンスの向上を図っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:49:08 GMT)
Image-to-Force Estimation for Soft Tissue Interaction in Robotic-Assisted Surgery Using Structured Light [4.2]
本文では, 軟組織にパターンをデザインしたOne-Shot構造光射影を用いた効果的な視覚ベーススキームを提案する。内視鏡ステレオカメラから撮像した画像を分析し、軟組織変形のために高解像度の3D点雲を再構成する。軟組織の複雑な力学特性を表現するため, 改良されたPointNetを用いた力推定法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:36:41 GMT)
Patch-aware Vector Quantized Codebook Learning for Unsupervised Visual Defect Detection [4.1]
産業応用においては、教師なしの視覚欠陥検出が重要である。教師なし欠陥検出に最適化された拡張VQ-VAEフレームワークを用いた新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:26:26 GMT)
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation [4.0]
本研究では,評価者の予測値に基づく下流結果のフィードバックが,グッドハートの法則力学を系統的に誘導することを示す。 RLHS(Reinforcement Learning from Hindsight Simulation)を導入し、まずまず、実証可能な結果をシミュレートし、次に、後見において真に有益である行動を評価するためにフィードバックを付与する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:33:15 GMT)
Investigating Parameter-Efficiency of Hybrid QuGANs Based on Geometric Properties of Generated Sea Route Graphs [3.9]
我々はQuGAN(Quarum-classical Hybrid Generative Adversarial Network)を用いて,輸送経路のグラフを人工的に生成する。我々は、QuGANと古典的生成逆ネットワーク(GAN)の比較を行う。以上の結果から,QuGANは基底となる幾何学的性質や分布を素早く学習し,表現できることが示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:08:05 GMT)
Compositional Automata Embeddings for Goal-Conditioned Reinforcement Learning [3.9]
決定論的有限オートマトン(cDFAs)の合成を用いた時間目標の表現法を提案する。提案手法は,様々なcDFAタスククラスに対してゼロショットの一般化を可能にするとともに,階層的手法のミオピックな部分最適化を伴わずに,ポリシーの特殊化を促進できることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:46:25 GMT)
Networked Agents in the Dark: Team Value Learning under Partial Observability [3.9]
ネットワークエージェントのための協調型マルチエージェント強化学習(MARL)手法を提案する。完全な状態情報や共同観測に依存する従来の手法とは対照的に、我々のエージェントは部分観測可能性の下で共有目的に到達する方法を学ぶ必要がある。トレーニング中、個々の報酬を収集し、ローカルコミュニケーションを通じてチームの価値関数を近似し、協調行動をもたらす。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:01:32 GMT)
Deep Distance Map Regression Network with Shape-aware Loss for Imbalanced Medical Image Segmentation [3.9]
既存のバイナリセグメンテーションネットワークと軽量回帰ネットワークを組み込んだ新しいセグメンテーションフレームワーク(LR-Net)を提案する。物体の完全な形状を推定するために,距離マップをペナルティマップとして利用することにより,形状認識損失を導出する。実験の結果,本手法は既存の最先端技術と同様に,他の分類手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:52:02 GMT)
Applying General Turn-taking Models to Conversational Human-Robot Interaction [3.9]
本稿では、一般的なターンテイクモデル、特にTurnGPTとVAP(Voice Activity Projection)を用いて、HRIにおける会話力学を改善する。本稿では,ロボットがいつ応答を準備し,交替し,潜在的割り込みを扱うべきかを予測するために,これらのモデルをタンデムで使用する手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:49:22 GMT)
Generative Medical Image Anonymization Based on Latent Code Projection and Optimization [3.8]
医用画像の匿名化問題を,潜時コード投影と最適化という2段階の解決策で解決する。プロジェクション段階では、入力画像を潜在空間に投影する合理化エンコーダを設計し、プロジェクションプロセスを強化するための協調学習方式を提案する。最適化段階において、医用画像専用のデータユーティリティとアイデンティティ保護のトレードオフに対応するために設計された2つの深い損失関数を用いて潜時コードを洗練する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:50:56 GMT)
FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction [3.8]
FlowDockは、非有界(アポ)構造をそれらの有界(ホロ)構造にマッピングすることを学ぶ最初の深部幾何学的生成モデルである。 FlowDockは、予測された構造的信頼度スコアと、生成したタンパク質-リガンド複合体構造とのアフィニティ値を提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:20:03 GMT)
Non-adiabatic linear response in open quantum systems [3.8]
我々は、非断熱線形応答理論をオープン量子多体系に一般化する。定常状態からの線形偏差は閉系と同様にメモリレスであることが分かる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:28:23 GMT)
A Misclassification Network-Based Method for Comparative Genomic Analysis [3.8]
メタデータに基づくゲノム配列の分類は、数十年間、比較ゲノム学において活発な研究領域であった。本研究では、AIとネットワークサイエンスのアプローチを統合し、比較ゲノム分析フレームワークを開発する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:50:44 GMT)
Knowledge Graph-based Retrieval-Augmented Generation for Schema Matching [3.8]
本稿では,大規模言語モデル(LLM)マッチングのための知識グラフに基づく検索型生成モデルを提案する。特に、KG-RAG4SMはベクトルベース、グラフベース、クエリベースのグラフ検索を導入している。 KG-RAG4SMは、MIMICデータセットの精度とF1スコアにおいて、最先端(SOTA)法を35.89%、30.50%で上回っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:32:37 GMT)
Experimental Study on The Effect of Multi-step Deep Reinforcement Learning in POMDPs [3.7]
本稿では, PPO, Twin Delayed Deep Deterministic Policy Gradient (TD3) と Soft Actor-Critic (SAC) の3つのDRLアルゴリズムについて考察する。 SACとTD3は一般的に、MPPとして表現できる幅広いタスクでPPOを上回っている。我々は、TD3とSACに複数ステップのブートストラップを組み込むことで、POMDP設定におけるロバスト性が向上することを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:45:12 GMT)
Anthropomorphic Features for On-Line Signatures [3.7]
本稿では,オンライン署名を効率的に記述するための特徴空間を提案する。サインを作成するには骨格の腕系とその関連筋が必要であるため、新しい特徴空間は、署名時の肩、肘、手首関節の動きを特徴付けるものである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:28:36 GMT)
Disentangling Exploration of Large Language Models by Optimal Exploitation [3.6]
大規模言語モデルが状態空間を探索できるかどうかを評価する。我々の実験は、ほとんどのモデルが状態空間を十分に探索するのに苦労していることを示している。モデルサイズと探索性能の正の相関を観察し,より大きなモデルで優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:30:29 GMT)
Learning Cross-Domain Representations for Transferable Drug Perturbations on Single-Cell Transcriptional Responses [3.6]
フェノタイプドラッグの発見は、生物活性分子を同定する可能性から、広く注目を集めている。本稿では,特徴分離と伝達可能な表現学習のための新しい生成フレームワークであるXTransferCDRを提案する。実験結果から,XTransferCDRは現在の最先端手法よりも優れた性能を示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:16:30 GMT)
Empowering Agricultural Insights: RiceLeafBD - A Novel Dataset and Optimal Model Selection for Rice Leaf Disease Diagnosis through Transfer Learning Technique [3.5]
世界の人口の半数以上に食糧を供給するため、米は最も重要な栽培作物の1つである。早期の病原体検出は、稲作の栽培において主要な困難である。このデータを用いて, イネの葉に影響を及ぼす病原体を正確に, 効果的に同定できることが実証された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:20:26 GMT)
HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location [3.3]
HyGenは、オンラインおよびオフラインワークロードの効率的なコロケーションを可能にする干渉対応LLMサービスシステムである。運用負荷評価の結果,HyGenのスループットは既存技術に比べて最大5.84倍向上した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:32:27 GMT)
Easing Seasickness through Attention Redirection with a Mindfulness-Based Brain--Computer Interface [3.3]
本研究は,脳-コンピュータインタフェース (BCI) を用いて, 現実の環境において, 船酔いの症状を軽減し, 注意を向けることを目的としている。本システムでは,1チャンネルのヘッドバンドを用いて前頭前脳波信号を捕捉し,マインドフルネス状態の評価のためにコンピュータ装置に無線で送信する。結果は、マインドフルネスのスコアや聴覚刺激としてリアルタイムでフィードバックされ、生理的不快感からマインドフルネスの実践へと注目が移る。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:06:29 GMT)
Development and Validation of the Provider Documentation Summarization Quality Instrument for Large Language Models [3.1]
The Provider Documentation Summarization Quality Instrument (PDSQI-9) was developed to evaluate LLM- generated clinical summaries。検証には、実体的妥当性のためのピアソン相関、因子分析、構造的妥当性のためのクロンバッハのαが含まれていた。 PDSQI-9は強い内部整合性と信頼性を示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:47:57 GMT)
Benchmarking Robustness of Contrastive Learning Models for Medical Image-Report Retrieval [3.0]
本研究では,CLIP,CXR-RePaiR,MedCLIP,CXR-CLIPの4つの最先端コントラスト学習モデルの堅牢性を評価する。以上の結果から,全ての評価モデルは分布外データに非常に敏感であることが判明した。これらの制限に対処することにより、医療応用のためのより信頼性の高いクロスドメイン検索モデルを構築することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:37:04 GMT)
Multi-View Transformers for Airway-To-Lung Ratio Inference on Cardiac CT Scans: The C4R Study [3.0]
重症COVID-19とSARS-CoV-2感染症(PASC)の急性後遺症との関連性を検討するため、心エコー画像からALRを推測する関心が高まっている。本研究では, 集束心磁図からFL ALR値を推定する新しいアテンションベースマルチビュースイム変換器を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:11:24 GMT)
CT-PatchTST: Channel-Time Patch Time-Series Transformer for Long-Term Renewable Energy Forecasting [3.0]
本研究では,高度深層学習モデルであるChannel-Time Patch Time-Series Transformer(CT-PatchTST)を開発し,評価する。年間オフショア風力、オンショア風力、デンマークからの太陽光発電データを用いて、太陽光発電と風力発電システムの発電を予測している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:35:39 GMT)
Temporal Reasoning in AI systems [3.0]
本稿では,サイック・ナレッジ・ベースにおいて,頑健な時間予測に必要な知識表現と推論手法について論じる。次に、与えられた流動を外挿するために、事実の持続性に関する知識を表す離散生存関数を使用する。外挿された区間は、時間的制約やその他のコモンセンス知識によって切り離される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:47:50 GMT)
Growth Patterns of Inference [3.0]
本研究では,地中事実の分布が探索空間における推論性能にどのように影響するかをモデル化する。実験により、一様探索空間はより大きいKBに適しているが、歪んだ次数分布を持つ探索空間は小さいKBではより良い性能を示すことが示された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:41:04 GMT)
A Coordination-based Approach for Focused Learning in Knowledge-Based Systems [3.0]
読解・機械読解システムによる学習の最近の進歩は、知識ベースシステムによる新たな事実の学習能力を大幅に向上させてきた。本稿では,これらの知識に基づくシステムに対して,Q/A性能の最大化につながる一連の学習要求を選択する問題について論じる。これらの学習システムに最適な事実群を選択することは協調ゲームと類似していることを示し、この問題を解決するために強化学習を用いる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:45:02 GMT)
PRIMO: Private Regression in Multiple Outcomes [2.9]
我々は、PRIMO(Private Regression in Multiple Outcomes)と呼ばれる新しいプライベートレグレッション設定を導入する。 PRIMOは、プライバシを保持しながら、データアナリストが$l$のレグレッションを実行したいという一般的な状況にインスパイアされている。理論が予測するよりもはるかに小さい$l$の値であっても、射影法は射影を使わない変種と比較して精度を向上させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:06:56 GMT)
Towards a performance characteristic curve for model evaluation: an application in information diffusion prediction [2.9]
拡散データのランダム性を定量化するために,情報エントロピーに基づくメトリクスを提案する。次に,モデルのランダム性と予測精度の間のスケーリングパターンを同定する。曲線の妥当性は、同じ家系の3つの予測モデルによって検証される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:14:07 GMT)
Optimizing compilation of error correction codes for 2xN quantum dot arrays and its NP-hardness [2.8]
ハードウェア固有のエラー訂正符号は、他の制約を尊重しながらフォールトトレランスを達成することができる。近年の進歩は、高い忠実度を持つ量子ドットアレイを通して電子とホールスピン量子ビットのシャットリングを実証している。我々は,最小限のシャットリング操作で動作させるために,安定化器エラー訂正符号のシンドローム抽出回路をコンパイルする一連の方法を開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:00 GMT)
Improving the Efficiency of Self-Supervised Adversarial Training through Latent Clustering-Based Selection [2.8]
逆向きの堅牢な学習は、トレーニングの例をはるかに多く求めていると広く認識されている。近年の研究では、モデルロバスト性を高めるために、外部または合成された未ラベルデータを用いた自己教師付き対人訓練が提案されている。そこで本稿では,SSATに不可欠なラベルなしデータの小さなサブセットを戦略的に選択し,ロバスト性を向上させる手法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:47:49 GMT)
Scalable Bayesian Physics-Informed Kolmogorov-Arnold Networks [2.7]
Kolmogorov-Arnoldネットワーク(KAN)は、パラメータが少ない代替ソリューションを提供する。そこで我々は,Chebyshev KansとTikhonovアンサンブルKalmanインバージョン(DTEKI)を併用した新しい手法を提案する。この勾配のない方法は、オーバーフィッティングを効果的に軽減し、数値安定性を高める。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:38:13 GMT)
SteLLA: A Structured Grading System Using LLMs with RAG [2.6]
本稿では,SteLLA (Structured Grading System Using LLMs with RAG) について述べる。受験生の回答を含む実世界のデータセットを大学レベルの生物学コースから収集した。実験により,本システムでは,人間の学級との相当な合意を達成でき,また,その問題で検討されたすべての知識点について,ブレークダウングレードとフィードバックを提供することができた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:24:48 GMT)
Let Network Decide What to Learn: Symbolic Music Understanding Model Based on Large-scale Adversarial Pre-training [2.6]
マスク言語モデル(MLM)は、自然言語処理(NLP)における人種差別差別のようなバイアス問題を導入するかもしれない本稿では,ランダムマスキングではなく,マスカネットワークを介してマスクすべきものを適応的に決定する,SMU用Adversarial-MidiBERTを提案する。提案手法は4つのSMUタスクにまたがって評価し,全てのケースにおいて優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:36:48 GMT)
Personality Modeling for Persuasion of Misinformation using AI Agent [2.6]
本研究はエージェント・ベース・モデリング・アプローチを用いて,性格特性と誤情報力学の関係について検討する。ビッグファイブの性格特性の異なる次元を具現化した6つのAIエージェントを用いて、6つの異なる誤情報トピック間の相互作用をシミュレートした。分析的・批判的な性格特性は,エビデンスに基づく議論において有効性を高めることが示唆された。非攻撃的説得戦略は誤報訂正の予期せぬ成功を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:04:21 GMT)
Multimodal-to-Text Prompt Engineering in Large Language Models Using Feature Embeddings for GNSS Interference Characterization [2.5]
大規模言語モデル(LLMs)は、NLP、情報検索、レコメンデーションシステムなど、さまざまな領域にまたがる高度なAIシステムである。干渉監視は道路上の車両の位置決めの信頼性を確保するために不可欠だ我々のパイプラインは干渉分類タスクにおいて最先端の機械学習モデルより優れています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:46:44 GMT)
Information Entropy Invariance: Enhancing Length Extrapolation in Attention Mechanisms [2.4]
長さ外挿量を高めるために,2つの新しいスケール温度を導入する。まず、InfoScaleはドット製品に注意を向ける訓練不要の手法である。第2に,スケーリング(CosScale)がコサイン注意に与える影響を理論的に分析する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:32:41 GMT)
Unmasking the Imposters: How Censorship and Domain Adaptation Affect the Detection of Machine-Generated Tweets [2.4]
4つの著名な大規模言語モデル(LLM)の生成能力を調べるために,9つのTwitterデータセットを作成する手法を提案する。これらのデータセットは、3つのオープンソースLCMの7Bおよび8Bパラメータベースインストラクションモデルを含む、検閲されていない4つの5つのモデル構成を含んでいる。評価の結果,「アンセンソルド」モデルが自動検出手法の有効性を著しく損なうことが明らかとなった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:20:15 GMT)
Software Testing for Extended Reality Applications: A Systematic Mapping Study [2.3]
拡張現実性(XR)は、多様なアプリケーションドメインにまたがる新興技術であり、没入的なユーザエクスペリエンスを提供する。本稿では,XRアプリケーションのソフトウェアテストに関する最初の体系的マッピング研究について述べる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:19:12 GMT)
TCMM: Token Constraint and Multi-Scale Memory Bank of Contrastive Learning for Unsupervised Person Re-identification [2.3]
本稿では,ViTアーキテクチャに対するパッチノイズによる損傷を軽減するために,ViT Token Constraintを提案する。提案されたマルチスケールメモリは、外れ値サンプルの探索を強化し、機能の一貫性を維持する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:14:02 GMT)
Towards Federated Multi-Armed Bandit Learning for Content Dissemination using Swarm of UAVs [2.3]
提案アーキテクチャは,固定型アンカーUAVと移動型マイクロUAVのハイブリッドネットワークをユビキタスコンテンツの普及に活用する。コンテンツ可用性を最大化するために最適なキャッシュポリシを動的に学習するコンテンツ拡散システムの開発に重点を置いている。選択キャッシングアルゴリズムも導入され、UAV間の情報共有を組み込むことで冗長なコンテンツの複製を減らすことができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:55:13 GMT)
Top-k Multi-Armed Bandit Learning for Content Dissemination in Swarms of Micro-UAVs [2.3]
本稿では,通信インフラが一般に侵害されている災害シナリオを対象とした,UAV(Micro-Unmanned Aerial Vehicle)によるコンテンツ管理システムを提案する。開発アーキテクチャでは、垂直および横方向のリンクを備えた固定型アンカーUAVが、個別の災害影響のあるコミュニティで利用者にサービスを提供する。移動式マイクロフェリーUAVは、移動性を高め、複数のコミュニティでカバー範囲を広げている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:09:22 GMT)
Digital Phenotyping for Adolescent Mental Health: A Feasibility Study Employing Machine Learning to Predict Mental Health Risk From Active and Passive Smartphone Data [2.2]
本研究は,非クリニカル青年期の精神障害を予測するために,アクティブおよびパッシブスマートフォンデータを統合する可能性について検討した。我々はMindcraftアプリを用いて、内因性障害、摂食障害、不眠症、自殺思考のリスクを予測する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:05:49 GMT)
An analysis of data variation and bias in image-based dermatological datasets for machine learning classification [2.2]
臨床皮膚学では、分類モデルはRGB画像のみを入力として、患者の皮膚の悪性病変を検出することができる。学習に基づくほとんどの手法では、トレーニングにおいて皮膚科のデータセットから取得したデータを用いており、これは金の基準によって大きく検証されている。本研究の目的は,皮膚内視鏡検査と臨床検査のギャップを評価し,データセットの変動がトレーニングに与える影響を理解することである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:18:46 GMT)
Unified Few-shot Crack Segmentation and its Precise 3D Automatic Measurement in Concrete Structures [2.2]
本研究では, 2次元(2次元)き裂検出, 3次元再構築, 3次元自動き裂計測のためのフレームワークを提案する。そこで我々は,不慣れなシナリオにまたがって強力な一般化を図り,正確な2次元き裂マスクの生成を可能にするき裂分割法を開発した。画像とLiDAR-SLAMの両方を活用することで、高密度で彩色された点雲を生成するマルチフレームおよびマルチモーダル融合フレームワークを開発した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:36:05 GMT)
Decompose-ToM: Enhancing Theory of Mind Reasoning in Large Language Models through Simulation and Task Decomposition [2.1]
心の理論 (Theory of Mind, ToM) は、他者の精神状態を理解し、反映する能力である。大規模言語モデル(LLM)は、ToMの初歩的な理解しか持たない。本稿では,複雑なToMタスクにおけるモデル性能を改善するLLMベースの推論アルゴリズムであるDecompose-ToM'を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:44:01 GMT)
Non-Hermitian Skin Effect in Periodically-Driven Dissipative Ultracold Atoms [2.1]
非エルミートスキン効果(英: non-Hermitian skin effect、NHSE)は、非エルミート物理学における最も顕著な性質の1つである。周期的に駆動される超低温原子による1次元光学格子中のNHSEを、停滞した原子損失の存在下で研究する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:30:38 GMT)
Towards Multilingual LLM Evaluation for Baltic and Nordic languages: A study on Lithuanian History [2.1]
GPT-4oは言語グループ全体で他のモデルよりも一貫して優れていた。 QWEN2.5 72bのような大規模なオープンソースモデルはよく機能したが、バルト語との整合性は弱かった。より小さなモデルは、北欧や他の言語でより優れた性能を保ちながら、バルト語とのLT関連アライメントとのギャップを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:14:09 GMT)
The Veln(ia)s is in the Details: Evaluating LLM Judgment on Latvian and Lithuanian Short Answer Matching [2.1]
ラトビア語502組とリトアニア語690組からなる新しいデータセットを導入する。各問合せ対について,一組の修正規則を用いて一致解と非一致解を生成した。これらの回答は、LLMが元の回答のマッチングの微妙な違いを検出する能力を評価するためのテストケースとして機能する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:30:03 GMT)
Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.1]
本稿では,低次元物理モデル学習のための合理化手法を提案する。各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:44:41 GMT)
Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems [2.0]
Click-Calibは、オフラインSVS外部キャリブレーションのためのパターンなしのアプローチである。他のオフラインキャリブレーションアプローチとは異なり、Click-Calib最適化カメラは再投射距離誤差を最小限に抑えて広い範囲でポーズする。社内データセットとパブリックなWoodScapeデータセットの評価は,ベースライン手法と比較して精度と堅牢性に優れていた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:29:56 GMT)
SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation [1.9]
テキスト・トゥ・イメージのような生成AIモデルは、セグメンテーションマスクのような空間アノテーションを取り入れることで、データの不足を軽減することができる。本研究は,同時画像とマスク生成のための新しいタスクと手法であるSimGenを紹介する。 SimGenはDDPMフレームワークとResidual U-Netに基づく拡散モデルであり、高忠実度手術画像とそれに対応するセグメンテーションマスクを共同で生成するように設計されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:48:38 GMT)
A Vessel Bifurcation Landmark Pair Dataset for Abdominal CT Deformable Image Registration (DIR) Validation [1.9]
変形可能な画像登録(DIR)は多くの診断および治療タスクにおいて実現可能な技術である。このデータセットは腹部DIR検証のための第一種である。ランドマークペアの数、精度、分布により、現在利用可能なもの以上の精度でDIRアルゴリズムの堅牢な検証が可能になる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:28:47 GMT)
Projection Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning [1.9]
Implicit Q-Learning (IQL)アルゴリズムは、サンプル内学習を実現するために期待できる回帰を採用する。本稿では,プロジェクティブIQLアルゴリズムであるProj-IQLを提案する。 Proj-IQLはD4RLベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:17:02 GMT)
Data-driven inventory management for new products: A warm-start and adjusted Dyna-$Q$ approach [1.8]
本稿では,新発売商品の在庫管理を行うための新しい強化学習アルゴリズムを提案する。調整済みのDyna-$Q$は、Q$ラーニングと比較して平均的な日価を23.7%削減する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:48:33 GMT)
Dynamic Portfolio Optimization via Augmented DDPG with Quantum Price Levels-Based Trading Strategy [1.8]
DDPG(Deep Deterministic Policy Gradient)に基づくモデル固有の構造を改良し,拡張DDPGモデルを提案した。本モデルでは, DPO問題において, ベースラインモデルと比較して, リスク管理能力が向上し, サンプルの複雑さが低下する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:37:28 GMT)
High-frequency readout free from transmon multi-excitation resonances [1.7]
超伝導量子コンピュータでは、量子ビット状態の測定は最低忠実度演算のままである。その結果,トランスモンの周波数から読み出し周波数を強く劣化させることで,急激な多重励起共鳴の強度が指数関数的に抑制されることが判明した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:27:00 GMT)
A Bioplausible Model for the Expanding Hole Illusion: Insights into Retinal Processing and Illusory Motion [1.7]
拡張ホールイリュージョンは、脳が視覚情報をどう処理するかについての理解に挑戦する。近年の心理学的な研究により、この錯覚は知覚効果だけでなく、瞳孔拡張などの生理的反応も引き起こすことが明らかになっている。本稿では,早期網膜処理をシミュレートするために,ガウスフィルタ(DoG)の差分と古典受容場(CRF)の実装に基づく計算モデルを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:03:44 GMT)
Neuromorphic Retina: An FPGA-based Emulator [1.6]
我々はFPGA上でニューロモルフィック網膜モデルをエミュレートしている。ファシック細胞とトニック細胞は、最も単純な方法で網膜で実現可能である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:45:45 GMT)
Detecting Vulnerabilities in Encrypted Software Code while Ensuring Code Privacy [1.6]
テスト会社は、コードのプライバシが保存されている間、ソフトウェア企業が提供する暗号化されたソフトウェアコード上でコード解析タスクを実行することができる。このアプローチは静的コード解析と検索可能な対称暗号化を組み合わせたものだ。インデックスは、秘密の方法で静的解析タスクを実行することで脆弱性を発見するために使用される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:39:50 GMT)
Adaptive Noise-Tolerant Network for Image Segmentation [1.6]
そこで本研究では,非完全・ノイズセグメンテーションとオフザシェルフセグメンテーションアルゴリズムを組み合わせることで,適応型ノイズ耐性ネットワーク(ANTN)モデルにより,より優れたセグメンテーション結果が得られるかどうかを考察する。 1)複数のノイズラベルを1つのディープラーニングモデルに統合できる,(2)確率的パラメータを含む雑音分割モデリングは、与えられたテスト画像の外観に応じて適応する,という2つの新しい側面で、ノイズラベルのディープラーニングを画像セグメンテーションに拡張する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:54:54 GMT)
DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains [1.5]
DeDiNATはDilated Neighborhood Attentionに基づくデブロアリングトランスフォーマーである。チャンネル横断学習者は、隣接するチャンネル間の短距離関係を理解するためにトランスフォーマーブロックを支援する。最先端モデルと比較して、コンパクトなDeDiNATはより優れた一般化能力を示し、知覚的メトリクスにおいて顕著な性能を達成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:45:15 GMT)
Semantic Security with Infinite Dimensional Quantum Eavesdropping Channel [1.5]
本稿では,ワイヤタップチャネルの直接符号化定理の証明法を提案する。この方法はブロック長の増加とともに指数関数的に減衰する誤差を生じる。セマンティックセキュリティの量子バージョンを保証する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:52:42 GMT)
Formal Model Guided Conformance Testing for Blockchains [1.5]
本稿では,プロトコルの形式モデルと決定論的シミュレータ内で動作する実装を用いて,プロトコル適合性テストを行うフレームワークを提案する。私たちのフレームワークは、トレースジェネレータとチェッカーとしてコンポーネントを使用する2つの補完的なコンポーネントで構成されています。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:20:13 GMT)
Adapting Whisper for Regional Dialects: Enhancing Public Services for Vulnerable Populations in the United Kingdom [1.5]
本研究では、バイアス付きASRモデルが公共サービスにおける誤通信につながる現実世界の問題に対処する。まず,ベースラインデータセットとデータを用いたWhisper大容量v3モデルのアウト・オブ・ボックス性能について検討する。次に、微調整されたWhisperが2つの英国地域でのパフォーマンスに与える影響について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:39:21 GMT)
Structural damage detection via hierarchical damage information with volumetric assessment [1.4]
構造的健康モニタリング(SHM)は、インフラの安全性と寿命を確保するために不可欠である。本稿では,これらの課題に対処するためのフレームワークであるGuided-DetNetについて紹介する。 Guided-DetNetの特徴は、GAM(Generative Attention Module)、階層的除去アルゴリズム(Hierarchical Elimination Algorithm)、VCVA(Volumetric Contour Visual Assessment)である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:53:29 GMT)
Exploring the Efficacy of Meta-Learning: Unveiling Superior Data Diversity Utilization of MAML Over Pre-training [1.4]
データセットの多様性が視覚モデルの性能に影響を及ぼすことを示す。本研究は,テストセットの精度とデータの多様性との間に正の相関関係を示す。これらの結果は我々の仮説を支持し、形式的なデータの多様性がモデルの性能にどのように影響するかをより深く探究するための有望な方法を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:56:59 GMT)
AI-RAN: Transforming RAN with AI-driven Computing Infrastructure [1.4]
この記事では、同じインフラストラクチャ上でRANとAI(AI)ワークロードを統合するAI-RANを紹介します。これにより、AI-RANは将来のネットワークの性能要求を満たすだけでなく、資産利用も改善する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:47:05 GMT)
Optimal Federated Learning for Functional Mean Estimation under Heterogeneous Privacy Constraints [1.4]
Federated Learning(FL)は、データのプライバシとセキュリティを保護するために設計された分散機械学習技術である。本稿では,フェデレーション環境での離散サンプリングデータからの最適関数平均推定の問題に対処する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:07:15 GMT)
Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production [1.3]
本研究では,自動車生産環境における人工知能適用の有効性について検討した。データ構造は、コンテキストの特徴を識別するために分析され、ワンホット符号化を使用して前処理される。この研究は、高度に可変された生産データにAIメソッドを効果的に適用し、ビジネス価値を付加できることを実証している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:01:15 GMT)
Kolmogorov-Arnold Networks for Time Series Granger Causality Inference [1.3]
我々はGranger Causality Kolmogorov-Arnold Networks (GCKAN)を紹介し、これは最近提案されたKolmogorov-Arnold Networks (KAN)を拡張した革新的なアーキテクチャである。 GCKANは、時系列からGranger因果関係を推論し、自動時間ラグ選択を可能にする。また,時間逆グレンジャー因果関係を利用して推論精度を向上させるアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:09:07 GMT)
AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning [1.3]
本稿では、自動カリキュラム学習と視覚SLAMシステムのための効率的な微調整を組み合わせた新しいアプローチであるAutoLoopを提案する。本手法では, DDPG (Deep Deterministic Policy Gradient) エージェントを用いて, トレーニング中のループ閉鎖重量を動的に調整する。 TartanAirでトレーニングを行い、KITTI、EuRoC、ICL-NUIM、TUM RGB-Dを含む複数のベンチマークで検証した結果、AutoLoopは同等または優れたパフォーマンスを達成できた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:22:09 GMT)
A Framework for Mining Collectively-Behaving Bots in MMORPGs [1.3]
MMORPG(Massively Multiplayer Online Role-Playing Games)では、異常プレイヤー(ボット)が一般的に見られる。トラジェクティブ表現学習とクラスタリングを組み合わせたフレームワークBotTRepを開発した。本モデルは,ゲーム内トラジェクトリシーケンスの表現を学習し,文脈的に類似したトラジェクトリを持つプレイヤーがより密接な埋め込みを実現することを目的としている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:11:26 GMT)
Quantum Reservoir Computing and Risk Bounds [1.2]
2つの特定の量子貯水池クラスに対して、特定のパラメータ依存境界を与える。読み出し関数を持つクラスに結果を適用すると、リスク境界はトレーニングサンプルの数に収束する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:06:03 GMT)
Inferring Transition Dynamics from Value Functions [1.2]
強化学習では、値関数は通常ベルマン方程式を解くために訓練される。収束値関数は環境の基盤となる力学のモデルを符号化する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:47 GMT)
CrystalGRW: Generative Modeling of Crystal Structures with Targeted Properties via Geodesic Random Walks [1.2]
本稿では,密度汎関数理論で検証された安定位相を予測できる拡散モデルであるCrystalGRWを紹介する。 CrystalGRWは、既存のモデルに匹敵する精度で基底状態に近い現実的な結晶構造を生成する能力を示す。これらの特徴は、安定で対称性に富んだ結晶候補を実験的に検証することで、材料発見と逆設計を加速する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:26:35 GMT)
Analyzing the Ethical Logic of Six Large Language Models [1.1]
本研究では,OpenAI GPT-4o, Meta LLaMA 3.1, Perplexity, Anthropic Claude 3.5 Sonnet, Google Gemini, Mistral 7Bの6つの著名な生成言語モデルの倫理的理由について検討した。発見によると、LLMは、合理主義的、連帯主義的な強調が特徴で、しばしば害と公正を優先する決定を伴う、ほぼ収束した倫理論理を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:56:26 GMT)
GRAPPA - A Hybrid Graph Neural Network for Predicting Pure Component Vapor Pressures [1.1]
我々は,純粋な成分の蒸気圧を予測するハイブリッドグラフニューラルネットワークGRAPPAを開発した。モデルは、メッセージパッシングステップ用のグラフアテンションネットワーク、長距離インタラクションをキャプチャするプール機能、予測ヘッドの3つの部分から構成される。約25,000個の純成分の蒸気圧データを用いてGRAPPAを訓練・評価した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:11:38 GMT)
Pseudolabel guided pixels contrast for domain adaptive semantic segmentation [1.0]
セマンティックセグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付き仮想データを使用してモデルをトレーニングし、ラベルなしで実際のデータに適応するテクニックである。近年のいくつかの研究は、このテクニックを支援するために、自己教師付き学習の強力な方法であるコントラスト学習を使用している。 Pseudo-label Guided Pixel Contrast (PGPC) と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:25:25 GMT)
Contextual Evaluation of Large Language Models for Classifying Tropical and Infectious Diseases [1.0]
我々は、オープンソースの熱帯感染症(TRIND)データセットを構築し、11000以上のプロンプトを産出する人口統計学的、意味論的、消費者的増強を含むように拡張した。一般のLSMと医学のLSMと、LSMの結果を人間の専門家と比較し、LSMのパフォーマンスを評価した。本研究では, TRINDs-LMのプロトタイプを開発し, LLMが健康にどのような影響を及ぼすかを知るための遊び場を提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:52:52 GMT)
Polyp detection in colonoscopy images using YOLOv11 [1.0]
ディープラーニングモデルは、小さな特徴の一般化と学習の優位性により、ポリープ検出においてより有効であることが示されている。 YOLOはポリプ検出に成功している単一ステージモデルの1つである。本研究の目的は,最近リリースされたYOLOv11がポリプの検出に有効であることを確かめることである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:40:13 GMT)
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG [0.8]
大規模言語モデル(LLM)は、人間のようなテキスト生成や自然言語理解を可能にすることによって、人工知能(AI)に革命をもたらした。 Retrieval Augmented Generation (RAG) がソリューションとして登場し、リアルタイムデータ検索を統合して文脈に関連のある応答を提供することでLLMを強化している。 Agentic Retrieval-Augmented Generation (RAG)は、自律的なAIエージェントをRAGパイプラインに埋め込むことによって、これらの制限を超越する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:40:25 GMT)
RoHan: Robust Hand Detection in Operation Room [0.8]
露伴(ろはん)は手術室における手探りの新しい手法である。ハンドウェア用手袋の合成画像を用いて,一般公開されているハンドデータセットを増強する手法であるArtificial Glovesを用いている。術中切開再建術と静脈グラフト採取術の2つのデータセットを用いて本法の評価を行った。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:05:39 GMT)
PAC Learnability of Scenario Decision-Making Algorithms: Necessary and Sufficient Conditions [0.8]
PACは、未知の安全制約に違反するリスクが任意に低い決定を下す能力である。シナリオ決定アルゴリズムがPACとなるための十分な条件が文献で提供されている。シナリオ決定アルゴリズムに必要な条件は,VC次元といわゆるフリーランチ定理にインスパイアされたPACである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:57:13 GMT)
Improved Compression Bounds for Scenario Decision Making [0.8]
我々は、不確実性のサンプルを描画し、そのサンプルに基づいて意思決定を行うことにより、不確実な環境での意思決定方法を示す。確率保証は、障害のリスクが与えられた最大許容値を超える決定につながるシナリオの集合をサンプリングする確率に縛られる。我々は,問題に対するより強い仮定を必要とせず,既存の問題を改善する新たな限界を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:53:34 GMT)
$\texttt{InfoHier}$: Hierarchical Information Extraction via Encoding and Embedding [0.7]
$texttInfoHier$は、堅牢な潜在表現と階層構造を学ぶためのフレームワークである。適応的な表現を提供し、HCの複雑なパターンをキャプチャする能力を高める。 HCロスを統合してSSLトレーニングを洗練し、基盤となる情報階層に調整された表現をもたらす。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:58:32 GMT)
Increasing Batch Size Improves Convergence of Stochastic Gradient Descent with Momentum [0.7]
運動量による勾配降下(SGDM)は理論と実践の両方でよく研究されている。学習速度と運動量重みが一定であるミニバッチSGDMに着目した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:53:27 GMT)
Self-Organizing Edge Computing Distribution Framework for Visual SLAM [0.7]
本稿では,デバイスネットワーク上で完全に分散されたSLAM実行を自己組織化できる新しいエッジ支援SLAMフレームワークを提案する。アーキテクチャは3つのレイヤで構成されており、デバイスに依存しず、ネットワーク障害に対して回復力があり、コアSLAMシステムに最小限の侵入力を持つように設計されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:24:15 GMT)
Entanglement-based quantum digital signatures over deployed campus network [0.6]
量子デジタル署名プロトコルの大きな利点は、情報理論のセキュリティを持つことができることである。我々のキャンパスネットワーク上で、絡み合いに基づく量子デジタルシグネチャを実装するハードウェアを実演し、特徴付けする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:41:45 GMT)
Approximation properties relative to continuous scale space for hybrid discretizations of Gaussian derivative operators [0.5]
本稿ではガウス微分に対する2つのハイブリッド離散化法の特性について解析する。これらの離散化手法を研究する動機は、異なる順序の複数の空間微分が同じスケールレベルで必要である場合、より効率的に計算できることである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:37:21 GMT)
More resourceful states improve quantum channel discrimination [0.5]
凸でない状態の任意の資源理論において、最大平均成功確率が向上する程度は、ロバストネス測度によって正確に定量化できることを示す。また, 補助システムを用いたチャネル識別問題の改善を, 頑健性測定によって定量化できることを実証した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:46:09 GMT)
Advance Sharing Procedures for the Ramp Quantum Secret Sharing Schemes With the Highest Coding Rate [0.5]
いくつかの量子シークレット共有スキームでは、ディーラーに秘密が渡される前に一部のシェアを参加者に分配することができる。我々は、これらのスキームに秘密が与えられる前に、いくつかの株式を分配する手続きを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 01:06:38 GMT)
Vision Foundation Models for Computed Tomography [0.5]
基礎モデル(FM)は、画像のモダリティを越えて多種多様な複雑なタスクを実行することにより、放射線学における変換可能性を示している。そこで我々はCT-FM(CT-FM)を開発した。 CT-FMは画像データコモンズから148,000個のCTスキャンを用いてラベルに依存しないコントラスト学習によって事前訓練を行った。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:30:58 GMT)
Silent Abandonment in Text-Based Contact Centers: Identifying, Quantifying, and Mitigating its Operational Impacts [0.5]
17社にまたがる顧客の3%から70%が黙秘している。ある研究では、放棄された顧客の71.3%が黙って、エージェント効率を3.2%、システム容量を15.3%削減した。我々は,無声放棄行動の疑いやサービス設計の変更を予測し,無声放棄の影響を運用的に緩和する戦略を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:38:56 GMT)
Supersolidity in Rydberg tweezer arrays [0.4]
Rydberg tweezer アレイは、双極子 XY または van-der-Waals Ising ZZ 相互作用で量子磁石を探索するための汎用的なプラットフォームを提供する。本稿では,2つのRydberg状態間の双極子相互作用とファンダーワール相互作用を組み合わせたスキームを提案する。反発相互作用を持つ三角格子上では、粒子あたりの臨界エントロピーを持つ頑健な超固体相の存在を予測する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:30:06 GMT)
Multi-visual modality micro drone-based structural damage detection [0.3]
DetectorXは、マイクロドローンと組み合わせた構造損傷検出のための堅牢なフレームワークである。幹ブロックは2つのディープ畳み込みニューラルネットワーク(DCNN)モデルの出力を活用することで動的視覚的モダリティを導入する。オンライン画像拡張手法であるスパイラルプール技術は,特徴表現の増大によってフレームワークを強化している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:03:27 GMT)
Evaluating GenAI for Simplifying Texts for Education: Improving Accuracy and Consistency for Enhanced Readability [0.3]
生成的人工知能(GenAI)は、パーソナライズされた学習を支援するツールとして、非常に有望である。大きな言語モデル(LLM)は、このニーズを満たす可能性を示しているが、以前の研究では、現在のアプローチで複数の欠点が指摘されている。本研究では,LLM,プロンプト技術,新しいマルチエージェントアーキテクチャを用いた精度と一貫性の体系的評価のための一般化されたアプローチとメトリクスを導入した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:19:01 GMT)
Learning Hemodynamic Scalar Fields on Coronary Artery Meshes: A Benchmark of Geometric Deep Learning Models [0.3]
本研究は、冠状動脈のvFFR領域をCFDサロゲートとして予測するための様々なバックエンドを実験的に分析する。トランスフォーマーベースのバックエンドは、圧力とvFFRフィールドを予測する場合、他のバックエンドよりも優れていた。圧力降下は、圧力関連分野を学習するための最適ネットワーク出力として同定された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:52:40 GMT)
Computing Approximated Fixpoints via Dampened Mann Iteration [0.3]
正確には知られていないが、それらに収束する近似関数列で表される関数の最小固定点を近似する方法を示す。この結果は,確率的誤差境界で関心関数を近似できるシステムに対して,最小の固定点にほぼ確実に反復することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:52:21 GMT)
Mantis Shrimp: Exploring Photometric Band Utilization in Computer Vision Networks for Photometric Redshift Estimation [0.3]
我々は、紫外光(GALEX)、光(PanSTARRS)、赤外線(UnWISE)画像を融合した測光赤方偏移推定モデルを提案する。 Mantis Shrimpは、カットアウト画像を用いた赤方偏移の条件密度推定を推定する。我々は、モデルがバンド間で情報を使用する方法を学び、我々のモデルがすべての調査から情報をうまく取り入れた証拠を見つける。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:46:23 GMT)
Addressing Intersectionality, Explainability, and Ethics in AI-Driven Diagnostics: A Rebuttal and Call for Transdiciplinary Action [0.3]
人工知能の医療診断への統合の増大は、その倫理的および実践的な意味を批判的に検証する必要がある。本稿は、AIによる診断が多様な人口に公平かつ倫理的に役立っていることを保証するために、正確さと公正性、プライバシ、傾きのバランスをとるフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:00:01 GMT)
Improving Pain Classification using Spatio-Temporal Deep Learning Approaches with Facial Expressions [0.3]
痛み管理と重症度検出は効果的な治療に不可欠である。伝統的な自己申告法は主観的であり、非言語的個人には適さない。表情を用いた痛みの自動検出について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:39:03 GMT)
Emergence of a second law of thermodynamics in isolated quantum systems [0.2]
熱力学の第2法則は、孤立系のエントロピーは時間とともにしか増加しないと述べている。これは、Schr"odinger方程式の下で孤立量子系の可逆進化と矛盾しているように見える。与えられた可観測性に関するエントロピーは、系のユニタリ進化の過程でその平衡値に傾向を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:34:21 GMT)
Towards Precision Spectroscopy of Antiprotonic Atoms for Probing Strong-field QED [0.2]
PAXは、反プロトン性原子の高精度X線分光を行い、強磁場量子電磁力学(QED)効果をテストすることを目的としている。ガス標的は反陽子原子の生成に使われます円形のRydberg状態間の遷移の測定は、最大2桁の精度で行う。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:03:23 GMT)
Error Crafting in Mixed Quantum Gate Synthesis [0.2]
任意の単一量子ユニタリの残差をパウリとし、誤差を非分極化する。特にパウリ回転ゲートの場合、工法により残留誤差を立方次まで抑えることができる。我々の研究は、エラー対策を編成する量子回路設計とアーキテクチャの新たな道を開く。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:52:22 GMT)
Mask-guided cross-image attention for zero-shot in-silico histopathologic image generation with a diffusion model [0.1]
拡散モデルは、シリコン内画像を生成する最先端のソリューションである。自然画像の出現伝達拡散モデルが設計されている。計算病理学、特に腫瘍学では、画像内のどのオブジェクトを前景と背景に分類すべきかを簡単に定義することはできない。我々は,クラス固有のAdaIN特徴量マッチングを交互に行うために,外観伝達指導を変更することで,拡散安定画像への外観伝達モデルの適用性に寄与する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:51:19 GMT)
Experimental distributed quantum sensing in a noisy environment [0.1]
我々は、トラップイオンセンサーを用いて、関連するセンシングプロトコルを実験的に実証した。多次元センサの絡み合った状態が生成され、信号を分離し、最適に検出する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:42:55 GMT)
A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series [0.0]
現在の公開データセットは小さすぎるため、多様ではない。我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。トレーニングとテストサブセットが汚染された、クリーンなバージョンで提供されるように、データセットのさまざまなバージョンを利用可能にしています。予想通り、ベースライン実験では、データセットの半教師付きバージョンでトレーニングされたアプローチが、教師なしバージョンよりも優れていた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:16:22 GMT)
disco: Distributional Synthetic Controls [0.0]
我々は,Gunsilius (2023)で導入された分散合成制御方式を実装した新しいディスココマンドを導入する。このパッケージは、QuantileベースのアプローチとCDFベースのアプローチの両方、ブートストラップと置換メソッドによる包括的な推論手順、可視化機能を提供している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:40:02 GMT)
Watermarking in Diffusion Model: Gaussian Shading with Exact Diffusion Inversion via Coupled Transformations (EDICT) [0.0]
本稿では,ガウスシェーディングの性能向上のための新しい手法を提案する。本稿では,EDICTの正確な逆写像を導出する能力を活用して,このプロセスを洗練することを提案する。提案手法は, 透かしを注入した消音剤を複製し, 相反的, 交互な消音・消音方式を採用する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:04:18 GMT)
Volterra Accentuated Non-Linear Dynamical Admittance (VANYA) to model Deforestation: An Exemplification from the Amazon Rainforest [0.0]
アルゴリズム学習は神経科学、遺伝学、人間とコンピュータの相互作用といった先進的な分野を持っている。本稿では,プレデター・プレイ・ダイナミクスを取り入れたVANYAモデルを用いて森林の損失をモデル化することに焦点を当てる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:12:04 GMT)
Visual WetlandBirds Dataset: Bird Species Identification and Behavior Recognition in Videos [0.0]
本研究では,鳥の行動検出と種分類に特化して設計されたビデオデータセットについて紹介する。提案したデータセットは、スペインの湿地で記録された178のビデオで構成され、13の異なる鳥種が7つの異なる行動クラスを実行している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:34:20 GMT)
ViBidirectionMT-Eval: Machine Translation for Vietnamese-Chinese and Vietnamese-Lao language pair [0.0]
本稿では,VLSP 2022-2023 機械翻訳共有タスクの結果について述べる。この課題はベトナム語と音声処理に関する第9回年次ワークショップの一環として組織された。共通作業の目的は機械翻訳システムの構築であり、特にベトナム・中国・ベトナム・ラオスの翻訳を対象としていた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:40:26 GMT)
VCRScore: Image captioning metric based on V\&L Transformers, CLIP, and precision-recall [0.0]
本研究では,画像キャプション問題に対する新しい評価基準を提案する。人間のラベル付きデータセットを生成して、キャプションが画像の内容とどの程度相関しているかを評価する。優れた結果も見出され、興味深い洞察が提示され、議論された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:14:36 GMT)
Unconditional stability of a recurrent neural circuit implementing divisive normalization [0.0]
任意次元ORGaNICs回路における非条件局所安定性の顕著な特性を証明した。 ORGaNICsは、勾配のクリッピング/スケーリングなしで、時間経過によるバックプロパゲーションによって訓練できることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:42:42 GMT)
Tunable anharmonicity in cavity optomechanics in the unresolved sideband regime [0.0]
機械的アンハーモニック性によって残される測定可能なシグネチャを予測する理論を提案する。特に,機械的変位スペクトルを解析的,数値的に取得し,空洞光場における機械的不調和のインプリントを探索する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:21:21 GMT)
Tripartite multiphoton Jaynes-Cummings model: Analytical solution and Wigner nonclassicalities [0.0]
非線形多光子Jaynes-Cummings相互作用を用いた三部晶純初期状態の時間的進化を解析的に追跡する。我々は、高光子数状態に対する初期値の大幅な向上を実現した。多光子過程によって導入された追加の非線形性は、光子数状態の初期非古典性を上回る重要な役割を果たす。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:20:02 GMT)
Towards Foundation Models: Evaluation of Geoscience Artificial Intelligence with Uncertainty [0.0]
Geoscience Foundation Model(FM)は、ワークフロー内で複数のタスクを達成またはワークフローを完全に置き換えることを約束する。我々は,パフォーマンスの不確実性,学習効率,重なり合うトレーニングテストデータなどを共同で組み込んだ評価フレームワークを設計する。我々のフレームワークは,トレーニングデータの様々な予算で,モデルの性能を明示的に分析することによって,実践者が自身の問題に対して最適なモデルを選択し,パフォーマンスの期待値を設定するのに役立ちます。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:45:51 GMT)
Towards Fast, Specialized Machine Learning Force Fields: Distilling Foundation Models via Energy Hessians [0.0]
本稿では,MLFF基礎モデルから化学空間の特定の領域に特化して,より小さく,より高速なMLFFへの汎用表現の転送手法を提案する。私たちの専門的なMLFFは、オリジナルの基礎モデルよりも最大20ドル高速で、そして場合によっては、その性能と未蒸留モデルよりも高速です。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:50:52 GMT)
Topological Bardeen-Cooper-Schrieffer theory of superconducting quantum rings [0.0]
数ナノメートルのスケールでは、実験的に実現可能な量子環は3Dナノ構造である。量子環のフェルミ海のトポロジーに関する理論は存在せず、ナノリングにおける超伝導の顕微鏡理論も欠落している。我々は,電子状態の非自明な孔ポケットを量子閉じ込めによって禁止するフェルミ海面とフェルミ表面のトポロジーの数学的モデルを開発する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:04:31 GMT)
Thermodynamics of the Page curve in Markovian open quantum systems [0.0]
マルコフ貯水池との弱い接触におけるリンドブラディアン進化のエントロピーダイナミクスについて検討した。 2レベル系における減衰励起に対する絡み合い力学の解析式を与える。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:01:04 GMT)
The parametric instability landscape of coupled Kerr parametric oscillators [0.0]
ここでは,大域パラメトリックドライブとKPO間の線形結合の競合から分岐が生じることを示す。熱力学の極限では、これらの遷移が一様に空間化され、非常に規則的な構造になる。この結果から, KPO ネットワークが Ising のような解空間を持つ場合の厳密な境界が明らかとなり, 実験的な実装のための重要なガイダンスが得られた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:37:00 GMT)
Surrogate Modeling for Explainable Predictive Time Series Corrections [0.0]
古典的時系列'ベースモデル'の予測を改善するために、当初は解釈不能な予測モデルが使用される。補正の「説明可能性」は、誤り予測を除去したデータに再びベースモデルを適合させることで提供される(減算)。本稿では,データ中のパターンを発見し,説明するための手法の可能性を示すための例を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:51:44 GMT)
SupplyGraph: A Benchmark Dataset for Supply Chain Planning using Graph Neural Networks [0.0]
グラフニューラルネットワーク(GNN)は、輸送、バイオインフォマティクス、言語処理、コンピュータビジョンなど、さまざまな領域で注目を集めている。サプライチェーンネットワークは本質的にグラフのような構造であり、GNN方法論を適用するための主要な候補となる。このアプローチの大きな欠点は、GNNを用いたサプライチェーン問題の研究と解決を容易にするために、実世界のベンチマークデータセットが存在しないことである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:23:55 GMT)
Stochastic optimal control of open quantum systems [0.0]
オープン量子システムのための状態準備の一般的な問題を考える。 SOC問題はハミルトン・ヤコビ・ベルマン方程式の解を必要とする。得られたアルゴリズムをQDC(Quantum Diffusion Control)と呼ぶ。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:40:19 GMT)
Spectral function of a bipolaron coupled to dispersive optical phonons [0.0]
フォノン分散とクーロン反発の相互作用とその単一電子除去スペクトル関数への影響について検討した。スペクトル関数はフォノン分散に大きく影響され、特に強い電子-フォノン結合を持つ系では顕著である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:52:16 GMT)
Spectral and temporal properties of type-II parametric down-conversion: The impact of losses during state generation [0.0]
損失導波路で発生するパルス自発パラメトリックダウン変換のスペクトルと時間特性について検討した。ポンプ・イドラー群速度整合条件下で発生する周波数縮退型SPDCの例を用いて,SPDCプロセスの内部損失に依存する結合スペクトル強度,モード構造,正規化2次相関関数,およびHong-Ou-Mandel干渉パターンを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:22:47 GMT)
Sparse Low-Ranked Self-Attention Transformer for Remaining Useful Lifetime Prediction of Optical Fiber Amplifiers [0.0]
本稿では,新しい寿命予測手法としてSparse Low-ranked Self-Attention Transformer (SLAT)を提案する。 SLATはエンコーダ-デコーダアーキテクチャに基づいており、2つの並列動作エンコーダがセンサーと時間ステップの機能を抽出する。注意行列と低ランクパラメトリゼーションにおけるスパーシティの実装は、過度な適合を減らし、一般化を増大させる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:07:35 GMT)
Similarity-Quantized Relative Difference Learning for Improved Molecular Activity Prediction [0.0]
分子活性予測を構造的に類似した化合物の相対差学習として再構成する学習フレームワークであるSQRLを導入する。我々は、パブリックデータセットとプロプライエタリな業界データにベンチマークすることで、その幅広い適用性と現実世界の可能性を示します。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:42:18 GMT)
Signatures of Enhanced Superconducting Properties in Niobium Cavities [0.0]
Nbキャビティにおける異常周波数減少を報告し,TllT_c$の超伝導特性の向上を示唆した。また, Nb SRFキャビティの交流伝導率におけるコヒーレンスピークの初例を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:12:59 GMT)
Securing the AI Frontier: Urgent Ethical and Regulatory Imperatives for AI-Driven Cybersecurity [0.0]
本稿では,サイバーセキュリティにおける人工知能の統合によって引き起こされる倫理的・規制上の課題について批判的に考察する。我々は、1940年代の理論的議論から、欧州連合のAI法のような最近のグローバルなフレームワークの実装に至るまで、AI規制の歴史的発展を辿った。バイアス、透明性、説明責任、プライバシ、人間の監視といった倫理的な懸念は、AI駆動のサイバーセキュリティシステムに影響を及ぼすとともに、深く調査されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:17:37 GMT)
Satisfiability problems and algebras of boolean constraint system games [0.0]
制約系間のある種の還元は系のBCS代数間の$*$-ホモモルフィズムをもたらすことを示す。また、超線型群が存在するかどうかという問題は$mathcalRmathcalU$-satisfiability の二分法定理に関係していることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:38:03 GMT)
Revisiting the properties of superfluid and normal liquid ${}^4$He using ab initio potentials [0.0]
3体と4体のポテンシャルがそれぞれ約4%と0.4%のエネルギーに寄与していることが判明した。粒子あたりのエネルギーに加えて、超流動分数、凝縮分数、対分布関数など、他の重要な観測値も分析する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:14:10 GMT)
Reinforcement Learning-Enhanced Procedural Generation for Dynamic Narrative-Driven AR Experiences [0.0]
本稿では,モバイルAR環境向けに設計された強化学習型WFCフレームワークを提案する。環境固有のルールと強化学習(RL)による動的タイル量調整を統合することにより,ゲームプレイのニーズに応答し,コンテキスト的に一貫性のあるマップを生成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:23:06 GMT)
Recurrence in discrete-time quantum stochastic walks [0.0]
線形上の離散時間量子再帰ウォークを解析する。ランダム性は再発確率を減少させる。その結果、離散時間量子ウォークは古典的ランダムウォークとユニタリ量子ウォークの両方に優れていた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 09:06:13 GMT)
Quarkonium dynamics in the quantum Brownian regime with non-abelian quantum master equations [0.0]
我々は、以前に導出された量子マスター方程式(QME)の1次元設定において、その量子ブラウン状態における正確な数値解を提示する。次に、QMEから導出される正確な解に対して、対応する進化をベンチマークすることで、半古典的近似(しばしばURHICのチャーモニウム生産を記述するために使われる)の精度について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:47:25 GMT)
Quantum collision circuit, quantum invariants and quantum phase estimation procedure for fluid dynamic lattice gas automata [0.0]
計算ベースエンコーディング(CBE)を用いた量子コンピュータにおけるLGCAの変換について検討する。モデルの古典的特徴に基づいて衝突量子回路を最適化する効率的な手法を提案する。本稿では,LGCAにおける不変量の重要点に対処し,QCの定式化において何個の不変量が存在するかを求める方法を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:04:53 GMT)
Quantum Friction near the Instability Threshold [0.0]
不安定なしきい値付近で、量子摩擦力は対数的に分散することを示す。我々の発見は、量子的および古典的な状態における摩擦力学における不安定性、臨界ばらつき、温度の役割に関する新たな洞察を提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:18:47 GMT)
Quantifying imaginarity in terms of pure-state imaginarity [0.0]
複素数は量子系とその動的挙動を記述するのに必要な成分である。想像力の資源理論は近年構築されており、量子情報理論における複素数に関する体系的な研究を可能にしている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:36:36 GMT)
Quantal analysis of the effects of coordinate noncommutativity on bi-dimensional harmonic motion under parametric variations [0.0]
まず、時間に依存しないパラメータで記述されたシステムの量子解を導出する。我々は,非可換位相空間形式に枠を組んだ研究を拡張し,時間依存パラメータを用いたシステムの関連する解を求める。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:07:29 GMT)
Pseudo-real quantum fields [0.0]
複素数に対する擬現実性の概念は、場の量子論に対する2つのアプローチのための統一的な枠組みを提供することを示す。ボゾン場の擬現実条件は、擬エルミート電流を含むゲージ理論の定式化によって長年の問題を解決している。結果は、擬エルミート量子場理論の第一原理の構成の継続的な発展に大きく貢献する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:46:16 GMT)
Planon-modular fracton orders [0.0]
平面モジュラー(p-モジュラー)フラクトンオーダーのクラスを導入する。定義的な性質は、任意の非自明な点のような励起は、プラノンでブレイディングすることによって検出できるということである。これらのモデルはそれぞれ p-モジュラーであり、位相不変量を計算する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:37:15 GMT)
PASS: Presentation Automation for Slide Generation and Speech [0.0]
PASSは一般的なWord文書からスライドを生成するパイプラインである。また、生成されたスライドのオーラル配信を自動化する。 Passはユーザ文書を分析して、AI生成音声による動的で魅力的なプレゼンテーションを生成する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:43:44 GMT)
Off-policy Evaluation for Payments at Adyen [0.0]
オフ・ポリティ・アセスメント(OPE)は、Adyenの推奨システム開発と最適化を加速するために適用された。分析の結果,OPE推定値とオンラインA/Bテスト結果との間には強い相関関係があることが判明した。大規模産業決済システムにおける意思決定システムの有効性と統合に関するガイダンスを提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:17:01 GMT)
Neural Risk-sensitive Satisficing in Contextual Bandits [0.0]
文脈的包帯問題は、レコメンデーションシステムにおける課題を解決する効果的な枠組みを提供する。より複雑な環境に対処するため,ニューラルネットワークをRegLinRSに組み込むニューラルリスク感性満足度(NeuralRS)を提案した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:20:25 GMT)
Nesterov Acceleration for Ensemble Kalman Inversion and Variants [0.0]
ネステロフ加速は, 様々な逆問題において, EKIコスト関数の高速化に有効であることを示す。我々の具体的な実装は、既存のEKI変種アルゴリズムとブラックボックス方式で組むのが明らかに簡単である粒子レベルナッジの形式を採っている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:01:34 GMT)
Multilingual Email Phishing Attacks Detection using OSINT and Machine Learning [0.0]
本稿では、オープンソースのインテリジェンス(OSINT)ツールと機械学習(ML)モデルを統合して、多言語データセット間のフィッシング検出を強化する。 NmapとTheHarvesterを用いて、ドメイン名、IPアドレス、オープンポートを含む17の機能を抽出し、検出精度を向上した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:05:25 GMT)
MeshMask: Physics-Based Simulations with Masked Graph Neural Networks [0.0]
本稿では,計算流体力学(CFD)問題に適用したグラフニューラルネットワーク(GNN)のための新しいマスク付き事前学習手法を提案する。事前学習中に入力メッシュノードの40%をランダムにマスキングすることにより、複雑な流体力学の堅牢な表現を学習せざるを得ない。提案手法は,メッシュ当たり25万ノード以上の3次元頭蓋内動脈瘤シミュレーションの挑戦的データセットを含む,7つのCFDデータセットの最先端結果を実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:34:56 GMT)
Manifestations of chaos in billiards: the role of mixed curvature [0.0]
この研究では、ビーン型のビリヤードとピーナッツ型のビリヤードの2つのビリヤードを紹介し、後者はカッシーニ・オバルの変種である。これらのビリヤードの古典力学と量子力学の両方を考察し、2つの視点の強い配向を観察する。スカリング現象は、量子的および古典的対応の豊かな視覚的表現として機能し、局所的なレベルで量子的抑圧カオスを強調する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:47:15 GMT)
Local Description of Decoherence of Quantum Superpositions by Black Holes and Other Bodies [0.0]
我々は、アリスの研究室内の量子場の局所的な2点関数の観点から、デコヒーレンスを記述することができることを示す。局所的な視点から、ウンルー真空中のシュワルツシルト時空におけるデコヒーレンスを明示的に計算する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 23:50:33 GMT)
Knowledge prompt chaining for semantic modeling [0.0]
本稿では,新しいセマンティック・モデリング・フレームワーク,ナレッジ・プロンプト・チェインを提案する。グラフ構造化された知識をシリアライズし、LSMに適切に注入することができる。実験結果に基づいて,本手法は既存の先行技術よりも優れた性能を実現する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 03:00:57 GMT)
Karatsuba Matrix Multiplication and its Efficient Custom Hardware Implementations [0.0]
行列乗算に対するスカラーカラツバ乗算アルゴリズムの拡張を提案する。これにより、元のカラツバアルゴリズムの乗算複雑性の低減と追加加算の複雑さの低減が維持される。提案するアルゴリズムとハードウェアアーキテクチャは,整数行列の乗算に対して実面積や実行時間を改善することができることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:00:43 GMT)
Is magnitude 'generically continuous' for finite metric spaces? [0.0]
有限距離空間のグロモフ・ハウスドルフ空間上では等級が連続ではないことを示す。しかし、ジェネリックグロモフ=ハウスドルフ極限が等しく保存されるという意味では、それが「本質的に連続である」ことを示す証拠が見つかる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:01:41 GMT)
Investigating the Effect of Network Pruning on Performance and Interpretability [0.0]
異なる刈り取り技術がGoogLeNetの分類性能と解釈性に与える影響について検討する。我々は,反復的刈り込みやワンショット刈り込みなど,異なるトレーニング戦略を比較した。十分な再学習エポックがあれば、ネットワークの性能はデフォルトのGoogLeNetの性能に近似できる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:29:14 GMT)
Integrated Photonic Programmable Random Matrix Generator with Minimal Active Components [0.0]
プログラム可能な位相変調層を固定混合演算子で利用することにより、ランダム行列を生成するためのコンパクトフォトニック回路を提案する。 2つのランダム位相層のみを用いることで、白色雑音プロファイルを持つ出力光信号を出力するのに十分であり、非常にスパースな入力光信号に対しても十分であることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:57:24 GMT)
Information geometry of transitions between quantum nonequilibrium steady states [0.0]
量子非平衡定常状態間の緩やかな遷移について、非断熱エントロピー生成は先行順序であることを示す。任意に高速なプロセスを保持する余剰エントロピーフラックスの上界を導出する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:13:09 GMT)
Improving Stability Estimates in Adversarial Explainable AI through Alternate Search Methods [0.0]
局所代理法は複雑な機械学習モデルの動作を近似するために使われてきた。最近の研究は、生成した説明が著しく異なる敵攻撃に対する脆弱性を明らかにしている。本稿では,最小限の摂動の探索を目的とした代替探索手法について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 18:45:05 GMT)
Improved finite-size key rates for discrete-modulated continuous variable quantum key distribution under coherent attacks [0.0]
我々は,Alice氏が4つのコヒーレント状態の集合から選択し,Bobがヘテロダイン測定を行うCVQKDプロトコルについて検討する。有限サイズシステムにおけるコヒーレント攻撃に対するセキュリティ証明を行い、達成可能なキーレートを算出する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:15:18 GMT)
Improved bounds on collapse models from rotational noise of LISA Pathfinder [0.0]
我々は,LISAパスファインダーの角運動データを解析し,それまでの翻訳動作よりも厳密な制約を導出する。我々は、CSLモデルに制約を加えるために、翻訳されたものよりも回転測定を優先する一般的な条件を同定する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:35:14 GMT)
Heat semigroup representation of Laplacian [0.0]
この研究は、計算量子力学のための新しい数値アルゴリズムを導入する。このアプローチの鍵となる利点は、その計算効率にある。提案したマルチウェーブレットに基づくラプラシアン近似は、2つの基本的な量子化学応用を通して検証される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:17:13 GMT)
Grounding Text-To-Image Diffusion Models For Controlled High-Quality Image Generation [0.0]
我々は,最先端画像生成フレームワークからインスピレーションを得るモデルであるObjectDiffusionを提案する。我々はContorlNetで導入されたネットワークアーキテクチャを改良し、GLIGENで提案されている条件処理とインジェクション技術と統合する。我々のモデルは、AP$_50$ 46.6、AR 44.5、FID 19.8を達成し、オープンソースのデータセットでトレーニングされた現在のSOTAモデルより優れている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:55:26 GMT)
Gradient Descent Converges Linearly to Flatter Minima than Gradient Flow in Shallow Linear Networks [0.0]
本研究では,1つの入力と出力を持つディープ2線形ニューラルネットワークの勾配勾配勾配ダイナミクスについて検討する。また, GD は, たとえ大きなステップサイズであっても, 訓練損失の最小値に比例して直線的に収束することを示した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 20:43:36 GMT)
Generative diffusion model with inverse renormalization group flows [0.0]
拡散モデルは、ホワイトノイズによって破損したサンプルをデノナイズすることでデータを生成する。本稿では,データ分散のマルチスケールな性質を利用する正規化群に基づく拡散モデルを提案する。タンパク質構造予測および画像生成への応用を通じて,モデルの汎用性を検証する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:01 GMT)
Generative AI Takes a Statistics Exam: A Comparison of Performance between ChatGPT3.5, ChatGPT4, and ChatGPT4o-mini [0.0]
小学校1年生を対象に, GPT バージョン3.5, 4.0, 4o-mini の16質問統計試験において, GPT バージョン3.5, 4.0, 4o-mini の成績を検討した。その結果, GPT3.5と4o-miniはいずれもGPT4と類似していることがわかった。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:46:01 GMT)
Extraordinary manifestation of near electrostatic field caused by macroscopic quantum shell effects in submicron hemispherical clusters [0.0]
強静電場がヘミスフェラル形状の孤立無電荷金属ナノクラスターの近傍に存在することを示す。この物理現象は、サブミクロン金属クラスターにおける量子シェル効果に関連する電子の分布における大規模な空間的不均一性の結果である。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:05:41 GMT)
Expanding Vietnamese SentiWordNet to Improve Performance of Vietnamese Sentiment Analysis Models [0.0]
本稿ではベトナム語レビューの感性分析のためのPhoBERT-V2とSentiWordnetを組み合わせた新しいアプローチを提案する。提案モデルではベトナム語に対してPhoBERT-V2を用いて,ベトナム語の文脈における顕著なBERTモデルのロバストな最適化を行う。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:22:37 GMT)
Evaluation of radiomic feature harmonization techniques for benign and malignant pulmonary nodules [0.0]
肺結節(PNs)の放射線学的特徴は肺癌の診断に有効であるが, 医学的画像取得の多様性は臨床応用の障害となる。放射線学的特徴の獲得依存性を補正する際の良性PNと悪性PNの相違について検討した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:35:11 GMT)
Evaluating SAT and SMT Solvers on Large-Scale Sudoku Puzzles [0.0]
Z3, CVC5, DPLL(T) における現代の SMT ソルバの性能を DPLL の SAT ソルバに対して評価した。以上の結果から,現代のSMTソルバは従来のSATソルバよりも有意に優れていた。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:31:56 GMT)
Equivalence between exponential concentration in quantum machine learning kernels and barren plateaus in variational algorithms [0.0]
本研究では,変分量子アルゴリズムにおけるバレンプラトー(BP)間の厳密な接続と,機械学習のための量子カーネルの指数集中を定式化する。この結果から,BPフリーな量子回路を構築するための提案手法が,機械学習に有用な量子カーネルの構築に有効であることが示唆された。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:39:24 GMT)
Entanglement-assisted variational algorithm for discrete optimization problems [0.0]
離散最適化問題は、しばしば正確に難解であり、近似メソッドの使用を必要とする。古典物理学に触発されたヒューリスティックスは、長い間この領域において中心的な役割を果たしてきた。量子アニールは、アナログおよびデジタル量子デバイスの両方で実現されたハードウェア実装によって、有望な代替手段として登場した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:00:10 GMT)
Eigenstate thermalization to non-Gibbs states in strongly-interacting chaotic lattice gases [0.0]
多体カオス系の平衡エネルギーはフェルミ・ディラックとボース・アインシュタインの分布と質的に異なる。効果は、正温度と負温度の両方をサポートする有限エネルギースペクトルを持つ系に現れる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:23:38 GMT)
Effect of spontaneous emission on a tanh model [0.0]
本研究では,自然放出がタングモデルに及ぼす影響について検討した。この効果は、虚数項とモデルの変化を導入し、その結果非エルミート性をもたらす。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 12:19:29 GMT)
Dynamic Knowledge Integration for Enhanced Vision-Language Reasoning [0.0]
大規模視覚言語モデル(AKGP-LVLM)のための適応的知識誘導型事前学習法を提案する。事前訓練と微調整の間、構造化された、構造化されていない知識をLVLMに組み込む。提案手法を4つのベンチマークデータセットで評価し,最先端モデルよりも優れた性能を示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 05:45:04 GMT)
Dual Cone Gradient Descent for Training Physics-Informed Neural Networks [0.0]
物理インフォームド・デュアルニューラルネットワーク(PINN)は偏微分方程式の解法として注目されている。コーン領域内に落下するのを確実にするために、更新された勾配の方向を調節する新しいフレームワークであるDual Cone Gradient Descent (DCGD)を提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 04:59:43 GMT)
Disentangled Interleaving Variational Encoding [0.0]
本稿では,変分オートエンコーダの潜時空間において,元の入力を限界値と条件値の確率分布に分解する原理的手法を提案する。提案モデルであるDeep Disentangled Interleaving Variationalを提案する。コーダ(DeepDIVE)は、元の入力から切り離された特徴を学習し、埋め込み空間にクラスタを形成する。 2つの公開データセットの実験は、DeepDIVEが元の入力をアンタングルし、元のVAEよりも予測精度が良いことを示している。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 10:50:54 GMT)
Direct sum theorems beyond query complexity [0.0]
コンピュータサイエンスの根本的な疑問は、$n$インスタンスを同時に解決するよりも、独立して解決することが難しいか、ということです。本稿では,古典的/量子的クエリ複雑性,機械学習のためのPAC学習,統計的推定理論などを拡張する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 13:08:39 GMT)
Design and Benchmarks for Emulating Kondo Dynamics on a Quantum Chip [0.0]
我々は,不純物磁化,不純物とフェルミオンの絡み合い,エネルギーを時間関数として数値的に決定する。この研究は、NISQ時代の量子チップ上での電子量子多体状態のダイナミクスの研究の視点を開く。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 00:28:13 GMT)
Deep Learning Meets Queue-Reactive: A Framework for Realistic Limit Order Book Simulation [0.0]
MDQR(Multidimensional Deep Queue-Reactive Model)を提案する。このモデルは待ち行列独立の仮定を緩和し、市場特徴で状態空間を豊かにし、注文サイズの分布をモデル化する。 Bund Futures Marketのデータを用いて、MDQRは市場影響の平方根法則、クロスキュー相関、現実的なオーダーサイズパターンなどの重要な市場特性を捉えていることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:19:20 GMT)
CveBinarySheet: A Comprehensive Pre-built Binaries Database for IoT Vulnerability Analysis [0.0]
CveBinarySheetは1999年から2024年までの1033のCVEエントリを含むデータベースである。私たちのデータセットは16の重要なサードパーティコンポーネントで構成されています。各プリコンパイルされたバイナリは2つのコンパイラ最適化レベル(O0とO3)で利用でき、異なるコンパイルシナリオ下で包括的な脆弱性分析を容易にする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:50:46 GMT)
Controlling the spontaneous emission of trapped ions [0.0]
予想される新規性には、単一の光子検出イベントを通じて2つ以上のイオンが絡み合う可能性がある。この設定は、量子技術で一般的に使用される既存のイオントラップのほとんどに適応することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 07:17:02 GMT)
Continuous Approach to Phase (Norm) Retrieval Frames [0.0]
連続近傍リース基底の概念を導入し、可逆作用素の下でそれらの不変性を証明する。連続フレームの位相およびノルム検索特性に対する等価条件について述べる。摂動下での位相検索の安定性について検討する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:30:45 GMT)
Complexity Assessment of Analog and Digital Security Primitives Signals Using the Disentropy of Autocorrelation [0.0]
我々は,Pseudo-Random Number Generators (PRNGs) などのセキュリティプリミティブに注目する。このようなプリミティブは、アプリケーションに対する十分なセキュリティを保証するために、レスポンスにおいて高いレベルの複雑さやエントロピーを持つ必要があります。自己相関の非エントロピーは、よく知られたPRNGと、アナログドメインとバイナリドメインにおける最適化されていないPRNGとを区別できることを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 14:20:29 GMT)
Cavity-enhanced detection of spin polarization in a microfabricated atomic vapor cell [0.0]
我々は,光共振器内における微小共振器内での原子蒸気の電子スピン偏極の連続的なパウンド・ドレーバー・ハル(PDH)非破壊モニタリングを実証した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:27:01 GMT)
Can Large Language Models Predict the Outcome of Judicial Decisions? [0.0]
大規模言語モデル(LLM)は自然言語処理(NLP)において例外的な機能を示す。 LLaMA-3.2-3B や LLaMA-3.1-8B を含む最先端のオープンソース LLM を様々な構成でベンチマークする。本結果は,タスク固有のコンテキストにおいて,細調整された小型モデルが大規模モデルに匹敵する性能を実現することを示す。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 11:32:35 GMT)
Benchmarking of Fluorescence Lifetime Measurements using Time-Frequency Correlated Photons [0.0]
本稿では、連続波源から発生する時間周波数相関光子を用いて、蛍光寿命の革新的な方法の限界について検討する。また、この手法を最先端のFLIMと比較し、改良されたメリットを観察した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 15:39:44 GMT)
Attention is All You Need Until You Need Retention [0.0]
この研究はトランスフォーマーベースのアーキテクチャのための新しいRetention Layerメカニズムを導入し、本質的な保持機能の欠如に対処する。 Retention Layerには、リアルタイムデータ人口、動的リコール、ガイド付き出力生成が可能な永続メモリモジュールが含まれている。各領域において、保持機構は、システムが漸進的に学習し、アウトプットをパーソナライズし、進化する現実世界の課題に効果的に対応できるようにする。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:33:53 GMT)
Application of Deep Reinforcement Learning to UAV Swarming for Ground Surveillance [0.0]
マルチエージェント集中型Swarmアーキテクチャに深層強化学習を統合するハイブリッドAIシステムを提案する。提案システムは、特定のエリアの監視、地上目標の探索と追跡、セキュリティおよび法執行機関の応用に適したシステムである。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 08:46:20 GMT)
Analysis of quantum mechanics with real-valued Schrödinger equation,single-event quantum-path dynamics, Mauprtuis path in parameter space, and branching paths beyond semiclassics [0.0]
我々はシュル・オーディンガー力学とシュル・オーディンガー関数(またはいわゆる波動関数)を解析する。シュル・オーディンガー方程式は、ニュートン力学や光学に言及することなく、実場のスクラッチから再構成される。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 06:06:42 GMT)
Advancing a responsible future quantum internet [0.0]
我々は、QIの倫理的、法的、社会的側面(ELSA)と政策含意(ELSPI)の範囲内で、利害関係者によって概念化された望ましい未来(DF)を提示する。量子イノベーションに責任を負う10の原則」の理念に対するQI ELSPIの現況とDFの整合性について検討する。有責任な量子インターネットの継続的な成功のために、量子インターネットの二重利用防止に関するさらなる調査を推奨する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 19:01:00 GMT)
Absolute Risk Prediction for Cannabis Use Disorder Using Bayesian Machine Learning [0.0]
提案モデルは,SUDにおける最初の絶対リスク予測モデルである。将来、CUDを開発するリスクが高い青少年や青年の物質使用者を特定するために、臨床医を支援することができる。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 21:17:02 GMT)
Absence of a dissipative quantum phase transition in Josephson junctions: Theory [0.0]
RSJにおける超伝導-絶縁量子相転移について検討した。すべてのパラメータに対して、ジャンクションを絞ると超伝導が増すことが分かる。我々は,この量子相転移の実験的無効化を,2020年にMuraniらによって完全に支持し,確認した。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 16:21:12 GMT)
AI Consciousness is Inevitable: A Theoretical Computer Science Perspective [0.0]
我々は,資源制限下での計算を研究する数学の分野である理論計算機科学のレンズを通して,意識を考察する。我々は、アラン・チューリングの単純だが強力な計算モデルとバーナード・バールズ(Bernard Baars)の意識モデルにインスパイアされた、意識のためのフォーマルなマシンモデルを開発する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 02:23:44 GMT)
A design of Convolutional Neural Network model for the Diagnosis of the COVID-19 [0.0]
患者の肺領域における新型コロナウイルス(COVID-19)の認識は、クリカルセンターや病院の基本的な必要不可欠なものの一つである。胸部X線写真から新型コロナウイルスを正確に認識するために、19層CNNの新しい構造が推奨されている。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 17:56:35 GMT)
A Blockchain-Enabled Approach to Cross-Border Compliance and Trust [0.0]
本稿では,ブロックチェーンと分散台帳技術(DLT)を活用した,AIガバナンスの新しいアプローチを提案する。ブロックチェーン、AI倫理、サイバーセキュリティの進歩を合成することにより、分散AIガバナンスフレームワークの包括的なロードマップを提供する。
論文参考訳（メタデータ） (Wed, 15 Jan 2025 22:19:34 GMT)