Fugu-MT: arxivの論文翻訳(概要)

TAR3D: Creating High-Quality 3D Assets via Next-Part Prediction [137.3]
TAR3Dは、3D対応ベクトル量子可変オートエンコーダ(VQ-VAE)と生成事前学習トランス(GPT)で構成される新しいフレームワークである。 TAR3Dは,テキスト・ツー・3Dタスクや画像・ツー・3Dタスクにおいて,既存の手法よりも優れた生成品質が得られることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:28:20 GMT)
Preventing Non-intrusive Load Monitoring Privacy Invasion: A Precise Adversarial Attack Scheme for Networked Smart Meters [99.9]
本稿では,敵攻撃に基づく革新的な手法を提案する。このスキームは、NILMモデルがアプライアンスレベルのプライバシに違反するのを効果的に防ぎ、ユーザの正確な請求計算を確実にする。提案手法はトランスファービリティを示し,他の様々なNILMモデルに適用可能な1つのターゲットモデルから発生する摂動信号を生成する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:06:46 GMT)
Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.1]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:56:22 GMT)
Aristotle: Mastering Logical Reasoning with A Logic-Complete Decompose-Search-Resolve Framework [93.6]
本稿では論理完全推論フレームワークであるAristotleについて,論理解法,論理解法,論理解法,論理解法の3つの主要なコンポーネントを提案する。本フレームワークでは,記号表現と論理規則を総合的に推論プロセスに統合する。いくつかのデータセットの実験結果は、Aristotleが最先端の推論フレームワークを精度と効率の両方で一貫して上回っていることを示している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:14:09 GMT)
Imitate, Explore, and Self-Improve: A Reproduction Report on Slow-thinking Reasoning Systems [92.9]
o1のような推論システムは、複雑な推論タスクを解く際、顕著な能力を示した。推論モデルをトレーニングするために、模倣、探索、自己改善のフレームワークを導入します。提案手法は,産業レベルの推論システムと比較して競争性能が向上する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:44:13 GMT)
Data value estimation on private gradients [85.0]
勾配に基づく機械学習(ML)法では、デファクト微分プライバシー技術がランダムノイズで勾配を乱している。データバリュエーションは、トレーニングデータにMLのパフォーマンスを特性付け、DPの強制を必要とするプライバシーに配慮したアプリケーションで広く使用されている。我々は,データ値推定の不確かさをパラドックス的に線形に評価し,評価予算を増大させるため,勾配に不規則な雑音を注入するというデフォルトのアプローチを伴わないことを示す。提案手法は, 予測の不確実性の線形化を確実に除去するために, 慎重に相関ノイズを注入することである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:15:51 GMT)
Multi-Agent Sampling: Scaling Inference Compute for Data Synthesis with Tree Search-Based Agentic Collaboration [81.5]
本研究の目的は,マルチエージェントサンプリングによるデータ合成の問題を調べることでギャップを埋めることである。逐次サンプリングプロセス中にワークフローが反復的に進化する木探索に基づくオーケストレーションエージェント(TOA)を紹介する。アライメント、機械翻訳、数学的推論に関する実験は、マルチエージェントサンプリングが推論計算スケールとしてシングルエージェントサンプリングを著しく上回ることを示した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:16:44 GMT)
On the Differential Privacy and Interactivity of Privacy Sandbox Reports [78.2]
GoogleのPrivacy Sandboxイニシアチブには、プライバシ保護広告機能を実現するAPIが含まれている。これらのAPIのプライバシを分析するための形式モデルを提供し、それらが正式なDP保証を満たすことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:22:57 GMT)
On Optimal Sampling for Learning SDF Using MLPs Equipped with Positional Encoding [76.8]
我々は、好ましくない副作用を伴わずに、正確な暗黙の場を学習するための適切なサンプリング率を決定するツールを考案した。 PEを具備したPEは、PE層の最高周波数成分よりも内在周波数がはるかに高いことが観察された。 SDFフィッティングの設定において,この推奨サンプリングレートは正確なフィッティング結果の確保に十分であることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:17:41 GMT)
Neural network learns low-dimensional polynomials with SGD near the information-theoretic limit [75.5]
単一インデックス対象関数 $f_*(boldsymbolx) = textstylesigma_*left(langleboldsymbolx,boldsymbolthetarangleright)$ の勾配勾配勾配学習問題について検討する。 SGDに基づくアルゴリズムにより最適化された2層ニューラルネットワークは、情報指数に支配されない複雑さで$f_*$を学習する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:59:09 GMT)
Seamless Detection: Unifying Salient Object Detection and Camouflaged Object Detection [73.9]
本稿では,SOD(Salient Object Detection)とCOD(Camouflaged Object Detection)を統合化するためのタスク非依存フレームワークを提案する。我々は、間隔層と大域的コンテキストを含む単純で効果的なコンテキストデコーダを設計し、67fpsの推論速度を実現する。公開SODデータセットとCODデータセットの実験は、教師なし設定と教師なし設定の両方において、提案したフレームワークの優位性を実証している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:25:43 GMT)
RG-SAN: Rule-Guided Spatial Awareness Network for End-to-End 3D Referring Expression Segmentation [73.0]
3D参照式は、参照式と点雲を関連付けて3Dオブジェクトをセグメントすることを目的としている。従来のアプローチでは、インスタンスの空間情報に重点が置かれていないため、過剰なセグメンテーションや誤ったセグメンテーションといった問題に頻繁に遭遇する。本稿では,ルールガイド型空間認識ネットワーク(RG-SAN)を導入する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:51:52 GMT)
Teaching LLMs to Refine with Tools [68.2]
大規模言語モデル(LLM)はフィードバックに基づいて応答を洗練し、反復的なトレーニングやテスト時間の改良を通じて自己改善を可能にする。外部ツールを用いて同一または他のLLMによって生成されたチェーン・オブ・シント(CoT)応答を洗練するための新しいアプローチであるCaPを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:43:50 GMT)
Enhancing Item Tokenization for Generative Recommendation through Self-Improvement [67.9]
生成レコメンデーションシステムは大規模言語モデル(LLM)によって駆動される現在のアイテムトークン化手法には、テキスト記述、数値文字列、離散トークンのシーケンスの使用が含まれる。自己改善アイテムトークン化手法を提案し,LLMがトレーニングプロセス中に独自のアイテムトークン化を洗練できるようにする。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:56:15 GMT)
InterDance:Reactive 3D Dance Generation with Realistic Duet Interactions [67.4]
動きの質、データスケール、さまざまなダンスジャンルを大幅に向上させる大規模なデュエットダンスデータセットであるInterDanceを提案する。本稿では,対話のリアリズムを段階的に最適化するためのインタラクション改善指導戦略を備えた拡散型フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:53:51 GMT)
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps [65.6]
我々は、強化学習に広く用いられているAdam optimiserに適応する。我々は、Adam-Relがエポック内で局所的なタイムステップを使用しており、基本的にターゲット変更後のAdamのタイムステップを0にリセットしていることを示す。次に,RLにおいて勾配ノルムの増加が生じることを示すとともに,理論モデルと観測データとの差について検討する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:01:08 GMT)
NeuRodin: A Two-stage Framework for High-Fidelity Neural Surface Reconstruction [63.9]
サイン付き距離関数 (SDF) を用いたボリュームレンダリングは, 表面再構成において有意な機能を示した。ニューロディン(NeuRodin)は、新しい2段階の神経表面再構成フレームワークである。 NeuRodinは高忠実な表面再構成を実現し、密度ベース手法の柔軟な最適化特性を維持している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:24:09 GMT)
HyperNet Fields: Efficiently Training Hypernetworks without Ground Truth by Learning Weight Trajectories [63.0]
我々は,サンプル単位の真理を必要とせず,ハイパーネットワークを訓練する手法を提案する。私たちのキーとなるアイデアは、Hypernetwork Fieldを学び、単に収束状態ではなく、ネットワークウェイトトレーニングの全軌道を見積もることです。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:37:10 GMT)
Shaping the Safety Boundaries: Understanding and Defending Against Jailbreaks in Large Language Models [59.3]
大規模言語モデル(LLM)におけるジェイルブレークは、LLMを騙して有害なテキストを生成するというセキュリティ上の問題である。我々は7つの異なるジェイルブレイク法を詳細に分析し、不一致が不十分な観察サンプルから生じることを確認した。安全境界内でのアクティベーションを適応的に制限する「textbfActivation Boundary Defense (ABD)」という新しい防衛法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:18:39 GMT)
Evaluating Interventional Reasoning Capabilities of Large Language Models [58.5]
大規模言語モデル(LLM)は意思決定タスクを自動化するために使用される。本稿では,LPMが介入に応じてデータ生成プロセスの知識を正確に更新できるかどうかを評価する。さまざまな因果グラフ(例えば、コンバウンディング、仲介)と変数タイプにまたがるベンチマークを作成します。これらのベンチマークにより、LLMが事実を記憶したり、他のショートカットを見つけたりすることで、変化を正確に予測する能力を切り離すことができます。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:22:53 GMT)
Generate to Discriminate: Expert Routing for Continual Learning [57.7]
Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:16:28 GMT)
ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image [57.5]
従来の3Dヘッド生成法はテキスト記述によって制限されており、画像ベースの手法は高品質なヘッドジオメトリを作成するのに苦労していた。高品質な3Dヘッドを生成できる新しいフレームワークID-Sculptを提案する。広汎な実験により、1枚の画像から正確な形状とテクスチャで高品質な3Dヘッドを生成できることが実証された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:16:16 GMT)
MARINA-P: Superior Performance in Non-smooth Federated Optimization with Adaptive Stepsizes [57.2]
EF21-P (匿名2024) と MARINA-P (arXiv:2402.06412) の非滑らか凸理論を非サイズ凸設定で拡張する。我々は、定数、減少、適応(aktype)ステップの理論的保証を提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:18:34 GMT)
Layer- and Timestep-Adaptive Differentiable Token Compression Ratios for Efficient Diffusion Transformers [55.9]
Diffusion Transformer (DiTs)は、最先端(SOTA)画像生成の品質を達成したが、レイテンシとメモリ非効率に悩まされている。圧縮率の異なる動的DiT推論フレームワークであるDiffRatio-MoDを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:04:17 GMT)
FADA: Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation [55.4]
拡散に基づく音声駆動型アバター手法は近年,高忠実で鮮明で表現力のある結果に注目されている。拡散モデルの様々な蒸留技術が開発されているにもかかわらず, 自然拡散蒸留法では良好な結果が得られないことがわかった。本稿では,FADA (Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation) を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:19:22 GMT)
Reversed Attention: On The Gradient Descent Of Attention Layers In GPT [55.2]
我々は、後ろ向きの注意パスの数学を研究し、それが「逆注意」と呼ぶ注意行列を暗黙的に計算することを明らかにする。実験的な設定では,モデルの重みを変更することなく,前向きの注意パスを直接変更することができる。 LMがバックプロパゲーション中に注意層を構成する方法の理解を深めるだけでなく、Reversed Attention Mapはより解釈可能な後方パスに寄与する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:48:04 GMT)
CURE4Rec: A Benchmark for Recommendation Unlearning with Deeper Influence [55.2]
CURE4Recは、レコメンデーションアンラーニング評価のための最初の包括的なベンチマークである。さまざまな影響レベルのデータに対する推薦公正性と堅牢性に対するアンラーニングの影響について検討する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:40:24 GMT)
Controllable Conversations: Planning-Based Dialogue Agent with Large Language Models [52.7]
計画型会話エージェント (PCA) は, LLM駆動エージェントの制御性向上を目的とした対話フレームワークである。 GPT-4oを用いた半自動ロールプレイングシステムを用いて,SOP注釈付きマルチシナリオ対話からなるデータセットを提案する。また、SOP予測のための教師付き微調整と思考の連鎖を統合し、モンテカルロ木探索を対話中の最適な行動計画に活用する手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:34:01 GMT)
Efficiently Solving Turn-Taking Stochastic Games with Extensive-Form Correlation [52.2]
そこで我々は,Stackelbergの大規模相関平衡の計算アルゴリズムを提案する。また,大域的相関平衡を近似計算するアルゴリズムも提案する。ほぼ最適なEFCEのアルゴリズムは、私たちの知る限り、3つのデシラタを同時に達成した最初のアルゴリズムである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:12:05 GMT)
Differentially Private Random Block Coordinate Descent [51.6]
スケッチ行列を用いて各反復における確率の異なる複数の座標を選択する差分プライベートな座標降下法を提案する。提案アルゴリズムはDP-CDと従来のDP-SGDの両方を一般化し,有効性を保証する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:06:56 GMT)
DreamOmni: Unified Image Generation and Editing [51.5]
本稿では,画像生成と編集の統一モデルであるDream Omniを紹介する。訓練のためにドリーム・オムニはT2I世代と下流のタスクを共同で訓練する。このコラボレーションは、編集性能を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:17:28 GMT)
SoundLoc3D: Invisible 3D Sound Source Localization and Classification Using a Multimodal RGB-D Acoustic Camera [51.1]
SoundLoc3Dはタスクをセット予測問題として扱い、セットの各要素は潜在的な音源に対応する。大規模シミュレーションデータセットにおけるSoundLoc3Dの有効性と優位性を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:04:17 GMT)
Predicting the Reliability of an Image Classifier under Image Distortion [48.9]
画像分類タスクでは、深層学習モデルは画像歪みに弱い。品質管理のためには、画像分類器が歪みレベルで信頼できない/信頼できないかを予測することが重要である。我々の解決策は、歪みレベルと「信頼できない」「信頼できない」ラベルからなるトレーニングセットを構築し、歪みレベルを分類するために機械学習予測モデル(歪み分類器と呼ばれる)を訓練することである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:21:06 GMT)
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning [46.9]
本稿では,Q-Learning(ACL-QL)における適応保守レベル(Adaptive Conservative Level in Q-Learning, ACL-QL)を提案する。 ACL-QLは、各状態-作用ペアに対する保守的なレベルの適応的な制御を可能にする。理論解析により,2つの学習可能な適応重み関数を用いて各遷移の保守レベルを制御する新しいアルゴリズム ACL-QL を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:18:02 GMT)
Fairness in Reinforcement Learning with Bisimulation Metrics [45.7]
公平さを考慮せずに報酬を最大化することにより、AIエージェントはグループや個人の扱いに格差を導入することができる。そこで本研究では,バイシミュレーションのメトリクスを利用して報酬関数と観測ダイナミクスを学習する手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:23:06 GMT)
Linguistics-Vision Monotonic Consistent Network for Sign Language Production [45.1]
手話生成(SLP)は、音声言語文に対応する手話ビデオを生成することを目的としている。クロスモーダルなセマンティックギャップのため、SLPは言語学と視覚の整合性に大きな課題を被る。本稿では,SLPのためのトランスフォーマーベース言語ビジョンモノトニック一貫性ネットワーク(LVMCN)を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:28:06 GMT)
Catalytic and asymptotic equivalence for quantum entanglement [45.0]
多くのコピーの絡み合う操作は、ノイズの多い状態から非常に絡み合った純粋な状態を可能にする。本研究では, 絡み合った触媒を用いることで, 蒸留可能な量子状態の単項蒸留速度を向上できないことを示す。本研究は, 絡み合った状態の触媒および状態変換の能力と限界を包括的に把握するものである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:39:47 GMT)
A Reality Check on Context Utilisation for Retrieval-Augmented Generation [44.5]
DRUID (Dataset of Retrieved Untrieved Unliable, Insufficient and Difficult-to-understand contexts) を導入し、実世界のクエリやコンテキストを手動でアノテートする。このデータセットは、現実世界の証拠の自動検索が不可欠である自動クレーム検証のタスクに基づいている。合成データセットは、実検索データで稀な文脈特性を誇張し、拡張された文脈利用結果をもたらすことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:16:38 GMT)
Faster Local Solvers for Graph Diffusion Equations [44.2]
グラフ拡散方程式(GDE)は、クラスタリング、ニューラルネットワークのトレーニング、その他多くのグラフ関連の問題に不可欠である。既存の反復的な手法では、イテレーション毎にグラフ全体にアクセスする必要があり、大規模なグラフには時間がかかる。本稿では,局所拡散プロセスを用いてGDEを近似的に解くための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:03:04 GMT)
GME: Improving Universal Multimodal Retrieval by Multimodal LLMs [43.5]
Universal Multimodal Retrieval (UMR) は、統一モデルを用いて様々なモダリティを探索することを目的としている。これまで、テキストデータのみを用いてUMRを実現するためにMLLM(Multimodal large language model)を採用してきた。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:40:24 GMT)
Detect Changes like Humans: Incorporating Semantic Priors for Improved Change Detection [41.8]
本稿では,セマンティック・アウェア・チェンジ検出ネットワーク,すなわちSA-CDNetを提案する。人間の視覚パラダイムにインスパイアされた新しいデュアルストリーム特徴デコーダは、変化を区別するために導出される。また,ランドスケープのセマンティック理解を高めるために,単一時間的セマンティック事前学習戦略を設計する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:27:15 GMT)
Reconsidering SMT Over NMT for Closely Related Languages: A Case Study of Persian-Hindi Pair [41.1]
本稿では,Phrase-Based Statistical Machine Translation (PBSMT) がトランスフォーマーベースのニューラルマシン翻訳 (NMT) を適度に活用できることを示す。その結果,PBSMTのBLEUスコアは66.32であり,Transformer-NMTスコアは53.7以上であった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:12:46 GMT)
Lightweight Design and Optimization methods for DCNNs: Progress and Futures [41.0]
深層畳み込みニューラルネットワーク(DCNN)はコンピュータビジョンタスクにおいて優れた性能を示した。高い計算コストと大規模なネットワークアーキテクチャは、リソース制約のあるハードウェアプラットフォーム上でのDCNNの広範な適用を著しく制限する。本稿では,DCNNの軽量設計戦略を概観し,軽量設計とモデル圧縮の両面での最近の研究動向について考察する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:47:01 GMT)
Imitate Before Detect: Aligning Machine Stylistic Preference for Machine-Revised Text Detection [39.6]
大規模言語モデル (LLM) はテキスト生成に革命をもたらした。機械生成テキストの検出はますます困難になっている。 ImBD(Imitate Before Detect)アプローチを提案する。次に、テスト対象のテキストの分布とマシンスタイルの分布を比較し、そのテキストが機械修正されたかどうかを判定する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:47:50 GMT)
Anchor3DLane++: 3D Lane Detection via Sample-Adaptive Sparse 3D Anchor Regression [38.7]
本稿では,3次元レーンアンカーを構造表現として定義し,FV特徴から直接予測を行う,Anchor3DLane++という新しいBEVフリー手法を提案する。 Anchor3DLane++は従来の最先端の手法よりも優れています。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:52:10 GMT)
Cannot or Should Not? Automatic Analysis of Refusal Composition in IFT/RLHF Datasets and Refusal Behavior of Black-Box LLMs [37.7]
拒絶(Refusals)とは、大きな言語モデル(LLM)が減少またはユーザ命令の実行に失敗するインスタンスである。既存の拒絶評価データセットは不十分である。 LLMの拒絶を分類するための包括的枠組みを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:16:53 GMT)
GeoBEV: Learning Geometric BEV Representation for Multi-view 3D Object Detection [36.2]
Bird's-Eye-View (BEV)表現は、マルチビュー3Dオブジェクト検出の主流パラダイムとして登場した。既存の方法では、BEV表現の幾何学的品質を見落とし、低分解能状態に置かれている。我々は高分解能高密度BEV表現を生成するためにラジアル・カルテシアンBEVサンプリング(RC-Sampling)を提案する。 In-Box Labelとともに、Centroid-Aware Inner Loss (CAI Loss) が開発され、物体の内部幾何学構造を捉えている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:15:10 GMT)
PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompt and Prompt-aware Mask [35.1]
本稿では,提供される衣服画像に基づいて衣料品を変更するテキスト編集可能な仮想試着タスクに取り組む。テキスト編集可能な仮想試行において、(i)ペア化された人着データのためのリッチテキスト記述を設計してモデルを訓練すること、(ii)既存の人の衣服のテクスト情報が新しい衣服の発生を妨害する紛争に対処すること、(iii)テキスト記述に沿った塗装マスクを適応的に調整すること、の3つの重要な側面が存在する。本手法では,個人と衣服の画像の詳細な記述を個別に生成するために,コンテキスト内学習によるLMMを利用する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:38:04 GMT)
Skull-to-Face: Anatomy-Guided 3D Facial Reconstruction and Editing [34.4]
頭蓋骨から3D顔を引き出すことは、法科学と考古学において難しい課題である。本稿では,エンドツーエンドの3次元顔再構成パイプラインと探索手法を提案する。実際の頭蓋顔面データセットを用いて実験を行い,提案したパイプラインの有効性を実証した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:04:02 GMT)
VIoTGPT: Learning to Schedule Vision Tools in LLMs towards Intelligent Video Internet of Things [34.0]
Video Internet of Things(VIoT)は、前例のない量のビデオデータを収集する可能性を示している。ドメイン固有の知覚モデルをどのようにスケジュールし、収集したビデオを均一に、効率的に、そして特にインテリジェントに分析するかは、難しい。我々は、人間と正しく対話し、知識動画をクエリし、視覚モデルを実行し、マルチメディアデータを協調的に分析するLLMに基づくフレームワークであるVIoTGPTを構築した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:32:54 GMT)
GSemSplat: Generalizable Semantic 3D Gaussian Splatting from Uncalibrated Image Pairs [33.7]
GSemSplatは,3次元ガウスに関連付けられた意味表現を,シーンごとの最適化や高密度画像収集,キャリブレーションなしに学習するフレームワークである。本研究では,2次元空間における領域固有の意味的特徴と文脈認識的意味的特徴を両立させる二重機能アプローチを用いる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:06:58 GMT)
Better Think with Tables: Leveraging Tables to Enhance Large Language Model Comprehension [33.3]
テーブルを用いた思考は、大型ランガウジモデル(LLM)が、人間の認知行動と整合する中間思考にテーブルを活用するのを支援する技術である。提案手法は,40.29%の平均相対的な性能向上,ロバスト性の向上,異なる要求,条件,シナリオに対する一般化性を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 23:31:03 GMT)
Towards a Unified Paradigm: Integrating Recommendation Systems as a New Language in Large Models [33.0]
大規模モデルにおける新しい言語としてのレコメンデーションシステム(Integrating Recommendation Systems as a New Language in Large Models)について紹介する。 RSLLMは、従来のレコメンデーションモデルからのIDベースのアイテム埋め込みとテキストアイテムの特徴を組み合わせた独自のプロンプト方式を使用している。ユーザのシーケンシャルな振る舞いを別の言語として扱い、プロジェクタを使用してID埋め込みとLLMの入力空間を整列する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:08:46 GMT)
NumbOD: A Spatial-Frequency Fusion Attack Against Object Detectors [30.5]
我々は様々な物体検出器(OD)に対する空間周波数核融合攻撃であるNummbODを提案する。まず、ターゲットとするOD出力から高品質なバウンディングボックスを選択するために、デュアルトラック攻撃目標選択戦略を設計する。我々は,予測ボックスのシフトと圧縮に指向性摂動を用い,分類結果を騙すために変更する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:16:34 GMT)
From Intention To Implementation: Automating Biomedical Research via LLMs [30.3]
本稿では,バイオメディカル研究プロセス全体を合理化するために設計された,初のエンドツーエンド自動システムであるBioResearcherを紹介する。複雑なタスクを論理的に関連するサブタスクに分解することで、BioResearcherは多分野要求と論理複雑性の課題を効果的に解決する。 BioResearcherは8つの未測定研究目標に対して平均実行成功率63.07%を達成している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:34:46 GMT)
RealisID: Scale-Robust and Fine-Controllable Identity Customization via Local and Global Complementation [29.4]
RealisIDは、ローカルブランチとグローバルブランチの連携を通じて、異なるコントロール機能を学ぶ。本手法は,個別のデータセットでのみ訓練された場合でも,マルチパーソンのカスタマイズに容易に対応できる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:36:25 GMT)
LLM-Powered User Simulator for Recommender System [29.3]
LLMを利用したユーザシミュレータを導入し、アイテムとのユーザエンゲージメントを明示的にシミュレートする。具体的には、ユーザ嗜好の明示的なロジックを特定し、LCMを活用してアイテムの特性を分析し、ユーザ感情を抽出する。本稿では,ユーザインタラクションシミュレーションの論理的および統計的洞察を相乗化するアンサンブルモデルを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:00:04 GMT)
AWRaCLe: All-Weather Image Restoration using Visual In-Context Learning [29.3]
悪天候下でのオールウェザー画像復元(AWIR)は、様々な種類の劣化が存在するため難しい課題である。 AWRaCLeは,分解特異的な視覚的コンテキスト情報を革新的に活用し,画像復元プロセスのステアリングを行う,AWIRの新しいアプローチである。 AWRaCLeにはDCE(Degradation Context extract)とCF(Context Fusion)が組み込まれている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:10:56 GMT)
Multifaceted User Modeling in Recommendation: A Federated Foundation Models Approach [28.7]
多面的ユーザモデリングは、きめ細かいパターンを発見し、ユーザデータから表現を学習することを目的としている。基礎モデルに基づくリコメンデーションに関する最近の研究は、トランスフォーマーアーキテクチャが複雑で非線形なユーザとイテムのインタラクション関係をキャプチャする顕著な能力を強調している。本稿では,ユーザ・イテムの対話パターンを逐次的にキャプチャする自己認識機構を用いて,レコメンデーションに特化して設計されたトランスフォーマー層を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:00:00 GMT)
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond [28.1]
我々は,大規模な学習目標のための統一的なアルゴリズムフレームワークを開発する。我々のフレームワークは、非回帰RL、PAC RL、報酬なし学習、モデル推定、嗜好に基づく学習など、多くの学習目標を処理する。応用として、一般化されたDECを有界化するための自然な十分条件として「分解可能表現」を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:16:25 GMT)
Decoupled Functional Central Limit Theorems for Two-Time-Scale Stochastic Approximation [28.1]
2回のスケール近似では、異なるステップサイズで異なるレートで2つのイテレーションが更新され、それぞれが他方に影響を与える。以前の研究では、これらの更新に対する誤差項の収束率はそれぞれのステップサイズにのみ依存していることが示されており、これは分離収束と呼ばれる性質である。我々の研究はこのギャップを埋めるために、2段階のSAに対して分離された機能中心極限定理を確立し、その挙動をより正確に評価する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:43:01 GMT)
FriendsQA: A New Large-Scale Deep Video Understanding Dataset with Fine-grained Topic Categorization for Story Videos [27.5]
我々は,大規模DVUデータセットを自動的に生成するために,大規模言語モデルに基づくマルチエージェントコラボレーションフレームワークであるStoryMindを考案した。データセットであるFriendsQAは、平均1,358秒のSitecom Friendsから派生したものだ。我々は、FriendsQAデータセットを用いて、10の最先端ビデオQAモデルに関する包括的な実験を行う。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:55:44 GMT)
LH-Mix: Local Hierarchy Correlation Guided Mixup over Hierarchical Prompt Tuning [27.0]
階層的テキスト分類(HTC)は、各テキストに1つ以上のラベルを割り当てることを目的としている。これを解決するためには、テキスト固有のローカル階層を組み込むことが不可欠である。まず、親子関係を捉えるために、まずローカル階層を手動の深さレベルのプロンプトに統合する。次に、この階層的なプロンプトチューニングスキームにMixupを適用し、兄弟関係およびピア関係における潜時相関を改善する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:47:18 GMT)
Optimized Gradient Clipping for Noisy Label Learning [26.5]
我々はOGC(Optimized Gradient Clipping)と呼ばれるシンプルだが効果的なアプローチを提案する。 OGCは、クリッピング後のクリーン勾配に対するノイズ勾配の比に基づいて、クリッピング閾値を動的に調整する。実験は, 対称, 非対称, インスタンス依存, 実世界の雑音など, 様々な種類のラベルノイズにまたがって, OGCの有効性を実証した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:47:27 GMT)
GAS: Generative Auto-bidding with Post-training Search [26.2]
本稿では,GASと呼ばれるポストトレーニング後検索を用いたフレキシブルで実用的な自動入札方式を提案し,基本方針モデルの出力を改良する。実世界のデータセットとKuaishou広告プラットフォーム上でのオンラインA/Bテストによる実験は、GASの有効性を実証している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:47:46 GMT)
vec2wav 2.0: Advancing Voice Conversion via Discrete Token Vocoders [26.0]
音声変換(VC)を向上する新しい音声離散トークンボコーダ vec2wav 2.0 を提案する。我々は、音声の自己教師型モデルからの離散トークンをソース音声のコンテンツ特徴として使用し、VCをインシデントヴォコーディングタスクとして扱う。 vec2wav 2.0はモノリンガルコーパスのみをトレーニングしても、競争力のあるクロスランガルVCを実現する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:49:28 GMT)
Generative Diffusion Modeling: A Practical Handbook [25.8]
拡散確率モデル、スコアベースの生成モデル、一貫性モデル、修正フロー、および関連する方法。コンテンツは拡散モデルの基礎、事前学習プロセス、および様々なポストトレーニング方法を含む。実用的なガイドとして設計され、理論的な深さよりも明瞭さとユーザビリティを強調している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:02:36 GMT)
Simultaneous Multiple Object Detection and Pose Estimation using 3D Model Infusion with Monocular Vision [25.7]
複数物体の検出とポーズ推定はコンピュータビジョンの重要なタスクである。単眼視と3Dモデルを用いた同時ニューラルモデリングを提案する。我々の同時多重物体検出・ポース推定ネットワーク(SMOPE-Net)は、エンドツーエンドのトレーニング可能なマルチタスクネットワークである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:51:22 GMT)
Joint Knowledge Editing for Information Enrichment and Probability Promotion [25.1]
大きな言語モデルに格納された知識は、実世界の情報の動的な性質を反映するタイムリーな更新を必要とする。知識リコールプロセスに関する最近の調査では,回答情報が低層に濃縮されていることが明らかになった。この矛盾は、プローブアプローチと関連する編集方法の両方が不十分であることを示している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:16:49 GMT)
MINTQA: A Multi-Hop Question Answering Benchmark for Evaluating LLMs on New and Tail Knowledge [24.7]
MINTQAは、マルチホップ推論における大規模言語モデルの能力を評価するベンチマークである。 MINTQAは、新しい知識を評価するための10,479対の質問応答ペアと、長い知識を評価するための17,887対の質問応答ペアからなる。 MINTQA上での22の最先端LCMの体系的評価により,複雑な知識ベースクエリを扱う能力に重大な制限があることが判明した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:17:12 GMT)
Towards AI-$45^{\circ}$ Law: A Roadmap to Trustworthy AGI [24.4]
我々は、信頼できるAGIに向けたバランスのとれたロードマップの指針として、textitAI-textbf$45circ$ Lawを提案する。このフレームワークは、現在のAI能力と安全性研究のための体系的な分類と階層構造を提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:52:15 GMT)
Why Do Speech Language Models Fail to Generate Semantically Coherent Outputs? A Modality Evolving Perspective [23.5]
テキストから音声へのモダリティを進化的に伝達することで,3つの要因の影響を別々に検討する。 A因子は比較的小さな影響を持ち、B因子は構文的および意味的モデリングに明らかに影響を与え、C因子は特に基本的な語彙的モデリングにおいて最も大きな影響を与えている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:59:19 GMT)
GraphAgent: Agentic Graph Language Assistant [23.3]
明示的なグラフ依存と暗黙的なグラフ強化セマンティック相互依存性に対処する自動エージェントパイプラインであるGraphAgentを提案する。 GraphAgentには3つの重要なコンポーネントがある: (i) 複雑なセマンティックな依存関係を反映した知識グラフを構築するグラフ生成エージェント; (ii) 多様なユーザクエリを解釈し、エージェントによる自己計画を通じて対応するタスクを定式化するタスク計画エージェント; (iii) ユーザクエリに対応するツールマッチングと呼び出しを自動化しながら、計画されたタスクを効率的に実行するタスク実行エージェント。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:13:32 GMT)
Revisiting In-Context Learning with Long Context Language Models [22.9]
In-Context Learning (ICL) は、言語モデルが入力コンテキストで提供される例に基づいて予測を行う手法である。 LCLM(Long Context Language Models)の出現により、コンテキストに含まれるサンプルの数が大幅に増加した。 4つのタスクにまたがる18のデータセットに関する広範な実験を通じて、LCLMの文脈でこれらのアプローチを再考する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:55:19 GMT)
Image Quality Assessment: Investigating Causal Perceptual Effects with Abductive Counterfactual Inference [22.7]
既存のフルリファレンス画像品質評価法(FR-IQA)は、画像歪みに対する人間の知覚応答を弱める複雑な因果メカニズムを捉えるのに失敗することが多い。本稿では,深いネットワーク特徴と知覚歪みの因果関係を明らかにするために,帰納的反事実推論に基づくFR-IQA法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:17:57 GMT)
Engineering Carbon Credits Towards A Responsible FinTech Era: The Practices, Implications, and Future [22.1]
炭素クレジットは、環境被害を軽減し、組織が炭素フットプリントを管理するのに役立つ重要なツールとして登場した。本研究は, 二酸化炭素排出管理の高度化に向けた工学的実践と解決策について考察する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:48:02 GMT)
MixRec: Heterogeneous Graph Collaborative Filtering [22.0]
そこで本稿では,MixRecを用いたグラフ協調フィルタリングモデルを提案する。本モデルでは,意図的不整合とマルチビヘイビア・モデリングを取り入れてこれを実現している。また、自己教師付きデータ拡張の利点を適応的に探求する、新しいコントラスト学習パラダイムを導入する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:42:21 GMT)
OpenRFT: Adapting Reasoning Foundation Model for Domain-specific Tasks with Reinforcement Fine-Tuning [21.9]
OpenAIは先日、Reinforcement Fine-Tuning (RFT)を導入した。本稿では,ドメイン固有タスクに対する一般推論モデルを微調整するemphOpenRFTを提案する。評価はSciKnowEval上で行われ、OpenRFTは各タスクに対してわずか100ドルのドメイン固有のサンプルで顕著なパフォーマンス向上を達成している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:21:30 GMT)
GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [21.9]
人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を考察する枠組みを提案する。主な考え方は、ポーズ先行と拡散モデルの潜在表現の間のグラフ位相構造を確立することである。事前訓練されたポーズ推定ネットワークに基づいてポーズ知覚損失を導入し、ポーズ差を最小限にする。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:42:45 GMT)
ImagineMap: Enhanced HD Map Construction with SD Maps [21.5]
Track Maplessは、マルチビューイメージと標準定義(SD)マップを処理するモデルを要求する。本稿では,車線やエリア検出性能を改善するために,SDマップを事前統合した新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:17:08 GMT)
Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory [21.4]
局所的およびグローバルな特徴に基づく説明のための統一的なフレームワークを導入する。特徴分布の影響を決定する3つのfANOVA分解を導入する。次に、合成および実世界のデータセットにおけるフレームワークの有用性を実証的に示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:12:16 GMT)
MAGIC++: Efficient and Resilient Modality-Agnostic Semantic Segmentation via Hierarchical Modality Selection [20.6]
本稿では,効率的なマルチモーダル融合と階層的モダリティ選択のための2つの重要なプラグアンドプレイモジュールからなるMAGIC++フレームワークを紹介する。本手法は実世界のベンチマークと合成ベンチマークの両方で最先端の性能を実現する。本手法は, 先行技術よりも大きなマージンで優れる新奇なモダリティ非依存環境において, 優れた手法である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:12:03 GMT)
WPMixer: Efficient Multi-Resolution Mixing for Long-Term Time Series Forecasting [20.3]
時系列予測のための新しい多分解能ウェーブレット分解モデルであるWavelet Patch Patch Mixer (WPMixer)を提案する。本モデルでは,長期連続予測のための最先端モデルと変圧器モデルとを比較検討した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:08:16 GMT)
Grams: Gradient Descent with Adaptive Momentum Scaling [20.0]
textbfGradient Descent with textbfAdaptive textbfMomentum textbfScaling (textbfGrams) Gramsは、ディープラーニングにおけるパラメータ更新の方向と大きさを分離する最適化アルゴリズムである。本結果は,大規模機械学習における効率的な最適化のための変換的アプローチとしてのGramsの可能性を強調した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:39:32 GMT)
Evaluating LLM Reasoning in the Operations Research Domain with ORQA [19.7]
我々は,大規模言語モデル(LLM)の一般化能力を評価するために設計された新しいベンチマークであるOperations Research Question Answering(ORQA)を導入し,適用する。このデータセットは、数学モデルを構築するために多段階推論を必要とする実世界の最適化問題を特徴としている。 LLaMA 3.1、DeepSeek、MixtralなどのオープンソースLLMの評価では、その質素な性能が明らかにされ、専門技術ドメインへの一般化能力のギャップが浮かび上がっている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:10:34 GMT)
DiffArtist: Towards Aesthetic-Aligned Diffusion Model Control for Training-free Text-Driven Stylization [19.6]
拡散モデルは、デノナイジングプロセス中にコンテンツとスタイルの生成を絡ませる。 DiffusionArtistは、拡散プロセス全体におけるコンテンツとスタイルの美的整合性制御を可能にする最初のアプローチである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:03:12 GMT)
KG-FPQ: Evaluating Factuality Hallucination in LLMs with Knowledge Graph-based False Premise Questions [19.2]
大規模言語モデル(LLM)は、誤った前提問題(FPQ)によって誤解されるおそれがある。知識グラフ(KG)に基づいたFPQを作成するための,自動化されたスケーラブルなパイプラインを導入する。本稿では,知識グラフに基づくFalse Premise Questions (KG-FPQ) のベンチマークについて述べる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:28:15 GMT)
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization [19.0]
光音響イメージング(PAI)は、再構成された結果の品質を低下させる固有の限界に悩まされる。本稿では,2次元と3次元のPAI再構成結果に対する新たな最適化手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:46:39 GMT)
Towards Edge General Intelligence via Large Language Models: Opportunities and Challenges [19.0]
エッジインテリジェンス(EI)は、エッジネットワークの計算能力を活用することで、リアルタイムなローカライズされたサービスを提供する上で重要な役割を果たしている。大規模言語モデル(LLM)の統合により、EIは次のステージへと進化する。本調査は, LLMを取り入れたEGIを, 集中型, ハイブリッド型, 分散型という3つの概念システムに分類し, 従来のEIとEGIの区別を明らかにした。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:40:35 GMT)
Learning to Generate Gradients for Test-Time Adaptation via Test-Time Training Layers [18.9]
テストタイム適応は、未ラベルのテストデータを使用してトレーニングされたモデルをオンラインで微調整することを目的としている。この最適化プロセスでは、エントロピーのような教師なし学習目標がノイズの多い学習信号に頻繁に遭遇する。そこで我々は,メタグラディエント・ジェネレータと呼ばれるエントロピー・ジェネレータを自動的に学習するために,学習と最適化のアプローチを採用した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:24:09 GMT)
FedCross: Intertemporal Federated Learning Under Evolutionary Games [18.3]
Federated Learning (FL)は、複数のクライアントが協力してローカルにトレーニングできるようにすることで、分散機械学習におけるプライバシー漏洩を軽減する。高モビリティ、断続接続、帯域幅制限を備えたモバイルネットワークは、クラウドサーバのモデル更新を著しく妨げている。我々は、中断したトレーニングタスクを実行可能なモバイルデバイスに移行することで、FLタスクの継続性を保証する、時間的インセンティブフレームワークであるFedCrossを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:59:57 GMT)
Subject-driven Text-to-Image Generation via Preference-based Reinforcement Learning [18.2]
我々は、信頼できる報酬信号を提供する$lambda$-Harmonic reward関数を提示する。提案アルゴリズムは,最新のCLIP-Iスコア0.833,CLIP-Tスコア0.314をDreamBench上で達成する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:42:13 GMT)
Online Preference-based Reinforcement Learning with Self-augmented Feedback from Large Language Model [17.4]
嗜好に基づく強化学習(PbRL)は、人間の嗜好に基づいて報酬を学習することで、巧妙な報酬工学を避けるための強力なパラダイムを提供する。本稿では,オンラインPbRLの特権情報に依存しないRL自己拡張大言語モデルフィードバック(RL-SaLLM-F)手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:15:25 GMT)
Out-of-Distribution Detection with Prototypical Outlier Proxy [17.1]
よく訓練されたディープモデルは、目に見えないテストデータに対して過剰な自信を持つ傾向があります。近年の研究では、実際のまたは合成された外れ値を利用して問題を緩和しようとしている。 POP(Prototypeal Outlier Proxy)を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:32:20 GMT)
Analysis of Speech Temporal Dynamics in the Context of Speaker Verification and Voice Anonymization [17.0]
自動話者検証および話者音声匿名化タスクへの適用における音声時間ダイナミクスの影響について検討する。音素持続時間のみに基づいて自動話者検証を行うための指標をいくつか提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:18:08 GMT)
CoF: Coarse to Fine-Grained Image Understanding for Multi-modal Large Language Models [16.9]
マルチモーダルな理解は、粗いものから細かいものへと、2つの段階に分けられる。第1段階では,MLLMに回答のほぼ面積を特定するよう促す。第2段階では、視覚的なプロンプトエンジニアリングにより、関連する領域に対するモデルの焦点をさらに強化する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:42:40 GMT)
DR-Encoder: Encode Low-rank Gradients with Random Prior for Large Language Models Differentially Privately [16.9]
大規模言語モデル(LLM)の微調整手順における3つの潜在的な情報漏洩について検討する。潜在的な情報漏洩に基づいて、2段階のランダム性を挿入することで、FedLLMのエンドツーエンドのプライバシー保証ソリューションを提供する。いくつかの基礎モデルと2つの評価ベンチマークを用いて,提案手法の有効性と精度を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:06:09 GMT)
Where am I? Cross-View Geo-localization with Natural Language Descriptions [16.9]
クロスビュージオローカライゼーションは、ジオタグ付き衛星画像やOSMとマッチングすることで、ストリートビュー画像の位置を特定する。本稿では,シーンテキストに基づいて,対応する衛星画像やOSMデータベースを検索することを目的とした,自然言語記述によるクロスビュージオローカライズのための新しいタスクを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:13:10 GMT)
GeoTexDensifier: Geometry-Texture-Aware Densification for High-Quality Photorealistic 3D Gaussian Splatting [16.9]
3D Gaussian Splatting (3DGS)は,3Dナビゲーション,VR(Virtual Reality),3Dシミュレーションなど,様々な分野で注目を集めている。高品質な3DGSの再構成は、実際の幾何学的表面とテクスチャの細部を適合させるために十分なスプラットと適切な分布に依存している。提案するGeoTexDensifierは,高品質なガウススプラットを再構築するためのジオテクスチャ対応デンシフィケーション戦略である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:25:53 GMT)
Ask-Before-Detection: Identifying and Mitigating Conformity Bias in LLM-Powered Error Detector for Math Word Problem Solutions [16.8]
Ask-Before-Detect (AskBD) フレームワークを導入し,大規模言語モデル(LLM)を用いて適応参照ソリューションを生成し,エラー検出を強化する。 GSM8Kの200例の実験では、AskBDがバイアスを効果的に軽減し、性能を向上させることが示されている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:08:36 GMT)
Online Learning from Strategic Human Feedback in LLM Fine-Tuning [16.4]
人間からのフィードバックからの強化学習(RLHF)は、人間の好みに合わせるために、大規模言語モデル(LLM)を微調整する上で不可欠なステップとなっている。 LLMファインチューニングプロセスにおける戦略的ラベル付け者に対するオンライン学習機構について検討した。我々は新しい動的ベイズゲームを定式化し、好みのアグリゲーションにおいて人間のラベルの重みを動的に調整する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:43:07 GMT)
Algorithm Design for Continual Learning in IoT Networks [16.4]
連続学習(CL)は、異なるタスクから連続的に生成されたストリーミングデータに対する新しいオンライン学習技術である。実用的なIoTネットワークでは、データをサンプリングしてさまざまなタスクを学習する自動運転車は、タスクパターンの順序をルーティングし変更することができる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:36:09 GMT)
Integrating Artificial Intelligence into Operating Systems: A Comprehensive Survey on Techniques, Applications, and Future Directions [16.3]
人工知能とオペレーティング・システムの統合はイノベーションの重要なフロンティアとして現れます。 AI-OS統合の現状は、先進的なコンピューティングパラダイムの進化を操る上で、その重要な役割を強調している。 Intelligent Operating Systemsの今後の展望は、OS設計がいかにして新たな可能性をもたらすかを議論する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:04:08 GMT)
Multi-Agent Q-Learning for Real-Time Load Balancing User Association and Handover in Mobile Networks [16.1]
本稿では,高密度セルネットワークにおけるリアルタイムロードバランシングユーザアソシエーションとハンドオーバを実現するためのマルチエージェントオンラインQラーニング(QL)アルゴリズムを提案する。学習ステップ毎にロードバランシングを満たすために,集中型と分散型の2つのマルチエージェントアクション選択ポリシーを提案する。いずれのポリシーも、様々なUE速度プロファイルにおけるネットワークダイナミクスによく適応していることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:22:01 GMT)
Empirical Coordination of Separable Quantum Correlations [16.0]
経験的調整は量子システムの自然な枠組みである。カスケードネットワークに着目して最適な調整率を確立する。量子協調ゲームにおける結果の結果について論じる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:19:03 GMT)
Dynamic Incremental Optimization for Best Subset Selection [15.8]
最良のサブセット選択は、多くの学習問題に対する金の標準と見なされている。主問題構造と双対問題構造に基づいて,効率的な部分集合双対アルゴリズムを開発した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:25:15 GMT)
A Progressive Transformer for Unifying Binary Code Embedding and Knowledge Transfer [15.7]
本稿では,バイナリコード埋め込みのための新しいトランスフォーマーベースの手法であるProTSTを紹介する。 ProTSTは、独特の木のような構造に基づく階層的なトレーニングプロセスを採用している。その結果, ProTSTは従来の2段階トレーニングに比べて14.8%改善した(F1, MRR, Recall@1)。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:53:33 GMT)
BloomCoreset: Fast Coreset Sampling using Bloom Filters for Fine-Grained Self-Supervised Learning [15.5]
Open-Set for fine-fine Self-Supervised Learning (SSL) problemは、未ラベルデータの大規模なプール(Open-Set)から画像のサブセット(Core-Set)を戦略的にサンプリングすることで、ダウンストリームタスクのパフォーマンスを向上させることを目的としている。本稿では,コアセット内のサンプルの品質を保ちながら,Open-Setからのサンプリング時間を著しく短縮するBloomCoresetを提案する。サンプルコアセットの有効性を示すため,提案手法を最先端の微細SSLフレームワークであるSimCoreに統合した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:18:58 GMT)
CloudLens: Modeling and Detecting Cloud Security Vulnerabilities [15.5]
クラウドコンピューティングサービスは、データストレージ、処理、コラボレーションのためのスケーラブルで費用対効果の高いソリューションを提供する。アクセス制御のミスコンフィグレーションが、クラウドアタックの主要な要因であることが多い。プランナーは、クラウド内のそのような脆弱性を特定するために攻撃を生成する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:53:07 GMT)
gECC: A GPU-based high-throughput framework for Elliptic Curve Cryptography [15.4]
Elliptic Curve Cryptography (ECC)は、Rivest-Shamir-Adleman (RSA)のような従来の技術に匹敵するセキュリティを提供する暗号化手法である。 ECCは、楕円曲線(EC)操作に関連する大きな性能上のオーバーヘッドによって、いまだに妨げられている。本稿では,GPUアーキテクチャ向けに最適化されたECCのための汎用フレームワークであるgECCを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 01:50:50 GMT)
Focusing on what to decode and what to train: SOV Decoding with Specific Target Guided DeNoising and Vision Language Advisor [15.4]
我々は、SOV-STG-VLAに3つの重要な要素、SOV-Object-Verb(SOV)デコーディング、特定ターゲットガイド(STG)デノナイズ、ビジョンランゲージ・アドバイザ(VLA)について紹介する。我々のSOVデコーダは、オブジェクト検出と動詞認識を新しい相互作用領域表現で切り離す。我々のVLAはSOV-STGを著しく改善し、最近のSOTAと比較して6分の1のトレーニングエポックでSOTA性能を達成する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:14:28 GMT)
Learning to Adapt to Low-Resource Paraphrase Generation [15.3]
パラフレーズ生成は長年にわたるNLPタスクであり、大きなコーパスの助けを借りて大きな成功を収めている。パラフレーズモデルを別のドメインに転送することは、特にデータがスパースである場合、ドメインシフトの問題に直面する。同時に、大規模事前学習言語モデル (PLM) を広く使用する場合、ラベル付きデータ不足のトレーニングにおいて、過度に適合する問題に直面している。メタラーニングにより最適化されたPLMの効果的なアダプタであるLAPAを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:55:52 GMT)
MU-Bench: A Multitask Multimodal Benchmark for Machine Unlearning [14.8]
MU-Benchは、Machine Unlearning(MU)の最初の包括的なベンチマークである。 MU-Benchは削除されたサンプルとトレーニングされたモデルの集合を統一し、タスクとデータモダリティを広範囲にカバーする。我々は、スケーラビリティ、パラメータ効率のよい微調整とカリキュラム学習の影響、データセットバイアスに対する感受性など、未学習の未研究のいくつかの側面を分析した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 23:47:58 GMT)
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec [14.7]
LSCodecは低話者分離能力と低話者分離能力を持つ離散音声である。再構成実験により、LSCodecは、単一のコードブックだけで、ベースラインよりも語彙サイズが小さい、優れた知性およびオーディオ品質を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:48:43 GMT)
RCAEval: A Benchmark for Root Cause Analysis of Microservice Systems with Telemetry Data [13.7]
近年,マイクロサービスシステムの根本原因分析(RCA)が注目されている。大規模なデータセットを含み、包括的な評価環境をサポートする標準ベンチマークはまだ存在しない。マイクロサービスシステムにおけるRCAEvalは、データセットとRCAEvalの評価環境を提供するオープンソースのベンチマークである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:30:02 GMT)
System-2 Mathematical Reasoning via Enriched Instruction Tuning [13.7]
Enriched Instruction Tuning (EIT)は、人間とAIのフィードバックを相乗化して、きめ細かい推論軌道を作る方法である。 EITはGSM8Kで84.1%、MATHで32.5%の精度を達成し、最先端の微調整およびプロンプト法を超越している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:49:27 GMT)
Computational Analysis of Character Development in Holocaust Testimonies [13.6]
本研究は,ナラティブ・タイムラインに沿ってキャラクタ開発を分析するための計算手法を提案する。ホロコーストの生存者証言の書き起こしをテストケースとみなし、それぞれが一人称の言葉で個人の物語を語る。我々は、生存者の宗教的軌道に焦点をあて、宗教的信念と実践に対する彼らの配置の進化を考察する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:20:53 GMT)
PointAD: Comprehending 3D Anomalies from Points and Pixels for Zero-shot 3D Anomaly Detection [13.6]
本稿では,未知の物体上の3次元異常を認識するために,CLIPの強力な一般化能力を伝達する新しい手法であるPointADを紹介する。 PointADは、複数の2Dレンダリングに3D異常をレンダリングし、それらを3D空間に投影する。我々のモデルはRGB情報を直接統合することができ、プラグアンドプレイ方式で3D異常の理解をさらに強化することができる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:19:07 GMT)
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models [13.4]
ブラックボックスFRモデルに対する堅牢で消去可能なプライバシ保護スキームであるErasableMaskを提案する。具体的には、EasableMaskは、ブラックボックス転送性を高める新しいメタ補助攻撃を導入している。また、画像品質を劣化させることなく、保護された顔における意味的摂動の消去をサポートする摂動消去機構を提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:30:26 GMT)
Semantic Hierarchical Prompt Tuning for Parameter-Efficient Fine-Tuning [13.4]
Visual Prompt Tuningは、フル微調整に比べて優れたパフォーマンスで知られている。船は性能を大幅に改善し、VTAB-1kタスクのVT-B/16バックボーンでVPTよりも精度が4.8%向上した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:28:52 GMT)
MVREC: A General Few-shot Defect Classification Model Using Multi-View Region-Context [13.3]
FSDMC(Few-shot defect multi-classification)は、製造業における品質管理の新たなトレンドである。本稿では、欠陥インスタンスの一般的な特徴を抽出するMVRECと呼ばれる一般的なFSDMCフレームワークを提案する。また、MVTec ADに基づく新しいFSDMCベンチマークであるMVTec-FSを導入し、インスタンスレベルのマスクアノテーションを備えた1228の欠陥画像を含む。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:14:45 GMT)
Distilled Decoding 1: One-step Sampling of Image Auto-regressive Models with Flow Matching [13.0]
自動回帰(AR)モデルは、テキストと画像生成において最先端のパフォーマンスを達成したが、トークン・バイ・トークン・プロセスにより、遅い生成に悩まされている。トレーニング済みのARモデルは、1、2ステップでアウトプットを生成することができるのか? 本研究では,ガウス分布から事前学習されたARモデルの出力分布への決定論的マッピングを生成するために,フローマッチングを用いたDD(Distilled Decoding)を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:21:54 GMT)
LLM-based relevance assessment still can't replace human relevance assessment [12.8]
近年の研究では、情報検索における関連性評価のための大規模言語モデル(LLM)が、人間の判断に匹敵する評価をもたらすことが示唆されている。 Upadhyayらは、LLMに基づく関連性評価は、TRECスタイルの評価における従来の人間関連性評価を完全に置き換えることができると主張している。本稿ではこの主張を批判的に検証し、この結論の妥当性を損なう実践的・理論的制約を強調した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:45:15 GMT)
Gaussian and Bootstrap Approximation for Matching-based Average Treatment Effect Estimators [12.8]
ガウス近似の精度に及ぼすマッチ数や処理バランスなどの重要な問題パラメータの影響を定量化する。我々の研究は、一般的に使われているATE推定器の新たな理論的枠組みを導入するだけでなく、漸近的に有効な信頼区間を構築するためのデータ駆動手法も提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:47:31 GMT)
A Backdoor Attack Scheme with Invisible Triggers Based on Model Architecture Modification [12.4]
従来のバックドア攻撃では、トレーニングデータに特定のトリガーで悪意のあるサンプルを注入する。より高度な攻撃は、モデルのアーキテクチャを直接変更する。本論文では、新たなバックドア攻撃方法を示す。モデルアーキテクチャ内にバックドアを埋め込んで,目立たない,ステルス的なトリガを生成する機能を備えている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:39:43 GMT)
LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty [12.3]
名前付きエンティティ認識(NER)は、自然言語理解の基本的なタスクである。本稿では,小型微調整モデルとLLM(LinkNER)を組み合わせ,RCCと呼ばれる不確実性に基づくリンク戦略を提案する。 LinkNERは、堅牢性テストにおいて、特にSOTAモデルを上回る、NERタスクパフォーマンスを向上させる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:18:24 GMT)
Breaking Barriers in Physical-World Adversarial Examples: Improving Robustness and Transferability via Robust Feature [12.3]
ディープニューラルネットワーク(DNN)は物理世界に広く応用されている。物理世界の逆数例(PAE)は入力に摂動を導入し、モデルの誤った出力を引き起こす。既存のPAEは、満足のいく攻撃性能と、攻撃効率とステルスネスのバランスのとれない2つの課題に直面します。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:34:02 GMT)
Similarity Trajectories: Linking Sampling Process to Artifacts in Diffusion-Generated Images [11.8]
本論文は, 拡散モデルにより生成した画像中のアーティファクトの重大さと, サンプリング過程における連続時間ステップ間の復号画像の類似性を示す。本論文では,サンプリングプロセスと画像アーティファクトとの相関を特徴付けるために,類似性トラジェクトリの概念を導入する。 680個の画像の注釈付きデータセットを用いて,画像中の人工物の存在を予測するために,これらの軌道上の分類器を訓練した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:52:29 GMT)
ECAFormer: Low-light Image Enhancement using Cross Attention [11.6]
低照度画像強調(LLIE)はコンピュータビジョンにおいて重要である。我々はクロスアテンショントランス(ECAFormer)による階層的相互強化を設計する。我々は,ECAFormerが複数のベンチマークで競合性能に到達し,PSNRを最適化法よりも3%近く改善したことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:06:33 GMT)
DTSGAN: Learning Dynamic Textures via Spatiotemporal Generative Adversarial Network [11.5]
一つの動的テクスチャから学習できる時間生成逆映像ネットワーク(DTSGAN)を導入する。 DTSGANのパイプラインでは、粗いスケールから最も細かいスケールまで、新しいビデオシーケンスが生成される。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:49:48 GMT)
Foundation Model for Lossy Compression of Spatiotemporal Scientific Data [11.5]
損失のある科学的データ圧縮のための基礎モデル(FM)を提案する。可変オートエンコーダ(E)と超高次構造と超高分解能(SR)モジュールを組み合わせる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:57:08 GMT)
SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework [11.2]
sPA画像はノイズの影響を受けやすいため、信号対雑音比(SNR)が低く、画質が損なわれる。フレーム平均化のような従来の denoising 技術は SNR の改善に有効だが、ダイナミックイメージングのシナリオでは実用的ではない。本研究では,SPA画像のノイズ化のためのSPADEフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:34:22 GMT)
A Note on Generalization in Variational Autoencoders: How Effective Is Synthetic Data & Overparameterization? [11.2]
変分オートエンコーダ(VAEs)は、科学的応用に使用される深い確率モデルである。我々のモチベーションは、現在訓練されている生成モデルを改善するか、あるいは傷つけるかという最近の議論に端を発する。本研究は, 事前学習した拡散モデルからのサンプルのトレーニングと, 特定の層でより多くのパラメータを併用することにより, VAEの過剰適合を効果的に軽減できることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:55:37 GMT)
Human-Guided Image Generation for Expanding Small-Scale Training Image Datasets [10.9]
特定の実世界のアプリケーションにおけるコンピュータビジョンモデルの性能は、利用可能な少数の画像によって制限される。より制御可能なデータセット拡張のためのヒューマンガイド画像生成法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:15:39 GMT)
Distributionally Robust Instrumental Variables Estimation [10.8]
We show that Wasserstein DRIVE is a distributionally robust IV estimation method。本稿では,Wasserstein DRIVEの分布を導出し,正規化パラメータを選択するためのデータ駆動方式を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:30:43 GMT)
Advances in Photoacoustic Imaging Reconstruction and Quantitative Analysis for Biomedical Applications [10.2]
光音響イメージング(PAI)は、光学分解能と音響透過深さの利点を生かし、安全性の向上を図った革新的なバイオメディカルイメージングのモダリティである。本稿では,光音響CT(PACT),光音響顕微鏡(PAM),光音響内視鏡(PAE)の3つの主要な実装を中心に,PAIの基礎原理を考察する。 PACT, PAM, PAEをまたいだ画像再構成・アーティファクト緩和のための従来の, あるいは深層学習(DL)手法の利用に関する最近の進歩を概説し, 画像品質の向上と画像プロセスの高速化に有意義な可能性を示唆している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:27:30 GMT)
Part-Of-Speech Sensitivity of Routers in Mixture of Experts Models [10.2]
本稿では,トークンの言語的特徴,特にPOS(Part-of-Speech)タグに基づいてトークンをルーティングする方法について検討する。 6つの人気のあるMoEモデルの発見は、特定のPOSカテゴリの専門家の専門化を明らかにしている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:03:41 GMT)
Integrating Random Effects in Variational Autoencoders for Dimensionality Reduction of Correlated Data [10.0]
LMMVAEは、従来のVAEラテントモデルを固定部品とランダム部品に分離する新しいモデルである。その結果, 正方形復元誤差と負の可能性損失は, 未確認データに対して有意に改善した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:20:17 GMT)
Discovering Effective Policies for Land-Use Planning with Neuroevolution [9.9]
森林、都市部、農業など、異なる用途の土地がどのように配分されているかは、地球上の炭素収支に大きな影響を及ぼす。意思決定者が利用できるさまざまな選択肢を効率的に評価できるようにする代理モデルを学ぶことができる。進化的探索プロセスは、特定の場所に対する効果的な土地利用政策を発見するために使用できる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:37:35 GMT)
Bi-Sparse Unsupervised Feature Selection [9.5]
非教師付き特徴選択(UFS)は、画像処理の上昇技術となっている。本稿では,グローバル構造とローカル構造の両方を同時に満たすために,BSUFSと呼ばれる新しい二スパースUFS方式を提案する。合成および実世界のデータセットに対する大規模な数値実験により,提案したBSUFSの有効性が示された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 01:43:58 GMT)
Relaxation of A Thermally Bathed Harmonic Oscillator: A Study Based on the Group-theoretical Formalism [9.5]
熱環境に浸漬した高調波発振器が平衡状態にどのように緩和するかを解析的に検討した。特に、初期状態がガウス状態(すなわち圧縮されたコヒーレント状態)である場合、環境温度の臨界値が存在することが分かる。エントロピーは最初は最大に達するまで増加し、その後は最小に達するまで下降し、そこから上昇し、最終的に平衡値に収束する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:53:12 GMT)
Efficient cryogenic nonlinear conversion processes in periodically-poled thin-film lithium niobate waveguides [9.4]
周期的にポーリングされた薄膜のニオブ酸リチウム(TFLN)導波路は、古典的および量子的信号処理の重要な基盤となる。周期的な極性TFLN導波路は低温と室温の両方で高い変換効率を保っていることがわかった。これらの結果は、低温応用のためのTFLN波長変換装置の有意義な可能性を示し、将来のスケーラブルな量子フォトニクスシステムを開発した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:13:19 GMT)
Segmented Private Data Aggregation in the Multi-message Shuffle Model [9.3]
我々は、差分プライバシーのマルチメッセージシャッフルモデルにおいて、セグメント化されたプライベートデータアグリゲーションの研究を開拓した。当社のフレームワークでは,ユーザに対するフレキシブルなプライバシ保護と,アグリゲーションサーバのための拡張ユーティリティを導入している。提案手法は,既存手法と比較して推定誤差を約50%削減する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:12:36 GMT)
Vision Language Models See What You Want but not What You See [9.3]
他人の意図を知り、他人の視点をとることは、人間の知性の2つの中核的な構成要素である。このような能力を持つ機械を浸透させることは、人間レベルの人工知能を構築するための重要なステップである。視覚言語モデルにおける意図的理解と視点獲得について検討する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:13:52 GMT)
Vision Language Models Know Law of Conservation without Understanding More-or-Less [9.3]
ConserveBenchは、物理量の4次元にわたる365の認知実験の電池である。ビジョン言語モデルは一般に保存できるが、非変換タスクでは失敗する傾向にある。これは、少なくとも具体的な領域において、保存の法則が、量の概念的な理解なしに存在することを示唆している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:59:36 GMT)
Hate Speech Detection and Target Identification in Devanagari Languages via Parameter Efficient Fine-Tuning of LLMs [9.2]
本稿では,ヘイトスピーチ検出とターゲット識別のためのPEFT(Efficient Fine tuning)に基づくソリューションを提案する。我々は,Devanagariデータセットを用いた複数のLCMの評価を行った(Thapa et al., 2025)。以上の結果から,Devanagari-scriptedコンテンツに対するアプローチの有効性が示された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:38:24 GMT)
A Multi-modal Approach to Dysarthria Detection and Severity Assessment Using Speech and Text Information [9.2]
本研究は、音声とテキストのモダリティを両立させる新しいアプローチを提案する。本手法は,クロスアテンション機構を用いて,音声とテキスト表現の音響的・言語的類似性を学習する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:08:35 GMT)
PsychAdapter: Adapting LLM Transformers to Reflect Traits, Personality and Mental Health [9.2]
我々は、標準言語モデルトランスフォーマーアーキテクチャ「サイコアダプタ」の軽量な修正を提案する。サイコアダプターは経験的に派生した特徴言語パターンを用いて、特定の性格、人口統計学的、精神的な健康特性(無言・無言)を自然言語で生成する例えば、専門家はサイコアダプターが生成したテキストの出力を評価し、意図した特徴レベルと一致し、ビッグファイブの人格の平均精度は87.3%、うつ病と生活満足度は96.7%であった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:22:40 GMT)
Anonymous Shamir's Secret Sharing via Reed-Solomon Codes Against Permutations, Insertions, and Deletions [9.1]
本稿では,コードワードの記号を置換し,挿入や削除を行う相手に対して,リード・ソロモン符号の性能について検討する。完全に匿名の秘密共有スキームは、(1)秘密が再構築される前に参加者の身元は明らかにされず、(2)無許可の参加者の共有は均一かつ独立である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:51:16 GMT)
Technical Report: Towards Spatial Feature Regularization in Deep-Learning-Based Array-SAR Reconstruction [8.8]
アレイ合成開口レーダ(Array-SAR)は高品質な3Dマッピングに有意な可能性を証明している。ほとんどの研究はピクセル・バイ・ピクセルの再構成に依存しており、建築構造のような空間的特徴を無視し、穴や破片のような人工物に繋がる。我々の研究は、空間的特徴の正規化をDLベースのArray-SAR再構成に統合し、重要な疑問に対処する。その結果, 空間的特徴正規化は再建精度を著しく向上させ, より完全な建物構造を復元し, 騒音や外れ値の低減によるロバスト性の向上を図っている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:31:11 GMT)
Speech-Based Depression Prediction Using Encoder-Weight-Only Transfer Learning and a Large Corpus [8.7]
音声に基づくアルゴリズムはうつ病などの行動状態の管理に関心を寄せている。本稿では,軽量エンコーダとエンコーダ重みのみを伝達する音声に基づくトランスファー学習手法について検討する。結果は、このアプローチは柔軟性があり、効率的な実装を約束していることを示唆している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:21:51 GMT)
Analyzing Mass School Shootings in the United States from 1999 to 2024 with Game Theory, Probability Analysis, and Machine Learning [8.5]
銃乱射事件の確率は1校当たり1.23 E-5(または81,604人)である。新型コロナウイルス(COVID-19)時代のマススクール射撃と比較して、米国でのマススクール射撃は4つの機械学習モデルにより減少すると予想する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 23:34:31 GMT)
Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation [8.4]
本研究では,ロボットが学習した課題における能力の回復を効果的に行う方法を提案する。提案手法は,EM(Epsodic Memory)を用いて,局所的な微調整のためのテスト中のトレーニングと検索において経験的リプレイを可能にする。得られた実験の最も困難な部分を強調する選択重み付け機構を導入する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:09:48 GMT)
Dynamic Language Group-Based MoE: Enhancing Code-Switching Speech Recognition with Hierarchical Routing [8.4]
Mixture of Experts (MoE)は、コードスイッチング音声認識(CS-ASR)タスクを扱うための有望なアプローチである。 CS-ASRタスクを効果的に処理できる動的言語グループベースのMoEであるDLG-MoEを提案する。さまざまなトップ$の推論とストリーミング機能をサポートし、モデルパラメータを柔軟に訓練してモノリンガルなサブモデルを得ることもできる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:01:37 GMT)
Approximate Contraction of Arbitrary Tensor Networks with a Flexible and Efficient Density Matrix Algorithm [8.3]
低ランク近似を用いてテンソルネットワークの収縮を効率的に近似する手法を提案する。提案アルゴリズムは,低ランク近似を行う場合,環境の大部分を組み込む柔軟性を有する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:58:40 GMT)
Adversarial Diffusion Model for Unsupervised Domain-Adaptive Semantic Segmentation [8.3]
本稿では,CICLDベースセマンティックモデルを用いた新しいコンディショナルおよびインターコーダ接続遅延拡散法を提案する。 CICLDには、セグメンテーション中の文脈理解を改善するための条件付け機構と、細粒度の詳細と空間階層を保存するためのコーダ間接続が組み込まれている。 3つのベンチマークデータセット(GTA5、Synthia、Cityscape-shows)で、CICLDは最先端のUDAメソッドよりも優れています。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:55:41 GMT)
Quantum Logic Locking (QLL): Safeguarding Intellectual Property for Quantum Circuits [7.7]
量子コンピューティングにおいて、特定の量子関数を実装する量子回路は正しい解を生成するのに不可欠である。本稿では,制御ゲートを挿入して量子回路の機能を制御する量子論理ロックを提案する。以上の結果から,量子論理ロックは量子回路の関数を効果的に隠蔽し,平均忠実度は1%以下であることが示唆された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:29:24 GMT)
Visual Prompting with Iterative Refinement for Design Critique Generation [7.7]
UI批判に対する反復的視覚的プロンプト手法を提案する。スクリーンショット内の各コメントを特定の領域にマップする、対応するバウンディングボックスとともに、デザインコメントのリストを生成する。 Gemini-1.5-pro と GPT-4o を用いて提案手法の評価を行ったところ,人間の専門家はパイプラインが生み出す設計批判を概ね好んでいることがわかった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:35:57 GMT)
AV-DTEC: Self-Supervised Audio-Visual Fusion for Drone Trajectory Estimation and Classification [7.6]
AV-DTEC (英語: AV-DTEC) は、オーディオ・ヴィジュアル・フュージョンベースの対UAVシステムである。 LiDARによって生成されたラベルを使って、自己教師付き学習を用いて訓練される。並列選択状態空間モデルにより、オーディオと視覚の特徴を同時に学習する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:58:15 GMT)
Autoregressive Speech Synthesis with Next-Distribution Prediction [7.5]
KALL-Eは,音声合成のための次世代分布予測を用いた,新しい自己回帰型(AR)言語モデリング手法である。 KALL-Eは、VAEや拡散に基づくコンポーネントに頼ることなく、テキスト上で条件付けられた連続的な音声分布を直接モデル化し、予測する。 1つのAR言語モデルは、Kulback-Leibler分散損失を制約として、これらの連続した音声分布をテキストから予測する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:03:24 GMT)
Leveraging Consistent Spatio-Temporal Correspondence for Robust Visual Odometry [7.5]
S-Temporal Visual Odometry (STVO) は,マルチフレームフローマッチングの精度と一貫性を高めるための,新しいディープネットワークアーキテクチャである。我々のSTVOはETH3Dベンチマークの最先端性能とKITTI Odometryベンチマークの38.9%を実現している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:47:13 GMT)
HiCoM: Hierarchical Coherent Motion for Streamable Dynamic Scene with 3D Gaussian Splatting [7.5]
本稿では,HiCoMと呼ばれる3つの重要なコンポーネントを持つ効率的なフレームワークを提案する。まず、摂動平滑化戦略を用いて、コンパクトで頑健な初期3DGS表現を構築する。次に、3次元ガウスの固有非一様分布と局所的一貫性を利用する階層的コヒーレント運動機構を導入する。 2つの広く利用されているデータセットを用いて行った実験により、我々のフレームワークは最先端の手法の学習効率を約20%向上することが示された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:36:16 GMT)
Bias in Motion: Theoretical Insights into the Dynamics of Bias in SGD Training [7.5]
機械学習システムは、データの望ましくない特徴を活用してバイアスを取得し、異なるサブポピュレーションの精度に影響を与えることが多い。本稿では, ガウス混合モデルを用いて, 教師学生によるデータサブポピュレーションのモデル化におけるバイアスの進化について検討する。この発見を公平性と堅牢性に適用することで、不均一なデータと突発的な特徴がバイアスを発生し増幅する方法について、いつ、どのように、どのように、どのようにして、そして、どのようにして、そのバイアスを増大させるかを説明します。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:59:00 GMT)
Contextualizing Security and Privacy of Software-Defined Vehicles: State of the Art and Industry Perspectives [7.2]
Software-Defined Vehicles(SDV)によるサイバーセキュリティとプライバシの課題に関する調査 SDVはOTA(Over-the-Air)アップデートやV2X(Valby-to-Everything)通信といった機能をますます統合している。 SDVへの移行は、車両が大量の機密データを収集するなど、重要なプライバシー上の懸念も引き起こす。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:51:08 GMT)
Latent Schr{ö}dinger Bridge Diffusion Model for Generative Learning [7.1]
潜在空間におけるシュリンガー橋拡散モデルを用いた新しい生成学習手法を提案する。我々は、Schr"odingerブリッジフレームワークを用いて、潜伏空間内の拡散モデルを開発する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:02:23 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0]
平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:11:18 GMT)
Prompting Large Language Models with Rationale Heuristics for Knowledge-based Visual Question Answering [6.7]
我々は,先行手法がLarge Language Models (LLM) の容量を十分に活性化していないことを論じる。本稿では,知識に基づく VQA のための LLM と Rationale Heuristics を併用した PLRH というフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:14:35 GMT)
Webcam-based Pupil Diameter Prediction Benefits from Upscaling [6.3]
本研究では,バイコビックから高度超解像まで,様々なアップスケーリング手法が瞳孔径予測に与える影響について検討した。以上の結果から,大規模データセットで訓練した瞳孔径予測モデルは,選択したアップスケーリング手法やスケールに非常に敏感であることが示唆された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:35:34 GMT)
Modular Conversational Agents for Surveys and Interviews [6.0]
本稿では,対話エージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。 3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。その結果、このモジュラーアプローチの有効性と、重要な倫理的、プライバシ、セキュリティ、トークン消費の懸念にどのように対処するかが示されている。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:00:16 GMT)
KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis [6.0]
KG4Diagnosisは、大規模言語モデルと知識グラフの自動構築を組み合わせた、新しい階層型マルチエージェントフレームワークである。本フレームワークは,2層構造を用いて実世界の医療システムをミラーリングする。初期評価とトリアージのためのGPエージェントであり,特定のドメインにおける深度診断のための特殊なエージェントと協調する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:40:59 GMT)
Fair and Accurate Regression: Strong Formulations and Algorithms [5.9]
本稿では,メトリクスを組み込んだ回帰問題を解くための混合整数最適化手法を提案する。公正回帰モデルのトレーニングのための正確な定式化を提案する。最小二乗および対数回帰問題に対する数値実験は、競合統計性能を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:04:54 GMT)
Semantic Web: Past, Present, and Future [5.9]
私たちは、セマンティックウェブの古典的な概念と基礎を振り返る。最近の概念には、証明、セキュリティ、信頼などが含まれる。セマンティックウェブの今後の方向性を概観する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:58:14 GMT)
Video Domain Incremental Learning for Human Action Recognition in Home Environments [5.9]
ビデオドメインインクリメンタルラーニング(VDIL)の問題点を定式化する。 VDILは、モデルが一定のアクションクラスを維持しながら、異なるドメインから継続的に学習することを可能にする。本研究では,制約のない家庭環境を対象としたドメインインクリメンタルな人間行動認識のベンチマークを紹介する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:40:48 GMT)
A Lorentz-Equivariant Transformer for All of the LHC [5.3]
ローレンツ等価な幾何アルゲブラ変換器(L-GATr)は、大規模ハドロン衝突型加速器において、幅広い機械学習タスクに対して最先端の性能を発揮することを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:02:46 GMT)
Robustness of Large Language Models Against Adversarial Attacks [5.3]
GPT LLMファミリーのロバスト性に関する総合的研究を報告する。我々は2つの異なる評価手法を用いてレジリエンスを評価する。実験により,これらのモデルのロバスト性は著しく変化し,文字レベルと意味レベルの両方の敵攻撃に対する脆弱性の程度が変化することが示された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:21:15 GMT)
PINN-EMFNet: PINN-based and Enhanced Multi-Scale Feature Fusion Network for Breast Ultrasound Images Segmentation [5.2]
本研究では,PINNに基づくマルチスケール機能融合ネットワークを提案する。ネットワークは、いくつかの構造的革新を通じて、効率的に統合し、グローバルにマルチスケールの機能をモデル化する。このデコーダ部では,マルチスケール・フィーチャー・リファインメント・デコーダが採用され,マルチスケール・スーパービジョン機構と修正モジュールを組み合わせることで,セグメンテーション精度と適応性を大幅に向上する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:16:00 GMT)
Processing and Decoding Rydberg Leakage Error with MBQC [5.2]
本稿では,測定に基づく量子計算において,ライドバーグの漏洩誤差を管理する新しい手法を提案する。我々は、トポロジカルクラスタ状態の固有構造と最終リーク検出情報を活用して、Rydbergリークから伝播エラーを検出する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:40:36 GMT)
Tackling the Unlimited Staleness in Federated Learning with Intertwined Data and Device Heterogeneities [5.0]
フェデレートラーニングは、クライアントの異なるローカルデータ分散と、モデルの更新をアップロードする際のレイテンシに起因する、データとデバイスの不均一性によって影響を受ける可能性がある。本稿では,この変換の精度と計算効率を保証する新しいFLフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:15:04 GMT)
Sharpness-Aware Minimization with Adaptive Regularization for Training Deep Neural Networks [4.9]
Sharpness-Aware Minimization (SAM) は機械学習タスクにおけるモデル一般化の改善に極めて有効であることが証明されている。本稿では,適応正規化パラメータを動的に更新するフレキシブルなシャープネス比ルールを導入するSAM with Adaptive Regularization (SAMAR)を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:40:02 GMT)
TSEML: A task-specific embedding-based method for few-shot classification of cancer molecular subtypes [4.8]
異種および小癌のデータセットにおける数発の分子サブタイプ予測問題に焦点をあてる。タスク固有の埋め込み型メタラーニングフレームワーク(TSEML)を導入する。本フレームワークは,数発の分子サブタイプ分類の問題に対処する上で,優れた性能を実現する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:56:50 GMT)
Shadow-Frugal Expectation-Value-Sampling Variational Quantum Generative Model [4.5]
観測可能な予測値サンプリング(OT-EVS)を導入する。結果として得られるモデルは、標準のEVSと比較して表現性を高めます。本稿では,OT-EVSのニーズに適応した対向訓練手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:35:46 GMT)
Inverse design of potential metastructures inspired from Indian medieval architectural elements [4.5]
特別に私たちを農耕したモチーフは、タジ・マハルに近いアグラ市にあるイティマド・ドゥ・ダウラの墓に由来する。添加物製造法を用いて構造を作製し, その振動特性を実験的, 数値的に検討した。これらの構造パネルの包括的研究により、弾性波伝搬の制御と適切な周波数帯域の生成における高い性能が明らかとなった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:10:48 GMT)
SAIL: Sample-Centric In-Context Learning for Document Information Extraction [4.3]
ドキュメント情報抽出(DIE)は、ビジュアルリッチドキュメント(VRD)から構造化された情報を抽出することを目的としている。以前のフルトレーニングアプローチは強い性能を示してきたが、見つからないデータへの一般化に苦労する可能性がある。 DIEのためのサンプル中心型インコンテキスト学習(SAIL)を提案し,事前学習モデルに対する正確なガイダンスを提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:58:59 GMT)
Generalized Teleportation Fidelity and Singlet Fraction and their Relation for (In)-distinguishable Particles and Its Applications [4.2]
量子テレポーテーションは、予め確立された複合システムを利用して、遠隔地間で量子情報を効率的に転送する。テレポーテーション・ヒンジの有効性を評価することは、入力状態と出力状態の類似性を表す。我々の関係は、その識別可能性、分離性、最大絡み合い構造の存在、自由度の数の観点から、異なる種類の複合状態の特徴付けにどのように役立つかを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:20:38 GMT)
Self-Corrected Flow Distillation for Consistent One-Step and Few-Step Text-to-Image Generation [3.9]
フローマッチングは、生成モデルをトレーニングするための有望なフレームワークとして登場した。本稿では, 整合性モデルと対向学習を統合した自己補正型流動蒸留法を提案する。この研究は、数ステップと1ステップのサンプリングで一貫した生成品質を達成するための先駆者である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:48:49 GMT)
Chebyshev Feature Neural Network for Accurate Function Approximation [3.9]
本稿では,関数を機械的精度まで近似できる新しいDeep Neural Networkアーキテクチャを提案する。 Chebyshev Feature Neural Network (CFNN)と呼ばれる新しい構造では、学習可能な周波数を持つChebyshev関数を最初の隠れ層として採用している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:43:48 GMT)
Rethinking Performance Analysis for Configurable Software Systems: A Case Study from a Fitness Landscape Perspective [3.8]
私たちはパフォーマンス分析を再考する新しい視点を提唱します -- 構成空間を構造化された風景としてモデル化します。当社のフレームワークは,実システムの32ドル(約3,800円)のワークロードから,ベンチマークによる構成を86ドル(約8,800円)にします。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:51:33 GMT)
A Multi-AI Agent System for Autonomous Optimization of Agentic AI Solutions via Iterative Refinement and LLM-Driven Feedback Loops [3.7]
本稿では,産業間におけるエージェントAIソリューションを自律的に最適化するフレームワークを提案する。このフレームワークは、仮説を自律的に生成し、テストすることで、人間の入力なしに最適な性能を達成する。ケーススタディでは、アウトプットの品質、妥当性、動作性が大幅に改善された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:08:04 GMT)
Modeling Unknown Stochastic Dynamical System via Autoencoder [3.5]
本稿では,未知の力学系に対する正確な予測モデルを軌道データから学習する数値的手法を提案する。オートエンコーダ(autoencoder)というアイデアを使って、観測されていない潜在確率変数を識別する。また、非ガウス雑音によって駆動されるシステムにも適用できる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:50:50 GMT)
Separating Drone Point Clouds From Complex Backgrounds by Cluster Filter -- Technical Report for CVPR 2024 UG2 Challenge [3.5]
本稿では,教師なしパイプラインを用いた簡易なUAV検出手法を提案する。時空間シーケンス処理を使用して複数のライダーデータセットを効果的に融合し、UAVの位置を追跡し、決定する。本手法はCVPR 2024 UG2+ Challengeで4位を獲得し,本手法の有効性を確認した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:44:43 GMT)
DCC: Differentiable Cardinality Constraints for Partial Index Tracking [3.4]
インデックス追跡はポートフォリオの最適化を目的とした受動的投資戦略として人気があるが、インデックスの複製は高い取引コストにつながる可能性がある。本稿では,索引追跡のための可変濃度制約を提案し,浮動小数点精度認識手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:05:56 GMT)
SoK: Usability Studies in Differential Privacy [3.4]
差分プライバシー(DP)は、個人プライバシをデータ分析で保護するための重要なアプローチとして登場した。本稿では,DPのユーザビリティとコミュニケーションに関する既存研究の包括的体系化について述べる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:21:57 GMT)
Towards Instance-Wise Calibration: Local Amortized Diagnostics and Reshaping of Conditional Densities (LADaR) [3.3]
本稿では,LADaR(Local Amortized Diagnostics and Reshaping of Conditional Densities)フレームワークを紹介する。これには、解釈可能な局所キャリブレーション診断を生成する、textttCal-PIT$と呼ばれるアルゴリズムが含まれている。我々の主な科学応用は、画像データから得られる銀河距離の条件密度推定である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:18:26 GMT)
Compositional Oil Spill Detection Based on Object Detector and Adapted Segment Anything Model from SAR Images [3.3]
本稿では,オブジェクト検出器(YOLOv8など),SAM(Adapted Segment Anything Model),OMF(Ordered Mask Fusion)モジュールからなる複合オイル流出検出フレームワークSAM-OILを提案する。 SAM-OILは,石油流出検出における強力なSAMの最初の応用である。特に,SAM-OIL戦略では,YOLOv8を用いて油流出関連物のカテゴリとバウンディングボックスを取得し,適応SAMにバウンディングボックスを入力し,カテゴリ非依存マスクを検索し,最終的にOMFモジュールを用いてマスクとカテゴリを融合する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:35:53 GMT)
A Conditional Diffusion Model for Electrical Impedance Tomography Image Reconstruction [3.3]
電気インピーダンストモグラフィ(EIT)は、組織や材料の電気伝導度のイメージを再構成する非侵襲的イメージング技術である。アンダーサンプル電圧データと高分解能伝導率画像とのミスマッチにより、EIT画像再構成が悪くなる。 CDEITと呼ばれるEIT再構成のための条件拡散モデルに基づく新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:43:00 GMT)
Environment Descriptions for Usability and Generalisation in Reinforcement Learning [3.1]
本稿では、RLをより広く採用できるようにするためには、環境がユーザフレンドリーなドメイン固有言語や自然言語で記述される方法論に移行することが研究コミュニティにとって重要である、と論じる。言語ベースの環境記述は、RLのユーザビリティの改善以外にも、価値あるコンテキストを提供し、任意の言語で記述できるすべての環境の集合の中で、訓練されたエージェントが見えない環境に一般化する能力を高める可能性がある。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:02:13 GMT)
Safely Learning with Private Data: A Federated Learning Framework for Large Language Model [3.1]
フェデレートラーニング(FL)は、分散プライベートデータを用いたモデルのトレーニングに理想的なソリューションである。 FedAvgのような従来のフレームワークは、大きな言語モデル(LLM)には適さない本稿では,サーバサイド攻撃とピアクライアント攻撃の両方によるデータ漏洩を防止するFL-GLMを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:16:28 GMT)
Transformer Block Coupling and its Correlation with Generalization in LLMs [3.0]
大規模言語モデル(LLM)は自然言語処理において大きな進歩を遂げている。変換器ブロックを通過する個々のトークンの軌跡を辿り、ジャコビアン行列を通してこれらの軌跡に沿って系を線形化する。トークンと深さをまたいだ頂点特異ベクトルのカップリングを特徴とする,様々な LLM における $textbftransformer block coupling$ 現象を明らかにする。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:54:57 GMT)
LLM Agent for Fire Dynamics Simulations [3.0]
FoamPilotはFireFOAMのユーザビリティを高めるために設計された概念実証エージェントである。 FireFOAM は OpenFOAM を用いて構築された火災力学と火災抑制シミュレーションの解法である。 FoamPilotは、コードインサイト、ケース構成、シミュレーション評価の3つのコア機能を提供する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:03:35 GMT)
Secure numerical simulations using fully homomorphic encryption [2.9]
データプライバシは、医療、財務、エンジニアリングデータなどの機密情報に数値シミュレーションを使用する場合、重要な懸念事項である。完全同型暗号化(FHE)は、暗号化されたデータに直接セキュアな計算を可能にすることによって、データのプライバシを実現するための有望なソリューションを提供する。暗号的に安全な数値シミュレーションが可能であることを示すが、計算オーバーヘッドとFHEによる数値誤差について慎重に検討する必要がある。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:11:28 GMT)
Risk Bounds for Mixture Density Estimation on Compact Domains via the $h$-Lifted Kullback--Leibler Divergence [2.8]
標準KL分散の一般化として、$h$-lifted Kullback--Leibler(KL)分散を導入する。我々は、対応する最大$h$-lifted chance 推定器の計算手順を開発する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:52:42 GMT)
Refining CNN-based Heatmap Regression with Gradient-based Corner Points for Electrode Localization [2.8]
リチウムイオン電池の電極位置検出手法を提案する。畳み込みニューラルネットワークは、この領域内の極の位置を回帰するために使用される。後退位置を最適化し、コーナーポイント先行値を用いて補正する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:34:01 GMT)
Subgradient Selection Convergence Implies Uniform Subdifferential Set Convergence: And Other Tight Convergences Rates in Stochastic Convex Composite Minimization [2.7]
非滑らかな近似最適化の非平均化では、部分微分写像の均一収束を理解することが重要である。この研究は、部分微分写像の一様収束と下次写像の集団を結びつける。偏微分凸複合目的に対する一様収束率を導出する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:33:12 GMT)
Detecting and Classifying Defective Products in Images Using YOLO [2.5]
YOLO(You Only Look Once)アルゴリズムは、製品欠陥検出の分野で目立った解決策として登場した。本研究の目的は, YOLOアルゴリズムを用いて製品画像の欠陥を検出し, 分類することである。その結果,検出精度を高く保ちながらリアルタイム検出が可能であることが示唆された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:14:01 GMT)
Sparse Generation: Making Pseudo Labels Sparse for Point Weakly Supervised Object Detection on Low Data Volume [2.4]
従来の擬似ラベル生成手法は、低データボリュームや高密度オブジェクト検出タスクでは不十分である。弱教師付き擬似ラベルの生成をモデルのスパース出力とみなし、擬似ラベルをスパースにするための解決策としてスパース生成を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:15:32 GMT)
ViLBias: A Framework for Bias Detection using Linguistic and Visual Cues [2.3]
ViLBiasは、Large Language Models(LLM)とVision-Language Models(VLM)を活用して、ニュースコンテンツの言語的および視覚的バイアスを検出するフレームワークである。コントリビューションには、多様なニュースソースからの視覚を伴うテキストコンテンツをペアリングする新しいデータセットが含まれている。経験的分析により、視覚的手がかりをテキストと組み合わせることで、バイアス検出精度が3～5%向上することが示された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:05:30 GMT)
Speedup of high-order unconstrained binary optimization using quantum Z2 lattice gauge theory [2.2]
この問題に対する量子アルゴリズムとその対応する量子インスピレーション付き古典的アルゴリズムを提案する。量子インスパイアされた古典的アルゴリズムを実行することにより、gLQAはLQAから1桁の計算時間を短縮することを示した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:20:33 GMT)
Zero-Shot Low Light Image Enhancement with Diffusion Prior [2.1]
暗視画像変換タスクのための拡散モデルの生成挙動を制御・改善するための新しいゼロショット手法を提案する。提案手法は,低照度画像強調作業における既存の最先端手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:29:58 GMT)
Utilizing Large Language Models for Information Extraction from Real Estate Transactions [2.0]
本稿では,大規模言語モデルの不動産契約からの自動情報抽出への応用について検討する。実世界のトランザクションデータセットを用いて合成コントラクトを生成した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:31:15 GMT)
Adaptive Dataset Quantization [2.0]
適応データセット量子化(ADQ)という,データセット圧縮のための汎用フレームワークを導入する。本稿では,生成したビンの代表性スコア,多様性スコア,重要度スコアの評価を通じて,新しい適応型サンプリング戦略を提案する。提案手法は, 異なるアーキテクチャにまたがる優れた一般化能力を示すだけでなく, 各種データセットにおいてDQを平均3%越えて, 最先端の結果が得られる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:08:29 GMT)
Hierarchically Gated Experts for Efficient Online Continual Learning [1.9]
連続学習モデルは、タスクが順次到着する制約の下で一連のタスクを学習することを目的としている。オンライン連続学習は、タスクが未知であり、その代わりにデータが単一のストリームとして到着する、さらなる課題となる。本稿では,これらの課題を識別する手法として,Gated Experts (GE)アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 23:27:20 GMT)
SubstationAI: Multimodal Large Model-Based Approaches for Analyzing Substation Equipment Faults [1.8]
本稿では,マルチモーダル大言語モデル(MLLM)に基づくサブステーション機器故障解析手法を提案する。我々は、画像、欠陥ラベル、分析レポートを含む4万件のエントリを含むデータベースを開発し、データ拡張に画像からビデオ生成モデルを使用した。このデータベースに基づいて, サブステーション故障解析のための最初のモデルであるSubstationAIを開発した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:59:07 GMT)
Solving Nonlinear Energy Supply and Demand System Using Physics-Informed Neural Networks [1.6]
本稿では,非線形エネルギー需給システムの解法として物理情報ニューラルネットワーク(PINN)を用いる手法を提案する。我々は、4つの出力を持つニューラルネットワークを設計し、各出力は微分方程式の非線形系における未知の関数の1つに対応する関数を近似する。この問題に対するニューラルネットワークから得られる解は、次数4/5のルンゲ・クッタ法(RK45)との比較と評価において等価である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:37:59 GMT)
AI-Based Teat Shape and Skin Condition Prediction for Dairy Management [1.6]
我々は,乳牛のティート局所化,ティート形状,およびティート皮膚状態分類にAIツールを適用した。得られたティート形状予測モデルは平均平均精度(mAP)が0.783であり、ティート皮膚条件モデルの平均精度は0.828である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:37:07 GMT)
Sim911: Towards Effective and Equitable 9-1-1 Dispatcher Training with an LLM-Enabled Simulation [1.6]
大規模言語モデル(LLM)を用いた9-1-1ディスパッチの最初の訓練シミュレーションであるSim911を紹介する。 Sim911は,(1)実世界のシナリオを忠実に反映したシミュレーションを生成するために,アーカイブされたコールデータを利用する知識構築,(2)動的プロンプトとベクトルベースを利用するコンテキスト認識制御生成,(3)低品質応答をフィルタリングしてシステム性能を洗練するループ補正による検証,という3つの技術革新を通じて,トレーニングを強化する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:43:51 GMT)
Basis Function Encoding of Numerical Features in Factorization Machines for Improved Accuracy [1.1]
FM変種に数値的特徴を組み込む体系的・理論的に最適化された方法を提案する。提案手法は,選択した関数の集合にまたがる数値特徴の分数化関数を学習するモデルであることを示す。本手法は,高速な学習と推論を保存し,FMモデルの計算グラフのわずかな修正しか必要としない。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 06:50:11 GMT)
Fluctuations and optimal control in a Floquet Quantum Thermal Transistor [1.1]
3端子フロッケ量子熱トランジスタにおけるゆらぎと最適制御について検討する。基本量子ビット周波数の正弦波およびπ-フリップ変調を用いて、ベース電流のばらつきがエミッタやコレクタ電流と比較してはるかに小さいことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:31:18 GMT)
Map Imagination Like Blind Humans: Group Diffusion Model for Robotic Map Generation [1.0]
ロボットが入力情報に制限のある点雲マップを生成するためのグループ拡散モデル(GDM)に基づくアーキテクチャを提案する。視覚的知覚データや深度データを使わずに,視覚障害者の心的地図の想像・生成能力からインスピレーションを得た。公開データセットの実験を行った結果,提案手法は経路データのみに基づいて合理的な地図を生成でき,さらに複雑なLiDARデータを組み込んだ地図を作成できることがわかった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:54:21 GMT)
Unsupervised Bilingual Lexicon Induction for Low Resource Languages [1.0]
一般的に使用されているUBLIフレームワークであるVecMapの教師なしバージョンを使用します。 LRLペア,イングリッシュ・シンハラ,イングリッシュ・タミル,イングリッシュ・パンジャービを用いた総合的な実験を行った。これらの実験は、拡張の最良の組み合わせを特定するのに役立ちました。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:07:09 GMT)
ASP-based Multi-shot Reasoning via DLV2 with Incremental Grounding [0.9]
DLV2は知識表現と推論のためのAIツールである。 DLV2の反復的推論への進化から得られた新しい漸進的推論器を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:46:49 GMT)
Lies, Damned Lies, and Distributional Language Statistics: Persuasion and Deception with Large Language Models [0.9]
LLM(Large Language Models)は、人間が書いたテキストと同じくらい説得力のあるコンテンツを生成し、選択的に認識出力を生成することができる。これらの機能は、これらのシステムがより広くデプロイされるにつれて、潜在的な誤用や意図しない結果に対する懸念を引き起こす。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:34:10 GMT)
Survey on Abstractive Text Summarization: Dataset, Models, and Metrics [0.8]
トランスフォーマーモデルは、それらの注意機構、一般的な知識に基づく事前訓練、下流タスクの微調整によって区別される。本研究は,テキスト要約モデルにおける技術の現状を,抽象的要約アプローチに特化して検討する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:18:40 GMT)
Diffusion-Based Approaches in Medical Image Generation and Analysis [0.8]
医療画像におけるデータの不足は、プライバシー上の懸念から大きな課題となっている。オリジナルのデータセットと合成データセット上での畳み込みニューラルネットワーク(CNN)モデルのパフォーマンスに関する疑問が残る。本研究では,3領域でCNNを訓練するための合成医用画像生成のための拡散モデルの有効性について検討した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:02:05 GMT)
Experimental quantum randomness enhanced by a quantum network [0.7]
従来の2部構成のベルシナリオをハイブリッド量子ネットワークに拡張することで、証明可能なランダム性のロバスト性を高めることを示す。当社のプロトコルでは,ベルローカル状態からランダム性を証明することも可能である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:08:02 GMT)
Parameter-Efficient Interventions for Enhanced Model Merging [0.7]
モデルマージは、タスク固有のモデルからの知識を統一されたマルチタスクモデルに結合し、すべてのタスクデータに対する共同トレーニングを避ける。モデル全体の表現バイアスを効果的に緩和するマルチタスクモデルマージの新しいアプローチであるIntervMergeを提案する。 IntervMergeは、パラメータが少なくて最先端のアプローチを一貫して上回ることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 13:58:12 GMT)
A Career Interview Dialogue System using Large Language Model-based Dynamic Slot Generation [0.7]
本研究は,看護管理者のキャリア面接の効率化と質の向上を目的とする。我々は,スタッフのキャリアに関する情報収集のために,事前に対話を行うスロット満載対話システムを開発している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:25:02 GMT)
An Exploration of Pattern Mining with ChatGPT [0.6]
本稿では、人間の洞察とAI能力を組み合わせて、既知の用途からパターンを抽出する8段階の協調プロセスを提案する。本稿では、大規模言語モデルとデータソースとツールを統合するパターン言語を作成することで、このプロセスの実例を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 01:27:12 GMT)
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States [0.6]
我々は、トレーニングで使われていない情報を含む幻覚に焦点を当て、それは、カットオフ後の情報を確実にするために、正確性を用いて決定する。本研究では,様々な言語モデルの内部状態を用いて,これらの幻覚を文レベルで検出する。以上の結果から,IAVはCEVと同じくらい効果的に幻覚を検知し,解答可能なプロンプトと解答不能なプロンプトは別個の分類器としてコード化されていることが明らかとなった。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:08:24 GMT)
RoboSignature: Robust Signature and Watermarking on Network Attacks [0.5]
本稿では,モデルが意図した透かしを埋め込む能力を阻害する新たな逆調整攻撃を提案する。本研究は, 発生システムにおける潜在的な脆弱性を予知し, 防御することの重要性を強調した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:36:27 GMT)
An OpenMind for 3D medical vision self-supervised learning [0.5]
3D医療ビジョンの自己指導型学習の分野では、一貫性と標準化が欠如している。我々は114kの3D脳MRIボリュームからなる公開事前学習データセットを公表した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:38:28 GMT)
Towards Agentic AI on Particle Accelerators [0.5]
本稿では,大規模言語モデル(LLM)を用いたアクセラレータ制御のための分散マルチエージェントフレームワークを構想する。本稿では,知的エージェントがハイレベルなタスクやコミュニケーションを処理し,各エージェントが個別のアクセラレーターコンポーネントを制御できる自己改善型分散システムを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:30:47 GMT)
Where Did Your Model Learn That? Label-free Influence for Self-supervised Learning [0.5]
自己教師型学習は、大規模なラベルなしデータセットからの学習に革命をもたらした。事前学習データと学習表現との序文的関係はいまだに理解されていない。 SSLに適した影響関数を定義するための,新規かつラベルフリーなアプローチであるEmpfect-SSLを紹介する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:43:56 GMT)
Scalable Speech Enhancement with Dynamic Channel Pruning [0.4]
遠隔協調環境における生産性向上には,音声強調(SE)が不可欠である。ディープラーニングモデルはSEでは非常に効果的であるが、その計算要求により組み込みシステムでは実用的ではない。音声領域にDynamic Channel Pruningを導入し,それをSEの独自の畳み込みアーキテクチャに適用する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:21:08 GMT)
Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection [0.4]
バックボーンネットワークの下位層における標準畳み込みの代替として,新しいピンホイール型畳み込み(PConv)を提案する。 PConvは、ディム小ターゲットの画素ガウス空間分布とよく一致し、特徴抽出を強化し、受容野を著しく増加させ、パラメータの最小増加しか導入しない。我々はSIRST-UAVBという新しいベンチマークを構築し、これは実際の単フレーム赤外線小ターゲット検出において、これまでで最大かつ最も難しいデータセットである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:04:02 GMT)
Enhancing Supply Chain Transparency in Emerging Economies Using Online Contents and LLMs [0.4]
本研究では、オンラインコンテンツと大規模言語モデル(LLM)を活用して、新興国におけるサプライチェーンの透明性を高める新しいアプローチを提案する。我々は,先進的なLCMとWebクローラ技術を統合したサプライチェーン知識グラフマイニングシステムを開発し,サプライチェーン情報を自動的に収集・解析する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:46:16 GMT)
Multi-Scale Foreground-Background Confidence for Out-of-Distribution Segmentation [0.4]
本研究では,前景-背景セグメントモデルの信頼性情報を利用するマルチスケールOODセグメンテーション手法を提案する。モデル予測の画素毎の信頼スコアは,前景オブジェクトの画素に対して1に近い。異なるサイズのパッチに対してこれらの信頼値を集約することにより、さまざまなサイズのオブジェクトを単一のイメージで識別することができる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 12:09:27 GMT)
Hermitian Kirkwood-Dirac real operators for discrete Fourier transformations [0.3]
負あるいは非実のKD分布の存在は、特定の量子的特徴や利点を示す可能性がある。我々は、任意のKD正状態が純粋なKD正状態の凸結合として表現できることを証明した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 09:33:47 GMT)
Revolutionizing Genomics with Reinforcement Learning Techniques [0.2]
強化学習(Reinforcement Learning, RL)は、幅広い問題を解決する強力なツールとして登場した。 RLアルゴリズムは、最小限の人間の監督で経験から学ぶことができる。 RLを使用する大きなメリットの1つは、ラベル付きトレーニングデータ収集に伴うコスト削減である。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:21:48 GMT)
Negative Feedback System as Optimizer for Machine Learning Systems [0.2]
本稿では, ネガティブフィードバックシステムの関数反転処理が, 機械学習における最適化手法の物理的類似性としてどのように機能するかを述べる。このプロセスは勾配降下法が故障した場合に微分不可能な関数を学習できることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:38:32 GMT)
Iterative NLP Query Refinement for Enhancing Domain-Specific Information Retrieval: A Case Study in Career Services [0.1]
ニッチドメインにおける意味的関連文書の検索は、TF-IDFベースのシステムにとって大きな課題となる。本稿では,Humber CollegeのキャリアサービスWebページに合わせて,反復的かつ半自動的なクエリリファインメント手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:57:35 GMT)
Bridging Auditory Perception and Language Comprehension through MEG-Driven Encoding Models [0.1]
脳磁図(MEG)データを用いて、音声言語刺激に対する脳反応を解析する。我々は,音声-MEGエンコーダとテキスト-MEGエンコーダの2つの異なる符号化モデルを開発した。どちらのモデルも神経活動の予測に成功し、推定されたMEG信号と観測されたMEG信号の間に有意な相関を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:41:54 GMT)
Digital Quantum Simulation of Cavity Quantum Electrodynamics: Insights from Superconducting and Trapped Ion Quantum Testbeds [0.0]
我々は,光量子通信,シミュレーション,計算への応用のために,オープンなCavity Quantum Electrodynamical (CQED)システムをシミュレートする。結果は、現代の量子コンピュータと将来の量子コンピュータにおけるキャビティ・エミッターシステムの効率的かつプラットフォーム固有の量子シミュレーションのレシピとして利用することができる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:55:09 GMT)
Unsupervised Discovery of Formulas for Mathematical Constants [0.0]
本稿では,これらの公式の分類,特徴化,パターン同定のための体系的手法を提案する。我々の方法論の鍵となるのは、公式の数値ではなく、公式の収束力学に基づくメトリクスの導入である。我々は1,768,900のそのような公式の集合上で我々の方法論を検証し、数学定数の既知の多くの公式を同定し、以前は知られていなかった$pi$, $ln(2)$, Gaus', Lemniscateの定数を発見した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 01:43:56 GMT)
Trees that can be grown in "too many" ways: A review of Bouch's construction [0.0]
平方格子上の木々のブーチ[1]による構成を、その根から$L!/CL$の異なる方法で成長することができることを概観する。この結果は、2次元以上の量子スピン系の作用素成長に影響を及ぼす。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:07:36 GMT)
Transverse orbital angular momentum and polarization entangled spatiotemporal structured light [0.0]
システム内の絡み合いは、同じシステム内の非分離モード間で起こる。我々は, 新規な t-OAM と絡み合った偏光構造光を創出し, 特徴付ける方法を開発した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:09:13 GMT)
Time-reversed Young's experiment: Deterministic, diffractionless second-order interference effect [0.0]
本稿では,回折や一階効果を欠いた理想的,決定論的な2次の「ゴースト」干渉パターンを提案する。この新しいシステムは、従来のダブルスリット干渉研究では利用できない様々な効果と現象を可能にする。時間反転対称性による回折の除去は、超高分解能光学イメージングとセンシング技術の発展を約束する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 21:02:12 GMT)
Thermodynamic computing out of equilibrium [0.0]
本稿では, 任意の非線形計算を平衡内外で行うことのできる熱力学計算機の設計について述べる。簡単な熱力学回路は、熱浴と接触する自由度を変動させ、入力の非線形機能であるアクティビティを表示する。熱力学ニューラルネットワークのディジタルモデルをシミュレートし、そのパラメータを遺伝的アルゴリズムで調整し、特定の観測時間で非線形計算を行うことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:51:51 GMT)
The unphysicality of Hilbert spaces [0.0]
ヒルベルト空間は数学的に量子状態を表すには適さないと主張する。この論文の主なポイントは、ヒルベルト空間の完全性に依存する結果が物理的に重要でないという認識を高めることである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:59:47 GMT)
The molecular nature of superfluidity: Viscosity of helium from quantum stochastic molecular dynamics simulations over real trajectories [0.0]
量子液体の粘度は古典液体の粘度よりも著しく小さく、最も低い温度でほぼ5倍小さい。古典と量子の液体はボース=アインシュタイン凝縮を除いて同一であり、超流動性の分子機構を示唆している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 23:04:13 GMT)
The Sound of Decoherence [0.0]
この文書は、YouTubeチャンネルのOpen Quantum Sonification with the Python Codes on GitHubで利用可能な、これらのモデルの対応するオーディオビジュアルシミュレーションのコンパニオンとして機能する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:55:25 GMT)
The Potential of Convolutional Neural Networks for Cancer Detection [0.0]
畳み込みニューラルネットワーク(CNN)は、医療画像の分析と分類のための強力なツールとして登場した。本稿では,10種類の癌を検出するためにCNNモデルを応用した最近の研究を包括的に紹介する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:33:59 GMT)
The Manhattan Trap: Why a Race to Artificial Superintelligence is Self-Defeating [0.0]
我々は、米国がAISを開発するためのレースを動機付けるかもしれない仮定は、そのようなレースが極めて危険なことを暗示していると論じている。分析の結果, ASI は囚人ジレンマよりも信頼ジレンマを呈しており, ASI 開発を制御するための国際協力が望ましいこと,戦略的に健全であること,などが示唆された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:04:28 GMT)
Symmetry induced enhancement in finite-time thermodynamic trade-off relations [0.0]
有限時間熱力学における集合的拡張の基本的な限界を記述する対称性に基づく枠組みを示す。我々は,従来の超輝度モデルによって実現された拡張を超越したオープン量子系モデルを構築した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:33:45 GMT)
Style Transfer Dataset: What Makes A Good Stylization? [0.0]
画像スタイルの転送を推し進める目的で,新しいデータセットを提案する。データセットは、さまざまなサイズのコンテンツとスタイルのイメージをカバーし、1-10スケールの3つのアノテーションによって手作業で評価されるスタイリングを含んでいる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 19:13:15 GMT)
Saturation of the Multiparameter Quantum Cramér-Rao Bound at the Single-Copy Level with Projective Measurements [0.0]
量子状態の1つのコピーしか入手できないとき、量子クラムエル・ラオ境界が飽和(達成)できる時期は分かっていなかった。本稿では、量子クラムエル・ラオ境界を飽和させる最適測定の鍵となる構造特性を照らす。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 01:37:26 GMT)
Robust Causal Analysis of Linear Cyclic Systems With Hidden Confounders [0.0]
多くの複雑なシステムにはフィードバックループがあり、これは我々の手法が周期的因果関係を許容する必要があることを意味する。データは、しばしば汚染されたプロセスによって歪むので、そのような歪みに対して堅牢な手法を適用する必要があります。我々はLLCの堅牢性について検討する。 citellcは、隠れた共同設立者と循環モデルを扱う数少ない因果分析手法の1つだ。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:04:49 GMT)
Reduction-induced the Variation of Partial Von Neumann Entropy [0.0]
両部混合状態におけるQEの定量化のために,部分フォンニューマンエントロピー(RIVPVNE)の変動を低減誘導する手法を提案する。この手法に付随する計算複雑性は最小限であり,適用範囲も広い。我々はこの手法を用いて、よく知られたQEの組織と構造を調査する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:11:29 GMT)
Reduced Order Models and Conditional Expectation [0.0]
システムは、制御できるパラメータ、システムの最適化に役立つパラメータ、または外部に課されるパラメータに依存する。機械学習の分野では、機械学習モデルのイメージ空間に設定されたパラメータの関数も、サンプルのトレーニングセットで学習する。これにより、これらの手法を組み合わせて検討し、より一般的な損失関数を導入することが可能となる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:28:10 GMT)
Quantum-inspired super-resolution of fluorescent point-like sources [0.0]
画像インバージョン干渉顕微鏡を用いて, 同時に発光する点状蛍光光源の超解像実験を行った。この技術は、量子パラメータ推定理論を半古典的イメージング問題に適用する最近の発展に着想を得たものである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 02:58:40 GMT)
Quantum Detection of Recurrent Dynamics [0.0]
このような近似的再帰を検出するための簡単な量子アルゴリズムについて述べる。隠れたテンソル構造は、演算子レベルの自発的対称性の破れの高エネルギー文脈で両方現れることが観察されている。我々は,これらの構造を探索し,関連するスペクトル情報を検出することの難しさについて,いくつかの知見を収集する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:14:21 GMT)
Quantifying Public Response to COVID-19 Events: Introducing the Community Sentiment and Engagement Index [0.0]
CSEI(Community Sentiment and Engagement Index)は、ソーシャルメディア上での世間の感情やエンゲージメントの変化を捉えるために開発された。 CSEIの応答性は、COVID-19に関する4,510,178件のデータセットを使用して検証された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 08:52:12 GMT)
Projected Entangled Pair States for Lattice Gauge Theories with Dynamical Fermions [0.0]
格子ゲージ理論は標準模型や凝縮物質物理学で生じるゲージ理論を研究するための重要な枠組みである。我々は、動的物理物質を含む格子ゲージ理論のアンザッツとしてゲージ付きガウス射影絡み合ったペア状態の使用を実証する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:12:06 GMT)
Optimizing Data Curation through Spectral Analysis and Joint Batch Selection (SALN) [0.0]
本稿では,データセット全体からではなく,各バッチ内のサンプルを優先順位付けして選択する手法であるSALNを紹介する。提案手法は,各バッチ内の最も情報性の高いデータポイントを特定するためのスペクトル解析を応用し,学習速度と精度を向上する。最大8倍のトレーニング時間を短縮し、標準のトレーニングメソッドよりも最大5%の精度を向上する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:38:36 GMT)
On the ETHOS of AI Agents: An Ethical Technology and Holistic Oversight System [0.0]
ETHOSは、AIエージェントのための分散グローバルレジストリである。システムには、AI固有の法的実体の概念が組み込まれている。システムは、AIガバナンスに対する協力的で参加的なアプローチの必要性を強調している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:01:49 GMT)
On Fusing ChatGPT and Ensemble Learning in Discon-tinuous Named Entity Recognition in Health Corpora [0.0]
アンサンブル法における調停器としてのChatGPTの統合について検討し,DNERタスクの性能向上を目的とした。提案手法は,5つの最先端NERモデルとChatGPTを組み合わせたカスタムプロンプトエンジニアリングを用いて,アンサンブルアルゴリズムの堅牢性と一般化能力を評価する。その結果,ChatGPTとアンサンブル学習アルゴリズムの融合はCADEC,ShARe13,ShARe14データセットにおいてSOTAよりも優れていた。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:26:49 GMT)
Interactive Classification Metrics: A graphical application to build robust intuition for classification model evaluation [0.0]
インタラクティブ分類メトリクス(ICM)は、異なる評価指標間の関係を可視化し、探索するアプリケーションである。ユーザーは分布統計を変更し、一連の評価指標を通して対応する変化を探索する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:36:15 GMT)
Instanton-Induced Supersymmetry Breaking in Topological Semimetals [0.0]
超対称性(SUSY)は、標準モデルを超えた物理学の基本対称性として提案され、高エネルギー物理学以外の様々な分野で重要な応用が発見されている。ここでは,超対称性量子力学を幅広いトポロジカル半金属に体系的に実装する。 SUSY電位バレーに対するインスタント効果による動的SUSY破壊がギャップ開口の基礎機構として機能することを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 07:05:31 GMT)
Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0]
閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:05:10 GMT)
Hanprome: Modified Hangeul for Expression of foreign language pronunciation [0.0]
本稿では,ハングルの基本形を変更し,音韻記号の一種として用いる可能性について検討する。このアプローチの中核的な概念は、アルファベットの基本形を保存し、文字自体ではなくストロークの形だけを変更することである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:19:42 GMT)
Graph Learning-based Regional Heavy Rainfall Prediction Using Low-Cost Rain Gauges [0.0]
農村部における降雨の自動記録・監視・予測のための低コストIoTシステムを提案する。第2に,グラフニューラルネットワーク(GNN)を実装した地域豪雨予測手法を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 03:40:16 GMT)
Fast charging of an Ising spin pair quantum battery using optimal control [0.0]
一対のスピンとイジング結合からなる量子電池において、所定充電期間の蓄積エネルギーを最大化する問題を考察する。この問題を1量子ビット上の最適制御問題にマップし、最適制御理論を用いて、単一バングパルスは比較的大きな上向き制御境界に対してかなりの充電レベルを迅速に達成できるが、完全充電を含む保存エネルギーの高レベルはバン・特異バンパルス系列によって達成されることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:39:34 GMT)
Empirical evaluation of normalizing flows in Markov Chain Monte Carlo [0.0]
現在、MCMCの異なる正規化フローアーキテクチャの体系的な比較は行われていない。我々は,多数の正規化フローアーキテクチャを広範囲に評価し,そのようなガイドラインを初めて提示する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 18:52:59 GMT)
Dynamic T-decomposition for classical simulation of quantum circuits [0.0]
量子回路は、安定化状態 (T-) を$O (2alpha t)$時間で分解することで、古典的なハードウェアでシミュレートすることができることが知られている。本研究では、最も一般化されたT分解を行い、$alpha=1$の低効率を実現し、これを適用可能な共通構造を特定する。我々は、古典的シミュレーション、特にある種の共通回路クラスにおいて、全体的な$alpha$とそれによる全体のランタイムの大幅な削減を観察する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:51:23 GMT)
DivShift: Exploring Domain-Specific Distribution Shift in Volunteer-Collected Biodiversity Datasets [0.0]
約800万のiNaturalist植物画像のキュレートされたデータセットであるDivShift-NAWC(DivShift-NAWC)を紹介した。モデル性能を既知の4つのバイアスで比較し、それらが実際にモデル性能を損なうことを観察する。我々は、気候変動が世界の生物多様性に与える影響を監視するために、データセットをキュレートしてディープラーニングモデルを訓練する実践的戦略を提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:09:55 GMT)
Detecting Inpainted Video with Frequency Domain Insights [0.0]
本稿では、検出精度を大幅に向上させる周波数領域洞察ネットワーク(FDIN)を提案する。公開データセットに対する以前の評価は、FDINが最先端のパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:03:06 GMT)
Decoupling Dipolar Interactions in Dense Spin Ensembles [0.0]
スピン間双極子結合の抑制を目的とした一連のパルス列の性能について検討する。実験と理論の相違は典型的には制御誤差と実験的な非理想の存在によって説明される。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 04:32:50 GMT)
Chronic Obstructive Pulmonary Disease Prediction Using Deep Convolutional Network [0.0]
提案された研究は、Convolutional Brain Organizationに基づくディープラーニングのアイデアを使用して、臨床専門家を支援することを望んでいる。 We used MFCC, Mel-Spectrogram, Chroma, Chroma (Steady Q), and Chroma CENS from the Librosa AI library in the test。新しいシステムは、感染の深刻さ、軽度、中等度、あるいは重症度も調べることもできる。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 11:19:22 GMT)
COVID-19 on YouTube: A Data-Driven Analysis of Sentiment, Toxicity, and Content Recommendations [0.0]
本研究は、YouTube上での新型コロナウイルスに関するデータ駆動分析である。 2023年1月から2024年10月までに公開されたビデオコンテンツの感情、毒性、テーマパターンを調べます。関連性およびコンテキストに整合したビデオレコメンデーションを保証するためのレコメンデーションシステムを開発した。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 22:43:36 GMT)
Better product formulas for quantum phase estimation [0.0]
量子エネルギー推定の特定のタスクに対する積公式の誤差について検討する。我々は、効果的にシミュレートされたハミルトニアンのマグナスによる拡張によるトロッター誤差の理論を用いる。局所性や正の性質を持つハミルトニアンにとって、そのコストは目標誤差の点で最大2次スピードアップに達することが示される。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 00:58:23 GMT)
Analysis on LLMs Performance for Code Summarization [0.0]
大規模言語モデル(LLM)は、コード要約の分野を著しく進歩させてきた。本研究の目的は,LLaMA-3,Phi-3,Mistral,GemmaなどのオープンソースLLMの比較分析を行うことである。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:09:34 GMT)
Aligning Graphical and Functional Causal Abstractions [0.0]
因果抽象化により、異なるレベルの粒度の因果モデルを関連付けることができる。モデルが原因と効果に一致するように、因果的抽象化のフレームワークは一貫性の概念を定義します。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 16:11:25 GMT)
Adapting Image-to-Video Diffusion Models for Large-Motion Frame Interpolation [0.0]
本稿では,単純で効果的なトレーニング可能なモジュールとして機能する条件付きエンコーダを提案する。最初のフレームと最後のフレームを活用することで、空間的特徴と時間的特徴を抽出し、条件付きエンコーダに入力する。条件付きエンコーダの計算された特徴は、生成誘導ビデオシーケンスにおけるビデオ拡散モデルを導く。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 14:49:55 GMT)
ABACUS: A FinOps Service for Cloud Cost Optimization [0.0]
FinOpsのプラクティスは、企業がクラウド利用の可視性とコスト最適化を実現するための手段を提供する。 ABACUSはクラウドコストを最適化するためのFinOpsソリューションで、予算を設定し、新しいデプロイメントをブロックすることでそれらの予算を強制し、予算のしきい値を破った場合に適切なチームに警告する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 20:26:54 GMT)
A tensor network formulation of Lattice Gauge Theories based only on symmetric tensors [0.0]
対称な基本テンソルに基づくゲージ不変理論の新しいPEPSテンソルネットワークの定式化を提供する。新しい定式化は、利用可能な最先端テンソルネットワークライブラリを用いて数値シミュレーションで実装することができる。このような新しい定式化は、格子ゲージ理論と大域不変系の特定のセクターの間の新しい双対変換をもたらすことを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:42:05 GMT)
A diversity-enhanced genetic algorithm for efficient exploration of parameter spaces [0.0]
多次元パラメータ空間探索のための軽量な多様性強化遺伝的アルゴリズム(GA)の実装のための実践的ガイドとともにPythonパッケージを提案する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 17:32:38 GMT)
A Semi-supervised CART Model for Covariate Shift [0.0]
本稿では,重み付けを用いた半教師付き分類・回帰木(CART)を提案する。本手法は,トレーニングサンプルに重みを割り当てることで,CARTモデルの予測性能を向上させる。実世界の医療データに対するシミュレーション研究と応用を通して,予測精度の大幅な向上を示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 10:41:27 GMT)
A Parameter-Efficient Quantum Anomaly Detection Method on a Superconducting Quantum Processor [0.0]
量子支援ベクトルデータ記述(QSVDD)と呼ばれる新しい量子機械学習手法を提案する。 QSVDDは従来のモデルと比較してパラメータ効率と精度の両方を達成することを目的としている。超伝導量子プロセッサ上での異常検出のための量子機械学習手法の最初の実装を実証する。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 05:36:51 GMT)
$SU(\infty)$ Quantum Gravity and Cosmology [0.0]
我々は、$SU(infty)$-QGRと呼ばれる量子宇宙論と重力に対する抽象的なアプローチの構造と性質を強調する。一般的な$SU(infty)$対称性と重力との相互作用を同定し、$SU(infty)$-QGRは量子重力(QGR)のスピン-1メディエータを予測する。重力の量子性を検出できない観測者は、連続パラメータの平均値空間の曲率としてその効果を認識できることを示す。
論文参考訳（メタデータ） (Sun, 22 Dec 2024 15:11:31 GMT)