Optimistic Policy Optimization is Provably Efficient in Non-stationary MDPs [113.9] 非定常線形カーネルマルコフ決定過程(MDP)におけるエピソード強化学習(RL)の研究
線形最適化アンダーライン最適化アルゴリズム(PROPO)を提案する。
PROPOはスライディングウィンドウベースのポリシー評価と周期的リスタートベースのポリシー改善の2つのメカニズムを特徴としている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:25:22 GMT)
YuLan-Mini: An Open Data-efficient Language Model [111.0] 2.42Bパラメータを持つ高い能力を持つベースモデルであるYuLan-Miniは、同様のパラメータスケールのモデルで上位層のパフォーマンスを実現する。
注目すべきは、1.08TトークンでトレーニングされたYuLan-Miniは、はるかに多くのデータを必要とする業界主導のモデルに匹敵するパフォーマンスを達成することだ。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:47:53 GMT)
Enhancing Multi-Text Long Video Generation Consistency without Tuning: Time-Frequency Analysis, Prompt Alignment, and Theory [92.2] 本稿では,単一または複数プロンプトで生成されたビデオの一貫性とコヒーレンスを高めるため,時間的注意強調アルゴリズム(TiARA)を提案する。
本手法は拡散モデルにおける周波数に基づく手法の第一種である理論的保証によって支持される。
複数のプロンプトが生成するビデオについては、プロンプト品質に影響を及ぼす重要な要因をさらに調査し、プロンプトブレンド(PromptBlend)という高度なビデオプロンプトパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:56:27 GMT)
DRT-o1: Optimized Deep Reasoning Translation via Long Chain-of-Thought [89.5] DRT-o1は、長いチェーン・オブ・シークレットの成功をニューラルマシン翻訳(MT)にもたらす試みである。
まず、既存の文献から模範文や比喩文を含む文を抽出し、その後、長い思考を通してこれらの文を翻訳する多エージェントフレームワークを開発する。
文献翻訳実験の結果, DRT-o1の有効性が示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:55:33 GMT)
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders [87.2] 提案する鋭いエッジサンプリング戦略と2つのクロスアテンション機構により,VAEの再構築を促進する新しいアプローチであるDora-VAEを提案する。
VAE再建の品質を体系的に評価するために,シャープエッジの密度を通じて形状複雑性を定量化するベンチマークであるDora-benchを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:59:06 GMT)
From Models to Microtheories: Distilling a Model's Topical Knowledge for Grounded Question Answering [86.4] マイクロ理論は、あるトピックに関するLMのコア知識をカプセル化した文である。
一般コーパス(例えばウィキペディア)に追加されると、マイクロ理論はコーパスに必ずしも存在しない重要なトピック情報を供給できることを示す。
また, 医療分野での人体評価において, 我々の蒸留マイクロ理論は, 局所的に重要な事実の集中度が著しく高いことも示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:32:55 GMT)
EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.7] 本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:58:37 GMT)
ChatGarment: Garment Estimation, Generation and Editing via Large Language Models [79.5] ChatGarmentは、大規模な視覚言語モデル(VLM)を活用して、3D衣服の見積もり、生成、編集を自動化する新しいアプローチである。
ウィジェット内の画像やスケッチから縫製パターンを推定し、テキスト記述から生成し、ユーザー指示に基づいて衣服を編集することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:59:28 GMT)
StructTest: Benchmarking LLMs' Reasoning through Compositional Structured Outputs [78.8] StructTestは、構造化されたアウトプットを生成する能力に基づいて、大きな言語モデルを評価する新しいベンチマークである。
StructTestが一般的な推論能力のよいプロキシであることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:08:40 GMT)
Spectrum-guided Feature Enhancement Network for Event Person Re-Identification [78.6] スペクトル誘導型特徴拡張ネットワーク(SFE-Net)について紹介する。
SFE-Netは、Multi-grain Spectrum Attention Mechanism (MSAM)とConsecutive Patch Dropout Module (CPDM)の2つの革新的なコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:50:27 GMT)
BrainMAP: Learning Multiple Activation Pathways in Brain Networks [77.2] 本稿では,脳ネットワークにおける複数の活性化経路を学習するための新しいフレームワークであるBrainMAPを紹介する。
本フレームワークは,タスクに関わる重要な脳領域の説明的分析を可能にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:13:35 GMT)
Transformers Can Do Arithmetic with the Right Embeddings [75.7] 算術演算における変換器の性能向上について述べる。
たった20桁の数値で1日1GPUでトレーニングすれば、最先端のパフォーマンスに到達できます。
これらの数的増加は、ソートや乗算を含む他の多段階の推論タスクの改善を解放する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:46:06 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6] 活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。
本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:29:21 GMT)
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.2] 本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:12:48 GMT)
ControlMLLM: Training-Free Visual Prompt Learning for Multimodal Large Language Models [73.3] マルチモーダル大言語モデル(MLLM)に視覚的参照を注入する学習自由手法を提案する。
MLLMにおけるテキストプロンプトトークンと視覚トークンの関係を観察する。
我々は,エネルギー関数に基づいて学習可能な視覚トークンを最適化し,注目マップにおける参照領域の強度を高める。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:03:44 GMT)
Concept Discovery in Deep Neural Networks for Explainable Face Anti-Spoofing [70.7] 我々は、XAIを対面アンチ・スプーフィングに組み込み、X-FAS(eXplainable Face Anti-Spoofing)と呼ばれる新しい問題を提案する。
提案するSPED(SPoofing Evidence Discovery)は,スプーフ概念を探索し,発見概念に基づいて信頼性の高い説明を提供するX-FAS法である。
実験の結果,SPEDは信頼性のある説明を生成できることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:03:51 GMT)
Developmental Predictive Coding Model for Early Infancy Mono and Bilingual Vocal Continual Learning [69.8] 本稿では,連続学習機構を備えた小型生成ニューラルネットワークを提案する。
我々のモデルは解釈可能性を重視し,オンライン学習の利点を実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:23:47 GMT)
CoSurfGS:Collaborative 3D Surface Gaussian Splatting with Distributed Learning for Large Scene Reconstruction [68.8] 大規模表面再構成のための分散学習に基づく多エージェント協調高速3DGS表面再構成フレームワークを提案する。
具体的には,局所モデル圧縮(LMC)とモデルアグリゲーションスキーム(MAS)を開発し,大規模シーンの高品質な表面表現を実現する。
提案手法は高速でスケーラブルな高忠実表面再構成とフォトリアリスティックレンダリングを実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:31:15 GMT)
Comprehensive Multi-Modal Prototypes are Simple and Effective Classifiers for Vast-Vocabulary Object Detection [68.3] 現在のオープンワールド検出器は、限られたカテゴリーで訓練されているにもかかわらず、より広い範囲の語彙を認識することができる。
本稿では,多語彙オブジェクト検出のためのプロトタイプ分類器Provaを紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:57:43 GMT)
Ask Your Distribution Shift if Pre-Training is Right for You [67.9] 実際に、事前訓練されたモデルの微調整は、いくつかのケースではロバスト性を大幅に改善するが、他のケースではまったく改善しない。
分散シフト中のモデルの2つの障害モード – トレーニングデータの補間不足とバイアス – に注目する。
我々の研究は、親指の規則として、事前学習は、粗悪な外挿を緩和するがデータセットのバイアスを緩和する助けとなることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:15:36 GMT)
WarriorCoder: Learning from Expert Battles to Augment Code Large Language Models [67.2] WarriorCoderはエキスパートの戦いから学び、現在のアプローチの限界に対処する。
ゼロから構築された新しいトレーニングデータを生成し、すべての参加者の強みを活用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:47:42 GMT)
Defense Against Prompt Injection Attack by Leveraging Attack Techniques [66.7] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを実現している。
LLMが進化を続けるにつれて、新しい脆弱性、特にインジェクション攻撃が発生する。
近年の攻撃手法は, LLMの命令追従能力とデータ内容に注入された命令を識別する能力を活用している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:25:54 GMT)
CALLIC: Content Adaptive Learning for Lossless Image Compression [64.5] CALLICは、学習したロスレス画像圧縮のための新しい最先端(SOTA)を設定する。
本稿では,畳み込みゲーティング操作を利用したコンテンツ認識型自己回帰自己保持機構を提案する。
エンコーディング中、低ランク行列を用いて深度の畳み込みを含む事前学習層を分解し、レート誘導プログレッシブファインタニング(RPFT)による画像検査にインクリメンタルウェイトを適応させる。
推定エントロピーにより下位順にソートされたパッチを徐々に増加させたRPFTファインチューン,学習過程の最適化,適応時間の短縮を実現した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:41:18 GMT)
Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for Foundation Models [64.3] 我々は,100以上の演算子が支援する実りあるデータ処理機能を提供する新しいシステムであるData-Juicer 2.0を提案する。
このシステムは、さまざまな研究努力、実用的なアプリケーション、Alibaba Cloud PAIのような現実世界の製品で、公開され、積極的に維持され、広く採用されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:29:57 GMT)
The Superalignment of Superhuman Intelligence with Large Language Models [64.0] 我々は,この疑問に答えるために,学習の観点からスーパーアライメントの概念について議論する。
スーパーアライメントにおけるいくつかの重要な研究課題、すなわち、弱いから強い一般化、スケーラブルな監視、評価に焦点を当てる。
本稿では,学習者モデルの弱点を露呈しようとする敵対的クエリを生成する攻撃者,最小限の人間専門家とともに,批判モデルによって生成されたスケーラブルなフィードバックから学習することで自己を洗練させる学習者,与えられた質問応答対に対する批判や説明を生成する批判者,そして批判によって学習者を改善することを目的とした,3つのモジュールからなるスーパーアライメントの概念的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:29:44 GMT)
Path-of-Thoughts: Extracting and Following Paths for Robust Relational Reasoning with Large Language Models [62.1] 本稿では,関係推論に対処するための新しいフレームワークであるPath-of-Thoughts(PoT)を提案する。
PoTは、問題コンテキスト内の重要なエンティティ、関係、属性を識別するタスクに依存しないグラフを効率的に抽出する。
PoTは、提案された質問に対応するグラフ内の関連する推論連鎖を特定し、潜在的な答えの推論を容易にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:27:12 GMT)
Unity is Strength: Unifying Convolutional and Transformeral Features for Better Person Re-Identification [61.0] 人物再識別(ReID)は、重複しないカメラを通して特定の人物を回収することを目的としている。
画像に基づく人物ReIDのためのCNNとトランスフォーマーの強みを統合するために,FusionReIDと呼ばれる新しい融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:19:19 GMT)
UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios [60.5] 複雑な多視点都市シナリオにおけるLMM評価のためのベンチマークであるUrBenchを提案する。
UrBenchには、リージョンレベルとロールレベルの両方で、厳密にキュレートされた11.6Kの質問が含まれている。
21のLMMに対する評価は、現在のLMMが都市環境においていくつかの面で苦戦していることを示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:25:51 GMT)
Retention Score: Quantifying Jailbreak Risks for Vision Language Models [60.5] VLM(Vision-Language Models)はLarge Language Models (LLM)と統合され、マルチモーダル機械学習機能を強化する。
本研究の目的は, モデル安全コンプライアンスを損なう可能性のある脱獄攻撃に対するVLMのレジリエンスを評価し, 有害な出力をもたらすことにある。
逆入力摂動に対するVLMの頑健性を評価するために,textbfRetention Scoreと呼ばれる新しい指標を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:05:51 GMT)
Predicting Satisfied User and Machine Ratio for Compressed Images: A Unified Approach [58.7] 圧縮画像のSUR(Satified User Ratio)とSMR(Satified Machine Ratio)を同時に予測するディープラーニングモデルを構築した。
実験結果から,提案手法は最先端SURおよびSMR予測法より有意に優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:09:30 GMT)
Reconstructing People, Places, and Cameras [57.8] Humans and Structure from Motion (HSfM) は、メカニカルワールド座標系において、複数の人メッシュ、シーンポイント雲、カメラパラメータを共同で再構築する手法である。
以上の結果から,SfMパイプラインに人体データを組み込むことで,カメラのポーズ推定が改善された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:58:34 GMT)
Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.5] MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:27:19 GMT)
A Plug-and-Play Physical Motion Restoration Approach for In-the-Wild High-Difficulty Motions [56.7] 動作コンテキストとビデオマスクを利用して、欠陥のある動作を修復するマスクベースの動作補正モジュール(MCM)を導入する。
また,運動模倣のための事前訓練および適応手法を用いた物理ベースの運動伝達モジュール (PTM) を提案する。
本手法は,高速な移動を含む映像モーションキャプチャ結果を物理的に洗練するためのプラグイン・アンド・プレイモジュールとして設計されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:26:00 GMT)
HumanVBench: Exploring Human-Centric Video Understanding Capabilities of MLLMs with Synthetic Benchmark Data [55.7] 我々は,ビデオMLLMの評価において,ギャップを埋めるために巧みに構築された,革新的なベンチマークであるHumanVBenchを紹介する。
HumanVBenchは、17の慎重に設計されたタスクで構成されており、内的感情と外的表現、静的、動的、基本的、複雑にまたがる、シングルモーダルとクロスモーダルという2つの主要な側面を探索する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:45:56 GMT)
GauSim: Registering Elastic Objects into Digital World by Gaussian Simulator [55.0] GauSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体としてモデル化し、理想化された仮定なしに現実的な変形を考慮に入れた。
ガウシムは質量や運動量保存などの明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:58:17 GMT)
Understanding the Logic of Direct Preference Alignment through Logic [54.3] 本稿では,単一モデルと参照モデルに基づくアプローチの選好損失を特徴付ける新しいフォーマリズムを提案する。
そこで我々は,この嗜好学習の形式的視点が,DPA損失景観の大きさと構造の両方に新たな光を当てていることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:23:13 GMT)
FaceLift: Single Image to 3D Head with View Generation and GS-LRM [54.2] FaceLiftは、1枚の画像から高速で高品質な360度頭部再構築のためのフィードフォワード方式である。
FaceLiftは3次元頭部再構成において最先端の手法よりも優れており、実世界の画像に対する実用性とロバストな性能を強調している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:59:49 GMT)
LegalAgentBench: Evaluating LLM Agents in Legal Domain [53.7] LegalAgentBenchは、中国の法律領域でLLMエージェントを評価するために特別に設計されたベンチマークである。
LegalAgentBenchには、現実世界の法的シナリオから17のコーパスが含まれており、外部知識と対話するための37のツールを提供している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:02:46 GMT)
Discriminative Image Generation with Diffusion Models for Zero-Shot Learning [53.4] ゼロショット学習のための新たな識別画像生成フレームワークであるDIG-ZSLを提案する。
我々は、事前学習されたカテゴリー識別モデル(CDM)の指導のもと、各未確認クラスの識別クラストークン(DCT)を学習する。
本稿では,4つのデータセットに対する広範な実験と可視化を行い,(1)多彩で高品質な画像を生成すること,(2)最先端の非人間アノテーション型セマンティックプロトタイプ手法を大きなマージンで上回ること,(3)人間アノテーションを利用したベースラインよりも同等あるいは優れた性能を実現すること,の4つが示される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:18:54 GMT)
Large Motion Video Autoencoding with Cross-modal Video VAE [52.1] ビデオ可変オートエンコーダ(VAE)は、ビデオ冗長性を低減し、効率的なビデオ生成を容易にするために不可欠である。
既存のビデオVAEは時間圧縮に対処し始めているが、しばしば再建性能が不十分である。
本稿では,高忠実度ビデオエンコーディングが可能な,新規で強力なビデオオートエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:58:24 GMT)
Variational Graph Generator for Multi-View Graph Clustering [51.9] マルチビューグラフクラスタリング(VGMGC)のための変分グラフ生成器を提案する。
この生成器は、複数のグラフに対する事前仮定に基づいて、信頼性のある変分コンセンサスグラフを推論する。
推論されたビュー共通グラフとビュー固有のグラフを機能と一緒に埋め込む。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:29:38 GMT)
DiffusionAttacker: Diffusion-Driven Prompt Manipulation for LLM Jailbreak [51.8] 大規模言語モデル (LLM) は、慎重に入力を行うと有害なコンテンツを生成する可能性がある。
本稿では,拡散モデルにインスパイアされたジェイルブレイク書き換えのためのエンドツーエンド生成手法であるDiffusionAttackerを紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:44:54 GMT)
GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems [51.6] 本稿では,モジュール性に基づく二部グラフクラスタリングを利用したグラフベースの最初のアプローチであるGraphHashを紹介する。
GraphHashは検索およびクリックスルーレート予測タスクにおいて,多様なハッシュベースラインを大幅に上回ることを示す。
特にGraphHashは、埋め込みテーブルのサイズを75%以上削減する際のリコールにおいて、平均101.52%の改善を実現している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:37:58 GMT)
Uniting contrastive and generative learning for event sequences models [51.5] 本研究では,2つの自己指導型学習手法 – 例えば,コントラスト学習と,潜在空間におけるマスクイベントの復元に基づく生成的アプローチ – の統合について検討する。
いくつかの公開データセットで行った実験は、シーケンス分類と次点型予測に焦点を合わせ、統合された手法が個々の手法と比較して優れた性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:00:24 GMT)
DreamFit: Garment-Centric Human Generation via a Lightweight Anything-Dressing Encoder [51.1] テキストや画像プロンプトから衣料中心の人間生成のための拡散モデルが注目されている。
衣服中心の人間生成に適した軽量のAnything-Dressingを組み込んだDreamFitを提案する。
我々のモデルは驚くほど多種多様な(非)着想、創造的なスタイル、命令のプロンプトを一般化し、常に高品質な結果をもたらす。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:21:28 GMT)
SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.9] COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:17:20 GMT)
Real-world Image Dehazing with Coherence-based Pseudo Labeling and Cooperative Unfolding Network [50.3] 実世界のイメージデハジングは、実世界の設定におけるヘイズによる劣化を軽減することを目的としている。
本研究では,大気散乱と画像シーンを協調的にモデル化する,協調的展開ネットワークを提案する。
また,コヒーレンスに基づくラベルジェネレータと呼ばれるRID指向の反復型平均教師フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 00:40:41 GMT)
Generative Adversarial Networks for Image Super-Resolution: A Survey [49.6] 単一画像超解像(SISR)は画像処理の分野で重要な役割を果たしている。
近年のGAN(Generative Adversarial Network)は,小サンプルを用いた低解像度画像に対して優れた結果が得られる。
本稿では,異なる視点からGANの比較研究を行う。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:27:21 GMT)
MoE-LLaVA: Mixture of Experts for Large Vision-Language Models [49.3] 本稿では,LVLMのための簡易かつ効果的なトレーニング戦略であるMoE-Tuningを提案する。
MoE-LLaVAはMoEベースのスパースLVLMアーキテクチャであり、ルータを通じてトップkの専門家のみをユニークに活性化する。
様々な視覚的理解と物体幻覚のベンチマークにおいて,MoE-LLaVAの顕著な性能を示す実験を行った。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:05:14 GMT)
Facial Expression Analysis and Its Potentials in IoT Systems: A Contemporary Survey [48.6] 表情は人間の感情を伝達し、時間と強さに基づいてマクロ表現(MaEs)とマイクロ表現(MiEs)に分類することができる。
表情分析とIoT(Internet-of-Thing)システムの統合は、さまざまなシナリオにおいて大きな可能性を秘めている。
本研究は,表情分析における研究の進展の包括的概要を提供することを目標とし,IoTシステムとの統合について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:41:01 GMT)
Deliberation in Latent Space via Differentiable Cache Augmentation [48.2] 凍結した大規模言語モデルをオフラインコプロセッサで拡張し,キー値(kv)キャッシュで動作することを示す。
このコプロセッサは、後続の復号化の忠実性を改善するために設計された遅延埋め込みのセットでキャッシュを増強する。
キャッシュが拡張されると、デコーダは多数のトークンに対して低いパープレキシティを達成できることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:02:25 GMT)
Correctness is not Faithfulness in RAG Attributions [47.5] ソースドキュメントを明示的に引用することで、ユーザは生成されたレスポンスを検証し、信頼を高めることができる。
先行研究は引用正当性(引用された文書が対応する文をサポートするかどうか)を概ね評価している。
評価された回答に対する信頼を確立するためには、引用の正しさと引用の忠実さの両方を検討する必要がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:57:11 GMT)
EDGE: Unknown-aware Multi-label Learning by Energy Distribution Gap Expansion [47.0] Multi-label Out-Of-Distribution (OOD) 検出は,OOD サンプルを Multi-label In-Distribution (ID) サンプルから識別することを目的としている。
JointEnergyは、代表的なマルチラベルOOD推論基準である。
本研究では,不確実なエネルギー空間レイアウトを再構成する未知のマルチラベル学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:34:09 GMT)
The Superposition of Diffusion Models Using the Itô Density Estimator [46.0] 以上の結果から,SuperDiffは大規模な事前学習拡散モデルに対してスケーラブルであることを示す。
また、スーパーディフは推論時間中に効率的であることを示し、論理ORや論理ANDといった従来の合成演算子を模倣する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:18:07 GMT)
Friends-MMC: A Dataset for Multi-modal Multi-party Conversation Understanding [44.9] マルチモーダル・マルチパーティ・会話(MMC)は、あまり研究されていないが重要な研究テーマである。
MMCは、視覚とテキストの両方の文脈に多くのインターロケータが存在するため、文字中心の理解能力を必要とする。
ビデオコンテキストと組み合わせた24,000以上のユニークな発話を含むMCCデータセットであるFriends-MMCを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:32:48 GMT)
RepoTransBench: A Real-World Benchmark for Repository-Level Code Translation [44.9] リポジトリレベルのコード変換(Repository-level code translation)とは、コードリポジトリ全体をあるプログラミング言語から別の言語に翻訳することを指す。
以前のベンチマークでは、コードスニペット、関数、ファイルレベルのコード変換のいずれかに焦点を当てた、きめ細かいサンプルが提供されていた。
自動実行テストスイートを備えた実世界のリポジトリレベルのコード翻訳ベンチマークであるRepoTransBenchを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:52:10 GMT)
Empathetic Response in Audio-Visual Conversations Using Emotion Preference Optimization and MambaCompressor [44.5] まず、チャットボットのトレーニングに感情的選好最適化(EPO)を用いる。
このトレーニングは、モデルが正しい反応と反感情反応の微妙な区別を識別することを可能にする。
次に,MambaCompressorを導入し,会話履歴を効果的に圧縮し,管理する。
複数のデータセットにまたがる包括的実験により、我々のモデルは共感的応答の生成や長い対話の管理において、既存のモデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:44:51 GMT)
Reasoning to Attend: Try to Understand How <SEG> Token Works [44.3] 我々は、$texttSEG>$ tokenが画像とテキストのペア内のセマンティックな類似性に寄与していることを示す。
本稿では,高活性点の誘導の下で,LMMの高強度な$textbfREA$soning機能を実現するREADを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:44:05 GMT)
GaussianPainter: Painting Point Cloud into 3D Gaussians with Normal Guidance [44.0] 本稿では,3次元ガウス空間に点雲を描画する最初の手法であるガウス空間について紹介する。
本手法は3次元ガウススプラッティングのパラメータ空間に固有の非特異性問題に対処する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:45:37 GMT)
Sloth: scaling laws for LLM skills to predict multi-benchmark performance across families [43.4] 大規模言語モデルのスケーリング法則は、サイズやトレーニングデータといったパラメータに基づいてモデルパフォーマンスを予測する。
我々は、公開されているベンチマークデータを活用する新しいスケーリング法則であるSkills Scaling Laws (SSLaws)を提案する。
パラメータ同定と経験的評価について,12のベンチマークで理論的に検討した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:29:22 GMT)
Leveraging Cardiovascular Simulations for In-Vivo Prediction of Cardiac Biomarkers [43.2] 我々は、新たに構築された心臓シミュレーションの大規模なデータセットに基づいて、無傷神経後部推定器を訓練する。
シミュレーションデータと実世界の測定値との整合性を改善するために,要素モデリング効果を取り入れた。
提案するフレームワークは,実世界のデータに対する予測能力を向上するために,インバイブなデータソースをさらに統合することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:05:17 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:48:43 GMT)
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding [42.8] LangSurfは3D言語フィールドとオブジェクトの表面を整列する言語組み込みのSurface Fieldである。
提案手法は,オブジェクトを3次元空間に分割することで,インスタンス認識,削除,編集におけるアプローチの有効性を高めることができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:12:20 GMT)
Cross-Lingual Text-Rich Visual Comprehension: An Information Theory Perspective [42.7] LVLM(Large Vision-Language Models)は、チャート、テーブル、ドキュメントからのテキストリッチなイメージに対して、有望な推論能力を示している。
これにより、画像中の言語が命令の言語と異なる場合、言語間テキストリッチな視覚入力に対してLVLMの性能を評価する必要が生じる。
XT-VQA (Cross-Lingual Text-Rich Visual Question Answering) は,LVLMが画像テキストと質問間の言語不整合をどのように扱うかを評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:48:04 GMT)
The Prompt Report: A Systematic Survey of Prompting Techniques [42.6] 生成的人工知能システムは、様々な産業や研究領域に展開されつつある。
工学は矛盾する用語と 存在論的理解に苦しむ
本研究は,プロンプト技術と応用分析の分類を組み込むことにより,プロンプトエンジニアリングの構造化された理解を確立する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:38:36 GMT)
Emerging Microelectronic Materials by Design: Navigating Combinatorial Design Space with Scarce and Dispersed Data [42.5] 材料設計には計算モデリングと機械学習が用いられている。
物理機構、第一原理計算のコスト、データの分散は、物理に基づく材料モデリングとデータ駆動材料モデリングの両方に課題をもたらす。
本稿では,これらの課題に対処し,材料設計を加速するために,データ駆動および物理に基づく手法を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:06:19 GMT)
CC-Diff: Enhancing Contextual Coherence in Remote Sensing Image Synthesis [42.1] 本稿では,拡張コンテキストコヒーレンスを用いた拡散モデルに基づくRS画像生成手法であるCC-Diffを紹介する。
空間的相互依存を捉えるために,合成した前景のインスタンスに背景生成を条件付けるシーケンシャルパイプラインを提案する。
実験により、CC-Diffは視覚的忠実度、意味的精度、位置精度において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:23:08 GMT)
A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression [41.7] ギストベースの圧縮は,検索強化生成や長期文書QAといったタスクにおいて,ほぼ無作為な性能が得られることを示す。
境界によって失われ、サプライズによって失われ、途中で失われる3つの重要な障害パターンを特定します。
本稿では,従来のトークン情報の復号化を促進させる細粒度自動符号化と,セグメント単位のトークン重要度推定という2つの効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:24:04 GMT)
An Investigation on the Potential of KAN in Speech Enhancement [41.4] Kolmogorov-Arnold Networks (KAN) は、グラフエッジ上で学習可能なアクティベーション関数を利用する新興手法である。
本研究は,音声強調のための有理基底関数とラジアル基底関数に基づく2つの新しいカン変種について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:38:32 GMT)
APEX$^2$: Adaptive and Extreme Summarization for Personalized Knowledge Graphs [40.1] 本稿では,適応的な要約タスクにおいて優れた理論的保証を備えた,高度にスケーラブルなPKG要約フレームワークを提案する。
我々は、最大で1200万トリプルのベンチマークKGに対して、進化するクエリ設定の下でAPEX$2$を評価した。
実験の結果,APEXは問合せ精度と効率の両面で最先端のベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:02:06 GMT)
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models [39.7] ファンデーションビジョン言語モデル(VLM)はマルチモーダル表現学習、理解、推論において強力な能力を示す。
VLMにアクションコンポーネントを注入することにより、自然にVLA(Vision-Language-Action Models)を形成し、有望な性能を示すことができる。
本稿では,VLAの性能に大きく影響を及ぼす重要な要因を明らかにするとともに,3つの重要な設計選択に答えることに注力する。
我々はVLAの新たなファミリーであるRoboVLMsを開発し、3つのシミュレーションタスクと実世界の実験で非常に少ない手動設計と新しい最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:46:27 GMT)
From Skepticism to Acceptance: Simulating the Attitude Dynamics Toward Fake News [39.0] 大規模言語モデル(LLM)に基づくフェイクニュース伝搬シミュレーションフレームワークを提案する。
シミュレーションの結果,話題の関連性や個々の特徴に関連する偽ニュースの伝播パターンが,実世界の観測と一致していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:59:47 GMT)
Automating the Search for Artificial Life with Foundation Models [38.4] 本稿では、視覚言語基礎モデルを用いて、この機会の実現に成功したことを初めて提示する。
提案したアプローチは、自動人工生命探索(ASAL)と呼ばれ、ターゲット現象を生成するシミュレーションを見つける。
ASALは、Boids、Particle Life、Game of Life、Lenia、Neural Cellular Automataなど、さまざまなALife基板で効果的に動作する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:57:00 GMT)
AFANet: Adaptive Frequency-Aware Network for Weakly-Supervised Few-Shot Semantic Segmentation [38.0] 少ないショット学習は、いくつかのサンプルから学んだ事前知識を活用することで、新しい概念を認識することを目的としている。
弱教師付き少数ショットセマンティックセマンティックセグメンテーションのための適応周波数認識ネットワーク(AFANet)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:20:07 GMT)
AV-EmoDialog: Chat with Audio-Visual Users Leveraging Emotional Cues [38.0] AV-EmoDialogは,ユーザの音声・視覚入力からの言語情報や非言語情報を利用して,より応答性が高く共感的な対話を生成するための対話システムである。
AV-EmoDialogは、音声と視覚の対話における感情の手がかりを体系的に活用し、音声から音声の内容と感情のトーンを抽出し、視覚からきめ細かい表情を分析し、これらの手がかりを統合し、エンドツーエンドで感情的な反応を生成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:24:26 GMT)
V$^2$-SfMLearner: Learning Monocular Depth and Ego-motion for Multimodal Wireless Capsule Endoscopy [37.6] 深層学習は、カプセル内視鏡ビデオから深度マップとカプセルのエゴモーションを予測し、3Dシーンの再構築と病変の局所化を支援する。
既存のソリューションは、視覚ベースの処理にのみ焦点を合わせ、振動のような他の補助信号を無視している。
V$2$-SfMLearnerを提案する。これは、振動信号を視覚に基づく深度とカプセルの動き推定に組み込むマルチモーダルアプローチである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:11:30 GMT)
Diving into Self-Evolving Training for Multimodal Reasoning [36.7] 自己進化型トレーニングは推論能力を高めるための効果的でスケーラブルなアプローチである。
トレーニング方法,リワードモデル,プロンプト変動の3つの要因を同定する。
本稿では,MSTaR(Multimodal Self-evolving Training for Reasoning)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:18:41 GMT)
EasyTime: Time Series Forecasting Made Easy [35.7] 時系列予測の使用を簡略化するためにEasyTimeをどのように利用できるかを示す。
EasyTimeは、新しい予測方法のワンクリック評価を可能にする。
予測手法を組み合わせることで予測精度を向上する自動アンサンブルモジュールを提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:22:02 GMT)
CustomTTT: Motion and Appearance Customized Video Generation via Test-Time Training [35.4] 本稿では,映像の外観や動きを簡単にジョイントできるCustomTTTを提案する。
それぞれのLoRAは個別に訓練されているので、組み合わせた後にパラメータを更新するための新しいテストタイムトレーニング手法を提案する。
本手法は, 定性評価と定量的評価の両面で, 最先端の作業に優れる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:52:45 GMT)
Large Language Model Safety: A Holistic Survey [35.4] 大規模言語モデル(LLM)の急速な開発と展開により、人工知能の新たなフロンティアが導入された。
この調査は、LLMの安全性の現在の状況の概要を包括的に紹介し、価値のミスアライメント、敵の攻撃に対する堅牢性、誤用、自律的なAIリスクの4つの主要なカテゴリをカバーしている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:11:27 GMT)
QUART-Online: Latency-Free Large Multimodal Language Model for Quadruped Robot Learning [35.1] 本稿では,多モーダル大規模言語モデル(MLLM)を4つの視覚-言語-アクションタスクに展開する際の,固有の推論遅延問題に対処する。
言語基盤モデルの性能を劣化させることなく推論効率を向上させるために, QUIRT-Online と呼ばれる新しい待ち時間フリーの4重結合MLLMモデルを提案する。
実験の結果, QUIRT-Onlineは既存のMLLMシステムと連動して動作し, 制御周波数に同期してリアルタイムの推論を実現することがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:06:17 GMT)
Align-DETR: Enhancing End-to-end Object Detection with Aligned Loss [35.1] 本稿では,モデル内の2つの重要な相違点を同定する。
両課題間の相違を解決するために,Align Lossと呼ばれる新たな損失関数を導入する。
提案手法は,ResNet-50バックボーンを用いたH-DETRベースライン上で49.3% (+0.6) APを実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:30:51 GMT)
Observation Interference in Partially Observable Assistance Games [34.5] 我々は,人間とAIアシスタントが部分的な観察を行うことを可能にする,人間-AI値アライメント問題のモデルについて検討する。
最適なアシスタントは、人間が最適に演奏している場合でも、観察干渉行動をとる必要がある。
不合理性のボルツマンモデルに従えば、これはアシスタントが観察に干渉するインセンティブを生じさせることが示される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:53:33 GMT)
Revisiting 360 Depth Estimation with PanoGabor: A New Fusion Perspective [33.9] 本稿では,これらの課題に対処するため,指向性歪みを考慮したGabor Fusionフレームワーク(PGFuse)を提案する。
再帰的歪みに対処するために、線形緯度対応の歪み表現法を設計し、カスタマイズされた歪み対応ガボルフィルタを生成する。
ガボル変換の配向感度を考慮すると、この感度を安定させるために球面勾配制約を導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:00:31 GMT)
A 3-dimensional scanning trapped-ion probe [33.7] 単一原子量子センサーは、高空間分解能と電気および磁場に対する高感度を提供する。
金属表面から3次元位置走査を50$mumathrmm$から450$mumathrmm$まで提供する単一イオンプローブを実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:50:48 GMT)
Architecture-Aware Learning Curve Extrapolation via Graph Ordinary Differential Equation [33.6] 本稿では,学習曲線を連続的に予測するアーキテクチャを考慮したニューラル微分方程式モデルを提案する。
我々のモデルは、純粋な時系列モデリングとCNNベースの学習曲線の両方に対して、最先端の学習曲線法および補間アプローチより優れている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:48:27 GMT)
Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence [33.4] 数ショットのアクション認識では、ビデオの長いサブシーケンスは、アクション全体をより効果的に表現する。
最近のMambaは、長いシーケンスをモデリングする効率を示すが、MambaをFSARに直接適用することは、局所的な特徴モデリングとアライメントの重要性を見落としている。
これらの課題を解決するために,Matryoshka MAmba と CoNtrasTive LeArning フレームワーク (Manta) を提案する。
Mantaは、SSv2、Kineetics、UCF101、HMDB51などの著名なベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:25:42 GMT)
Be More Diverse than the Most Diverse: Online Selection of Diverse Mixtures of Generative Models [33.0] 本研究では,複数の生成モデルの組み合わせの選択について検討する。
我々はMixture-UCB(Mixture-UCB)と呼ばれるオンライン学習手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:48:17 GMT)
LokiTalk: Learning Fine-Grained and Generalizable Correspondences to Enhance NeRF-based Talking Head Synthesis [32.1] ライフライクな顔のダイナミックスでNeRFをベースとした発話ヘッドを強化するフレームワークであるLokiTalkを提案する。
領域特異的変形場は、全体の肖像画の動きを唇の動き、点滅、頭部ポーズ、胴体の動きに分解する。
また,マルチアイデンティティビデオから動的および静的な対応を一般化するプラグイン・アンド・プレイモジュールであるID-Aware Knowledge Transferを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:15:50 GMT)
CodeV: Issue Resolving with Visual Data [32.1] 我々は,大規模言語モデル(LLM)の問題解決能力を高めるために,視覚データを活用するための最初のアプローチであるCodeVを提案する。
CodeVは、データ処理とパッチ生成という2段階のプロセスに従えば、各問題を解決できる。
CodeVの有効性を実証するとともに、GitHubの問題を解決するために視覚データを活用するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:17:11 GMT)
mABC: multi-Agent Blockchain-Inspired Collaboration for root cause analysis in micro-services architecture [31.9] マイクロサービスアーキテクチャ(mABC)における根本原因分析のための先駆的フレームワークであるマルチエージェント型コラボレーションを提案する。
mABCは、マイクロサービスアーキテクチャにおける包括的な自動化された根本原因分析と解決を提供し、ITオペレーションドメインを大幅に改善します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:46:10 GMT)
Mimicking-Bench: A Benchmark for Generalizable Humanoid-Scene Interaction Learning via Human Mimicking [31.7] 人間のデータを模倣して3Dシーンと対話するヒューマノイドロボットの一般的なスキルを学ぶことは、重要な研究課題である。
既存の方法論とベンチマークは、手作業による小規模なデモによって制約される。
一般ヒューマノイド・シーンインタラクション学習のための総合的なベンチマークであるMimicking-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:27:30 GMT)
Adaptive-Solver Framework for Dynamic Strategy Selection in Large Language Model Reasoning [31.6] 大きな言語モデル(LLM)は、推論タスクを扱う素晴らしい能力を示している。
LLMベースのほとんどの手法はワンサイズ・オールアプローチを採用している。
これらの手法の柔軟性は不要な計算オーバーヘッドや準最適性能をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:29:47 GMT)
Causal Composition Diffusion Model for Closed-loop Traffic Generation [31.5] 本稿では,これらの課題に対処するための構造誘導拡散フレームワークであるCausal Compositional Diffusion Model (CCDiff)を紹介する。
まず、制約付き最適化問題として、制御可能で現実的な閉ループシミュレーションの学習を定式化する。
そして、CCDiffは拡散過程に直接因果構造を自動同定し注入することにより、現実主義に固執しながら制御性を最大化する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:20:29 GMT)
UniGLM: Training One Unified Language Model for Text-Attributed Graph Embedding [31.5] 統一グラフ言語モデル(Unified Graph Language Model、UniGLM)は、グラフ埋め込みモデルであり、ドメイン内およびドメイン間TAGの両方によく一般化する。
UniGLMには、構造的に類似したノードを特定するための適応的な正のサンプル選択技術と、トレーニングを加速するために考案された遅延コントラストモジュールが含まれている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:30:47 GMT)
Free-viewpoint Human Animation with Pose-correlated Reference Selection [31.4] 拡散に基づく人間アニメーションは、人物の人物像と、ポーズの列のような信号の駆動に基づいて人間キャラクターをアニメーションすることを目的としている。
既存のアプローチは、高忠実なポーズを生成することができるが、重要な視点の変化に苦慮している。
本稿では,ポーズ関連参照選択拡散ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:22:44 GMT)
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation [31.4] 本稿では,AVS と RVOS タスクという,オーディオおよび言語参照オブジェクトセグメンテーションのトレーニングフリーパラダイムを探求する。
トレーニング不要のAL-Ref-SAM 2パイプラインは、完全に教師された微調整手法に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:10:30 GMT)
DynamicPAE: Generating Scene-Aware Physical Adversarial Examples in Real-Time [31.3] 物理敵例(PAEs)は、ディープラーニング応用における現実世界のリスクの「ウィストル・ブロワーズ」と見なされている。
動的PEEの生成における主な課題は、ノイズの多い勾配フィードバックの下でパターンを探索し、シナリオの性質にアタックを適用することである。
静的アタック以外のリアルタイムな物理的アタックを可能にする最初の生成フレームワークであるDynamicPAEを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:53:13 GMT)
Leveraging Memory Retrieval to Enhance LLM-based Generative Recommendation [31.3] LLM(Large Language Models)は、アイテム生成にユーザとイテムのインタラクション履歴を利用することができる。
本稿では,メモリの長期的関心を記憶するための新しい自動記憶検索フレームワーク(Automated Memory-Retrieval framework, AutoMR)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:10:09 GMT)
DAMPER: A Dual-Stage Medical Report Generation Framework with Coarse-Grained MeSH Alignment and Fine-Grained Hypergraph Matching [31.2] DAMPERは、医療報告作成のための2段階のフレームワークであり、レポート作成の2段階における臨床パイプラインを模倣している。
第1段階では、MCG(MeSH-Guided Coarse-Grained Alignment)ステージは、胸部X線像の特徴と、MeSH(Messical subject Heads)特徴とを一致させて、全体的な印象の粗いキーフレーズ表現を生成する。
第2段階では、ハイパーグラフ強化ファイングラインドアライメント(HFG)ステージは、画像パッチとレポートアノテーションのためのハイパーグラフを構築し、各モダリティ内の高次関係をモデル化し、セマンティックをキャプチャするためにハイパーグラフマッチングを実行する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:14:13 GMT)
Ultra-sensitive heterodyne detection at room temperature in the atmospheric windows [31.1] 一極性量子光検出器に局所発振器を印加した量子カスケードレーザーの室温ヘテロダイン検出を報告する。
測定されたヘテロダインノイズ等価電力は、直接検出した騒音よりも6桁低い。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:11:30 GMT)
ActiveGS: Active Scene Reconstruction using Gaussian Splatting [30.8] オンボードのRGB-Dカメラを用いて未知のシーンの正確な地図を作成するという課題に挑戦する。
本稿では,ガウススプレイティングマップと粗いボクセルマップを組み合わせたハイブリッドマップ表現を提案する。
本研究では,無人航空機を用いた実世界におけるアクティブなシーン再構築フレームワークの適用性を実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:29:03 GMT)
Towards efficient representation identification in supervised learning [30.8] 人間は複雑な感覚入力を分解する驚くべき能力を持っている。
我々は,補助情報次元が真の潜在表現の次元よりもはるかに小さい場合でも,絡み合いが可能であることを理論的,実験的に示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:25:34 GMT)
Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark [30.7] 6つの公開データセットと12のベンチマークモデルと、トレーニングと評価パイプラインで構成されるベンチマークである textbfScenario-Wise Rec を紹介します。
このベンチマークは、研究者に先行研究から貴重な洞察を提供することを目的としており、新しいモデルの開発を可能にしている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:15:34 GMT)
Probing the magnetic origin of the pseudogap using a Fermi-Hubbard quantum simulator [30.3] 強い相関を持つ物質では、相互作用する電子は絡み合って集合量子状態を形成する。
超伝導は、臨界温度を超える異常な擬ギャップの金属状態から低いドーピングで現れる。
我々は、量子ガス顕微鏡Fermi-Hubbardシミュレータを用いて、幅広いドーピングレベルと温度を探索する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:58:01 GMT)
BenCzechMark : A Czech-centric Multitask and Multimetric Benchmark for Large Language Models with Duel Scoring Mechanism [30.3] BenCzechMark (BCM) は、大規模な言語モデル向けに設計されたチェコ初の総合的な言語ベンチマークである。
私たちのベンチマークには50の課題があり、対応するテストデータセット、主にチェコ原産で、新たに収集された11のタスクが含まれています。
これらのタスクは8つのカテゴリにまたがり、歴史的チェコのニュース、生徒や言語学習者のエッセイ、話し言葉など様々な分野をカバーする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:45:20 GMT)
FedMeld: A Model-dispersal Federated Learning Framework for Space-ground Integrated Networks [29.5] 宇宙地上統合ネットワーク(SGIN)は、世界中の隅々に人工知能(AI)サービスを提供することが期待されている。
SGINsのミッションの1つは、世界規模で連邦学習(FL)をサポートすることである。
本稿では,モデル分散(FedMeld)戦略に基づく,インフラストラクチャフリーなフェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:58:12 GMT)
Fast Causal Discovery by Approximate Kernel-based Generalized Score Functions with Linear Computational Complexity [29.4] 我々は,$mathcalO(n)$時間と空間複素量を持つカーネルベース一般化スコア関数を提案する。
提案手法は計算コストを大幅に削減するだけでなく,特に大規模データセットの精度も向上する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:51:45 GMT)
A Dual-Perspective Metaphor Detection Framework Using Large Language Models [29.2] メタファ検出のための新しいデュアルパースペクティブフレームワークであるDMDを提案する。
比喩理論の暗黙的および明示的な応用を利用して比喩検出においてLLMを導く。
従来の手法と比較して、我々のフレームワークはより透過的な推論プロセスを提供し、より信頼性の高い予測を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:50:04 GMT)
Knowledge Graphs are all you need: Leveraging KGs in Physics Question Answering [28.3] 質問回答タスクに対するモデル応答品質の向上を目的としたパイプラインを導入する。
LLMを用いて質問の内部ロジックをキャプチャする知識グラフを構築することにより、これらのグラフはサブクエストの生成をガイドする。
その結果,知識グラフから派生したサブクエストは,元の質問の論理に対する忠実度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:40:52 GMT)
Towards Unsupervised Model Selection for Domain Adaptive Object Detection [27.6] ドメイン適応オブジェクト検出のための教師なしモデル選択手法を提案する。
パラメータ空間の平坦なミニマ領域に位置するモデルは通常、優れた一般化能力を示す。
一般化により、平坦性はモデル分散と見なせるが、ミニマは検出されたタスクの領域分布距離に依存することを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:06:26 GMT)
Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis [27.4] 本稿では,リアルタイム音声ヘッド合成が可能な拡散型フレームワークであるDittoを紹介する。
私たちの重要なイノベーションは、明示的なアイデンティティに依存しないモーション空間を通じて、ブリッジングモーション生成とフォトリアリスティックなニューラルレンダリングです。
この設計は、合成音声ヘッドの正確な制御を可能にしながら、拡散学習の複雑さを著しく低減する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:04:09 GMT)
Cluster-wise Graph Transformer with Dual-granularity Kernelized Attention [27.3] グラフを,各クラスタを1つの埋め込みに圧縮することなく,相互接続したノード集合のネットワークとして想定する。
これらのノード間の効果的な情報伝達を実現するために,ノード間クラスタアテンション(N2C-Attn)機構を提案する。
N2C-Attnがクエリとキーの2レベル特徴マップを組み合わせる方法を示し、二重粒度情報をマージする能力を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:55:20 GMT)
Fast Gradient Computation for RoPE Attention in Almost Linear Time [27.3] 我々は,RoPEに基づく有界エントリ下での逆方向の計算のための,最初のニアリニア時間アルゴリズムを開発した。
我々のアプローチは、高速なRoPEアテンション計算の最近の進歩に基づいている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:20:22 GMT)
ADC: Enhancing Function Calling Via Adversarial Datasets and Code Line-Level Feedback [27.2] 大規模言語モデル(LLM)は自然言語処理とコーディングにおいて大きな進歩を遂げているが、複雑な関数呼び出しの堅牢性と正確性に苦慮している。
本稿では,LLMの関数形式を追従し,複雑なパラメータにマッチする能力を高める革新的なアプローチであるADCを紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:07:18 GMT)
A Survey on Multi-Generative Agent System: Recent Advances and New Frontiers [27.0] 多世代エージェントシステム(MGAS)は,大規模言語モデル(LLM)の台頭以来,研究ホットスポットとなっている。
本稿では,これらの研究を包括的に調査する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:11:51 GMT)
Steps are all you need: Rethinking STEM Education with Prompt Engineering [26.6] シュートとチェーン・オブ・ワートのプロンプトは、物理学的質問回答タスクに適用すると、有望であることが示されている。
物理質問回答タスクに適用された場合、ほとんどショットやチェーン・オブ・ソートのプロンプトは期待できない。
The Mixture of Experts (MoE) Model, as analogical prompting, we can be shown improve model performance。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:06:24 GMT)
LLM4AD: A Platform for Algorithm Design with Large Language Model [26.2] LLM4ADは,大規模言語モデル(LLM)を用いたアルゴリズム設計(AD)のための統一Pythonプラットフォームである。
プラットフォームは多くの重要なメソッドを統合し、最適化、機械学習、科学的発見など、さまざまな領域にわたる幅広いアルゴリズム設計タスクをサポートする。
チュートリアル、例、ユーザマニュアル、オンラインリソース、専用グラフィカルユーザインターフェース(GUI)など、包括的なサポートリソーススイートをコンパイルしました。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:12:54 GMT)
Guided Real Image Dehazing using YCbCr Color Space [25.8] 本稿では, YCbCr のRGB よりも優れた構造特性を生かした新規な構造ガイドデハジングネットワーク (SGDN) を提案する。
効果的な教師付き学習のために,実世界適応型Hazeデータセットを導入する。
実験により,本手法は複数の実世界の煙・煙・煙のデータセットにまたがって既存の最先端手法を超越していることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:53:06 GMT)
Your Causal Self-Attentive Recommender Hosts a Lonely Neighborhood [25.7] 両方向/自動符号化(AE)と一方向/自動回帰(AR)の注意機構の比較分析を行った。
理論解析を支援するために,バニラと変種AE/ARの注目度を5つのベンチマークで比較する実験を行った。
適応チューニング,モジュール化設計,Hugingface に基づく結果が報告されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:26:56 GMT)
Towards Foundation Models on Graphs: An Analysis on Cross-Dataset Transfer of Pretrained GNNs [25.6] 本研究では,事前学習したグラフニューラルネットワークがデータセット間で適用可能な範囲について検討する。
機能に依存しないまま特徴情報をキャプチャする拡張を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:28:56 GMT)
S-INF: Towards Realistic Indoor Scene Synthesis via Scene Implicit Neural Field [25.5] 室内シーン合成のためのS-INF(Scene Implicit Neural Field)を導入し,マルチモーダルな関係の有意義な表現を学習することを目的とした。
S-INFは、マルチモーダルな関係をシーンレイアウトの関係と詳細なオブジェクト関係に切り離し、後に暗黙のニューラルネットワークを通してそれらを融合させる。
室内シーンの異なるタイプの合成において、最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:29:35 GMT)
CLAPNQ: Cohesive Long-form Answers from Passages in Natural Questions for RAG systems [25.4] 完全なRAGパイプラインのためのロングフォーム質問回答データセットのベンチマークであるClapNQを提示する。
ClapNQの答えは簡潔で、全文よりも3倍小さく、結束的であり、多くの場合、連続しない複数の節を統合することで、解答は流動的に構成される。
本稿では,基礎となるRAGの改善の余地がまだ残っている地域に焦点を当てた,ClapNQのベースライン実験と解析を行う。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:01:11 GMT)
From 2D Images to 3D Model:Weakly Supervised Multi-View Face Reconstruction with Deep Fusion [25.1] 我々は,多視点画像間の特徴対応を探索し,高精度な3次元顔の再構成を行う,Deep Fusion MVRと呼ばれる新しいパイプラインを提案する。
具体的には、マスクを用いて複数のエンコーダの特徴を整列させる、新しいマルチビュー機能融合バックボーンを提案する。
マルチビュー機能融合と顔再構成を容易にする1つの簡潔なマスク機構を開発した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:10:36 GMT)
ShotQC: Reducing Sampling Overhead in Quantum Circuit Cutting [25.0] ShotQCは、古典的な後処理の複雑さを増大させることなくサンプリングオーバーヘッドを大幅に削減する。
ShotQCは,従来の後処理の複雑さを増大させることなく,サンプリングオーバーヘッドを大幅に削減できることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:34:57 GMT)
EraseDraw: Learning to Draw Step-by-Step via Erasing Objects from Images [24.6] 以前の作業は、画像のグローバルな変更、非現実的な空間的な場所へのオブジェクト挿入、不正確な光の詳細の生成によって失敗することが多い。
我々は、最先端のモデルではオブジェクト挿入が不十分であるが、オブジェクトを削除し、自然画像の背景を非常によく消し去ることができることを観察した。
様々な領域にまたがる多様な挿入プロンプトと画像について,説得力のある結果を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:42:41 GMT)
VidTwin: Video VAE with Decoupled Structure and Dynamics [24.5] VidTwinはビデオの自動エンコーダで、ビデオを2つの異なる遅延空間に分離する。
構造潜時ベクトルは全体内容とグローバルな動きを捉え、ダイナミクス潜時ベクトルは微細な詳細と高速な動きを表す。
実験により、VidTwinは高い圧縮率で高い復元品質で0.20%を達成することが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:16:58 GMT)
What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.2] 実世界の四角形におけるゼロショット展開が可能なロバストなRL制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:27:07 GMT)
Detail-Preserving Latent Diffusion for Stable Shadow Removal [24.2] 安定かつ効率的なシャドウ除去に安定拡散モデルを適用するための2段階微調整パイプラインを提案する。
実験の結果,提案手法は最先端のシャドウ除去技術より優れていた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:06:46 GMT)
Theoretical Constraints on the Expressive Power of $\mathsf{RoPE}$-based Tensor Attention Transformers [24.0] 本研究では, アテンションと$mathsfRoPE$-based Attentionの回路複雑性を分析し, 固定メンバシップ問題や$(A_F,r)*$クロージャ問題を解くことができないことを示す。
これらの結果は,経験的性能と注意の理論的制約と$mathsfRoPE$ベースの注意変換器とのギャップを浮き彫りにした。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:26:07 GMT)
Multimodal Preference Data Synthetic Alignment with Reward Model [24.0] 本稿では,DPOトレーニングによる効果的なマルチモーダルアライメントのための人選好のプロキシとして,報酬モデルを用いて合成データを生成する新しいフレームワークを提案する。
実験結果から、生成モデルや報酬モデルのような選択された合成データの統合は、人手による注釈付きデータへの依存を効果的に軽減できることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:29:40 GMT)
Fourier Position Embedding: Enhancing Attention's Periodic Extension for Length Generalization [23.9] 回転位置埋め込み(RoPE)は非均一離散フーリエ変換を暗黙的に達成することで周期的に注意を向けることができることを示す。
この周期性は,1) 線形層と注意領域外の活性化機能,2) 時間領域切断による周波数成分の不足によるスペクトル損傷によって損なわれている。
本稿では,FoPE (Fourier Position Embedding) を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:44:01 GMT)
Condor: A Code Discriminator Integrating General Semantics with Code Details [23.8] 本稿では,複数の生成結果から信頼性の高い出力を選択するための識別器であるCondorを紹介する。
まず、ベースモデルのコード表現を最適化するために、コントラスト学習を設計する。
そして、コード修正プロセスの中間データを利用して、識別者のトレーニングデータをさらに強化する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:47:20 GMT)
Enhancing Topic Interpretability for Neural Topic Modeling through Topic-wise Contrastive Learning [23.8] トピックの正規化を含まない可能性の過剰強調は、トピックモデリングの過剰な拡張潜在空間につながる可能性がある。
本稿では,トピック解釈可能性の複数の面を評価可能な微分正則化器を統合した新しいNTMフレームワークContraTopicを提案する。
我々のアプローチは、最先端のNTMと比較して、優れた解釈可能性を持つトピックを一貫して生成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:07:06 GMT)
On the Generalization Ability of Machine-Generated Text Detectors [23.4] 大規模言語モデル(LLM)は、機械生成テキスト(MGT)に対する懸念を提起している。
本研究はMGT検出器の3つの側面における一般化能力について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:30:34 GMT)
Chumor 2.0: Towards Benchmarking Chinese Humor Understanding [23.4] Chumorは中国初のユーモアデータセットで、既存のユーモアデータセットの規模を超える。
Chumorは中国のRedditのようなプラットフォームで、知的に挑戦的で文化的に特定のジョークを共有することで有名だ。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:19:58 GMT)
GR-MG: Leveraging Partially Annotated Data via Multi-Modal Goal-Conditioned Policy [23.3] テキスト命令とゴール画像の条件付けを支援する新しい手法GR-MGを提案する。
GR-MGは拡散ベース画像編集モデルを介して目標画像を生成し、テキストと生成された画像の両方に条件を付与する。
シミュレーション実験では、GR-MGは5列のタスクの平均数を3.35から4.04に改善した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:08:16 GMT)
Boosting LLM via Learning from Data Iteratively and Selectively [23.3] 複雑さと多様性を同時に測定する。
IterITは、トップランクのサンプルの複雑性スコアを反復的に更新することで、両方の世界の強みを統合する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:01:24 GMT)
RATT: A Thought Structure for Coherent and Correct LLM Reasoning [23.3] 本稿では,思考過程の各段階における論理的健全性と事実的正当性の両方を考慮した新しい思考構造であるRetrieval Augmented Thought Tree(RATT)を紹介する。
様々な種類のタスクに関する実験では、RATT構造が既存の手法を事実的正当性と論理的整合性で著しく上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:43:01 GMT)
FFA Sora, video generation as fundus fluorescein angiography simulator [23.1] Fundus fluorescein angiography(FFA)は網膜血管疾患の診断に重要である。
本研究では,FFAレポートを動的ビデオに変換するテキスト・ビデオ・モデルであるFFA Soraを開発した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:18:13 GMT)
Sensitivity Curve Maximization: Attacking Robust Aggregators in Distributed Learning [23.0] 分散学習エージェントは、グローバルな学習問題を協調的に解決することを目的としている。
ネットワークのサイズが大きくなるにつれて、個々のエージェントが悪意や欠陥を持っている可能性がますます高まっている。
これは、学習プロセスの退化または完全な分解につながる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:44:03 GMT)
Adaptive Channel Allocation for Robust Differentiable Architecture Search [22.9] 微分可能なArchiTecture Search(DARTS)は、その単純さと効率の大幅な向上により、多くの注目を集めている。
スキップ接続の過度な蓄積は、訓練エポックが大きくなると、安定性とロバスト性に悩まされる。
より微妙で直接的なアプローチとして,検索段階における接続のスキップを明示的に検索しないアプローチを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:48:08 GMT)
Non-Convex Tensor Recovery from Local Measurements [22.7] 本論文は, テンソル全体の検知が不可能な設定により, テンソル圧縮センシングモデルを提案する。
ScaleAlt-PGD-Alt-DMinが$mathcal O(log frac1epsilon)$を達成し、サンプルを$mathcal Oleftに改善することを証明する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:04:56 GMT)
WildPPG: A Real-World PPG Dataset of Long Continuous Recordings [22.6] 本研究では,屋外環境における日常活動からの表現的データを処理する際に,最先端の人事推定手法が困難であることを示す。
13.5時間に16人の参加者による野外活動における連続PSG記録のための新しいマルチモーダルデータセットとベンチマーク結果を紹介した。
本稿では,既存のベースラインよりも現実のシナリオにおいて,HR値をより堅牢に推定する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:02:45 GMT)
Just What You Desire: Constrained Timeline Summarization with Self-Reflection for Enhanced Relevance [22.5] 制約付きタイムライン要約(CTLS)と呼ばれる新しいタスクを導入し、タイムライン内のすべてのイベントが制約を満たすタイムラインを生成する。
本稿では,大言語モデル(LLM)を用いて,特定の制約に従ってニュース記事を要約し,制約付きタイムラインに含まれる重要なイベントをクラスタ化する手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:17:06 GMT)
Revisiting Multimodal Fusion for 3D Anomaly Detection from an Architectural Perspective [22.5] 我々は3D-ADに寄与するマルチモーダル・フュージョン・アーキテクチャ(トポロジー)設計の役割を分析する。
マルチモーダル融合戦略とモダリティ特異的モジュールを同時に探索する3D-ADNASを提案する。
広範囲な実験により、3D-ADNASは様々なモデル容量で連続的に3D-ADを改善することが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:38:49 GMT)
xPatch: Dual-Stream Time Series Forecasting with Exponential Seasonal-Trend Decomposition [21.9] 指数関数分解を利用した新しいデュアルストリームアーキテクチャを開発した。
本研究では,頑健なアークタンジエント損失関数とシグモイド学習率調整スキームを開発し,予測性能の過度化と向上を防止した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:32:59 GMT)
CharGen: High Accurate Character-Level Visual Text Generation Model with MultiModal Encoder [21.9] CharGenは、非常に正確な文字レベルのビジュアルテキスト生成と編集モデルである。
文字レベルのマルチモーダルエンコーダを使用し、文字レベルの埋め込みを抽出するだけでなく、グリフ画像の文字を文字単位でエンコードする。
CharGenはテキストレンダリングの精度を大幅に改善し、AnyText-benchmarkやMARIO-Evalといった公開ベンチマークにおける最近の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:40:07 GMT)
VITRO: Vocabulary Inversion for Time-series Representation Optimization [21.3] 本稿では,自然言語の離散的,意味的な性質と時系列データの連続的,数値的性質とのギャップを埋めるために,VITROを提案する。
学習可能な時系列固有の擬単語埋め込みは、既存の汎用言語モデル語彙よりも時系列データの表現が優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:24:51 GMT)
EPE-P: Evidence-based Parameter-efficient Prompting for Multimodal Learning with Missing Modalities [21.0] モダリティの欠如は、実世界のマルチモーダル学習シナリオにおいて、トレーニングとテストの両方で発生する一般的な課題である。
欠落したモダリティを管理する既存の方法は、しばしば各モダリティや欠落したケースに対して別々のプロンプトを設計する必要がある。
我々はエビデンスに基づくエビデンスを提案する。
事前学習型マルチモーダルネットワークのための新規かつパラメータ効率の高い手法EPE-P。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:01:12 GMT)
Understanding Individual Agent Importance in Multi-Agent System via Counterfactual Reasoning [20.8] 本稿では,エージェントの重要度を評価する新しいエージェントレベルの説明手法であるEMAIを提案する。
反実的推論にインスパイアされたエージェントのランダム化作用による報酬の変化は、その重要性を示唆している。
EMAIは、ベースラインよりも説明の忠実度が高く、実践的応用においてより効果的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:56:56 GMT)
FFT: Towards Harmlessness Evaluation and Analysis for LLMs with Factuality, Fairness, Toxicity [20.5] 生成的人工知能の普及により、AI生成テキストによる潜在的な害に対する懸念が高まっている。
これまでの研究者は、生成言語モデルの無害性を評価するために多くの努力を払ってきた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:04:49 GMT)
PI-Whisper: Designing an Adaptive and Incremental Automatic Speech Recognition System for Edge Devices [20.0] 本稿では,話者の特徴をリアルタイムに識別し,認識能力を適応的に向上する新しいASRシステムであるPI-Whisperを提案する。
PI-Whisperは最先端の精度を実現し、ワードエラー率(WER)を基準値に対して最大13.7%削減し、計算資源に対して線形にスケーリングする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:22:48 GMT)
SMAC-Hard: Enabling Mixed Opponent Strategy Script and Self-play on SMAC [19.9] トレーニングの堅牢性と評価の包括性を高めるための新しいベンチマークであるSMAC-HARDを提案する。
SMAC-HARDは、カスタマイズ可能な対戦戦略、敵ポリシーのランダム化、MARLのセルフプレイのためのインターフェースをサポートする。
我々は、SMAC-HARD上で広く使われているアルゴリズムと最先端のアルゴリズムを広範囲に評価し、編集・混合戦略相手がもたらす重大な課題を明らかにした。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:36:21 GMT)
ANID: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance [19.8] AI-Natural Image Discrepancy Evaluationベンチマークを導入し、重要な問題に対処する。
大規模マルチモーダルデータセットであるDNAI(Distinguishing Natural and AI- generated Images)データセットを構築した。
粒度評価フレームワークは,5つの重要な領域にわたるDNAIデータセットを包括的に評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:08:08 GMT)
OmniPred: Language Models as Universal Regressors [19.6] 任意のフォーマットから$(x,y)$のデータに対して,言語モデルをユニバーサルなエンドツーエンド回帰器としてトレーニングするためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:19:53 GMT)
SEAS: Self-Evolving Adversarial Safety Optimization for Large Language Models [19.5] 大規模言語モデル(LLM)は能力と影響力を向上し続け、セキュリティを確保し、有害な出力を防ぐことが重要になっている。
これらの問題に対処するための有望なアプローチは、レッドチームのための敵のプロンプトを自動的に生成するトレーニングモデルである。
本稿では,モデル自体が生成したデータを活用することで,セキュリティを向上させるための最適化フレームワークであるmathbfStextelf-mathbfEtextvolving mathbfAtextdversarial mathbfStextafetyety mathbf(SEAS)について紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:44:30 GMT)
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration [19.4] 正書法統一とLAMA-UT(Language-Agnostic Multilingual ASR Pipeline)による言語に依存しないASRパイプラインを提案する。
LAMA-UTは、最小限のデータ量でトレーニングされた最先端モデルのパフォーマンスに適合しながら、言語固有のモジュールなしで動作します。
パイプラインはWhisperと比較して45%の相対誤差低減率を実現し,MMSと相容れない性能を示した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:37:25 GMT)
SCBench: A Sports Commentary Benchmark for Video LLMs [19.1] 我々は,ビデオ大言語モデル(ビデオLLM)のためのスポーツビデオ解説生成のためのベンチマークを開発する。
$textbfSCBench$はタスク用に特別に設計された6次元計量であり、GPTに基づく評価手法を提案する。
結果,InternVL-Chat-2は5.44で最高の性能を示し,1.04で2位となった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:13:56 GMT)
PC Agent: While You Sleep, AI Works -- A Cognitive Journey into Digital World [19.0] PC Agentは、人間の認知伝達を通じて、このビジョンに向けて重要なステップを示すAIシステムである。
この仮説を検証するために、我々は3つの重要な革新を紹介した。
PowerPointのプレゼンテーション作成における予備的な実験は、少量の高品質な認知データで複雑なデジタル作業機能を実現することができることを示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:02:12 GMT)
FedLEC: Effective Federated Learning Algorithm with Spiking Neural Networks Under Label Skews [19.0] フェデレートラーニング(FL)とスパイキングニューラルネットワーク(SNN)は、リソース制約のあるエッジデバイス間で協調学習を行うための、よりエネルギー効率の良いスキーマを提供する可能性がある。
FLシステムにおける重要な課題の1つは、異なるクライアントからのデータはしばしば非独立で、同じ分散(非IID)であることである。
この課題に対処するために、FedLECという実践的なポストホックフレームワークを提案する。
このフレームワークは、各局所モデルの一般化能力を高めるために、局所的欠落ラベルに対応する局所ロジットを罰する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:52:32 GMT)
CARL-GT: Evaluating Causal Reasoning Capabilities of Large Language Models [19.0] 因果推論能力は、教育や医療といった幅広い応用において、大きな言語モデル(LLM)にとって不可欠である。
グラフとタブラリデータを用いた大規模言語モデルのCAusal Reasoning機能を評価するCARL-GTというベンチマークを提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:34:32 GMT)
B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners [19.0] 自己改善は、パフォーマンスを向上させる主要な方法として現れています。
本稿では,この反復的プロセスにおいて2つの重要な要因をモニタする手法を提案し,提案する。
B-STaRは、反復的な構成を調整し、探索とエクスプロイトのバランスをとる自己学習推論フレームワークである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:58:34 GMT)
Hyperbolic Chamfer Distance for Point Cloud Completion and Beyond [18.8] チャンファー距離(CD)は、外れ値の存在に対して脆弱である。
Hyperbolic Chamfer Distance (HyperCD)は、ポイントクラウド完了タスク用に特別に設計された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:04:07 GMT)
Large Language Models have Intrinsic Self-Correction Ability [18.8] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおける例外的な能力に対して大きな注目を集めている。
LLMのパフォーマンスを改善するための有望な解決策の1つは、LLMに世代ごとの回答の修正を求めることである。
内在的な自己補正は、外部知識を活用できないため、有望な方向と考えられる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:03:31 GMT)
Correlated Noise Estimation with Quantum Sensor Networks [18.5] 量子センサネットワークによる相関雑音推定の限界を決定するための理論的枠組みを開発する。
我々は,多体エコー系列を連想させるセンシングプロトコルを同定し,幅広い問題に対して測定感度の基本的な限界を実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:00:06 GMT)
Chinese SafetyQA: A Safety Short-form Factuality Benchmark for Large Language Models [18.1] 大規模言語モデルの安全性は、その正確さ、包括性、安全性に関する理解の明確さと密接に関連している。
この事実性の能力は、これらのモデルを特定のリージョンに安全に、かつコンプライアンスにデプロイできるかどうかを決定する上で不可欠である。
これらの課題に対処し、短い質問に答えるLLMの事実性を評価するために、中国安全QAベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:06:56 GMT)
Multi-Source EEG Emotion Recognition via Dynamic Contrastive Domain Adaptation [18.0] 本稿では,差分エントロピー(DE)特徴に基づくマルチソース動的コントラストドメイン適応手法を提案する。
我々のモデルは、認識精度、クラス間マージン、クラス内コンパクト性において、いくつかの代替領域適応法より優れている。
また,前頭葉および頭頂葉の感情感受性も高いことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:38:19 GMT)
WavePulse: Real-time Content Analytics of Radio Livestreams [17.6] 我々はWavePulseについて紹介する。WavePulseはリアルタイムに無線コンテンツを記録、文書化、分析するフレームワークである。
WavePulseを使って3ヶ月にわたって396のニュースラジオ局のライブストリームを監視し、50万時間近いオーディオストリームを処理する。
この結果から,WavePulseがWebから発信される無線ライブストリームからコンテンツを捕捉・分析する効果が示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:42:31 GMT)
Ensembler: Protect Collaborative Inference Privacy from Model Inversion Attack via Selective Ensemble [17.4] エンサンブラ(Ensembler)は、敵によるモデル反転攻撃の実施の難しさを高めるために設計されたフレームワークである。
実験により,クライアントがネットワークの1層のみをローカルに保持している場合でも,エンサンブラはリコンストラクション攻撃から入力イメージを効果的に保護できることを示した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:46:18 GMT)
Multi-Modal Grounded Planning and Efficient Replanning For Learning Embodied Agents with A Few Examples [17.4] 本研究では,FLARE(Few-shot Language with Environmental Adaptive Replanning Embodied Agent)を提案する。
また,エージェントからの視覚的手がかりを用いて誤りを修正することを提案する。
提案手法では,視覚的手がかりによっていくつかの言語ペアを使用でき,最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:20:01 GMT)
Cognition Transferring and Decoupling for Text-supervised Egocentric Semantic Segmentation [17.4] Egocentic Semantic (TESS)タスクは、画像レベルのラベルからテキストによって弱められたエゴセントリックなイメージにピクセルレベルのカテゴリを割り当てることを目的としている。
本稿では、まず、画像とテキストを関連づけて、自我中心の着用者オブジェクトの関係を学習する認知伝達デカップリングネットワーク(CTDN)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:55:56 GMT)
DGNS: Deformable Gaussian Splatting and Dynamic Neural Surface for Monocular Dynamic 3D Reconstruction [17.3] 本稿では,動的ノベルビュー合成と3次元再構成の2つの課題に取り組む。
変形可能なガウススプラッティングと動的ニューラルサーフェスというハイブリッドフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:04:39 GMT)
Bi-Directional Deep Contextual Video Compression [17.2] 本稿では,Bフレームに適した双方向深層映像圧縮方式をDCVC-Bと呼ぶ。
まず、効果的な動き差分符号化のための双方向の動き差分文脈伝搬法を提案する。
次に、双方向文脈圧縮モデルと対応する双方向時間エントロピーモデルを提案する。
第3に,階層的品質構造に基づくトレーニング戦略を提案し,画像の大規模なグループ間で効果的なビット割り当てを実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:06:15 GMT)
SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images [17.1] SBSFigures (Stage-by-Stage Synthetic Figures, SBSFigures, SBSFigures) は、事前学習された図形QAのためのデータセットである。
提案するパイプラインは、視覚化されたデータの完全なアノテーションによるチャートフィギュアの作成を可能にする。
我々のSBSFiguresは、事前学習効果が強く、限られた実世界のチャートデータで効率的なトレーニングを実現することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:25:33 GMT)
PixelsDB: Serverless and NL-Aided Data Analytics with Flexible Service Levels and Prices [17.0] PixelsDBは、ユーザが効率的にデータを探索できるオープンソースのデータ分析システムである。
クエリは、さまざまなパフォーマンスサービスレベル(SLA)に対してさまざまな価格を提供するサーバレスクエリエンジンによって実行される。
サーバレスパラダイム,自然言語支援インターフェース,フレキシブルSLAと価格の組み合わせによって,クラウドデータ分析システムのユーザビリティが大幅に向上することが実証された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:44:10 GMT)
One Framework to Rule Them All: Unifying Multimodal Tasks with LLM Neural-Tuning [17.0] 複数のタスクやモダリティを同時に処理する統合フレームワークを提案する。
このフレームワークでは、すべてのモダリティとタスクは統一トークンとして表現され、単一の一貫したアプローチでトレーニングされる。
複数のタスクラベルを付加したサンプルを含む新しいベンチマークMMUDを提案する。
複数のタスクを合理化して効率的に同時に処理できることを実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:03:02 GMT)
FocusLLM: Precise Understanding of Long Context by Dynamic Condensing [16.6] FocusLLM は、デコーダのみの LLM の固定コンテキスト長を拡張するように設計されたフレームワークである。
動的凝縮法を用いて、各チャンクから重要な情報を蒸留する。
最終的に、新しい並列デコーディング機構によって、FocusLLMは抽出した情報をそのローカルコンテキストに統合することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:36:32 GMT)
Label-Efficient Data Augmentation with Video Diffusion Models for Guidewire Segmentation in Cardiac Fluoroscopy [16.6] 深層学習法はワイヤセグメンテーションにおいて高い精度とロバスト性を示した。
これらの手法は、一般化可能性のためにかなりのデータセットを必要とする。
ラベル付き蛍光ビデオの大規模なコレクションを生成するためのフレーム一貫性拡散モデル(SF-VD)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:51:26 GMT)
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues [16.3] 本稿では,画像の固有特性を活かしたグラニュラーDQを提案する。
グラニュラーDQは局所パッチの多粒度解析を行い、その情報密度をさらに探究する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:44:52 GMT)
Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection [16.2] 本稿では,よく訓練された視覚言語モデル(VLM)を一般深度検出に活用する手法を提案する。
入力摂動によってモデル予測を操作するモデル再プログラミングパラダイムにより,本手法はトレーニング済みのVLMモデルを再プログラムすることができる。
いくつかの人気のあるベンチマークデータセットの実験では、ディープフェイク検出のクロスデータセットとクロスマニピュレーションのパフォーマンスが大幅に改善できることが示されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:12:37 GMT)
The Dynamic Duo of Collaborative Masking and Target for Advanced Masked Autoencoder Learning [16.1] CMT-MAEは、教師モデルと学生モデルの両方の注意を通した線形アグリゲーションを通じて、単純な協調マスキング機構を活用する。
ImageNet-1Kで事前学習したフレームワークは、最先端の線形探索と微調整性能を実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:37:26 GMT)
SWAN: SGD with Normalization and Whitening Enables Stateless LLM Training [16.0] Gradient Descent(SGD)は、トレーニング中に状態変数をトラッキングしないため、ステートレスで拡張性がある。
本研究では,SGDを非定常的に前処理することで,LLMのトレーニングを行うAdamと同じ性能が得られることを示す。
正規化は勾配を安定化させ,損失景観の局所的な曲率に反することを示す。これによってSWAN (SGD with Whitening and Normalization) が成立し,任意の状態を保存する必要がなくなる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:46:21 GMT)
A Tunable Despeckling Neural Network Stabilized via Diffusion Equation [16.0] ニューラルネットワークの実際のデータへの適応性を判断するための基準として、Adrialversa攻撃を用いることができる。
本稿では,ニューラルネットワークブロックと拡散正則性ブロックを1つのネットワークにアンロールしてエンドツーエンドのトレーニングを行う,チューニング可能な正規化ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:50:54 GMT)
DART-Math: Difficulty-Aware Rejection Tuning for Mathematical Problem-Solving [15.8] 本稿では,難解なクエリを合成フェーズに割り当てるDART(Difficulty-Aware Rejection Tuning)を提案する。
DARTは、合成フェーズ中に難しいクエリをより多くのトライアルに割り当て、難しいサンプルのより広範なトレーニングを可能にする。
データセットのさまざまなベースモデルを7Bから70Bまで微調整し、DART-MATHと呼ばれる一連の強力なモデルを作成しました。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:32:21 GMT)
UW-GS: Distractor-Aware 3D Gaussian Splatting for Enhanced Underwater Scene Reconstruction [15.6] 3D Gaussian splatting (3DGS) はリアルタイムの高品質な3Dシーンレンダリングを実現する機能を提供する。
しかし、3DGSは、シーンが透明な中性環境にあると仮定し、水中のシーンで満足できる表現を生成するのに苦労している。
水中用途に特化して設計された新しいガウススプラッティング方式UW-GSを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:28:05 GMT)
Responsible AI Governance: A Response to UN Interim Report on Governing AI for Humanity [15.4] このレポートは、持続可能な開発目標を達成するためのAIの変革の可能性を強調している。
それは、関連するリスクを軽減するための堅牢なガバナンスの必要性を認めている。
報告書は、責任あるAIガバナンスを促進するための実行可能な原則で締めくくっている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:53:56 GMT)
A Bias-Free Training Paradigm for More General AI-generated Image Detection [15.4] 良く設計された法医学的検知器は、データバイアスを反映するのではなく、生成物固有のアーティファクトを検出する必要がある。
本稿では,実画像から偽画像を生成する,バイアスのない学習パラダイムであるB-Freeを提案する。
我々は,最先端検出器の一般化とロバスト性の両方において有意な改善が認められた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:54:32 GMT)
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions [15.4] DiffH2Oとよばれる新しい手法を提案する。
本手法では,限られたデータから効果的な学習を可能にする3つの手法を導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:36:22 GMT)
A Case for Quantum Circuit Cutting for NISQ Applications: Impact of topology, determinism, and sparsity [15.3] 本稿では, 量子回路切断戦略において, 短期量子コンピューティングのための変分アルゴリズムが適していることを示す。
回路切断の以前の実証は、指数的実行と後処理のコストに焦点を当てていた。
実現可能なアンサツェを6つのアンサッツ層を持つ200キュービット以上まで拡張します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:39:48 GMT)
Exotic phase transitions in spin ladders with discrete symmetries that emulate spin-1/2 bosons in two dimensions [15.3] 半充填時の2次元スピン-1/2ボソン系をエミュレートする離散対称性を持つスピンはしごを導入する。
正確な双対変換は、3つのパートトンの$mathbbZ$ゲージ理論にマッピングし、2次元スピン-1/2ボソン系におけるチャーゴンとスピノンのU(1)ゲージ理論に類似している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:06:21 GMT)
Criticality Leveraged Adversarial Training (CLAT) for Boosted Performance via Parameter Efficiency [15.2] CLATは、パラメータ効率を敵のトレーニングプロセスに導入し、クリーンな精度と敵の堅牢性の両方を改善した。
既存の対数訓練法に応用でき、トレーニング可能なパラメータの数を約95%削減できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:28:36 GMT)
VidCtx: Context-aware Video Question Answering with Image Models [15.1] VidCtxは、入力フレームからの視覚情報と他のフレームのテキスト記述の両方を統合する、新しいトレーニング不要なビデオQAフレームワークである。
実験により、VidCtxはオープンモデルに依存するアプローチ間の競争性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:26:38 GMT)
Human-centric Reward Optimization for Reinforcement Learning-based Automated Driving using Large Language Models [15.1] 現在の強化学習(RL)ベースの自動運転(AD)エージェントにおける重要な課題の1つは、柔軟で正確で人間らしい振る舞いをコスト効率よく達成することである。
本稿では,大規模言語モデル(LLM)を用いて,人間中心の方法でRL報酬関数を直感的かつ効果的に最適化する革新的な手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:48:55 GMT)
FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation [15.1] 既存の数発の医用画像分割(FSMIS)モデルは、様々な画像技術によって引き起こされる領域シフトという、医療画像の実践的な問題に対処できない。
本稿では、周波数対応マッチング(FAM)モジュールとマルチスペクトル融合(MSF)モジュールの2つの主要なコンポーネントを含む周波数対応マッチングネットワーク(FAMNet)を提案する。
我々のFAMNetは、既存のFSMISモデルと3つのクロスドメインデータセット上のクロスドメインFew-shot Semanticモデルを上回っています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:23:30 GMT)
Can Stability be Detrimental? Better Generalization through Gradient Descent Instabilities [14.7] 本研究では,大きな学習率によって引き起こされる不安定さが,損失景観の平坦な領域へモデルパラメータを移動させることを示す。
最新のベンチマークデータセットでは,これらが優れた一般化性能をもたらすことが判明した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:32:53 GMT)
2M-BELEBELE: Highly Multilingual Speech and American Sign Language Comprehension Dataset [14.5] BELEBELEを拡張することで、最初の多言語音声とアメリカ手話(ASL)理解データセットを導入する。
我々のデータセットは、BELEBELEとFLEURSの交差点にある74の言語と、1つの手話(ASL)をカバーしている。
2M-BELEBELEデータセットを5ショット設定と0ショット設定の両方で評価し, 音声理解の精度は読解よりも平均2-3%低かった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:32:28 GMT)
Aligning AI Research with the Needs of Clinical Coding Workflows: Eight Recommendations Based on US Data Analysis and Critical Review [14.4] 本研究の目的は,AIコーディング研究と臨床コーディングの実践的課題をより緊密に連携させることである。
分析の結果,8つの推奨事項が提示され,現在の評価方法を改善する方法が提案されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:39:05 GMT)
FlowMamba: Learning Point Cloud Scene Flow with Global Motion Propagation [14.3] 本研究では,フローマンバという,グローバルな動き伝搬を伴うシーンフロー推定ネットワークを提案する。
FlowMambaはFlyingThings3DおよびKITTIデータセットにおいてミリレベルの予測精度を実現する最初の方法である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:03:59 GMT)
Technical Report of HelixFold3 for Biomolecular Structure Prediction [14.1] PaddleHelixチームは、AlphaFold3の機能の複製を目的としたHelixFold3を開発している。
HelixFold3の最初のリリースは、学術研究のためのオープンソースGitHubとして入手できる。
最新バージョンはHelixFold3 Webサーバ上で継続的に更新され、インタラクティブなビジュアライゼーションとAPIアクセスの両方を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:57:47 GMT)
Better Knowledge Enhancement for Privacy-Preserving Cross-Project Defect Prediction [14.1] クロスプロジェクト欠陥予測(CPDP)は、信頼性のある欠陥予測器を構築するための非自明な課題である。
本稿では,FedDPという新しい知識向上手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:21:15 GMT)
ResearchTown: Simulator of Human Research Community [14.0] ResearchTownは、リサーチコミュニティシミュレーションのためのマルチエージェントフレームワークである。
ResearchTownは、協調研究活動の現実的なシミュレーションを提供する。
ResearchTownは、複数の研究者と多様な論文で堅牢なシミュレーションを維持できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:26:53 GMT)
Attack by Yourself: Effective and Unnoticeable Multi-Category Graph Backdoor Attacks with Subgraph Triggers Pool [13.8] 最近の研究は、ノード分類におけるバックドア攻撃に対する脆弱性を強調している。
アダプティブ・トリガ・ジェネレータは一般的に単純な構造を持ち、パラメータが限られており、グラフの知識にカテゴリを意識していない。
我々はtextbfEffective と textbfUnnoticeable textbfMulti-textbfCategory(EUMC) の新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:52:15 GMT)
Hierarchical Vector Quantization for Unsupervised Action Segmentation [13.8] 我々は、長いASMビデオの集合を、ビデオ間で一貫性のある意味的に意味のあるセグメントに分割する、教師なしの時間的アクションセグメンテーションに対処する。
本稿では,次の2つのベクトル量子化モジュールからなる階層ベクトル量子化法を提案する。
提案手法は,F1スコア,リコール,JSDの点において,最先端技術である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:18:24 GMT)
Rate of Model Collapse in Recursive Training [13.7] 最適確率(MLか近距離ML)推定の下で、よく研究された分布族に対して、モデル崩壊がどれだけ早く起こるかを問う。
驚くべきことに、離散分布やガウス分布のような基本的な分布であっても、モデル崩壊の正確な速度は不明である。
その結果,単語を忘れる時間は,元のコーパスで発生した回数にほぼ線形に依存していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:21:50 GMT)
Graph Size-imbalanced Learning with Energy-guided Structural Smoothing [13.6] 実世界のグラフは通常、マルチグラフ分類における大きさ不均衡の問題に悩まされる。
近年の研究では、市販のグラフニューラルネットワーク(GNN)が、長期設定下でのモデル性能を損なうことが報告されている。
我々は,頭部と尾部のグラフの特徴を円滑に表現する,textbfSIMBAという新しいエネルギーベースサイズ不均衡学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:06:49 GMT)
Stability Bounds for the Unfolded Forward-Backward Algorithm [13.5] 劣化演算子が線形で知られている逆問題を解決するために設計されたニューラルネットワークアーキテクチャを考察する。
入力摂動に対する逆法のロバスト性は理論的に解析される。
我々の研究の重要な新規性は、そのバイアスの摂動に対する提案されたネットワークの堅牢性を調べることである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:55:41 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [13.5] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
I-HallAを用いて5つのTTIモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できないことを明らかにする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:08:35 GMT)
QTSeg: A Query Token-Based Architecture for Efficient 2D Medical Image Segmentation [13.4] 医用画像のセグメンテーションは、医師が診断を行い、自動診断を可能にするのに不可欠である。
CNNはピクセルレベルの精度で関心のあるセグメンテーション領域を抜いているが、長距離依存に苦慮している。
トランスフォーマーはアテンションメカニズムを活用して、長距離依存関係を処理する。
医用2次元画像セグメンテーション(QTSeg)のための新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:22:44 GMT)
Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus [13.3] 大規模言語モデル(LLM)は幅広いタスクを解くことができるが、推論に苦戦している。
本稿では,プログラム生成論理推論サンプルを用いてLLMの推論能力を高めることを目的として,$textbfAdditional Logic Training (ALT)$を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:36:38 GMT)
DUET: Dual Clustering Enhanced Multivariate Time Series Forecasting [13.1] 実世界の時系列は、時間とともに分布の変化によって引き起こされる異質な時間パターンを示すことが多い。
チャネル間の相関は複雑で絡み合っており、チャネル間の相互作用を正確にかつ柔軟にモデル化することは困難である。
本稿では,時空間とチャネル次元に2つのクラスタリングを導入するDUETというフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:04:58 GMT)
Learning on Large Graphs using Intersecting Communities [13.1] MPNNは、各ノードの隣人からのメッセージを集約することで、入力グラフ内の各ノードの表現を反復的に更新する。
MPNNは、あまりスパースではないため、すぐに大きなグラフの禁止になるかもしれない。
本稿では,入力グラフを交差するコミュニティグラフ (ICG) として近似することを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:59:16 GMT)
GarmentLab: A Unified Simulation and Benchmark for Garment Manipulation [12.9] GarmentLabは、変形可能なオブジェクトと衣料品の操作のために設計された、コンテンツリッチなベンチマークと現実的なシミュレーションである。
私たちのベンチマークには、さまざまな種類の衣料品、ロボットシステム、マニピュレータが含まれています。
これらの課題に対して、最先端のビジョン手法、強化学習、模倣学習アプローチを評価した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:33:11 GMT)
Shifted Composition III: Local Error Framework for KL Divergence [12.9] 引数の結合は、2つのプロセス間の偏差を境界付ける中心的なツールである。
カップリングの議論をKL(Kulback-Leibler)の発散に適用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:40:01 GMT)
FedTLU: Federated Learning with Targeted Layer Updates [12.8] フェデレートラーニング(FL)は、複数のクライアントがトレーニング言語モデルにコントリビュートできるようにすることによって、言語モデリングにおけるプライバシの問題に対処する。
非IID(同一かつ独立に分散した)データは、FLの性能を制限していることが多い。
本稿では,FLにおける微調整のための層更新戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:17:46 GMT)
A Toolkit for Virtual Reality Data Collection [12.7] 広汎なVRデータセットの取得を容易にする汎用データ収集ツールキットを提案する。
ツールキットは、直接OpenXR経由で、または仮想デバイス経由で、任意のデバイスとシームレスに統合します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:39:26 GMT)
Deep Backward and Galerkin Methods for the Finite State Master Equation [12.6] 本稿では,有限状態平均場ゲームにおけるマスター方程式の解法として,2つのニューラルネットワーク手法を提案し,解析する。
アルゴリズムの損失関数を任意に小さくし、逆に損失が小さい場合、ニューラルネットワークはマスター方程式の解をよく近似する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:05:07 GMT)
Data Poisoning Attacks to Local Differential Privacy Protocols for Graphs [12.6] 本稿では,攻撃者がグラフのローカル差分プライバシープロトコルに偽ユーザを注入し,データ中毒攻撃を設計することにより,グラフメトリクスの品質を低下させることができることを示す。
概念実証として,2つの古典グラフ指標,次数集中度とクラスタリング係数に対するデータ中毒攻撃に着目した。
実世界のデータセットに関する実験的研究は、我々の攻撃が収集したグラフメトリクスデータセットの品質を大幅に低下させることができることを示した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:16:23 GMT)
Knowledge Editing through Chain-of-Thought [12.3] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクにまたがる例外的な機能を示している。
これらのモデルを世界知識の進化とともに最新に保つことは、頻繁な再トレーニングのコストが高いため、依然として大きな課題である。
本研究では,リトレーニングを伴わずに,様々なタスクにまたがるLSMを柔軟かつ効率的に更新する新しい知識編集フレームワークEditCoTを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:17:50 GMT)
The ELEVATE-AI LLMs Framework: An Evaluation Framework for Use of Large Language Models in HEOR: an ISPOR Working Group Report [12.2] この記事では、ELEVATE AI LLMsフレームワークとチェックリストを紹介します。
このフレームワークは、モデル特性、正確性、包括性、公平性を含む10の評価領域から構成される。
体系的な文献レビューと健康経済モデルの研究の枠組みとチェックリストの検証は、レポートの強さとギャップを識別する能力を強調した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:09:10 GMT)
Enabling Time-series Foundation Model for Building Energy Forecasting via Contrastive Curriculum Learning [12.2] エネルギー予測タスク構築のための基礎モデル(FM)の適用について検討する。
そこで本研究では,新しいテキストコントラスト学習に基づく学習方法を提案する。
実験の結果,既存のFMと比較してゼロ/フェーショット性能を14.6%向上できることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:07:06 GMT)
Dual Conditioned Motion Diffusion for Pose-Based Video Anomaly Detection [12.1] コンピュータビジョン研究にはビデオ異常検出(VAD)が不可欠である。
既存のVADメソッドは、再構築ベースのフレームワークまたは予測ベースのフレームワークを使用する。
ポーズに基づくビデオ異常検出に対処し、Dual Conditioned Motion Diffusionと呼ばれる新しいフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:31:39 GMT)
Discovery of an anomalous non-evaporating sub-nanometre water layer in open environment [12.1] 低次元閉じ込め水は物質科学、地質学、生物学において重要な役割を担っている。
STM、TEM、AFMといった従来の技術は原子スケールの観測を可能にするが、環境条件や表面トポグラフィーでは制限に直面している。
NV中心磁気共鳴技術はこれらの制限を克服する機会を提供し、化学分解能を持つ非接触原子スケール測定を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:13:10 GMT)
DisCo: Graph-Based Disentangled Contrastive Learning for Cold-Start Cross-Domain Recommendation [11.6] クロスドメインレコメンデーション(CDR)が有望なソリューションとして登場した。
しかし、ソースドメインに類似した好みを持つユーザは、ターゲットドメインに対して異なる関心を示す可能性がある。
そこで本稿では,ユーザ意図の微粒化を捉えるために,グラフに基づく非交叉型コントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:49:58 GMT)
Bi-Band ECoGNet for ECoG Decoding on Classification Task [11.5] 本稿では,ディープラーニングに基づくバイバンドECoGNetモデルを提案する。
Bi-BCWT ニューラルネットワークモジュールは、時間列法 MST を置き換えるように設計されている。
ECoGは2次元電極アレイを用いて取得され、新たに設計された2次元空間時間特徴エンコーダは2次元空間特徴をよりよく抽出することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:11:58 GMT)
Decomposition of thermal light with a flat spectrum into localized pulses [11.5] スペクトルフィルタリングを施すと発生する平坦なスペクトルを持つ熱光は、独立局在パルスの直接生成物に分解できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:36:11 GMT)
Sharp bounds on aggregate expert error [11.4] 我々は、条件に依存しない専門家からバイナリアドバイスを集約するという古典的な問題を再考する。
我々の関心事は、最適決定規則の誤り確率である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:25:57 GMT)
Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity [11.3] 本稿では,変換器モデルを線形時間置換器に変換し,目標タスクに微調整するクロスアーキテクチャ層蒸留(CALD)手法を提案する。
そこで本研究では,CALDが元のモデルの結果を効果的に回収できることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:53:32 GMT)
Full-text Error Correction for Chinese Speech Recognition with Large Language Model [11.3] 大言語モデル(LLM)は自動音声認識(ASR)における誤り訂正の可能性を示している
本稿では,より長い音声記録からASRシステムによって生成された全文における誤り訂正のためのLLMの有効性について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:20:03 GMT)
Prompting in the Wild: An Empirical Study of Prompt Evolution in Software Repositories [11.1] 本研究は,LSM統合ソフトウェア開発における迅速な進化の実証的研究である。
我々は、インシデント変更のパターンと頻度を調べるために、243のGitHubリポジトリにわたる1,262のインシデント変更を分析した。
私たちの調査によると、開発者は主に追加や修正を通じて進化し、ほとんどの変更は機能開発中に発生します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:41:01 GMT)
DeepMF: Deep Motion Factorization for Closed-Loop Safety-Critical Driving Scenario Simulation [11.1] 安全クリティカルな交通シナリオは、自律運転システムの堅牢性を評価する上で、非常に実用的な関係である。
安全クリティカルなシナリオを生成する既存のアルゴリズムは、以前に記録されたトラフィックイベントのスニペットに依存している。
本稿では,静的安全クリティカルな運転シナリオをクローズループや対話型対向交通シミュレーションに拡張するDeep Motion Factorizationフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:30:24 GMT)
Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning [10.9] 本研究は、露光制御のためのエージェントの訓練に深層強化学習フレームワークを用いる。
トレーニングプロセスを容易にするために,軽量なイメージシミュレータを開発した。
VOシステムを強化するために異なるレベルの報酬関数が作成される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:44:13 GMT)
Uncertainties of Satellite-based Essential Climate Variables from Deep Learning [10.8] 本調査では,深層学習から推定される本質的気候変数(ECV)に関連する不確実性の種類とその定量化手法について検討した。
その焦点は、気候データの動的かつ多面的な性質を考慮して、ECV推定における固有の不確かさの定量化の重要性を強調することである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:05:22 GMT)
Unsupervised learning of spatially varying regularization for diffeomorphic image registration [10.7] 変形正則化強度の事前分布を統合する階層的確率モデルを提案する。
提案手法は実装が容易で,様々な登録ネットワークアーキテクチャと容易に統合できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:01:32 GMT)
Bi-Directional Multi-Scale Graph Dataset Condensation via Information Bottleneck [10.7] 本稿では,新しいGNN中心の双方向マルチスケールグラフデータセット圧縮フレームワークを提案する。
本稿では,マルチスケールグラフ凝縮のための大規模・小・小の双方を対象とする統一パラダイムについて検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:32:02 GMT)
A Unified Post-Processing Framework for Group Fairness in Classification [10.6] 本稿では, グループフェアネスの基準である統計パリティ, 平等機会, 等化確率を1つの枠組みでカバーする, 公平分類のためのポストプロセッシングアルゴリズムを提案する。
我々のアルゴリズムは「LinearPost」と呼ばれ、(不公平な)ベース予測器の予測を、(予測された)グループメンバーシップの重み付けによる「公正リスク」で線形変換することで、公正なポストホックを実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:40:18 GMT)
Boosted Control Functions: Distribution generalization and invariance in confounded models [10.5] 非線形で非同定可能な構造関数が存在する場合でも分布の一般化を可能にする不変性という強い概念を導入する。
フレキシブルな機械学習手法を用いて,ブースト制御関数(BCF)を推定する制御Twicingアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:36:22 GMT)
Identifiability Guarantees for Causal Disentanglement from Purely Observational Data [10.5] 因果解離は、データの背後にある潜在因果関係について学ぶことを目的としている。
近年の進歩は、(単一の)潜伏因子への介入が可能であると仮定して、識別可能性(identifiability)が確立されている。
非線形因果モデルで同定できる潜伏因子の高精度な評価法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:59:03 GMT)
Minimax Optimal Simple Regret in Two-Armed Best-Arm Identification [10.5] 簡単な後悔に対して、ネーマン割当の極小極小性を証明した。
局所正規度に局所性制限を課すことなく、最適性が達成できることが示される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:06:20 GMT)
Does confidence calibration improve conformal prediction? [10.3] 適応型共形予測において、電流信頼度校正法がより大きな予測セットをもたらすことを示す。
温度値の役割を調べることにより,高信頼度予測が適応型等角予測の効率を高めることが確認された。
本稿では,予測セットの効率を向上させるために,新しい損失関数を備えた温度スケーリングの変種である Conformal Temperature Scaling (ConfTS) を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:46:59 GMT)
Uncovering Emergent Spacetime Supersymmetry with Rydberg Atom Arrays [10.3] 本稿では、2つの異なるRydberg励起からなる再構成可能なRydberg原子配列を用いて、創発的時空SUSYを実現することを提案する。
このような系では、時空 SUSY はボソニックモードとそのフェルミオンパートナーの相関関数に自身を表わす。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:10:24 GMT)
A Survey of Query Optimization in Large Language Models [10.3] RAGは、動的に検索し、最新の関連情報を活用することによって、大規模言語モデルの限界を緩和する。
QOは重要な要素として現れ、RAGの検索段階の有効性を決定する上で重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:26:04 GMT)
CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks [10.2] 広範な一般知識と強力な推論能力を持つ大規模言語モデル(LLM)は、急速な開発と広範な応用が見られた。
本稿では,対話型シミュレータによる評価プラットフォームであるCityBenchを設計する。
我々は,CityBenchとして認識理解と意思決定の2つのカテゴリに8つの代表的都市タスクを設計する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:10:09 GMT)
BEE: Metric-Adapted Explanations via Baseline Exploration-Exploitation [10.2] 説明可能性研究における2つの顕著な課題は、1)説明の微妙な評価、2)行方不明情報のモデル化である。
本稿では,BEE (Baseline Exploration-Exploitation) を提案する。
BEEは包括的な説明地図を生成し、最も優れた説明地図の選択を容易にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:19:03 GMT)
Attention Heads of Large Language Models: A Survey [10.1] 我々は,大規模言語モデル (LLM) の内部的推論過程を体系的に検討し,その役割と機構を解明することを目的としている。
まず,人間の思考プロセスにインスパイアされた新しい4段階のフレームワーク,知識のリコール,文脈内同定,潜在推論,表現準備を紹介する。
本稿では,これらの特殊ヘッドの発見に使用する実験手法を,モデリング自由法とモデリング要求法という2つのカテゴリに分けて分析する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:57:29 GMT)
DRIVE: Dual-Robustness via Information Variability and Entropic Consistency in Source-Free Unsupervised Domain Adaptation [10.1] ラベル付きデータなしで機械学習モデルを新しいドメインに適応させることは、医療画像、自律運転、リモートセンシングといったアプリケーションにおいて重要な課題である。
Source-Free Unsupervised Domain Adaptation (SFUDA)と呼ばれるこのタスクでは、未ラベルのターゲットデータのみを使用して、トレーニング済みのモデルをターゲットドメインに適応させる。
既存のSFUDAメソッドは、しばしば単一モデルアーキテクチャに依存し、ターゲットドメインにおける不確実性と可変性に悩まされる。
本稿では、2重モデルアーキテクチャを利用した新しいSFUDAフレームワークDRIVEを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:01:29 GMT)
HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection [10.1] 我々は新しい高周波空間知覚特徴ピラミッドネットワーク(HS-FPN)を提案する。
HS-FPNは、小さな物体の特徴を豊かに強調するために、ハイパスフィルタを通じて高周波応答を生成する。
第2に、FPNが欠落している空間依存を捉えるための空間依存認識モジュール(SDP)を開発した。
実験により, HS-FPNに基づく検出器は, 微小物体検出のためのAI-TODデータセット上での最先端モデルに対して, 競争上の優位性を示すことが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:49:13 GMT)
Transport-Hub-Aware Spatial-Temporal Adaptive Graph Transformer for Traffic Flow Prediction [10.0] 本稿では交通流予測のためのトランスポート・ハブ対応時空間適応型グラフ変換器を提案する。
具体的には、動的空間依存を捉えるために、まず新しい空間自己認識モジュールを設計する。
また、トラフィックフローデータ中の動的時間パターンを検出するために、時間的自己アテンションモジュールを用いる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:36:37 GMT)
Uncertainty-Aware Critic Augmentation for Hierarchical Multi-Agent EV Charging Control [10.0] ビルと電気自動車の両方のエネルギー需要を制御するための新しいリアルタイム充電制御であるHUCAを提案する。
HUCAは階層的なアクタークリティカルネットワークを使用して、動的価格シナリオにおけるEV充電の必要性を考慮して、建物の電力コストを動的に削減する。
実世界の電気データセットのシミュレーションと不確実な離脱シナリオによる実験により、HUCAは総電力コストにおいてベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:45:45 GMT)
DECN: Evolution Inspired Deep Convolution Network for Black-box Optimization [9.9] 本稿では、自動EAの概念を紹介します。 自動EAは、関心の問題における構造を利用して、自動更新ルールを生成する。
手動で設計したEAから手動の介入なしに自動化されたEAへの移行を実現するために、深層進化畳み込みネットワーク(DECN)を設計する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:33:13 GMT)
Memorization Over Reasoning? Exposing and Mitigating Verbatim Memorization in Large Language Models' Character Understanding Evaluation [9.8] 大きな言語モデル(LLM)は、文字理解タスクにおいて素晴らしいパフォーマンスを示している。
我々は「ギストメモリ」が文字理解タスクの主要なメカニズムであるべきだと論じている。
本稿では,文字理解評価において,機械的記憶を緩和する簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:46:55 GMT)
Quantifying Positional Biases in Text Embedding Models [9.7] テキスト埋め込みにおけるコンテンツ位置と入力サイズの影響について検討する。
実験の結果, 埋め込みモデルは, 位置符号化機構によらず, 入力の開始点を不均等に優先順位付けしていることが判明した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:59:23 GMT)
InfoGaussian: Structure-Aware Dynamic Gaussians through Lightweight Information Shaping [9.7] 本研究では,運動ネットワークにおける相関ガウス間の移動共鳴を強制する手法を開発した。
動作ネットワークを形作るための軽量な最適化を施した効率的なコントラスト訓練パイプラインを開発する。
提案手法は,挑戦的な場面で評価し,大幅な性能向上を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:50:44 GMT)
The FIX Benchmark: Extracting Features Interpretable to eXperts [9.7] FIX(Features Interpretable to eXperts)は、機能の集合が専門家の知識とどの程度うまく一致しているかを測定するベンチマークである。
ドメインエキスパートと共同でFIXScoreを提案する。
特徴に基づく一般的な説明手法は、専門家が特定した知識と不一致であることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:39:18 GMT)
Tracking the Feature Dynamics in LLM Training: A Mechanistic Study [9.7] 連続的なSAE系列を効率よく得る手法であるSAE-Trackを紹介する。
次に特徴形成の過程を定式化し、力学解析を行う。
次に、トレーニング中にフィーチャードリフトを分析し、視覚化します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:58:37 GMT)
Interweaving Memories of a Siamese Large Language Model [9.6] 本稿では,シームズ大言語モデルの記憶を織り込むモデル非依存のPEFTフレームワークを提案する。
IMSMは背骨PEFT法と同等の時間と空間効率を維持している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:33:47 GMT)
Uncertainty-Participation Context Consistency Learning for Semi-supervised Semantic Segmentation [9.5] 半教師付きセマンティックセグメンテーションは、広範囲なラベル付きデータへの依存を緩和する能力にかなりの注目を集めている。
本稿では、よりリッチな監視信号を探索するために、不確かさ参加型コンテキスト一貫性学習(UCCL)手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:49:59 GMT)
Successive optimization of optics and post-processing with differentiable coherent PSF operator and field information [9.5] 我々は正確な光学シミュレーションモデルを導入し、パイプライン内の全ての操作は微分可能である。
様々な劣化に効率的に対処するために,フィールド情報を活用する共同最適化手法を設計する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:40:38 GMT)
Singular Value Scaling: Efficient Generative Model Compression via Pruned Weights Refinement [9.5] 生成モデルは、しばしば支配的な特異ベクトルを示し、微調整効率を阻害し、最適以下の性能をもたらす。
SVS(Singular Value Scaling, Singular Value Scaling)は, 刈り込み重みを精製する多用途手法である。
SVSは、追加のトレーニングコストなしでモデルタイプ間の圧縮性能を改善する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:40:08 GMT)
ACECode: A Reinforcement Learning Framework for Aligning Code Efficiency and Correctness in Code Language Models [9.4] SOAP や PIE のような CodeLLM のコード効率を最適化するための既存のアプローチには、いくつかの制限がある。
ACECodeは、強化学習に基づく微調整フレームワークで、CodeLLMを効率と正確性の2つの目的に合わせる。
ACECodeは4つのSOTA (state-of-the-art) CodeLLMを微調整し、それらのコードをオリジナル、命令調整、PIE調整の3つのベースラインと比較することで評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:19:45 GMT)
Connecting the Dots: LLMs can Infer and Verbalize Latent Structure from Disparate Training Data [9.3] 本研究では, LLMが学習文書に分散した証拠から潜伏情報を推測する, 暗黙の帰納的推論(OOCR)について検討する。
ある実験では、未知の都市と他の既知の都市の間の距離のみからなるコーパスにLSMを微調整する。
OOCRは様々なケースで成功するが、特にLLMが複雑な構造を学ぶ場合、信頼性が低いことも示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:01:28 GMT)
Power- and Fragmentation-aware Online Scheduling for GPU Datacenters [9.3] 我々はGPUのフラグメンテーションの最小化と消費電力の削減という2つの目標に焦点を当てている。
そこで本稿では,電力効率のよいGPUとCPUの組み合わせを選択することで,電力使用量を最小限に抑える新しいスケジューリングポリシーであるPWRを提案する。
本稿では,PWRがFGDと組み合わせることで,消費電力削減とGPUフラグメンテーションの最小化のトレードオフを実現することを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:27:17 GMT)
Trustworthy and Efficient LLMs Meet Databases [9.2] 大規模言語モデル(LLM)をより信頼でき、効率的にすることに大きな注目を集めている。
このチュートリアルでは、このような取り組みを探求し、データベースコミュニティに透明性を持たせる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:34:40 GMT)
WavePlanes: Compact Hex Planes for Dynamic Novel View Synthesis [9.2] 本稿では,3次元シーンの高速かつコンパクトなヘックス平面表現であるWavePlanesを紹介する。
逆離散ウェーブレット変換を用いて様々なスケールで特徴を再構成する。
小さなSotAモデルと比較して、WavePlanesは、新しいビューのモデルサイズと品質の両方でメソッドを上回ります。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:53:49 GMT)
Reviewing Intelligent Cinematography: AI research for camera-based video production [9.2] 本稿では,エンターテイメント目的のリアルカメラコンテンツ取得の文脈において,人工知能(AI)研究の総合的なレビューを行う。
我々は、生成AI、オブジェクト検出、自動カメラキャリブレーション、および3Dコンテンツ取得に関する技術的背景を提供する。
最終章では、IC研究の幅広い範囲について論じ、創造産業に影響を及ぼすためのこの分野の有意義な可能性について要約する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:38:01 GMT)
Exploring Dynamic Novel View Synthesis Technologies for Cinematography [9.2] 新規ビュー合成 (NVS) は、撮影技術への応用に大きく期待されている。
本稿では,モデル選択プロセスの促進を目的とした動的NVSについて検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:57:34 GMT)
Signal Transformation for Effective Multi-Channel Signal Processing [9.1] 低帯域幅信号の個別チャネルを合成するために,基本信号処理を用いた信号変換を提案する。
この信号変換の利点は、事前訓練された単一チャネル事前訓練モデルを使用することである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:09:53 GMT)
Assessing UML Models by ChatGPT: Implications for Education [9.1] ソフトウェア工学(SE)の研究と実践において、本質的なモデリング方法論としてよく知られている。
ChatGPTのような生成AI技術の最近の進歩は、多くのSEタスクを自動化する新しい方法を生み出している。
本稿では,モデルの品質評価におけるChatGPTの有効性と有効性を検討することを目的とする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 00:28:33 GMT)
An Intrinsically Explainable Approach to Detecting Vertebral Compression Fractures in CT Scans via Neurosymbolic Modeling [9.1] 脊椎圧迫骨折(VCFs)は骨粗しょう症の一般的な原因であり、潜在的に重篤な結果である。
機会論的診断のような高度なシナリオでは、モデル解釈可能性がAIレコメンデーションの採用の鍵となる。
我々はCTボリュームにおけるVCF検出のためのニューロシンボリックアプローチを導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:01:44 GMT)
AA-SGAN: Adversarially Augmented Social GAN with Synthetic Data [9.1] 本研究では, 合成軌道を訓練時に, 対角的アプローチで増強する手法を提案する。
本研究は, 実世界の軌道上で, 最先端生成モデルの評価を行うと, 学習時の軌道増進が大きな利益をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:17:44 GMT)
Modality-Aware Shot Relating and Comparing for Video Scene Detection [9.1] ビデオシーン検出は、それぞれのショットとその周辺が同じシーンに属しているかどうかを評価することを含む。
ほとんどの方法はマルチモーダルセマンティクスを等しく扱い、ショットの2つの側面間の文脈的差異を検査しない。
我々は$bfM$odality-$bfA$ware $bfS$hot $bfR$elating and $bfC$omparing approach (MASRC)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:17:21 GMT)
Evaluating the Design Features of an Intelligent Tutoring System for Advanced Mathematics Learning [9.0] Xiaomaiは、中国の大学生が高度な数学を学び、大学院数学の入学試験の準備をするために設計された知的学習システム(ITS)である。
本研究はXiaomaiの2つの特徴として,自動フィードバックによる自由応答型質問の導入と,自己生成誤りを反映するメタ認知的要素について検討した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:22:05 GMT)
Mirage: A Multi-Level Superoptimizer for Tensor Programs [9.0] 我々は、テンソルプログラムのための最初のマルチレベルスーパー最適化であるMirageを紹介する。
Mirageのキーとなるアイデアは$mu$Graphsで、カーネルにおけるテンソルプログラムの統一表現、スレッドブロック、GPU計算階層のスレッドレベルである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:28:18 GMT)
A Novel Approach to Balance Convenience and Nutrition in Meals With Long-Term Group Recommendations and Reasoning on Multimodal Recipes and its Implementation in BEACON [9.0] 我々は、カスタマイズ可能な食事構成と時間的地平を考慮に入れた食事レコメンデーションのためのデータ駆動ソリューションを提案する。
コントリビューションには、良さ対策の導入、テキストから最近導入されたマルチモーダル・リッチ・レシピ表現(R3)フォーマットへのレシピ変換方法、BEACONシステムのプロトタイプ、使用感に着想を得た。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:05:27 GMT)
CareBot: A Pioneering Full-Process Open-Source Medical Language Model [8.9] CareBotは、連続事前訓練(CPT)、教師付き微調整(SFT)、人間フィードバックによる強化学習(RLHF)を統合したバイリンガル医療用LLMである。
DataRaterは、CPT中のデータ品質を評価するために設計されたモデルで、トレーニングデータの正確性と関連性を保証する。
漢英ベンチマークの厳格な評価は、医療相談・教育におけるCareBotの有効性を裏付けるものである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:44:18 GMT)
Unlocking Cross-Lingual Sentiment Analysis through Emoji Interpretation: A Multimodal Generative AI Approach [8.8] 絵文字は、感情を伝える普遍的な媒体として、オンラインコミュニケーションにおいてユビキタスになりつつある。
本研究の目的は,大規模な言語モデル(LLM)を用いて,感情マーカーとして機能する絵文字の能力を検討することである。
分析の結果,LLMをベースとした絵文字表現感情の精度は81.43%であり,絵文字が普遍的な感情マーカーとして機能する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:57:45 GMT)
Establishing Reality-Virtuality Interconnections in Urban Digital Twins for Superior Intelligent Road Inspection [8.7] 道路の整備と交通安全を確保するためには道路検査が不可欠である。
手作業による評価に依存する従来の手法は、労働集約的でコストがかかり、時間を要する。
本稿では,インテリジェント道路検査のためのUrban Digital Twin(UDT)技術に基づくシステムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:31:29 GMT)
MineAgent: Towards Remote-Sensing Mineral Exploration with Multimodal Large Language Models [8.7] MineAgentはマルチイメージ推論と空間スペクトル統合のためのフレームワークである。
MineBenchは、ドメイン固有の鉱物探査タスクでMLLMを評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:08:14 GMT)
LiveIdeaBench: Evaluating LLMs' Scientific Creativity and Idea Generation with Minimal Context [8.4] 本稿では,Large Language Modelsの科学的創造性と多様な思考能力を評価するベンチマークであるLiveIdeaBenchを紹介する。
われわれのフレームワークは、最先端のLCMのダイナミックパネルを用いて、創造性、実現可能性、フレキシビリティ、柔軟性の4つの重要な側面にまたがって生成されたアイデアを評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:13:44 GMT)
Probabilistic Trust Intervals for Out of Distribution Detection [8.4] 本稿では,従来のパラメータを変更することなく,事前学習ネットワークにおけるOOD検出を向上する手法を提案する。
提案手法は,各ネットワーク重みに対する確率的信頼区間を定義し,分布内データを用いて決定する。
我々は,MNIST,Fashion-MNIST,CIFAR-10,CIFAR-100,CIFAR-10-Cについて検討した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:10:48 GMT)
MacLight: Multi-scene Aggregation Convolutional Learning for Traffic Signal Control [8.3] 大規模道路網で訓練可能な交通信号制御ポリシーを, 強化学習手法により提案した。
現在のSOTA手法は、道路ネットワークをトポロジカルグラフ構造としてモデル化し、グラフ注意を深層Q-ラーニングに組み込み、局所的およびグローバルな埋め込みをマージしてポリシーを改善する。
交通信号制御(MacLight)のためのマルチシーン・アグリゲーション・コンボリューショナル・ラーニングを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:15:00 GMT)
A Framework for Effective Invocation Methods of Various LLM Services [8.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクを解く上で、素晴らしい能力を示している。
さまざまなプロバイダが,価格やレイテンシ,パフォーマンスの面で,さまざまなLLMサービスを提供している。
本稿では, LLM サービスの効率的な呼び出しを支援する手法について概説する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:55:21 GMT)
The Power of Adaptation: Boosting In-Context Learning through Adaptive Prompting [8.3] 大規模言語モデル(LLM)は、幅広い言語関連タスクで例外的な能力を示している。
モデルフィードバックを活用することで,見本を適応的に選択する新しい手法であるtextscAdaptive-Promptを提案する。
実験の結果,textscAdaptive-Promptは様々な推論タスクにおけるLLM性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:49:43 GMT)
Analyzing the Generalization and Reliability of Steering Vectors [8.3] ステアリングベクトルは分布内および分布外の両方にかなりの制限があることを示す。
分散において、ステアビリティは異なる入力間で高度に変動する。
アウト・オブ・ディストリビューション(out-of-distribution)、ステアリングベクトル(steering vector)はよく一般化されるが、いくつかの概念はプロンプトの合理的な変化に対して脆弱である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:04:38 GMT)
Matrix Decomposition and Applications [8.0] 1954年、Alston S. Householder は行列分解に関する最初の近代的な研究の1つである Principles of Numerical Analysis を出版した。
行列分解は、主にニューラルネットワークに適合するバック伝搬アルゴリズムの開発によって、機械学習のコア技術となった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:15:16 GMT)
Same Company, Same Signal: The Role of Identity in Earnings Call Transcripts [8.0] 我々は、以前見過ごされたbeforeAfterMarket属性によって実現された正確なボラティリティ計算を特徴とするデータセットであるDECを紹介した。
後発のボラティリティは,各ティッカーに異なるボラティリティ分布が示されるなど,大きな変化がみられた。
現時点の転写表現は、収益ごとに財務的に意味のある洞察を提供するのではなく、主にティッカーアイデンティティを捉えていることを実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:49:38 GMT)
Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention Lens [7.8] LVLM(Large Vision-Language Models)の幻覚は、その信頼性を著しく損なう。
本稿では,LVLMが視覚情報をどのように処理し,その処理が幻覚を引き起こすかについて述べる。
本稿では,様々な頭部に情報を統合することで視覚的注意を調節する簡易な推論時間手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:19:20 GMT)
Research on Key Technologies for Cross-Cloud Federated Training of Large Language Models [7.8] クロスクラウドフェデレーショントレーニングは、単一のクラウドプラットフォームのリソースボトルネックに対処するための、新たなアプローチを提供する。
本研究では、データパーティショニングと分散、通信最適化、モデル集約アルゴリズム、異種クラウドプラットフォームとの互換性など、クロスクラウドフェデレーショントレーニングの重要技術について分析する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:13:43 GMT)
When Focus Enhances Utility: Target Range LDP Frequency Estimation and Unknown Item Discovery [7.7] ローカルの差分プライバシープロトコルは、Google、Apple、Microsoftといったテクノロジー企業が現実のシナリオでうまく展開している。
本稿では,既存の多くの周波数推定プロトコルをキャプチャする一般化数平均スケッチプロトコルを提案する。
周波数推定プロトコルは、既知のデータ領域でのみ有効に動作するため、未知領域内でデータを収集するための新しいプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:50:11 GMT)
Analysis of Financial Risk Behavior Prediction Using Deep Learning and Big Data Algorithms [7.7] 本稿では,金融リスク予測のためのディープラーニングとビッグデータアルゴリズムの有効性と有効性について検討する。
ディープラーニングベースのビッグデータリスク予測フレームワークを設計し、実際の財務データセット上で実験的に検証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:08:49 GMT)
Assessing Quantum Extreme Learning Machines for Software Testing in Practice [7.7] 量子ノイズが3つの産業的および実世界の古典的ソフトウェアテストケーススタディにおいてQELMに与える影響について検討する。
その結果,QELMは量子ノイズの影響が大きく,回帰タスクは250%,分類タスクは50%であった。
誤差軽減技術は耐雑音性を高めることができるが、平均3.0%の性能低下を達成することはできるが、その効果は文脈によって異なる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:14:55 GMT)
CLEAR: Character Unlearning in Textual and Visual Modalities [7.6] マルチモーダル・アンラーニング(MMU)は、適切なオープンソース・ベンチマークが存在しないため、未発見のままである。
CLEARには200人の架空の人物と3700枚の画像が関連付けられている。
10 MU 法を評価し,それらを MMU に適用し,マルチモーダルな忘れ方に特有な新たな課題を浮き彫りにする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:48:15 GMT)
On the Power and Limitations of Examples for Description Logic Concepts [6.8] 記述論理概念記述のためのラベル付き例のパワーについて検討する。
具体的には,有限特性化の存在と効率的な計算可能性について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:17:58 GMT)
Extending Graph Condensation to Multi-Label Datasets: A Benchmark Study [6.7] マルチラベルデータセットに対応するために,グラフ凝縮アプローチを拡張した。
8つの実世界のマルチラベルグラフデータセットを用いた実験により,本手法の有効性を実証する。
このマルチラベルグラフ凝縮のベンチマークは、様々な現実世界のアプリケーションに多大な利益をもたらす。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:18:53 GMT)
Benchmarking Generative AI Models for Deep Learning Test Input Generation [6.7] テスト入力ジェネレータ(TIG)は、ディープラーニング(DL)画像分類器が、トレーニングやテストセットを超えて入力の正確な予測を提供する能力を評価するために不可欠である。
ジェネレーティブAI(GenAI)モデルの最近の進歩は、合成画像の作成と操作のための強力なツールとなった。
我々は、異なるGenAIモデルとTIGをベンチマークして組み合わせ、生成したテスト画像の有効性、効率、品質を評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:30:42 GMT)
Learning from Mistakes: Self-correct Adversarial Training for Chinese Unnatural Text Correction [6.4] 不自然なテキスト補正は、文中のスペルエラーや逆転摂動エラーを自動的に検出し、修正することを目的としている。
既存の方法は、ミスを修正するための微調整や敵の訓練に頼っている。
我々はtextbfMIstextbfTakes から textbfLearntextbfIng の自己正逆学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:58:58 GMT)
RAGONITE: Iterative Retrieval on Induced Databases and Verbalized RDF for Conversational QA over KGs with RAG [6.4] SPARQLは複雑な意図と会話型の質問に対して脆弱である。
i)知識グラフから自動的に抽出されたデータベース上のSPARQL結果と、(ii)KG事実の動詞化に関するテキスト検索結果。
パイプラインは反復的な検索をサポートし、どのブランチの結果も満足できないと判断された場合、システムは自動的にラウンドを選択できる。
本稿では,BMW自動車の知識グラフに基づくいくつかのベースラインに対する提案方式の優位性を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:16:30 GMT)
Personalized Large Vision-Language Models [6.3] 大規模な視覚言語モデル(LVLM)は、一般的な形式ではなく参照概念を用いて対話的な対話を処理する。
PLVM は Aligner を提案している。Aligner はトレーニング済みのビジュアルエンコーダで、参照概念をクエリされたイメージと整合させる。
総合的な質的および定量的分析により,PLVMの有効性と優位性を明らかにする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:29:41 GMT)
Towards An Unsupervised Learning Scheme for Efficiently Solving Parameterized Mixed-Integer Programs [6.2] 教師なし学習方式でバイナリ変数の自動エンコーダを訓練する。
オフライン学習AEのデコーダパラメータから平面制約を切断するクラスを構築する戦略を提案する。
原始的なMIP問題への統合は、実現可能な領域を縮小したMIPの強化につながる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:48:32 GMT)
Emerging Security Challenges of Large Language Models [6.2] 大規模言語モデル(LLM)は、多くの異なる分野において短期間で記録的な普及を遂げた。
これらは、特定の下流タスクに合わせて調整されることなく、多様なデータでトレーニングされたオープンエンドモデルである。
従来の機械学習(ML)モデルは、敵の攻撃に対して脆弱である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:36:37 GMT)
What to Say and When to Say it: Live Fitness Coaching as a Testbed for Situated Interaction [6.0] QEVDベンチマークとデータセットは、フィットネスコーチングの挑戦的かつ制御されながら現実的な領域における人間とAIの相互作用を探索するものだ。
このベンチマークでは、複雑な人間の行動を認識し、起こりうる誤りを特定し、リアルタイムで適切なフィードバックを提供するために、視覚言語モデルが必要である。
そこで本研究では,適切なタイミングで適切なフィードバックで人間の行動に非同期に応答できる,シンプルなエンドツーエンドストリーミングベースラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:06:20 GMT)
Detecting Cognitive Impairment and Psychological Well-being among Older Adults Using Facial, Acoustic, Linguistic, and Cardiovascular Patterns Derived from Remote Conversations [5.9] 高齢化社会では、認知の低下を監視し、認知症リスクを示す社会的・心理的要因を特定するためのスケーラブルな方法が緊急に求められている。
機械学習の最近の進歩は、認知障害をリモートで検出し、神経症や心理的幸福のような関連する要因を評価する新しい機会を提供する。
実験の結果,言語パターンは認知障害の定量化に有用であるのに対し,表情や心血管パターンは性格や心理的幸福の定量化に有用であることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:46:17 GMT)
Learning Dynamic Local Context Representations for Infrared Small Target Detection [5.9] 複雑な背景、低信号/クラッタ比、ターゲットサイズと形状の違いにより、赤外線小目標検出(ISTD)は困難である。
ISTDの動的局所文脈表現を学習する新しい手法であるLCRNetを提案する。
1.65Mのパラメータだけで、LCRNetは最先端(SOTA)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:06:27 GMT)
COBRA: COmBinatorial Retrieval Augmentation for Few-Shot Learning [5.8] 我々は,COBRA(COmBinatorial Retrieval Augmentation,COBRA)を提案する。
COBRAは、ダウンストリームモデルの性能を大幅に向上させながら、検索コストに無視可能な計算オーバーヘッドを導入している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:10:07 GMT)
Explainability in Neural Networks for Natural Language Processing Tasks [5.8] LIME(Local Interpretable Model-Agnostic Explanations)は、複雑なシステムの振る舞いに関する洞察を提供するための重要なツールである。
本研究では、LIMEを利用してテキスト分類タスクで訓練された多層パーセプトロン(MLP)ニューラルネットワークを解釈する。
ローカライズされた説明を提供することの有効性にもかかわらず、LIMEはグローバルパターンのキャプチャや機能間の相互作用に制限がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:09:56 GMT)
Catch Me if You Can: Detecting Unauthorized Data Use in Deep Learning Models [5.7] 深層学習(DL)の台頭により、学習データに対する需要が急増し、DLモデルの作成者がインターネットを旅して教材を訓練するインセンティブがもたらされた。
ユーザは、自分のデータが自分の同意なしにDLモデルのトレーニングに使用されるかどうかを、限定的にコントロールすることが多い。
この研究は、一般ユーザーがデータの不正使用を確実に検出できる実用的なデータ監査ツールである MembershipTracker を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:44:47 GMT)
Detecting anxiety and depression in dialogues: a multi-label and explainable approach [5.6] 不安と抑うつは世界中で最も一般的なメンタルヘルスの問題であり、人口の非無視的な部分に影響を及ぼす。
本研究では、不安と抑うつの多ラベル分類のための全く新しいシステムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:29:46 GMT)
3D-GSW: 3D Gaussian Splatting for Robust Watermarking [5.5] モデルとレンダリング画像の両方の所有権を確保する3D-GSのためのロバストな透かし方式を提案する。
提案手法は高いレンダリング品質を維持しながら、レンダリング画像の歪みやモデルアタックに対して頑健である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:14:23 GMT)
STeInFormer: Spatial-Temporal Interaction Transformer Architecture for Remote Sensing Change Detection [5.5] マルチ時間特徴抽出のための時空間相互作用変換器アーキテクチャSTeInFormerを提案する。
また、RSCDのスペクトル情報を提供する周波数領域機能を統合するためのパラメータフリー多周波トークンミキサーを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:40:04 GMT)
MSHyper: Multi-Scale Hypergraph Transformer for Long-Range Time Series Forecasting [5.4] より包括的なパターン相互作用モデリングを促進するために,マルチスケールハイパーグラフトランス (MSHyper) フレームワークを提案する。
MSHyperは様々な設定で最先端のSOTA(State-of-the-art)パフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:08:16 GMT)
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference [5.4] Group Quantization and Sparse Acceleration (textbfGQSA)は、大規模言語モデル(LLM)に適した新しい圧縮技術である。
GQSAは量子化とスパーシフィケーションを緊密に結合した方法で統合し、GPUフレンドリな構造化グループ空間と量子化を利用して効率的な加速を行う。
LLaMAモデルファミリーの実験結果から,GQSAはモデル速度と精度のバランスが良好であることが確認された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:28:15 GMT)
Tiered Acquisition for Constrained Bayesian Optimization: An Application to Analog Circuits [5.4] 本稿では,獲得関数の結合アンサンブルを用いたベイズ最適化アルゴリズムを提案する。
この方法は、65nmの2段ミラー補償動作増幅器の利得と面積最適化に有効である。
頑健なベースラインと最先端のアルゴリズムと比較して、制約違反を最大38%削減し、目標目標を最大43%改善する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:41:43 GMT)
Simplified derivations for high-dimensional convex learning problems [5.3] 本研究では,高次元学習問題を解析するための空洞的手法を提案する。
これらの問題は共通の構造を共有し、統一的な分析を可能にする。
パーセプトロン・キャパシティ問題に対しては、Na" 法による正しいキャパシティの導出を可能にする対称性を同定する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:52:40 GMT)
Exponential speedup of quantum algorithms for the pathfinding problem [5.3] 溶接木に基づいてグラフ$G$を構築し、隣接リスト oracle $O$ でパスフィニング問題を定義する。
古典的なアルゴリズムが確率の高い指数時間で$x$-$y$パスを見つけることはできないことを証明している。
我々の発見は、量子アルゴリズムがパスフィニング問題を解決するために、より多くの種類のグラフに利点をもたらす可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:05:32 GMT)
Addressing and Visualizing Misalignments in Human Task-Solving Trajectories [5.2] 本稿では,軌跡データにおける不一致を検出し,分類するための可視化ツールとアルゴリズムを提案する。
これらのミスアライメントを取り除くことで、AIモデルのトレーニングのための軌道データの有用性が大幅に向上することを期待しています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:38:12 GMT)
Hiding, Shuffling, and Triangle Finding: Quantum Algorithms on Edge Lists [5.1] 三角形探索問題の3つの変種の量子クエリ複雑性について検討する。
Zhandryのレコードクエリフレームワークのバウンダリが低いことを証明します。
我々はBelovsの学習グラフアルゴリズムを3ドルで適用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:43:41 GMT)
Local unitarty equivalence and entanglement by Bargmann invariants [5.1] 局所的なユニタリ同値は、量子状態の分類と資源理論において重要な意味を持つ。
本稿では,量子情報理論における多部量子状態に対する局所的ユニタリ等価性の基本的問題に焦点をあてる。
この研究は局所ユニタリ同値のキャラクタリゼーションと局所ユニタリバーグマン不変量を用いた絡み合いの検出を深く研究している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:15:51 GMT)
Advancing Additive Manufacturing through Deep Learning: A Comprehensive Review of Current Progress and Future Challenges [5.0] 本稿では,添加性製造(AM)における深層学習(DL)応用の総合的な文献レビューについて紹介する。
急速に成長するが散在するこの分野で徹底的な分析の必要性に対処し、既存の知識をまとめ、さらなる開発を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:05:16 GMT)
LayerDropBack: A Universally Applicable Approach for Accelerating Training of Deep Networks [5.0] 本稿では,広範囲の深層ネットワークにおけるトレーニングを高速化する,シンプルかつ効果的な手法であるLayerDropBack(LDB)を紹介する。
LDBは後方パスのみにランダム性を導入し、前方パスの整合性を維持する。
実験の結果、16.93%のトレーニング時間を23.97%に削減し、モデル精度を保留または向上させた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:39:41 GMT)
Are Self-Attentions Effective for Time Series Forecasting? [5.0] 時系列予測は、複数のドメインやさまざまなシナリオにわたるアプリケーションにとって不可欠である。
近年の研究では、より単純な線形モデルは、複雑なトランスフォーマーベースのアプローチよりも優れていることが示されている。
我々は、新しいアーキテクチャ、クロスアテンションのみの時系列変換器(CATS)を導入する。
提案モデルでは,平均二乗誤差が最小であり,既存のモデルに比べてパラメータが少ないため,性能が向上する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:34:55 GMT)
THÖR-MAGNI Act: Actions for Human Motion Modeling in Robot-Shared Industrial Spaces [4.9] 本稿では TH"OR-MAGNI Act データセットについて紹介する。
TH"OR-MAGNI Actは、アイトラッキングメガネで記録されたエゴセントリックなビデオから、手動で8.3時間の参加者アクションをラベル付けする。
本研究では,行動条件付き軌道予測と共同行動,軌道予測の2つのタスクに対するTH"OR-MAGNI法の有用性を実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:40:12 GMT)
Constructing Fair Latent Space for Intersection of Fairness and Explainability [4.9] 本稿では,公正性を確保しつつ忠実な説明を可能にする,公正な潜在空間を構築する新しいモジュールを提案する。
我々のモジュールは事前訓練された生成モデルに結びついており、偏りのある潜在空間を公平な潜在空間に変換する。
様々なフェアネス指標を用いてフェアレント空間を検証し、偏りのある決定やフェアネスの保証について効果的に説明できることを実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:47:04 GMT)
Goal-Driven Reasoning in DatalogMTL with Magic Sets [4.9] DatalogMTLは時間的推論のための強力なルールベースの言語である。
本稿では,マジックセット技術を利用したDatalogMTLの新しい推論手法を提案する。
このアプローチを実装し、いくつかの公開ベンチマークで評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:24:15 GMT)
Technological Progress and Obsolescence: Analyzing the Environmental Economic Impacts of MacBook Pro I/O Devices [4.8] 本研究は、MacBook Pro I/Oデバイスの新リリースが、関連するアクセサリーの陳腐化にどのように影響するかを検討する。
我々は、I/Oポートの変更とMacBook Proバージョン間の互換性を分析し、どのアクセサリーが時代遅れであるかを判断し、環境への影響を見積もる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:26:01 GMT)
Navigating the Cultural Kaleidoscope: A Hitchhiker's Guide to Sensitivity in Large Language Models [4.8] LLMはますますグローバルなアプリケーションにデプロイされ、さまざまなバックグラウンドを持つユーザが尊敬され、理解されることが保証される。
文化的な害は、これらのモデルが特定の文化的規範と一致しないときに起こり、文化的な価値観の誤った表現や違反をもたらす。
潜在的な文化的不感を露呈するシナリオを通じて、異なる文化的文脈におけるモデルアウトプットを評価するために作成された文化的調和テストデータセットと、多様なアノテータからのフィードバックに基づいた微調整による文化的感受性の回復を目的とした、文化的に整合した選好データセットである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:53:33 GMT)
Domain adapted machine translation: What does catastrophic forgetting forget and why? [4.7] 本論文は,NTT適応時の破滅的忘れを理解するための新しいアプローチである。
ドメイン内のデータと忘れることの関係について検討し、そのデータのターゲット語彙カバレッジと、忘れることの量と種類が関連していることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:59:43 GMT)
Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer [4.7] 非意味的特徴は文脈非関連であり、操作に敏感である。
スパースビジョントランス (Sparse Vision Transformer, SparseViT) は、ViTの密集したグローバルな自己意識をスパースな個別の方法で再構成する。
既存のIMLモデルと比較して、スパース自己注意機構はモデルサイズを大幅に削減した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:08:19 GMT)
Improving the Noise Estimation of Latent Neural Stochastic Differential Equations [4.6] SDE(Latent Neural differential equations)は、最近時系列データから生成モデルを学習するための有望なアプローチとして登場した。
本稿では, この過小評価を詳細に検討し, 損失関数に付加的な雑音正規化を加えることで, 簡単な解法を提案する。
我々はデータの拡散成分を正確に捉えるモデルを学ぶことができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:56:35 GMT)
Analytic 3D vector non-uniform Fourier crystal optics in arbitrary $\bar{\bar{\varepsilon}}$ dielectric [4.6] 相互空間における固有解析と実空間における光場伝播の3つの広く用いられている平面波面の比較を行った。
M.V.ベリーの2003年一様平面波モデルから非一様フーリエ結晶光学(FCO)へ展開する。
円盤状, リング状, ハート状形状に配置された無限特異点など, 実空間および相互空間における LCO の新しい領域を発見した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:39:51 GMT)
A Theoretical Review on Solving Algebra Problems [4.6] 本稿では、まず状態変換理論(STT)を開発し、問題解アルゴリズムは状態や変換に応じて構造化されていることを強調する。
この構造は、単語と図形代数学の問題を解くための関係中心のアルゴリズムに適合する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:57:14 GMT)
EcoSearch: A Constant-Delay Best-First Search Algorithm for Program Synthesis [4.5] 本稿では,前世代コスト関数の定時遅延アルゴリズムであるEcoSearchを提案する。
EcoSearchは2つの古典的ドメインで前者よりも優れています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:48:47 GMT)
Examining Imbalance Effects on Performance and Demographic Fairness of Clinical Language Models [4.4] 本研究は,ICD符号予測におけるデータ不均衡とモデル性能の関係を統計的に検証する。
我々は、最先端のバイオメディカル言語モデルを用いて、性別、年齢、民族、および健康の社会的決定要因の標準ベンチマークデータにおける不均衡を分析する。
我々の研究は、データの不均衡がモデルの性能と公平性に大きく影響していることを示しているが、多数派と特徴的類似性はより重要な要素であるかもしれない。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:58:11 GMT)
A Coalition Game for On-demand Multi-modal 3D Automated Delivery System [4.4] 2つのオーバレイネットワークで動作するUAVとADRの連合ゲームとして,マルチモーダルな自律デリバリ最適化フレームワークを導入する。
このフレームワークは、高密度領域、道路ベースのルーティング、実際の運用課題など、都市環境におけるラストマイルデリバリに対処する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:50:29 GMT)
Average randomness verification in sets of quantum states via observables [4.3] 我々は、量子状態の集合$S$とハールランダム分布の$t$-モーメントとの整合性を検証する階層的テスト、平均ランダム性を示す。
可観測物の置換とユニタリ等価ランダム化により、平均乱数解析を拡張して、$S$と$t$-designsの互換性を統計的に検証することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:33:49 GMT)
Global Optimization with A Power-Transformed Objective and Gaussian Smoothing [4.3] 我々の手法は、$f$の大域的最適点の$delta$-neighborhoodの解に収束することを示す。
収束率は$O(d2sigma4varepsilon-2)$であり、標準および単一ループホモトピー法よりも高速である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:15:34 GMT)
An Evaluation Framework for Product Images Background Inpainting based on Human Feedback and Product Consistency [4.2] 製品広告アプリケーションでは、プロダクトイメージにおけるAI技術を活用した背景の自動塗り絵が重要なタスクとして現れている。
HFPC(Human Feedback and Product Consistency)は、2つのモジュールに基づいて生成した製品イメージを自動的に評価する。
HFPCは、他のオープンソースのビジュアル品質評価モデルと比較して、最先端(96.4%の精度)を実現している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:03:35 GMT)
Multiple Consistency-guided Test-Time Adaptation for Contrastive Audio-Language Models with Unlabeled Audio [4.2] 本稿では,アノテートラベルのない事前学習型音声言語モデルの試験時間適応手法を提案する。
提案手法を適用すれば平均0ショット性能が4.41%(最大7.50%)向上する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:53:52 GMT)
Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems [4.1] Retrieval Augmented Generation(RAG)は、会話質問回答(ConvQA)を介して企業のデータと対話するためのバックボーンとして機能する。
本研究では,RAGONITE(RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE ,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGO NITE)について述べる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:12:59 GMT)
Improving Pareto Set Learning for Expensive Multi-objective Optimization via Stein Variational Hypernetworks [4.1] 重大多目的最適化問題(EMOP)は、目的関数の評価にコストがかかる実世界のシナリオでは一般的である。
本稿では,Stein Variational Gradient Descent (SVGD) を Hypernetworks に統合した SVH-PSL という新しい手法を提案する。
本手法は, 解空間を滑らかにするために粒子を集合的に移動させることにより, フラグメント化サロゲートモデルと擬似局所最適化の問題に対処する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:05:45 GMT)
Collaborative Optimization in Financial Data Mining Through Deep Learning and ResNeXt [4.0] 本研究ではResNeXtに基づくマルチタスク学習フレームワークを提案する。
提案手法は精度,F1スコア,ルート平均二乗誤差,その他の指標において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:14:15 GMT)
Scattering halos in strongly interacting Feshbach molecular Bose-Einstein condensates [3.8] 本研究では, 相互作用制御可能な6mのLi$分子Bose-Einstein凝縮体の飛行時間膨張における離散運動量成分間の衝突による散乱ハロースについて検討する。
この研究の重要な特徴は、衝突散乱過程における相互作用の影響を観察することである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:22:14 GMT)
Fair Knowledge Tracing in Second Language Acquisition [3.7] 本研究では、Duolingoデータセットのen_es(スペイン語学習者)、es_en(スペイン語学習者)、fr_en(フランス語学習者)のトラックを用いた2つの予測モデルの公正性を評価する。
ディープラーニングは、精度と公正性の改善により、第2言語の知識追跡において機械学習よりも優れています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:47:40 GMT)
Proactive and Reactive Constraint Programming for Stochastic Project Scheduling with Maximal Time-Lags [3.7] 本研究では,最大時間ラグ(SRCPSP/max)を用いた資源制約型プロジェクトスケジューリング問題のスケジューリング戦略について検討する。
制約プログラミング(CP)とテンポラルネットワークの最近の進歩は、様々なプロアクティブかつリアクティブなスケジューリング手法の利点と欠点を評価することへの関心を再燃させた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:57:48 GMT)
Neural Spatial-Temporal Tensor Representation for Infrared Small Target Detection [3.7] 赤外線小ターゲット検出のためのニューラル表現時空間モデル(NeurSTT)を提案する。
NeurSTTは、背景近似における空間的時間的相関を強化し、教師なしの方法でターゲット検出をサポートする。
様々なデータセットの視覚的および数値的な結果から,提案手法は256倍256$のシーケンスで最適以下の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:46:08 GMT)
Line Graph Vietoris-Rips Persistence Diagram for Topological Graph Representation Learning [3.7] トポロジカルエッジ図(TED)と呼ばれる新しいエッジフィルタを用いた永続化図を導入する。
TEDは、ノードの埋め込み情報を保存し、追加の位相情報を含むことが数学的に証明されている。
本稿では,グラフを行グラフに変換することによってエッジ情報を抽出するLine Graph Vietoris-Rips (LGVR) Persistence Diagramを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:46:44 GMT)
Three-in-One: Robust Enhanced Universal Transferable Anti-Facial Retrieval in Online Social Networks [3.7] 3-in-One Adversarial Perturbation (TOAP) は、ユニバーサルトランスファー可能な抗顔面検索法である。
現実世界のシナリオでは、悪意のある検索からプライベートイメージを効果的に保護することができる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:36:35 GMT)
Multimodal Learning with Uncertainty Quantification based on Discounted Belief Fusion [3.7] 医療、金融、自動運転といった分野では、マルチモーダルAIモデルがますます使われています。
騒音、不十分な証拠、モダリティ間の紛争に起因する不確実性は、信頼できる意思決定に不可欠である。
本稿では,命令不変なエビデンス融合を用いた新しいマルチモーダル学習手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:37:18 GMT)
AutoLife: Automatic Life Journaling with Smartphones and LLMs [3.7] 本稿では,商用スマートフォンをベースとした自動ライフジャーナリングシステムであるAutoLifeを紹介する。
まず、マルチモーダルセンサデータから時間、動き、位置のコンテキストを導き、大規模言語モデルのゼロショット機能を利用する。
本研究は,リアルタイムデータセットをベンチマークとして確立し,AutoLifeが正確かつ信頼性の高いライフジャーナルを生成することを示す実験結果である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:45:32 GMT)
GCS-M3VLT: Guided Context Self-Attention based Multi-modal Medical Vision Language Transformer for Retinal Image Captioning [3.6] 本稿では,視覚的特徴とテキスト的特徴を組み合わせた視覚的イメージキャプションのための新しい視覚言語モデルを提案する。
DeepEyeNetデータセットの実験では、0.023 BLEU@4の改善と重要な定性的な進歩が示されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:49:29 GMT)
Stable Mean Teacher for Semi-supervised Video Action Detection [3.6] 我々は,映像行動検出のための半教師付き学習に焦点を当てた。
改良された時間的に一貫した擬似ラベルの恩恵を受ける、シンプルなエンドツーエンドの教師ベースのフレームワークである安定平均教師を紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:39:48 GMT)
TempoKGAT: A Novel Graph Attention Network Approach for Temporal Graph Analysis [3.6] 本稿では,時間遅延重みと空間領域上の選択的な隣接集約機構を組み合わせた新しいタイプのグラフアテンションネットワークであるTempoKGATを提案する。
我々は、時間的データを含む交通、エネルギー、健康セクターから複数のデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:31:30 GMT)
ORIGAMI: A generative transformer architecture for predictions from semi-structured data [3.6] ORIGAMIは、ネストされたキー/バリューペアを処理するトランスフォーマーベースのアーキテクチャである。
分類を次点予測として再構成することで、ORIGAMIはシングルラベルとマルチラベルの両方のタスクを自然に処理する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:21:17 GMT)
Impact of Evidence Theory Uncertainty on Training Object Detection Models [3.4] エビデンス理論は、基底の真理ラベルと予測の関係を確立するために用いられる。
その後、不確実性尺度を使用して、その後の反復に対するフィードバック損失を重み付けする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:16:10 GMT)
PHICOIN (PHI): The Proof of Work High-Performance Infrastructure [3.4] PHICOIN (PHI) はProof-of-Work (PoW) メカニズムに基づく高性能暗号通貨である。
一般ユーザーに分散的な参加機会を提供することを目標としている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:50:55 GMT)
A partial likelihood approach to tree-based density modeling and its application in Bayesian inference [3.4] 本稿では,コヒーレンシを復元する上で,候補パーティションをデータ依存にしつつ,簡単な戦略を提案する。
我々の部分的確率的アプローチは、既存の可能性に基づく手法、特に木に基づくモデルに対するベイズ推定に広く適用できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:46:34 GMT)
Beyond Silent Letters: Amplifying LLMs in Emotion Recognition with Vocal Nuances [3.4] 本稿では,音声特徴を自然言語記述に変換するSpeechCueLLMを提案する。
我々は、IEMOCAPとMELDの2つのデータセット上でSpeechCueLLMを評価し、感情認識精度を大幅に改善した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:35:12 GMT)
Optimization of Convolutional Neural Network Hyperparameter for Medical Image Diagnosis using Metaheuristic Algorithms: A short Recent Review (2019-2022) [3.4] 畳み込みニューラルネットワーク(CNN)は,多くの疾患の診断に有効である。
本研究は,CNN最適化プロセスにおけるメタヒューリスティック最適化アルゴリズムの利用について,近年の成果を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:13:02 GMT)
Analysis of Transferred Pre-Trained Deep Convolution Neural Networks in Breast Masses Recognition [3.4] 乳腺X線像を良性または悪性と分類し, 術前訓練したCNNにおける層凍結の影響について検討した。
VGG19の冷凍第1ブロックの感度は95.64 %であり、VGG19全体のトレーニングは94.48%であった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:16:45 GMT)
DiffFormer: a Differential Spatial-Spectral Transformer for Hyperspectral Image Classification [3.3] 超スペクトル画像分類(HSIC)は、高次元データをスペクトル情報と空間情報で分析する可能性から注目されている。
本稿では、スペクトル冗長性や空間不連続性といったHSICの固有の課題に対処するために、差分空間スペクトル変換器(DiffFormer)を提案する。
ベンチマークハイパースペクトルデータセットの実験は、分類精度、計算効率、一般化可能性の観点から、DiffFormerの優位性を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:21:41 GMT)
Generating refactored code accurately using reinforcement learning [3.2] そこで本研究では,Javaソースコードの自動抽出を行うために,プログラム言語モデルを微調整・整合化するための強化学習に基づく新しい手法を提案する。
提案手法は,PPO(Proximal Policy Optimization)アルゴリズムを用いて,シーケンス・ツー・シーケンス生成モデルを微調整する。
我々の実験は、我々のアプローチがコードにおける大きな言語モデルの性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:09:48 GMT)
ICPR 2024 Competition on Domain Adaptation and GEneralization for Character Classification (DAGECC) [3.1] 提案した課題の一般的な文脈をコミュニティに提示し、コンペに備えたデータを紹介し、結果の概要と、上位3つの勝者の項目について説明する。
このコンペティションはドメイン適応と一般化を中心に行われており、新しいアイデアの高速なプロトタイピングと検証を支援する高品質で軽量な実世界のデータセットを提供することで、関心を高め、これらのトピックの進展を促進することを目的としています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:06:08 GMT)
Broadband Ground Motion Synthesis by Diffusion Model with Minimal Condition [3.1] 本研究では,実際の地震データから学習した後に,現実的な波形を確実に生成する特殊潜在拡散モデル(LDM)を提案する。
本研究では,南カリフォルニア地震データセンター (SCEDC) API を用いた時整列地震データセットを構築した。
我々のモデルは、波形生成領域だけでなく、地震学からも、様々な試験基準において、同等のデータ駆動手法をすべて上回っている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:56:28 GMT)
Optimal Convergence Rates for Neural Operators [2.9] 我々は、隠れたニューロンの数と一般化に必要な第2段階のサンプルの数に制限を与える。
ニューラル作用素のキーとなる応用は、偏微分方程式の解作用素に対する代理写像の学習である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:31:38 GMT)
LLM for Barcodes: Generating Diverse Synthetic Data for Identity Documents [2.7] 我々は,LLMを用いた合成データ生成に新たなアプローチを導入し,事前定義されたフィールドに依存することなく,文脈的にリッチでリアルなデータを生成する。
我々のアプローチはデータセット作成のプロセスを単純化し、広範なドメイン知識の必要性を排除します。
このスケーラブルでプライバシ優先のソリューションは、自動文書処理とID認証のための機械学習の進歩の大きな一歩だ。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:01:23 GMT)
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion [2.7] 治療ペプチドSMILESの同時生成と最適化のための多目的離散拡散モデルであるPepTuneを提案する。
我々は, 標的結合親和性, 膜透過性, 溶解性, 溶血性, 非汚濁性など, 複数の治療特性に最適化された多種多様な修飾ペプチドを生成する。
以上の結果から,PepTuneは離散状態空間における多目的シーケンス設計において,強力かつモジュール化されたアプローチであることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:38:49 GMT)
tuGEMM: Area-Power-Efficient Temporal Unary GEMM Architecture for Low-Precision Edge AI [2.7] General matrix multiplication (GEMM) は、様々なアプリケーションにおけるデータ処理のためのユビキタスコンピューティングカーネル/アルゴリズムである。
エッジコンピューティングへの最近のシフトは、一元計算に基づくGEMMアーキテクチャに影響を与えた。
本稿では,時間的符号化に基づく新しいGEMMアーキテクチャであるtuGEMMを提案し,正確な計算を行う。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:30:28 GMT)
How Green Can AI Be? A Study of Trends in Machine Learning Environmental Impacts [2.6] 最適化戦略は、AIに関連するエネルギー消費と環境への影響を減らすことを目的としている。
本稿では,個々のグラフィクスカードの生産への影響と,機械学習(ML)モデルの学習に伴う環境への影響について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:24:44 GMT)
Enhancing Reconstruction-Based Out-of-Distribution Detection in Brain MRI with Model and Metric Ensembles [2.6] アウト・オブ・ディストリビューション(OOD)検出は、自動化された医用画像分析システムを安全に展開するために重要である。
脳MRIにおける人工臓器の教師なし検出における再構成に基づくオートエンコーダの有効性について検討した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:58:52 GMT)
Non-parametric Hypothesis Tests for Distributional Group Symmetry [2.6] この研究は、一般群対称性の有無についての非パラメトリック仮説試験を定式化する。
2つの広い設定に適用可能な対称性のテストの一般的な定式化を提供する。
地磁気衛星データにおける対称性のテストと高エネルギー粒子物理学の2つの問題に適用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:07:50 GMT)
EM-MIAs: Enhancing Membership Inference Attacks in Large Language Models through Ensemble Modeling [2.5] 本稿では,XGBoostをベースとしたモデルに既存のMIA技術を統合し,全体的な攻撃性能(EM-MIAs)を向上させる新しいアンサンブル攻撃法を提案する。
実験結果から,アンサンブルモデルではAUC-ROCと精度が,大規模言語モデルやデータセットを対象とする個別攻撃法と比較して有意に向上していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:47:54 GMT)
SwinGS: Sliding Window Gaussian Splatting for Volumetric Video Streaming with Arbitrary Length [2.5] 本稿では,リアルタイムストリーミング方式でボリュームビデオのトレーニング,配信,レンダリングを行うフレームワークであるSwinGSを紹介する。
SwingGSはPSNRの妥協を無視する以前の研究と比較して伝送コストを83.6%削減することを示した。
また、現代的なブラウザを持つほとんどのデバイス上で、リアルタイムのボリュームビデオ再生を可能にするインタラクティブなWebGLビューアを開発した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:03:22 GMT)
CoMIX: A Multi-agent Reinforcement Learning Training Architecture for Efficient Decentralized Coordination and Independent Decision-Making [2.5] ロバストコーディネートスキルにより、エージェントは共有環境で、共通の目標に向けて、そして理想的には、お互いの進歩を妨げることなく、結合的に操作することができる。
本稿では,分散エージェントのための新しいトレーニングフレームワークであるCoordinated QMIXについて述べる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:38:00 GMT)
Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy [2.3] 人工知能の急速に発展する分野であるマルチモーダル学習は、より汎用的で堅牢なシステムの構築を目指している。
多くの感覚を通じて情報を同化する人間の能力に触発され、テキストからビデオへの変換、視覚的質問応答、画像キャプションなどの応用が可能となる。
マルチモーダル言語モデル(MLLM)をサポートするデータセットの最近の発展について概説する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:15:19 GMT)
Assessing Human Editing Effort on LLM-Generated Texts via Compression-Based Edit Distance [2.2] Levenshtein、BLEU、ROUGE、TERといった既存の編集距離のメトリクスは、後編集に必要な労力を正確に測定できないことが多い。
本稿では,Lempel-Ziv-77アルゴリズムに基づく新しい圧縮ベース編集距離測定手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:29:25 GMT)
Towards Intrinsic Self-Correction Enhancement in Monte Carlo Tree Search Boosted Reasoning via Iterative Preference Learning [2.2] 我々は、ステップワイズ選好学習を活用し、強化学習による自己検証を強化する。
算術的推論タスクの評価において,本手法は MaTH 上で OpenMath2-Llama3.1-8B,dart-math-mistral-7b-uniform より優れている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:51:48 GMT)
TNNGen: Automated Design of Neuromorphic Sensory Processing Units for Time-Series Clustering [2.1] 最近の研究で、エネルギー効率の高いアプリケーション固有のTNNのためのマイクロアーキテクチャフレームワークとカスタムマクロスイートが提案されている。
TNN用のオープンソースの関数型シミュレーションフレームワークはありません。
本稿では、PyTorchソフトウェアモデルからポストネットリストまで、TNNの自動設計に向けた先駆的な取り組みであるTNNGenを紹介する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:46:53 GMT)
Vulnerability Detection in Popular Programming Languages with Language Models [2.0] 本稿では,JavaScript,Java,Python,PHP,Goの脆弱性検出における言語モデル(LM)の有効性について検討する。
C/C++と比較して、JavaScriptは最高のパフォーマンスを示し、より優れた、より実用的な検出能力を持っています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:12:25 GMT)
Machine learning and natural language processing models to predict the extent of food processing [2.0] 超加工食品消費に関連する公衆衛生上の影響を考えると、食品の処理を予測するための計算モデルを構築することは極めて重要である。
私たちは、食品処理の範囲を予測するために、機械学習、ディープラーニング、NLPモデルを作成しました。
食品の栄養パネルに基づいて処理レベルを予測するためのユーザフレンドリーなWebサーバを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:08:45 GMT)
Quantum Algorithms for Discrete Log Require Precise Rotations [2.0] Shorの量子因数分解アルゴリズムは、アルゴリズムの量子フーリエ変換がランダムノイズの消滅レベルによって破壊されるとき、大きな整数を分解できないことを示す。
また、同じノイズレベルがShorのアルゴリズムを確率 1-o(1) で失敗させ、ランダムに選択された素数 P に対して離散ログ P を計算することも示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:33:19 GMT)
More than Chit-Chat: Developing Robots for Small-Talk Interactions [1.9] スモールトークは、社会的ダイナミクスにおいて重要な役割を担い、ラプポートの構築と理解のための言葉による握手として機能する。
会話型AIとソーシャルロボットでは、小さな会話に参加する能力は社会的可能性を高める。
フィードバックを自律的に生成し、LLM生成応答を小さな話の慣行と一致させる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:35:38 GMT)
A Grounded Observer Framework for Establishing Guardrails for Foundation Models in Socially Sensitive Domains [1.9] 基礎モデルの複雑さを考えると、エージェントの振る舞いを制約する従来の手法は直接適用できない。
本稿では,行動保証とリアルタイム変動性の両方を提供する基礎モデルの挙動を制約する基盤となるオブザーバフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:57:05 GMT)
Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs [1.9] バックドアを成功させようとする悪いアクターは、トレーニングや評価の際のアクティベーションを避けるために、それらを設計する必要があります。
現在の大規模言語モデル(LLM)は、過去の出来事と将来の出来事を区別することができ、モデルのアクティベーションに関する調査で90%の精度を実現している。
私たちは、時間的分布シフトによって引き起こされるバックドアでモデルをトレーニングします。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:24:44 GMT)
The Role of XAI in Transforming Aeronautics and Aerospace Systems [1.9] 本稿では,XAIの概念とその目的について概観する。
本稿は、その内部で定義されたモデルの種類と、それらのモデルが満たさなければならない特性について論じる。
航空・航空宇宙分野における様々な応用分野が紹介され、AIシステムやモデルの機能を理解するためにXAIがこれらの分野でどのように使われているかが強調される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:02:17 GMT)
How well can large language models explain business processes as perceived by users? [1.8] 大規模言語モデル(LLM)は、人間のような文章を解釈し、生成するために大量のテキストで訓練される。
そのようなシステムの1つの機能は、因果的音と人間解釈可能な説明を生成することに関連する状況認識eXplainability (SAX)である。
本稿では,SAX の説明を生成するために開発された SAX4BPM フレームワークについて述べる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:56:06 GMT)
Collective sleep and activity patterns of college students from wearable devices [1.7] 大学1学期における若年者コホートの毎日および毎週の睡眠と活動パターンについて検討した。
ほとんどの学生は深夜のクロノタイプで、午前5時に睡眠中盤が中央値である。
ソーシャル・ジェットラグ(フリーデイとスクールデイの睡眠時間の違い)は、我々のサンプルに多い。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:34:14 GMT)
Towards quantum-centric simulations of extended molecules: sample-based quantum diagonalization enhanced with density matrix embedding theory [1.6] サンプルベース量子対角化法(SQD)と組み合わせて実施した第1密度行列埋め込み理論(DMET)について述べる。
我々はDMET-SQD形式を用いて18個の水素原子の環の基底状態エネルギーと、シクロヘキサンの椅子、半チェア、ねじれボート、ボートコンホメータの相対エネルギーを計算する。
我々のDMET-SQD計算は、短期量子コンピュータで正確に取り組めるアクティブ領域のサイズが明らかに進歩していることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:29:25 GMT)
Markov Process-Based Graph Convolutional Networks for Entity Classification in Knowledge Graphs [1.6] マルコフプロセスに基づくアーキテクチャをよく知られたグラフ畳み込みネットワーク(GCN)に導入する。
このエンドツーエンドネットワークは、マルコフプロセス内の知識グラフにおけるエンティティのクラスアフィリエイトの予測を学習する。
実験は、いくつかの研究されたアーキテクチャとデータセットにおいて、既存のモデルよりもパフォーマンスが向上したことを示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:59:49 GMT)
Double Landmines: Invisible Textual Backdoor Attacks based on Dual-Trigger [1.6] 本稿では,構文とムードに基づくDual-Triggerバックドアアタックを提案する。
多くの実験結果から,本手法が従来の手法よりも有意に優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:56:30 GMT)
FRTP: Federating Route Search Records to Enhance Long-term Traffic Prediction [1.6] 本稿では,様々な特徴や時間的粒度や長さを持つ生データから学習できるフェデレートアーキテクチャを提案する。
本実験は,経路探索記録のフェデレーションに焦点をあて,モデルフレームワーク内で生データを処理することから開始する。
提案モデルの精度は,多様な学習パターンとパラメータ設定を用いた評価によって実証される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:14:20 GMT)
Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations [1.5] 消化管の異常は患者の健康に大きく影響を与え、タイムリーな診断が必要である。
この研究は、ビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。
Omni次元のGated Attention(OGA)機構とWavelet変換技術をモデルアーキテクチャに統合することで、モデルは最も重要な領域に集中することができた。
このモデルの性能は、VGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:32:45 GMT)
Time-Probability Dependent Knowledge Extraction in IoT-enabled Smart Building [1.5] 建物内の異種センサデータをモデリングするための統一的で実用的なフレームワークが欠如している。
本稿では,スマートビルディングにおける状況と状況の知識を抽出する実践的推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:29:29 GMT)
Data-Driven Priors in the Maximum Entropy on the Mean Method for Linear Inverse Problems [1.5] 我々は,それぞれのログモーメント生成関数間のエピグラフィカル距離に基づいて,先行値がmu$ と $nu$ の MEM 解の違いを推定する。
MNIST と Fashion-MNIST のデータセットについて,本研究の結果を概説する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:09:37 GMT)
Third-Order Exceptional Point in Non-Hermitian Spin-Orbit-Coupled cold atoms [1.5] 我々は、散逸スピン軌道結合(SOC)フェルミオンを持つ対称性で保護された3レベル非エルミタン系について述べる。
EP3は、系の固有値と固有状態の両方が崩壊すると現れる。
我々はEP3の外部摂動に対する高感度化と立方根エネルギー分散を強調した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:35:02 GMT)
Two-Photon Interference of Photons from Remote Tin-Vacancy Centers in Diamond [1.4] ダイヤモンド中のスズ原子空孔は長寿命のクビットとして出現している。
リモートノードを接続するには、区別できない光子の量子干渉が必要である。
遠隔量子レジスタ間のロバストな光リンクを確立するため,ダイヤモンド中のスズ空孔中心の可能性を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:02:21 GMT)
Room-temperature quantum sensing with photoexcited triplet electrons in organic crystals [1.4] 光励起有機色調における偏光スピントリップレット電子を用いた量子センサ
技術は化学系における量子センシングの新たな可能性を強調している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:29:00 GMT)
Complex energy structures of exceptional point pairs in two level systems [1.4] 非エルミート系における複数の例外点の位相的性質について検討する。
我々は,EP対を大きなEPアセンブリの基本構造ブロックとして分類し,反対の渦を持つタイプI対と同一の渦を持つタイプII対の2つのタイプを区別した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:18:17 GMT)
naab: A ready-to-use plug-and-play corpus for Farsi [1.4] naabは、最も公開されており、クリーンで、使えるFarsiテキストコーパスである。
Naabは130GBのデータで、2億5000万の段落と150億の単語で構成されている。
Naab-rawは、前処理ツールキットとともに、データセットの未処理バージョンである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:29:49 GMT)
Bayesian penalized empirical likelihood and MCMC sampling [1.3] 本稿では,経験的可能性 (EL) に固有の計算課題に対処するため,ベイズ法(Bayesian Penalized Empirical Likelihood, BPEL)と呼ばれる新しい手法を提案する。
提案手法の主な目的は, (i) 多様なモデル条件を収容する際のELの固有の柔軟性を高めること, (ii) 確立されたマルコフ・チェイン・モンテカルロ(MCMC)サンプリングスキームの使用を容易にすることである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:29:14 GMT)
Steganography and Probabilistic Risk Analysis: A Game Theoretical Framework for Quantifying Adversary Advantage and Impact [1.3] 本研究では, 防衛企業と敵との戦略的相互作用を分析するための, 新たなステガノグラフィーゲーム理論モデルを提案する。
非協力的なゲームとしてシナリオをフレーミングすることにより、双方にとって最適な戦略を体系的に評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:02:52 GMT)
Generating Completions for Fragmented Broca's Aphasic Sentences Using Large Language Models [1.3] ブロカ失語症 (Broca's aphasia) は、非流動的で、強固で、断片的な発声を特徴とする失語の一種である。
我々は,Brocaの失語文を完全化するためのシーケンス・ツー・シーケンス・Large Language Models (LLM) を開発した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:54:15 GMT)
Initialization Method for Factorization Machine Based on Low-Rank Approximation for Constructing a Corrected Approximate Ising Model [1.2] FMを用いたIsingモデルの構築はブラックボックス最適化問題に適用される。
FMQAの最適化性能は、ウォームスタート方式の実装により向上することが期待されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:26:23 GMT)
Enhancing Cancer Diagnosis with Explainable & Trustworthy Deep Learning Models [1.1] 本研究は, 説明可能な人工知能(XAI)と深層学習技術を用いて, がんの診断と予測に革新的なアプローチを提案する。
我々の研究は、意思決定プロセスに関する正確な結果と明確な洞察を提供するAIモデルを開発した。
このモデルの応用は、がんの診断を超えて、医学的な意思決定の様々な側面を変え、世界中の数百万人の命を救う可能性がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:50:47 GMT)
Enhanced Generative Data Augmentation for Semantic Segmentation via Stronger Guidance [1.1] 制御可能拡散モデルを用いたセマンティックセグメンテーションのための効果的なデータ拡張パイプラインを提案する。
提案手法は,textitClass-Prompt Appending と textitVisual Prior Blending を用いた効率的なプロンプト生成を含む。
このパイプラインは,セマンティックセグメンテーションのための高品質な合成画像を生成する上での有効性を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:57:21 GMT)
Popularity Estimation and New Bundle Generation using Content and Context based Embeddings [1.1] 製品バンドルは、製品レコメンデーションの分野におけるエキサイティングな開発です。
販売、消費者エクスペリエンス、商品の多様性に基づいた新しいバンドル人気指標をバンドルに導入する。
実験の結果,既存のバンドルを32%~44%上回る,新たなバンドルを生成することが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:04:14 GMT)
Content Adaptive Front End For Audio Classification [1.0] 音声信号処理のための学習可能なコンテンツ適応フロントエンドを提案する。
我々は、各音声信号を畳み込みフィルタのバンクに通し、それぞれが固定次元ベクトルを与える。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:55:56 GMT)
Asynchronous Federated Learning: A Scalable Approach for Decentralized Machine Learning [0.9] フェデレートラーニング(FL)は、分散機械学習の強力なパラダイムとして登場した。
従来のFLアプローチは、同期クライアントのアップデートに依存しているため、スケーラビリティと効率の制限に直面することが多い。
本稿では、クライアントが独立して非同期にグローバルモデルを更新できる非同期フェデレートラーニング(AFL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:11:02 GMT)
A mixing time bound for Gibbs sampling from log-smooth log-concave distributions [0.9] ログスムースと強いログコンケーブ対象分布のクラスにおけるギブスサンプリング器の挙動について検討した。
Gibbsのサンプルは、少なくとも$Ostarleft(kappa2 n7.5left(maxleft1,sqrtfrac1nlog frac2Mgammarightright2right)$のステップで、条件番号$kappa$の分布から合計で$gamma$以下の誤差を持つサンプルを生成する必要がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:00:02 GMT)
Arbitrary Polynomial Separations in Trainable Quantum Machine Learning [0.9] 量子機械学習の最近の理論的結果は、量子ニューラルネットワーク(QNN)の表現力とトレーニング可能性との一般的なトレードオフを示している。
我々は、文脈性が表現性分離の源であることを示し、この性質を持つ他の学習タスクが量子学習アルゴリズムの使用の自然な設定である可能性を示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:38:51 GMT)
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs [0.8] 大きな言語モデル(LLM)は、言語理解と生成に関する考え方を変えました。
LLM量子化によく使われるグループ量子化形式は、計算上のオーバーヘッドとリソース集約型量子化プロセスを持つ。
本稿では,LLMの超低精度量子化のためのグループワイド非一様符号ブックに基づく量子化手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:44:29 GMT)
Dynamic safety cases for frontier AI [0.8] 本稿では, 安全ケースの初期作成と, その体系的, 半自動改定の両立を支援するための動的安全事例管理システム(DSCMS)を提案する。
攻撃的サイバー能力のための安全ケーステンプレート上でこのアプローチを実証し、安全クリティカルな意思決定のためのガバナンス構造に統合する方法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:43:41 GMT)
On the Feasibility of Vision-Language Models for Time-Series Classification [0.7] 視覚言語モデル(VLM)の機能を活用して時系列分類を構築する。
我々は,グラフィカルなデータ表現を画像として組み込んだ新しい手法を,数値データと組み合わせて開発する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:52:17 GMT)
Measuring Contextual Informativeness in Child-Directed Text [0.7] 本研究は,子どもの物語における文脈的情報度測定という課題を動機づけるものである。
大規模言語モデル(LLM)を用いたタスクの自動化手法を提案する。
追加分析の結果,成人向けテキストにおける文脈情報性の測定にLLMベースのアプローチが適用可能であることがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:45:03 GMT)
Online Adaptation for Myographic Control of Natural Dexterous Hand and Finger Movements [0.7] この研究は、補綴制御システムから得られる信頼性、応答性、運動の複雑さの観点から、筋電図復号における最先端の状態を再定義する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:20:32 GMT)
MatchMiner-AI: An Open-Source Solution for Cancer Clinical Trial Matching [0.7] 臨床治験におけるMatchMiner-AIパイプラインの開発と評価について述べる。
MatchMiner-AIは、臨床「空間」を規定するコア基準に基づいて、患者と潜在的な臨床試験をマッチングすることに焦点を当てる
パイプラインは、患者の縦型電子健康記録から鍵情報を抽出するモジュールを含む。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:44:35 GMT)
Feature Based Methods Domain Adaptation for Object Detection: A Review Paper [0.6] ドメイン適応は、異なるデータ分布を持つターゲットドメインにデプロイされた場合、機械学習モデルの性能を向上させることを目的としている。
本総説では, 対人学習, 差分ベース, マルチドメイン, 教師学生, アンサンブル, VLM技術など, 高度なドメイン適応手法について述べる。
特に合成ドメインシフトを含むシナリオにおいて、ラベル付きデータへの依存を最小限に抑える戦略に特に注意が払われる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:34:23 GMT)
MOCK: an Algorithm for Learning Nonparametric Differential Equations via Multivariate Occupation Kernel Functions [0.6] d$次元状態空間の軌跡から得られる通常の微分方程式の非パラメトリック系は、$d$変数の$d$関数を学ぶ必要がある。
明示的な定式化はしばしば、スパーシティや対称性といったシステム特性に関する追加の知識が得られない限り、$d$で2次的にスケールする。
本稿では,ベクトル値を持つカーネルヒルベルト空間から得られる暗黙の定式化を用いて,線形アプローチ,多変量占有カーネル法(MOCK)を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:54:29 GMT)
Approximating Ground States of Quantum Hamiltonians with Snapshot-QAOA [0.6] Snapshot-QAOAは量子近似最適化アルゴリズム(QAOA)の変種である
量子ハミルトニアンの大きな集合の近似最小エネルギー固有状態を求める。
我々の基本的なアプローチは、連続時間線形アダバティックアニールスケジュールのトロタライズというアイデアにインスパイアされている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:18:30 GMT)
TransferLight: Zero-Shot Traffic Signal Control on any Road-Network [0.6] TransferLightは、ロードネットワーク全体の堅牢な一般化のために設計された新しいフレームワークである。
階層的で、異質で、有向的なグラフニューラルネットワークアーキテクチャは、トラフィックの粒度の動態を効果的に捉えます。
我々は、ゼロショットを任意の道路ネットワークに再トレーニングせずにスケールする、単一の重み付けポリシーを開発した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:13:20 GMT)
Time Series Feature Redundancy Paradox: An Empirical Study Based on Mortgage Default Prediction [0.6] 従来の知恵は、長いトレーニング期間とより多くの機能変数がモデルのパフォーマンス向上に寄与することを示している。
本稿では、住宅ローンのデフォルト予測に着目し、従来の知識と矛盾する現象を実証的に発見する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:28:32 GMT)
A Quantum Super-Krylov Method for Ground State Energy Estimation [0.6] 基底状態エネルギー推定のためのクリロフ量子対角化法は、量子コンピュータにとって魅力的なユースケースである。
本稿では,時間発展と回復確率のみを利用する量子クリロフ法について述べる。
得られた地中エネルギーの推定値がノイズのない状態に収束していることが証明され,ノイズの存在下での手法の古典的な数値的な実演が提供される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:21:43 GMT)
Classical simulability of Clifford+T circuits with Clifford-augmented matrix product states [0.6] 我々は、$T$ゲート数でドープされた$N$-qubit Clifford回路の古典的シミュラビリティについて検討する。
我々は,制御パウリゲートを用いたCAMPSにおけるMPS成分の絡み合いを低減するために,単純な解離アルゴリズムを用いる。
この研究は、$t$ドープ回路の古典的シミュレート可能性を理解するために、CAMPSに基づく汎用的なフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:26:40 GMT)
Continuous-variable designs and design-based shadow tomography from random lattices [0.5] n-モード系に対して、すべての GKP 状態の集合は、厳密な連続変数状態 2-設計を形成することを示す。
これらの格子状態設計を用いて連続変数シャドウトモグラフィープロトコルを構築する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:04:47 GMT)
Lindblad engineering for quantum Gibbs state preparation under the eigenstate thermalization hypothesis [0.4] 量子ギブス状態生成アルゴリズムにおけるリンドブラッド工学の最近の進歩に基づき、固有状態熱化仮説(ETH)の下で効率的であることが示される単純化されたプロトコルを提案する。
現実のリンドブラッド力学は、偏極ノイズに対するレジリエンスを示し、量子コンピュータにおける最初のデモンストレーションへの道を開く。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:35:12 GMT)
"From Unseen Needs to Classroom Solutions": Exploring AI Literacy Challenges & Opportunities with Project-based Learning Toolkit in K-12 Education [0.4] K-12の生徒には、コンピュータ科学を超えて、AIリテラシーのスキルを身につける必要性がますます高まっている。
本稿では,PBL(Project-Based Learning)AIツールキットをさまざまな分野に統合し,教育者がAI概念をより効果的に教えることを目的とした。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:31:02 GMT)
Study of the Proper NNUE Dataset [0.3] NNUEはチェスエンジンの開発に革命をもたらし、ほとんどのトップエンジンがNNUEモデルを採用して競争力を維持している。
NNUEトレーニングにおける重要な課題は、特に戦術的および戦略的評価が不可欠であるチェスのような複雑なドメインにおいて、高品質なデータセットを作成することである。
本稿では,安定かつ戦術的ボラティリティのない「キート」位置からなるデータセットの生成とフィルタリングを行うアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:02:17 GMT)
Complete Implementation of WXF Chinese Chess Rules [0.3] 本稿では,WXFマニュアルに見られる110例すべてにおいて,WXFルールを正しく決定するための完全アルゴリズムを提案する。
プログラムの正しさを損なうことなく繰り返し処理を高速化するための新しい最適化をいくつか導入する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:56:50 GMT)
Nonparametric Instrumental Variable Regression through Stochastic Approximate Gradients [0.3] 集団リスクを直接最小化することにより,NPIV回帰に対処するための関数勾配降下アルゴリズムの定式化方法を示す。
我々は,過大なリスクに対するバウンダリの形で理論的支援を行い,提案手法の優れた安定性と競争性能を示す数値実験を行った。
このアルゴリズムは、ニューラルネットワークやカーネルベースの手法のような柔軟な推定器の選択と、非二次的損失関数を可能にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:56:11 GMT)
Improving Sickle Cell Disease Classification: A Fusion of Conventional Classifiers, Segmented Images, and Convolutional Neural Networks [0.3] 本稿では, 従来の分類器, セグメント化画像, CNNを併用して, 病原細胞疾患の自動分類を行う手法を提案する。
以上の結果から,SVMを用いたセグメント画像とCNN機能を用いることで96.80%の精度が得られた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:42:15 GMT)
Dynamic Scheduling Strategies for Resource Optimization in Computing Environments [0.3] 本稿では,資源利用,負荷分散,タスク完了効率といった重要な性能指標のバランスをとることを目的とした,多目的最適化に基づくコンテナスケジューリング手法を提案する。
実験の結果, 従来の静的ルールアルゴリズムや効率アルゴリズムと比較して, 資源利用, 負荷分散, バーストタスク完了において, 最適化されたスケジューリング方式が有益であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:43:17 GMT)
Is ChatGPT Massively Used by Students Nowadays? A Survey on the Use of Large Language Models such as ChatGPT in Educational Settings [0.3] 本研究では,フランスとイタリアで13歳から25歳までの395人の学生を対象に,Large Language Models(LLM)を教育ルーチンに統合する方法について検討した。
主な発見は、すべての年齢グループと規律でこれらのツールが広く使われていることである。
結果はまた、ジェンダー格差を示し、新興のAIリテラシーと技術的男女格差に関する懸念を提起している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:29:44 GMT)
SoK: The Design Paradigm of Safe and Secure Defaults [0.3] セキュリティエンジニアリングでは、安全でセキュアなデフォルトを好むように指示する、よく知られた設計パラダイムがあります。
本稿では,このパラダイムの知識の体系化を,体系的なマッピング研究と関連する文献のスコーピングレビューを用いて提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:48:04 GMT)
Towards structure-preserving quantum encodings [0.2] 量子コンピュータは、機械学習タスクに量子コンピュータの潜在的な計算上の利点を利用することができる。
このようなエンコーディングの選択は、あるタスクから別のタスクへと大きく異なり、構造がそれらの設計と実装に関する洞察を与えているケースはわずかである。
本稿では、カテゴリ理論が、データセットや学習タスクに固有の構造を尊重するエンコーディングを解析するための自然な数学的枠組みを提供するという視点を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:32:08 GMT)
Towards Cognitive Service Delivery on B5G through AIaaS Architecture [0.2] 4Gから5Gへの移行は、ビジネス分野に向けたネットワークの統合において、AIに重大な意味を持つ。
本稿では,AI能力B5Gと6Gでコアネットワークをさらに強化するために必要なインターフェースを提示するNWDAFの進化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:30:29 GMT)
CiteBART: Learning to Generate Citations for Local Citation Recommendation [0.1] 本稿では,局所的引用レコメンデーション(LCR)を実現するために,引用トークンマスキングに基づくカスタムBART事前トレーニングであるCiteBARTを提案する。
ベーススキームでは、局所的な引用コンテキストにおける引用トークンをマスクして、引用予測を行う。
グローバルな意味では、論文のタイトルを再構築し、ローカルな引用コンテキストに抽象化し、引用トークンを学ぶ。
この効果は、例えばRefseerやArXivのようなより大きなベンチマークにおいて重要である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:58:30 GMT)
Variational Sequential Optimal Experimental Design using Reinforcement Learning [0.0] 対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。
我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:56:29 GMT)
Variational Quantum Simulation of Anyonic Chains [0.0] 任意の音速鎖は、2つの時空次元における豊富な場の量子論の格子実現を提供する。
説明された量子シミュレーションスキームは、量子場理論の大きなファミリーを生み出すための体系的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:39:28 GMT)
Ultrashort-pulse-pumped, single-mode type-0 squeezers in lithium niobate nanophotonics [0.0] 超短パルス型0相整合光パラメトリック増幅器の設計原理を述べる。
我々の研究は、超高速な量子情報処理と量子センシングアプリケーションのための大規模回路のための有望な道を開く。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:39:31 GMT)
Transporting, splitting, and connecting spin singlet pairs in a topological pump [0.0] 光格子中にフェルミオンカリウム-40原子の2つの磁性状態のスピン一重項対を作る。
我々は,50以上の格子点に対して99.78(3)%の単一シフト忠実度を持つペアポンピングを実現し,このペアを非コヒーレンスな部分空間に分割する。
我々の研究は、絡み合いの複雑なパターンを作り、量子処理、センシング、原子干渉計への新しいアプローチを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:31:49 GMT)
Trading Devil RL: Backdoor attack via Stock market, Bayesian Optimization and Reinforcement Learning [0.0] データ中毒のみに焦点を当てたバックドア攻撃を提案する。
この特定のバックドア攻撃は、事前の考慮やトリガーなしに攻撃として分類され、ファイナンスLLMsBackRLと命名する。
本研究の目的は,テキスト生成や音声認識,ファイナンス,物理,現代人工知能モデルのエコシステムに強化学習システムを利用する大規模言語モデルの有効性を検討することである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:04:46 GMT)
TrIM, Triangular Input Movement Systolic Array for Convolutional Neural Networks: Dataflow and Analytical Modelling [0.0] 畳み込みニューラルネットワーク(CNN)はフォン・ノイマンのボトルネックに影響を受けやすい。
このボトルネックは、処理コアとメモリ間でデータを移動する際のエネルギーコストに関連している。
TrIMは、三角入力運動に基づくSystolic Arraysのための新しいデータフローであり、CNNコンピューティングと互換性がある。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:15:28 GMT)
Towards An Automated AI Act FRIA Tool That Can Reuse GDPR's DPIA [0.0] AI法は、EU委員会に対して、基本権利影響評価プロセスをサポートする自動化ツールを作成することを要求する。
本稿では、自動ツール作成を可能にする情報プロセスとして、DPIAとFRIAを新たに探求する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:46:55 GMT)
Topology and Spectrum in Measurement-Induced Phase Transitions [0.0] 観測された量子系における位相位相は、そのスペクトルと多体位相不変量により特徴づける。
我々の研究は、トポロジカル位相のバルクエッジ対応を平衡から観測された量子力学へ拡張する道を開く。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:19:06 GMT)
Topological phases of unitary dynamics: Classification in Clifford category [0.0] 量子セルオートマトン (QCA) あるいは因果ユニタリ (Cousal Unitary) は、定義によって局所作用素代数の自己同型である。
クリフォード QCA は、任意のパウリ作用素をパウリ作用素の有限テンソル積に写像するものである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:58:01 GMT)
Topological edge states at Floquet quantum criticality [0.0] 位相的位相境界における位相的に保護されたエッジ状態は、位相的状態がバルクエネルギーギャップと関連付けられなければならないという従来の信念に挑戦する。
周期的に駆動される(フロケット)系は、異常に複雑な位相位相境界を持つため、そのようなフロケット量子臨界度において位相的エッジ状態は有益である。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:27:09 GMT)
Three-Class Text Sentiment Analysis Based on LSTM [0.0] 本稿では,Long Short-Term Memory (LSTM) ネットワークを用いたWeiboコメントの3クラス感情分類手法を提案する。
実験の結果、優れた性能を示し、精度は98.31%、F1スコアは98.28%に達した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:21:07 GMT)
Theory of Quantum Circuits with Abelian Symmetries [0.0] 大域対称性を尊重するジェネリックユニタリは、同じ対称性を尊重するゲートを使って、概して実現できない。
相互作用の局所性は依然として実現可能なユニタリに追加の制約を課すが、ある制約はアベリア対称性を持つ回路には適用されない。
この結果は、グローバルな非アベリア対称性が、アベリア対称性の下では不可能な方法で量子系の熱化に影響を及ぼす可能性を示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:47:54 GMT)
The inherent goodness of well educated intelligence [0.0] 本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。
インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 04:12:30 GMT)
The Wehrl-type entropy conjecture for symmetric $SU(N)$ coherent states: cases of equality and stability [0.0] 対称$SU(N)$表現に対して、対応するWehrl型エントロピーはコヒーレント状態によって最小化されることを示す。
リーブとソロヴェイによる境界の鋭い定量的形式も証明されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:49:29 GMT)
Tensor-Based Foundations of Ordinary Least Squares and Neural Network Regression Models [0.0] 本稿では,通常の最小二乗モデルとニューラルネットワーク回帰モデルの数学的発展に対する新しいアプローチを紹介する。
解析と基本的な行列計算を活用することにより、両方のモデルの理論的基礎は慎重に詳細化され、完全なアルゴリズム形式に拡張される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:11:01 GMT)
Surveillance Capitalism Revealed: Tracing The Hidden World Of Web Data Collection [0.0] 本研究では,Webナビゲーションと検索における個人データ転送に着目し,サーベイランス資本主義のメカニズムを考察する。
データ収集の実践の具体的な証拠を提示し、データ保護と透明性を高めるための戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:55:20 GMT)
Spectroscopic footprints of quantum friction in nonreciprocal and chiral media [0.0] 平面界面に平行な一定の速度で移動する偏光性原子が経験する量子摩擦は、後者がキラル媒質または非相反媒質からなるときにどのように変化するかを検討する。
我々は,速度依存性のカシミール・ポルダー周波数シフトと崩壊速度を得るために,マクロ量子電磁力学を用いた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:39:10 GMT)
Solving The Travelling Salesman Problem Using A Single Qubit [0.0] トラベルセールスマン問題(TSP)はNP-ハード組合せ最適化問題として人気がある。
本稿では,量子並列性(quantum parallelism)の原理を導出し,単一量子ビットを用いて任意のTSPを解くアルゴリズムを提案する。
我々のアルゴリズムの基盤となるフレームワークは、古典的ブラキストクロンのアプローチの量子バージョンである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:35:45 GMT)
SoK: Liquid Staking Tokens (LSTs) and Emerging Trends in Restaking [0.0] 分散ファイナンス(DeFi)における最近のイノベーションを振り返って
Liquid Stake Tokens(LST)は、Proof-of-Stake(PoS)ブロックチェーン上のステンドトークンのトークン化表現である。
Restakeはこのコンセプトに基づいて、ステンドトークンやLST、あるいはネイティブのBitcoinトークンが追加のプロトコルやPoSチェーンを保護し、追加的な報酬を得られるようにしている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:17:41 GMT)
Simulating lossy and partially distinguishable quantum optical circuits: theory, algorithms and applications to experiment validation and state preparation [0.0] 我々は,光子数分布の計算が指数時間で可能であることを証明し,高速化を実現する。
その結果,Fock と Gaussian のボーソンサンプリングの検証試験において,大幅な高速化と精度の向上が得られた。
彼らはリアルなフォトニック回路のより効率的なシミュレーションへの道を開いた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:45:37 GMT)
Sensitivity-Adapted Closed-Loop Optimization for High-Fidelity Controlled-Z Gates in Superconducting Qubits [0.0] 7つのパラメータで定義した64ns長フーリエ系列パルスを用いて99.9%の制御Zゲート忠実度が得られることを示す。
この手法は超伝導量子プロセッサのチューニングと再校正に利用できる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:20:48 GMT)
Security and Privacy in Virtual Reality: A Literature Survey [0.0] 私たちは、VRプライバシとセキュリティの最先端を探究し、潜在的な問題と脅威を分類し、特定された脅威の原因と影響を分析します。
本研究は、VRにおける認証分野において以前に行われた研究に焦点をあてる。
また、サイバーセキュリティの分野におけるVRの他の興味深い利用、例えば、サイバーセキュリティを教えたり、セキュリティソリューションのユーザビリティを評価するためにVRを使用することについても概説する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:19:27 GMT)
Resource-Aware Arabic LLM Creation: Model Adaptation, Integration, and Multi-Domain Testing [0.0] 本稿では,4GB VRAMしか持たないシステム上で,量子化低ランク適応(QLoRA)を用いたアラビア語処理のためのQwen2-1.5Bモデルを微調整する新しい手法を提案する。
Bactrian、OpenAssistant、Wikipedia Arabic corporaなどの多様なデータセットを使用して、この大きな言語モデルをアラビア語領域に適応する過程を詳述する。
1万以上のトレーニングステップの実験結果は、最終的な損失が0.1083に収束するなど、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:08:48 GMT)
Reinforcement Learning with a Focus on Adjusting Policies to Reach Targets [0.0] 本稿では,期待したリターンを最大化することよりも,期待レベルを達成することを優先する,新しい深層強化学習手法を提案する。
その結果,本手法は探索範囲を柔軟に調整し,非定常環境に適応できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:16:47 GMT)
Reassessing quantum-thermodynamic enhancements in continuous thermal machines [0.0] コヒーレンス(コヒーレンス)は、熱力学的タスクを実行する量子システムの運用能力に影響を与えることが示されている。
熱貯水池や作業源と弱い相互作用を持つ定常量子熱機械の場合、摂動によって引き起こされるコヒーレンスの存在は、真の熱力学的優位性を保証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:03:28 GMT)
Randomized Approach to Matrix Completion: Applications in Recommendation Systems and Image Inpainting [0.0] 提案手法では,カラムサブセット選択と低ランク行列補完を組み合わせることで,不完全なデータセットを再構成する。
CSMCを実装した2つのアルゴリズムを導入する。
この結果から,CSMCは最先端の行列補完アルゴリズムに匹敵するソリューションを提供することがわかった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:58:47 GMT)
Random Circuits in the Black Hole Interior [0.0] ブラックホール内部の虫穴の幾何学的長さとランダム性の顕微鏡的測定値との間には,定量的なホログラフィー的関係が認められた。
半古典的双対がアインシュタイン・ローゼン核子を含むブラックホールの状態のアンサンブルをランダム回路で作成する。
指数的に長い回路時間では、ERカタピラーのアンサンブルはブラックホールのランダムな状態の集まりと区別できない。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:24:51 GMT)
Quantum simulation of Burgers turbulence: Nonlinear transformation and direct evaluation of statistical quantities [0.0] 量子コンピュータを用いて、バーガース方程式のような流体力学の非線形方程式を解くことは依然として困難である。
本稿では,バーガース方程式を解くための新しい量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:17:26 GMT)
Quantum Time-Series Learning with Evolutionary Algorithms [0.0] 変分量子回路は量子コンピューティングにおいて重要な方法である。
本稿では,このような最適化のための進化的アルゴリズムの利用,特に時系列予測について検討する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:53:35 GMT)
Quantum Simulation for Dynamical Transition Rates in Open Quantum Systems [0.0] マルコフ開量子系における動的遷移率を計算するための,新しい,効率的な量子シミュレーション手法を提案する。
我々の新しいアプローチは、現在の量子化学研究のボトルネックを超える可能性を秘めている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 02:53:05 GMT)
Quantum Phase Estimation by Compressed Sensing [0.0] 圧縮センシングに基づく初期量子コンピュータのための新しいハイゼンベルク制限量子位相推定アルゴリズムを提案する。
我々のアルゴリズムは、合計ランタイム$mathcalO(epsilon-1textpolylog(epsilon-1))$で周波数を復元することができる。
また、より一般的な量子固有値推定問題(QEEP)を考察し、オフグリッド圧縮センシングがQEEPの解決の有力な候補であることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:49:08 GMT)
Quantum Phase Diagram of the Bilayer Kitaev-Heisenberg Model [0.0] 二層ハニカム格子上の北エフ・ハイゼンベルク模型の基底状態相図について検討した。
我々は、様々な磁気秩序相を超えて、2つの拡張量子スピン液体相が、北エフ限界の近傍で起こることを発見した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:53:01 GMT)
Quantum Gravity Signature in a Thermodynamic Observable [0.0] テーブルトップ設定における重力の量子的記述に関する経験的証拠を得るための実験は、量子情報シグネチャの検出に焦点を当てた。
重力の量子化は、マクロ的、熱力学的な量の測定によって推測できる別の方法を探究する。
ボース気体の熱容量における古典的重力相互作用の予測と量子重力相互作用の明確な区別を見いだす。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:28:10 GMT)
Quantum Approximate Optimisation Applied to Graph Similarity [0.0] 本稿では,QAOAのすべての構成成分の探索を容易にする新しい量子最適化シミュレーションパッケージを提案する。
6段階の分解レベルで8つの古典的最適化手法について検討する。
QAOAとエッジの重複によるグラフ類似性のような置換に基づく問題の符号化は、量子メモリの大幅な節約を可能にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:04:08 GMT)
QKD protected fiber-based infrastructure for time dissemination [0.0] 提案手法は、2つの光ファイバー接続された位置間でセキュアかつ正確な信号の拡散を可能にする。
このセキュアな交換により、離れたクロックの同期のために、2つのパーティ間で時間情報の秘密共有が可能になる。
暗号化されると、時間信号は同期状態に関する有用な情報を持たない第三者に公開され、2桁の時間安定性が著しく悪化する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:28:39 GMT)
Q-LIME $π$: A Quantum-Inspired Extension to LIME [0.0] Local Interpretable Model-Agnostic Explanations (LIME)は、機能を摂動させ、モデルの出力への影響を測定することで、この問題に対処する。
量子状態のバイナリ特徴ベクトルを符号化するLIMEの量子化拡張である textbfQ-LIME $pi$ (Quantum LIME $pi$) を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 00:20:11 GMT)
Python Fuzzing for Trustworthy Machine Learning Frameworks [0.0] 我々はSydr-Fuzzを用いたPythonプロジェクトの動的解析パイプラインを提案する。
私たちのパイプラインにはファジング、コーパスの最小化、クラッシュトリアージ、カバレッジ収集が含まれています。
機械学習フレームワークの最も脆弱な部分を特定するために、攻撃の潜在的な表面を分析し、PyTorchのファズターゲットとh5pyなどの関連プロジェクトを開発する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:23:54 GMT)
Pretraining with random noise for uncertainty calibration [0.0] 本研究では,発達神経科学に触発された事前学習法により,不確実性の校正が効果的に達成できることを実証する。
ランダムにトレーニングされていないネットワークは、誤って高い信頼性を示す傾向があるが、ランダムノイズによる事前トレーニングは、これらのネットワークを効果的に校正する。
その結果、ランダムノイズで事前訓練されたネットワークは最適なキャリブレーションを示し、その信頼性はその後のデータトレーニングを通して正確さと密接に一致している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:22:00 GMT)
Power-optimized amplitude modulation for robust trapped-ion entangling gates: a study of gate-timing errors [0.0] 振幅変調 (AM) は、Molmer-Sorensen (MS) プロトコルのよく研究された拡張である。
本稿では,レーザー振幅関数の一般性を維持するためにフーリエ級数展開を用いたAMの解析的研究を行う。
次に、この一般AM法をこれらのフーリエ係数に条件を課すことによりゲート位置誤差に適用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:49:30 GMT)
Postmeasurement information and nonlocality of quantum state discrimination [0.0] 量子状態の識別において、非局所性は、局所的な操作や古典的な通信によって最適な状態の識別が実現できないときに生じる。
量子状態判別における非局所性の消滅や生成は、後処理情報によって提供されるサブアンサンブルの選択に依存することを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:53:32 GMT)
PointVoxelFormer -- Reviving point cloud networks for 3D medical imaging [0.0] 点雲は、医療画像における体積データを表現するための非常に効率的な方法である。
それらの利点にもかかわらず、ポイントクラウドは、ボリューム3D CNNやビジョントランスフォーマーと比較して、医療画像においてまだ過小評価されている。
この研究は、ポイントワイズ演算と中間微分可能化と高密度局所化CNNを組み合わせたハイブリッドアプローチを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 08:43:39 GMT)
One-Time Signature Based on Pseudorandom Number Generator [0.0] ハッシュ関数は擬似乱数生成器(PRNG)に広く応用されている
本研究では,ワンタイムシグネチャ(OTS)アプリケーションに適したPRNGをベースとしたDSAを改良したアプローチを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:36:42 GMT)
On the exact solution for the Schrödinger equation [0.0] 約75年間、シュル・オーディンガー方程式の一般解は指数あるいは時間順序指数によって生成されると仮定された。
基礎空間が$L2(mathbbR)$であるという仮定に基づいていない新しい方法論を提供する。
我々の考察は、シュル「オーディンガー」方程式とリウヴィル方程式が、実際には、同じコインの2つの側面であり、共に量子系に対する統一的な記述を提供することを示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:14:18 GMT)
On computing quantum waves and spin from classical action [0.0] 量子物理学のシュル・オーディンガー方程式は、古典的ハミルトン・ヤコビ最小作用方程式の一般化形式を用いて解析的に解けることを示す。
多値最小作用と古典的位置力学の流体密度$rho$とを組み合わせることで、正確な写像を構築することができることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:12:41 GMT)
Nonlinear semiclassical spectroscopy of ultrafast molecular polariton dynamics [0.0] 分子偏光子の超高速非線形応答の体系的かつ効率的な記述を可能にする理論的枠組みを導入する。
我々のアプローチは、分子ハミルトニアンと空洞場の半古典的平均場進化に基づいている。
パルスを格納することで、空洞が自由空間では不可能な追加の励起経路を促進することを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:30:39 GMT)
No quantum advantage for violating fixed-order inequalities? [0.0] 我々は、$k$サイクルの不等式について研究し、これらの不等式に合わせた量子スイッチの多項一般化を導入する。
一方、これは、この制限の下で$k$-cycleの不等式に違反するには、非因果的な設定が必要であることを意味する。
一方、$k$-cycleの不等式は、固定順序の不等式の1つの例であるから、このことは、デバイスに依存しない量子スイッチの独立な認証の可能性を再開放する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:19:13 GMT)
Multiphoton ionization distributions beyond the dipole approximation: Retardation versus recoil corrections [0.0] 本研究では,2次元水素様原子のイオン化における非双極子効果について,強度の異なるフラットトップレーザーパルスを用いて検討した。
エネルギー-角光電子分布の方向依存性を数値的に示す。
レーザー磁場の空間依存性と時間依存性から生じる遅延補正は、光電子エネルギースペクトルの小さな再シフトをもたらす。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:38:46 GMT)
Moving boundaries: An appreciation of John Hopfield [0.0] 2024年のノーベル物理学賞はジョン・ホップフィールドとジェフリー・ヒントンに授与された。
これはホップフィールドの研究、物理学の一部としての生物物理学の台頭への影響、そして彼の初期の論文から人工知能の近代的革命への道のりを簡潔に反映したものである。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:50:57 GMT)
More is Less? A Simulation-Based Approach to Dynamic Interactions between Biases in Multimodal Models [0.0] 本研究では,動的マルチモーダルバイアス相互作用を解析するためのシステム的枠組みを提案する。
MMBiasデータセットを用いて、テキストのみ、画像のみ、マルチモーダル埋め込みのバイアススコアを計算するシミュレーションベースのアプローチを採用する。
フレームワークは、バイアス相互作用を増幅、緩和、中立として分類するために開発された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:04:28 GMT)
Modal division multiplexing of quantum and classical signals in few-mode fibers [0.0] テレコム波長における量子信号と古典信号の両方の変調多重化を実験的に検討した。
量子レベルでのランダムモードカップリングの存在を観察し、退化チャネルと非退化チャネルの両方でクロストークする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:51:01 GMT)
Memory makes computation universal, remember? [0.0] メモリは2つの基本的な能力を通じて普遍的な計算を可能にする。
ニューラルネットワークのような並列システムは,基本単位に制限があるにもかかわらず,普遍的な計算を実現する方法を示す。
我々の分析は、生物学的システム、人工知能、人間の認知における計算の理解を統一する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:51:46 GMT)
Measurement of the work statistics of an open quantum system using a quantum computer [0.0] 我々は、もともとクローズドシステムのために考案されたインターフェロメトリスキームを、オープンシステムケースに拡張し、超伝導量子コンピュータ上で実装する。
本手法は, システムバス化合物の物性を解析するための診断ツールとして有用であることを示す。
我々の実験は、インターフェロメトリスキースキームが任意の開量子系に対するジャージンスキー等式に対する長期の実験的検証を達成するための有望なツールであることを示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:40:05 GMT)
Machine learning for moduli space of genus two curves and an application to isogeny based cryptography [0.0] 機械学習を用いて、属の2つの曲線のモジュライ空間を研究する。
機械学習は属2曲線のモジュライ空間における算術的問題に対して高い信頼性を持つことを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:46:08 GMT)
MRANet: A Modified Residual Attention Networks for Lung and Colon Cancer Classification [0.0] 肺癌と大腸癌は、がんの死亡率に大きく寄与する。
異なる画像検出に画像技術を活用することで、学習モデルは癌分類の自動化において有望であることが示されている。
改良された注意ネットワークアーキテクチャに基づく新しいアプローチを提案する。
提案モデルの精度は99.30%,96.63%,97.56%であった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:31:45 GMT)
Learning from Summarized Data: Gaussian Process Regression with Sample Quasi-Likelihood [0.0] 本研究では,ガウス過程回帰の枠組みにおける要約データのみを用いた学習と推論に取り組む。
本稿では,要約データのみを用いた学習と推論を容易にするサンプル準類似概念を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:21:38 GMT)
LMV-RPA: Large Model Voting-based Robotic Process Automation [0.0] 本稿では,OCRを向上する大規模モデル投票型ロボットプロセス自動化システムであるLMV-RPAを紹介する。
LMV-RPAは、Paddle OCR、Tesseract OCR、Easy OCR、DocTRなどのOCRエンジンから出力を統合する。
OCRタスクの99%の精度を実現し、ベースラインモデルの94%を突破し、処理時間を80%削減した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:28:22 GMT)
Krylov spread complexity as holographic complexity beyond JT gravity [0.0] 量子ブラックホール物理学における重要な開問題のひとつは、ホログラフィック複雑性の提案の二重解釈である。
我々の研究は、最近の2重スケールSYKと正弦ディラトン重力の接続を利用して、クリロフ拡散複雑性と体積=体積の量的関係が有限温度とディスクレベルでの重力側の完全な量子状態に広がることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:43:35 GMT)
Interplay between dressed and strong-axial-field states in Nitrogen-Vacancy centers for quantum sensing and computation [0.0] ダイヤモンド中の窒素-原子核(NV)中心は、量子ラジオメトリー、センシング、計算に応用された興味深い電子スピンシステムである。
本報告では,NV中心アンサンブルにおいて,ひずみと弱磁場の存在下で自由誘導減衰(FID)の測定を行った。
単一FID測定における着衣状態と強軸磁場状態の非平衡重ね合わせの同時検出について述べる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:28:19 GMT)
Integrated Learning and Optimization for Congestion Management and Profit Maximization in Real-Time Electricity Market [0.0] 我々は,経済派遣(ED)と直流最適潮流(DCOPF)問題を解決するため,新たな統合学習・最適化手法を開発した。
提案手法は、負荷とPTDF予測を経済的な操作よりも正確に訓練する逐次学習と最適化(SLO)と比較する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:53:06 GMT)
Inspiring Women in Technology: Educational Pathways and Impact [0.0] メニナス++プロジェクトは高校と高等教育の両方で活動を調整する。
本研究は,コンピュータ教育における女子学生のインスピレーション,力づけ,維持に対するこれらの活動の意義を実証した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:17:38 GMT)
Incentivized Symbiosis: A Paradigm for Human-Agent Coevolution [0.0] 進化ゲーム理論は、協力を成功させるための構造とインセンティブを理解するためのレンズを提供する。
人工知能エージェントが人間のシステムに不可欠なものとなるにつれ、協力のダイナミクスは前例のない重要性を生んでいる。
Web3のような分散フレームワークは、人間とAIエージェントのための強制可能なルールとインセンティブを確立することによって協力を促進する基盤を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:41:34 GMT)
In Defence of Post-hoc Explainability [0.0] 我々は、科学AIにおけるポストホック解釈可能性の哲学的枠組みとして計算補間主義(CI)を紹介した。
ポストホック合理化が信頼性のあるパフォーマンスと共存する人間の専門知識と平行して描くことで、CIは経験的検証によって適切に拘束された場合、構造化されたモデル解釈を通じて科学的知識が生まれることを証明している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:22:03 GMT)
In Case You Missed It: ARC 'Challenge' Is Not That Challenging [0.0] ARC Challengeは、現代のLLMではARC Easyよりも難しいように見える。
同様の評価慣行が、他のベンチマークの赤字の原因を誤って示唆していることを示す。
私たちは、複数の選択評価が実際のモデル能力を正確に反映することを保証するガイドラインを提供します。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:14:36 GMT)
Improved Cotton Leaf Disease Classification Using Parameter-Efficient Deep Learning Framework [0.0] 綿花は「白金」と呼ばれ、重要な生産課題に直面している。
この課題に対処するために、ディープラーニングと機械学習の技術が研究されている。
我々はMobileNetからトレーニング可能なレイヤのサブセットを統合する革新的なディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:01:10 GMT)
IITR-CIOL@NLU of Devanagari Script Languages 2025: Multilingual Hate Speech Detection and Target Identification in Devanagari-Scripted Languages [0.0] 本研究は,デバナガリ文字言語におけるヘイトスピーチ検出とターゲット識別に関連する2つのサブタスクに焦点を当てた。
Subtask Bはヘイトスピーチをオンラインテキストで検出するが、Subtask Cはヘイトスピーチの特定のターゲットを特定する必要がある。
我々は、事前訓練された多言語変換モデル ia-multilingual-transliterated-roberta に基づいて構築されたディープニューラルネットワークであるMultilingualRobertaClass モデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:58:11 GMT)
HyperQ-Opt: Q-learning for Hyperparameter Optimization [0.0] 本稿では,HPOを逐次決定問題として定式化し,強化学習技術であるQ-ラーニングを活用することにより,HPOに対する新たな視点を示す。
これらのアプローチは、限られた試行数で最適または準最適構成を見つける能力について評価されている。
このパラダイムをポリシーベースの最適化にシフトすることで、スケーラブルで効率的な機械学習アプリケーションのためのHPOメソッドの進歩に寄与する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:22:34 GMT)
Homomorphic Encryption Based on Lattice Post-Quantum Cryptography [0.0] ホモモルフィック暗号法は量子コンピューティング攻撃に弱い。
本研究では,格子型ポスト量子同型暗号方式を提案する。
この発見は、同型暗号化アプリケーション開発者のためのリファレンスとして機能することを意図している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 05:30:44 GMT)
Higher-order topology protected by latent crystalline symmetries [0.0] 系の等スペクトル還元を行うと、潜在回転対称性が明らかになるのに十分である。
この研究は、トポロジカル結晶絶縁体の分類を拡張し、潜在対称性を含む。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:22:44 GMT)
HPCNeuroNet: A Neuromorphic Approach Merging SNN Temporal Dynamics with Transformer Attention for FPGA-based Particle Physics [0.0] HPCNeuroNetは粒子物理学に適したスパイキングニューラルネットワーク(SNN)、トランスフォーマー、高性能コンピューティングの先駆的な融合である。
HPCNeuroNetの中心には、SNNに固有のシーケンシャルダイナミズムと、Transformerのコンテキスト対応アテンション機能の統合がある。
素粒子物理学におけるSNN, Transformer, FPGAベースの高性能コンピューティングの組み合わせは, 重要な前進を示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:44:29 GMT)
Gröbner Basis Cryptanalysis of Ciminion and Hydra [0.0] CiminionとHydraは、最近導入された2つの対称鍵 Pseudo-Random- Functions for Multi-Party Computation である。
効率性のために、両プリミティブは2次置換をラウンドレベルで利用する。
システム問題解決に基づく攻撃がこれらのプリミティブに深刻な脅威をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:20:38 GMT)
Graph Neural Networks Are Evolutionary Algorithms [0.0] Graph Neural Evolution(GNE)は、グラフ内のノードとして個人をモデル化する新しい進化アルゴリズムである。
GNEは、GA、DE、CMA-ES、SDAES、RL-SHADEといった最先端のアルゴリズムを一貫して上回っている。
GNEはEAとGNNを結びつける概念的および数学的基盤を確立し、両方の分野に新たな視点を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:06:37 GMT)
Generalised second law beyond the semiclassical regime [0.0] 一般化された第二法則が半古典的極限を超える全ての順序に対して摂動重力を持つことを証明する。
我々の証明は代数的手法を用いており、ファウルクナーとスペランザの最近の研究に基づいている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 01:59:54 GMT)
Fault Detection and Identification Using a Novel Process Decomposition Algorithm for Distributed Process Monitoring [0.0] この研究は、相互作用する測定のプロセスブロックを決定する新しいアルゴリズムを導入する。
また、異なる断層の大きさをスケールする新しいコントリビューションマップも定義します。
提案手法は,最も洗練された集中型あるいは分散型の手法と同等の故障検出率を示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:18:25 GMT)
Fast generation of entanglement between coupled spins using optimization and deep learning methods [0.0] 本研究では,機械学習と最適化手法を用いて,最小時間で最大絡み合った状態を生成する。
我々は、先行研究のように、特定の極大絡み合った状態をターゲットにするのではなく、コンカレンスを最大化する制御を見つける。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:38:01 GMT)
Factuality or Fiction? Benchmarking Modern LLMs on Ambiguous QA with Citations [0.0] 質問回答(QA)タスクにおける最先端大言語モデル(LLM)の事実精度と引用性能を評価する。
以上の結果から,より大規模で最近のモデルでは,不明瞭な文脈において,少なくとも1つの正解を常に予測するが,複数の有効な解のケースを処理できないことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:55:19 GMT)
Evaluation of Bio-Inspired Models under Different Learning Settings For Energy Efficiency in Network Traffic Prediction [0.0] 本研究では,SNN(Spike Neural Networks)とESN(Reservoir Computing through Echo State Networks)の2つのバイオインスパイアモデルの可能性について検討した。
評価は予測性能とエネルギー効率の両方に焦点を当てている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:35:53 GMT)
Entropy Density Benchmarking of Near-Term Quantum Circuits [0.0] 本研究では,量子処理ユニットの性能を監視するためのベンチマークとして,エントロピー密度の蓄積について検討する。
解析手法、数値シミュレーション、およびプログラム可能な超伝導量子回路の実験の組み合わせを用いる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:01:09 GMT)
Enhanced Temporal Processing in Spiking Neural Networks for Static Object Detection Using 3D Convolutions [0.0] スパイキングニューラルネットワーク(英: Spiking Neural Networks、SNN)は、時間的情報を処理できるネットワークモデルである。
本稿では,SNNの時間情報処理能力の向上に焦点をあてる。
時間情報のSNN処理を改善するために,従来の2次元畳み込みを3次元畳み込みに置き換えることを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:32:26 GMT)
Enaction for QBists [0.0] QB主義(QBism)は、エージェントとの相互作用を通じて世界がどのように創造され、再生されるかの理論である。
アクション(英: Enaction)とは、エージェントが世界との相互作用によってどのように生成され、再現されるかの理論である。
これらのノートは、QBist物理学と活動的認知科学を統一することを目的としたより大きなプロジェクトへと進化した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:12:16 GMT)
Emoji Retrieval from Gibberish or Garbled Social Media Text: A Novel Methodology and A Case Study [0.0] 絵文字はソーシャルメディアプラットフォームで広く使われているが、騒々しいテキストや派手なテキストでしばしば失われる。
本稿では,ソーシャルメディア投稿中のニンブルテキストから絵文字を検索する3段階のリバースエンジニアリング手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:44:13 GMT)
Emergence of nonequilibrium Lieb excitations in periodically driven strongly interacting bosons [0.0] 強い周期駆動を受けるトンクス・ジラードボソンの気体の正確な非平衡スペクトル関数について検討した。
基礎となる写像されたフェルミオンがフロケ=フェルミ海を形成すると、非平衡リーブモードが出現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:06:21 GMT)
Efficient fine-tuning methodology of text embedding models for information retrieval: contrastive learning penalty (clp) [0.0] 本研究では,事前学習したテキスト埋め込みモデルの情報検索性能を向上させるために,効率的な微調整手法を提案する。
提案手法は,文書検索タスクにおける既存手法よりも大幅な性能向上を実現する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:55:22 GMT)
Efficacy of Full-Packet Encryption in Mitigating Protocol Detection for Evasive Virtual Private Networks [0.0] フルパケット暗号化(Full-packet encryption)は、現代の回避型仮想プライベートネットワーク(VPN)が、ネットワーク上のランダムノイズとしてトラフィックをゆがめることによって、検閲モデルからのプロトコルベースのフラグ付けを避けるために使用するテクニックである。
私は、完全に暗号化された回避VPNプロトコルであるAggressive Circumvention of Censorship(ACC)プロトコルに対して、機械学習ベースの分類モデルをいくつかテストしました。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:24:36 GMT)
Editing Implicit and Explicit Representations of Radiance Fields: A Survey [0.0] 本稿では,既存の作品を編集手法に基づいて分類する新たな分類法を提案する。
我々は、編集オプションと性能の観点から最先端のアプローチを比較した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:59:46 GMT)
Edge-AI for Agriculture: Lightweight Vision Models for Disease Detection in Resource-Limited Settings [0.0] 提案システムは,エッジデバイスへの展開に最適化された高度なオブジェクト検出,分類,セグメンテーションモデルを統合する。
本研究は, 精度, 計算効率, 一般化能力に着目し, 各種最先端モデルの性能を評価する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:48:50 GMT)
ERX: A Fast Real-Time Anomaly Detection Algorithm for Hyperspectral Line Scanning [0.0] 本稿では,これらの問題に対処するために,指数移動RXアルゴリズム(ERX)を提案する。
ラインスキャンカメラを使用する際の現実的な課題をよりよく評価するために、3つの大規模で複雑なデータセットが導入されている。
ERXは、最も多くの帯域を持つデータセットの次のベストアルゴリズムよりも9倍高速だった。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:33:41 GMT)
ERUPD -- English to Roman Urdu Parallel Dataset [0.0] ローマ・ウルドゥー(Roman Urdu)は、ウルドゥーのラテン文字対応言語である。
本研究では75,146対の文対からなる新しい並列データセットを作成する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:33:09 GMT)
Dynamic Multi-Agent Orchestration and Retrieval for Multi-Source Question-Answer Systems using Large Language Models [0.0] 本稿では,大規模言語モデル(LLM)検索におけるいくつかの高度な手法を組み合わせて,堅牢で多ソースな問合せシステムの開発を支援する手法を提案する。
この手法は、協調型マルチエージェントオーケストレーションと動的検索アプローチにより、多様なデータソースからの情報を統合するように設計されている。
提案手法は応答精度と妥当性を向上し,質問応答システムを開発するための汎用的でスケーラブルなフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:28:20 GMT)
Dynamic Moiré-like pattern in non-Hermitian Wannier-Stark ladder system [0.0] 非エルミティア・ワニエ・スタークはしご系の動的挙動について検討した。
線形外部場が存在する場合、エネルギー準位が磁場に敏感であることが分かる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 03:33:22 GMT)
Diagnosing electronic phases of matter using photonic correlation functions [0.0] 散乱光子の相関関数を計測することにより,電子系のスピン,電荷,トポロジカル秩序を探索できることを示す。
散乱光子の相関子から相関絶縁体への写像を構築する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:46:31 GMT)
Decomposed Quadratization: Efficient QUBO Formulation for Learning Bayesian Network [0.0] 目的関数で使用されるバイナリ変数の数を最小限にすることが不可欠である。
そこで本研究では,従来の二次化手法よりもビット容量に有利なQUBOの定式化を提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:06:43 GMT)
Dataset for Real-World Human Action Detection Using FMCW mmWave Radar [0.0] 人間の行動検出のためのベースライン結果を用いた実世界のmmWaveレーダデータセットを提案する。
プライバシ保存型mmWaveレーダセンサを用いたヒューマンアクション検出は、医療やホームオートメーションへの応用について研究されている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:30:28 GMT)
Data-driven Modeling of Parameterized Nonlinear Fluid Dynamical Systems with a Dynamics-embedded Conditional Generative Adversarial Network [0.0] 本稿では,動的生成条件付きGAN(Dyn-cGAN)を代理モデルとして,パラメータ化非線形流体力学系を正確に予測する。
学習したDyn-cGANモデルはシステムの流れ場を正確に予測するためにシステムパラメータを考慮に入れている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:50:20 GMT)
Correlation hypergraph: a new representation of a quantum marginal independence pattern [0.0] 我々は,ある相関ハイパーグラフに基づいて,境界独立のパターンを新たに表現する。
これらの相関ハイパーグラフは任意の量子系に一般化されることを示す。
ホログラフィーの文脈では、エントロピーベクトルの実現に必要条件を導出するためにこれらの手法を適用する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 22:29:14 GMT)
Contrato360 2.0: A Document and Database-Driven Question-Answer System using Large Language Models and Agents [0.0] 契約管理プロセスを支援するために設計されたQ&Aアプリケーションを提案する。
データは大きな言語モデル(LLM)によって処理され、正確で関連する回答を提供する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:54:28 GMT)
Contextual Backpropagation Loops: Amplifying Deep Reasoning with Iterative Top-Down Feedback [0.0] 中間表現を洗練させるためにトップダウンフィードバックを組み込んだ反復的なメカニズムとしてコンテキストバックプロパゲーションループ(CBL)を導入する。
我々の結果は、CBLが現代のディープラーニングアーキテクチャにそのような文脈推論を組み込むための、単純かつ強力な方法を提供することを示唆している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 17:36:51 GMT)
Comparative Analysis of Resource-Efficient CNN Architectures for Brain Tumor Classification [0.0] 本研究は,脳腫瘍分類のための有効かつ単純な畳み込みニューラルネットワーク(CNN)アーキテクチャと事前訓練されたResNet18とVGG16モデルの比較分析を行った。
カスタムCNNアーキテクチャは、複雑さが低いにもかかわらず、事前訓練されたResNet18とVGG16モデルとの競合性能を示している。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:40:32 GMT)
Comparative Analysis of Document-Level Embedding Methods for Similarity Scoring on Shakespeare Sonnets and Taylor Swift Lyrics [0.0] 本研究では,文書類似性評価のためのTF-IDF重み付け,Word2Vec埋め込み,BERT埋め込みの性能評価を行った。
TF-IDFの語彙重なりへの依存とWord2Vecの優越した意味的一般化を裏付けた。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 13:20:06 GMT)
Combinatorial Regularity for Relatively Perfect Discrete Morse Gradient Vector Fields of ReLU Neural Networks [0.0] ReLUニューラルネットワークは、正準多面体複体(canonical polyhedral complex)と呼ばれる入力空間を断片的に線形に分解する。
以前、ReLUニューラルネットワークが断片的に線形なモースであるかどうかが決定可能であることが判明した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 21:58:51 GMT)
Chaos in hyperscaling violating Lifshitz theories [0.0] 超スケーリング違反リフシッツ理論(電荷)における量子カオスの研究
本稿では、衝撃波解析による時間外順序相関器(OTOC)の詳細な計算について述べる。
また, エンタングルメントウェッジ再構成を用いてバタフライ速度(v_B$)を計算した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 14:03:55 GMT)
Causal Deep Learning [0.0] 逆因果質問は、マルチ線形投影アルゴリズムを実装するニューラルネットワークで対処される。
計算にスケーラブルな解に対しては、ブロック代数を利用してディープニューラルネットワークの集合を導出する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 16:48:28 GMT)
Carbon-based light emitting defects in different layers of hexagonal boron nitride [0.0] 2つのC型欠陥が室温で安定な三重項スピン状態を示すことを示す。
異なる層におけるC欠陥のゼロフォノン線(ZPL)エネルギーは16-2.2$ eVの範囲内にある。
また、典型的なフォノン複製パターンから逸脱する欠陥が発見され、hBNの黄色のエミッタにおける観測されたフォノン複製を説明できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:23:52 GMT)
Bivariate Matrix-valued Linear Regression (BMLR): Finite-sample performance under Identifiability and Sparsity Assumptions [0.0] 行列値線形回帰モデルでは, mathbbRn×p$の$T$応答$(Y_t)_t=1Tと, mathbbRm×q$の予測子$(X_t)_t=1Tを推定する。
最適化のない明示的な推定器を提案し、その性能を定量化するために非漸近収束率を確立する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 18:03:34 GMT)
Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse [0.0] 本稿では,エロティックなコンテンツ検出のためのポーランド語データセットであるforePLayを紹介する。
このデータセットは、曖昧さ、暴力、社会的受容不能な次元を含む多次元分類を含む24k以上の注釈付き文を特徴としている。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:58:18 GMT)
ArchComplete: Autoregressive 3D Architectural Design Generation with Hierarchical Diffusion-Based Upsampling [0.0] ArchCompleteは、密度の高いボクセルベースの3D生成パイプラインで、アーキテクチャのジオメトリとトポロジーの複雑さに対処するために開発された。
推定のために、パイプラインはまず643ドルという解像度でハウスモデルを自動回帰的に生成し、その後、ボクセルサイズが18textcm$という2563ドルという解像度に徐々に洗練する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:13:27 GMT)
An information theoretic limit to data amplification [0.0] Generative Adversarial Networks (GAN) はモンテカルロシミュレーション入力を用いてトレーニングされ、同じ問題に対してデータを生成するために使用される。
GANのためのNつのトレーニングイベントは、ゲインファクタGが1つ以上の生成イベントをもたらす可能性がある。
データの情報内容が変化しないまま、一つ以上のゲインが可能であることが示される。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 23:27:51 GMT)
An efficient search-and-score algorithm for ancestral graphs using multivariate information scores [0.0] 本稿では,2方向のエッジを含む祖先グラフのグリージー検索とスコアアルゴリズムを提案する。
計算効率を向上させるため、提案した2段階のアルゴリズムは、周辺ノードに限定した局所的な情報スコアに依存する。
この計算戦略は、最大2コライダーパスを含むAC接続サブセットからの情報提供に制限されているものの、ベンチマークデータセットの挑戦に対して最先端の因果探索法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 12:09:14 GMT)
An Experimental Evaluation of Japanese Tokenizers for Sentiment-Based Text Classification [0.0] 日本語テキストの感情に基づくテキスト分類のための前処理ステップとして,MeCab,Sudachi,SentencePieceの3つの一般的なトークン化ツールの性能について検討した。
我々は、TF-IDFベクトル化を用いて、従来の機械学習分類器であるマルチノードニーブベイズとロジスティック回帰の2つを評価する。
SentencePiece、TF-IDF、Logistic Regressionの組み合わせは、分類性能の点で他の選択肢よりも優れています。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 07:45:51 GMT)
An Adaptive Framework for Multi-View Clustering Leveraging Conditional Entropy Optimization [0.0] マルチビュークラスタリング(MVC)は、データから貴重な洞察を抽出する強力な手法として登場した。
既存のMVCメソッドは、ビュー間の一貫性と補完性を効果的に定量化するのに苦労しています。
本稿では,適応重み付けアルゴリズムとパラメータ分離深度モデルを統合する新しいフレームワークCE-MVCを提案する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:21:55 GMT)
Advantages of density in tensor network geometries for gradient based training [0.0] 近年、テンソルネットワークは機械学習での利用が増加している。
本稿では、異なるジオメトリを持つテンソルネットワークを訓練し、ランダムな量子状態を符号化し、密結合された構造がよりスパースな構造よりも優れた不完全性を達成することを確認する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 11:54:44 GMT)
Advances in Machine Learning Research Using Knowledge Graphs [0.0] この研究は、中国国家知識基盤(CNKI)データベースからCSSCIをインデクシングした文献をデータソースとして使用している。
CiteSpaceビジュアライゼーションソフトウェアを使用して,制度的コラボレーションやキーワード共起といった側面の知識グラフを描画する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 15:20:01 GMT)
Adaptive Signal Analysis for Automated Subsurface Defect Detection Using Impact Echo in Concrete Slabs [0.0] 本研究は,コンクリートスラブの地下欠陥発生領域を検出するための,新しい,自動化された,スケーラブルな手法を提案する。
このアプローチは、高度な信号処理、クラスタリング、および視覚分析を統合して、地下の異常を識別する。
結果は方法論の堅牢性を示し、最小限の偽陽性とほとんど欠陥のない欠陥発生領域を一貫して同定した。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:05:53 GMT)
Abrupt changes in the spectra of the Laplacian with constant complex magnetic field [0.0] ラプラス作用素のスペクトルを平面内の均一な複素磁場下で解析する。
磁場がゼロでない虚像成分を持つとき、スペクトルは複素平面全体を覆うように広がる。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 09:33:11 GMT)
A dynamical algebra of protocol-induced transformations on Dicke states [0.0] ディックは、量子ビットの置換の下で完全に対称であることは、重要なアルゴリズムと量子情報の応用の重要な要素であると述べている。
ディック状態を変えるための2つの単純なプロトコルを考える。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:10:16 GMT)
A Temporal Convolutional Network-based Approach for Network Intrusion Detection [0.0] 本研究では,ネットワークトラフィックデータの依存関係をキャプチャするために,拡張畳み込みを伴う残差ブロックアーキテクチャを特徴とする時間畳み込みネットワーク(TCN)モデルを提案する。
提案したモデルは96.72%の精度と0.0688の損失を達成し、1D CNN、CNN-LSTM、CNN-GRU、CNN-BiLSTM、CNN-GRU-LSTMモデルを上回った。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 10:19:29 GMT)
A Simple Scheme for Preparation of the Approximate Gottesman-Kitaev-Preskill States with Random Walk Mechanism [0.0] ランダムウォーク機構を用いて、近似GKP状態を作成するための簡単な光学的セットアップを提案する。
単一モードパルスレーザーの逆位置の符号化を考慮し、この考え方を実証する。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 06:45:55 GMT)
A Multimodal Fusion Framework for Bridge Defect Detection with Cross-Verification [0.0] 本稿では,橋梁欠陥の検出と解析のための多モード融合フレームワークを提案する。
非破壊的評価(NDE)技術と高度な画像処理を統合し、正確な構造評価を可能にする。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 20:33:34 GMT)
A Multimodal Emotion Recognition System: Integrating Facial Expressions, Body Movement, Speech, and Spoken Language [0.0] 本研究は,評価者を支援するための標準化された,客観的かつデータ駆動型ツールを提供するマルチモーダル感情認識システムを提案する。
このシステムは、表情、スピーチ、音声言語、身体の動きの分析の認識を統合し、人間の評価でしばしば見過ごされる微妙な感情的な手がかりを捉える。
論文参考訳(メタデータ) (Mon, 23 Dec 2024 19:00:34 GMT)