Fugu-MT: arxivの論文翻訳(概要)

Attack-in-the-Chain: Bootstrapping Large Language Models for Attacks Against Black-box Neural Ranking Models [111.6]
本稿では,アタック・イン・ザ・チェーン(Attack-in-the-Chain)という新しいランキングアタックフレームワークを紹介する。大型言語モデル(LLMs)とニューラルランキングモデル(NRMs)の相互作用をチェーン・オブ・ソートに基づいて追跡する。 2つのWeb検索ベンチマークによる実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:03:09 GMT)
On the Robustness of Generative Information Retrieval Models [103.6]
生成情報検索方法は、識別子を直接生成して文書を検索する。生成IRモデルのアウト・オブ・ディストリビューションの一般化、すなわち、そのようなモデルが新しい分布にどのように一般化されるかを評価することは重要である。我々は,検索問題におけるOODシナリオに焦点をあてる: (i)クエリのバリエーション, (ii)未知のクエリタイプ, (iii)未知のタスク, (iv)コーパス拡張。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:51:26 GMT)
MotionMap: Representing Multimodality in Human Pose Forecasting [98.3]
タスクを適切に配置するための代替パラダイムを提案する。最先端の手法はマルチモーダリティを予測するが、これは大量の予測をオーバーサンプリングする必要がある。マルチモーダリティのためのシンプルなヒートマップベースの表現であるMotionMapを用いて,これらの問題に対処する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:47:26 GMT)
TraceVLA: Visual Trace Prompting Enhances Spatial-Temporal Awareness for Generalist Robotic Policies [95.3]
VLAモデルの行動予測のための時空間認識を容易にするために,視覚的トレースプロンプトを導入する。我々は,これまでに収集した150Kロボット操作トラジェクトリのデータセットに基づいてOpenVLAを微調整し,新しいTraceVLAモデルを開発した。 4B Phi-3-Vision に基づくコンパクトな VLA モデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 23:12:26 GMT)
Symbolic Disentangled Representations for Images [83.9]
本稿では,ArSyD (Architecture for Disentanglement) を提案する。我々は,dSpritesおよびCLEVRデータセットのArSyDについて検討し,学習されたシンボル不絡み表現の包括的解析を行う。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:20:13 GMT)
Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization [77.4]
コンピュータビジョン(CV)は自然言語処理(NLP)で観測されるゼロショットタスクの一般化をまだ完全に達成していない本稿では,ゼロショットタスクの一般化において重要な障壁となる離散的・用語的タスク定義をCVが採用するという考えを考察する。我々の仮説は、これらの用語的定義により、以前に見いだされたタスクを真に理解せずに、ディープモデルは新しいタスクに一般化するのに苦労する、というものである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:06:59 GMT)
PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.0]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:44:29 GMT)
CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models [74.8]
改良されたストリーミング音声合成モデルCosyVoice 2を提案する。具体的には,音声トークンのコードブック利用を改善するために,有限スカラー量子化を導入する。我々は,様々な合成シナリオをサポートするために,チャンク対応因果フローマッチングモデルを開発した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:54:03 GMT)
Bootstrap Your Own Context Length [74.6]
長文言語モデルを学習するためのブートストラップ手法を提案する。提案したデータ合成ワークフローは、短いコンテキスト言語モデル、テキスト検索、文書収集のみを必要とする。我々は,オープンソースのLlama-3ファミリを用いて実験を行い,最大100万トークンまでコンテキスト長を拡張できることを実証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:08:54 GMT)
VLBiasBench: A Comprehensive Benchmark for Evaluating Bias in Large Vision-Language Model [72.1]
我々は、LVLM(Large Vision-Language Models)におけるバイアスを評価するベンチマークであるVLBiasBenchを紹介する。 VLBiasBenchは、年齢、障害ステータス、性別、国籍、身体的外観、人種、宗教、職業、社会経済ステータスを含む9つの異なる社会バイアスのカテゴリを含むデータセットと、人種x性別と人種x社会経済ステータスの2つの交叉バイアスのカテゴリを含む。 15のオープンソースモデルと2つの高度なクローズドソースモデルに対して広範な評価を行い、これらのモデルに存在するバイアスに関する新たな洞察を得る。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:31:14 GMT)
MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities [72.1]
異種モデルのパラメータ空間のギャップを埋めることを学ぶMergeNetを提案する。 MergeNetの中核となるメカニズムはパラメータアダプタにあり、ソースモデルの低ランクパラメータをクエリすることで動作する。 MergeNetは両方のモデルと共に学習され、我々のフレームワークは、現在のステージに関する知識を動的に転送し、適応することができます。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:32:27 GMT)
Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.4]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:01:48 GMT)
UNIC-Adapter: Unified Image-instruction Adapter with Multi-modal Transformer for Image Generation [64.8]
一つのフレームワーク内で制御可能な生成を統一するための新しいアプローチを提案する。具体的には,Multi-Modal-Diffusion Transformerアーキテクチャ上に構築された統合イメージインストラクションアダプタ(UNIC-Adapter)を提案する。 UNIC-Adapterは条件付き画像とタスク命令の両方を組み込んだマルチモーダル命令情報を効果的に抽出する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:19:02 GMT)
Token Highlighter: Inspecting and Mitigating Jailbreak Prompts for Large Language Models [61.9]
大規模言語モデル(LLM)は、ユーザクエリに対する応答を提供するために、ChatGPTなどのサービスに統合されつつある。本稿では,Token Highlighterという手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:15:50 GMT)
TINQ: Temporal Inconsistency Guided Blind Video Quality Assessment [61.8]
Blind Video Quality Assessment (BVQA)は、ユーザ生成コンテンツ(UGC)ビデオに対して活発に研究されている。最近の超解像(SR)技術はビデオに広く応用されている。連続するフレーム間の不規則性を指す時間的不整合は、映像品質に関係している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:43:41 GMT)
AI Flow [58.3]
AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:46:27 GMT)
See Further for Parameter Efficient Fine-tuning by Standing on the Shoulders of Decomposition [56.9]
パラメータ効率の細かいチューニング(PEFT)は、パラメータの選択したサブセットを最適化し、残りを固定し、計算とストレージのオーバーヘッドを大幅に削減することに焦点を当てている。分解の観点からそれらを分離することで、すべてのアプローチを統一する第一歩を踏み出します。本稿では,PEFT技術の性能向上を目的とした,単純かつ効果的なフレームワークとともに,新しい2つのPEFT手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:55:30 GMT)
Decoupled Video Generation with Chain of Training-free Diffusion Model Experts [54.4]
我々は、ビデオ生成をより簡単なサブタスクに分解する効率的なビデオ生成フレームワークである textbfConFiner を提案する。オフザシェルフ拡散モデルの専門家の鎖で高品質なビデオを生成することができ、それぞれが分離されたサブタスクを担当している。そしてConFiner-Longは、600フレームまでの高品質でコヒーレントなビデオを生成することができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:12:57 GMT)
Discriminative Image Generation with Diffusion Models for Zero-Shot Learning [53.4]
ゼロショット学習のための新たな識別画像生成フレームワークであるDIG-ZSLを提案する。我々は、事前学習されたカテゴリー識別モデル(CDM)の指導のもと、各未確認クラスの識別クラストークン(DCT)を学習する。本稿では,4つのデータセットに対する広範な実験と可視化を行い,(1)多彩で高品質な画像を生成すること,(2)最先端の非人間アノテーション型セマンティックプロトタイプ手法を大きなマージンで上回ること,(3)人間アノテーションを利用したベースラインよりも同等あるいは優れた性能を実現すること,の4つが示される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:57:49 GMT)
Adaptive Training Meets Progressive Scaling: Elevating Efficiency in Diffusion Models [52.2]
TDCトレーニングと呼ばれる新しい2段階分割型トレーニング戦略を提案する。タスクの類似性と難易度に基づいてタイムステップをグループ化し、高度にカスタマイズされた復調モデルを各グループに割り当て、拡散モデルの性能を向上させる。 2段階のトレーニングでは、各モデルを個別にトレーニングする必要がなくなるが、総トレーニングコストは、単一の統合されたデノナイジングモデルをトレーニングするよりもさらに低い。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:55:14 GMT)
DreamFit: Garment-Centric Human Generation via a Lightweight Anything-Dressing Encoder [51.1]
テキストや画像プロンプトから衣料中心の人間生成のための拡散モデルが注目されている。衣服中心の人間生成に適した軽量のAnything-Dressingを組み込んだDreamFitを提案する。我々のモデルは驚くほど多種多様な(非)着想、創造的なスタイル、命令のプロンプトを一般化し、常に高品質な結果をもたらす。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:36:24 GMT)
PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.8]
系統樹は種間の進化的関係を解明する。伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:33:05 GMT)
Methods for Convex $(L_0,L_1)$-Smooth Optimization: Clipping, Acceleration, and Adaptivity [50.3]
我々は、(強に)凸 $(L0)$-smooth 関数のクラスに焦点を当て、いくつかの既存のメソッドに対する新しい収束保証を導出する。特に,スムーズなグラディエント・クリッピングを有するグラディエント・ディフレッシュと,ポリアク・ステップサイズを有するグラディエント・ディフレッシュのコンバージェンス・レートの改善を導出した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:02:32 GMT)
ModelGrow: Continual Text-to-Video Pre-training with Model Expansion and Language Understanding Enhancement [49.5]
本研究は,テキスト・ビデオ・モデルの連続的な事前学習について考察する。私たちはこのタスクを、モデルのキャパシティの向上とセマンティック理解の改善という、2つの重要な側面に分割します。意味理解のために,大規模言語モデルを高度なテキストエンコーダとして活用する手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:58:07 GMT)
Seek and Solve Reasoning for Table Question Answering [49.0]
本稿では,タスク単純化時の推論プロセスが,タスク自体の単純化よりも有用であることを示す。本稿では,LLMにまず関連情報を求め,質問に答えるように指示するSeek-and-solving Pipelineを提案する。本稿では, SS-CoT経路を用いた実演を用いて, 複雑なTQA課題の解決にLLMを誘導する単一ステップTQA解決プロンプトをこのパイプラインから蒸留する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:57:52 GMT)
Large Language Model Simulator for Cold-Start Recommendation [45.3]
コールドアイテムはコンテンツ機能のみに依存し、レコメンデーションパフォーマンスを制限し、ユーザーエクスペリエンスと収益に影響を与える。現在のモデルは、コンテンツ機能から合成行動埋め込みを生成するが、主要な問題、すなわち過去の行動データがないことに対処できない。寒冷品のユーザインタラクションをシミュレートするために,大規模言語モデルを活用する LLM Simulator フレームワークを導入する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:38:33 GMT)
Musings About the Future of Search: A Return to the Past? [45.2]
質問がある場合、質問に答える最も効果的な方法は、トピックのエキスパートと直接接続することです。文章の発明以前は、これが唯一の方法であった。大規模言語モデルの出現により、ユーザが専門家に直接関与できるようにすることで、優れたエクスペリエンスを開発することが可能になった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:09:34 GMT)
How Propense Are Large Language Models at Producing Code Smells? A Benchmarking Study [45.1]
コードの臭いを生成するための大規模言語モデルの妥当性を評価するためのベンチマークであるCodeSmellEvalを紹介する。当社のベンチマークには、Propensity Smelly Score (PSC) と、メソッドレベルのコードの臭いを収集したデータセットであるCodeSmellDataが含まれている。 CodeSmellEvalの使用を実証するために,CodeLlamaとMistralの2つの最先端LLMを用いてケーススタディを行った。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 21:56:35 GMT)
Language-Guided Instance-Aware Domain-Adaptive Panoptic Segmentation [44.5]
汎視的ドメイン適応の鍵となる課題は、ラベル付きソースとラベルなしターゲットドメインの間のドメインギャップを減らすことである。我々は、新しいクロスドメイン混合戦略IMixによるインスタンスレベル適応の導入に重点を置いている。 LIDAPSと呼ばれる2つのメカニズムを組み込んだエンド・ツー・エンド・エンド・モデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 23:27:36 GMT)
Reasoning to Attend: Try to Understand How <SEG> Token Works [44.3]
我々は、$texttSEG>$ tokenが画像とテキストのペア内のセマンティックな類似性に寄与していることを示す。本稿では,高活性点の誘導の下で,LMMの高強度な$textbfREA$soning機能を実現するREADを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:19:44 GMT)
SWAG: Long-term Surgical Workflow Prediction with Generative-based Anticipation [44.0]
SWAG(Surgical Precipative Generation, SWAG)は, 位相認識と手術の長期予測のための統合された枠組みである。 SWAGは、単一パス(SP)と自己回帰(AR)の2つの生成復号法を用いて、将来の手術フェーズのシーケンスを予測する。新しい事前知識埋め込み機構は予測予測の精度を高める。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:29:57 GMT)
Sloth: scaling laws for LLM skills to predict multi-benchmark performance across families [43.4]
大規模言語モデルのスケーリング法則は、サイズやトレーニングデータといったパラメータに基づいてモデルパフォーマンスを予測する。我々は、公開されているベンチマークデータを活用する新しいスケーリング法則であるSkills Scaling Laws (SSLaws)を提案する。パラメータ同定と経験的評価について,12のベンチマークで理論的に検討した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:28:00 GMT)
DCIS: Efficient Length Extrapolation of LLMs via Divide-and-Conquer Scaling Factor Search [43.2]
トランスフォーマーアーキテクチャに基づく大規模言語モデル(LLM)は通常、トレーニングコストが高いため、コンテキスト長が制限される。最近の進歩は、RoPEのスケーリング係数と微調整を調整してコンテキストウィンドウを拡張している。本稿では,従来のスケーリング要素探索から切り離された,RoPEに基づくファインチューニングフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:42:22 GMT)
The Codecfake Dataset and Countermeasures for the Universally Detection of Deepfake Audio [42.8]
ALMベースのディープフェイクオーディオは、広範に広範に、高い騙しと、多目的性を示す。本研究では,ALMに基づくディープフェイク音声を効果的に検出するために,ALMに基づく音声生成手法のメカニズムに着目した。ドメインバランスと一般化されたミニマを学習するための CSAM 戦略を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:30:50 GMT)
Object-Centric Learning with Slot Mixture Module [42.5]
本研究はガウス混合モデルに基づく学習可能なクラスタリング手法を用いる。他のアプローチとは異なり、スロットはクラスタの中心としてだけでなく、クラスタと割り当てられたベクトル間の距離に関する情報も含んでいる。 Slot Attentionの代わりにこのアプローチを使用することで、オブジェクト中心のシナリオのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:21:47 GMT)
FedCFA: Alleviating Simpson's Paradox in Model Aggregation with Counterfactual Federated Learning [42.0]
フェデレートラーニング(FL)はデータプライバシと分散最適化のための有望な技術である。既存のFLメソッドは、クライアントをサーバモデルに合わせるか、クライアントモデルを制御変数に修正することで問題を解決しようとする。本稿では,FedCFAを提案する。FedCFAは,対実的学習を用いて対実的サンプルを生成する新しいFLフレームワークである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:35:54 GMT)
Baichuan Alignment Technical Report [42.0]
ベイチュアン・アライメント(Baichuan Alignment)は、ベイチュアン級数のモデルで用いられるアライメント手法の詳細な解析である。プロセスは、Prompt Augmentation System(PAS)、Supervised Fine-Tuning(SFT)、Preference Alignmentの3つの主要なステージにまたがる。 Baichuan-Instructはコア機能を大幅に改善し、ユーザエクスペリエンスは17%から28%に向上した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:40:01 GMT)
Improving Generated and Retrieved Knowledge Combination Through Zero-shot Generation [41.4]
オープンドメイン質問回答(QA)は,大規模言語モデル(LLM)による忠実に検索されたパスと関連するパスを組み合わせることで,かなりの関心を集めている。これらの知識の源と組み合わせるための明確なラベルが不足している。本稿では,検索したパスとLLM生成したパスの両方に対して,再格付け手法を利用したBi-Re rank for Merging Generated and Retrieved Knowledge (BRMGR)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:40:36 GMT)
Flexible categorization using formal concept analysis and Dempster-Shafer theory [40.3]
本稿では,外乱検出と分類のための機械学習メタアルゴリズムについて論じる。このフレームワークは、エンティティの集合の説明可能な分類を生成し、研究するための公式な基盤を提供する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:35:04 GMT)
Mean Aggregator is More Robust than Robust Aggregators under Label Poisoning Attacks on Distributed Heterogeneous Data [40.0]
我々は、ロバストなアグリゲーターは、ラベル中毒攻撃として知られる、弱いが実用的な悪意のある攻撃のクラスには保守的すぎることを示した。驚くべきことに、平均アグリゲータは理論上の最先端のロバストアグリゲータよりも堅牢であることを示すことができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 23:39:56 GMT)
Overview of MWE history, challenges, and horizons: standing at the 20th anniversary of the MWE workshop series via MWE-UD2024 [39.8]
第1回MWEワークショップの開催は2003年を皮切りに,MWE-UDとLREC-COING 2024が共同開催するMWE-UDの共同ワークショップが,過去20年近くにわたって開催されるMWEワークショップの20周年を記念した。このマイルストーンに立ち、このワークショップシリーズを振り返り、研究者が長年にわたって行ってきた研究トピックと方法論を要約します。我々はまた、私たちが直面している現在の課題と、CLおよびNLP分野におけるMWE研究のより広範な影響/エネルギーについても論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:00:27 GMT)
Adversarial Training for Graph Neural Networks via Graph Subspace Energy Optimization [39.7]
本稿では,GNNのトポロジー摂動に対する頑健性の指標として,グラフ部分空間エネルギー(GSE)の新たな概念を提案する。広範な実験により、AT-GSEは最先端のGNN敵の訓練方法よりも一貫して優れていたことが示されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:04:18 GMT)
TSDS: Data Selection for Task-Specific Model Finetuning [39.2]
タスク固有の微調整の有効性は、適切なトレーニングデータの選択に大きく依存する。本稿では,タスク固有のモデル微調整のためのデータ選択フレームワークであるTSDS(Task-Specific Data Selection)を提案する。提案手法で選択したデータを用いて,1%選択率で命令チューニングを行う場合,全データセットで処理性能が向上することを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:16:39 GMT)
AFANet: Adaptive Frequency-Aware Network for Weakly-Supervised Few-Shot Semantic Segmentation [38.0]
少ないショット学習は、いくつかのサンプルから学んだ事前知識を活用することで、新しい概念を認識することを目的としている。弱教師付き少数ショットセマンティックセマンティックセグメンテーションのための適応周波数認識ネットワーク(AFANet)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:42:31 GMT)
ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots [37.8]
本稿では,ChaI-TeA: CHat InTEraction Autocomplete; LLMに基づくインタラクションのための自動評価フレームワークを提案する。フレームワークにはタスクの正式な定義が含まれており、適切なデータセットとメトリクスが組み合わされている。フレームワークを使って、適切なデータセットとメトリクスと共にタスクを正式に定義した後、定義したオートコンプリートタスクで9つのモデルをテストします。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:26:52 GMT)
Constraint-Adaptive Policy Switching for Offline Safe Reinforcement Learning [37.7]
オフライン安全な強化学習(OSRL)は、一定のトレーニングデータから報酬を最大化するための意思決定ポリシーを学習する。本稿では,既存のオフラインRLアルゴリズムのラッパーフレームワークである制約適応ポリシースイッチング(CAPS)を導入する。 CAPSは既存の手法を一貫して上回り、OSRLの強力なラッパーベースのベースラインを確立する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:42:27 GMT)
Context-Based Semantic-Aware Alignment for Semi-Supervised Multi-Label Learning [37.1]
大規模な画像テキストペアで事前訓練された視覚言語モデルは、SSMLL設定下でのラベル付きデータ制限の課題を軽減することができる。 SSMLL問題を解くために,文脈に基づく意味認識アライメント手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:06:54 GMT)
Unveiling Uncertainty: A Deep Dive into Calibration and Performance of Multimodal Large Language Models [36.8]
MLLM(Multimodal large language model)は、画像キャプションや視覚的質問応答といったタスクの視覚的データとテキスト的データを組み合わせたモデルである。本稿では,MLLMの代表例について,様々なシナリオにおけるキャリブレーションに着目して検討する。その結果, キャリブレーションの相違は認められなかったが, キャリブレーションの相違は認められなかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:05:36 GMT)
Embodied Image Quality Assessment for Robotic Intelligence [36.8]
まず,画像品質評価(EIQA)フレームワークを提案する。我々は,ロボットの下流作業に基づく入力画像の評価基準を確立する。実験により、エンボディ画像の品質評価は人間と異なることが示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:29:22 GMT)
Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RL [36.7]
オフラインからオンラインへの強化学習(O2O)は、オンラインインタラクションの制限によって、パフォーマンスが急速に向上する。近年の研究では、特定のオフラインRL手法の微調整戦略を設計することが多く、任意のオフライン手法から一般のO2O学習を行うことはできない。この2つのミスマッチを同時に処理し,オフラインメソッドからオンラインメソッドへの一般的なO2O学習を実現することを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:52:22 GMT)
Scalable and Resource-Efficient Second-Order Federated Learning via Over-the-Air Aggregation [34.8]
スパースヘッセン推定を用いたスケーラブルな第2次フェデレーション学習アルゴリズムを提案する。シミュレーションの結果,他の1次および2次ベースラインと比較して67%以上の通信資源と省エネ効果が示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:13:14 GMT)
HV-BEV: Decoupling Horizontal and Vertical Feature Sampling for Multi-View 3D Object Detection [34.7]
HV-BEVは、BEVグリッドクエリのパラダイムにおける特徴サンプリングを水平特徴集約と垂直適応高さ対応基準点サンプリングに分離する新しいアプローチである。我々の最高のパフォーマンスモデルは、nuScenesテストセットで50.5%のmAPと59.8%のNDSを達成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:49:14 GMT)
The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment [33.3]
大規模言語モデル(LLMs)の出現は、人工超知能(ASI)の可能性を引き起こしている。 Superalignmentは2つの主要な目標 – 高品質なガイダンスシグナルを提供するための監視のスケーラビリティと、人間の価値との整合性を確保するための堅牢なガバナンス – に対処することを目指している。具体的には、ASIの概念、それらがもたらす課題、そしてスーパーアライメント問題に対処する際の現在のアライメントパラダイムの限界について検討する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:10:21 GMT)
Knowledge Editing with Dynamic Knowledge Graphs for Multi-Hop Question Answering [31.7]
MHQA(Multi-hop Question answering)は、大規模言語モデル(LLM)において重要な課題となる。知識編集は、LLMでMHQAの課題に対処する潜在的な解決策を提供する。ほとんどのパラメータ保存編集手法は、不正確な検索と二次的な編集の問題によって妨げられている。本稿では,MHQAの動的知識グラフを利用した知識編集手法であるKEDKGを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:52:33 GMT)
Defining and Detecting the Defects of the Large Language Model-based Autonomous Agents [31.1]
本研究は,LLMエージェントの欠陥の同定と検出に焦点を当てた最初の研究である。 StackOverflowから6,854件の関連記事を収集し分析し、8種類のエージェント欠陥を定義しました。以上の結果から,Agentableの総合精度は88.79%,リコール率は91.03%であった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:32:18 GMT)
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning [31.1]
大規模言語モデル(LLM)は大規模トレーニングにおいて重要な障害となっている。ローランド適応(LoRA)はこの問題を軽減するために提案されている。微調整作業におけるLoRAの層状特性について検討し、予期せぬが一貫した重みノルムの歪さを観察する。私たちはLayerwise Importance Sampled AdamW (LISA)と名付けた。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:03:23 GMT)
Adaptive Self-supervised Learning for Social Recommendations [30.8]
自己監視学習(SSL)は推奨分野において大きな注目を集めている。本稿では,社会推薦のための適応型自己指導型学習(AdasRec)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:47:39 GMT)
Follow-Your-MultiPose: Tuning-Free Multi-Character Text-to-Video Generation via Pose Guidance [29.8]
分離されたテキストをベースとした新しいマルチキャラクタ・ビデオ生成フレームワークを提案する。具体的には、まずポーズシーケンスから文字マスクを抽出し、各生成文字の空間的位置を識別し、各文字の単一プロンプトをLLMで取得する。ビデオ生成結果の可視化により,本手法の精度の高いマルチキャラクタ生成の可能性を示した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:41:58 GMT)
A Dual-Perspective Metaphor Detection Framework Using Large Language Models [29.2]
メタファ検出のための新しいデュアルパースペクティブフレームワークであるDMDを提案する。比喩理論の暗黙的および明示的な応用を利用して比喩検出においてLLMを導く。従来の手法と比較して、我々のフレームワークはより透過的な推論プロセスを提供し、より信頼性の高い予測を提供する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:49:27 GMT)
EvalMuse-40K: A Reliable and Fine-Grained Benchmark with Comprehensive Human Annotations for Text-to-Image Generation Model Evaluation [29.2]
本研究では,EvalMuse-40Kベンチマークにコントリビュートし,画像テキストアライメントに関連するタスクに対して,微粒な人間のアノテーションを用いた40K画像テキストペアを収集する。本稿では,T2Iモデルの画像テキストアライメント機能を評価するための2つの新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:00:36 GMT)
Cross-View Image Set Geo-Localization [29.1]
クロスビュージオローカライゼーション(CVGL)はロボットナビゲーションや拡張現実といった分野に広く応用されている。そこで我々は, 多様な視点で複数の画像を収集し, ローカライズのためのクエリセットとして, クロスビュー画像セットジオローカライズ(Set-CVGL)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:46:14 GMT)
Adaptive Rate Control for Deep Video Compression with Rate-Distortion Prediction [29.0]
本稿では,ディープビデオ圧縮のためのニューラルネットワークによる$lambda$ドメインレート制御手法を提案する。コンテンツ認識方式は、フレーム間の品質変動を緩和し、ビデオコンテンツの急激な変化に適応することができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:42:23 GMT)
Hierarchical Multi-Graphs Learning for Robust Group Re-Identification [28.8]
グループ再識別(G-ReID)は個々の再識別(ReID)よりも複雑である従来のグラフベースのアプローチは、群を単一の位相構造としてモデル化することで、これらのダイナミクスを捉えることを目的としていた。これらの課題に対処するために,階層型多グラフ学習フレームワークを導入する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:33:43 GMT)
Torque-Aware Momentum [28.7]
本稿では,新しい勾配と以前の運動量との角度に基づく減衰率を導入し,トレーニング中の更新方向を安定化させるTorque-Aware Momentum (TAM)を提案する。実験の結果,SGDとAdamの双方と組み合わせることができるTAMは探索性を高め,分散シフトをより効果的に扱えるようになり,様々なタスクにおける一般化性能が向上することがわかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:58:07 GMT)
ADC: Enhancing Function Calling Via Adversarial Datasets and Code Line-Level Feedback [27.2]
大規模言語モデル(LLM)は自然言語処理とコーディングにおいて大きな進歩を遂げているが、複雑な関数呼び出しの堅牢性と正確性に苦慮している。本稿では,LLMの関数形式を追従し,複雑なパラメータにマッチする能力を高める革新的なアプローチであるADCを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:23:11 GMT)
Agents4PLC: Automating Closed-loop PLC Code Generation and Verification in Industrial Control Systems using LLM-based Agents [27.1]
Agents4PLCは、PLCコード生成とコードレベルの検証を自動化する新しいフレームワークである。まず、検証可能なPLCコード生成領域のベンチマークを作成する。そして、自然言語の要件から、人間によって記述された形式仕様と参照PLCコードへ移行する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:54:02 GMT)
On the Universal Truthfulness Hyperplane Inside LLMs [27.0]
モデル内の事実的正確かつ誤った出力を区別する普遍真性超平面が存在するかどうかを考察する。その結果,トレーニングデータセットの多様性の向上が,すべてのシナリオのパフォーマンスを著しく向上させることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:20:23 GMT)
An Attentive Dual-Encoder Framework Leveraging Multimodal Visual and Semantic Information for Automatic OSAHS Diagnosis [26.7]
閉塞型睡眠時無呼吸症候群(英語:obstructive sleep apnea-hypopnea syndrome、OSAHS)は、上気道閉塞による一般的な睡眠障害であり、酸素欠乏と睡眠障害を引き起こす。顔画像解析を用いた既存のディープラーニング手法では、顔の特徴キャプチャが劣り、サンプルサイズが制限されていたため、精度が低かった。自動OSAHS診断のための視覚入力と言語入力を統合したマルチモーダルデュアルエンコーダモデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:42:17 GMT)
Enhancing Federated Graph Learning via Adaptive Fusion of Structural and Node Characteristics [26.6]
Federated Graph Learning (FGL)は、分散クライアント間でグローバルグラフニューラルネットワーク(GNN)モデルをトレーニングするメリットを実証した。本稿では,FedGCFという新しいFGLフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:20:06 GMT)
TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.1]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:07:04 GMT)
GameArena: Evaluating LLM Reasoning through Live Computer Games [25.4]
我々は,人間との対話型ゲームプレイを通じて,大規模言語モデル(LLM)推論能力を評価するベンチマークであるGameArenaを紹介する。 GameArenaは3つのゲームからなり、参加者を楽しませたりエンゲージメントしたりしながら、特定の推論能力(演能的推論や帰納的推論など)をテストする。我々は2000以上のゲームセッションを収集し、5つの最先端LCMに対して様々な推論能力の詳細な評価を行う。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:59:54 GMT)
Accelerating Diffusion Transformers with Dual Feature Caching [25.4]
拡散変換器(DiT)は画像およびビデオ生成において支配的な手法となっているが、依然としてかなりの計算コストを被っている。 DiTアクセラレーションの効果的なアプローチとして、機能キャッシング手法は、以前のタイムステップでDiTの特徴をキャッシュするように設計されている。以前のタイムステップでキャッシュされたすべての機能を積極的に再利用することで、世代品質が大幅に低下する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:00:14 GMT)
EC-Diffuser: Multi-Object Manipulation via Entity-Centric Behavior Generation [25.1]
高次元観測から物体を操作することを学ぶことは重要な課題である。最近のアプローチでは、大規模なオフラインデータを使用して、ピクセル観測からモデルをトレーニングしている。本稿では、オブジェクト中心の表現とエンティティ中心のトランスフォーマーを活用する新しい行動クローニング(BC)手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:50:15 GMT)
Interpretable Contrastive Monte Carlo Tree Search Reasoning [25.1]
大規模言語モデル(LLM)のための新しいモンテカルロ木探索法(MCTS)を提案する。 SC-MCTSは推論精度と速度の両方を著しく改善することを示した。我々は,Llama-3.1-70BとSC-MCTS*を用いたBlocksworldのマルチステップ推論データセットにおいて,平均17.4%でo1-miniを上回りました。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:32:54 GMT)
Enhanced Quantum Circuit Cutting Framework for Sampling Overhead Reduction [25.0]
ShotQCは、サンプリングオーバーヘッドを効果的に削減する拡張回路切断フレームワークである。これは、古典的な後処理の複雑さを増大させることなく、サンプリングオーバーヘッドを大幅に削減する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:26:58 GMT)
Advancing NAM-to-Speech Conversion with Novel Methods and the MultiNAM Dataset [24.9]
現在のNon-Audible Murmur (NAM)-to-speech技術は、ペアのささやきの音声をシミュレートするために音声のクローニングに依存している。我々は,音素レベルのアライメントをペアのささやきやテキストから学習することに集中し,テキスト・トゥ・スピーチ(TTS)システムを用いて地情をシミュレートする。我々はMultiNAMデータセットを7.96ドル以上のペアNAM、ささやき、ビデオ、テキストデータを2つのスピーカーからリリースし、このデータセットのすべてのメソッドをベンチマークします。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:57:24 GMT)
RI-MAE: Rotation-Invariant Masked AutoEncoders for Self-Supervised Point Cloud Representation Learning [24.5]
マスク付きポイントモデリング手法は,最近,ポイントクラウドデータの自己教師付き学習において大きな成功を収めている。これらの手法は回転に敏感であり、回転変動に遭遇するときにしばしば鋭い性能低下を示す。本稿では,2つの課題に対処するために,回転不変マスク付きオートエンコーダ(RI-MAE)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:07:41 GMT)
Explore the Potential of LLMs in Misinformation Detection: An Empirical Study [24.3]
大きな言語モデル(LLM)は、自然言語の理解と推論における強力な能力に対して大きな注目を集めている。本研究は,ソーシャルメディアプラットフォームにおけるコンテンツと伝播の両面について,複数のLDMの理解能力に関する先駆的な研究である。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:52:46 GMT)
MRI2Speech: Speech Synthesis from Articulatory Movements Recorded by Real-time MRI [23.5]
rtMRIからのテキスト予測にマルチモーダル自己教師型AV-HuBERTモデルを適用する新しい手法を提案する。予測されたテキストと期間は音声デコーダによって使用され、任意の新しい音声で一致した音声を合成する。提案手法はUSC-TIMIT MRIコーパス上で15.18%のワード誤り率(WER)を達成し,現状よりも大幅に改善されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:49:43 GMT)
TPCH: Tensor-interacted Projection and Cooperative Hashing for Multi-view Clustering [22.9]
実験の結果,TPCHは5つの大規模マルチビューデータセット上でのクラスタリングにおいて,最先端の手法よりも大幅に優れていた。 CPU時間の観点からは、TPCHは最も先進的な現在の手法と比較してかなり加速する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:22:11 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6]
本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:23:02 GMT)
Single Trajectory Distillation for Accelerating Image and Video Style Transfer [22.3]
拡散に基づくスタイリング手法は、通常、イメージ・ツー・イメージやビデオ・ツー・ビデオのタスクにおいて、特定の部分的なノイズ状態から逸脱する。特定部分雑音状態から始まる単一軌道蒸留(STD)を提案する。提案手法は,スタイルの類似性や美的評価の観点から,既存の加速度モデルを超えている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:40:23 GMT)
MixRec: Heterogeneous Graph Collaborative Filtering [22.0]
そこで本稿では,MixRecを用いたグラフ協調フィルタリングモデルを提案する。本モデルでは,意図的不整合とマルチビヘイビア・モデリングを取り入れてこれを実現している。また、自己教師付きデータ拡張の利点を適応的に探求する、新しいコントラスト学習パラダイムを導入する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:33:14 GMT)
Grid4D: 4D Decomposed Hash Encoding for High-Fidelity Dynamic Gaussian Splatting [21.5]
ガウススプラッティングに基づく動的シーンレンダリングモデルであるGrid4Dを提案する。低ランクの仮定を使わずに, 4Dエンコーディングを1つの空間的および3つの時間的3Dハッシュエンコーディングに分解する。我々の実験は、Grid4Dが視覚的品質とレンダリング速度において最先端のモデルよりも大幅に優れていることを示した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:25:56 GMT)
Efficiently serving large multimedia models using EPD Disaggregation [21.4]
本稿では,Encode-Prefill-Decode (EPD) Disaggregationを紹介した。本研究は,マルチモーダルスケールで資源効率の高い推論を可能にするために,EPDデアグリゲーションの可能性を明らかにするものである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:11:31 GMT)
HAND: Hierarchical Attention Network for Multi-Scale Handwritten Document Recognition and Layout Analysis [21.3]
手書き文書認識は、コンピュータビジョンにおいて最も難しいタスクの1つである。伝統的に、この問題は手書き文字認識とレイアウト解析という2つの別々のタスクとしてアプローチされてきた。本稿では,テキスト認識とレイアウト解析を同時に行うための,新しいエンドツーエンドおよびセグメンテーションフリーアーキテクチャであるHANDを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 20:36:29 GMT)
Dovetail: A CPU/GPU Heterogeneous Speculative Decoding for LLM inference [20.7]
Dovetailは、GPUにドラフトモデルをデプロイしてドラフトトークンを生成し、ターゲットモデルをCPU上で並列検証可能にするアプローチである。 Dovetailは3GBのVRAMを使用してLLaMA2-Chat-7Bで毎秒5.86トークンの推論速度を実現しており、CPUのみの推論よりも約2.77倍改善されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:45:18 GMT)
Explicit Relational Reasoning Network for Scene Text Detection [20.3]
後処理なしでコンポーネント関係をエレガントにモデル化するための明示的推論ネットワーク(ERRNet)を導入する。 ERRNetは、高い競争力を持つ推論速度を保持しながら、最先端の精度を一貫して達成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:28:33 GMT)
CGCOD: Class-Guided Camouflaged Object Detection [20.0]
カモフラーゲ型物体検出(COD)は、周囲とシームレスに融合した物体を識別するように設計されている。既存のCOD法は、しばしば視覚的特徴に依存しており、変更可能なカモフラージュ環境では十分に安定していない。我々は,従来のCODタスクを拡張したCG-COD(Class-Guided Camouflaged Object Detection)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:38:32 GMT)
Towards Global AI Inclusivity: A Large-Scale Multilingual Terminology Dataset [19.9]
GISTは2000年から2023年にかけての上位AIカンファレンス論文から抽出された5K語を含む、大規模な多言語AI用語データセットである。この用語はアラビア語、中国語、フランス語、日本語、ロシア語に翻訳され、LLMを抽出するためのハイブリッドフレームワークと翻訳のための人間の専門知識を組み合わせたものである。この研究は、AI用語リソースにおける重要なギャップに対処し、AI研究におけるグローバルな傾きとコラボレーションを促進することを目的としている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:20:11 GMT)
Efficient Point Transformer with Dynamic Token Aggregating for LiDAR Point Cloud Processing [19.7]
LiDARポイントクラウド処理と解析は、3Dトランスの開発によって大きな進歩を遂げた。既存の3Dトランスフォーマー法は通常、計算コストが高く、大きな注意マップと冗長な注意マップのために非効率である。ポイントクラウド表現と処理のための動的トークン集約(DTA-Former)を用いた効率的なポイントトランスフォーマーを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:20:14 GMT)
OmniPred: Language Models as Universal Regressors [19.6]
任意のフォーマットから$(x,y)$のデータに対して,言語モデルをユニバーサルなエンドツーエンド回帰器としてトレーニングするためのフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:19:12 GMT)
Probabilistic Mission Design in Neuro-Symbolic Systems [19.5]
Probabilistic Mission Design (ProMis)は、地理空間と感覚データを宣言型ハイブリッド確率論理プログラム(HPLP)に結びつけるシステムアーキテクチャである。 ProMisは確率的ミッションランドスケープ(Probabilistic Mission Landscapes, PML)を生成する。本稿では,Large Language Models(LLM)やTransformerベースの視覚モデルなど,強力な機械学習モデルとの統合について述べる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:04:00 GMT)
HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs [19.4]
複雑な推論が可能な医療用LLMであるHuatuoGPT-o1は、40K問題のみを使用して、一般および医療固有のベースラインを上回ります。実験により、複雑な推論は医学的問題解決を改善し、強化学習の恩恵を受けることが示されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:12:34 GMT)
LoGFiLM: Fine-Tuning A Large Language Model for Automated Generation of Log Statements [19.4]
本論文は,Llama-3-8Bの微細チューニング手法であるLoGFiLMと,Llama-3-8Bの微細チューニングに提案手法を用いた模範モデルを提案する。我々のキュレートされたデータセットと公開データセットによる実験では、LoGFiLMはオリジナルのLlama-3-8Bと、GPT-3.5とGPT-4の商業的例を一貫して上回っている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:43:00 GMT)
AlphaFolding: 4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance [18.9]
本研究では分子動力学(MD)シミュレーションデータを用いた動的タンパク質構造学習のための革新的4次元拡散モデルを提案する。本モデルでは,32時間で最大256個のアミノ酸を含むタンパク質の動的3次元構造を予測できる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:20:56 GMT)
Task Diversity in Bayesian Federated Learning: Simultaneous Processing of Classification and Regression [18.5]
本稿では,多出力ガウス過程(MOGP)を用いたマルチタスク学習の原理的統合と,グローバルレベルでのフェデレート学習を提案する。 P'o'lya-Gamma Augmentation Techniqueと平均場変動推論によって、ローカルデバイスで後部推論を行う際の課題に対処する。合成データと実データの両方の実験結果は、予測性能、OOD検出、不確実性校正、収束率に優れていた。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:58:16 GMT)
RhythmFormer: Extracting Patterned rPPG Signals based on Periodic Sparse Attention [18.4]
RRhythmは、生理学的ビデオに基づいて生理的信号を検出する非接触法である。本稿では,周期性によって誘発される時間的注意間隔に基づく周期的注意機構を提案する。これは、データ内およびデータ間評価の両方において最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:48:12 GMT)
Prioritize Denoising Steps on Diffusion Model Preference Alignment via Explicit Denoised Distribution Estimation [18.3]
本稿では,信用割当の新しい手法であるDenoized Distribution Estimation (DDE)を提案する。 DDEは、各ステップの観点から、端末の復号化分布を直接推定する。 2つの推定戦略を備え、1つのモデル推論で全聴覚軌跡を表現できる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:55:08 GMT)
Window-based Channel Attention for Wavelet-enhanced Learned Image Compression [18.1]
チャネルアテンションに初めてウィンドウパーティションを導入し、大きな受信フィールドを取得し、よりグローバルな情報を取得する。実験の結果,4つの標準データセットに対してBDレートが18.54%,23.98%,22.33%,24.71%削減された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:48:00 GMT)
PEARL: Input-Agnostic Prompt Enhancement with Negative Feedback Regulation for Class-Incremental Learning [17.8]
クラスインクリメンタルラーニング(CIL)は,従来学習されていたクラスを忘れずに,新しいカテゴリを分類システムに継続的に導入することを目的としている。 CILでは、事前学習した知識に合わせてデータ分散を調整できるため、プロンプト学習が採用されている。本稿では,素早い学習の観点から,既存の手法の限界を批判的に検討する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:44:35 GMT)
Improving Integrated Gradient-based Transferable Adversarial Examples by Refining the Integration Path [17.5]
移動可能な敵の例は、実用的なブラックボックス攻撃のシナリオで脅威を引き起こすことが知られている。既存のIGベースの攻撃は、モデル解釈可能性におけるIGの素早い採用により、転送可能性に制限がある。我々は,高度に伝達可能な逆数例を生成できるMultiple Monotonic Diversified Integrated Gradients (MuMoDIG)攻撃を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:15:39 GMT)
M3-CVC: Controllable Video Compression with Multimodal Generative Models [17.5]
M3-CVCは、生成モデルを組み込んだ制御可能なビデオ圧縮フレームワークである。以上の結果から,M3-CVCは超低シナリオにおいて最先端のVVCを著しく上回っていることが明らかとなった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:01:45 GMT)
Voter Priming Campaigns: Strategies, Equilibria, and Algorithms [17.3]
問題サリエンス」は有権者の判断の主要な決定要因である。複数政党構成における投票者プライミングのためのキャンペーン費用の動態,戦略,均衡について検討する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:30:58 GMT)
LangYa: Revolutionizing Cross-Spatiotemporal Ocean Forecasting [17.1]
海洋予報システムであるLangYaを紹介した。結果は、LangYaが1日から7日間のリードタイムで1つのモデルで予測できることを示した。既存の数値およびAIベースの海洋予測システムと比較して、LangYaはGlobal Ocean Reanalysis and Simulationバージョン12から27年間の地球海洋データを使用している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:28:54 GMT)
RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction [17.0]
拡散確率モデル(DPM)は、高忠実度画像合成のデファクトアプローチとして登場した。本稿では, 再帰的拡散確率モデル(RDPM, Recurrent Diffusion Probabilistic Model)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:12:10 GMT)
DebiasDiff: Debiasing Text-to-image Diffusion Models with Self-discovering Latent Attribute Directions [16.7]
DebiasDiffは、自己発見方法で属性潜在方向を学習するプラグイン・アンド・プレイ方式である。本手法は,他のDMと軽量かつ容易に統合可能でありながら,DMの複数の属性を同時にデバイアスすることが可能である。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:30:20 GMT)
Efficient Multi-Policy Evaluation for Reinforcement Learning [16.7]
対象とするすべてのポリシーにおける推定器のばらつきを低減するために、調整された行動ポリシーを設計する。推定器は, 従来の最適手法に比べて, かなり低いばらつきを有することを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:32:21 GMT)
CausalTAD: Causal Implicit Generative Model for Debiased Online Trajectory Anomaly Detection [16.4]
軌道異常検出は多くの実世界のアプリケーションにとって重要な問題となっている。既存の解は観測軌道の生成モデルを直接訓練し、条件付き生成確率$P(T|C)$を異常リスクとして計算する。観測された軌跡は、SD分布と軌跡の両方の共通原因である道路網の嗜好によって構築されていると論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:20:52 GMT)
Computing Approximate Graph Edit Distance via Optimal Transport [16.3]
グラフペア$(G1, G2)$が与えられたとき、グラフ編集距離(GED)は、G1$から$G2$に変換する編集操作の最小数として定義される。 GEDIOTは、学習可能なシンクホーンアルゴリズムを利用して結合行列を生成する逆最適輸送に基づいている。 GEDGWは最適輸送と変種であるGromov-Wassersteinの不一致の線形結合としてGED計算をモデル化した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:55:14 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [15.8]
既存の因果ベイズ最適化(CBO)法は、報酬を最大化するために因果構造を変更するハード介入に依存する。学習内因性分布を利用した新しいCBO法を開発した。異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:34:22 GMT)
Design and Evaluation of Privacy-Preserving Protocols for Agent-Facilitated Mobile Money Services in Kenya [15.8]
Mobile Money (MoMo) は、携帯電話でデジタル金融取引を完了させる技術である。 MoMoプロセスは、エージェントが名前やID番号などの顧客情報にアクセスし、検証する必要がある。本研究では,エージェントからMoMoプロバイダへの機密情報のフローをリダイレクトするプロトコルを設計する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:27:13 GMT)
Offline Reinforcement Learning for LLM Multi-Step Reasoning [15.7]
OREO(Offline Reasoning Optimization)は,多段階推論の強化を目的としたオフライン強化学習手法である。これにより、ペアワイズデータを収集する必要がなくなり、より優れたクレジット割り当てが可能になる。マルチステップ推論ベンチマークでは、既存のオフライン学習手法を超越している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:54:02 GMT)
Protective Perturbations against Unauthorized Data Usage in Diffusion-based Image Generation [15.4]
拡散に基づくテキスト・ツー・イメージモデルは、様々な画像関連タスクに対して大きな可能性を示してきた。認証されていないデータを使ってこれらのモデルをカスタマイズすることは、深刻なプライバシーと知的財産の問題を引き起こす。既存の方法は、敵の攻撃に基づく保護的摂動を導入する。本稿では,拡散画像生成における不正なデータ使用を防止するための保護摂動法について検討する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:06:41 GMT)
On the Local Complexity of Linear Regions in Deep ReLU Networks [15.3]
低次元特徴表現を学習するReLUネットワークは局所的複雑性が低いことを示す。特に、局所的な複雑性は、入力データ分布上の関数の総変動の上限として機能することを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:14:07 GMT)
MrSteve: Instruction-Following Agents in Minecraft with What-Where-When Memory [14.9]
我々はPlace Event Memory (PEM)を搭載した新しい低レベルコントローラMrSteveを紹介する。 PEMは、空間的およびイベントベースのデータを整理し、長距離タスクにおける効率的なリコールとナビゲーションを可能にする。提案手法は既存の手法に比べてタスク解決と探索の効率を大幅に改善する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:43:48 GMT)
Secure Shapley Value for Cross-Silo Federated Learning (Technical Report) [14.5]
Shapley Value(SV)は、クロスサイロ・フェデレーション・ラーニング(クロスサイロFL)における貢献評価のための公平で原則化された指標である既存のFLのSV計算方法は、サーバが生のFLモデルや公開テストデータにアクセスできると仮定する。提案するSecSVは,以下の特徴を持つ効率的な2サーバプロトコルである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:01:04 GMT)
Dynamics of Topological Defects in a Rashba Spin-Orbit Coupled Bose-Einstein Condensate [14.5]
2次元ラシュバスピン軌道結合ボース・アインシュタイン凝縮体のクエンチダイナミクスについて検討する。このクエンチの間、トポロジカルな欠陥は渦の形で現れる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:31:42 GMT)
Simultaneously Recovering Multi-Person Meshes and Multi-View Cameras with Human Semantics [14.4]
我々は、非校正カメラを用いたマルチパーソンモーションキャプチャーに焦点をあてる。主要なアイデアは、カメラパラメータと人間のメッシュを同時に推定するために、動きの事前知識を組み込むことである。その結果, 正確なカメラパラメータと人間の動きは, ワンステップで再現できることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:35:30 GMT)
Protect Your Secrets: Understanding and Measuring Data Exposure in VSCode Extensions [14.4]
Visual Studio Code(VSCode)におけるクロスエクステンションインタラクションのセキュリティ問題について検討する。我々の研究は、敵が秘密裏にクレデンシャル関連のデータを入手したり、操作したりできるような、インパクトの高いセキュリティ上の欠陥を発見しました。当社のツールを現実世界のVSCodeエクステンション27,261に適用することにより、その8.5%がクレデンシャル関連のデータ漏洩にさらされていることが分かりました。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:49:44 GMT)
Open-Vocabulary Panoptic Segmentation Using BERT Pre-Training of Vision-Language Multiway Transformer Model [14.2]
我々は,BEiT-3と呼ばれる大規模視覚言語事前学習モデルを用いて,オープン語彙セグメンテーションのためのOMTSegを提案する。実験の結果、OMTSegは最先端のモデルに対して好適に機能することが示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:31:00 GMT)
CoEvo: Continual Evolution of Symbolic Solutions Using Large Language Models [14.2]
大規模言語モデル(LLM)は人工知能の変換ツールとして登場した。本稿では,LLMが科学・工学分野における記号解の発見を促進する可能性について考察する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:27:27 GMT)
Conditional Balance: Improving Multi-Conditioning Trade-Offs in Image Generation [14.1]
DDPMアテンション層内の感度を識別する新しい手法を導入し、異なるスタイルの側面に対応する特定の層を同定する。提案手法は,スタイルや内容のきめ細かい制御を可能にし,過度に制約された入力から生じる問題を著しく低減する。提案手法は,スタイルや内容の整合性を向上し,最終的に生成した視覚的コンテンツの質を向上させることによって,最近のスタイリング技術の向上を図っている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:51:55 GMT)
SoK: On the Offensive Potential of AI [14.1]
ますます多くの証拠が、AIが攻撃目的にも使われていることを示している。現存する研究は、AIの攻撃的可能性の全体像を描けなかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:05:54 GMT)
DiFiC: Your Diffusion Model Holds the Secret to Fine-Grained Clustering [14.0]
DiFiCは条件拡散モデルに基づく微細クラスタリング法である。実験により、DiFiCは最先端の識別法と生成的クラスタリング法の両方より優れていることが示された。 DiFiCの成功が将来の研究に刺激を与え、世代を超えたタスクにおける拡散モデルの可能性を解き放つことを期待している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:55:48 GMT)
Towards a Statistical Understanding of Neural Networks: Beyond the Neural Tangent Kernel Theories [13.9]
ニューラルネットワークの主な利点は、その特徴学習特性にある。本稿では,特徴学習のための新しいパラダイムを提案し,その結果の一般化可能性について考察する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:03:58 GMT)
Position-aware Graph Transformer for Recommendation [13.4]
我々は新しいグラフトランス (GT) フレームワーク - textitPosition-aware Graph Transformer for Recommendation (PGTR) を提案する。キーとなる洞察は、ノードの位置と構造情報をユーザとイテムの相互作用グラフからGTアーキテクチャに明示的に組み込むことである。実世界の4つのデータセットにまたがる様々なGCNベースのバックボーンに実装したPGTR法の有効性を実証研究により実証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:22:35 GMT)
Speech Recognition With LLMs Adapted to Disordered Speech Using Reinforcement Learning [13.1]
本稿では,音声入力を処理可能な大規模言語モデルを提案する。人間の嗜好に基づく強化学習でさらに調整することで、従来の微調整よりも混乱した音声に適応できることが示される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:16:22 GMT)
Generative Models with ELBOs Converging to Entropy Sums [13.0]
エビデンス・ローバウンド(ELBO)は教師なし学習の最も中心的な目的の一つである。いくつかの生成モデルとモデルクラスに対するエントロピー和への収束性を証明する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:47:23 GMT)
Planning from Imagination: Episodic Simulation and Episodic Memory for Vision-and-Language Navigation [12.4]
我々は,エージェントに現実的想像型ハイブリッドメモリシステムを提供する新しいアーキテクチャを開発した。我々のエージェントは、将来の場面で高忠実なRGB画像を想像し、パス長(SPL)で重み付けされた成功率の最先端結果を達成することができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:59:53 GMT)
MineStudio: A Streamlined Package for Minecraft AI Agent Development [12.3]
Minecraftは、インテリジェンスとシーケンシャルな意思決定研究のための貴重なテストベッドとして登場した。本稿では,Minecraftにおける具体的政策開発を効率化するオープンソースソフトウェアパッケージであるMineStudioについて述べる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:51:04 GMT)
MoRe: Class Patch Attention Needs Regularization for Weakly Supervised Semantic Segmentation [12.3]
そこで本研究では,最小のセマンティック関連性を持つパッチ領域を誤動作させる問題に対処するため,MoReを提案する。以上の結果から,クラスパッチ注意にさらなる正規化を加える必要があることが示唆された。 MoReはアーティファクトの問題を効果的に解決し、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:24:52 GMT)
Long-Range Tasks Using Short-Context LLMs: Incremental Reasoning With Structured Memories [12.1]
本稿では,情報をチャンクのストリームとして処理し,コンテクスト内メモリを構造化したPRISMを提案する。このアプローチは、少なくとも4倍の小さなコンテキストを使用しながら、多様なタスクのベースラインよりも優れたパフォーマンスを示す。代替の短文アプローチに比べて54%のコスト削減を実現している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:14:31 GMT)
Research Experiment on Multi-Model Comparison for Chinese Text Classification Tasks [12.1]
本稿では,中国語のテキスト分類タスクに対して,TextCNN,TextRNN,FastTextの3つのディープラーニングモデルの比較研究を行う。これらのモデルの性能を評価し,異なるシナリオにおける適用性について論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:54:40 GMT)
Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT [12.0]
現在の定量的灌流イメージングは、時間分解画像再構成と灌流パラメトリック推定という2つのカスケードステップを含む。これらの2つの課題は、C-arm CBCTを用いて定量的に正確な灌流画像を得るのを防ぐことである。現に開発された直接脳血流パラメトリック画像再構成技術であるTRAINERでは、定量的灌流画像は時間分解CTフォワードモデルの制約の下で訓練された主観的条件生成モデルとして表現されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:12:02 GMT)
Comparative Analysis of Machine Learning-Based Imputation Techniques for Air Quality Datasets with High Missing Data Rates [11.5]
都市汚染は深刻な健康リスクをもたらし、特に交通関連の大気汚染は、多くの都市で大きな問題となっている。この研究は、データレートの低いデータセットを処理するための洞察を提供することを目的としている。アンサンブル法,深層学習モデル,拡散モデルなど,様々な計算・予測手法を評価・比較した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:39:20 GMT)
AdaEAGLE: Optimizing Speculative Decoding via Explicit Modeling of Adaptive Draft Structures [11.4]
適応型ドラフト構造を明示的にモデル化する最初のSDフレームワークであるAdaEAGLEを紹介する。 AdaEAGLEは、バニラARデコードよりも1.62倍のスピードアップを実現し、固定長のSotAベースラインを上回っている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:57:33 GMT)
A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space [11.2]
オープンセット物体検出(OSOD)は、非構造環境におけるロボット操作に非常に望ましい。既存のOSOD法は、計算負荷と複雑な展開のために、ロボットアプリケーションの要求を満たすことができないことが多い。本稿では,ロボットシステムにおけるリアルタイムOSODタスクを支援するために,Decoupled OSOD(DOSOD)と呼ばれる軽量フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:22:27 GMT)
Elucidating Flow Matching ODE Dynamics with respect to Data Geometries [10.9]
拡散に基づく生成モデルが画像生成の標準となり, 学習ベクトル場によるサンプリングステップの削減により, 拡散モデルと比較して, ODEベースのサンプリングモデルとフローマッチングモデルにより効率が向上した。我々は,ODE力学を駆動するデノイザを中心に,サンプル軌道の包括的解析を通じて,フローマッチングモデルの理論を推し進める。解析により,グローバルなデータ特徴から局所構造への軌道の進化が明らかとなり,フローマッチングモデルにおけるサンプルごとの挙動の幾何学的特徴が得られた。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:17:15 GMT)
HybridDepth: Robust Metric Depth Fusion by Leveraging Depth from Focus and Single-Image Priors [10.9]
本稿では,深度推定における重要な課題に対処する頑健な深度推定パイプラインHYBRIDDEPTHを提案する。 HYBRIDDEPTHは、一般的なモバイルデバイスで便利なデータである焦点スタックを活用して、正確な距離深度マップを生成する。包括的定量的および定性的分析により、HYBRIDDEPTHは最先端(SOTA)モデルより優れていることが示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 23:10:42 GMT)
Fit and Prune: Fast and Training-free Visual Token Pruning for Multi-modal Large Language Models [10.7]
トークンプルーニングはMLLMの高速化に有効なソリューションだが、トークンをいつ、どのようにドロップするかは依然として課題である。本研究では,MLLMの効率的な視覚的トークンプルーニング(FitPrune)のための新しい,トレーニング不要なアプローチを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:30:16 GMT)
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models [10.5]
HiREDは固定トークン予算内で運用するために設計されたトークンドロップ方式である。既存のトークンドロップ方式に比べて精度と性能が優れている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:27:01 GMT)
Ister: Inverted Seasonal-Trend Decomposition Transformer for Explainable Multivariate Time Series Forecasting [10.3]
本稿では,Inverted Seasonal-Trend Decomposition Transformer (Ister) という新しいモデルを提案する。アイスターはオリジナルの時系列を季節やトレンドの要素に分解する。本稿では,季節成分処理のための新しいDotアテンション機構を提案し,精度,計算複雑性,解釈可能性の両方を改善した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:37:19 GMT)
Exemplar-condensed Federated Class-incremental Learning [10.0]
本稿では,ストリーミングデータから実画像のトレーニング特性を情報リハーサルの例に活かすために,Exemplar-Condensed Federated Class-Incremental Learning (ECoral)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:13:40 GMT)
ReverseNER: A Self-Generated Example-Driven Framework for Zero-Shot Named Entity Recognition with Large Language Models [9.9]
ReverseNERは、ゼロショット名のエンティティ認識タスクにおいて、大きな言語モデルの制限を克服することを目的とした手法である。 NERの逆プロセスを通じて生成される数十のエンティティラベル付き文からなるサンプルライブラリを生成する。 LLMを用いたNER性能向上のためのエンティティレベルの自己整合性スコアリング機構を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:13:57 GMT)
OmniVLM: A Token-Compressed, Sub-Billion-Parameter Vision-Language Model for Efficient On-Device Inference [9.8]
デバイス上での効率的な推論のための視覚言語モデルであるOmniVLMを提案する。視覚トークンシーケンスの長さを729から81に短縮し、計算オーバーヘッドを大幅に削減する。 968MのパラメータフットプリントでnanoLLAVAのような既存のベースラインを上回ります。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:15:29 GMT)
DRDM: A Disentangled Representations Diffusion Model for Synthesizing Realistic Person Images [9.8]
本稿では,画像からリアルな画像を生成するために,DRDM(Disentangled Representations Diffusion Model)を提案する。まず、ポーズエンコーダは、人物画像の生成を導くために、ポーズ特徴を高次元空間に符号化する。第2に、本体部分部分部分空間疎結合ブロック(BSDB)は、ソースフィギュアの異なる本体部分から特徴を分離し、ノイズ予測ブロックの様々な層に供給する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:36:24 GMT)
A Natural Primal-Dual Hybrid Gradient Method for Adversarial Neural Network Training on Solving Partial Differential Equations [9.6]
偏微分方程式(PDE)を解くためのスケーラブルな事前条件付き原始ハイブリッド勾配アルゴリズムを提案する。本稿では,提案手法の性能を,一般的なディープラーニングアルゴリズムと比較する。その結果,提案手法は効率的かつ堅牢に動作し,安定に収束することが示唆された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:29:13 GMT)
H-FedSN: Personalized Sparse Networks for Efficient and Accurate Hierarchical Federated Learning for IoT Applications [9.6]
実用的なIoT環境のための革新的なアプローチとして,H-FedSNを提案する。 H-FedSNでは、通信オーバーヘッドを低減するために、共有層とパーソナライズ層を備えたバイナリマスク機構が導入されている。 H-FedSN は HierFAVG と比較して通信コストを 58 倍から 238 倍に削減する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:21:07 GMT)
A Unified Framework for Continual Learning and Unlearning [9.5]
継続的学習と機械学習は機械学習において重要な課題であり、通常は別々に対処される。制御された知識蒸留を活用することにより,両課題に共同で取り組む新しい枠組みを導入する。我々のアプローチは、最小限の忘れ込みと効果的な標的未学習で効率的な学習を可能にする。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:05:43 GMT)
Sparse Anatomical Prompt Semi-Supervised Learning with Masked Image Modeling for CBCT Tooth Segmentation [9.4]
Cone Beam Computed Tomography (CBCT) 歯科画像における歯の識別とセグメンテーションは, 歯科医が行う手技診断の効率と精度を著しく向上させることができる。既存のセグメンテーション手法は主に大規模なデータボリュームトレーニングに基づいて開発され、そのアノテーションは非常に時間がかかります。本研究では, 大量の未ラベルデータを効果的に活用し, 限られたラベル付きデータで正確な歯のセグメンテーションを実現するタスク指向Masked Auto-Encoderパラダイムを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:30:46 GMT)
Experimental secure entanglement-free quantum remote sensing over 50 km of optical fiber [9.4]
セキュアな量子リモートセンシング(SQRS)は、遠い物体や環境に関する情報を集めるために量子状態を使用する。最近の実験は、絡み合い状態を用いたSQRSの実現可能性を示している。我々は,一量子状態が準備しやすいという現実的な利点を提供するため,絡み合いを伴わずに位相を推定できるSQRSを実験的に実証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:52:06 GMT)
OCMDP: Observation-Constrained Markov Decision Process [9.1]
我々は、コスト感受性環境における観察と制御戦略を同時に学習する課題に取り組む。我々は,ポリシーのセンシングと制御を分離する反復的,モデルなしの深層強化学習アルゴリズムを開発した。本研究は,HeartPoleを用いたシミュレートされた診断課題と現実的な医療環境に対するアプローチを検証する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:08:59 GMT)
Unambiguous detection of high energy vortex states via the superkick effect [8.9]
渦状態で調製された粒子は、伝播方向の非ゼロ軌道角運動量プロジェクションを有する。低エネルギーの渦光子、電子、中性子、ヘリウム原子が実験で実証され、多くの応用が発見されている。本稿では,位相渦の存在を明瞭に検出できる,いわゆるスーパーキック効果に基づく新しい診断法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:46:48 GMT)
LearnLM: Improving Gemini for Learning [8.5]
生成型AIシステムは、人間の家庭教師としての学習にユーザを巻き込むのではなく、デフォルトで情報を提示するように調整されている。本稿では, 教育指導による教育訓練が, 有能なトレーナーにかなり好まれるLearnLMモデルをいかに生み出すかを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:12:22 GMT)
A non-relativistic theory of quantum mechanics and gravity with local modulus symmetry [8.4]
膨張する宇宙において、これらの理論的特徴は、従来の量子力学とニュートン重力の予測から逸脱する新しい効果を生み出す。重力ポテンシャルエネルギーの余剰項は小さな境界系では無視できるが、銀河スケールでは支配的になる。新しい背景エネルギー項は、ハッブル定数によって乗算されたプランク定数の半分であることが判明した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:18:03 GMT)
Towards Expressive Video Dubbing with Multiscale Multimodal Context Interaction [8.3]
自動ビデオダビング(AVD)は、スクリプトから唇の動きや顔の感情に合わせた音声を生成する。最近の研究は、韻律表現性を高めるためのマルチモーダルコンテキストのモデリングに焦点を当てている。 AVDのためのマルチスケールマルチモーダルコンテキストインタラクションスキームであるM2CI-Dubberを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:41:13 GMT)
The Impact of Input Order Bias on Large Language Models for Software Fault Localization [8.2]
大規模言語モデル(LLM)は、ソフトウェア工学のタスクにおいて非常に有望である。本研究では,入力順序とコンテキストサイズがFLのLLM性能に与える影響について検討した。コード順序を逆転すると、Top-1の精度は57%から20%に低下します。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:48:53 GMT)
VisionGRU: A Linear-Complexity RNN Model for Efficient Image Analysis [8.1]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は画像解析の主流モデルである。本稿では,効率的な画像分類のための新しいRNNアーキテクチャであるVisionGRUを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:33:25 GMT)
Renaissance of Literate Programming in the Era of LLMs: Enhancing LLM-Based Code Generation in Large-Scale Projects [7.9]
大規模言語モデル(LLM)は、コード生成、理解、修復を通じてプログラマの効率向上を支援する。大規模プロジェクトへの彼らの適用は、複雑な相互依存と近代の広範な規模のために、依然として困難である。本研究では,ILP(Interoperable LP)の概念を導入し,LLMによる小規模文書と大規模プロジェクトの開発を促進する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:02:46 GMT)
Improving the Readability of Automatically Generated Tests using Large Language Models [7.7]
探索型ジェネレータの有効性とLLM生成試験の可読性を組み合わせることを提案する。提案手法は,検索ツールが生成するテスト名や変数名の改善に重点を置いている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:08:53 GMT)
Experimental verification of quantum battery capacity with an optical platform [7.7]
量子バッテリは、量子相関が存在するため、従来のバッテリを上回るパフォーマンスが期待されている。最近の理論的研究は、充電および放電過程における最高および最低エネルギーに応じて定義される量子バッテリ容量を導入している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:53:26 GMT)
Automated Review Generation Method Based on Large Language Models [7.4]
大規模言語モデル(LLM)に基づく自動レビュー生成手法を提案する。提案手法は高速に343項目を解析し,LLMアカウント1項目あたり平均秒を計測し,35項目にわたる総合的なレビューを作成した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:10:27 GMT)
Dynaseal: A Backend-Controlled LLM API Key Distribution Scheme with Constrained Invocation Parameters [7.1]
モデル呼び出しに対するきめ細かいバックエンド制約を可能にする新しい手法であるDynasealを提案する。 Dynasealは、エッジデバイスデプロイメントに必要な柔軟性とバックエンドコントロールを提供する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:09:09 GMT)
Zema Dataset: A Comprehensive Study of Yaredawi Zema with a Focus on Horologium Chants [7.1]
エチオピア正教会のテワヘド教会聖歌は、計算音楽研究において比較的少なすぎる。本稿では, ヤレダウィ・ゼマ(Yaledawi Zema)として知られる, EOTCの唱歌の分析に適した新しいデータセットを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:20:08 GMT)
RapGuard: Safeguarding Multimodal Large Language Models via Rationale-aware Defensive Prompting [7.1]
RapGuardは、シナリオ固有の安全プロンプトを生成するために、マルチモーダル連鎖推論を使用する新しいフレームワークである。 RapGuardは最先端の安全性能を実現し、応答の品質を低下させることなく有害なコンテンツを著しく削減する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:31:53 GMT)
Adopting Trustworthy AI for Sleep Disorder Prediction: Deep Time Series Analysis with Temporal Attention Mechanism and Counterfactual Explanations [6.9]
本研究は,3つの深部時系列モデルを用いて,睡眠障害予測のための説明可能性アプローチを行う。睡眠の健康度を測る大規模なデータセットを用いて,本手法が睡眠障害の予測に及ぼす影響を実証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:19:45 GMT)
Implicit factorized transformer approach to fast prediction of turbulent channel flows [6.7]
本稿では,従来の連鎖因数分解処理を並列因数分解処理に置き換える改良型暗黙因数分解変換器 (IFactFormer-m) モデルを提案する。 IFactFormer-mモデルは乱流流の長期予測に成功している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:05:14 GMT)
Federated Learning with Partially Labeled Data: A Conditional Distillation Approach [6.5]
本稿では,条件付き蒸留を取り入れた新しいFLフレームワークであるConDistFLを提案する。 ConDistFLは、部分的にラベル付けされたデータセットから効果的な学習を可能にし、分散データセットと非一様データセットのセグメンテーション精度を大幅に改善する。より優れたセグメンテーション性能に加えて、ConDistFLは計算と通信の効率を維持し、現実世界のアプリケーションにそのスケーラビリティを保証する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:40:03 GMT)
RAGONITE: Iterative Retrieval on Induced Databases and Verbalized RDF for Conversational QA over KGs with RAG [6.4]
SPARQLは複雑な意図と会話型の質問に対して脆弱である。 i)知識グラフから自動的に抽出されたデータベース上のSPARQL結果と、(ii)KG事実の動詞化に関するテキスト検索結果。パイプラインは反復的な検索をサポートし、どのブランチの結果も満足できないと判断された場合、システムは自動的にラウンドを選択できる。本稿では,BMW自動車の知識グラフに基づくいくつかのベースラインに対する提案方式の優位性を示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:05:04 GMT)
Label-free SERS Discrimination of Proline from Hydroxylated Proline at Single-molecule Level Assisted by a Deep Learning Model [6.1]
ハイドロキシル化プロリンから低収率のハイドロキシル化プロリンを識別することは、疾患のモニタリングやeval-uating治療の成果に不可欠である。プラズモンナノ孔センサは表面増強ラマン分光法(SERS)により単一分子感度のヒドロキシ化を検出することができるが、単一分子信号の内在的な変動に悩まされる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:46:52 GMT)
Predicting Time Series of Networked Dynamical Systems without Knowing Topology [6.1]
本稿では,観測時系列データから直接ネットワークダイナミクスを学習するための新しいフレームワークを提案する。提案手法では,注意機構を備えた連続グラフニューラルネットワークを用いて潜在トポロジを構築する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:39:04 GMT)
Boosted fusion gates above the percolation threshold for scalable graph-state generation [5.9]
小さな資源状態をより大きく完全に連結されたグラフ状態に融合することは、スケーラブルなフォトニック量子コンピューティングに不可欠である。ここでは, 理論的成功確率75%の昇圧核融合ゲートの実証に成功した。さらに, 2つのベル状態と67(2)%の忠実度を融合させることにより, 昇圧核融合ゲートの有効性を実証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:47:17 GMT)
SAFLITE: Fuzzing Autonomous Systems via Large Language Models [5.7]
本稿では,自律システムにおけるファジテストの効率化を目的とした普遍的な枠組みを提案する。コアとなるSaFliTeは、テストケースが事前に定義された安全基準を満たすかどうかを評価する予測コンポーネントである。 GPT-3.5, Mistral-7B, Llama2-7B など様々な LLM を用いて SaFliTe をインスタンス化し, PGFuzz, DeepHyperion-UAV, CAMBA, TUMB の4つのファジテストツールに統合することにより, SaFliTe の評価を行った。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:00:05 GMT)
Mitigating optimistic bias in entropic risk estimation and optimization with an application to insurance [5.4]
エントロピーリスク尺度は、不確実な損失に関連する尾のリスクを説明するために広く使用されている。経験的エントロピーリスク推定器のバイアスを軽減するために, 強く一貫したブートストラップ手法を提案する。当社の手法は、住宅所有者に対してより高い(そしてより正確な)プレミアムを示唆している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:45:46 GMT)
TravelAgent: Generative Agents in the Built Environment [5.3]
TravelAgentは、さまざまな屋内および屋外環境における歩行者ナビゲーションと活動パターンをモデル化する、新しいシミュレーションプラットフォームである。 1898年のエージェント・ステップを多種多様な空間配置とエージェント・アーチタイプからなる100個のシミュレーションから分析し,全体のタスク完了率を76%とした。本研究では,都市デザイン,空間認知研究,エージェントベースモデリングのツールとしてのTravelAgentの可能性を明らかにする。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 21:27:51 GMT)
WeatherGS: 3D Scene Reconstruction in Adverse Weather Conditions via Gaussian Splatting [5.2]
WeatherGSは3DGSベースのフレームワークで、異なる気象条件下でのマルチビュー画像から鮮明なシーンを再構築する。本研究では,高密度粒子を大気効果フィルタで逐次除去するプロセス前処理手法を提案する。最後に,処理した画像を用いて3次元ガウスの集合を訓練し,隠蔽領域を除外するためのマスクを生成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:16:57 GMT)
Provable Uncertainty Decomposition via Higher-Order Calibration [5.0]
本稿では,モデルの予測的不確かさをアレタリック成分とてんかん成分に分解する原理的手法を提案する。我々の手法は、高次校正という新しい概念に基づいている。本手法が画像分類において意味のある不確実性分解を生じさせることを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:26:36 GMT)
Large Language Models for Constructing and Optimizing Machine Learning Workflows: A Survey [4.9]
複雑なタスクに対処するための効果的な機械学習(ML)を構築することは、Automatic ML(AutoML)コミュニティの主要な焦点である。最近、MLへのLLM(Large Language Models)の統合は、MLパイプラインのさまざまなステージを自動化し、拡張する大きな可能性を示している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:38:51 GMT)
Quantifying the Risk of Pastoral Conflict in 4 Central African Countries [4.9]
気候変動は、アフリカにおける農家と農家の紛争のリスク要因として広く認識されている。統計的および機械学習の手法を牧草地紛争の分析に応用する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:37:29 GMT)
Robustness Evaluation of Offline Reinforcement Learning for Robot Control Against Action Perturbations [4.8]
オフライン強化学習は特にロボット制御の応用に有望ですロボットの関節アクチュエータ障害のような現実世界の課題に対する堅牢性は、依然として重要な関心事である。本研究は,OpenAI Gymの脚ロボットを用いた既存のオフライン強化学習手法のロバスト性を評価する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:02:22 GMT)
Enhancing Large Language Models with Domain-Specific Knowledge: The Case in Topological Materials [4.7]
大規模言語モデル (LLM) はテキスト生成タスクにおいて顕著な性能を示した。 TopoChatと呼ばれるトポロジカル材料のための対話システムを開発した。 TopoChatは、構造およびプロパティクエリ、マテリアルレコメンデーション、複雑なリレーショナル推論において優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:49:28 GMT)
Analytic 3D vector non-uniform Fourier crystal optics in arbitrary $\bar{\bar{\varepsilon}}$ dielectric [4.6]
相互空間における固有解析と実空間における光場伝播の3つの広く用いられている平面波面の比較を行った。複素線トレーシングに着想を得て、3$times$2遷移行列の明示的な形式を導出する。我々は、円盤状、環状、三日月状のような形状に配置された無限特異点のような、実空間および相互空間における LCO の新しい領域を発見した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 09:28:10 GMT)
Machine Learning-Based Reward-Driven Tuning of Scanning Probe Microscopy: Towards Fully Automated Microscopy [4.6]
タップモードにおけるプローブ顕微鏡(SPM)の最適化を自動化するための報奨駆動ワークフローを提案する。報酬関数は、良質なスキャンの物理的および経験的な知識を符号化した複数のチャネルに基づいて定義され、画像品質のサンプルに依存しない尺度を表す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:28:04 GMT)
Generative Landmarks Guided Eyeglasses Removal 3D Face Reconstruction [4.5]
シングルビュー3D顔の再構成は、異常な難しさの基本的なコンピュータビジョン問題である。本稿では,眼鏡を1枚の画像から除去する3次元顔の撮影方法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:57:56 GMT)
Generative Face Parsing Map Guided 3D Face Reconstruction Under Occluded Scenes [4.5]
ランドマークで案内された完全な顔解析マップ生成法を提案する。優れた隠蔽顔復元法は、出力の真偽を確実にする。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:49:41 GMT)
3D Face Reconstruction With Geometry Details From a Single Color Image Under Occluded Scenes [4.5]
3D顔再構成技術は、自然かつ現実的に顔ステレオモデルを作成することを目的としている。従来のディープ・フェイス・リコンストラクション・アプローチは、一般的に説得力のあるテクスチャを生成するために設計されている。バンプマッピングを導入することで、3Dの顔を粗くするために中程度の細部を追加しました。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:16:02 GMT)
ArtNVG: Content-Style Separated Artistic Neighboring-View Gaussian Stylization [4.4]
ArtNVGは、レファレンススタイルのイメージを活用することで、スタイリングされた3Dシーンを効率的に生成する革新的な3Dスタイリングフレームワークである。本フレームワークは,コンテンツスタイル分離制御(Content-Style Separated Control)とAttention-based Neighboring-View Alignment(Neighboring-View Alignment)という,高品質な3Dスタイリングを実現する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:19:52 GMT)
Successes and Limitations of Object-centric Models at Compositional Generalisation [4.3]
オブジェクト中心アーキテクチャが有望な構成スキルを示していることを示す。本研究は、これらのスキルの源泉と、注意深いトレーニングを通じて改善できる方法を示すエビデンスを示す。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 02:25:12 GMT)
Evaluating the Adversarial Robustness of Detection Transformers [4.3]
物体検出変換器(DETR)の進歩にもかかわらず、敵の攻撃に対する堅牢性は未解明のままである。本稿では,White-box と Black-box の両攻撃下での DETR モデルとその変種を包括的に評価する。解析の結果, DETR 変種間のネットワーク内転送性は高いが, CNN モデルに対するネットワーク間転送性は限定的であることがわかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:31:10 GMT)
BLS-GAN: A Deep Layer Separation Framework for Eliminating Bone Overlap in Conventional Radiographs [4.3]
従来のX線写真では、骨の重なり合いが一般的であり、骨特性の正確な評価を妨げる可能性がある。本研究では,高品質な骨層画像を生成する骨層分離GANフレームワークを提案する。生成された画像はビジュアルチューリングテストに合格し、下流タスクのパフォーマンスが向上した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:54:41 GMT)
Populating cellular metamaterials on the extrema of attainable elasticity through neuroevolution [4.2]
材料の異なる機械的特性間のトレードオフは、工学的材料設計における課題を提起する。我々は、多目的最適化(MOO)問題を効率的に解くために、神経進化アルゴリズムを用いる。本手法は多分野にわたる多種多様なメタマテリアルの計算的発見のための普遍的な枠組みとして機能する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:08:22 GMT)
Benchmarking Large Language Model Uncertainty for Prompt Optimization [4.2]
本稿では,不確実性指標を評価するためのベンチマークデータセットを提案する。現在のメトリクスは、正当性不確実性ではなく、出力の信頼性と多様性を反映したアンサー不確実性とより一致していることを示します。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:12:44 GMT)
HELPNet: Hierarchical Perturbations Consistency and Entropy-guided Ensemble for Scribble Supervised Medical Image Segmentation [4.0]
本稿では,新しいスクリブルベースの弱教師付きセグメンテーションフレームワークHELPNetを提案する。 HELPNetはアノテーション効率とセグメンテーション性能のギャップを埋めるために3つのモジュールを統合する。 HELPNetは、スクリブルベースの弱教師付きセグメンテーションの最先端手法を著しく上回っている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:52:01 GMT)
Effective and Lightweight Representation Learning for Link Sign Prediction in Signed Bipartite Graphs [4.0]
署名付き二部グラフを学習するための効率よく軽量なGNNベースのアプローチであるERISEを提案する。まず、メッセージパッシング中に署名されたエッジを組み込んで、署名された二部グラフにパーソナライズされた伝搬を拡張します。次に、符号付き二部グラフの低ランク近似にノード埋め込みを共同で学習し、潜在的なノイズを低減する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:39:38 GMT)
Don't Lose Yourself: Boosting Multimodal Recommendation via Reducing Node-neighbor Discrepancy in Graph Convolutional Network [3.9]
マルチモーダルレコメンデーションシステムは、視覚的およびテキスト的の観点から、ノードに関するパーソナライズされた情報を学ぶことができる。我々は,ノード近傍の離散性(RedNnD)を低減させることにより,特徴集約中のegoノードのパーソナライズされた情報を保持する新しいモデルを提案する。 3つの公開データセットの実験は、RedNnDが精度と堅牢性で最先端のパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:41:36 GMT)
Convergence of Decentralized Actor-Critic Algorithm in General-sum Markov Games [3.9]
一般的なマルコフゲームにおける学習アルゴリズムの特性について検討する。特に,各エージェントがアクター批判学習を動的に採用する分散アルゴリズムに着目した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:27:21 GMT)
Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.8]
本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。 3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:32:20 GMT)
MGAN-CRCM: A Novel Multiple Generative Adversarial Network and Coarse-Refinement Based Cognizant Method for Image Inpainting [3.6]
本稿では,GANモデルとResNetモデルを組み合わせた新しいアーキテクチャを提案する。我々のフレームワークは3つのコンポーネントを統合している。ガイドおよびブラインドインペイントのための変換畳み込みベースGAN、オブジェクト除去のための高速ResNet-Convolutional Neural Network(FR-CNN)、改良のためのコモディションGAN(Co-Mod GAN)である。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:54:28 GMT)
Independent and Decentralized Learning in Markov Potential Games [3.5]
マルチエージェント強化学習ダイナミクスについて検討し,無限水平割引マルコフポテンシャルゲームにおける収束度を解析した。我々は、プレイヤーがゲームパラメータを知らない、コミュニケーションやコーディネートができない、独立的で分散的な設定に焦点を当てる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:51:10 GMT)
Intra- and Inter-modal Context Interaction Modeling for Conversational Speech Synthesis [3.4]
会話音声合成(CSS)は,多モーダル対話履歴(MDH)を効果的に活用し,ターゲット発話に適切な会話韻律を用いた音声を生成することを目的としている。 CSSの主な課題は、MDHとターゲット発話の間のインタラクションをモデル化することである。モーダル内およびモーダル間対話型CSSシステム(III-CSS)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:35:59 GMT)
Enhancing tripartite photon-phonon-magnon entanglement by synergizing parametric amplifications [3.4]
量子情報科学における顕著な資源としての三部構造絡み合いは、ハイブリッド量子システムにおいて広く研究されている。光学パラメトリック増幅(OPA)とメカニカルパラメトリック増幅(MPA)の相乗効果を利用して三部体の絡み合いを高める方法を提案する。我々の研究は、絡み合いを簡単な調整で操作するための有望な方法を提供し、脆弱な量子資源の強化と保護のための有用なツールとして役立つかもしれない。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:35:12 GMT)
GAI: Generative Agents for Innovation [3.2]
本研究は, 創造的エージェント間の集団的推論が, イノベーションにつながる新規で一貫性のある思考を促進するかどうかを考察する。マルチジェネレーションエージェント間のリフレクションと相互作用を目的とした,新たなLDMを利用したフレームワークであるGAIを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:20:10 GMT)
Recommending Pre-Trained Models for IoT Devices [3.1]
PTM(Pre-trained Model)が利用可能になったことで、広範なトレーニングの必要性を減らし、アプリケーション全体の機械学習のデプロイが高速化された。しかしながら、各モデルの適合性を評価するにはコストがかかりすぎることが多い。LogME、LEEP、ModelSpiderといったアプローチは、徹底的なチューニングなしにタスクの妥当性を見積もることで、モデルの選定を効率化する。本稿では、ハードウェア制約に関する現在のモデルレコメンデーション手法の限界を特定し、PTM選択のための新しいハードウェア対応手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:19:55 GMT)
Using Large Language Models for Automated Grading of Student Writing about Science [2.9]
AIは、学生の文章を評価するために大きな言語モデル(LLM)を使用する可能性を導入した。 GPT-4を用いてLLMに基づく機械学習手法がインストラクターグレーティングの信頼性に適合するか否かを判定する実験を行った。結果はまた、評価内容とモードが類似している大学環境での非科学専攻にも適用されるべきである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:31:53 GMT)
TopoBDA: Towards Bezier Deformable Attention for Road Topology Understanding [2.8]
TopoBDA (Topology with Bezier Deformable Attention) は,道路トポロジーの理解を高める新しいアプローチである。 BDAはベジエ制御点を利用して変形可能な注意機構を駆動する。 TopoBDAはマルチカメラの360度画像を処理してBird's Eye View(BEV)機能を生成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:31:54 GMT)
MRI Reconstruction with Regularized 3D Diffusion Model (R3DM) [2.8]
正規化3次元拡散モデルと最適化手法を組み合わせた3次元MRI再構成法を提案する。拡散に基づく事前処理を取り入れることで,画像品質の向上,ノイズの低減,3次元MRI再構成の全体的な忠実度の向上を実現した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:55:05 GMT)
Few-shot Metric Domain Adaptation: Practical Learning Strategies for an Automated Plant Disease Diagnosis [2.8]
FMDA(Few-shot Metric Domain Adaptation)は、実用的なシステムにおける診断精度を高めるための柔軟で効果的なアプローチである。 FMDAは、ソース(トレーニング)データの特徴空間とターゲットデータとの"距離"を最小限に抑える診断モデルに制約を導入することで、ドメインの相違を低減します。大規模な実験では、FMDAはF1スコアを11.1点から29.3点に改善した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:01:30 GMT)
WaveDiffUR: A diffusion SDE-based solver for ultra magnification super-resolution in remote sensing images [2.8]
本稿では,ウェーブレット領域拡散URソルバであるWaveDiffURを導入し,UR過程を条件付きウェーブレット成分に対処するシーケンシャルサブプロセスに分解する。 WaveDiffURは、訓練済みSRモデルをプラグ・アンド・プレイモジュールとして組み込むことで、低周波の詳細(グローバル整合性を保証する)と高周波成分(局所忠実性を高める)を反復的に再構築する。固定境界条件の限界を極端に拡大するために,クロススケールピラミッド (CSP) フレームワークを導入する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:26:39 GMT)
Variational Bayesian Inference for Tensor Robust Principal Component Analysis [2.7]
現在のアプローチはテンソルの低ランク特性を正確に捉えるのにしばしば困難に遭遇する。我々は、低ランクテンソル核ノルムと一般化された空間誘導前とを統合したTRPCAのためのベイズ的フレームワークを紹介する。この方法は、重み付きテンソル核ノルムモデルに効率的に拡張することができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:29:09 GMT)
Mining Frequent Structures in Conceptual Models [2.6]
本稿では,概念モデルにおける頻繁な構造発見問題に対する一般的なアプローチを提案する。我々は、広く使われている2つの概念モデリング言語に焦点をあてて、我々のアプローチを実装した。このツールは、効果的なモデリングプラクティスと非効果的なモデリングプラクティスの両方を特定するのに使うことができる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:59:25 GMT)
Exponentially Improved Dispersive Qubit Readout with Squeezed Light [2.6]
IESとICSを併用することで、任意の測定時間でSNRを指数関数的に改善できることを示す。短時間の測定では、SNRは2倍のスクイーズパラメータで指数関数的に改善される。この研究は、量子エラー補正とフォールトトレラント量子計算にすぐに応用できる、分散量子ビットの読み出しのために、シャープされた光を探索するための有望な道を提供する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:06:08 GMT)
Automated and Complete Generation of Traffic Scenarios at Road Junctions Using a Multi-level Danger Definition [2.6]
本稿では,任意の道路交差点において,完全な(潜在的に危険な)抽象シナリオを導出する手法を提案する。これらの抽象的なシナリオから、アクターがシミュレーションベースのテストをガイドするために従わなければならない正確なパスを導き出す。その結果, AV-under-test はシミュレーションにおける不安全行動の割合の増加に関与していることがわかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:40:40 GMT)
Graph Cut-guided Maximal Coding Rate Reduction for Learning Image Embedding and Clustering [2.5]
本稿では,構造化埋め込みとクラスタリングを共同で学習するための統合フレームワーク,CgMCR(Cut-guided Maximal Coding Rate Reduction)を提案する。我々は、標準画像データセットと外部画像データセットの両方について広範な実験を行い、提案手法の有効性を実験的に検証した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:20:54 GMT)
Biomedical Open Source Software: Crucial Packages and Hidden Heroes [2.4]
バイオメディカルペーパーで使用されるソフトウェアの依存関係をマップし、ソフトウェアエコシステムに不可欠なパッケージを見つけます。ソフトウェア依存ネットワークの集中度指標を提案し,3つのエコシステム(PyPi,CRAN,Bioconductor)を分析し,最も集中度の高いパッケージを決定する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:31:21 GMT)
MiTREE: Multi-input Transformer Ecoregion Encoder for Species Distribution Modelling [2.4]
我々は、エコリージョンエンコーダを備えたマルチインプット・ビジョン・トランスフォーマー・モデルであるMiTREEを紹介する。夏期と冬期のサットバードデータセットを用いて,鳥種の出現率を予測することを目的として,本モデルの評価を行った。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:20:47 GMT)
On Improved Regret Bounds In Bayesian Optimization with Gaussian Noise [2.3]
BOアルゴリズムの収束解析は、目的のためのベイズ的および頻繁な設定の下での累積的後悔に焦点を当てている。我々はガウス雑音の頻繁な設定の下で,GPの予測誤差に新たな点を定めている。 GP-UCB と GP-TS の累積後悔結合の収束率の改善を証明した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:57:27 GMT)
Two-stage Quantum Estimation and the Asymptotics of Quantum-enhanced Transmittance Sensing [2.2]
量子状態に埋め込まれた未知のパラメータを推定する。要求される測定は、しばしば利子のパラメータの真の価値に依存する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:00:47 GMT)
Forensics of Transpiled Quantum Circuits [2.1]
多くのサードパーティクラウドプロバイダは、最小コストでパフォーマンスを最大化するために、量子ハードウェアをサービスとしてセットアップした。回路の実行の可視性はほとんどない。我々は、回路のトランスパイルが行われたハードウェアの結合マップを、トランスパイルされたプログラムから追跡する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:10:34 GMT)
Tempus Core: Area-Power Efficient Temporal-Unary Convolution Core for Low-Precision Edge DLAs [2.0]
単項行列乗算ハードウェアは、データの分散性と低精度な値を活用し、ハードウェア効率を向上させることを目的としている。このような一元的ハードウェアを商用ディープラーニングアクセラレータ(DLA)に統合することは、処理要素(PE)配列データフローの違いによって制限されている。この研究は、Tempus Coreという、高度にスケーラブルな単項ベースのPEアレイを備えた畳み込みコアを、浴槽(時空単項)乗算器で提示する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 23:20:02 GMT)
Unified Local and Global Attention Interaction Modeling for Vision Transformers [2.0]
本稿では,視覚変換器(ViT)の自己認識機構を拡張し,多様なデータセット間でより正確な物体検出を行う手法を提案する。 ViTは、オブジェクト検出、セグメンテーション、分類などの画像理解タスクに強力な能力を示す。従来の自己意識フレームワークには,局所的特徴混合のための新たなアグレッシブ・コンボリューション・プール戦略と,新たな概念的アテンション・トランスフォーメーションという,2つの改良が加えられている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:53:19 GMT)
Quantum Computing for Automotive Applications [1.9]
この章では、自動車のバリューチェーンにおける効率性、正確性、スケーラビリティを高めるために、最先端の量子アルゴリズムを調査します。我々は, 短期および耐故障性アルゴリズムにおける鍵となる課題と, 産業応用におけるその実践的利用について論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:32:02 GMT)
RadioRAG: Factual large language models for enhanced diagnostics in radiology using online retrieval augmented generation [1.8]
大規模言語モデル(LLM)は、しばしば静的トレーニングデータセットに基づいて時代遅れまたは不正確な情報を生成する。 RAG(Radio-to-end framework, 無線RAG)は, 信頼できる無線オンラインソースからデータをリアルタイムに取得するフレームワークである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:49:52 GMT)
Optimal Federated Learning for Functional Mean Estimation under Heterogeneous Privacy Constraints [1.4]
Federated Learning(FL)は、データのプライバシとセキュリティを保護するために設計された分散機械学習技術である。本稿では,フェデレーション環境での離散サンプリングデータからの最適関数平均推定の問題に対処する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:06:12 GMT)
Distortion-Aware Adversarial Attacks on Bounding Boxes of Object Detectors [1.3]
本研究では, 物体検出装置を騙し, 最先端検出器の脆弱性を露呈する新しい手法を提案する。本手法は, テスト段階における各クラスに対する信頼度予測に不可欠である, トレーニング中に物体の信頼度を摂動することで, 対向画像を生成することを目的とする。提案手法を検証するために, YOLOv8, Faster R-CNN, RetinaNet, Swin Transformer などの最新の最先端モデルを含む, 異なる物体検出器に対する対向攻撃を行う。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:51:57 GMT)
Evaluating deep learning models for fault diagnosis of a rotating machinery with epistemic and aleatoric uncertainty [1.3]
本稿では,回転機械の故障診断における不確実性を考慮したディープラーニングアーキテクチャの比較研究について述べる。我々は,識別に使用する不確実性しきい値によらず,深層アンサンブルモデルが優れた性能を示すことを示す。本研究は, 現実の不確実性を認識した故障診断システムを展開しなければならない実践者や研究者にガイダンスを提供する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 20:22:59 GMT)
Optimizing Large Language Models with an Enhanced LoRA Fine-Tuning Algorithm for Efficiency and Robustness in NLP Tasks [1.2]
そこで本研究では,改良されたLoRAファインチューニングアルゴリズムに基づく大規模言語モデル最適化手法を提案する。低ランク適応戦略によって大きな言語モデルを微調整し、計算資源の消費を大幅に削減する。改良されたLoRAアルゴリズムでは、従来のモデルと比較して精度、F1スコア、MCCが大幅に改善されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:10:25 GMT)
Malware Classification using a Hybrid Hidden Markov Model-Convolutional Neural Network [1.2]
隠れマルコフモデル(HMM)と畳み込みニューラルネットワーク(CNN)を用いて抽出した特徴を組み合わせたハイブリッドアーキテクチャに基づく新しいアプローチを提案する。一般的なMaliciaデータセットに対するアプローチの有効性を実証し、他の機械学習手法と比較して優れた性能を得る。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:34:57 GMT)
Advantages of fixing spins in quantum annealing [1.1]
サイズ縮小法は、量子アニールに直接入力できない大規模な最適化問題を扱うために用いられる。固定スピンを用いた様々なサイズ縮小法が量子古典ハイブリッド法として提案されている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:44:00 GMT)
FOR: Finetuning for Object Level Open Vocabulary Image Retrieval [1.1]
我々は、オブジェクト中心のオープン語彙画像検索のためのファインタニングを提案し、クローズドセットラベルを用いてターゲットデータセットのファインタニングを可能にする。 FORは、意図したタスク用にカスタマイズされたCLIPヘッドの特別なデコーダ版と、多言語トレーニングフレームワーク内の結合という2つの設計要素に基づいている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:08:51 GMT)
Learning Broken Symmetries with Approximate Invariance [1.0]
多くの場合、正確な基礎となる対称性は理想化されたデータセットにのみ存在し、実際のデータに分解される。データ拡張や同変ネットワークのような標準的なアプローチは、完全な、壊れた対称性の性質を表現できない。本稿では,制約のないネットワークの一般性と性能と,制約のないネットワークの高速学習のバランスをとる学習モデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:29:04 GMT)
Taming the Memory Beast: Strategies for Reliable ML Training on Kubernetes [1.0]
本稿では、メモリ要求、制限、Quality of Serviceクラス、MLワークロードの排除ポリシーの扱い方法について概説する。オーバーコミットやメモリリーク,一時容積の枯渇など,一般的な落とし穴について検討した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:36:22 GMT)
Exploring Multiple Strategies to Improve Multilingual Coreference Resolution in CorefUD [0.9]
我々はCorefUD 1.1データセットを利用した新しいエンドツーエンドのニューラルコア参照解決システムを提案する。提案モデルは、標準のエンドツーエンドのニューラルコア参照解決システムに基づいている。多様な言語文脈における性能向上のためのいくつかの拡張を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:11:46 GMT)
Cross-PCR: A Robust Cross-Source Point Cloud Registration Framework [0.7]
本稿では,ロバストかつ高精度なクロスソース登録を実現するために,密度ロバストな特徴抽出とマッチング方式を提案する。オープンソース3DCSRデータセットのKinect-LiDARシーンでは,特徴マッチングリコールを63.5ポイント (pp) ,登録リコールを57.6pp。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:14:59 GMT)
Skeleton-based Action Recognition with Non-linear Dependency Modeling and Hilbert-Schmidt Independence Criterion [0.7]
任意の関節間の依存関係を明示的にモデル化する,新しい依存性改善手法を提案する。また、Hilbert-Schmidt Independence Criterionを利用して、データ次元の影響を受けずにアクションクラスを区別するフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:02:11 GMT)
UPCS: Unbiased Persona Construction for Dialogue Generation [0.6]
既存のペルソナプロファイルは、しばしばバイアスを示し、システムの完全性と公平性にリスクを及ぼす。キャラクタ記述を8次元に分類する UPCS フレームワークを導入する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:54:44 GMT)
3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding [0.6]
3Dシーングラフはコンパクトなシーンモデルを表し、オブジェクトに関する情報とそれらの間のセマンティックな関係を格納する。本研究では,3Dシーングラフの学習可能な表現を構築するための3DGraphLLMを提案する。学習可能な表現は、3次元視覚言語タスクの実行にLLMの入力として使用される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:13:41 GMT)
IUST_PersonReId: A New Domain in Person Re-Identification Datasets [0.5]
個人の再識別モデルは、様々な文化的文脈にまたがる一般化に苦慮することが多い。既存のデータセットは、主に西洋と東アジアのファッションを特徴とし、これらの設定で適用性を制限する。新しい文化環境におけるReIDのユニークな課題を反映したデータセットであるIUST_PersonReIdを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:17:43 GMT)
Lower bounds for quantum-inspired classical algorithms via communication complexity [0.5]
線形回帰の解法,クラスタリングの監督,主成分分析,レコメンデーションシステム,ハミルトニアンシミュレーションに焦点をあてる。基底行列のフロベニウスノルムの観点で二次下界を証明する。これらの問題に対する量子アルゴリズムはフロベニウスノルムにおいて線型であるため、この結果は量子古典的分離が少なくとも二次的であることを意味する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:43:07 GMT)
Bayesian Critique-Tune-Based Reinforcement Learning with Adaptive Pressure for Multi-Intersection Traffic Signal Control [0.5]
本稿では,多区間信号制御(BCT-APLight)のための適応的圧力を用いた批判-テュンベース強化学習を提案する。 BCT-APLightは、7つの実世界のデータセット上の他の最先端(SOTA)メソッドよりも優れている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:24:00 GMT)
U-Turn Diffusion [0.5]
我々は,GTサンプル情報をスコア関数(SF)にエンコードする方法に注目した。本稿では,事前学習した拡散モデルの拡張であるU-Turn拡散を提案する。 ImageNetデータセットのクラス条件SFの実験では、臨界記憶時間$T_mが明らかにされている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:35:24 GMT)
Dynamic Token Selection for Aerial-Ground Person Re-Identification [0.4]
AGPReIDに適した新しい動的トークン選択変換器(DTST)を提案する。入力画像を複数のトークンに分割し、各トークンは画像内のユニークな領域や特徴を表す。我々はTop-k戦略を用いて、識別に不可欠な重要な情報を含む最も重要なトークンkを抽出する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:13:58 GMT)
Stationary Processes, Wiener-Granger Causality, and Matrix Spectral Factorization [0.4]
本稿では,Grangerの因果関係を詳細に概説し,その歴史的発展を辿り,近年の計算技術の進歩が様々な分野への応用をいかに促進するかを考察する。提案手法の今後の方向性について,特に大規模データ分析の文脈で論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:29:39 GMT)
Fidelity decay and error accumulation in random quantum circuits [0.4]
忠実度は、回路深さとアーキテクチャ依存のパワーに上昇する量子ビットの数の両方で指数関数的に減衰する。量子ボリュームテストにおいて量子プロセッサをベンチマークするために用いられる重出力周波数と忠実度との間には、堅牢な線形関係が確立される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:08:02 GMT)
Optimization and Scalability of Collaborative Filtering Algorithms in Large Language Models [0.3]
協調フィルタリングアルゴリズムは多くのレコメンデーションシステムの中核である。従来の協調フィルタリング手法は、大規模LLMベースのシステムに統合された場合、多くの課題に直面している。本稿では,大規模言語モデルにおける協調フィルタリングアルゴリズムの最適化と拡張性について検討する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:26:51 GMT)
Robust Point Matching with Distance Profiles [0.3]
距離プロファイルに基づくマッチング手法の頑健性と雑音安定性を示す。提案手法は,外乱や雑音があっても高い確率で適用可能であることを示す理論的解析を行う。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 06:20:45 GMT)
Designing fault-tolerant circuits using detector error models [0.3]
本稿では,回路レベルでの耐故障性を完全に把握する検出誤差モデルの強力な形式性について検討する。フォールトトレラント回路設計の工学サイクルにおける3つの抽象化レベルにフォーマリズムを適用した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 11:00:09 GMT)
State-dependent mobility edge in kinetically constrained models [0.3]
運動論的に制約された量子東モデルが、量子スカーレッドと多体局在系の間に存在することを示す。我々はこのシナリオを$textitstate-dependent$ Mobility edgeと名付け、このシステムは熱と非熱の固有状態の間のエネルギーの急激な分離を示さないが、非熱の固有状態の豊富さは、ゆっくりと絡み合う成長をもたらす。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:14:04 GMT)
MTCAE-DFER: Multi-Task Cascaded Autoencoder for Dynamic Facial Expression Recognition [0.2]
本稿では、動的表情認識のための自動エンコーダに基づくマルチタスク学習(MTL)フレームワークのカスケードネットワークブランチを拡張した。オートエンコーダを用いたマルチタスク学習手法を用いて,動的顔検出と動的顔ランドマークが動的表情認識に与える影響を探索する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 21:52:31 GMT)
Resource-Efficient Transformer Architecture: Optimizing Memory and Execution Time for Real-Time Applications [0.2]
本稿では,メモリ使用量と実行時間を大幅に削減するメモリ効率変換器モデルについて述べる。その結果、メモリ使用量の52%削減と実行時間の33%削減が達成され、最先端モデルよりも効率が向上した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:41:23 GMT)
Cryptanalysis of authentication and key establishment protocol in Mobile Edge Computing Environment [0.1]
暗号解析は、鍵計算攻撃、モバイルユーザー偽装攻撃、トレーサビリティ攻撃に対する堅牢性の提供に失敗したことを示す。これらのスキームの脆弱性は、モバイルユーザの長期的な秘密をモバイルエッジサーバに公開することにつながる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:33:43 GMT)
Whose Morality Do They Speak? Unraveling Cultural Bias in Multilingual Language Models [0.0]
大規模言語モデル(LLM)は様々な分野において重要なツールとなっているが、その道徳的推論能力はいまだに未熟である。本研究は, GPT-3.5-Turbo などの多言語 LLM が文化的に特定の道徳的価値観を反映しているか,それとも支配的な道徳的規範を強制するかを検討する。 8つの言語でMFQ-2(Moral Foundations Questionnaire)を改訂し、モデルが6つのコアモラル基礎に忠実であることを分析する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:17:15 GMT)
Unveiling Secrets of Brain Function With Generative Modeling: Motion Perception in Primates & Cortical Network Organization in Mice [0.0]
この本は、生成モデリングの応用を通じて神経科学の問題に対処する2つの主要なプロジェクトで構成されている。プロジェクト#1は、脳の受容の構造を調査します。プロジェクト#2は、マウス大脳皮質が自然界に分解できることを示している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:39:18 GMT)
Unlocking the Power of Patch: Patch-Based MLP for Long-Term Time Series Forecasting [0.0]
近年,Transformer アーキテクチャを改良し,長期連続予測タスクの有効性を実証する研究が進められている。これらのモデルの有効性は, 適用されたパッチ機構に大きく寄与する。 LTSFタスクのための新しいシンプルなパッチベースコンポーネント(PatchMLP)を提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:07:56 GMT)
Trees that can be grown in "too many" ways: A review of Bouch's construction [0.0]
平方格子上の木々のボウチ[1]による階層構造について、その根から$L!/CL$の異なる方法で成長することができることを概観する。この結果は、2次元以上の量子スピン系の作用素成長に影響を及ぼす。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:56:21 GMT)
Thermodynamic and Real-time Dynamic Properties of Complex Sachdev-Ye-Kitaev Model [0.0]
cSYKモデルはファン・デル・ワールス=マクスウェル系に見られる一階相転移を著しく反映している。我々はファンデルワールス相転移とcSYKモデルとの類似性を詳細に分析し、化学ポテンシャルが系の相転移を駆動するメカニズムを探求する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:33:55 GMT)
Thermal-Mechanical Physics Informed Deep Learning For Fast Prediction of Thermal Stress Evolution in Laser Metal Deposition [0.0]
金属添加物製造(AM)における熱応力の進化を理解することは高品質な部品の製造に不可欠である。機械学習(ML)の最近の進歩は、金属AMの複雑な多物理問題をモデル化する大きな可能性を示している。本研究では、物理法則を深層ニューラルネットワーク(NN)に組み込んだ物理インフォームドニューラルネットワーク(PINN)フレームワークを導入し、温度と熱応力の進化を予測する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 05:37:48 GMT)
The moments of the spectral form factor in SYK [0.0]
カオス量子系において、スペクトル形成因子は、重畳された不規則振動を伴う普遍線型ランプとプラトー構造を示す。本研究では,SYKモデルにおいて,ランプ領域の時間を記述するサドル点を同定する。我々は、スペクトル形状因子が高雑音の指数的傾斜を示す$q=2$SYKモデルについて検討した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 01:50:28 GMT)
The Patterns of Digital Deception [0.0]
新たなデータ分析技術は、企業と顧客間のパワーバランスを損なう。オンライン追跡により、売り手は履歴データを収集し、機械学習ツールを適用して詳細な顧客プロフィールを構築することができる。同じツールが病気にも使われており、弱さを狙うために特別に調整された詐欺で、人口の脆弱なメンバーを標的にしている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:55:17 GMT)
Shallow Implementation of Quantum Fingerprinting with Application to Quantum Finite Automata [0.0]
量子フィンガープリントは長さ (n) の単語 (x in 0,1n) を (O(log n)) qubits の状態 (ketpsi(x)) にマッピングし、 (O(n)) ユニタリ演算を使用する。現在の量子コンピュータの利用可能な全ての量子ビットを用いた量子指紋の計算は、多数の量子演算のために不可能である。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:26:06 GMT)
Random Forest Regression Feature Importance for Climate Impact Pathway Detection [0.0]
気候源のチェーンRF時流ダウンストリームの影響を発見・ランク付けする手法を開発した。我々はRandom Forest Regression (RFR) とSHAP (SHAP) を重要視している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:35:39 GMT)
Quantum memristors for neuromorphic quantum machine learning [0.0]
量子メムリスタは、同じ量子ハードウェアにおいて、測定とフィードフォワードによって提供される非線形性とユニタリ進化を結合する方法として期待されている。量子機械学習のためのニューロモルフィック量子コンピューティングを効果的に展開する方法が有効である。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 20:21:24 GMT)
Proof of absence of local conserved quantities in two- and higher-dimensional quantum Ising models [0.0]
我々は、1より高次元の超立方体格子上の横場と縦場を持つイジング模型がハミルトニアン以外の局所保存量を持たないことを証明した。その結果,最近開発された1次元システムにおける局所保存量の欠如を,高次元およびはしごに拡張した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:30:52 GMT)
Projected Forward Gradient-Guided Frank-Wolfe Algorithm via Variance Reduction [0.0]
本稿では、深層ニューラルネットワークのトレーニングにフランク・ウルフアルゴリズム(FW)を用いることを目標とする。任意のアルゴリズムと同様に、FWはDNNの計算において高い計算メモリコストに悩まされる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:29:42 GMT)
Physics-Enhanced Machine Learning: a position paper for dynamical systems investigations [0.0]
物理強化機械学習(英: Physics-Enhanced Machine Learning、PEML)は、科学機械学習とも呼ばれる。 PEMLアプローチの3つの幅広いグループについて論じる: 物理誘導、物理符号化、物理インフォームド。複雑な力学系を含む工学アプリケーションにおいて, PEML 戦略の利点と課題について述べる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 10:13:28 GMT)
Opinion: The simplest quantum computer [0.0]
私は2040年のふりかえりを書きます。この「量子コンピューティング」がどうなったのかお話しします。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:58:37 GMT)
ObitoNet: Multimodal High-Resolution Point Cloud Reconstruction [0.0]
ObitoNetはマルチモーダル入力を統合するためにクロスアテンション機構を採用している。学習したマルチモーダル機能は、高解像度のポイントクラウド再構成のためのトランスフォーマーベースのデコーダに入力される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 04:34:22 GMT)
MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models [0.0]
医療大言語モデル(MLLM)は医療応用の可能性を示している。幻覚に対する寛容性は、患者医療に重大なリスクをもたらす。本稿では,MLLMにおける幻覚の評価と緩和のためのベンチマークフレームワークであるMedHallBenchを紹介する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:51:29 GMT)
Landauer's principle and information at the cosmological horizon [0.0]
宇宙の膨張する地平線における情報損失は、効率的な情報消去のためのランダウアーの原理に従わないことを示す。我々は、この結果がブラックホールにおける情報損失と「宇宙情報パラドックス」と呼ばれる宇宙の見かけの地平線との相違をもたらす意味について論じる。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:00:09 GMT)
LLM-assisted vector similarity search [0.0]
本稿では,ベクトル類似性探索とLarge Language Models(LLMs)を組み合わせたハイブリッド手法を提案する。構造化データセットの実験では、ベクトル類似性検索は単純なクエリに対してのみうまく機能するが、LLM支援アプローチは制約、否定、概念的な要求を含む複雑なクエリを処理するのに優れている。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:17:37 GMT)
Injecting Bias into Text Classification Models using Backdoor Attacks [0.0]
バイアス注入という新たな目的のために,バックドア攻撃を活用することを提案する。トレーニングデータセットのサブセットが毒され、強い男性アクターと否定的な感情を関連付けるバックドアアタックを開発する。その結果,バックドアモデルの良性分類精度の低下は限定的であることがわかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:32:02 GMT)
Heuristics for Inequality minimization in PageRank values [0.0]
本研究は、PageRankの不平等を評価するために、収入/富の不平等の尺度であるGini係数を用いている。その結果,2つの異なる決定論的分布の組み合わせは,不等式を最小化するための効果的な戦略を示す可能性が示唆された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 08:53:18 GMT)
Geospatial Data Fusion: Combining Lidar, SAR, and Optical Imagery with AI for Enhanced Urban Mapping [0.0]
本研究では,高度都市マッピングのための高度な人工知能技術によるライダー,合成開口レーダ(SAR),光学画像の統合について検討する。この研究は、都市の特徴抽出のための主要なディープラーニングモデルとして、FCN(Fully Convolutional Networks)を採用している。主な発見は、FCN-PSOモデルが92.3%の画素精度、IoUの平均インターセクションは87.6%で、従来の単一センサーのアプローチを上回ったことを示している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:17:31 GMT)
GenPlan: Generative Sequence Models as Adaptive Planners [0.0]
シーケンスモデルは、以前に収集されたデモを活用することで、行動計画において顕著な成功を収めた。しかし、特にプランナーが目に見えない制約やタスクに適応しなければならない場合、マルチタスクミッションの解決は重要な課題である。本稿では,適応型プランナのための離散フローモデルGenPlanを提案する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:45:43 GMT)
GSAVS: Gaussian Splatting-based Autonomous Vehicle Simulator [0.0]
本稿では,自律走行車モデルの作成と開発を支援する自律走行車シミュレータGSAVSを紹介する。シミュレータ内のすべての資産は、車両と環境を含む3Dガウススプラ板である。シミュレーターは古典的な3Dエンジン内で動作し、3Dガウスのスプレートをリアルタイムでレンダリングする。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 07:52:09 GMT)
Fusion of Deep Learning and GIS for Advanced Remote Sensing Image Analysis [0.0]
本稿では地理情報システム(GIS)を用いた深層学習技術を用いたリモートセンシング画像解析のための革新的なフレームワークを提案する。主な目的は、高次元、複雑なパターン、時間的データ処理に関わる課題を克服することで、空間データ解析の精度と効率を高めることである。その結果,分類精度は78%から92%に,予測誤差は12%から6%に低下した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 22:10:35 GMT)
Flat Bands and Compact Localised States: A Carrollian roadmap [0.0]
一次元フェルミオン系の構築において,キャロル対称性が重要であることを示す。我々はこの理論を、ゼロと有限の化学的ポテンシャルの両方について詳細に分析する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 18:54:45 GMT)
Enhanced Recommendation Combining Collaborative Filtering and Large Language Models [0.0]
大規模言語モデル(LLM)はレコメンデーションシステムに新たなブレークスルーを提供する。本稿では,協調フィルタリングとLLMを組み合わせたレコメンデーション手法を提案する。その結果,協調フィルタリングとLCMに基づくハイブリッドモデルは,精度,リコール,ユーザ満足度を著しく向上させることがわかった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:23:53 GMT)
Diffraction of walking drops by a standing Faraday wave [0.0]
振動する液体浴の表面を移動する液滴が定常波によって偏向されるパイロット波流体力学における類似現象を報告する。パラメータ構造によっては,カピツァ・ディラック効果で観測されたような回折パターンが示される。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 15:51:06 GMT)
Detection and classification of DDoS flooding attacks by machine learning method [0.0]
本研究では,ニューラルネットワークを用いた分散型サービス拒否攻撃(DDoS)の検出と分類に焦点をあてる。通常のトラフィックとさまざまなDDoS攻撃を含むデータセットを使用して、24-106-5アーキテクチャでニューラルネットワークモデルをトレーニングした。このモデルは高い精度(99.35%)、精度(99.32%)、リコール(99.54%)、Fスコア(0.99)を達成した。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 21:58:52 GMT)
Designing three-way entangled and nonlocal two-way entangled single particle states via alternate quantum walks [0.0]
我々は、量子粒子の3自由度を含む最初の分離可能な状態から真の3方向の絡み合いを生成する。また、粒子の非局所的な位置自由度の間の負性によって定量化される最適非局所的二方向絡み合わせを生成する。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:56:40 GMT)
Derandomized shallow shadows: Efficient Pauli learning with bounded-depth circuits [0.0]
本稿では,非可換量子オブザーバブルの集合を効率的に学習するためのデランドマイズド浅部影(DSS)アルゴリズムを提案する。提案アルゴリズムは, テンソルネットワーク技術により, 浅い測定回路の集合を出力する。結果から,DSSは複数の非可換オブザーバブルを推定する必要がある多くの大きなアルゴリズムの恩恵を受ける可能性が示唆された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 19:23:29 GMT)
Data clustering: an essential technique in data science [0.0]
本稿では,クラスタリングの基本原理を概観し,共通ツールと手法を導入し,データサイエンスにおけるその多様な応用について検討する。この議論は、今後の方向性に関する洞察で締めくくられ、イノベーションを推進し、データ駆動意思決定を可能にするクラスタリングの集中性を強調している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:14:18 GMT)
Comprehensive Study on Lumbar Disc Segmentation Techniques Using MRI Data [0.0]
本研究では,ResUnext,Ef3 Net,UNet,TransUNetなどの高度なディープラーニングアーキテクチャによる腰椎椎間板分割の有効性を評価する。 ResUnextは高いセグメンテーション精度を達成し、Pixelの精度は0.9492、Dice Coefficientは0.8425、TransUNetはそれに続く。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 12:54:52 GMT)
Can Schroedingerist Wavefunction Physics Explain Brownian Motion? III: A One-Dimensional Heavy and Light Particles Model Exhibiting Brownian-Motion-Like Trajectories and Diffusion [0.0]
有限級数を与え、BML軌道と拡散の基準を満たす一次元摂動モデルを導入する。プランク定数は拡散係数に現れ、これは前世紀におけるポインケアとアインシュタインの研究と現在の理論をさらに区別するものである。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 13:52:06 GMT)
Bridging Interpretability and Robustness Using LIME-Guided Model Refinement [0.0]
LIME(Local Interpretable Model-Agnostic Explanations)は、モデルロバスト性を体系的に強化する。複数のベンチマークデータセットに対する実証的な評価は、LIME誘導の洗練は解釈可能性を改善するだけでなく、敵の摂動に対する耐性を著しく向上し、アウト・オブ・ディストリビューションデータへの一般化を促進することを示している。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 17:32:45 GMT)
Bipartite polygon models: entanglement classes and their nonlocal behaviour [0.0]
我々は、qubit状態空間を含む幅広い操作理論のクラスにおけるハーディの非局所的挙動について検討する。この結果から, 明示的な操作モデルに関連付けられるような, ほとんど量子相関の探索されていないクラスが明らかになった。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 16:55:59 GMT)
BCR-Net: Boundary-Category Refinement Network for Weakly Semi-Supervised X-Ray Prohibited Item Detection with Points [0.0]
点を用いた半監督X線禁止項目検出(WSSPID-P)について検討した。 textbfBoundary-textbfCategory textbfRefinement textbfNetwork (textbfBCR-Net) を提案する。 BCR-Net は Group R-CNN をベースとして構築され、新しいBundary Refinement (BR) モジュールと新しいCalegory Refinement (CR) が導入された。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 14:37:05 GMT)
Architecture for fast implementation of qLDPC codes with optimized Rydberg gates [0.0]
データとアシラキュービットの最適化されたレイアウトは、非局所パリティチェック演算子に必要な最大ユークリッド通信距離を減少させる。最適化されたレイアウトとゲート設計の組み合わせは、以前の設計よりも2倍に改善された、$[[144,12,12]のコードに対して$sim 1.28rm ms$の量子エラー補正サイクル時間をもたらす。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 03:30:34 GMT)
A Systems Thinking Approach to Algorithmic Fairness [0.0]
システム思考は、アルゴリズムの公平性問題をモデル化する方法を提供する。フェアネス問題を複雑なシステムとして扱うことで、機械学習、因果推論、システムダイナミクスのテクニックを組み合わせることができる。これは、政治的通路の両側の政策立案者が、異なる種類の公正政策から存在する複雑なトレードオフを理解するのに役立つ。
論文参考訳（メタデータ） (Wed, 25 Dec 2024 00:49:04 GMT)