Fugu-MT: arxivの論文翻訳(概要)

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation [106.4]
本稿では,ビデオ中の異常検出のための非常に高速なフレームレベルモデルを提案する。複数の高精度なオブジェクトレベルの教師モデルから知識を抽出することで、異常を検出することを学ぶ。提案モデルでは,これまで聞こえなかった1480 FPSの速度のため,速度と精度の最良のトレードオフを実現している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:01:00 GMT)
Case2Code: Learning Inductive Reasoning with Synthetic Data [105.9]
プログラムの表現性と正確性を利用したtextbfCase2Code タスクを提案する。まず、合成したCase2Codeタスクにおける代表LLMを評価し、LLMにおいてケース・ツー・コード誘導が困難であることを実証する。実験結果から,このような帰納的学習は,Case2Codeの性能だけでなく,学習用LLMの各種符号化能力の向上にも寄与することがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:35:00 GMT)
RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.4]
Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。 Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:49:34 GMT)
$\textit{GeoHard}$: Towards Measuring Class-wise Hardness through Modelling Class Semantics [90.9]
この作業は、$textitclass-wise hardness$という概念を正式に開始する。 8つの自然言語理解(NLU)データセットに対する実験は、学習パラダイム、モデル、人間の判断にまたがる一貫した硬さ分布を示す。 $textitGeoHard$は、$textitPearson$のクラスワイド硬度測定の相関で、インスタンスレベルのメトリクスを59%以上上回る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:53:39 GMT)
Distilling Diffusion Models into Conditional GANs [90.8]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。 E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:38:23 GMT)
Learning Task Decomposition to Assist Humans in Competitive Programming [90.5]
タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:24:44 GMT)
HIMO: A New Benchmark for Full-Body Human Interacting with Multiple Objects [86.9]
HIMOは、複数のオブジェクトと相互作用するフルボディの人間のデータセットである。 HIMOは3.3K 4D HOIシーケンスと4.08M 3D HOIフレームを含む。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:47:34 GMT)
Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [85.9]
複数のエージェントが"tit for tat"の状態で議論を表現するマルチエージェント議論(MAD)フレームワークを提案し、審査員が議論プロセスを管理して最終解を得る。我々のフレームワークは、深い熟考を必要とするタスクに役立ちそうなLSMにおける散発的思考を奨励する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:56:01 GMT)
Any Target Can be Offense: Adversarial Example Generation via Generalized Latent Infection [83.7]
GAKerは任意のターゲットクラスに対して逆例を構築することができる。本手法は,未知のクラスに対する攻撃成功率を約14.13%で達成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:24:09 GMT)
GeoGaussian: Geometry-aware Gaussian Splatting for Scene Rendering [83.2]
ガウススプレイティング最適化の過程で、その構造が意図的に保存されていない場合、シーンの幾何学は徐々に悪化する。我々はこの問題を緩和するためにGeoGaussianと呼ばれる新しいアプローチを提案する。提案するパイプラインは、新しいビュー合成と幾何再構成において最先端の性能を達成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:11:14 GMT)
WildDeepfake: A Challenging Real-World Dataset for Deepfake Detection [82.4]
我々は,インターネットから完全に収集された707のディープフェイクビデオから抽出された7,314の顔シーケンスからなる新しいデータセットWildDeepfakeを紹介した。既存のWildDeepfakeデータセットと我々のWildDeepfakeデータセットのベースライン検出ネットワークを体系的に評価し、WildDeepfakeが実際により困難なデータセットであることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:59:39 GMT)
GLARE: Low Light Image Enhancement via Generative Latent Feature based Codebook Retrieval [81.0]
我々は、GLARE(Generative LAtent Feature based codebook Retrieval)を介して、新しい低照度画像強調(LLIE)ネットワークを提案する。 Invertible Latent Normalizing Flow (I-LNF) モジュールを開発し、LL特徴分布をNL潜在表現に整合させ、コードブック内の正しいコード検索を保証する。さまざまなベンチマークデータセットと実世界のデータに対するGLAREの優れたパフォーマンスを確認する実験。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:40:15 GMT)
Establishing Knowledge Preference in Language Models [80.7]
言語モデルは事前学習を通じて大量の事実知識を符号化することが知られている。このような知識はユーザーからの要求に応えるには不十分かもしれない。進行中のイベントに関する質問に答える場合には、最新のニュース記事を使って回答を更新する必要がある。ある事実がモデルで編集されると、更新された事実はモデルによって学習されたすべての事前知識をオーバーライドする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:16:11 GMT)
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold [79.9]
DragGANはGAN(Generative Adversarial Network)を制御する新しい方法である DragGANを使えば、ピクセルの行き先を正確に制御して、動物、車、人間、風景などのさまざまなカテゴリのポーズ、形状、表現、レイアウトを操作することができる。定性的かつ定量的な比較は、画像操作や点追跡のタスクにおいて、以前のアプローチよりもDragGANの利点を示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:27:55 GMT)
Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.8]
大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:34:45 GMT)
Interpreting the Weight Space of Customized Diffusion Models [79.1]
本研究では,多種多様な拡散モデルによる重みの空間について検討する。私たちは6万以上のモデルのデータセットを作成して、このスペースをポップアップさせ、それぞれが異なる人の視覚的アイデンティティを挿入するために微調整されたベースモデルです。我々は、この空間の3つの即時応用、サンプリング、編集、反転を実演する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:01:11 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:33:26 GMT)
Non-Vacuous Generalization Bounds for Large Language Models [78.4]
事前訓練された大言語モデルに対して、最初の空でない一般化境界を提供する。より大きいモデルはより優れた一般化バウンダリを持ち、より小さなモデルよりも圧縮可能であることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:32:47 GMT)
Faster Diffusion via Temporal Attention Decomposition [77.9]
テキスト条件拡散モデルにおける推論における注意機構の役割について検討する。我々は、時間的注意づけ(TGATE)として知られるトレーニング不要の手法を開発した。 TGATEは、スケジュールされた時間ステップで注意出力をキャッシュして再利用することで、効率的に画像を生成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:09:10 GMT)
Multimodal Reranking for Knowledge-Intensive Visual Question Answering [77.2]
回答生成のための知識候補のランク付け品質を向上させるためのマルチモーダル・リランカを提案する。 OK-VQAとA-OKVQAの実験は、遠隔監視からのマルチモーダルリランカーが一貫した改善をもたらすことを示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:58:52 GMT)
Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.4]
本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:04:28 GMT)
Position: Considerations for Differentially Private Learning with Large-Scale Public Pretraining [75.3]
大規模なWebスクレイプデータセットの使用は、差分プライバシ保存と見なすべきかどうかを疑問視する。 Webデータ上で事前訓練されたこれらのモデルを“プライベート”として公開することで、市民のプライバシーに対する信頼を意味のあるプライバシの定義として損なう可能性があることを警告します。公的な事前学習がより普及し、強力になるにつれて、私的な学習分野への道のりを議論することで、我々は結論づける。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:53:58 GMT)
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5]
Plucker座標に基づく制御ネットライクなコンディショニング機構を用いた3次元カメラ制御のためのトランスフォーマー映像を試作する。我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:59:05 GMT)
EmoBench: Evaluating the Emotional Intelligence of Large Language Models [73.6]
EmoBenchは、確立された心理学理論に基づいて、マシン感情知能(EI)の包括的な定義を提案するベンチマークである。 EmoBenchには、英語と中国語で400の手作りの質問が含まれている。以上の結果から,既存の大規模言語モデルのEIと平均的な人間の間には,かなりのギャップがみられ,今後の研究に向けての有望な方向性が浮かび上がっている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:30:58 GMT)
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases [73.0]
本稿では,RAG とRAG をベースとした LLM エージェントを標的とした最初のバックドア攻撃である AgentPoison を提案する。従来のバックドア攻撃とは異なり、AgentPoisonは追加のモデルトレーニングや微調整を必要としない。エージェントごとに、AgentPoisonは平均攻撃成功率を80%以上達成し、良質なパフォーマンスに最小限の影響を与える。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:59:47 GMT)
Fully Authentic Visual Question Answering Dataset from Online Communities [72.1]
VQA(Visual Question Answering)は、画像に関する質問に答える機能である。 VQAデータセットは、すべてのコンテンツが真正のユースケースから生まれたものである。このデータセットと8つの主流VQAデータセットとの関係を特徴付ける。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:28:19 GMT)
Rate-Preserving Reductions for Blackwell Approachability [72.0]
Abernethy et al. (2011) はブラックウェルのアプローチ可能性と非回帰学習が等価であることを示した。一般化された後悔最小化の例に対して、いかなるアプローチ可能性のインスタンスも厳格に削減できることが示される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:28:36 GMT)
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models [71.8]
LMMS-EVALは50以上のタスクと10以上のモデルを持つ統一的で標準化されたマルチモーダルベンチマークフレームワークである。 LMMS-EVAL LITEは、カバー範囲と効率の両方を重視したプルーニング評価ツールキットである。マルチモーダルなLIVEBENCHは、ニュースやオンラインフォーラムを継続的に更新し、野生におけるモデルの一般化能力を評価する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:51:53 GMT)
Rethinking the Architecture Design for Efficient Generic Event Boundary Detection [71.5]
ジェネリック(GEBD)は、ビデオを一貫した時間的チャンクに分割する人間の視覚的認知的行動にインスパイアされている。 SOTA GEBDモデルは、しばしばモデル複雑さよりも最終的なパフォーマンスを優先し、推論速度を低くし、現実のシナリオにおける効率的なデプロイメントを妨げる。我々は,GEBDモデルのアーキテクチャを実験的に再検討し,この問題に対処するために貢献する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:49:54 GMT)
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization [70.1]
テキストプロンプトから音声を生成することは、音楽や映画産業におけるそのようなプロセスの重要な側面である。我々の仮説は、これらのオーディオ生成の側面が、限られたデータの存在下でのオーディオ生成性能をどのように改善するかに焦点を当てている。我々は、各プロンプトが勝者の音声出力と、拡散モデルが学習するための敗者音声出力を持つ選好データセットを合成的に作成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:17:50 GMT)
T2IShield: Defending Against Backdoors on Text-to-Image Diffusion Models [70.0]
バックドア攻撃の検出, 局所化, 緩和のための総合防御手法T2IShieldを提案する。バックドアトリガーによって引き起こされた横断アテンションマップの「アシミレーション現象」を見いだす。バックドアサンプル検出のために、T2IShieldは計算コストの低い88.9$%のF1スコアを達成している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:19:16 GMT)
Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text and Image [70.0]
Open-vocabulary 3D object detection (OV-3DDet) は、新しい3Dシーン内において、目に見えないものの両方をローカライズし、認識することを目的としている。視覚基盤モデルを利用して、3Dシーンにおける新しいクラスを発見するための画像的ガイダンスを提供する。オープン語彙の3Dオブジェクト検出における基礎モデルの可能性を明らかにするとともに,精度と一般化の大幅な向上を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:50:09 GMT)
Patch-Level Training for Large Language Models [69.7]
本稿では,Large Language Models (LLM) に対するパッチレベルのトレーニングを紹介する。パッチレベルのトレーニングでは、言語モデルの短いパッチシーケンスをフィードし、次のパッチを予測するようにトレーニングします。これに続いて、モデルは推論モードに合わせて、残りのトレーニングデータに対するトークンレベルのトレーニングを継続する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:48:39 GMT)
Online Pseudo-Zeroth-Order Training of Neuromorphic Spiking Neural Networks [69.3]
スパイクニューラルネットワーク(SNN)を用いた脳誘発ニューロモルフィックコンピューティングは、有望なエネルギー効率の計算手法である。最近の手法では、空間的および時間的バックプロパゲーション(BP)を利用しており、ニューロモルフィックの性質に固執していない。オンライン擬似ゼロオーダートレーニング(OPZO)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:09:00 GMT)
GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.1]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:27:41 GMT)
Generative AI for Low-Carbon Artificial Intelligence of Things with Large Language Models [67.0]
ジェネレーティブAI(GAI)は、AIoT(Artificial Intelligence of Things)の二酸化炭素排出量を減らす大きな可能性を秘めている本稿では, 炭素排出量削減のためのGAIの可能性について検討し, 低炭素AIoTのための新しいGAI対応ソリューションを提案する。本稿では,Large Language Model (LLM) を利用したCO_2排出最適化フレームワークを提案し,このフレームワークにより,プラグ可能なLLMとRetrieval Augmented Generation (RAG) モジュールを設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:32:46 GMT)
Towards continually learning new languages [66.4]
言語のバッチ学習は経済的に有益だが、大きな課題は破滅的な忘れ方だ。我々は,破滅的忘れを抑えるために,重量分解特性と弾性重みの固化特性を組み合わせる。私たちは、すべての言語をゼロからトレーニングするのに比べ、破滅的な忘れものもなく、合理的なパフォーマンスで26の言語を達成しています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:56:04 GMT)
Visual Concept-driven Image Generation with Text-to-Image Diffusion Model [66.0]
テキスト・ツー・イメージ(TTI)モデルは複雑なシーンの高解像度画像を生成するという印象的な結果を示した。近年のアプローチでは、これらの手法をパーソナライズ技術で拡張し、ユーザ認証の概念の統合を可能にしている。しかし、人間の被写体のような複数の相互作用する概念を持つ画像を生成する能力は、1つにまたがったり、複数にまたがったりする概念は、いまだに説明がつかないままである。これらの課題に対処する概念駆動型TTIパーソナライズフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:47:16 GMT)
Tokenize Anything via Prompting [65.9]
我々は,任意のものを同時にセグメンテーションし,認識し,キャプションすることができる統一的,迅速なモデルを提案する。我々は、50億のパラメータを持つ事前学習されたCLIPモデルから、巨大なセグメンテーションマスク、eg、SA-1Bマスク、セマンティックプリミティブを持つ一般化可能なモデルをトレーニングする。我々は,このモデルが汎用領域コンテキストを符号化できる汎用領域レベルの画像トークン化器であると考えている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:34:37 GMT)
QuRating: Selecting High-Quality Data for Training Language Models [64.8]
データ品質に関する人間の直感をキャプチャできる事前学習データを選択するQuRatingを導入する。本稿では,書体,専門知識,事実とトリビア,教育的価値の4つの特性について検討する。ペアの判断からスカラー評価を学習するためにQurモデルをトレーニングし、それを4つの基準ごとに品質評価付き260Bのトレーニングコーパスにアノテートするために使用します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:50:11 GMT)
CityGaussian: Real-time High-quality Large-Scale Scene Rendering with Gaussians [64.7]
CityGaussianは、大規模な3DGSのトレーニングとレンダリングを効率化するために、新しい分別/分別トレーニングアプローチとLevel-of-Detail(LoD)戦略を採用している。我々のアプローチは最先端のレンダリング品質を実現し、大規模なシーンを全く異なるスケールで一貫したリアルタイムレンダリングを可能にする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:56:34 GMT)
From Fake to Real: Pretraining on Balanced Synthetic Images to Prevent Spurious Correlations in Image Recognition [64.6]
我々はFrom Fake to Realと呼ぶシンプルで簡単に実装できる2段階のトレーニングパイプラインを提案する。実データと合成データを別々にトレーニングすることで、FFRは実データと合成データの統計的差異にモデルを公開しない。実験の結果,FFRは3つのデータセットに対して,最先端のグループ精度を最大20%向上させることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:07:01 GMT)
Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment [64.5]
本稿では,検出されたテキストと画像のペア間の相違点の詳細な説明を行う。我々は、大きな言語モデルと視覚的接地モデルを活用して、与えられた画像に対して妥当なキャプションを保持するトレーニングセットを自動構築する。また,テキストと視覚的ミスアライメントアノテーションを組み合わせた新たな人為的なテストセットも公開する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:12:26 GMT)
NCL++: Nested Collaborative Learning for Long-Tailed Visual Recognition [63.9]
本研究では,Nested Collaborative Learning (NCL++)を提案する。長期学習における協調学習を実現するために,バランスの取れたオンライン蒸留を提案する。混乱するカテゴリにおける細かな識別能力を改善するために,さらにハードカテゴリーマイニングを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:25:29 GMT)
PersLLM: A Personified Training Approach for Large Language Models [63.8]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:13:22 GMT)
Enhancing Diffusion Models with Text-Encoder Reinforcement Learning [63.4]
テキストから画像への拡散モデルは通常、ログのような目的を最適化するために訓練される。近年の研究では、強化学習や直接バックプロパゲーションを通じて人間の報酬を用いて拡散U-Netを精製することでこの問題に対処している。我々は、強化学習によってテキストエンコーダを微調整することにより、結果のテキストイメージアライメントを強化することができることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:52:37 GMT)
Sharpness-diversity tradeoff: improving flat ensembles with SharpBalance [60.7]
深層アンサンブルにおけるシャープネスと多様性の相互作用を示す。私たちは、アンサンブル内でシャープネスと多様性のバランスをとるトレーニングアプローチであるSharpBalanceを紹介します。実験により、SharpBalanceはシャープネスとダイバーシティのトレードオフを効果的に改善するだけでなく、アンサンブル性能を大幅に改善することを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:31:26 GMT)
Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatial Relation Matching [60.6]
自然言語コマンドを通じてドローンをナビゲートすることは、アクセス可能なマルチモーダルデータセットが不足しているため、依然として難しい。我々は新しい自然言語誘導ジオローカライゼーションベンチマークGeoText-1652を紹介する。このデータセットは、インタラクティブなヒューマンコンピュータプロセスを通じて体系的に構築される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:34:39 GMT)
Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.6]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:34:03 GMT)
Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.3]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できるこの研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:01:21 GMT)
Instruction-Driven Game Engines on Large Language Models [60.3]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:27:37 GMT)
Towards Understanding and Improving Knowledge Distillation for Neural Machine Translation [59.3]
この知識は,教師のトップ1の予測から得られたものである。我々はtextbfTop-1 textbfInformation textbfEnhanced textbfKnowledge textbfDistillation (TIE-KD) という新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:36:30 GMT)
Few-Shot Class Incremental Learning with Attention-Aware Self-Adaptive Prompt [58.9]
ASP(Attention-Aware Self-Adaptive Prompt)という新しいフレームワークを提案する。 ASP.NETはタスク不変のプロンプトを奨励し、注意点から特定の情報を減らすことで共有知識をキャプチャする。要約すると、ASPはベースタスクの過度な適合を防ぎ、数秒のインクリメンタルタスクで膨大なデータを必要としない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:00:27 GMT)
VegeDiff: Latent Diffusion Model for Geospatial Vegetation Forecasting [58.1]
地理空間植生予測タスクのためのVegeDiffを提案する。 VegeDiffは、植物の変化過程の不確かさを確率的に捉えるために拡散モデルを使用した最初の企業である。植生の変化の不確かさを捉え、関連する変数の複雑な影響をモデル化することで、VegeDiffは既存の決定論的手法より優れている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:15:52 GMT)
Towards AI-Powered Video Assistant Referee System for Association Football [58.0]
Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。 VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:09:03 GMT)
Improving SAM Requires Rethinking its Optimization Formulation [57.6]
Sharpness-Aware Minimization (SAM) は、もともとネットワークの重みと有界摂動がそれぞれ同じ差分損失を最小/最大化しようとするゼロサムゲームとして定式化されている。我々は SAM を 0-1 の損失を用いて再定式化すべきであると主張する。連続緩和として、最小化(最大化)プレイヤーが 0-1 の損失に対して上界(より下界)をサロゲートする単純なアプローチに従う。これは BiSAM と呼ばれる双レベル最適化問題として SAM の新たな定式化につながる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:22:33 GMT)
DriveLM: Driving with Graph Visual Question Answering [57.5]
本研究では,Webスケールデータに基づいて学習した視覚言語モデル(VLM)を,エンド・ツー・エンドの運転システムに統合する方法について検討する。グラフVQAとエンドツーエンド駆動を併用するVLMベースラインアプローチ(DriveLM-Agent)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:45:20 GMT)
EvSign: Sign Language Recognition and Translation with Streaming Events [57.4]
イベントカメラは、動的手の動きを自然に知覚し、手話作業のための豊富な手作業の手がかりを提供する。イベントベースSLRおよびSLTタスクのための効率的なトランスフォーマーベースフレームワークを提案する。計算コストは0.34%に過ぎず,既存の最先端手法に対して良好に機能する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:16:35 GMT)
The Role of Language Imbalance in Cross-lingual Generalisation: Insights from Cloned Language Experiments [57.3]
本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:59:01 GMT)
MoME: Mixture of Multimodal Experts for Generalist Multimodal Large Language Models [57.1]
本稿では,タスク干渉を緩和し,汎用MLLMを得るためのマルチモーダルエキスパート(MoME)の混合を提案する。私たちのMoMEは、視覚専門家の混合(MoVE)と言語専門家の混合(MoLE)の2つの重要なコンポーネントで構成されています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:31:38 GMT)
Continuously Learning New Words in Automatic Speech Recognition [57.0]
本稿では,新たな単語認識のための自己教師付き連続学習手法を提案する。過去の研究から,メモリ拡張型自動音声認識モデルを用いた。提案手法により,新たな単語の出現頻度が高くなると,新たな単語のパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:01:26 GMT)
4Dynamic: Text-to-4D Generation with Hybrid Priors [56.9]
本稿では,ビデオによる直接監督によって動的振幅と信頼性を保証し,テキストから4Dへ変換する新しい手法を提案する。本手法は,テキスト・ツー・4D生成だけでなく,モノクロ映像からの4D生成も可能にしている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:02:55 GMT)
Monocular Occupancy Prediction for Scalable Indoor Scenes [56.7]
そこで本研究では,モノクロ画像を用いた屋内シーン占有率の予測手法であるISOを提案する。 ISOは、事前訓練された深度モデルの利点を利用して正確な深度予測を行う。 Occ-ScanNetは屋内シーンの大規模占有ベンチマークである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:37:07 GMT)
Variable-Agnostic Causal Exploration for Reinforcement Learning [56.5]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:45:27 GMT)
Estimating the Energy Footprint of Software Systems: a Primer [56.2]
ソフトウェアシステムのエネルギーフットプリントの定量化は、最も基本的な活動の1つです。この文書は、この分野で研究を始めたい研究者の出発点となることを目的としている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:07:08 GMT)
Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.7]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。従来の手法は手作りの機能と機械学習技術に依存している。 HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:12:48 GMT)
End-to-End Evaluation for Low-Latency Simultaneous Speech Translation [55.5]
本稿では,低遅延音声翻訳の様々な側面を現実的な条件下で実行し,評価するための第1の枠組みを提案する。これには、オーディオのセグメンテーションと、異なるコンポーネントの実行時間が含まれる。また、このフレームワークを用いて低遅延音声翻訳の異なるアプローチを比較する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:29:10 GMT)
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On [55.4]
一般的な7B言語モデル上での教師付き微調整(SFT)であるSkywork-Mathモデルシリーズを紹介する。 Skywork-Math 7Bは競争レベルのMATHベンチマークで51.2%の精度を達成した。我々は,LLMの数学推論能力を高めるために,研究用と産業用の両方で,いくつかの実践的なテイクアウトを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:28:33 GMT)
SafePowerGraph: Safety-aware Evaluation of Graph Neural Networks for Transmission Power Grids [55.4]
我々は,電力システム(PS)におけるグラフニューラルネットワーク(GNN)のための,最初のシミュレータに依存しない,安全指向のフレームワークであるSafePowerGraphを紹介する。 SafePowerGraphは複数のPFシミュレータとOPFシミュレータを統合し、エネルギー価格の変動や電力線停止など、さまざまなシナリオでGNNのパフォーマンスを評価する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:01:38 GMT)
Towards Scalable Automated Alignment of LLMs: A Survey [54.8]
本稿では,最近登場した自動アライメントの手法を体系的にレビューする。既存の自動アライメント手法をアライメント信号のソースに基づいて4つの主要なカテゴリに分類する。本稿では,アライメントの基本的役割から,自動アライメント技術の実現を可能にする重要な要因について論じる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:26:31 GMT)
The Foundation Model Transparency Index v1.1: May 2024 [54.8]
2023年10月、インデクスは100の透明性指標について10の主要なファンデーションモデル開発者を評価した。当時、開発者は非常に限られた情報を公開しており、平均スコアは100点中37点だった。開発者は、平均して100点中58点を獲得し、v1.0よりも21点改善している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:03:37 GMT)
AdaLog: Post-Training Quantization for Vision Transformers with Adaptive Logarithm Quantizer [54.7]
Vision Transformer (ViT) はコンピュータビジョンコミュニティにおいて最も普及しているバックボーンネットワークの1つである。本稿では,AdaLog(Adaptive Logarithm AdaLog)量子化器を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:38:48 GMT)
Out of Length Text Recognition with Sub-String Matching [54.6]
本稿では,これをOOL(Out of Length)テキスト認識と呼ぶ。サブ文字列マッチング(SMTR)を用いたOOLテキスト認識手法を提案する。 SMTRは2つのクロスアテンションベースのモジュールから構成される: 1つは、複数の文字を含むサブストリングを次のクエリと前のクエリにエンコードし、もう1つは、サブストリングをマッチングし、次の文字列と前の文字を同時に認識する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:02:17 GMT)
TurkishMMLU: Measuring Massive Multitask Language Understanding in Turkish [54.5]
本稿では,最初のマルチタスク,複数選択のトルコQAベンチマーク,トルコMMLUを紹介する。トルコMMLUには1万以上の質問があり、トルコの高校教育カリキュラムとは9つの異なるテーマをカバーしている。多言語オープンソース(Gemma、Llama、MT5)、クローズドソース(GPT 4o、Claude、Gemini)、トルコ適応モデル(Trendyolなど)を含む20以上のLLMを評価した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:28:55 GMT)
Retrieval Robust to Object Motion Blur [54.3]
本研究では,動きのぼやけの影響を受けやすい画像のオブジェクト検索手法を提案する。ぼやけたオブジェクト検索のための最初の大規模データセットを提示する。提案手法は,新しいぼやけた検索データセット上で,最先端の検索手法より優れている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:57:16 GMT)
MuggleMath: Assessing the Impact of Query and Response Augmentation on Math Reasoning [54.2]
大規模言語モデルを用いた数学推論では、クエリの進化と多様な推論経路による微調整データ拡張が実験的に有効である。本研究では,数理推論におけるそのようなデータ拡張に関する調査を行い,これらの疑問に答えることを意図している。コードと拡張データはhttps://github.com/OFA-Sys/8k-Scel.comで公開しています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:46:17 GMT)
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models [54.1]
トレーニングデータを自動的に生成する最初のスケーラブルで信頼性の高いAutoIFを導入する。 AutoIFは命令追従データ品質の検証をコード検証に変換する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:33:35 GMT)
ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:04:00 GMT)
Optimizing Query Generation for Enhanced Document Retrieval in RAG [53.1]
大規模言語モデル(LLM)は様々な言語タスクに優れるが、しばしば誤った情報を生成する。 Retrieval-Augmented Generation (RAG) は、正確な応答に文書検索を使用することによってこれを緩和することを目的としている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:50:32 GMT)
Harnessing Large Language Models for Multimodal Product Bundling [53.0]
大型言語モデル(LLM)と製品バンドルタスクのギャップを埋めるために、Bundle-LLMを導入します。具体的には、マルチモーダル情報を統合するために、ハイブリッドアイテムトークン化を使用し、単純なマルチモーダル融合モジュールとトレーニング可能なプロジェクタが、すべての非テキスト機能を単一のトークンに埋め込む。我々の手法は、最先端(SOTA)の手法よりも優れています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:57:55 GMT)
Efficient Depth-Guided Urban View Synthesis [52.8]
高速フィードフォワード推論とシーンごとのファインチューニングのための効率的な深層誘導型都市ビュー合成(EDUS)を提案する。 EDUSは、粗い入力画像から一般化可能な都市ビュー合成を可能にするためのガイダンスとして、ノイズの多い幾何学的先行情報を利用する。その結果,EDUSは高速なテスト時間最適化と組み合わせることで,スパース・ビュー・セッティングにおける最先端性能を達成できることが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:16:25 GMT)
Hierarchical and Decoupled BEV Perception Learning Framework for Autonomous Driving [52.8]
本稿では,新しい階層型バードアイビュー(BEV)知覚パラダイムを提案する。基本的な知覚モジュールとユーザフレンドリなグラフィカルインターフェースのライブラリを提供することを目指している。我々は,大規模公開データセットと合理化開発プロセスを効果的に活用するために,Pretrain-Finetune戦略を実行している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:17:20 GMT)
Adversarial Bi-Regressor Network for Domain Adaptive Regression [52.5]
ドメインシフトを軽減するために、クロスドメインレグレッタを学ぶことが不可欠です。本稿では、より効果的なドメイン間回帰モデルを求めるために、ABRNet(Adversarial Bi-Regressor Network)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:11:10 GMT)
Watermarking Recommender Systems [52.2]
本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:51:24 GMT)
Safeguard Text-to-Image Diffusion Models with Human Feedback Inversion [51.9]
本稿では,Human Feedback Inversion (HFI) というフレームワークを提案する。実験の結果,画像品質を維持しながら,好ましくないコンテンツ生成を著しく削減し,公的な領域におけるAIの倫理的展開に寄与することが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:21:41 GMT)
E5-V: Universal Embeddings with Multimodal Large Language Models [51.6]
汎用マルチモーダル埋め込みを実現するためのMLLMに適応する新しいフレームワークであるE5-Vを導入する。 MLLMをプロンプトで活用することにより、E5-Vは異なるタイプの入力間のモダリティギャップを効果的に橋渡しする。 E5-Vは細調整なしでもマルチモーダル埋め込みにおいて高い性能を達成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:04:12 GMT)
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos [51.5]
任意の長さのビデオの解釈に適した手法を提案する。また,TVQA-longベンチマークを導入し,視覚とテキストコンテンツの両方に疑問を呈する長編ビデオの理解におけるモデルの能力を評価する。以上の結果から,本モデルでは長大・短大双方の理解が大幅に改善されていることが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:59:32 GMT)
Laugh Now Cry Later: Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech [51.5]
EmoCtrl-TTSは感情制御可能なゼロショットTSであり、あらゆる話者に対してNVで高い感情的な音声を生成することができる。高品質な感情音声生成を実現するために、EmoCtrl-TTSは擬似ラベルに基づく27,000時間以上の表現データを用いて訓練される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:54:15 GMT)
To Believe or Not to Believe Your LLM [51.3]
大規模言語モデル(LLM)における不確実性定量化について検討する。疫学的な不確実性が大きい場合にのみ確実に検出できる情報理論の指標を導出する。定式化の利点を実証する一連の実験を行う。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:55:51 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models [51.2]
我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する学習自由パラダイムであるPointSegを提案する。 PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。 ScanNet、ScanNet++、KITTI-360データセット上の14.1$%、12.3$%、12.6$%のmAPは、最先端のトレーニングフリーモデルを大きく上回っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:31:23 GMT)
Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts [50.2]
本稿では,2Dポイントやボックスプロンプトから3Dオブジェクトを自動的にラベル付けするアルゴリズムを提案する。従来のアートとは異なり、自動ラベルはバウンディングボックスの代わりに3D形状を予測し、特定のデータセットのトレーニングを必要としない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:32:53 GMT)
Mamba-PTQ: Outlier Channels in Recurrent Large Language Models [49.2]
本研究では,マンバモデルが注目型LLMで観測された異常チャネルと同じパターンを示すことを示す。本研究では,SSMの定量化が難しい理由は,トランスフォーマーベースLLMで見られるような,アクティベーションアウトレーヤによるものであることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:21:06 GMT)
Generalizable Human Gaussians for Sparse View Synthesis [48.5]
そこで本研究では,光写実的かつ正確な視線レンダリングを可能にする,一般化可能なヒトガウシアンを学習するための新しい手法を提案する。このアプローチの重要な革新は、3次元ガウスパラメータの学習を、人間のテンプレートの2次元UV空間上で定義された回帰プロセスに再構成することである。提案手法は,データ内一般化とクロスデータセット一般化設定の両方において,最近の手法よりも優れている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:56:30 GMT)
Learning Long-Horizon Predictions for Quadrotor Dynamics [48.1]
四元数に対する長軸予測力学を効率的に学習するための鍵となる設計選択について検討する。逐次モデリング手法は,他のタイプの手法と比較して,合成誤差を最小限に抑える上での優位性を示す。本稿では,モジュール性の向上を図りながら,学習プロセスをさらに単純化する,疎結合な動的学習手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:06:47 GMT)
Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.7]
速度歪み認識制御可能な多目的画像圧縮法を提案する。本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:26:20 GMT)
Similarity of Neural Architectures using Adversarial Attack Transferability [47.7]
ニューラルネットワーク間の定量的かつスケーラブルな類似度尺度を設計する。我々は69の最先端画像ネット分類器を大規模に解析する。我々の結果は、異なるコンポーネントを持つ多様なニューラルアーキテクチャの開発がなぜ必要かについての洞察を提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:10:22 GMT)
MUSES: The Multi-Sensor Semantic Perception Dataset for Driving under Uncertainty [46.4]
MUSES(MUlti-Sensor Semantic 知覚データセット)を導入する。データセットはフレームカメラ、ライダー、レーダー、イベントカメラ、IMU/GNSSセンサーを統合する。 MUSESは、様々な視覚条件下でモデルを評価するのに、トレーニングと挑戦の両方に効果的であることを証明している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:31:44 GMT)
The Better Angels of Machine Personality: How Personality Relates to LLM Safety [46.3]
LLM(Large Language Models)における人格特性と安全能力の関係は謎のままである。 LLMの性格特性が安全性と密接に関連していることが判明した。 ISTJからISTPへパーソナリティを誘導すると、プライバシとフェアネスのパフォーマンスが約43%と10%向上した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:36:29 GMT)
SMooDi: Stylized Motion Diffusion Model [46.3]
本稿では、コンテンツテキストとスタイルシーケンスによって駆動されるスタイル化された動作を生成するための、SMooDiと呼ばれる新しいスティル化モーション拡散モデルを提案する。提案手法は,従来のスタイル化動作生成手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:59:42 GMT)
Hierarchical Separable Video Transformer for Snapshot Compressive Imaging [46.2]
HiSViT(Hierarchical Separable Video Transformer)は、時間的アグリゲーションのない再構成アーキテクチャである。 HiSViTは、CSS-MSAとGSM-FFN(Gated Self-Modulated Feed-Forward Network)の複数グループによって構築されている。我々のメソッドは、同等または少ないパラメータと複雑さで、以前のメソッドを$!>!0.5$で上回ります。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:07:58 GMT)
Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.1]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。 RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:44:18 GMT)
Cross-Modality Program Representation Learning for Electronic Design Automation with High-Level Synthesis [45.5]
ドメイン固有アクセラレータ(DSA)は、ディープラーニングや自律運転などのアプリケーションで人気を集めている。本稿では,ソースコードシーケンスのモダリティとグラフのモダリティを深く,きめ細かな方法で相互作用できるモデルであるProgSGを提案する。 ProgSGは、設計性能予測のRMSEを最大22%の価格で削減し、設計を平均1.10Times$で識別する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:08:51 GMT)
Text- and Feature-based Models for Compound Multimodal Emotion Recognition in the Wild [45.3]
複合的な感情はしばしば現実世界のシナリオで起こり、予測することがより困難である。標準的な特徴に基づくモデルは、複雑な感情を理解するのに必要な複雑で微妙な手がかりを完全には捉えないかもしれない。本稿では,ビデオ中の複合ERに対する2つのマルチモーダルモデリング手法を比較する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:01:25 GMT)
Renormalisation of Quantum Cellular Automata [45.3]
超立方体格子上の量子セルオートマトンに対する粗粒化法について検討した。各タイル内の部分空間に適用される複数の進化ステップは、新しい量子セルオートマトンの一進化ステップと見なすことができる。我々は,再正常化のための必要十分条件を導出し,それをセルオートマトンの再正規化フローの解明に利用した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:33:33 GMT)
NL2Contact: Natural Language Guided 3D Hand-Object Contact Modeling with Diffusion Model [45.0]
NL2Contactは、段階拡散モデルを利用して制御可能な接触を生成するモデルである。手と接触の言語記述を与えられたNL2Contactは、現実的で忠実な3Dハンドオブジェクト接触を生成する。ポーズの最適化と新しい人間のグリップ生成のためのモデルの適用例を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:46:40 GMT)
Table Meets LLM: Can Large Language Models Understand Structured Table Data? A Benchmark and Empirical Study [44.4]
大規模言語モデル(LLM)は、自然言語(NL)に関連する課題を解決するために、数ショットの推論器として魅力的になってきている。 LLMの構造的理解能力を評価するためのベンチマークを設計して,これを理解しようと試みる。重要な値や範囲識別など,効率的な構造的プロンプトのための$textitself-augmentation$を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:26:03 GMT)
Rethinking the Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A Review [43.3]
自動走行は、個人、公共、貨物の移動に革命をもたらす可能性がある。安全と進歩を促進するために、多くの研究は周囲の交通の将来の動きを予測するモジュールに依存している。最近のモデルでは、双方向の相互作用をモデル化するための共同または相互依存的なステップで予測と計画を統合する傾向が強まっている。我々は、最先端のディープラーニングベースの予測と計画を体系的にレビューし、統合された予測と計画モデルに焦点を当てる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:35:26 GMT)
Molecule Language Model with Augmented Pairs and Expertise Transfer [43.3]
AMOLE は,(1) 構造的類似性を保った分子文対を増大させ,2) 分子間の専門知識を伝達する。様々な下流タスクに関する大規模な実験は、コンプレッション分子におけるAMOLEの優位性とその説明を実証している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:09:25 GMT)
On the Effect of (Near) Duplicate Subwords in Language Modelling [43.2]
ほぼ重複したサブワードがLMトレーニング効率に及ぼす影響について検討する。完全に複製された環境でトレーニングを行う場合、LMには約17%のデータが必要であることが分かりました。副語重複はLM訓練効率に悪影響を及ぼすが、自然に重複の近くで起こることは予想されるほどは似ていないかもしれない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:39:39 GMT)
Symmetric Replay Training: Enhancing Sample Efficiency in Deep Reinforcement Learning for Combinatorial Optimization [42.9]
本稿では,SRT (symmetric replay training) と呼ばれる簡易かつ効果的な手法を提案する。提案手法は,オンラインインタラクションを伴わない対称領域の探索を促進するために,高解像度サンプルを活用する。実世界のタスクに適用した多種多様なDRL法に対して,本手法を一貫したサンプル効率向上効果を示す実験結果を得た。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:55:45 GMT)
Gradient Projection For Continual Parameter-Efficient Tuning [42.8]
我々は勾配投影の観点からAdapter, LoRA, Prefix-tuning, Prompt-tuningを再構成する。大規模モデルであっても,勾配の条件は忘れることに効果的に抵抗できることを示す。多様なデータセットを用いて,VTやCLIPを含む異なるバックボーンを用いて,本手法を広範囲に評価した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:22:20 GMT)
End-to-end Stroke imaging analysis, using reservoir computing-based effective connectivity, and interpretable Artificial intelligence [42.5]
本稿では,貯水池計算に基づく有向グラフ解析パイプラインを提案する。このパイプラインの目標は、ストロークデータにおける接続性のための効率的な脳表現を定義することである。この表現は、有向グラフ畳み込みアーキテクチャ内で使われ、説明可能な人工知能(AI)ツールで調査される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:34:05 GMT)
Chip Placement with Diffusion [42.4]
マクロ配置 (Macro placement) は、2次元チップ上のマクロとして知られるコンポーネントの大規模なコレクションの物理的位置を定義する。既存の学習ベースの手法は、強化学習に依存しており、エージェントの柔軟性が制限されるため、不足している。本稿では,事前学習のための大規模合成データセットを生成するアルゴリズムとともに,デノナイズモデルのための新しいアーキテクチャを提案する。我々は,我々のモデルが配置課題に対処できることを実証的に示し,最先端の手法と比較して配置ベンチマーク上での競合性能を達成することを実証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:02:24 GMT)
MoAI: Mixture of All Intelligence for Large Language and Vision Models [42.2]
Mixture of All Intelligence (MoAI)は、命令調整型大規模言語および視覚モデル(LLVM)である。 MoAIは外部セグメンテーション、検出、SGG、OCRモデルの出力から得られる補助的な視覚情報を使用する。 MoAIは、多数のゼロショットビジョン言語(VL)タスクにおいて、オープンソースとクローズドソースのLLVMの両方を著しく上回っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:57:46 GMT)
F-HOI: Toward Fine-grained Semantic-Aligned 3D Human-Object Interactions [42.1]
既存の3Dヒューマンオブジェクトインタラクション(HOI)データセットとモデルは、グローバルな記述と長いHOIシーケンスを単純に一致させる。状態レベルの記述を利用した細粒度セマンティックアライメントは,意味的に豊かなHOI表現を学習する上で有望なパラダイムである,と我々は主張する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:43:58 GMT)
SUMix: Mixup with Semantic and Uncertain Information [42.0]
混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:46:52 GMT)
Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models [42.0]
現在のエージェントフレームワークは、シングルエージェント実行への依存に悩まされ、モジュール間通信が堅牢でないことが多い。協調的なMARLにおける協調行動を可能にするための協調エージェントとして,大規模言語モデルを訓練するためのフレームワークを提案する。伝搬ネットワークは、放送意図をチームメイト固有のコミュニケーションメッセージに変換し、指定されたチームメイトと関連する目標を共有する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:14:00 GMT)
Crossing exceptional points in non-Hermitian quantum systems [41.9]
例外点を越えた非エルミート系における2光子量子状態の挙動を明らかにする。例外点において、光子の量子干渉のスイッチングを実演する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:04:00 GMT)
Exploring the Untouched Sweeps for Conflict-Aware 3D Segmentation Pretraining [41.1]
LiDARカメラによる3D画像の事前学習は、3D知覚タスクと関連する応用に有意な可能性を示唆している。未探索フレームからLiDAR-画像ペアを精巧に選択するための,ビジョン・ファウンデーション・モデル駆動型サンプル探索モジュールを提案する。我々の手法は、既存の最先端の事前訓練フレームワークを3つの主要な公道走行データセットで一貫して上回っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:32:55 GMT)
Interpretable by Design: Wrapper Boxes Combine Neural Performance with Faithful Attribution of Model Decisions to Training Data [40.8]
モデル予測のための忠実な例に基づく説明を生成するための一般的なアプローチであるラッパーボックスを提案する。ニューラルネットワークを通常のように訓練した後、学習された特徴表現は古典的な解釈可能なモデルに入力され、実際の予測を実行する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:30:42 GMT)
SpatialFormer: Semantic and Target Aware Attentions for Few-Shot Learning [40.7]
CNN構造は、局所的な特徴に基づいて不正確な注意マップを生成し、相互に類似した背景が気晴らしを引き起こす。我々は,グローバルな特徴に基づいてより正確な注意領域を生成するために,新しいSpatialFormer構造を設計する。提案手法は実効性があり, 数発の分類ベンチマークにおいて, 最新の結果が得られる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:43:11 GMT)
IMAGDressing-v1: Customizable Virtual Dressing [39.8]
IMAGDressing-v1は、固定された衣服とオプション条件で自由に編集可能な人間の画像を生成する仮想ドレッシングタスクである。 IMAGDressing-v1は、CLIPのセマンティック特徴とVAEのテクスチャ特徴をキャプチャする衣料UNetを組み込んでいる。本稿では,凍結自己注意とトレーニング可能なクロスアテンションを含むハイブリッドアテンションモジュールを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:26:30 GMT)
Mutual Information Guided Optimal Transport for Unsupervised Visible-Infrared Person Re-identification [39.7]
非監視型赤外線人物再識別 (USVI-ReID) は, ラベル情報を用いることなく, 異質な歩行者画像を取得することを目的とした, 難易度の高い検索課題である。本稿では,モデルの相互情報に基づいて,教師なしVI-ReIDの最適化目標を導出する。彼らの指導のもと、モデルトレーニングと相互モダリティマッチングの交互にループ反復的なトレーニング戦略を設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:32:07 GMT)
A Three-Stage Algorithm for the Closest String Problem on Artificial and Real Gene Sequences [39.6]
ストロースト文字列問題(Closest String Problem)は、与えられた文字列の集合に属するすべての列から最小距離の文字列を見つけることを目的としたNPハード問題である。本稿では,次の3段階のアルゴリズムを提案する。まず,検索領域を効果的に見つけるために,検索空間を削減するために,新しいアルファベットプルーニング手法を適用する。第二に、解を見つけるためのビーム探索の変種を用いる。この方法は、部分解の期待距離スコアに基づいて、新たに開発された誘導関数を利用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:26:27 GMT)
PanoVOS: Bridging Non-panoramic and Panoramic Views with Transformer for Video Segmentation [39.3]
パノラマビデオデータセットPanoVOSを提案する。データセットは150本のビデオに高解像度と多様なモーションを提供する。パノラマ空間整合変換器(PSCFormer)は,従来のフレームのセマンティック境界情報を,現在のフレームとの画素レベルのマッチングに有効に利用することができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:44:21 GMT)
Warm-Start Variational Quantum Policy Iteration [39.0]
強化学習は、非常に複雑な意思決定シナリオにおける最適な行動を決定するための強力なフレームワークである。 NISQ互換の量子化サブルーチンを用いて,変分量子ポリシー反復(VarQPI)アルゴリズムを提案する。そのスケーラビリティは、一般的な強化学習環境の構造の分析によって支えられている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:38:33 GMT)
EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.0]
知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。 The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:55:42 GMT)
Occlusion-Aware Seamless Segmentation [38.8]
これら3つの課題に同時に取り組む新しいタスク,Occlusion-Aware Seamless (OASS)を導入する。ベンチマークのために、Blending Panoramic Amodal Seamlessのための新しい人間アノテーション付きデータセットを構築した。 BlendPASSデータセットの最先端性能を達成し、26.58%、mIoU43.66%という驚くべきmAPQに達した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:55:52 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.6]
本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:45:49 GMT)
Struct-X: Enhancing Large Language Models Reasoning with Structured Data [38.6]
構造Xは5つの重要なフェーズを通して動作する:read-model-fill-reflect-reason' 構造化データをグラフ埋め込みを用いて位相空間にエンコードする。行方不明のエンティティ情報を知識検索モジュールで埋める。最後のフェーズでは、選択したトークンでトポロジネットワークを構築する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:06:25 GMT)
JointDreamer: Ensuring Geometry Consistency and Text Congruence in Text-to-3D Generation via Joint Score Distillation [38.3]
textbfJoint textbfScore textbfDistillation (JSD) を提案する。 JSDは、スコア蒸留サンプリングにおける3次元不整合問題を著しく軽減する。筆者らのフレームワークであるJointDreamerは,テキストから3D生成の新しいベンチマークを構築している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:23:47 GMT)
Graph Signal Processing for Cross-Domain Recommendation [37.9]
クロスドメインレコメンデーション(CDR)は、高密度ドメインからのユーザ-イテムインタラクションを活用して、データ空間とコールドスタート問題を緩和することにより、従来のレコメンデーションシステムを拡張する。既存のCDR手法の多くは、重複するユーザの割合と、ソースドメインとターゲットドメインの固有の相違に敏感である。 GSPに基づく統一CDRフレームワークであるCGSPを提案し、ターゲットのみの類似性とソースブリッジの類似性を柔軟に組み合わせて構築されたクロスドメイン類似性グラフを利用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:52:45 GMT)
Jigsaw Game: Federated Clustering [37.5]
本稿では, 深層学習の枠組みにおいて, フェデレートされたk平均に対する非ショット目標がもたらす課題について検討する。これらの課題に対処するために、我々は、FeCAと呼ばれるフレームワークにおいて、k-平均の局所解の構造を研究することによって、新しい視点を採用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:42:25 GMT)
MDPE: A Multimodal Deception Dataset with Personality and Emotional Characteristics [37.3]
マルチモーダル・デシージャ・データセットMDPEを導入する。このデータセットは、騙しの特徴に加えて、個性や感情的表現の特徴の個人差情報も含んでいる。 193人の被験者による104時間以上の騙しと感情的なビデオで構成されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:44:26 GMT)
GROOT: Generating Robust Watermark for Diffusion-Model-Based Audio Synthesis [37.1]
本稿では,Groot を用いたロバストな音声透かし手法を提案する。このパラダイムでは、透かし生成と音声合成のプロセスが同時に行われる。 Grootは複合攻撃に直面した場合、異常な堅牢性を示し、平均的な透かし抽出精度は約95%を維持している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:43:36 GMT)
LookupViT: Compressing visual information to a limited number of tokens [36.8]
ビジョントランスフォーマー (ViT) は、多くの業界グレードのビジョンソリューションのデファクト選択として登場した。しかし、それらの推論コストは、トークン数の複雑さに悩まされる各レイヤにおける自己注意を計算するため、多くの設定で禁止される可能性がある。本研究では、この情報空間を利用してViT推論コストを削減するLookupViTを紹介する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:22:43 GMT)
Can You Learn Semantics Through Next-Word Prediction? The Case of Entailment [36.8]
Merrillらは、理論上、最適なLMによって予測される文共起確率は、構成文の詳細な関係を反映すべきであると主張している。本稿では,その理論をニューラルネットワークから包含関係を復号化するために利用できるか検討する。それらのテストに類似したテストは、自然文間の係り受け関係を復号することができるが、完全には成立しない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:49:42 GMT)
Progressive Classifier and Feature Extractor Adaptation for Unsupervised Domain Adaptation on Point Clouds [36.6]
非教師なしドメイン適応(UDA)は、ポイントクラウド分析の分野において重要な課題である。本稿では,3次元UDAのための分類器と特徴抽出器を深く結合した新しいフレームワークを提案する。われわれのPCFEAはマクロレベルとマイクロレベルという2つの異なる視点から3D UDAを実施している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:46:28 GMT)
Causality-inspired Discriminative Feature Learning in Triple Domains for Gait Recognition [36.6]
CLTDは、三重ドメイン、すなわち空間、時間、スペクトルにおける共同創設者の影響を排除するために設計された識別的特徴学習モジュールである。具体的には、Cross Pixel-wise Attention Generator (CPAG)を用いて、空間的および時間的領域における実物的特徴と反物的特徴の注意分布を生成する。次に、FPH(Fourier Projection Head)を導入し、空間的特徴をスペクトル空間に投影し、計算コストを低減しつつ重要な情報を保存する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:16:44 GMT)
StuGPTViz: A Visual Analytics Approach to Understand Student-ChatGPT Interactions [35.9]
本稿では、学生のプロンプトの時間パターンとChatGPTの応答の質を複数のスケールで追跡・比較する視覚分析システム、StuGPTVizを提案する。その結果、StuGPTVizがChatGPTの教育的価値に対する教育者の洞察を高める能力があることが確認された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:20:44 GMT)
Leveraging the Mahalanobis Distance to enhance Unsupervised Brain MRI Anomaly Detection [35.5]
教師なし異常検出(UAD)法は、異常を外れ値として識別するために健全なデータ分布に依存する。脳MRIでは、再生モデルが正常な脳MRIを再構成し、異常が入力と再構成のずれとして検出される。我々は確率的拡散モデルを用いて複数の再構成を構築し、マハラノビス距離を用いてこれらの再構成結果の分布を分析し、異常を外れ値として同定する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:02:31 GMT)
ActionSwitch: Class-agnostic Detection of Simultaneous Actions in Streaming Videos [35.4]
ActionSwitchは、オーバーラップするアクションを検出することができる最初のクラスに依存しないOn-TALフレームワークである。クラス情報への依存をなくすことで、ActionSwitchは様々な状況に幅広い適用性を提供します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:07:05 GMT)
High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [35.2]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。本稿では,ウェーブレット変換による高周波圧縮に着目した。 2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:21:31 GMT)
GRIDS: Grouped Multiple-Degradation Restoration with Image Degradation Similarity [35.1]
Grouped Restoration with Image Degradation similarity (GRIDS) は、多重劣化修復に固有の競合対象を調和させる新しいアプローチである。劣化類似性に基づいて、GRIDSは復元タスクを最適群の1つに分割する。各グループのトレーニングモデルでは、シングルタスクの上限モデルよりも平均0.09dBの改善が見られた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:43:32 GMT)
Dual-Hybrid Attention Network for Specular Highlight Removal [35.0]
画像やビデオの品質と解釈性を高めるため、マルチメディアアプリケーションにおいて特異ハイライト除去は重要な役割を担っている。現在の最先端のアプローチは、しばしば追加の事前や監督に依存し、実用性と一般化能力を制限する。本稿では、新しいハイブリッドアテンション機構を導入するエンドツーエンドネットワークであるDHAN-SHR(Dual-Hybrid Attention Network for Specular Highlightectomy)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:52:41 GMT)
DIFFender: Diffusion-Based Adversarial Defense against Patch Attacks [34.9]
敵対的攻撃、特にパッチ攻撃は、ディープラーニングモデルの堅牢性と信頼性に重大な脅威をもたらす。本稿では,テキスト誘導拡散モデルを用いてパッチ攻撃に対処する新しい防御フレームワークであるDIFFenderを紹介する。 DIFFenderは、パッチのローカライゼーションと復元の2つのタスクを単一の拡散モデルフレームワークに統合する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:22:55 GMT)
Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms [34.6]
モノグラフは、平均報酬決定過程(MDPs)の文脈内で制約された様々なモデルベースおよびモデルフリーアプローチの探索に焦点を当てているこのアルゴリズムは制約付きMDPの解法として検討されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:32:18 GMT)
The First to Know: How Token Distributions Reveal Hidden Knowledge in Large Vision-Language Models? [34.3]
本研究では線形プローブを用いてLVLMの出力層における隠れた知識を隠蔽する。本報告では,最初のトークンのロジット分布は命令に応答するかどうかを決定するのに十分な情報を含んでいることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:54:38 GMT)
tSF: Transformer-based Semantic Filter for Few-Shot Learning [34.2]
FSL(Few-Shot Learning)は、ターゲット認識機能を埋め込むことによって、データ不足の問題を緩和する。最近のFSL手法におけるほとんどの機能埋め込みモジュールは、対応する学習タスクのために特別に設計されている。変圧器ベースセマンティックフィルタ (tSF) という軽量で普遍的なモジュールを提案する。 tSFは、ベースセット全体から新しいセットに知識を埋め込むとともに、ターゲットカテゴリのセマンティック機能をフィルタリングする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:29:23 GMT)
Word Embedding Dimension Reduction via Weakly-Supervised Feature Selection [34.2]
語彙が大きくなるにつれて、ベクトル空間の次元は増加し、膨大なモデルサイズに繋がる。本稿では,単語埋め込み次元の減少について検討する。本稿では,WordFSという機能選択手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:36:09 GMT)
Language models show human-like content effects on reasoning tasks [33.7]
大規模言語モデル (LM) は推論タスクの超精度を達成するが、多くの不完全性を示す。人間の推論は現実世界の知識に影響され、意味的コンテンツが論理的推論をサポートする場合、確実に効果を示す。本研究は,これらの認知的影響と,言語モデルの性能に寄与する要因の両方に影響を及ぼすものである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:01:29 GMT)
Weighting Pseudo-Labels via High-Activation Feature Index Similarity and Object Detection for Semi-Supervised Segmentation [33.4]
半教師付きセマンティックセグメンテーション法は、擬似ラベル付けによってラベル付けされていないデータを活用する。既存の手法では、誤った擬似ラベルを避けるため、主に高信頼画素を選択する。疑似ラベルから確実に学習するための新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:58:04 GMT)
QVD: Post-training Quantization for Video Diffusion Models [33.1]
ポストトレーニング量子化(PTQ)は、メモリフットプリントの削減と計算効率の向上に有効な手法である。本稿では,QVDと呼ばれるビデオ拡散モデルに適した最初のPTQ戦略を紹介する。我々は、W8A8のほぼロスレス性能劣化を達成し、FVDの205.12倍の性能向上を実現した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:27:04 GMT)
MatchDet: A Collaborative Framework for Image Matching and Object Detection [33.1]
画像マッチングとオブジェクト検出のためのコラボレーティブフレームワークであるMatchDetを提案する。 2つのタスクの協調学習を実現するために,3つの新しいモジュールを提案する。 Warp-COCO と miniScanNet という2つのデータセットを用いた新しいベンチマークのアプローチを評価する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:03:31 GMT)
VividDreamer: Invariant Score Distillation For Hyper-Realistic Text-to-3D Generation [33.1]
Invariant Score Distillation (ISD) を提案する。 ISDは、スコア蒸留サンプリング(SDS)における過飽和および過平滑化問題に対処することを目的としている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:28:27 GMT)
ClearCLIP: Decomposing CLIP Representations for Dense Vision-Language Inference [32.9]
我々はCLIPのアーキテクチャを再検討し、残余接続をセグメンテーション品質を劣化させるノイズの主源として同定する。オープン語彙セマンティックセグメンテーションを強化するためにCLIPの表現を分解する新しいアプローチであるClearCLIPを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:52:20 GMT)
Universal Facial Encoding of Codec Avatars from VR Headsets [32.6]
コンシューマー向けVRヘッドセットのヘッドマウントカメラ(HMC)を用いて,光リアルアバターをリアルタイムにアニメーションする手法を提案する。本稿では,実行時の効率向上に最小限のコストで精度を高める軽量な式キャリブレーション機構を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:08:15 GMT)
GV-Bench: Benchmarking Local Feature Matching for Geometric Verification of Long-term Loop Closure Detection [32.5]
ループクロージャは軌道推定における正しいドリフトを補正し、グローバルに一貫したマップを構築する。偽ループ閉鎖は致命的であり、堅牢性を保証するための追加のステップとして検証が必要である。本稿では,長期条件下でのループ閉鎖検出の幾何的検証を対象とする統一ベンチマークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:46:29 GMT)
Matryoshka-Adaptor: Unsupervised and Supervised Tuning for Smaller Embedding Dimensions [32.5]
Matryoshka-Adaptorは、LLM(Large Language Models)からの埋め込みをカスタマイズするためのチューニングフレームワークである。 Matryoshka-Adaptorは、同等のパフォーマンスレベルを維持しながら、相当な次元削減を促進する。教師なしと教師なしの両方の学習環境において有効性を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:03:29 GMT)
OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance Segmentation [32.5]
OpenIns3Dは、3Dオープン語彙シーン理解のための新しい3D入力専用フレームワークである。様々な3Dオープン語彙タスクで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:05:38 GMT)
Revisiting the Adversarial Robustness of Vision Language Models: a Multimodal Perspective [32.4]
マルチモーダル攻撃下での対角的ロバスト性に対する視覚言語モデルの適用について検討する。本研究は,マルチモーダル・コントラッシブ・コントラスト・トレーニング・ロスを提案し,クリーン・アトラッシブ・テキストの埋め込みと,その逆・クリーンな視覚的特徴との整合性を示す。 2つのタスクにまたがる15のデータセットの実験により、我々の手法はCLIPの対角的堅牢性を大幅に改善することを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:40:50 GMT)
Counterfactual Explainable Incremental Prompt Attack Analysis on Large Language Models [32.0]
本研究は,大規模言語モデル(LLM)における安全性とプライバシ対策の推進的必要性に光を当てるものである。本稿では,攻撃効果を定量的に測定するために,特定の方法でプロンプトを誘導する新しい手法であるCEIPAを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:23:28 GMT)
UniTE: A Survey and Unified Pipeline for Pre-training ST Trajectory Embeddings [32.0]
埋め込みを事前訓練する手法は、様々なタスクにまたがって有望な適用性を示している。このドメインのための調査と統合パイプラインであるUniTEを紹介します。また,提案したパイプラインを実世界のデータセットに適用した実験結果の選定にも貢献する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:31:13 GMT)
Non-parametric regularization for class imbalance federated medical image classification [32.0]
フェデレートラーニング(FL)は、異なる医療クライアントがプライバシーに敏感なデータを共有せずに、ディープモデルを協調的にトレーニングできるようにすることによって、前者に対処する。我々は,FedNPRとFedNPRのパーソナライズ版であるFedNPRとFedNPR-Perを併用して,特徴抽出器を正規化し,特徴空間における有用かつ識別的な信号を強化するフェデレーション学習を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:54:28 GMT)
Learning Structurally Stabilized Representations for Multi-modal Lossless DNA Storage [32.0]
Reed-Solomon coded single-stranded representation learningはDNAストレージの表現を学習するための新しいエンドツーエンドモデルである。既存の学習手法とは対照的に、RSRLは誤り訂正と構造生物学の両方に着想を得ている。その結果、RSRLは、情報密度と耐久性がはるかに高いがエラー率がはるかに低い様々な種類のデータを格納できることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:31:49 GMT)
MIGS: Multi-Identity Gaussian Splatting via Tensor Decomposition [31.8]
MIGSは、モノクロビデオのみを使用して、複数のアイデンティティのための単一の神経表現を学習する新しい方法である。統一ネットワークにおける複数の被験者の複雑な剛性および非剛性変形をモデル化し,パラメータの総数を大幅に削減する。提案手法は,すべてのトレーニングアイデンティティからの情報を活用し,未確認のポーズで頑健なアニメーションを実現し,既存のアプローチより優れている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:57:52 GMT)
Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.6]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。 Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:46:37 GMT)
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers [31.5]
生成的トレーニングは視覚言語モデルを構築する上で強力であることが示されている。ゼロショット判別ベンチマークでは、生成的および差別的目的で訓練されたモデルの間にはまだパフォーマンスのギャップがある。本稿では,分類作業における生成学習の有効性を向上させることにより,このギャップを狭めることを目的とする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:10:24 GMT)
Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments [31.4]
本稿では,階層型階層型ニューラルネットワーク(SHNN)を提案する。 SHNNはまずグローバル空間をタスク割り当てによってローカルエンティティレベルのグラフに動的に分離する。その後、局所的なエンティティレベルのグラフを渡って、局所的な参照フレームを考案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:37:34 GMT)
TriNeRFLet: A Wavelet Based Triplane NeRF Representation [31.4]
本研究では,NRFの2次元ウェーブレットに基づくマルチスケールトリプレーン表現を提案する。また, 拡散モデルとTriNeRFLetを組み合わせた新しい超解像法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:14:34 GMT)
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models [30.7]
我々は、VLN特化モデルとLLMに基づくナビゲーションパラダイムの分割を橋渡しする。我々は、効果的な行動予測とナビゲーション推論のために、LCMとナビゲーションポリシーネットワークを組み込む方法を利用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:44:26 GMT)
Base Models for Parabolic Partial Differential Equations [30.6]
パラボリック偏微分方程式(PDE)は、様々な数学的対象の進化をモデル化するために多くの分野に現れる。このPDEの異なるパラメータに対応する複数のシナリオにおいて、パラメトリックPDEに対する解の解や関数を計算することがしばしば必要である。本稿では,メタラーニングを基盤としたパラボリックPDEの解を見つけるためのフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:04:28 GMT)
MerRec: A Large-scale Multipurpose Mercari Dataset for Consumer-to-Consumer Recommendation Systems [30.4]
我々は、Mercuri eコマースプラットフォームからソースされたC2Cレコメンデーションに特化した、最初の大規模データセットであるMerRecを紹介します。 MerRecには user_id, item_id, session_id といった標準機能だけでなく,タイムスタンプアクションタイプや製品分類,テキスト製品属性といったユニークな要素も含まれている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:09:31 GMT)
Clustered-patch Element Connection for Few-shot Learning [29.9]
本稿では,ミスマッチ問題を修正するために,新しいクラスタ化パッチ要素接続層を提案する。我々のCECNetは、分類ベンチマークで最先端の手法よりも優れています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:51:29 GMT)
Direct Unlearning Optimization for Robust and Safe Text-to-Image Models [29.9]
モデルが潜在的に有害なコンテンツを生成する能力を取り除くために、未学習の技術が開発されている。これらの手法は敵の攻撃によって容易に回避され、生成した画像の安全性を確保するには信頼性が低い。 T2IモデルからNot Safe For Work(NSFW)コンテンツを除去するための新しいフレームワークであるDirect Unlearning Optimization (DUO)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:19:11 GMT)
Modeling Relational Patterns for Logical Query Answering over Knowledge Graphs [29.5]
そこで我々は,複雑な空間における回転により,クエリ領域を幾何学的円錐と代数的クエリ演算子として定義する新しいクエリ埋め込み手法RoConEを開発した。いくつかのベンチマークデータセットに対する実験結果から,論理的問合せ処理の強化のための関係パターンの利点が確認された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:57:25 GMT)
Binomial Self-compensation for Motion Error in Dynamic 3D Scanning [29.2]
オブジェクトが静的でなければならないというPSPの基本的な仮定は、動的測定において破られる。本研究では,4ステップPSPの動作誤差を効果的かつ柔軟に除去するBSCアルゴリズムを提案する。我々のBSCは、カメラの取得率(90fps)に匹敵する深度マップのフレームレートを実現しつつ、既存の動作誤差低減手法よりも優れています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:01:14 GMT)
Invertible Neural Warp for NeRF [29.0]
本稿では、ポーズとニューラルラジアンスフィールド(NeRF)の同時最適化に取り組む。本稿では,モデルカメラが学習可能な剛性ワープ関数として機能する,パラメータの過剰表現を提案する。提案手法は,合成および実世界のデータセットにおいて,ポーズ推定や高忠実度再構成の点で,既存のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:14:08 GMT)
When can transformers compositionally generalize in-context? [29.0]
本研究では,データ生成プロセスにおける構成構造を正確に制御できるモジュール型マルチタスク設定について検討する。本研究は,この課題に対して,文脈内で学習するトランスフォーマーが,原理的に十分表現できるにもかかわらず,構成的に一般化する上で苦労する証拠を提示する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:49:27 GMT)
Dense Retrieval with Continuous Explicit Feedback for Systematic Review Screening Prioritisation [28.8]
体系的なレビューにおいて優先順位付けをスクリーニングする目的は、関連文書を高いリコールで識別し、レビューの早い段階でランク付けすることである。近年の研究では、ニューラルモデルがこのタスクに有意なポテンシャルがあることが示されているが、それらの時間を要する微調整と推論は、優先順位付けのスクリーニングに広く使用されることを妨げている。ニューラルモデルに引き続き依存する代替アプローチを提案するが、高密度表現と関連フィードバックを活用してスクリーニングの優先順位付けを強化する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:26:36 GMT)
DreamStory: Open-Domain Story Visualization by LLM-Guided Multi-Subject Consistent Diffusion [28.6]
自動オープンドメインストーリー可視化フレームワークDreamStoryを提案する。 DreamStory は(1) ストーリーディレクターとしての LLM と (2) 革新的多目的一貫した拡散モデル (MSD) から構成される。 MSDには、Masked Mutual Self-Attention (MMSA)とMasked Mutual Cross-Attention (MMCA)モジュールが含まれる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:54:12 GMT)
ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data [28.6]
ProcTagは、文書命令データの有効性を評価するデータ指向の手法である。実験により、既存のオープンソースおよび生成された文書VQA/インストラクションデータセットをProcTagでサンプリングすることは、インストラクションデータを評価する現在の方法よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:29:59 GMT)
X-Pose: Detecting Any Keypoints [28.3]
X-Poseは画像内の複数オブジェクトのキーポイント検出のための新しいフレームワークである。 UniKPTはキーポイント検出データセットの大規模なデータセットである。 X-Poseは、最先端の非プロンプタブル、視覚的プロンプトベース、テキスト的プロンプトベースメソッドに対する顕著な改善を実現している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:25:24 GMT)
OMG-Net: A Deep Learning Framework Deploying Segment Anything to Detect Pan-Cancer Mitotic Figures from Haematoxylin and Eosin-Stained Slides [27.8]
本研究では,デジタル化された全スライド画像(WSI)におけるMFを検出する人工知能(AI)アプローチを提案する。ここでは、社内の軟部組織腫瘍データセット(STMF)と、IPAC、TUPAC、CCMCT、CMC、MIDOG++の5つのオープンソースの有糸分裂データセットを組み合わせることで、最大の有糸分裂像のパン・カンサデータセットを確立する。次に、2段階のフレームワーク(Optimized Mitoses Generator Network (OMG-Net))を用いてMFを分類した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:53:37 GMT)
Less is More: Sparse Watermarking in LLMs with Enhanced Text Quality [27.6]
テキストに分散した生成されたトークンの小さなサブセットに透かしを適用することで、このトレードオフを緩和することを目的とした新しいタイプの透かしであるスパース透かしを提案する。提案手法は,従来の透かし手法よりも高い品質のテキストを生成しつつ,高い検出性を実現することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:52:12 GMT)
Weakly-Supervised 3D Hand Reconstruction with Knowledge Prior and Uncertainty Guidance [27.2]
所要の3Dデータを取得することは、制御された環境に特殊な機器を配置することを必要とするため、完全教師付き単眼3Dハンドリコンストラクションは困難であることが多い。本稿では,人間の手の構造や機能を理解する上で確立された基本原理を活用することによって,そのような要求を回避する弱教師付き手法を提案する。提案手法は広く採用されている FreiHAND データセットに対して約21% の性能向上を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:05:34 GMT)
A Novel Dependency Framework for Enhancing Discourse Data Analysis [27.2]
この研究はPDTBアノテーションを依存性構造に変換することに重点を置いている。改良されたBERTベースの談話を用いて、英語、中国語、その他の言語でPDTBスタイルのコーパスから派生した依存性データの妥当性を検証している。その結果,PDTB依存性データは有効であり,両者の依存関係距離には強い相関関係があることが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:55:00 GMT)
Clearer Frames, Anytime: Resolving Velocity Ambiguity in Video Frame Interpolation [27.0]
既存のビデオフレーム(VFI)メソッドは、各オブジェクトが特定の時刻tにどこにいるかを盲目的に予測する。このことは、メソッドがこれらの可能性を平均化するにつれて、しばしばぼやけたフレームをもたらす。この複雑なタイム・ツー・ロケーションのマッピングを、フレームの予測と合わせて暗黙的に学習させるのではなく、オブジェクトが開始フレームと終了フレームの間をどこまで移動したかを示す明確なヒントをネットワークに提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:19:32 GMT)
Generating SROI^{-} Ontologies via Knowledge Graph Query Embedding Learning [26.9]
本稿では,SROI-記述論理公理の形でグラフから学習した知識を説明する新しいクエリ埋め込み手法AConEを提案する。理論的には、AConEがSROI-公理を学習できることを示し、演算がSROI-記述論理の概念に対応する代数を定義する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:31:56 GMT)
EditShield: Protecting Unauthorized Image Editing by Instruction-guided Diffusion Models [26.8]
本稿では,テキスト・画像拡散モデルからの不正な修正に対するEditShieldの保護手法を提案する。具体的には、EditShieldは拡散プロセスで使われる潜伏表現をシフトできる知覚不能な摂動を追加することで機能する。本実験は,合成および実世界のデータセット間のEditShieldの有効性を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:01:32 GMT)
Motion and Structure from Event-based Normal Flow [26.5]
ニューロモルフィックなイベントベースカメラは、この根本的な問題を解決するために、生のイベントデータを入力として利用するアプローチに非常に要求する。既存の最先端ソリューションは、通常、イベントデータ生成プロセスを反復的に反転することによって暗黙的にデータアソシエーションを推測する。事象に基づく正規フローは、幾何学的問題群を解く際のフルフローの代替として、提案した幾何学的誤り項を介して利用できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:11:20 GMT)
Abstraction Alignment: Comparing Model and Human Conceptual Relationships [26.5]
モデルが学習した抽象と期待される人間の抽象との一致を測定する手法である抽象アライメントを導入する。評価タスクでは、抽象化アライメントがモデルの振る舞いとデータセットの内容をより深く理解します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:27:26 GMT)
Credibility-Aware Multi-Modal Fusion Using Probabilistic Circuits [26.5]
差別学習における後期マルチモーダル融合の問題点を考察する。ノイズの多いマルチソースドメインをモチベーションとし、マルチモーダル融合の文脈における信頼性の概念を探求する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:20:51 GMT)
Scissorhands: Scrub Data Influence via Connection Sensitivity in Networks [26.4]
我々は、訓練されたモデルからデータの影響を消すために、Scisorhandsの新しい機械学習アプローチを提案する。画像分類と画像生成タスクにまたがって実施した実験の結果,Scisorhandsが競争性能を示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:34:04 GMT)
The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation [26.2]
この研究は、拡散モデルが芸術的創造性や専門知識を必要とするプロンプトから画像を生成する方法を探る。本稿では,現実的なシナリオと幻想的なシナリオを融合した新しい評価フレームワークであるRealistic-Fantasy Benchmark(RFBench)を紹介する。広汎な人的評価とGPTに基づく構成的評価は、我々のアプローチが最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:04:10 GMT)
Backdoor Graph Condensation [26.1]
我々はBGCと呼ばれるグラフ凝縮に対する最初のバックドア攻撃を考案した。 BGCは高い攻撃成功率(1.0に近づいた)と優れたモデルユーティリティをすべてのケースで達成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:50:04 GMT)
Improving Air Mobility for Pre-Disaster Planning with Neural Network Accelerated Genetic Algorithm [26.1]
気象災害に関連する緊急作戦は、航空機と空港の両方での空輸に大きな課題をもたらす。そこで本稿では,空港の運用スケジュールを事前に調整するためのフレームワークを提案する。次に、避難計画のための新しいニューラルネットワーク(NN)高速化遺伝的アルゴリズム(GA)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:59:41 GMT)
Gaussian Splatting on the Move: Blur and Rolling Shutter Compensation for Natural Camera Motion [25.5]
本稿では,カメラの動きに適応し,手持ち映像データを用いた高品質なシーン再構成を実現する手法を提案する。合成データと実データの両方を用いて、既存の手法よりもカメラの動きを軽減できる性能を示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:50:14 GMT)
Learning in Deep Factor Graphs with Gaussian Belief Propagation [25.5]
我々は,すべての関連する量をグラフィカルモデルにおけるランダム変数として扱い,学習と予測の両方を異なる観測ノードでの推論問題とみなす。本実験は,更新が本質的に局所的である信念伝播(BP)を用いて,これらの問題を効率的に解けることを示す。私たちのアプローチはディープネットワークに拡張することができ、継続的な学習を行う自然な手段を提供します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:03:50 GMT)
Improving Adversarial Transferability via Model Alignment [25.4]
本稿では,トランスファー可能な逆方向摂動を生成するためのモデルアライメント手法を提案する。さまざまなモデルアーキテクチャを用いたImageNetデータセットの実験では、アライメントされたソースモデルから発生する摂動が、転送可能性を大幅に向上することを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:45:09 GMT)
SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition [25.3]
我々はSkateFormer(SkateFormer)と呼ばれる新しい手法を提案する。 SkateFormerは、さまざまなタイプの骨格と時間の関係に基づいて関節とフレームを分割する。アクション適応的な方法で、アクション認識に不可欠なキージョイントやフレームに選択的にフォーカスすることができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:00:42 GMT)
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections [25.2]
Splatfacto-Wは、ガウスごとのニューラルカラー特徴と画像ごとの外観をレンダリングプロセスに組み込む、自明なアプローチである。提案手法は,3DGSに比べて平均5.3dBのPak Signal-to-Noise Ratio(PSNR)を向上し,NeRF法に比べて150倍のトレーニング速度を向上し,3DGSと同様のレンダリング速度を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:02:54 GMT)
Accelerating the inference of string generation-based chemical reaction models for industrial applications [25.1]
本稿では,自動回帰SMILESジェネレータの投機的復号化による推論を高速化する手法を提案する。反応予測と1段階の逆合成では3倍高速な推算が可能であり,精度は低下しない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:43:17 GMT)
Toward INT4 Fixed-Point Training via Exploring Quantization Error for Gradients [25.0]
大振幅勾配の誤差の低減は量子化性能を著しく向上させることを示す。また、大きな勾配に対する小さな量子化誤差を維持するために、量子化間隔を適応的に調整する間隔更新アルゴリズムを導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:06:12 GMT)
MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline [24.9]
本稿では,Large Language Models (LLMs) を反復的なフィードバック学習に活用する,学習不要のパイプラインであるMERLINを紹介する。 MERLINは、クエリの埋め込みをユーザの視点から洗練し、クエリとビデオコンテンツのアライメントを強化する。 MSR-VTT、MSVD、ActivityNetといったデータセットの実験結果は、MERLINがRecall@1を大幅に改善し、既存のシステムよりも優れた性能を示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:45:02 GMT)
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning [24.7]
本稿では,数理推論にコードアシストと自己補正を併用した思考の分解を利用した大規模言語モデル(LLM)について紹介する。 DotaMathモデルは複雑な数学的タスクに対処し、それらをより単純な論理的なサブタスクに分解し、コードを利用してこれらのサブタスクを解決する。そこで我々は,DotaMathQAの模倣学習を用いて,オープンソースのLLMと比較して優れた性能を示すDotaMathモデルを訓練した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:13:05 GMT)
Diffusion-Aided Joint Source Channel Coding For High Realism Wireless Image Transmission [24.4]
DiffJSCCは条件拡散復調法により高現実性画像を生成する新しいフレームワークである。 768x512ピクセルのコダック画像を3072のシンボルで再現できる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:33:10 GMT)
Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation [24.3]
トランスを用いた画像分類では、第1変圧器エンコーダ層のクラストークンを学習して、テスト時間適応時のターゲットサンプルのドメイン固有の特性をキャプチャすることができる。本稿では,ドメイン固有の特徴の長期的変動を捉えつつ,インスタンス固有の特徴の局所的変動を調節する二段階学習手法を提案する。提案手法により,テスト時間適応性能を最大1.9%向上させることができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:57:44 GMT)
SlimFlow: Training Smaller One-Step Diffusion Models with Rectified Flow [24.2]
我々は, 強力な整流フローフレームワークに基づく, 小型かつ効率的な1ステップ拡散モデルを構築した。我々は、FIDが5.02と15.7Mの1ステップ拡散モデルを訓練し、従来の最先端1ステップ拡散モデルよりも優れている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:38:45 GMT)
Model Provenance via Model DNA [23.9]
本稿では,機械学習モデルの特徴を表現した新しいモデルDNAについて紹介する。本研究では,対象モデルの事前学習モデルであるかどうかを識別できるモデル証明同定のための効率的なフレームワークを開発する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:53:32 GMT)
ScanReason: Empowering 3D Visual Grounding with Reasoning Capabilities [23.2]
我々は3D推論基底と呼ばれる新しいタスクを提案し、新しいベンチマークScanReasonを導入する。 ScanReasonは、推論とグラウンドの相乗化を必要とする5つの推論タイプから10万以上の質問と回答のペアを提供する。提案手法は, 推論において, 分岐推論と接地ステップにより, さらなる性能向上を図っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:07:43 GMT)
Uncertainty Calibration with Energy Based Instance-wise Scaling in the Wild Dataset [23.2]
エネルギーモデルに基づく新しいインスタンスワイドキャリブレーション手法を提案する。本手法は,ソフトマックス信頼性スコアの代わりにエネルギースコアを組み込むことにより,不確実性を考慮した適応的な検討を可能にする。実験では,提案手法はスペクトル間のロバストな性能を一貫して維持することを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:14:55 GMT)
CaBaFL: Asynchronous Federated Learning via Hierarchical Cache and Feature Balance [23.1]
有望な分散機械学習パラダイムとしてのフェデレートラーニング(FL)は、AIoT(Artificial Intelligence of Things)アプリケーションで広く採用されている。 FLの効率性と推論能力は、トラグラーの存在と大規模なAIoTデバイス間のデータの不均衡により、著しく制限されている。本稿では,階層型キャッシュベースのアグリゲーション機構と機能バランス誘導型デバイス選択戦略を含む,CaBaFLという新しいFLアプローチを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:56:18 GMT)
Building Intelligence Identification System via Large Language Model Watermarking: A Survey and Beyond [22.9]
大規模言語モデル(LLM)は多種多様な産業に統合され、不正な複製と誤用により重大なセキュリティリスクが生じる。本稿では,識別過程を体系化し,より正確でカスタマイズされた透かしを実現する相互情報理論に基づく数学的枠組みを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:08:14 GMT)
Select and Distill: Selective Dual-Teacher Knowledge Transfer for Continual Learning on Vision-Language Models [22.9]
大規模視覚言語モデル(VLM)は、目に見えない領域データに対して強力なゼロショット一般化能力を示す。訓練済みのVLMを下流の一連のタスクに適応させることは、しばしば以前に学んだ知識を忘れてしまう。本稿では,これまでに学習した知識とゼロショット機能を維持するために,独特なSelective Dual-Teacher Knowledge Transferフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:53:25 GMT)
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation [22.8]
Part-Aware Network (PANet) は、航空機の翼や尾などの3Dオブジェクトの異なる部分のローカライズと理解を目的としている。提案手法は,任意のビュー下での3次元オブジェクト認識処理において,既存のビューベースアグリゲーションベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:52:05 GMT)
Halu-J: Critique-Based Hallucination Judge [22.8]
批判に基づく幻覚判断器であるHalu-Jを紹介する。 Halu-Jは、関連する証拠を選択し、詳細な批評を提供することで幻覚の検出を強化する。実験の結果,Hlu-J は GPT-4o よりも多値幻覚検出に優れていた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:21:01 GMT)
Agnostic Interactive Imitation Learning: New Theory and Practical Algorithms [22.7]
本研究では、対話型模倣学習について研究し、学習者がアクションアノテーションの実証的な専門家に対話的に問い合わせる。証明可能な有限サンプル保証を備えた新しいオラクル効率アルゴリズム MFTPL-P を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:05:36 GMT)
TIBET: Identifying and Evaluating Biases in Text-to-Image Generative Models [22.1]
我々は、任意のTTIモデルと任意のプロンプトに対して、幅広いバイアススペクトルを研究、定量化するための一般的なアプローチを提案する。我々の手法は、与えられたプロンプトに関連する可能性のある潜在的なバイアスを自動的に識別し、それらのバイアスを測定する。本研究では,本手法が意味論的概念を通じて複雑な多次元バイアスを説明できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:15:51 GMT)
Noisy Label Classification using Label Noise Selection with Test-Time Augmentation Cross-Entropy and NoiseMix Learning [22.0]
本論文では,テスト時間拡張(TTA)クロスエントロピーを用いたラベルノイズ選択とNossMix法による分類器学習を用いたノイズラベルデータの学習手法を提案する。 ISIC-18公開皮膚病変診断データセットの実験において、提案したTTAクロスエントロピーは、ラベルノイズデータの検出において従来のクロスエントロピーとTTAの不確実性よりも優れていた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:28:13 GMT)
Exploring Deeper! Segment Anything Model with Depth Perception for Camouflaged Object Detection [22.0]
DSAMはSAMのゼロショット機能を利用して、RGB-Dドメインの正確なセグメンテーションを実現する。 Finer Moduleは、深度の観点から高度にキャモフラージュされたターゲットを正確にセグメンテーションする可能性を探っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:31:29 GMT)
Asymmetric Bias in Text-to-Image Generation with Adversarial Attacks [21.9]
本稿では、攻撃成功率(ASR)に関連する要因の分析に焦点をあてる。敵接尾辞と2つの勾配に基づく攻撃アルゴリズムを用いた新たな攻撃目標であるエンティティスワップを導入する。敵の攻撃で成功確率が60%になる状況と、この確率が5%以下に低下する状況を見いだす。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:07:57 GMT)
Robust-Wide: Robust Watermarking against Instruction-driven Image Editing [21.7]
悪意のあるユーザーは、命令駆動の画像編集を利用して偽画像を作成することができる。本稿では,命令駆動画像編集に対する最初の堅牢な透かし手法であるRobust-Wideを提案する。実験により、ロバスト・ウェイドは編集画像から効果的に透かしを抽出でき、ビット誤り率は2.6%近くであることが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:26:45 GMT)
Towards Multimodal In-Context Learning for Vision & Language Models [21.7]
VLM(State-of-the-the-art Vision-Language Models)は、ビジョンと言語のモダリティを基盤としている。本稿では, 効果的なデータ混合を用いた, 単純かつ驚くほど効果的なマルチターンカリキュラムベースの学習手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:13:02 GMT)
Uncovering Weaknesses in Neural Code Generation [21.6]
マッチングベースのメトリクスと実行ベースのメトリクスを用いて生成されたコードの品質を評価し、その後、セマンティック分析を行い、9種類の弱点の分類法を開発する。 CoNaLaデータセットでは、不正確なプロンプトが顕著な問題であり、すべての大きなモデルが26.84%のケースで失敗する。 CoNaLaタスクの65.78%でキーセマンティクスを省略する1つ以上の大きなモデルがある。すべてのモデルは、あいまいなプロンプトや複雑なプロンプトによって増幅された、適切なAPI使用に苦しむ。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:34:14 GMT)
SpikeVoice: High-Quality Text-to-Speech Via Efficient Spiking Neural Network [21.5]
スパイキングニューラルネットワーク(SNN)は、視覚、自然言語、音声理解タスクにおいて、その効果と効率を実証している。 SNNを介して高品質のテキスト音声(TTS)を実行するtextbfSpikeVoiceを設計し、SNNの「話す」可能性を探る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:22:52 GMT)
AudienceView: AI-Assisted Interpretation of Audience Feedback in Journalism [21.2]
AudienceViewは、ジャーナリストがオーディエンスフィードバックを分類し解釈するのを助けるオンラインツールだ。このようなツールがジャーナリストのワークフローにどのように役立つかを検討し,文脈認識と人的判断の重要性を強調した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:41:35 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0]
既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。これまでの研究は、悪天候をシミュレートしたり、トレーニング中に普遍的なデータ拡張を採用することでこの問題に対処してきた。本稿では,性能劣化の主な原因を特定するために,新たな戦略データ拡張手法を提案する。提案手法はセマンティックKITTI-to-SemanticSTFベンチマークで39.5 mIoUを達成し,ベースラインを8.1%改善し,新たな最先端技術を確立した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:50:27 GMT)
Preventing Catastrophic Overfitting in Fast Adversarial Training: A Bi-level Optimization Perspective [21.0]
対人訓練(AT)は、敵例(AE)に対する効果的な防御方法となっている。 Fast AT (FAT) はトレーニングプロセスのガイドに単一ステップの攻撃戦略を採用している。 FAT法は破滅的なオーバーフィッティング問題に悩まされる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:53:20 GMT)
Progressive Proxy Anchor Propagation for Unsupervised Semantic Segmentation [20.8]
本稿では,画像レベルの事前学習モデルに対するプログレッシブプロキシ・アンカー・プロパゲーション(PPAP)戦略を提案する。この戦略は、各アンカーに対して、そのプロキシを意味的に類似したサンプルが密集した領域に移すことによって、より信頼に値する正を徐々に識別する。提案手法の有効性を検証し,提案手法の有効性を検証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:28:51 GMT)
The Future of Learning: Large Language Models through the Lens of Students [20.6]
学生はChatGPTの効率を学習と情報探索に活用するというジレンマに悩まされる。学生はChatGPTを従来のAIよりも「人間的」だと考えている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:40:37 GMT)
Information-Theoretic Foundations for Machine Learning [20.6]
本稿では,洞窟外に存在する問題に答えようとする理論的枠組みを提案する。我々はベイズ統計とシャノンの情報理論に根ざしたフレームワークを提供し、機械学習における多くの現象の分析を統一するのに十分一般的なものである。我々は、不特定アルゴリズムの性能を特徴付けるセクションを締めくくる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:18:40 GMT)
Audio-Synchronized Visual Animation [20.6]
本稿では,静的な画像をアニメーションして動きのダイナミクスを実演するAudio Synchronized Visual Animation (ASVA)を紹介する。本稿では,VGGSoundから収集したデータセットであるAVSync15について紹介する。また、オーディオによって誘導される動的アニメーションを生成することができる拡散モデルAVSyncDを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:28:48 GMT)
Questionable practices in machine learning [20.5]
研究者が何らかの指標で最先端の結果を報告するための強いインセンティブは、しばしば疑わしい研究慣行(QRP)につながる。報告結果を損なう可能性のある43のプラクティスについて説明する。また、他の研究者が以前の研究を再現し、構築し、監査することを困難または不可能にする「再現不可能な研究慣行」についても論じる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:06:30 GMT)
Generalized Graph Prompt: Toward a Unification of Pre-Training and Downstream Tasks on Graphs [20.4]
GraphPromptは、グラフに関する新しい事前トレーニングおよびプロンプトフレームワークである。トレーニング済みタスクとダウンストリームタスクを共通タスクテンプレートに統合する。また、学習可能なプロンプトを使用して、トレーニング済みモデルから最も関連性の高い知識を見つけるために、下流タスクを支援する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:50:46 GMT)
HGL: Hierarchical Geometry Learning for Test-time Adaptation in 3D Point Cloud Segmentation [20.2]
本稿では,3次元クラウドセグメンテーションのための階層幾何学学習(HGL)フレームワークを提案する。 HGLは、局所的、グローバルから時間的学習までの3つの相補的なモジュールをボトムアップで構成する。 SynLiDAR to Semantic KITTIタスクでは、HGLは46.91%のmIoUを達成し、GIPSOを3.0%改善し、必要な適応時間を80%削減した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:08:03 GMT)
Neural Compression of Atmospheric States [19.9]
ニューラルネットワークの手法を用いて大気状態を圧縮する手法を提案する。モデルの両方の族が小さな平均誤差のデシラタを満たすことを示す。大気中における1000倍を超える圧縮比を示すとともに, 大気中における圧縮と減圧を約1秒の速さで示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:20:51 GMT)
VCP-CLIP: A visual context prompting model for zero-shot anomaly segmentation [19.8]
CLIPに基づくZSASタスクのための視覚的コンテキストプロンプトモデル(VCP-CLIP)を提案する。具体的には、まず、グローバルな視覚情報をテキストプロンプトに埋め込むためのPre-VCPモジュールを設計する。そこで我々は,画像のきめ細かい特徴を利用してテキスト埋め込みを調整する新しいポストVCPモジュールを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:54:41 GMT)
Navigating the Noisy Crowd: Finding Key Information for Claim Verification [19.8]
EAConは,証拠の中から重要な情報を見つけ出し,請求項の各側面を個別に検証するフレームワークである。 Ecconはクレームからキーワードを見つけ出し、ファジィマッチングを使用して、生のエビデンスごとに関連するキーワードを選択する。 Ecconは、元の主張をサブステートに分解し、個別に抽象化された証拠と生の証拠の両方に対して検証される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:24:10 GMT)
COMAE: COMprehensive Attribute Exploration for Zero-shot Hashing [19.7]
COMAEと呼ばれるゼロショットハッシュ(ZSH)のための総合属性探索を行う。 COMAEは、3つの精巧に設計された探索を通して、見知らぬクラスから目に見えないクラスとの関係を描いている。一般的なZSHデータセットの結果は、COMAEが最先端のハッシュ技術より優れていることを示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:23:33 GMT)
DN-Splatter: Depth and Normal Priors for Gaussian Splatting and Meshing [19.4]
一般的な屋内シーンの高忠実度3D再構成は、VRおよびARアプリケーションにとって不可欠である。我々は3Dガウススプラッティングを奥行きと通常の手法で拡張し、屋内データセットに挑戦する。カラー画像の勾配に基づく適応的な深度損失を提案し、深度推定と新しいビュー合成結果を改善した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:01:54 GMT)
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding [18.6]
VisFocusは、視覚エンコーダのキャパシティを言語プロンプトと直接結合することにより、OCRフリーな手法である。視覚的エンコーダに入力された文書テキストのスニペットに言語マスキングを用いて,アーキテクチャ拡張と新たな事前学習タスクを組み合わせた。我々の実験は、このプロンプト誘導型視覚符号化アプローチが性能を著しく向上させることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:16:46 GMT)
GIVT: Generative Infinite-Vocabulary Transformers [18.6]
実数値エントリを持つベクトル列を生成するGIVT(Generative Infinite-Vocabulary Transformers)を導入する。 VQ-GANとMaskGITの画像生成パラダイムにインスパイアされた私たちは、GIVTを使って、$beta$-VAEの未定量実数値列をモデル化する。クラス条件画像生成におけるGIVTは、VQ-GANやMaskGITよりも優れ、近年の潜伏拡散モデルと競合する性能を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:32:09 GMT)
A Comprehensive Sustainable Framework for Machine Learning and Artificial Intelligence [18.5]
持続可能な機械学習の4つの重要な柱は、公正性、プライバシー、解釈可能性、温室効果ガスの排出である。それぞれの柱の間には固有のトレードオフがあり、一緒に考えることがより重要である。本稿では、持続可能な機械学習のための新しいフレームワークの概要と、汎用AIパイプラインであるFPIGを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:54:19 GMT)
Frequency Guidance Matters: Skeletal Action Recognition by Frequency-Aware Mixed Transformer [18.5]
骨格の周波数表現を除去するための周波数認識型アテンションモジュールを提案する。また、周波数特徴を持つ空間特徴を組み込む混合変圧器アーキテクチャも開発している。 FreqMiXFormerは3つの一般的な骨格認識データセットでSOTAを上回っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:47:27 GMT)
On Initializing Transformers with Pre-trained Embeddings [18.3]
また,T5 や mT5 などの言語モデルから抽出したサブワード埋め込みは,ランダムに比較するとはるかに悪い値を示した。これは、プレトレーニングのよく知られた表現的および伝達学習の利点を考えると、直感に反する。また、BERT と mBERT の埋め込みは、ランダムよりも優れていることもわかりました。事前訓練された表現の利点を示す意味。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:57:10 GMT)
SENC: Handling Self-collision in Neural Cloth Simulation [17.8]
SENCは、布の自己修復の課題に対処する、新しい自己教師型ニューラルネットワークである。本研究では,ランダムな外力に応答して布の挙動をシミュレーションで学習できる効果的な外力スキームを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:05:31 GMT)
NeuroSynth: MRI-Derived Neuroanatomical Generative Models and Associated Dataset of 18,000 Samples [17.6]
ニューロシンス(Neuro Synth)は、構造的脳画像から派生した規範的局所容積特徴の生成モデルである。成人の寿命(22～90歳)にまたがる18,000の合成サンプルと、無制限のデータを生成するモデルの能力を提供する。最も重要なことは、生成された規範データにより、疾患分類などのタスクにおける下流機械学習モデルの精度が大幅に向上することである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:33:10 GMT)
Auto-Regressive Next-Token Predictors are Universal Learners [17.4]
線形次トーケン予測器のような単純なモデルでさえ、チューリングマシンによって効率的に計算される任意の関数を近似することができることを示す。また、線形ネットワークや浅層多層パーセプトロン(MLP)のような単純な次世代予測器が、テキスト生成や算術タスクにおいて非自明な性能を示すことを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:03:08 GMT)
Embracing Events and Frames with Hierarchical Feature Refinement Network for Object Detection [17.4]
イベントカメラはスパースと非同期のイベントを出力し、これらの問題を解決する潜在的な解決策を提供する。イベントフレーム融合のための新しい階層的特徴改善ネットワークを提案する。本手法は, フレーム画像に15種類の汚損タイプを導入する際に, 極めて優れたロバスト性を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:09:46 GMT)
Why Do You Grok? A Theoretical Analysis of Grokking Modular Addition [17.3]
我々は、モデルが過度に適合した後長く一般化するグラッキング現象の理論的な説明を示す。勾配降下の早い段階では、全ての可能なデータポイントの少なくとも一定の分数しか見つからなければ、モジュラー加算における置換同変モデルによる小さな集団誤差が得られないことが示される。我々は,有界な$ell_infty$ノルムでゼロのトレーニング損失を達成する2層二次ネットワークが,ほぼ少ないトレーニングポイントを持つことを示すとともに,そのようなネットワークが存在することを示すとともに,小さな$ell_infty$正規化による勾配降下によって発見できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:15:30 GMT)
GenRC: Generative 3D Room Completion from Sparse Image Collections [17.2]
GenRCは、高忠実度テクスチャを備えたルームスケールの3Dメッシュを完成させる、自動トレーニングフリーパイプラインである。 E-Diffusionは、大域幾何学と外観整合性を保証するビュー一貫性パノラマRGBD画像を生成する。 GenRCは、ScanNetとARKitScenesデータセットのほとんどの外観と幾何学的メトリクスの下で、最先端のメソッドよりも優れています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:10:40 GMT)
SENTAUR: Security EnhaNced Trojan Assessment Using LLMs Against Undesirable Revisions [17.2]
ハードウェアトロイジャン(HT)は、ステルスな動作の導入、意図したIC作業の防止、またはサイドチャネルを介して機密データを漏洩することができる。 HTに対処するためには、HTシナリオを迅速に調査することが重要な要件である。本稿では,登録転送レベル(RTL)設計のためのHTスイートを生成するための大規模言語モデル(LLM)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:13:06 GMT)
KiGRAS: Kinematic-Driven Generative Model for Realistic Agent Simulation [17.1]
軌道生成は自動運転における重要な課題である。最近の研究は自己回帰パラダイムを導入している。実エージェントシミュレーションのためのキネマティック駆動生成モデルを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:12:11 GMT)
LTSim: Layout Transportation-based Similarity Measure for Evaluating Layout Generation [16.9]
レイアウト生成の結果を評価するために,レイアウト類似度尺度を導入する。本稿では, 要素のより柔軟なマッチングを容易にする最適輸送に基づく新しい類似度尺度を提案する。 FIDが一般的に使用される非条件レイアウト生成のようなタスクに対しては、コレクションレベルの類似性を扱うために、我々の測度を拡張します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:21:44 GMT)
Team Samsung-RAL: Technical Report for 2024 RoboDrive Challenge-Robust Map Segmentation Track [16.8]
本報告では2024年のRoboDrive Challenge Robust Map Trackの技術的詳細について述べる。ロバストマップのトラックは、様々な運転条件下でのBEVマップにおける複雑な運転シーン要素のセグメンテーションに焦点を当てている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:55:35 GMT)
Augmented Neural Fine-Tuning for Efficient Backdoor Purification [16.7]
最近の研究では、様々なバックドア攻撃に対するディープニューラルネットワーク(DNN)の脆弱性が明らかにされている。神経活動の最適再編成を目的としたニューラルマスクファインチューニング(NFT)を提案する。 NFTはトリガー合成プロセスを緩和し、逆探索モジュールの要求をなくす。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:01:42 GMT)
SambaLingo: Teaching Large Language Models New Languages [16.7]
我々は,LLMの新たな言語への適応に関する包括的調査を行う。本研究は,語彙拡張や直接選好最適化など,このプロセスの主要なコンポーネントについて述べる。 9つの言語と2つのパラメータスケールでこれらの実験をスケールします。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:30:56 GMT)
Close the Sim2real Gap via Physically-based Structured Light Synthetic Data Simulation [16.7]
我々は、RGBと物理的にリアルな深度画像を生成する革新的な構造化光シミュレーションシステムを導入する。ロボット産業の把握シナリオに適したRGBDデータセットを作成します。 sim2realのギャップを減らし、深層学習訓練を強化することにより、深層学習モデルを産業環境に適用しやすくする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:57:14 GMT)
Continual Learning for Adaptable Car-Following in Dynamic Traffic Environments [16.6]
自動運転技術の継続的な進化には、多様なダイナミックな交通環境に適応できる自動車追従モデルが必要である。従来の学習ベースのモデルは、連続的な学習能力の欠如により、目に見えないトラフィックパターンに遭遇する際のパフォーマンス低下に悩まされることが多い。本稿では,この制限に対処する連続学習に基づく新しい車追従モデルを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:32:52 GMT)
Investigating and Defending Shortcut Learning in Personalized Diffusion Models [16.6]
ショートカット学習のレンズを通して、パーソナライズされた拡散モデルの微調整過程を詳しく調べる。この微調整時のミスアライメントは、モデルがノイズパターンと識別子を関連付ける原因となり、性能が低下する。提案手法は,まず画像に固有の意味的意味を潜時空間で認識する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:02:01 GMT)
Security Matrix for Multimodal Agents on Mobile Devices: A Systematic and Proof of Concept Study [16.6]
マルチモーダル大規模言語モデルの推論能力の急速な進歩は、モバイルデバイス上での自律エージェントシステムの開発をきっかけにしている。ヒトと機械の相互作用効率が向上したにもかかわらず、MLLMベースの移動エージェントシステムのセキュリティリスクは体系的に研究されていない。本稿では,MLLMシステムの設計におけるセキュリティ意識の必要性を強調し,今後の攻撃・防御手法の研究の道を開く。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:36:56 GMT)
Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates [16.5]
本稿では,酵素をすべての官能基にまたがって設計する統一モデルを学ぶためのアプローチであるEnzyGenを提案する。我々のキーとなるアイデアは、酵素のアミノ酸配列とその3D座標を、所望の触媒機能に対応する機能的に重要な部位と基質に基づいて生成することである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:14:32 GMT)
NOD-TAMP: Generalizable Long-Horizon Planning with Neural Object Descriptors [16.5]
一般化可能なオブジェクト中心機能を生成するニューラルオブジェクト記述子(NOD)と,多段階タスクを解決するための短軸スキルをチェーンするタスク・アンド・モーション・プランニング(TAMP)フレームワークの2つのパラダイムを組み合わせることを提案する。我々は,少数の人間による実験から短い操作軌跡を抽出し,NOD特徴を用いてこれらの軌跡を適応させる,TAMPベースのフレームワークNOD-TAMPを紹介する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:41:23 GMT)
SG-NeRF: Neural Surface Reconstruction with Scene Graph Optimization [16.5]
本稿では,外乱ポーズの影響を軽減するため,シーングラフを用いた放射場最適化手法を提案する。本手法では,シーングラフに基づく適応型不整合・不整合信頼度推定手法を取り入れた。また、カメラのポーズと表面形状を最適化するために、効果的な交叉結合(IoU)損失を導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:50:17 GMT)
CatchBackdoor: Backdoor Detection via Critical Trojan Neural Path Fuzzing [16.4]
様々なトロイの木馬攻撃によって引き起こされるトロイの木馬の行動はトロイの木馬の道のせいだトロイの木馬攻撃に対する検出手法であるCatchBackdoorを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:58:13 GMT)
In-Context Probing Approximates Influence Function for Data Valuation [16.4]
そこで本研究では,文脈内探索によるデータ評価が,学習データ選択に影響を及ぼすことを示す。実験結果から, 文脈内探索と勾配に基づく影響フレームワークは, トレーニングデータのランク付け方法に類似していることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:06:56 GMT)
Evaluating the transferability potential of deep learning models for climate downscaling [16.3]
複数の気候データセットを用いた深層学習ダウンスケーリングモデルのトレーニングの有効性を評価し,より堅牢で伝達可能な表現を学習する。ダウンスケーリングモデルの空間的, 変動的, 製品移動可能性について実験的に評価し, これらの異なるアーキテクチャの一般化可能性について考察する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:10:24 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3]
NOVICは、革新的なuN制約付きOpen Vocabulary Imageである。埋め込みスペースを利用して、純粋なテキストから画像へのゼロショット転送を可能にする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:23:42 GMT)
Temporal Label Hierachical Network for Compound Emotion Recognition [16.3]
本稿では,第7回フィールド感情行動分析(ABAW)コンペの成果を紹介する。時間経過に伴う感情の連続性を考慮して,フレームレベルの感情予測のための時間ピラミッド構造ネットワークを提案する。同時に、複合感情認識におけるデータの欠如に対処するために、DFEWデータベースからのきめ細かいラベルを利用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:38:44 GMT)
Voltage-Controlled Magnetoelectric Devices for Neuromorphic Diffusion Process [16.2]
我々は、ニューロモルフィック拡散プロセスのためのスピントロニック電圧制御磁気メモリハードウェアを開発した。磁気メモリの非揮発性により,高速かつ低コストな計算が可能となる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:14:22 GMT)
Category-level Object Detection, Pose Estimation and Reconstruction from Stereo Images [15.9]
既存の単分子法とRGB-D法は、欠落や深さの測定によるスケールの曖昧さに悩まされている。本稿では,カテゴリーレベルの物体検出のための一段階的アプローチであるCoDERSを提案する。私たちのデータセット、コード、デモはプロジェクトのページで公開されます。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:13:08 GMT)
Evaluating Linguistic Capabilities of Multimodal LLMs in the Lens of Few-Shot Learning [15.9]
本研究では,VALSEベンチマークを用いたマルチモーダル大規模言語モデル(MLLM)の性能評価を目的とした。我々は,モデルサイズや事前学習データセットの異なる最先端MLLMの包括的評価を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:26:47 GMT)
InfoNorm: Mutual Information Shaping of Normals for Sparse-View Reconstruction [15.9]
多視点画像からの3次元表面再構成はシーン理解とインタラクションに不可欠である。ニューラルレージアンス場(NeRF)や符号付き距離関数(SDF)といった近年の暗黙的な表面表現は、観測情報の欠如を解決するために様々な幾何学的先行法を用いている。本稿では,高度に相関したシーンポイントの表面正規化における相互情報を明確に促進することにより,幾何学的モデリングの正規化を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:46:25 GMT)
The Role of Network and Identity in the Diffusion of Hashtags [15.8]
本稿では,Twitter上の人気ハッシュタグ1,337の拡散における2つの社会的要因の役割を包括的に調査する。カスケードはネットワークとアイデンティティの組み合わせでモデル化されるのが最適である。機能の組み合わせごとにどのハッシュタグが最適かを予測することができ、これを使ってパフォーマンスをさらに向上します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:51:49 GMT)
A Recent Survey of Heterogeneous Transfer Learning [15.8]
異種移動学習は様々なタスクにおいて重要な戦略となっている。データベースとモデルベースの両方のアプローチを網羅した60以上のHTLメソッドの広範なレビューを提供する。自然言語処理,コンピュータビジョン,マルチモーダル学習,バイオメディシンの応用について検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:56:45 GMT)
Think Big, Generate Quick: LLM-to-SLM for Fast Autoregressive Decoding [15.7]
大規模言語モデル(LLM)は、実際にはユビキタスなものとなり、翻訳、要約、命令の追従といった生成タスクに広く利用されている。本稿では,異なるサイズの言語モデルを組み合わせて,自己回帰復号化の効率を高めるハイブリッド手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:59:48 GMT)
Deep Learning-based Sentiment Analysis of Olympics Tweets [15.7]
本研究では,感性分析(SA)のための高度深層学習(DL)モデルの開発を試みる。我々は NLP をツイート前処理に使用し,SA と議論するために洗練された DL モデルを開発した。実験の結果、BERTモデルはオリンピックに関する感情を効率的に分類することができ、99.23%の精度を達成している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:55:04 GMT)
DP-KAN: Differentially Private Kolmogorov-Arnold Networks [15.5]
我々は最近、古典的多層受容器(MLP)の代替として提案されたコルモゴロフ・アルノルドネットワーク(KAN)について研究する。 DP-SGDアルゴリズムを用いて,kanを直接的にプライベートにすることが可能であることを実証し,その性能を複数のデータセットで評価した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:52:21 GMT)
Learning High-Frequency Functions Made Easy with Sinusoidal Positional Encoding [15.4]
正弦波PE(sinusoidal PE, SPE)は, 適応周波数特徴を真基底関数と密に一致させて効率的に学習するように設計されている。 SPEは、3Dビュー合成、テキスト音声生成、および1Dレグレッションなど、様々なタスクにわたる改善された忠実さと高速なトレーニングを実現している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:20:12 GMT)
DiverseDream: Diverse Text-to-3D Synthesis with Augmented Text Embedding [15.3]
既存のテキストから3Dの手法はモード崩壊を起こしやすいため、結果の多様性は低い。同じテキストプロンプトから異なる3次元モデルの結合生成を考慮した新しい手法を提案する。本手法はテキストから3D合成における多様性を質的,定量的に向上させることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:03:58 GMT)
VEON: Vocabulary-Enhanced Occupancy Prediction [15.3]
本稿では,Vocabulary-Enhanced Occupancy predictioNのためのVEONを提案する。 VEONはOcc3D-nuScenesで15.14 mIoUを達成し、オープン語彙圏で物体を認識する能力を示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:26:50 GMT)
Pack and Detect: Fast Object Detection in Videos Using Region-of-Interest Packing [15.2]
そこで我々は,ビデオにおけるオブジェクト検出の計算要求を削減するためのPack and Detectを提案する。 ImageNetのビデオオブジェクト検出データセットを使用した実験は、PaDがフレームに必要なFLOPSの数を4.99ドル削減できることを示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:09:10 GMT)
Temporal receptive field in dynamic graph learning: A comprehensive analysis [15.2]
本稿では,動的グラフ学習における時間受容領域の包括的解析について述べる。その結果,適切な時間的受容場を選択すれば,モデルの性能が大幅に向上することが示された。一部のモデルでは、過度に大きなウィンドウがノイズを発生させ、精度を低下させる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:46:53 GMT)
Dual-level Adaptive Self-Labeling for Novel Class Discovery in Point Cloud Segmentation [15.0]
そこで我々は,点雲セグメンテーションにおける新しいクラス発見に挑戦し,見受けられるクラスの意味的知識に基づいて,新しいクラスを発見する。既存の研究は、解の退化を避けるために、新しいクラスに等しいクラスサイズの制約を単純化したオンラインポイントワイズクラスタリング手法を提案する。本研究では,モデル学習中に不均衡なクラスに対して,高品質な擬似ラベルを適応的に生成する新たな自己ラベル方式を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:14:46 GMT)
Federated Learning Can Find Friends That Are Advantageous [15.0]
フェデレートラーニング(FL)では、クライアントデータの分散の性質と均一性は、機会と課題の両方を示します。本稿では,FLトレーニングに参加するクライアントに対して適応的なアグリゲーション重みを割り当てるアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:49:30 GMT)
Minimum-Norm Interpolation Under Covariate Shift [14.9]
高次元線形回帰に関する非分布研究は、テキシトベニンオーバーフィッティング(textitbenign overfitting)として知られる現象の同定につながった。本稿では,移動学習環境における線形補間器の非漸近的過剰リスク境界を初めて証明する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:55:59 GMT)
Shap-Mix: Shapley Value Guided Mixing for Long-Tailed Skeleton Based Action Recognition [14.8]
長い尾の学習は、重要な時空間運動パターンの欠如により、準最適である。そこで我々は,末尾カテゴリーの代表動作パターンをマイニングすることで長尾学習を改善するShap-Mixを提案する。我々の実験では、長い尾とバランスの取れた環境下での顕著なパフォーマンス改善が示されています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:25:51 GMT)
TransCAD: A Hierarchical Transformer for CAD Sequence Inference from Point Clouds [14.6]
物理物体の3次元スキャンによりCADモデルを推定する3次元リバースエンジニアリングは、有望な研究方向である。本稿では,ポイントクラウドからCADシーケンスを予測するエンドツーエンドトランスフォーマーアーキテクチャであるTransCADを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:24:36 GMT)
UTG: Towards a Unified View of Snapshot and Event Based Models for Temporal Graphs [14.6]
スナップショットベースおよびイベントベース機械学習モデルを統一するフレームワークであるUTG(Unified Temporal Graph)を導入する。時系列リンク予測タスクにおいて、スナップショットとイベントベースモデルの両方を時間グラフの両タイプで評価する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:35:24 GMT)
Denoising Diffusions in Latent Space for Medical Image Segmentation [14.5]
拡散モデル(DPM)は画像生成において顕著な性能を示しており、しばしば他の生成モデルよりも優れている。医用画像セグメンテーションのための潜在空間で拡散する新しい条件生成モデリングフレームワーク(LDSeg)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:44:38 GMT)
Efficient and Flexible Differet-Radix Montgomery Modular Multiplication for Hardware Implementation [14.5]
DRMMMと呼ばれる反復モンゴメリーモジュラー乗算の効率的な並列変乗法を提案し、複数の反復で商を計算できるようにする。提案した変種に基づいて,高速な動作を実現するための高性能ハードウェア実装アーキテクチャを設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:24:15 GMT)
Attribute Based Interpretable Evaluation Metrics for Generative Models [14.4]
属性強度の分布に関するトレーニングセットから生成された画像の集合のばらつきを計測する新しい評価プロトコルを提案する。我々のメトリクスは、生成モデルの説明可能な評価の基礎を築いた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:13:08 GMT)
IICPilot: An Intelligent Integrated Circuit Backend Design Framework Using Open EDA [14.4]
IICPilotはLLM技術に基づくインテリジェントICバックエンド設計システムである。 LangChainのマルチエージェントフレームワークは、異なる設計タスクを効率的に処理する。 IICPilotはバックエンド設計ワークフローを、特定のオープンソースEDAツールから分離する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:02:01 GMT)
Knowledge boosting during low-latency inference [14.4]
低レイテンシのストリーミングアプリケーションは、より大きなモデルの知識能力の恩恵を受けることができるが、エッジデバイスはリソース制約のためにこれらのモデルを実行できない。提案手法は,大規模モデルを推論中に時間遅延入力で動作させながら,小型モデルの性能を向上する新しい手法であるナレッジ・ブーイングを提案する。その結果,小型モデルと大規模モデルのパフォーマンスギャップが大きくなり,低レイテンシアプリケーションにおける大規模モデルコラボレーションに有望な方法が示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:43:12 GMT)
Privacy-Preserving Adaptive Re-Identification without Image Transfer [14.3]
Re-ID(DUDA-Rid)のためのプライバシ保護型分散非教師付きドメイン適応のための新しい設定法を提案する。エッジデバイス内で直接、人物Re-IDモデルを適応する新しいソリューションであるFed-Protoidを紹介します。提案実験は,Fed-Protoidが精度と通信効率の両面から評価されたすべての手法より優れていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:12:44 GMT)
Exploring State Space and Reasoning by Elimination in Tsetlin Machines [14.2]
Tsetlin Machine(TM)は機械学習(ML)において大きな注目を集めている。 TMは、単語の埋め込みを構築し、節を使ってターゲット語を記述するために使われる。これらの節の記述能力を高めるために,節の定式化におけるReasoning by Elimination(RbE)の概念を検討した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:42:34 GMT)
SmartQuant: CXL-based AI Model Store in Support of Runtime Configurable Weight Quantization [14.1]
近年の研究では、生成的AIモデルに対する推論において、異なる重みの重要性が文脈依存的な変化を示すことが明らかになっている。これは自然に、生成するAI推論効率を改善するために、ウェイト量子化を適応的に設定する有望な可能性を示す。急速に成熟したCXLエコシステムに動機づけられたこの研究は、このギャップを埋めるためのCXLベースの設計ソリューションを開発する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:39:49 GMT)
An Empirical Study of Static Analysis Tools for Secure Code Review [14.1]
静的アプリケーションセキュリティテストツール(SAST)は、セキュリティ問題の識別を強化する可能性がある。ほとんどのSAST研究は、対象プログラムの合成または完全に脆弱なバージョンに依存している。我々は、悪用可能な脆弱性に寄与する実際のコード変更のデータセットを使用して、C/C++ SASTを調査する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:15:39 GMT)
Energy-Guided Diffusion Sampling for Offline-to-Online Reinforcement Learning [13.8]
textbfEnergy-guided textbfDIffusion textbfSampling (EDIS)を紹介する。 EDISは拡散モデルを用いてオフラインデータセットから事前知識を抽出し、オンラインフェーズにおけるデータ生成の強化のためにエネルギー関数を用いてこの知識を蒸留する。また,MuJoCo,AntMaze,Adroit環境において,経験的性能の20%向上が目覚ましい。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:56:51 GMT)
IW-GAE: Importance Weighted Group Accuracy Estimation for Improved Calibration and Model Selection in Unsupervised Domain Adaptation [13.8]
グループ精度を推定することにより,モデルの校正とモデル選択に対処する新たな視点を提案する。実験の結果,モデルキャリブレーションタスクでは22%,モデル選択タスクでは14%,最先端性能では22%向上した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:53:29 GMT)
Improved Nonlocality Certification via Bouncing between Bell Operators and Inequalities [13.3]
非局所性認証を改善するための最適化手法を提案する。いくつかのハミルトン模型が古典的境界を改良した新しい不等式に写像できることを示す。本稿では,70以上の超伝導量子ビットを用いたXXZ型ハニカム格子モデルに適用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:47:22 GMT)
Is Sarcasm Detection A Step-by-Step Reasoning Process in Large Language Models? [13.2]
本稿ではSarcasmCueという新しいプロンプトフレームワークを紹介する。これには4つのプロンプト戦略、$viz.$ chain of contradiction (CoC)、Graph of cues (GoC)、baging of cues (BoC)、 tensor of cues (ToC)が含まれる。提案した4つのプロンプト法は,標準IOプロンプト法,CoT,ToTをかなりのマージンで上回り,非シーケンシャルプロンプト法は一般的には逐次プロンプト法よりも上であることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:42:03 GMT)
GUME: Graphs and User Modalities Enhancement for Long-Tail Multimodal Recommendation [13.1]
本稿では,長期マルチモーダルレコメンデーションのための新しいグラフとユーザモダリティエンハンスメント(GUME)を提案する。具体的には、アイテム間のマルチモーダルな類似性を用いて、まずユーザ-テムグラフを拡張します。次に、明示的なインタラクション機能と拡張された関心機能という2つのタイプのユーザモダリティを構築します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:29:00 GMT)
Cabin: Confining Untrusted Programs within Confidential VMs [13.0]
機密コンピューティングは、信頼できないクラウドから機密性の高い計算を保護します。 CVMは大規模で脆弱なオペレーティングシステムカーネルを伴い、カーネルの弱点を悪用する攻撃を受けやすい。本研究では、最新のAMD SEV-SNP技術を利用したゲストVM内での独立した実行フレームワークであるCabinを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:23:28 GMT)
Long-range Turbulence Mitigation: A Large-scale Dataset and A Coarse-to-fine Framework [12.9]
大規模実時間長距離大気乱流データセット(RLR-AT)を構築した。このデータセットは、1Kmから13Kmまでの距離に1500の乱流配列を含む。本研究では, 動的乱流と静的背景に協調して, 強歪みの処理を行う粗大なフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:26:01 GMT)
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models [12.9]
99Mから3.9Bのパラメータから、300Bトークンでトレーニングされた54の言語モデルからなるSpectra LLMスイートをリリースする。スペクトルには、FloatLM、後トレーニング量子化されたQuantLM(3, 4, 6, 8bits)、および3次LLM(TriLMs)が含まれる。 TriLM 3.9Bは6倍の大きさのモデルであるFloatLM 3.9Bと同じくらい毒性があり、立体タイプである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:53:20 GMT)
LTRL: Boosting Long-tail Recognition via Reflective Learning [12.8]
本稿では,ロングテール認識の処理において,リフレクション学習と呼ばれる新しい学習パラダイムを提案する。本手法は,学習中の過去の予測の見直し,クラス間の特徴関係の要約と活用,損失関数の勾配競合の補正という3つのプロセスを統合する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:51:49 GMT)
Continual Learning for Temporal-Sensitive Question Answering [12.8]
現実のアプリケーションでは、静的で完全なデータセットに頼るのではなく、モデルが時間とともに知識を継続的に取得することが重要です。本稿では,モデルが進化を続ける情報ランドスケープに適応できる戦略について検討する。時間記憶再生と時間的コントラスト学習を統合したCLTSQAのトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:47:43 GMT)
Adaptive Cascading Network for Continual Test-Time Adaptation [12.7]
そこで本研究では,テスト時に対象ドメインの列に事前学習したソースモデルを適応させることを目標とする連続的なテスト時間適応の問題について検討する。テストタイムトレーニングの既存の方法には、いくつかの制限がある。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:12:57 GMT)
Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles [12.7]
軌道サンプリングMA-PETSを用いた分散マルチエージェント確率アンサンブルを提案する。特に、未知環境の不確実性をよりよく捉えるために、MA-PETSは確率的アンサンブルニューラルネットワークを利用する。 MFBLに匹敵する試料効率でMA-PETSの優位性を実証的に実証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:10:18 GMT)
Private Heterogeneous Federated Learning Without a Trusted Server Revisited: Error-Optimal and Communication-Efficient Algorithms for Convex Losses [12.6]
Inter-Silo Record-Level Differential Privacy (ISRL-DP)は、各サイロのデータ漏洩を防止する。異種サイロデータの存在下で最適な過大なリスク境界を実現する新しいISRL-DP FLアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:25:57 GMT)
CDFL: Efficient Federated Human Activity Recognition using Contrastive Learning and Deep Clustering [12.5]
HAR(Human Activity Recognition)は、多様なセンサーからのデータを介し、人間の行動の自動化とインテリジェントな識別に不可欠である。中央サーバー上のデータを集約し、集中処理を行うことによる従来の機械学習アプローチは、メモリ集約であり、プライバシの懸念を高める。本研究は,画像ベースHARのための効率的なフェデレーション学習フレームワークCDFLを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:17:53 GMT)
Robust teleportation of a surface code and cascade of topological quantum phase transitions [12.4]
本研究では,小ベル計測を用いた長距離絡み合った表面コード状態の伝送プロトコルについて検討する。無限に弱い絡み合いは、自己双対位相曲面コードをテレポートするのに十分である。我々のプロトコルは、動的にRydberg原子配列で容易に実装でき、量子測定のパワーを実演するためのガイダンスを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:59:53 GMT)
The Linear Representation Hypothesis and the Geometry of Large Language Models [12.4]
インフォーマルに、「線形表現仮説」とは、高次概念がある表現空間の方向として線型に表現されるという考え方である。線形表現(linear representation)とは何か? 対実対を用いて線形表現のすべての概念を統一する方法を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:24:27 GMT)
Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models [12.3]
テキストガイダンスでローカライズを行うタスクは、通常、フレーズグラウンドディング( phrase grounding)と呼ばれる。私たちは、この課題を解決するために、公開のFoundation Model、すなわちLatent Diffusion Modelを使用します。胸部X線検査の結果から, 胸部X線検査と胸部X線検査を併用し, 胸部X線検査と胸部X線検査を併用し, 胸部X線検査と胸部X線検査を併用した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:50:15 GMT)
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem [12.2]
本研究は, 強化学習環境においてアクセントを付加した, 伝達不良の原因の1つを概念化したものである。モデルは、微調整の初期段階に訪れない下流タスクの状態部分空間を劣化させる。標準的な知識保持技術が問題を緩和し、事前訓練された能力を最大限に活用できることを示します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:29:19 GMT)
KESIC: Kerberos Extensions for Smart, IoT and CPS Devices [11.9]
Kerberosは、ヘビーウェイトプロトコルとリソース制約のあるデバイスの性質のため、IoTデバイスに直接適していない。本稿では,IoTデバイスのマルチユーザアクセスを効率的かつセキュアにするためのシステムであるKESICを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:29:18 GMT)
MEDFuse: Multimodal EHR Data Fusion with Masked Lab-Test Modeling and Large Language Models [11.8]
MEDFuseは構造化および非構造化の医療データを統合するフレームワークである。 10種類のマルチラベル分類タスクにおいて、90%以上のF1スコアを達成している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:17:09 GMT)
DVLO: Deep Visual-LiDAR Odometry with Local-to-Global Feature Fusion and Bi-Directional Structure Alignment [11.8]
画像のピクセルは規則的で密度が高いが、LiDARポイントは非順序であり、スパースである。本稿では,双方向構造アライメントを有するDVLO(ローカル・グローバル・フュージョン・ネットワーク)を提案する。本手法は,KITTI odometry と FlyingThings3D シーンフローデータセットの最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:03:33 GMT)
Semi-supervised Segmentation of Histopathology Images with Noise-Aware Topological Consistency [11.8]
TopoSemiSegは、ラベルのない画像からトポロジカル表現を学習する最初の半教師付き手法である。教師と学生モデルの表現を整合させるため,雑音を考慮したトポロジカル整合性損失を導入する。病理組織像データセットを用いた実験により,本手法の優位性を示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:51:20 GMT)
Dynamics of discrete solitons in the fractional discrete nonlinear Schrödinger equation with the quasi-Riesz derivative [11.7]
この方程式は、近傍のカップリングが長距離相互作用と結合される新しい離散系を表す。系の線形スペクトルにおける格子波の分散関係とそれに対応する伝搬帯域は、LIの全ての値に対して正確な形で現れる。単一部位および2部位の離散ソリトンの形成について, 反連続限界から検討した。離散ソリトン(英語版)の移動性も、システムのピエルス・ナバロポテンシャル障壁の推定によって考慮されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:52:18 GMT)
Statistics-aware Audio-visual Deepfake Detector [11.7]
オーディオ・ヴィジュアルフェイク検出の手法は、主に音声と視覚の特徴の同期を評価する。モデルの識別能力を高めるため,統計的特徴損失を提案する。 DFDCおよびFakeAVCelebデータセットの実験により,提案手法の妥当性が示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:41:59 GMT)
OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework [11.6]
提案するOpenRLHFは,効率的なRLHFスケーリングを実現するオープンソースフレームワークである。 OpenRLHFは、Ray、vLLM、DeepSpeedを使用して70Bパラメータを超えるモデルのスケジューリングを再設計する。 Hugging Faceとシームレスに統合されたOpenRLHFは、最適化されたアルゴリズムとローンチスクリプトを備えたアウトオブボックスソリューションを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:18:35 GMT)
Generating 3D House Wireframes with Semantics [11.4]
本稿では, 自己回帰モデルを用いて, セマンティックエンリッチメントを用いた3次元住宅の創出手法を提案する。意味に基づくワイヤシーケンスを並べ替えることで,3次元ワイヤフレーム構造をシームレスに学習する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:33:34 GMT)
CausalMed: Causality-Based Personalized Medication Recommendation Centered on Patient health state [11.1]
CausalMedは、患者の表現のパーソナライズを高めることができる患者の健康状態中心モデルである。本手法はよりパーソナライズされた患者表現を学習し、精度と安全性において最先端のモデルより優れる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:52:43 GMT)
Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition [11.1]
Grounded Multimodal Named Entity Recognition (GMNER) は、新しい情報抽出(IE)タスクである。機械読解(MRC)フレームワークやシーケンス生成モデルを用いた最近の統一手法は、マルチモーダルエンティティの関係を理解する上で困難に直面している。そこで我々は,Multi-fine Query-guided Set Prediction Network (MQSPN) という新しい統合フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:42:43 GMT)
TimeDRL: Disentangled Representation Learning for Multivariate Time-Series [11.0]
TimeDRLは、アンタングル化されたデュアルレベル埋め込みを備えた一般的な時系列表現学習フレームワークである。 TimeDRLは、既存の表現学習アプローチを一貫して上回り、MSEでは58.02%、精度では1.48%の平均的な改善を実現している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:19:17 GMT)
Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation [11.0]
画像セグメンテーション(RIS)を参照するための疑似監督として,参照表現を用いた高品質セグメンテーションマスクを自動生成する新しいフレームワークを提案する。本手法は, RISベンチマークデータセットにおいて, 弱いSoTA法とゼロショットSoTA法の両方を著しく上回っている。また、未確認領域における完全に教師された手法を超越し、RIS内のオープンワールドの課題に取り組む能力を証明している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:32:02 GMT)
Label-Efficient 3D Brain Segmentation via Complementary 2D Diffusion Models with Orthogonal Views [10.9]
相補的な2次元拡散モデルを用いた新しい3次元脳分割法を提案する。私たちのゴールは、個々の主題に対して完全なラベルを必要とせずに、信頼性の高いセグメンテーション品質を達成することです。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:14:53 GMT)
Experimental demonstration of spontaneous symmetry breaking with emergent multi-qubit entanglement [10.8]
自発的対称性破壊(SSB)は相転移の発生に不可欠である。 SSBは2つの縮退対称性を破る固有状態によって形成される多ビット猫状態の出現によって発現することを示す。観測された非古典的特徴は従来のSSBの記述を超え、量子多体系の相転移に新しい光を放つ。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:50:29 GMT)
VisionTrap: Vision-Augmented Trajectory Prediction Guided by Textual Descriptions [10.7]
本研究では,サラウンドビューカメラからの視覚入力を取り入れた新しい手法を提案する。提案手法は,53msのレイテンシを実現し,リアルタイム処理を実現する。実験の結果,視覚入力とテキスト記述の両方が軌跡予測性能の向上に寄与していることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:39:52 GMT)
A Multi-Modal Simulation Framework to Enable Digital Twin-based V2X Communications in Dynamic Environments [10.7]
近年,物理無線環境のためのディジタルツイン(DT)が,伝播環境の正確な仮想表現として提案されている。本稿では,V2X通信シナリオのDT作成のための新しいデータ駆動ワークフローを提案する。本稿では,V2Xリンク復元のためのDT支援ブロックハンドオーバタスクに関するフレームワークについて紹介する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:24:22 GMT)
Recovery of damaged information via scrambling in indefinite casual order [10.6]
スクランブルは、ローカルオペレーターとのローカル情報へのアクセスを防止する。不確定因果順序でスクランブルすることで、損傷した量子情報を復元する改良手法を示す。クラウドベースの量子コンピュータであるQuafuについて実験を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:42:40 GMT)
Federated Representation Learning in the Under-Parameterized Regime [10.6]
フェデレート・表現学習(FRL)は、クライアントが共通の表現をトレーニングし、パーソナライズされた頭を維持しながら連携する、パーソナライズド・フェデレーション・ラーニング(FL)フレームワークである。本稿では、新しいFRLアルゴリズムFLUTEを提案し、線形モデルに対するサンプルの複雑さと収束率を理論的に特徴づける。実験により、FLUTEは、合成タスクと実世界のタスクの両方において、最先端のFRLソリューションよりも優れていることが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:11:08 GMT)
Maintenance Strategies for Sewer Pipes with Multi-State Degradation and Deep Reinforcement Learning [10.5]
本研究は, 下水道資産に適用される診断・健康管理フレームワークにおける2つの課題に対処する。我々は、下水道管の劣化過程を表すために多状態劣化モデル(MSDM)を用い、保守戦略を考案するために深層強化学習(DRL)を用いる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:07:07 GMT)
A Novel GAN Approach to Augment Limited Tabular Data for Short-Term Substance Use Prediction [10.5]
薬物使用者の短期的物質使用行動(PWUD)を正確に予測するための機械学習モデルの有用性が注目されている。本稿では,米国大平原における258PWUDの縦断調査データを用いて,新しいGANを開発した。以上の結果から,提案したGANの強化データを用いてトレーニングすると,マリファナ,メス,アンフェタミン,コカインの使用において,Aの13.4%,Bの15.8%の予測性能(AUROC)が向上することが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:03:24 GMT)
Exploiting Inter-Image Similarity Prior for Low-Bitrate Remote Sensing Image Compression [10.4]
生成された離散コードブックを用いたコードブックベースのRS画像圧縮(Code-RSIC)手法を提案する。このコードは、知覚品質の観点から、最先端の伝統と学習に基づく画像圧縮アルゴリズムを著しく上回っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:33:16 GMT)
Towards Revisiting Visual Place Recognition for Joining Submaps in Multimap SLAM [10.4]
視覚SLAMシステムにおけるサブマップマージにおける最新のVPR手法の適用効果について検討する。ポストプロセッシングパイプラインとメトリクスのセットを使って、現代のVPRコンポーネントの影響を推定します。我々はORB-SLAM3のマップマージ性能を改善した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:39:20 GMT)
Bi-stochastically normalized graph Laplacian: convergence to manifold Laplacian and robustness to outlier noise [10.4]
双確率正規化 (bi-stochastic normalization) はグラフベースのデータ解析においてグラフラプラシアンの代替正規化を提供する。両階層正規化グラフ Laplacian から (重み付き) Laplacian への収束を速度で証明する。多様体データが外乱ノイズによって破損した場合、理論的にはラプラシア点の整合性を証明する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:24:56 GMT)
Turning Generative Models Degenerate: The Power of Data Poisoning Attacks [10.4]
悪意のある俳優は、毒殺攻撃を通じてバックドアを導入し、望ましくないアウトプットを発生させることができる。本研究では,大規模言語モデルの微調整段階を標的とした多種多様な中毒技術について,PEFT(Efficient Fine-Tuning)法を用いて検討する。本研究は,PEFTによる微調整中にNLGタスクを標的とした毒殺攻撃を理解するための最初の体系的アプローチである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:02:15 GMT)
Towards Understanding Unsafe Video Generation [10.3]
ビデオ生成モデル(VGM)は高品質な出力を合成する能力を実証している。安全でないビデオカテゴリーは、Distorted/Weird, Terrifying, Pornographic, Violent/Bloody, Politicalの5つです。次に、安全でないビデオの発生を防ぐための防御機構について検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:07:22 GMT)
R+X: Retrieval and Execution from Everyday Human Videos [10.2]
R+Xは、ロボットが日々の仕事をしている人間の、長く、ひそかで、一人称的なビデオからスキルを学ぶことができるフレームワークである。人間から言語コマンドが与えられた後、R+Xはまず、関連する振る舞いを含む短いビデオクリップを検索し、その振る舞いにコンテキスト内模倣学習法を条件付けてそのスキルを実行する。実験の結果、R+Xは人間の動画をロバストなロボットのスキルに翻訳することに成功し、R+Xはいくつかの方法よりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:59:56 GMT)
Distributed Gradient Descent for Functional Learning [9.8]
我々は,カーネルヒルベルト空間を再現するフレームワークにおいて,多数のローカルマシン(プロセッサ)にまたがる関数データに取り組むために,分散勾配勾配関数学習(DGDFL)アルゴリズムを提案する。軽度条件下では、DGDFLの信頼に基づく最適学習速度は、機能回帰における以前の研究で被った正則性指数の飽和境界を伴わずに得られる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:27:24 GMT)
MCU-MixQ: A HW/SW Co-optimized Mixed-precision Neural Network Design Framework for MCUs [9.7]
ニューラルネットワーク処理に十分なデータ幅を利用する混合精度ニューラルネットワーク(MPNN)は、厳密なリソース制約を満たすための効果的なアプローチである。しかし、MCUクラスのISAにはサブバイトと混合精度のSIMD操作がない。本研究では,複数の低ビット幅演算を単一の命令多重データ(SIMD)命令にパックする手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:51:15 GMT)
Serialized Point Mamba: A Serialized Point Cloud Mamba Segmentation Model [9.7]
シリアライズされたポイントクラウドマンバモデル(シリアライズされたポイントマンバ)を開発した。自然言語処理におけるMambaモデルの成功に触発されて,Serialized Point Cloud Mamba Modelを提案する。 Scannetでは76.8 mIoU、S3DISでは70.3 mIoUが達成された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:26:58 GMT)
DrJAX: Scalable and Differentiable MapReduce Primitives in JAX [9.7]
DrJAXは大規模分散および並列機械学習アルゴリズムをサポートするように設計されたライブラリである。 DrJAXはMapReduce計算のビルディングブロックをJAXのプリミティブとして組み込みます。 DrJAX計算はXLA HLOに直接変換することができ、幅広いMLトレーニングプラットフォームとの柔軟な統合を可能にする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:41:39 GMT)
Facial Affect Recognition based on Multi Architecture Encoder and Feature Fusion for the ABAW7 Challenge [9.6]
第7回ABAWコンペティションの課題に対処するためのアプローチを提案する。コンテストは、Valence Arousal(VA)推定、Expression(Expr)分類、AU(Action Unit)検出の3つのサブチャンジで構成されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:01:34 GMT)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting [9.6]
時系列予測手法は、異なるシナリオに適用する場合、柔軟であるべきです。本稿では、各フーリエ成分を個別に予測し、異なる周波数の出力を動的に融合する周波数動的融合(FreDF)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:54:41 GMT)
VoicePilot: Harnessing LLMs as Speech Interfaces for Physically Assistive Robots [9.5]
LLM(Large Language Models)を利用した音声インタフェースにより、個人はロボットに高度なコマンドや微妙な好みを伝えることができる。高度なタスク計画とコード生成のためのロボットへのインタフェースとしてLLMを統合するためのフレームワークが提案されているが、人間中心の考慮を組み込むことはできなかった。本稿では,身体支援ロボットの音声インタフェースとしてLLMを組み込むための枠組みについて,食事ロボットを用いた3段階の試験を反復的に構築し,11人の高齢者を対象に,独立した生活施設で評価を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:38:16 GMT)
Scalable Monte Carlo for Bayesian Learning [9.5]
この本は、マルコフ連鎖モンテカルロ(MCMC)アルゴリズムにおける高度なトピックに関する大学院レベルの紹介を提供することを目的としている。これらのトピックのほとんどは、最近10年ほど前に現れており、この分野ではかなりの実践的、理論的進歩を導いてきた。特に注目されているのは、データ量、あるいはデータ次元に関してスケーラブルな方法である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:19:56 GMT)
CIC-BART-SSA: Controllable Image Captioning with Structured Semantic Augmentation [9.5]
そこで本研究では,集中型および視覚的接地型キャプションをサンプリングするための,新しい完全自動手法を提案する。抽象的意味表現(AMR)を利用して、エンティティ間のすべての意味・意味関係を符号化する。次に、SSAに分散したデータセットから制御信号を出力する新しいモデルCIC-BART-SSAを開発する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:40:05 GMT)
PrE-Text: Training Language Models on Private Federated Data in the Age of LLMs [9.4]
PrE-Text合成データは、デバイス上で訓練された小さなモデルよりも優れていることを示す。また,PrE-TextのDP合成データを用いて大規模モデルを微調整することで,大規模言語モデル(LLM)の性能が向上することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:09:22 GMT)
TTSDS -- Text-to-Speech Distribution Score [9.4]
最近発表されたText-to-Speech (TTS) システムは、実際の音声に近い音声を生成する。本稿では,韻律,話者識別,知性といった複数の要因を組み合わせた合成音声の質を評価することを提案する。 2008年から2024年にかけて開発された35のTTSシステムをベンチマークし, 評価値の非重み付き平均値として計算した結果が人体評価と強く相関していることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:30:27 GMT)
Deep Mutual Learning among Partially Labeled Datasets for Multi-Organ Segmentation [9.2]
本稿では,相互学習に基づく2段階多臓器分割手法を提案する。第1段階では、各部分組織セグメンテーションモデルは、異なるデータセットから重複しない臓器ラベルを利用する。第2段階では、各全組織セグメンテーションモデルは、擬似ラベル付き完全ラベル付きデータセットによって管理される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:41:25 GMT)
Benchmarking Robust Self-Supervised Learning Across Diverse Downstream Tasks [9.2]
複数の下流タスクにまたがる自己監督型視覚エンコーダの対向ロバスト性に関する包括的実証評価を行った。我々の攻撃はエンコーダの埋め込みスペースと下流タスク出力レベルで動作する。基礎モデルの目的は一度に複数のアプリケーションに対応することであるため,より広範にエンコーダの堅牢性を高める必要性が明らかとなった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:12:34 GMT)
GS2Mesh: Surface Reconstruction from Gaussian Splatting via Novel Stereo Views [9.2]
3Dガウススプラッティング(3DGS)はシーンを正確に表現するための効率的なアプローチとして登場した。本稿では,ノイズの多い3DGS表現とスムーズな3Dメッシュ表現とのギャップを埋めるための新しい手法を提案する。私たちは、オリジナルのトレーニングポーズに対応するステレオアライメントされたイメージのペアをレンダリングし、ペアをステレオモデルに入力して深度プロファイルを取得し、最後にすべてのプロファイルを融合して単一のメッシュを得る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:58:34 GMT)
Characterizing Biphoton Spatial Wave Function Dynamics with Quantum Wavefront Sensing [9.1]
量子シャック・ハートマン波面センサを導入し、双光子空間波動関数の効率的かつ参照不要な計測を行う。我々の研究は、量子物理および適応光学における決定的なステップであり、高次相関やトポロジカルパターンで量子光学場を特徴づける道を開く。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:49:48 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.0]
従来の溶解度予測技術は、しばしば分子トラクチャーの複雑な性質を捉えるのに失敗し、予測と実際の結果の間に顕著な違いをもたらす。本研究では,注目に基づくトランスフォーマー,Long Short-Term Memory(LSTM)ネットワーク,GCN(Graph Convolutional Networks)を組み合わせた新しいディープラーニングフレームワークを提案する。相関係数(R2$)が0.59、ルート平均角誤差(RMSE)が0.57、ベンチマークモデルのスコアが0.52(R2$)と0.61(RMSE)を上回った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:35:31 GMT)
COKE: Causal Discovery with Chronological Order and Expert Knowledge in High Proportion of Missing Manufacturing Data [8.9]
現実世界のデータセットは、最大90%の欠落したデータと数百のセンサーから高次元性を示す。現実の状況に類似したシナリオで欠落したデータを扱う従来の方法は、専門家の知識を効果的に活用することができなかった。我々は,センサ間の専門知識と時間順を利用して,データ不足を抑えることにより,データセットの因果グラフを構築することを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:51:27 GMT)
Importance Weighted Expectation-Maximization for Protein Sequence Design [8.7]
そこで本研究では,IsEM-Proという,特定の適合基準に向けてタンパク質配列を生成する手法を提案する。中心となるIsEM-Proは、独立に学習されたマルコフランダムフィールド(MRF)の構造特徴によって強化された潜在生成モデルである。 8つのタンパク質配列設計タスクの実験により、我々のIsEM-Proは、平均的なフィットネススコアで少なくとも55%以上のパフォーマンスで過去のベストメソッドよりも優れていたことが示される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:21:28 GMT)
Runtime Verification and Field-based Testing for ROS-Based Robotic Systems [8.7]
ROSベースのシステムを設計して実行時検証とフィールドベースのテストを可能にするための明確なガイダンスはありません。本稿では,現場でのロボットの開発,検証,テストにおいて,開発者やQAチームを支援するガイドラインを提供することで,このギャップを埋めることを目的とする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:28:31 GMT)
Improving the classification of extreme classes by means of loss regularisation and generalised beta distributions [8.6]
本稿では,一級・一級の分類性能を向上させるための一級正規化手法を提案する。極端なクラスのパフォーマンスは、その感度を考慮に入れた新しいメトリクスを使って比較される。提案手法により, 一般化されたベータ分布は, 極端なクラスにおける分類性能を向上することが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:57:42 GMT)
LLM Inference Serving: Survey of Recent Advances and Opportunities [8.6]
本稿では,Large Language Model (LLM) サービスシステムの最近の進歩について概観する。コアLLM復号機構を変更することなく性能と効率を向上させるシステムレベルの拡張について検討する。この調査は、この急速に発展する分野における最新の発展を振り返りたいLLM実践者にとって、貴重なリソースとなる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:11:47 GMT)
Fault Tolerant Quantum Error Mitigation [8.5]
本研究では, 耐故障性操作が対称性に基づく誤差軽減手法の性能に大きく影響していることを示す。フォールトトレラント量子コンピューティングの結果と同様に、フォールトトレラント量子エラー軽減(FTQEM)におけるコード結合は、エラーを任意のレベルまで指数関数的に抑制することができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:48:08 GMT)
Fusion Flow-enhanced Graph Pooling Residual Networks for Unmanned Aerial Vehicles Surveillance in Day and Night Dual Visions [8.5]
無許可無人航空機(UAV)は、民間と軍事の航空安全に重大な脅威をもたらす。デュアルビジョンカメラでUAVを昼夜認識するのは簡単ではない。赤緑色(RGB)画像は、光条件が不十分な場合、検出速度が低いためである。昼夜両眼視におけるUAV検出率を大幅に向上させる新しい光フロー支援グラフプール残差ネットワーク(OF-GPRN)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:16:23 GMT)
Individualized Federated Learning for Traffic Prediction with Error Driven Aggregation [8.5]
フェデレートラーニング(Federated Learning)は、トラフィック予測のための有望なテクニックとして登場した。現在のFLTPフレームワークにはリアルタイムモデル更新スキームがない。個人化されたリアルタイム・フェデレーション学習方式であるNeighborFLを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:42:47 GMT)
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains [8.4]
大規模言語モデル(LLM)は近年,顕著な汎用性を示している。健康状況に合わせて様々なオープンソース LLM が利用可能であるにもかかわらず、汎用 LLM を医療分野に適用することは重大な課題である。我々は、Mistralを基盤モデルとして、バイオメディカルドメインに適したオープンソースのLLMであるBioMistralを紹介した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:34:00 GMT)
Universal framework for simultaneous tomography of quantum states and SPAM noise [8.4]
本稿では,量子状態と測定ノイズの同時トモグラフィーを行うアルゴリズムを提案する。本手法は、ユニタリ演算によって誘導される線形作用素空間の特性の解析に基づく。一般の場合、このゲージ自由度は避けられないが、状態やノイズ特性に関する事前の知識を用いて、この縮退性を破ることができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:00:56 GMT)
Private and Federated Stochastic Convex Optimization: Efficient Strategies for Centralized Systems [8.4]
本稿では,集中型システムにおけるフェデレートラーニング(FL)におけるプライバシ保護の課題に対処する。我々は、同種および異種データ分布に対する最適収束率を維持しつつ、微分プライバシ(DP)を確保する手法を考案した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:19:58 GMT)
GeoGuide: Geometric guidance of diffusion models [8.3]
GeoGuideは、データ多様体から拡散モデルの軌道距離をトレースするガイダンスモデルである。 FIDスコアと生成された画像の品質の両方に関して、確率論的アプローチ ADM-G を超えている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:56:27 GMT)
Lacuna Language Learning: Leveraging RNNs for Ranked Text Completion in Digitized Coptic Manuscripts [8.3]
原稿ラッカナにおけるコプト文字の文字予測のための双方向RNNモデルを提案する。最適なモデルでは, 単一文字再構成では72%の精度で再現できるが, 様々な長さの漆を復元すると37%に低下する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:28:12 GMT)
Analyzing the Generalization and Reliability of Steering Vectors -- ICML 2024 [8.3]
ステアリングベクトルは分布内および分布外の両方にかなりの制限があることを示す。分散において、ステアビリティは異なる入力間で高度に変動する。アウト・オブ・ディストリビューション(out-of-distribution)、ステアリングベクトル(steering vector)はよく一般化されるが、いくつかの概念はプロンプトの合理的な変化に対して脆弱である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:32:03 GMT)
I2AM: Interpreting Image-to-Image Latent Diffusion Models via Attribution Maps [8.2]
本稿では,パッチレベルのクロスアテンションスコアを集約し,潜時拡散モデルの解釈可能性を高めるイメージ・ツー・イメージマップI2AM法を提案する。 I2AMは、画像から画像への帰属分析を容易にし、拡散モデルが時間と頭において重要な特徴をどのように優先順位づけするかを観察できるようにする。我々の理解をさらに深めるために、参照ベース画像の塗装作業に適した新しい評価基準を導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:15:05 GMT)
LaSe-E2V: Towards Language-guided Semantic-Aware Event-to-Video Reconstruction [8.2]
セマンティック・アウェアの高品質なE2V再構成を実現する新しいフレームワークであるLaSe-E2Vを提案する。まずイベント誘導時空間アテンション(ESA)モジュールを提案する。次に、時間的コヒーレンスを確保するためのイベント対応マスクロスと、空間的一貫性を高めるためのノイズ戦略を導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:48:08 GMT)
MMVR: Millimeter-wave Multi-View Radar Dataset and Benchmark for Indoor Perception [8.1]
マルチビュー・マルチルーム・マルチオブジェクト設定におけるマルチビュー高分解能レーダヒートマップを用いて屋内レーダデータ収集をスケールアップする。ミリ波マルチビューレーダ(MMVR)データセットと呼ばれるこのデータセットは、25ドル(約2,300円)の被験者から収集された345ドル(約3,300円)のマルチビューレーダフレームで構成されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:23:17 GMT)
Universal Lower Bounds and Optimal Rates: Achieving Minimax Clustering Error in Sub-Exponential Mixture Models [8.1]
まず、混合モデルのクラスタリングにおける誤差率の普遍的な下限を確立する。次に、この下界をサブ指数尾を持つ混合モデルで再現的アルゴリズムが達成できることを実証する。ポアソンまたは負二項混合によりモデル化されたデータセットについて,指数族に属する混合モデルについて検討した。このような混合では、ブロッグマンの発散を利用したロイドのアルゴリズムの変種であるブロッグマンのハードクラスタリングが最適であることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:43:29 GMT)
GroundUp: Rapid Sketch-Based 3D City Massing [8.0]
スケッチが一般的なツールであるアーリーステージの都市デザインに焦点を当てる。私たちは、2Dスケッチと3Dモデルを簡単に切り替えることで、アーキテクトのアイデアの迅速な修正を支援することを目的としています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:59:29 GMT)
SchurVINS: Schur Complement-Based Lightweight Visual Inertial Navigation System [8.0]
フィルタに基づく新しいVINSフレームワークであるSchurVINSを提案する。完全な残差モデルを構築し、計算複雑性を低くすることで、高い精度を保証できる。 EuRoC および TUM-VI データセットを用いた実験により,本手法は精度と計算複雑性の両方において,最先端(SOTA) 手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:49:17 GMT)
CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs [7.9]
現在のカスタマサービスモデルは、カスタマプロファイルと限定的に統合されている。既存のAPI統合は、現実世界のカスタマーサービスシナリオに不可欠な精度とエラー回避の多様性を強調している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:26:47 GMT)
Collaborative Design for Job-Seekers with Autism: A Conceptual Framework for Future Research [7.8]
最近の経験的発見は、自閉症患者と新しいデザインによる社会的環境との連携が、いかに雇用機会を向上させるかを示し始めている。この研究は、将来の研究者や実践者が、自閉症のある求職者の協調設計を改善するために適用できる、実行可能なガイドラインと概念的フレームワークを提供することを目的としている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:24:03 GMT)
Causally Abstracted Multi-armed Bandits [7.7]
マルチアームバンディット (MAB) と因果MAB (CMAB) は意思決定問題の枠組みとして確立されている。転送学習を、潜在的に異なる変数で定義されたCMABを含む設定に拡張する。本稿では,CAMABで学習するアルゴリズムを提案し,その後悔について検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:10:25 GMT)
UP-Diff: Latent Diffusion Model for Remote Sensing Urban Prediction [7.6]
本研究では,今後の都市計画に焦点をあてた新しいリモートセンシング(RS)都市予測(UP)タスクを紹介する。本稿では,遅延拡散モデル(LDM)を応用したUP-Diffを提案する。 UP-Diffを利用することで、設計者は変化マップを動的かつ適応的に変更することで、都市計画の効果的かつ将来の調整を行うことができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:47:08 GMT)
Mode Connectivity in Auction Design [7.5]
オークションデザインはアルゴリズムゲーム理論における基本的な問題である。微分経済学における最近の研究は、ニューラルネットワークが既知の最適なオークション機構を効率的に学習できることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:03:13 GMT)
Towards Lower Bounds on the Depth of ReLU Neural Networks [7.4]
より多くの層を追加することで、正確に表現可能な関数のクラスが厳密に増加するかどうかを考察する。 We settled an old conjecture about piecewise linear function by Wang and Sun (2005) in affirmative。対数深度を持つ関数を表すのに必要なニューラルネットワークのサイズについて上限を述べる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:15:49 GMT)
Leveraging Environment Interaction for Automated PDDL Generation and Planning with Large Language Models [7.3]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。 LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:50:51 GMT)
FETCH: A Memory-Efficient Replay Approach for Continual Learning in Image Classification [7.3]
クラス増分連続学習は研究の重要な領域である。以前の作品では、リプレイと圧縮されたリプレイ技術を用いて、有望な結果が得られた。この作業は、GDumbのパイプラインで圧縮されたリプレイを評価することである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:54:03 GMT)
StyleForge: Enhancing Text-to-Image Synthesis for Any Artistic Styles with Dual Binding [7.3]
多様な芸術様式にまたがるパーソナライズされたテキスト・ツー・イメージ合成のための新しいアプローチであるSingle-StyleForgeを紹介した。また、複数のトークンを部分的なスタイル属性に結合することで、画像の品質とテキストアライメントを向上させるMulti-StyleForgeを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:15:10 GMT)
Resource-efficient Medical Image Analysis with Self-adapting Forward-Forward Networks [7.2]
医療画像解析のための高速自己適応型フォワードネットワーク(SaFF-Net)を提案する。 CFFAは、高度な画像解析に適したパラメータ効率の補正であり、元のFFAの速度と一般化の制約を克服する。提案手法により、より効果的なモデルトレーニングが可能となり、FFAにおいて任意に選択されたグッドネス関数に対して、これまで必要とされていた要求を排除できる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:35:37 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [7.1]
リスク分析の原則はコンテキストレスです。リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:02:46 GMT)
A Practical Solver for Scalar Data Topological Simplification [7.1]
本稿では,トポロジカル単純化の最適化のための実践的アプローチを提案する。フィラメントループを除去する標準的なトポロジカル手法よりも,本手法が優れていることを示す。また,本手法は表面処理における遺伝子欠陥の修復にも有効であることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:25:32 GMT)
MSD: A Benchmark Dataset for Floor Plan Generation of Building Complexes [7.0]
textbfModified Swiss Dwellings (MSD) - 大規模なフロアプランデータセット。 MSDは中規模から大規模の複合住宅の5.3K以上のフロアプランがあり、18.9K以上のアパートをカバーしている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:24:53 GMT)
Reliability Function of Classical-Quantum Channels [7.0]
信頼性関数(Reliability function)は、通信速度がチャネルのキャパシティ以下である場合、復号エラー確率の指数的減衰を表す。主な寄与は誤差指数に対する下界であり、これはペッツ形式におけるレナイ発散によって特徴づけられる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:30:27 GMT)
Breaking Boundaries: Investigating the Effects of Model Editing on Cross-linguistic Performance [6.9]
本稿では,多言語文脈における知識編集技術を検討することにより,言語的平等の必要性を戦略的に識別する。 Mistral, TowerInstruct, OpenHathi, Tamil-Llama, Kan-Llamaなどのモデルの性能を,英語,ドイツ語,フランス語,イタリア語,スペイン語,ヒンディー語,タミル語,カンナダ語を含む言語で評価した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:37:54 GMT)
Long-time properties of generic Floquet systems are approximately periodic with the driving period [6.9]
フロッケ量子系は、周期的なハミルトニアンによって支配される。任意の大きさのフロケ系では、離散時間結晶の挙動は厳密に無限の時間に持続しない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:11:00 GMT)
Efficient Continual Learning with Low Memory Footprint For Edge Device [6.8]
本稿では,連続学習の忘れる問題を解くために,LightCLと呼ばれるコンパクトアルゴリズムを提案する。まず,CLにおける可塑性学習とメモリ安定性の2つの新しい指標を提案する。実験的な比較では、LightCLは忘れるのを遅らせる他のSOTAメソッドよりも優れており、最大$textbf6.16$times$$$メモリフットプリントを削減している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:34:43 GMT)
MBBQ: A Dataset for Cross-Lingual Comparison of Stereotypes in Generative LLMs [6.8]
生成的大規模言語モデル(LLM)は有害なバイアスやステレオタイプを示すことが示されている。 MBBQは、オランダ語、スペイン語、トルコ語でよく見られるステレオタイプを測定するデータセットである。その結果、文化的な変化を抑えながら、英語以外の言語では、英語よりも偏見に悩まされていることが確認された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:49:22 GMT)
RBAD: A Dataset and Benchmark for Retinal Vessels Branching Angle Detection [6.7]
本稿では,自己設定画像処理技術を用いて網膜分岐角を検出する新しい手法を提案する。我々は、オープンソースのアノテーションツールと、網膜分岐角を付加した40の画像からなるベンチマークデータセットを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:37:39 GMT)
Dyadic Interaction Modeling for Social Behavior Generation [6.6]
ダイアディックインタラクションにおける3次元顔の動きを効果的に生成するための枠組みを提案する。私たちのフレームワークの中心は、事前トレーニングアプローチであるDydic Interaction Modeling(DIM)です。実験は、リスナー動作の生成において、我々のフレームワークが優れていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:53:41 GMT)
Missing Modality Prediction for Unpaired Multimodal Learning via Joint Embedding of Unimodal Models [6.6]
実世界のシナリオでは、完全なマルチモーダルデータを一貫して取得することは重大な課題である。これはしばしば、特定のモダリティのデータが欠落しているモダリティの問題につながる。自己教師型共同埋め込み学習手法を用いて, パラメータ効率のよい未学習モデルの微調整を行う新しいフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:44:25 GMT)
Highly Efficient Parallel Row-Layered Min-Sum MDPC Decoder for McEliece Cryptosystem [6.6]
中密度パリティチェック(MDPC)コードベースのMcEliece暗号系は、ポスト量子暗号標準のファイナリストのままである。 Min-sum復号アルゴリズムはMDPC符号の他のアルゴリズムよりも性能・複雑さのトレードオフが優れている。 MDPCデコーダのメモリ要求を大幅に低減するために,行層スケジューリング方式を初めて利用した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:19:42 GMT)
Object-Aware Query Perturbation for Cross-Modal Image-Text Retrieval [6.5]
オブジェクト認識型クエリ摂動に基づくクロスモーダル画像テキスト検索フレームワーク」を提案する。提案手法では、既存のV&Lモデルのリッチな表現力と検索性能を維持しつつ、追加の微調整をすることなく、オブジェクト認識のクロスモーダルな画像テキスト検索が可能となる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:42:14 GMT)
Open-Vocabulary Object Detectors: Robustness Challenges under Distribution Shifts [6.5]
VLM(Vision-Language Models)は近年,画期的な成果を上げている。 VLMベースのオープン語彙オブジェクト検出は、従来のオブジェクト検出フレームワークの機能を拡張する。本研究では,最近のOV基盤オブジェクト検出モデルのゼロショット機能について,包括的ロバスト性評価を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:49:36 GMT)
Enhanced Self-supervised Learning for Multi-modality MRI Segmentation and Classification: A Novel Approach Avoiding Model Collapse [6.3]
多モードMRI(Multi-modality magnetic resonance imaging)は、コンピュータ支援診断のための補完的な情報を提供する。従来のディープラーニングアルゴリズムは、病変をセグメント化し、磁気共鳴画像で疾患を分類する特定の解剖学的構造を特定するのに適している。自己教師付き学習(SSL)は、事前学習によりラベル付きデータから特徴表現を効果的に学習することができ、自然画像解析に有効であることが示されている。ほとんどのSSLメソッドはマルチモードMRIの類似性を無視し、モデルが崩壊する。ハイブリッドマスクパターン(HMP)とピラミッドバーローツイン(PBT)を組み合わせた多モードMRIマスク自動エンコーダの確立と検証を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:05:57 GMT)
Compound Expression Recognition via Multi Model Ensemble for the ABAW7 Challenge [6.3]
複合表現認識(CER)は、効果的な対人相互作用に不可欠である。本稿では,この複雑さに対処するアンサンブル学習に基づくソリューションを提案する。提案手法はRAF-DBデータセット上で高い精度を示し,ゼロショット学習によりC-EXPR-DBの一部の表現を認識できる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:59:34 GMT)
Generalized Robust Fundus Photography-based Vision Loss Estimation for High Myopia [6.2]
VF推定の一般化ロバスト性を高めるための新しいパラメータ効率フレームワークを提案する。本手法は, RMSE, MAE, 係数相関において, 内部および外部の検証において, 既存の手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:59:32 GMT)
Fast Context-Based Low-Light Image Enhancement via Neural Implicit Representations [6.1]
現在のディープラーニングベースの低照度画像強調手法は高解像度画像としばしば競合する。我々は、未露出画像の2次元座標を照明成分にマッピングすることで、拡張過程を再定義する、CoLIEと呼ばれる新しいアプローチを導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:51:52 GMT)
Across Platforms and Languages: Dutch Influencers and Legal Disclosures on Instagram, YouTube and TikTok [6.1]
本稿では,法的基準に基づいて,インフルエンサーが開示を遵守するかどうかを,透過的に測定する手法を提案する。本手法をオランダメディア公社に登録された150人のオランダ人インフルエンサーの内容を反映した独自のデータセットに適用する。インフルエンサーのマーケティングは、一般的にソーシャルメディア上では公表されていないが、大きなインフルエンサーは必ずしも開示基準に準拠しているとは限らない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:59:52 GMT)
A Framework for QoS of Integration Testing in Satellite Edge Clouds [6.1]
衛星エッジクラウドにサービステストの質を統合するためのフレームワークを提案する。このフレームワークは、衛星ネットワークトポロジの変更を統合し、衛星エッジクラウドクラスタテスト環境を作成し、管理することができる。実験の結果,サテライトエッジクラウドクラスタにおける主要なサービス品質メトリクスをテストするためのフレームワークの能力を検証することができた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:36:03 GMT)
A Unifying Post-Processing Framework for Multi-Objective Learn-to-Defer Problems [6.0]
Learn-to-Deferは、学習アルゴリズムが独立した作業ではなく、人間専門家のチームとして機能することを可能にするパラダイムである。本稿では,様々な制約下での学習・遅延システムに対するベイズ最適解を求める。本アルゴリズムは,一組のベースラインに対する制約違反による改善を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:32:30 GMT)
TaylorShift: Shifting the Complexity of Self-Attention from Squared to Linear (and Back) using Taylor-Softmax [6.0]
本稿では,線形時間と空間におけるトークン間相互作用の完全な計算を可能にするテイラーソフトマックスの新たな再構成であるTaylorShiftを紹介する。具体的には,TaylorShiftは800トークンまでのシーケンスのメモリ効率を向上し,約1700トークン以上の入力の推論を高速化することを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:32:01 GMT)
n-Step Temporal Difference Learning with Optimal n [5.9]
我々は,n段階時間差(TD)学習におけるnの最適値を求める問題を考察する。最適化問題に対する目的関数は平均根平均二乗誤差(RMSE)である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:07:13 GMT)
Muting Whisper: A Universal Acoustic Adversarial Attack on Speech Foundation Models [5.9]
モデル動作を操作するために,「特殊トークン」を敵攻撃によって利用することができることを示す。本稿では,Whisper の $texttt|endoftext|>$ token の普遍的な音響的実現方法を提案する。実験では、同じ0.64秒の対向音声セグメントが、ターゲットのWhisper ASRモデルを97%以上の音声サンプルでミュートできることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:59:26 GMT)
Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation [5.9]
本研究は自動運転の制御最適化問題における安全性問題に対処する。本稿では,条件付きバリュー・アット・リスクに基づくソフトアクター批判を利用して,ポリシー最適化のための新しいモデルベースアプローチを提案する。本手法では, 安全探索を誘導する最悪のアクターを導入し, 予測不可能なシナリオにおいても, 安全要件の厳密な遵守を確保する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:30:57 GMT)
Global-Local Similarity for Efficient Fine-Grained Image Recognition with Vision Transformers [5.8]
微粒な認識には、下位のマクロカテゴリからのイメージの分類が含まれる。本稿では,画像中の識別領域を識別する新しい,計算コストの低い指標を提案する。提案手法は,提案手法よりも計算コストの低い結果が得られる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:04:54 GMT)
OmniSat: Self-Supervised Modality Fusion for Earth Observation [5.8]
OmniSatは、多様なEOモダリティをラベルなしで表現的特徴にマージできる新しいアーキテクチャである。 3つの下流タスクで示されているように、OmniSatは監督なしでリッチな表現を学ぶことができ、最先端のパフォーマンスをもたらす。我々のマルチモーダル事前学習方式は,1つのモーダルしか推論できない場合でも性能が向上する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:16:14 GMT)
A LLM Benchmark based on the Minecraft Builder Dialog Agent Task [5.6]
本研究では,空間的指向性タスクにおけるLLM能力を評価するのに適したLCMベンチマークにMinecraftビルダータスクを適用することを提案する。このアプローチにより、異なるエージェントの特定の長所や短所を探索し、空間的推論とベクトルベースの数学の挑戦的な領域におけるLLMの能力をテストすることができると信じている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:52:23 GMT)
HTD-Mamba: Efficient Hyperspectral Target Detection with Pyramid State Space Model [5.5]
ハイパースペクトルターゲット検出(HTD)は、ピクセルレベルの複雑な背景から興味のある対象を特定する。本稿では, HTD-Mamba というピラミッド状態空間モデル (SSM) を用いた効率的な自己教師型 HTD 手法を提案する。 4つの公開データセットで行った実験により,提案手法は定量評価と定性評価の両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:12:48 GMT)
Enhancing the Utility of Privacy-Preserving Cancer Classification using Synthetic Data [5.4]
深層学習は、乳がん検出において放射線科医を補助する大きな可能性を秘めている。最適なモデルパフォーマンスを達成することは、データの可用性と共有の制限によって妨げられます。従来のディープラーニングモデルでは、センシティブなトレーニング情報を不注意にリークすることができる。この研究は、プライバシー保護のディープラーニング技術の有用性の定量化を探求するこれらの課題に対処する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:52:45 GMT)
PV-S3: Advancing Automatic Photovoltaic Defect Detection using Semi-Supervised Semantic Segmentation of Electroluminescence Images [5.4]
エレクトロルミネッセンス(EL)イメージングを用いた従来の健康チェックは高価で、論理的には難しい。現在の自動化アプローチでは、大規模な手作業による専門家のラベル付けが必要になります。 EL画像における欠陥のセマンティックセグメンテーションのための半スーパービジョン学習手法であるPV-S3(Photovoltaic-Supervised Supervised)を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:33:03 GMT)
ReLU Neural Networks of Polynomial Size for Exact Maximum Flow Computation [5.4]
本稿では,線形整流ユニットを用いたニューラルネットワークのパワーについて検討する。我々は,2つの基本最適化問題を$mathcalO(m2n2)$のニューラルネットワークで解くことができることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:31:15 GMT)
A Methodology Establishing Linear Convergence of Adaptive Gradient Methods under PL Inequality [5.4]
AdaGrad と Adam は、コスト関数が滑らかで、Polyak-Lojasiewicz の不等式を満たすときに線型収束することを示す。我々のフレームワークは、他の変種Adamの線形収束解析に利用できる可能性がある。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:56:21 GMT)
StoX-Net: Stochastic Processing of Partial Sums for Efficient In-Memory Computing DNN Accelerators [5.2]
ディープニューラルネットワーク(DNN)のハードウェアアクセラレーションのための有望なプラットフォームとして、クロスバーウェアベースのインメモリコンピューティング(IMC)が登場した。しかし、IMCシステムのエネルギーとレイテンシは、周辺アナログ・デジタルコンバータ(ADC)の大きなオーバーヘッドに支配されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:56:43 GMT)
In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery [5.2]
本稿では,記号回帰のタスクにLarge Language Models(LLM)を利用する,最初の包括的フレームワークを紹介する。 In-Context Symbolic Regression (ICSR) は、外部LLMで関数形式を反復的に洗練し、その係数を外部LLMで決定するSR手法である。以上の結果から,LLMは与えられたデータに適合するシンボリック方程式の発見に成功し,最高のSRベースラインの総合性能を4つのベンチマークで評価した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:29:18 GMT)
Diverse Part Synthesis for 3D Shape Creation [5.2]
部分ベース表現の形で3次元形状にニューラルネットワークを使用する手法は、ここ数年で導入されている。現在の方法では、個々の形状部品をユーザの好みに応じて容易に再生することはできない。ユーザが個別の部品に対して多種多様な提案を生成できるようにする技術について検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:12:53 GMT)
Fisheye-Calib-Adapter: An Easy Tool for Fisheye Camera Model Conversion [5.2]
本稿では,従来提案されていた魚眼カメラモデルに対する変換ツールを提案する。ユーザーフレンドリーでシンプルだが、非常に高速で正確で、幅広いモデルの変換機能を提供する。 SLAMなどのアプリケーションでは,本システムを用いて変換したモデルが正しく動作することが確認された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:32:14 GMT)
GraphGuard: Contrastive Self-Supervised Learning for Credit-Card Fraud Detection in Multi-Relational Dynamic Graphs [5.2]
本稿では,不正なクレジットカード取引を検出するためのグラフベースのフレームワークであるGraphGuardを紹介する。本研究は,クレジットカード不正検出のためのグラフベースの自己教師型手法の有効性を検討する上で,有望な初期方向性を提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:50:58 GMT)
Qiskit-Torch-Module: Fast Prototyping of Quantum Neural Networks [5.1]
量子コンピュータシミュレーションソフトウェアは、量子コンピューティングコミュニティの研究に不可欠なツールである。我々は,同等のライブラリに対して2桁の性能向上を実現したqiskit-torch-モジュールを開発した。パイプラインはシングルマシンの計算システム向けに調整されており、日々の研究で広く利用されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:33:08 GMT)
Tackling Structural Hallucination in Image Translation with Local Diffusion [5.1]
本稿では,複数の局所拡散プロセスによる幻覚を緩和する学習自由拡散フレームワークを提案する。本手法は,実世界の医療・自然画像データセットの40%と25%の誤診を減らし,ベースラインモデルに対する幻覚を定量的かつ質的に緩和する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:07:48 GMT)
On the dynamical Lie algebras of quantum approximate optimization algorithms [5.0]
動的リー代数(DLAs)は、パラメータ化量子回路の研究において貴重な道具として登場した。本研究では,量子近似最適化アルゴリズム(QAOA)のDLAについて検討する。 DLAの次元が$O(n3)$であることを示し、DLAの明示的な基底を与える。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:12:30 GMT)
Automated Gateways: A Smart Contract-Powered Solution for Interoperability Across Blockchains [4.9]
本研究では、スマートコントラクトを活用して相互運用性を促進する新しいフレームワークとして、Textit Automated Gatewayを紹介した。きめ細かいアクセス制御機構を実装することで、このフレームワーク内のスマートコントラクトは、チェーン間のインタラクションに対するアクセシビリティと承認を管理します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:45:05 GMT)
Precision Quantum Parameter Inference with Continuous Observation [4.8]
本稿では,従来の手法から分岐し,連続的な測定を行い,単一の量子軌道で正確なQPEを実現するための新しいQPE法を提案する。本研究では, 浮遊ナノ粒子のパラメータ推定と力覚のタスクに本手法を用いることを実演する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:24:09 GMT)
Domain-specific or Uncertainty-aware models: Does it really make a difference for biomedical text classification? [4.7]
ドメインの特異性と不確実性認識が組み合わさって、モデル自身の不確実性を合理的に推定する方法について論じる。ドメインの特異性と不確実性に対する認識は、しばしばうまく組み合わせられるが、正確なタスクはより強く重み付けされている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:52:46 GMT)
Subgraph-Aware Training of Text-based Methods for Knowledge Graph Completion [4.7]
微調整事前学習言語モデル(PLM)は、最近知識グラフ補完(KGC)を改善する可能性を示している。我々は, (i) サブグラフ認識のミニバッチを併用して, (ii) ハードネガティブサンプリングを促進するためのサブグラフ認識学習フレームワークKGC(SATKGC) と, (ii) ハードエンティティとハードネガティブトリプルにもっと焦点を合わせるための新しいコントラスト学習手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:25:37 GMT)
Virtual Gram staining of label-free bacteria using darkfield microscopy and deep learning [4.7]
グラム染色は微生物学で1世紀以上にわたって最も頻繁に使われている染色プロトコルの1つである。本稿では,学習したディープニューラルネットワークを用いたラベルのない細菌の仮想グラム染色について紹介する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:28:03 GMT)
Security of discrete-modulated continuous-variable quantum key distribution [4.6]
離散変調を持つ連続変数量子鍵分布は、情報理論のセキュリティを提供する可能性がある。離散変調量子鍵分布プロトコルにおけるコヒーレント攻撃に対する有限サイズセキュリティを証明した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:39:52 GMT)
Opportunities and Challenges of Urban Agetech: from an Automated City to an Ageing-Friendly City [4.6]
高齢者の介護、高齢化、高齢者の生活の維持が重要視されている。本論文は, 都市型老化技術の概念を提唱し, 家庭外の老化技術が近代的高齢化に欠かせない都市に欠かせない役割を担っている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:29:11 GMT)
AnglE-optimized Text Embeddings [4.5]
本稿では,AnglEと呼ばれる新しい角度最適化テキスト埋め込みモデルを提案する。 AnglE の中核となる考え方は、複素空間に角度最適化を導入することである。短文STS、長文STS、ドメイン固有のSTSタスクなど、さまざまなタスクで大規模な実験が行われた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:33:21 GMT)
CHOSEN: Compilation to Hardware Optimization Stack for Efficient Vision Transformer Inference [4.5]
ビジョントランスフォーマー(ViT)は、コンピュータビジョンへの機械学習アプローチにおける画期的なシフトである。本稿では,これらの課題に対処するソフトウェアハードウェアの共同設計フレームワークであるCHOSENを紹介し,FPGA上にViTをデプロイするための自動フレームワークを提供する。 ChoSENはDeiT-SとDeiT-Bモデルのスループットを1.5倍と1.42倍改善した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:56:06 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [4.4]
本稿では,クエリの洗練にガイドドドキュメントを利用するフレームワークである GuideCQR を紹介する。具体的には、キーワードを拡大し、再ランクされた文書から期待された回答を生成し、それらをフィルタリング処理で統一する。実験の結果,ガイド付き文書によって強化されたクエリは,従来のCQR法よりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:39:16 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3]
大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。 LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:27:17 GMT)
Intensity correlations in the Wigner representation [4.3]
量子状態の2階相関関数 $g(2) (0)$ に対するコンパクトな表現をウィグナー関数の項で導き出す。直接光計測により$g(2) (0)$を同時に測定し、ホモダインのトモグラフィーによりウィグナー関数を再構成する実験を行う。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:00:00 GMT)
Crafting the Path: Robust Query Rewriting for Information Retrieval [4.3]
本稿では,検索システムに適した新しい構造化クエリ書き換え手法であるCrafting the Pathを提案する。本研究では,本手法がモデルの内部パラメータの知識に依存せず,事実的不正確なクエリを生成することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:11:28 GMT)
Test-Time Adaptation with State-Space Models [4.2]
本研究では,分散ドリフトを受ける配置モデルに適応可能な状態空間モデルを提案する。我々のモデルは、最後の隠れた特徴セットの分布シフトによって引き起こされるダイナミクスを学習する。私たちのアプローチは軽量で、モデルの最後の線形層だけを変更します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:18:49 GMT)
Instance-wise Uncertainty for Class Imbalance in Semantic Segmentation [4.1]
最先端の手法はますます深層学習モデルに依存しており、不確実性を誤って推定し、予測を過度に信ずることが知られている。これは、固有のクラス不均衡のため、セマンティックセグメンテーションにおいて特に問題となる。セマンティックセグメンテーションに特化して設計された新しいトレーニング手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:38:32 GMT)
Calibrated Diverse Ensemble Entropy Minimization for Robust Test-Time Adaptation in Prostate Cancer Detection [4.1]
高分解能マイクロ超音波は、リアルタイム前立腺がん検出において有望であることを示す。深層学習は、超音波に反映された複雑な組織特性を学習するための顕著なツールである。データ分布の変化により,異なる臨床センターのデータに適用した場合,モデルの性能が低下することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:20:10 GMT)
Sparsity-based Safety Conservatism for Constrained Offline Reinforcement Learning [4.1]
強化学習(Reinforcement Learning, RL)は、自律運転やロボット操作といった意思決定分野で大きな成功を収めている。 RLのトレーニングアプローチは、"オン・ポリティクス(on-policy)"サンプリングを中心にしているが、データを完全には活用していない。オフラインRLは魅力的な代替手段として現れており、特に追加実験を行うことは実用的ではない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:57:05 GMT)
Time-Efficient and Identity-Consistent Virtual Try-On Using A Variant of Altered Diffusion Models [4.0]
本研究は, 複雑なテクスチャの詳細と, 対象者と衣服の特徴を, 様々なシナリオで保存することの課題を強調する。様々な既存アプローチが検討され、制限と未解決の側面を強調している。次に,仮想試行中にテクスチャのテクスチャ保存とユーザアイデンティティ保持に対処する,新しい拡散型ソリューションを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:50:47 GMT)
Real Option Pricing using Quantum Computers [4.0]
導関数価格に適用される標準量子加速モンテカルロ(QAMC)の代替手法を提案する。我々のパイプラインは、直接符号化と呼ばれる新しい符号化プロトコルと振幅推定アルゴリズムの組み合わせの恩恵を受けている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:26:52 GMT)
GraphMuse: A Library for Symbolic Music Graph Processing [4.0]
GraphMuseは、効率的な音楽グラフ処理を容易にするグラフ処理フレームワークとライブラリである。音楽の楽譜における意味のある動作を対象とする新しいサンプリング手法が,我々の貢献の中心である。 GraphMuseは、グラフ表現に基づくシンボリックな音楽処理の強化と標準化に繋がることを期待しています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:54:09 GMT)
Comprehensive Review and Empirical Evaluation of Causal Discovery Algorithms for Numerical Data [4.0]
因果解析は、様々な分野における現象の根本原因を理解する上で不可欠な要素となっている。因果発見アルゴリズムに関する既存の文献は断片化されており、矛盾する方法論と包括的評価の欠如がある。本研究では,数値データに対する因果発見手法の徹底的な検討と実証評価を行うことにより,これらのギャップに対処する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:47:05 GMT)
Applying Conditional Generative Adversarial Networks for Imaging Diagnosis [3.9]
本研究は、スタックド・ホアーグラス・ネットワーク(SHGN)と統合されたコンディショナル・ジェネレーション・アドバイザリアル・ネットワーク(C-GAN)の革新的な応用を紹介する。我々は、複雑な画像データセットに適用されるディープラーニングモデルに共通するオーバーフィッティングの問題に、回転とスケーリングを通じてデータを増大させることで対処する。血管内超音波(IVUS)画像において,L1とL2再構成損失を併用したハイブリッド損失関数を導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:23:09 GMT)
In-Depth Analysis of Emotion Recognition through Knowledge-Based Large Language Models [3.8]
本稿では,文脈に基づく感情認識の新たな分野に寄与する。本稿では,感情認識手法とベイジアンキュー統合を組み合わせたアプローチを提案する。本手法は,受刑者のジレンマである社会的課題における表情の解釈の文脈で検証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:39:51 GMT)
Driving pattern interpretation based on action phases clustering [3.8]
本研究では,非教師的手法で行動フェーズを分類することで,運転パターンをさらに解釈する新しい枠組みを提案する。現実世界のデータセットを使用したフレームワークの適用により、"'Catch Up''、'Keep away'、''Maintain distance'とラベル付けされたI80データセットの6つの駆動パターンが明らかになった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:40:23 GMT)
Pulse-based variational quantum optimization and metalearning in superconducting circuits [3.8]
ハードウェアレベルフレームワークとしてパルスベースの変動量子最適化(PBVQO)を導入する。量子干渉デバイス上での外部超伝導の最適化について説明する。 PBVQOとメタラーニングの相乗効果は、従来のゲートベースの変分アルゴリズムよりも有利である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:05:36 GMT)
CUAOA: A Novel CUDA-Accelerated Simulation Framework for the QAOA [3.8]
量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、最適化問題の近似解を見つけるために設計された顕著な量子アルゴリズムである。既存の最先端のシミュレーションフレームワークは、長い実行時間や包括的な機能が欠如している。ランタイム・ザ・アート・ツールキットを用いたGPUアクセラレーションQAOAシミュレーションフレームワークを開発した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:06:18 GMT)
Geometric Remove-and-Retrain (GOAR): Coordinate-Invariant eXplainable AI Assessment [3.7]
Remove-and-Retrain(ROAR)は、個々のピクセルの重要性を評価するために広く受け入れられているアプローチである。 Geometric Remove-and-Retrain (GOAR) という新たな機能摂動手法を導入する。 GOARはピクセル中心のメトリクスの制限を超越する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:28:53 GMT)
Parameter Generation of Quantum Approximate Optimization Algorithm with Diffusion Model [3.7]
量子コンピューティングは最適化の分野に革命をもたらす可能性を示している。本研究では,量子近似最適化アルゴリズム(QAOA)の高速初期パラメータを生成するために,機械学習モデルを訓練する。我々の拡散モデルでは, 高い性能パラメータの分布を学習し, 最適パラメータに近い新しいパラメータを学習できることが示されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:18:27 GMT)
SimPB: A Single Model for 2D and 3D Object Detection from Multiple Cameras [3.6]
ビュービュー内の2Dオブジェクトと、複数のカメラからBEV空間内の3Dオブジェクトを同時に検出するSimPBと呼ばれる単一のモデルを提案する。ハイブリッドデコーダは複数のマルチビュー2Dデコーダ層と複数の3Dデコーダ層で構成され、それぞれの検出タスク用に特別に設計されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:56:33 GMT)
Liouvillian skin effect in a one-dimensional open many-body quantum system with generalized boundary conditions [3.6]
リウビリアン皮膚効果(LSE)と呼ばれる1次元散逸型量子多体系における皮膚効果について検討する。我々は、ベーテ・アンザッツの利点を生かした、正確に解けるモデルのリウヴィリアン超作用素を解くことにより、一般化境界条件に対する LSE の存在を厳密に同定する。我々の研究は、一般化された境界条件に対してLSEを示す、正確に解ける散逸性量子多体格子系のプロトタイプ的な例を提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:20:07 GMT)
EmoFace: Audio-driven Emotional 3D Face Animation [3.6]
EmoFaceは、鮮やかな感情的ダイナミクスを備えた顔アニメーションを作成するための、新しいオーディオ駆動の方法論である。提案手法では,複数の感情で表情を生成でき,ランダムだが自然な点滅や眼球運動を生成できる。提案手法は、ビデオゲームでプレイ不可能なキャラクターの対話アニメーションを作成し、バーチャルリアリティ環境でアバターを駆動するのに有効である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:32:16 GMT)
Context-Aware Fuzzing for Robustness Enhancement of Deep Learning Models [3.5]
我々は、コンテキスト信頼(CC)と呼ばれる新しいテスト指標を提案する。 CCは、テストケースの予測ラベルに予測される平均確率の観点から、テストケースの周囲のサンプルを通してテストケースを測定する。 Cloverは、これらのペアのシードとテストケースの差分を計算する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:31:10 GMT)
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation [3.5]
A/Bテストは新しいポリシーを検証することができるが、短期的な収益を損なうリスクがある。本稿では,データ収集のためのモデルベース収益政策とランダム化探索政策を組み合わせた新しいアプローチを提案する。我々は,合成データと実世界のデータの両方を用いて,提案した混合政策の有効性を実証的に検証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:02:41 GMT)
On the Complexity of Identification in Linear Structural Causal Models [3.4]
空間内で動作するジェネリック識別のための,新しい音響および完全アルゴリズムを提案する。また,同定が一般に困難であることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:11:26 GMT)
Conspiracy theories and where to find them on TikTok [3.4]
TikTokがオンラインの有害で危険なコンテンツを宣伝し、増幅する可能性を懸念する声が上がっている。本研究は、陰謀論を推し進める動画の存在を分析し、その有病率を低く見積もっている。ビデオの音声の書き起こしを抽出した後の陰謀論を識別するために,最先端のオープン言語モデルの有効性を評価する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:28:11 GMT)
CoSIGN: Few-Step Guidance of ConSIstency Model to Solve General INverse Problems [3.4]
我々は, 高い復元品質を維持しつつ, 推論ステップの境界を1-2 NFEに推し進めることを提案する。本手法は拡散型逆問題解法における新しい最先端技術を実現する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:57:50 GMT)
Chaotic Hedging with Iterated Integrals and Neural Networks [3.3]
半マルティンゲールのすべての$p$-可積分函数が、[1,infty$]の$pに対して、その反復積分の和として表されることを示す。また、すべての金融デリバティブが$Lp$-senseで任意に近似可能であることも示している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:16:15 GMT)
A Survey of Scam Exposure, Victimization, Types, Vectors, and Reporting in 12 Countries [3.3]
本研究は,12カ国における詐欺暴露,被害者化,タイプ,ベクター,報告に関する全国的な調査を通じて,このギャップに対処するものである。まず、裕福でない国の住民が詐欺で財政的に損失を被っていることがわかりました。第二に、インターネットは世界中の詐欺において重要な役割を担い、一人当たりのGNIは特定の詐欺タイプや接触ベクトルと強く結びついている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:35:56 GMT)
Enhancing Wrist Abnormality Detection with YOLO: Analysis of State-of-the-art Single-stage Detection Models [3.2]
この研究では、最先端の単一ステージのディープニューラルネットワークに基づく検出モデルYOLOv5、YOLOv6、YOLOv7、YOLOv8を用いて、手首の異常を検出する。これらのYOLOモデルは, 骨骨折検出において, 一般的に用いられている2段階検出アルゴリズムであるFaster R-CNNよりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:21:53 GMT)
Learning-assisted Stochastic Capacity Expansion Planning: A Bayesian Optimization Approach [3.1]
大規模容量拡大問題(CEP)は、地域エネルギーシステムのコスト効率の高い脱炭の中心である。本稿では,2段階のCEPを抽出する学習支援近似解法を提案する。本手法では, 直列集約法と比較して最大3.8%のコスト削減効果が得られた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:43:25 GMT)
RoDUS: Robust Decomposition of Static and Dynamic Elements in Urban Scenes [3.1]
都市景観における静的および動的要素を分解するパイプラインであるRoDUSについて述べる。提案手法では、4Dセマンティック情報と組み合わされた堅牢なカーネルベースの初期化を用いて学習プロセスを選択的にガイドする。特に,KITTI-360およびPandasetデータセットを用いた実験により,挑戦的な都市景観を正確に静的かつ動的成分に分解する手法の有効性が示された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:43:54 GMT)
Characterization of Political Polarized Users Attacked by Language Toxicity on Twitter [3.0]
本研究は,左,右,センター利用者の言語毒性フローを初めて調査することを目的とする。 5億件以上のTwitter投稿が調査された。その結果、左派ユーザーは右派やセンター派よりもはるかに有毒な回答が得られた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:49:47 GMT)
Progressive enhancement and restoration for mural images under low-light and defected conditions based on multi-receptive field strategy [3.0]
そこで本稿では,MER (Mural Enhancement and Restoration net) と呼ばれる欠陥領域の自動検出手法を用いた2段階復元モデルを提案する。我々の2段階モデルは、復元された画像の視覚的品質を向上するだけでなく、関連する計量評価において、評価可能な結果も達成する。我々は提案したモデルを利用して、古代の壁画の復元のためのウェブサイトを開設した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:36:57 GMT)
Enhancing Gaussian Process Surrogates for Optimization and Posterior Approximation via Random Exploration [3.0]
ガウス過程シュロゲートモデルの精度を高めるために、ランダムな探索ステップに依存する新しいノイズフリーベイズ最適化戦略。新しいアルゴリズムは、古典的なGP-UCBの実装の容易さを維持しているが、さらなる探索がそれらの収束を促進する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:42:12 GMT)
BrainVoxGen: Deep learning framework for synthesis of Ultrasound to MRI [3.0]
本研究は,脳の3次元超音波画像から3次元MRIボリュームを合成するための新しいディープラーニングフレームワークを提案する。本研究は、神経画像領域における医療診断と治療計画における変革的応用を約束する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:52:47 GMT)
ARTEMIS: A Mixed Analog-Stochastic In-DRAM Accelerator for Transformer Neural Networks [3.0]
ARTEMISは、トランスフォーマーモデルのための混合アナログ確率型インDRAMアクセラレータである。解析の結果、ARTEMISはGPU、TPU、CPU、最先端のPIMトランスハードウェアアクセラレータと比較して、少なくとも3.0倍のスピードアップ、1.8倍のエネルギー、そして1.9倍のエネルギー効率を示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:08:14 GMT)
Quantum Secure Protocols for Multiparty Computations [3.0]
量子攻撃に耐えられるセキュアなマルチパーティ計算(MPC)プロトコルを提案する。まず、量子領域における情報理論のセキュアな半線形評価(OLE)、すなわち$sf qOLE$の設計と解析について述べる。さらに、ビルディングブロックとして$sf qOLE$を使用し、MPSIプロトコルを構築します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:54:38 GMT)
Pre-Trained Foundation Model representations to uncover Breathing patterns in Speech [2.9]
呼吸速度(英: respiratory rate, RR)は、個人の健康、フィットネス、健康全般を評価するために用いられる重要な指標である。 RRを測定するための既存のアプローチは、特殊装備や訓練を用いて実施されている。機械学習アルゴリズムは、バイオセンサー信号を入力としてRRを推定できることを示した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:57:18 GMT)
Fighting Sampling Bias: A Framework for Training and Evaluating Credit Scoring Models [2.9]
本稿では,サンプリングバイアスがモデルトレーニングおよび評価に与える影響について考察する。スコアカード評価のためのバイアス認識型自己学習と拒絶推論フレームワークを提案する。その結果,ベイズ評価を用いて受入率を決定する場合,利益率が約8%向上することが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:59:54 GMT)
Bribe & Fork: Cheap Bribing Attacks via Forking Threat [2.9]
Bribe & Fork(ブライブ&フォーク)は、いわゆる羽のフォークの脅威を生かした、改造されたアブレーション攻撃である。このコスト削減の規模を評価するために、実世界のブロックチェーン実装の履歴データを実証的に分析する。われわれの調査結果は、PCNの潜在的な脆弱性に光を当て、堅牢なソリューションの必要性を強調した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:30:17 GMT)
Towards Learning Contrast Kinetics with Multi-Condition Latent Diffusion Models [2.9]
DCE-MRI時間系列の時間条件画像合成が可能な潜時拡散モデルを提案する。以上の結果から,本手法が現実的な多列性脂肪飽和乳房DCE-MRIを生成できることが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:04:45 GMT)
Combining Federated Learning and Control: A Survey [2.9]
この調査は、(非線形)制御アプリケーションにおける適応性、スケーラビリティ、一般化、プライバシを高めるために、フェデレートラーニング(FL)とコントロールを組み合わせる概要を提供する。 FLは、データプライバシを保持しながら、分散デバイス間の協調学習を可能にする、モデルトレーニングに対する分散アプローチを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:20:28 GMT)
Strawberry detection and counting based on YOLOv7 pruning and information based tracking algorithm [2.8]
本研究は,イチゴの花,未熟果実,成熟果実の検出を迅速かつ正確に行うことができる深層学習モデル(YOLOv7とその変種)の検出ヘッドの最適刈り取り法を提案した。特にPruning-YOLOv7-tiny with detection head 3とPruning-YOLOv7-tiny with head 2 and 3は最高の推論速度(毎秒163.9フレーム)と検出精度(89.1%)を達成した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:41:57 GMT)
Automate or Assist? The Role of Computational Models in Identifying Gendered Discourse in US Capital Trial Transcripts [2.8]
本稿では,女性被告に対する米国資本裁判において,ジェンダーバイアス言語を識別する,ハイテイクな問題に自動システムを追加するケーススタディを提案する。多くの典型的なNLPタスクとは異なり、数ヶ月の資本試験で性別バイアスに注釈を付けることは、多くの個人による判断の呼び出しを伴う複雑なタスクであった。計算モデルは、注釈に基づく研究で法の専門家を支援する貴重な機会を提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:30:04 GMT)
Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique [2.7]
Chain & Hashは、暗号化されたフレーバーで指紋を実装する、新しいシンプルなフィンガープリントアプローチだ。チェイン・アンド・ハッシュ法を複数のモデルで評価し,良性変換に対するロバスト性を実証した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:39:41 GMT)
gFlora: a topology-aware method to discover functional co-response groups in soil microbial communities [2.7]
我々は,その機能的共応答群,すなわち,その共応答効果が総トポロジカル量のトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジカルなトポロジ土壌微生物群集を分類群をノードとした生態共起ネットワークとしてモデル化する。我々は、この共起ネットワーク上でグラフ畳み込みを用いて、グループ間の共応答効果を得るgFloraと呼ばれる手法を設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:10:20 GMT)
Cheddar: A Swift Fully Homomorphic Encryption Library for CUDA GPUs [2.6]
FHE(Fully homomorphic encryption)は、クラウドコンピューティングにおけるセキュリティとプライバシの問題を解決するための暗号化技術である。 FHEは、暗号化されたデータを処理するための膨大な計算オーバーヘッドを導入し、FHEワークロードは暗号化されていないワークロードよりも2～6桁遅くなりました。本稿では,GPUのFHEライブラリであるCheddarを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:49:18 GMT)
UEFI Vulnerability Signature Generation using Static and Symbolic Analysis [2.6]
我々は,Static Analysis Guided Symbolic Execution (STASE) と呼ばれる手法を導入する。 STASEは、両方の分析アプローチを統合して、その強みを活用し、弱点を最小限にする。 TianocoreのEDKIIでは、先日報告されたPixieFail脆弱性と13の新たな脆弱性を検出し、9つ中5つの脆弱性シグネチャを生成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:57:47 GMT)
Zero-shot Text-guided Infinite Image Synthesis with LLM guidance [2.5]
解像度とコンテキストの多様性を備えたテキストイメージのペアデータセットが不足している。テキストに基づく画像の拡張には、グローバルコヒーレンスとリッチなローカルコンテキスト理解が必要である。本稿では,大域的コヒーレンスと局所的文脈理解の両面において,Large Language Models (LLM) を用いた新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:10:01 GMT)
Proof-of-Collaborative-Learning: A Multi-winner Federated Learning Consensus Algorithm [2.5]
協調学習(PoCL, Proof-of-Collaborative-Learning)は,多自由度学習による協調学習によるコンセンサス機構である。 PoCLはブロックチェーンのパワーをリダイレクトして、フェデレートされた学習モデルをトレーニングする。鉱夫の局所訓練モデルの効率性を確保するための新しい評価機構を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:14:05 GMT)
Contrastive Adversarial Training for Unsupervised Domain Adaptation [2.4]
様々なドメイン適応タスクにおいて、ドメイン逆行訓練がうまく採用されている。大規模なモデルでは、敵のトレーニングがソースドメインに偏りやすく、ターゲットドメインにはほとんど適応しない。本稿では、ラベル付きソースドメインのサンプルを利用して、ターゲットドメインの機能生成を強化・調整するコントラッシブ・逆行訓練(CAT)手法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:59:21 GMT)
Dirac--Bianconi Graph Neural Networks -- Enabling Non-Diffusive Long-Range Graph Predictions [2.4]
我々は最近ビアンコーニが提唱したトポロジカルディラック方程式に基づいて,ディラック-ビアンコーニGNN(DBGNN)を紹介する。グラフラプラシアンに基づいて、DBGNNが従来のメッセージパッシングニューラルネットワーク(MPNN)と根本的に異なる方法でグラフの幾何学を探索することを実証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:59:00 GMT)
On the Pauli Spectrum of QAC0 [2.3]
我々は、$mathsfQAC0$のパウリスペクトルが低度濃度を満たすと推測する。我々は新しい回路の低境界と学習結果を応用として得る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:47:34 GMT)
Conditional Quantile Estimation for Uncertain Watch Time in Short-Video Recommendation [2.3]
条件量子推定(CQE)という新しい推定手法を導入する。 CQEは、量子レグレッションを使用して、時計時間のニュアンス分布をキャプチャする。また、条件付き予測、保守的推定、動的量子化の組み合わせを含む量子化予測を強化するためのいくつかの戦略を設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:25:35 GMT)
Sharif-STR at SemEval-2024 Task 1: Transformer as a Regression Model for Fine-Grained Scoring of Textual Semantic Relations [2.3]
本稿では,RoBERTa変換器の微調整技術を利用して,トラックA内の文レベルSTR(Supervised)について検討する。以上の結果から,特にラテン言語におけるSTR性能の有望な進歩が示唆された。しかし、我々のアプローチはアラビア語のような言語で困難に遭遇し、わずか0.38の相関しか見られず、結果として20位になった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:25:18 GMT)
Rényi-infinity constrained sampling with $d^3$ membership queries [2.2]
本稿では,エレガントな収束保証を有する原理的かつ単純なアルゴリズムである制約付き近位サンプリング手法を提案する。 R'enyi-infinity divergence(mathcal R_infty$)に収束することを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:20:08 GMT)
Tutorial on Quantum Error Correction for 2024 Quantum Information Knowledge (QuIK) Workshop [2.1]
我々は、2024年IEEE国際情報理論シンポジウム(ISIT 2024)の第1回量子情報知識ワークショップ(QuIK)の参加者に対して、量子計算の基礎と量子エラー補正の簡単なレビューを行う。これは包括的なレビューではないが、読者が概念や研究の方向性を深く掘り下げるために、多くの参考資料を提供している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:58:32 GMT)
Skeleton Recall Loss for Connectivity Conserving and Resource Efficient Segmentation of Thin Tubular Structures [2.1]
容器、神経、道路、コンクリートクラックなどの細い管状構造を正確に分断することは、コンピュータビジョンにおいて重要な課題である。 DiceやCross-Entropyのような標準的なディープラーニングベースのセグメンテーション損失関数は、しばしば構造的な接続性やトポロジーを犠牲にしてオーバーラップに焦点を当てる。我々は,GPUベースの計算を低コストなCPU操作で回避し,これらの課題を効果的に解決する新しいSkeleton Recall Lossを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:46:41 GMT)
How we won BraTS 2023 Adult Glioma challenge? Just faking it! Enhanced Synthetic Data Augmentation and Model Ensemble for brain tumour segmentation [2.1]
ディープラーニングは、脳腫瘍をセグメント化するための最先端技術である。大量の高品質なデータが必要ですが、入手は困難です。我々は、データ拡張に非従来的なメカニズムを用いることで、この問題に対処する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:47:18 GMT)
Minimum discrepancy principle strategy for choosing $k$ in $k$-NN regression [2.0]
保持データを用いずに、$k$-NN回帰推定器でハイパーパラメータ$k$を選択するための新しいデータ駆動戦略を提案する。本稿では,早期停止と最小一致原理に基づく実践的戦略を実践的に容易に導入することを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:28:01 GMT)
Deep Generative Attacks and Countermeasures for Data-Driven Offline Signature Verification [2.0]
本研究では,データ駆動型オフライン署名検証(DASV)システムの生成攻撃に対する脆弱性について検討する。本稿では,DASVシステムに挑戦する誤認識シグネチャを作成する上で,VAE(Variversaational Autoencoders)とCGAN(Conditional Generative Adrial Networks)の有効性について検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:44:45 GMT)
Enhancing Gene Expression Prediction from Histology Images with Spatial Transcriptomics Completion [2.0]
我々は,26の公開資料から収集した体系的にキュレートされ,処理されたデータベースについて述べる。また、欠落した遺伝子発現を推測する技術として、最先端のトランスフォーマーベースの補完手法を提案する。我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:28:20 GMT)
Anatomical basis of human sex differences in ECG identified by automated torso-cardiac three-dimensional reconstruction [2.0]
女性では脳梗塞後のMI診断の欠失率と予後不良率が高い。女性におけるSTj振幅の低下は、より小さな心室にも関係している。後MIT波振幅とR軸偏差は、女性においてより後方および水平の心位置と強く関連している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:28:38 GMT)
Mutual Information Bounded by Fisher Information [2.0]
我々は、フィッシャー情報の観点から、相互情報に対する一般的な上限を導出する。次にそれらを量子ケースに一般化し、量子フィッシャー情報の観点からホレヴォ情報を束縛する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 12:05:30 GMT)
Continuous reasoning for adaptive container image distribution in the cloud-edge continuum [1.9]
本稿では,コンテナイメージをクラウドエッジ連続体に複製する新たな宣言的アプローチを提案する。リソースの可用性、ネットワークとストレージのコストを考慮すると、最適な配置を決定するために論理プログラミングを活用します。 ASPとPrologの継続的推論を組み合わせることで、コストの最適化と意思決定の迅速化を両立させることができることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:33:52 GMT)
Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation [1.9]
我々は、シーンテキストをソース言語(例えばヒンディー語)からターゲット言語(例えば、英語)に視覚的に翻訳するタスクについて研究する。視覚翻訳は、シーンテキストの認識と翻訳だけでなく、翻訳された画像の生成も含む。本稿では、シーンテキスト認識、機械翻訳、シーンテキスト合成のための最先端モジュールを組み合わせた視覚翻訳のためのケースケードフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:53:23 GMT)
Is That Rain? Understanding Effects on Visual Odometry Performance for Autonomous UAVs and Efficient DNN-based Rain Classification at the Edge [1.9]
最先端のローカルトラッキングと軌道計画は通常、飛行制御アルゴリズムにカメラセンサーを入力して実行される。最先端のビジュアル・オドメトリーシステムでは, 1.5mの最悪ケース平均追跡誤差が可能であることを示す。我々は、モバイルおよび制約されたデプロイメントシナリオに適したディープニューラルネットワークモデルのセットをトレーニングし、これらの雨の条件を効率的に正確に分類できる範囲を判断する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:47:25 GMT)
Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs [1.9]
バックドアを成功させようとする悪いアクターは、トレーニングや評価の際のアクティベーションを避けるために、それらを設計する必要があります。現在の大規模言語モデル(LLM)は、過去の出来事と将来の出来事を区別することができ、モデルのアクティベーションに関する調査で90%の精度を実現している。私たちは、時間的分布シフトによって引き起こされるバックドアでモデルをトレーニングします。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:45:46 GMT)
Semantic-Aware Representation of Multi-Modal Data for Data Ingress: A Literature Review [1.9]
LLM(Large Language Models)のような生成AIは、テキスト、画像、オーディオ、ビデオなどのマルチモーダルデータを処理するために広く採用されている。このデータを効率的に管理することは、データ量が2倍にならないため、業界倍の課題となっている。本研究では,モノモーダル,マルチモーダル,クロスモーダルデータから埋め込みを抽出するセマンティック・アウェア技術に着目した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:49:11 GMT)
Comparison of estimation limits for quantum two-parameter estimation [1.9]
長岡クラム-ラオ境界とルワン不確実性関係の到達可能性を比較した。これらの2つの限界は、物理的に達成可能な精度について異なる情報を提供できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:37:08 GMT)
What's Distributive Justice Got to Do with It? Rethinking Algorithmic Fairness from the Perspective of Approximate Justice [1.8]
不完全な意思決定システムという文脈では、個人間での利益/利益の理想的な分配がどのようなものになるかだけを気にすべきではない、と私たちは主張する。このためには、アルゴリズムフェアネス研究者として、分配的正義を見極め、公正性基準を使用する方法を再考する必要がある。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:13:23 GMT)
Tiny Models are the Computational Saver for Large Models [1.8]
本稿では,TinySaverについて紹介する。TinySaverは,大規模モデルを適応的に置き換えるために小さなモデルを用いる,早期に出現する動的モデル圧縮手法である。この手法をImageNet-1k分類で評価した結果,最大90%の演算数を削減できる可能性が示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:12:28 GMT)
RIMformer: An End-to-End Transformer for FMCW Radar Interference Mitigation [1.8]
RIMformerと呼ばれる新しいFMCWレーダ干渉緩和法は、エンドツーエンドのTransformerベース構造を用いて提案される。このアーキテクチャは、時間領域IF信号をエンドツーエンドで処理するように設計されている。その結果,提案したRIMformerは干渉を効果的に軽減し,ターゲット信号の復元を可能にすることがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:01:27 GMT)
Pretraining Data and Tokenizer for Indic LLM [1.8]
我々は,多言語Indic大言語モデル構築のためのデータ準備のための新しいアプローチを開発する。われわれの厳密なデータ取得は、Common Crawl、Indic Book、ニュース記事、Wikipediaなど、オープンソースとプロプライエタリなソースにまたがっている。 Indic言語毎に、冗長で低品質なテキストコンテンツを効果的に除去するカスタムプリプロセッシングパイプラインを設計する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:06:27 GMT)
Turkish Delights: a Dataset on Turkish Euphemisms [1.8]
この研究は、潜在的至上主義用語(PET)に関する現在の計算作業をトルコ語に拡張する。本稿では,トルコのPETデータセットについて紹介する。トルコ語におけるPETのエウヘミスティックな例と非エウヘミスティックな例を挙げる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:13:42 GMT)
Profiling quantum circuits for their efficient execution on single- and multi-core architectures [1.7]
本研究では,量子ビット相互作用グラフとゲート依存性グラフから抽出したグラフ理論に基づくメトリクスを紹介する。量子ビット相互作用とゲート依存性グラフの両方に根ざしたパラメータ間の接続と、量子回路マッピングのパフォーマンス指標を明らかにする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:08:50 GMT)
MoCheQoS: Automated Analysis of Quality of Service Properties of Communicating Systems [1.7]
MoCheQoSは、メッセージパッシングシステムのQoS特性を分析するための有界モデルチェッカーである。本研究は,MoCheQoSの適用性を評価するための2つのケーススタディである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:09:58 GMT)
Navigating the Smog: A Cooperative Multi-Agent RL for Accurate Air Pollution Mapping through Data Assimilation [1.7]
本稿では,自律型ドローンが空飛ぶ探偵として機能する,空気質マッピングの新しい手法を提案する。当社のソリューションでは、ダイナミックなクレジット割り当てを備えたリターン機能を採用しており、ドローンによる情報測定の優先順位付けを可能にしている。空気の質以外にも、このソリューションは山火事の検出や管理といった多様な環境問題に対処する可能性を秘めている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:24:27 GMT)
Novel Deep Neural Network Classifier Characterization Metrics with Applications to Dataless Evaluation [1.7]
本研究では、サンプルデータセットを使わずに、ディープニューラルネットワーク(DNN)分類器のトレーニング品質を評価する。 CAFIR10およびCAFIR100データセットを用いて学習したResNet18の手法に関する実証的研究により、DNN分類器のデータレス評価が実際に可能であることを確認した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:40:46 GMT)
ModalChorus: Visual Probing and Alignment of Multi-modal Embeddings via Modal Fusion Map [1.7]
マルチモーダル埋め込みの視覚的探索とアライメントのための対話型システムであるModalChorusを設計する。 1) モーダル・フュージョン・マップ (MFM) を埋め込んだ新しい次元減少法である。ケーススタディでは、ゼロショット分類からクロスモーダル検索と生成までのシナリオにおいて、ModalChorusが直感的に誤調整と効率的な再調整の発見を容易にすることが示されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:49:56 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6]
言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:28:36 GMT)
Beyond the Veil of Similarity: Quantifying Semantic Continuity in Explainable AI [1.6]
本稿では,説明可能なAI手法と機械学習モデルにおける意味連続性を測定するための新しい指標を提案する。我々は、入力の漸進的な変化が、異なるXAI手法によって提供される説明にどのように影響するかを観察する実験を行う。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:32:41 GMT)
Morphosyntactic Analysis for CHILDES [1.6]
CHILDESデータベースのデータの書き起こしとリンクを行っている。 UD(Universal Dependencies)フレームワークを27言語に対して一貫した同値なモルフォシンタクティック分析に応用した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:11:24 GMT)
AI Control: Improving Safety Despite Intentional Subversion [1.5]
我々は,意図的な転倒に対して堅牢な安全手法のパイプラインを開発し,評価する。バックドアを含むソリューションを決して提出しないプロトコルについて検討する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:29:41 GMT)
Optical pumping through the Liouvillian skin effect [1.4]
我々は、リウビリアの皮膚効果の観点から、典型的な光ポンピングプロセスが理解可能であることを示した。以上の結果から, 光ポンピングは, 状態調製と冷却に重要な意味を持つと考えられる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:51:15 GMT)
HDLCopilot: Hardware Design Library Querying with Natural Language [1.3]
ハードウェア設計エンジニアは、様々な製造ラボから複数のプロセスデザインキット(PDK)を常用する。これらのライブラリには、タイミング情報のための自由ファイル、抽象的なレイアウトの詳細のためのEFファイル、プロセス設計ルールのための技術EFなど、複数のビューが含まれている。 LLMを利用したPDKクエリシステムであるHDLCopilotを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:11:13 GMT)
Efficient Fusion and Task Guided Embedding for End-to-end Autonomous Driving [1.3]
我々は,センサ融合と安全リスク予測の課題に対処するため,EfficientFuserというコンパクトで強力なソリューションを導入した。 CARLAシミュレーションプラットフォームで評価されたEfficientFuserは、パラメータの37.6%しか利用せず、顕著な効率性を示している。安全スコアは、その有効性と、自律運転システムへの実用的展開の可能性を示す主要な安全性向上手法に近づいた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:50:39 GMT)
Sparse-IFT: Sparse Iso-FLOP Transformations for Maximizing Training Efficiency [1.3]
Sparse Iso-FLOP Transformations (Sparse-IFT) は密度モデルFLOPを維持しながら精度を向上させる。本研究は,マスクトポロジ,重み,最終性能の相関性について明らかにした。我々の知る限りでは、高密度モデルの精度を向上させるためにスパーシティの使用を実証する最初の研究である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:57:12 GMT)
A polynomial-time classical algorithm for noisy quantum circuits [1.3]
雑音量子回路のための時空古典的アルゴリズムを提供する。我々のアプローチは、雑音が非局所的相関を指数的に減衰させるという直感に基づいている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:48:39 GMT)
Evaluating graph-based explanations for AI-based recommender systems [1.2]
本稿では,AIによるレコメンデーションに対するユーザの認識を改善するために,グラフに基づく説明の有効性について検討する。ユーザがグラフベースの説明を,機能の重要性を含む設計よりも有用であると認識していることが分かりました。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:28:49 GMT)
From Principles to Practices: Lessons Learned from Applying Partnership on AI's (PAI) Synthetic Media Framework to 11 Use Cases [1.2]
2023年は世界が生成的AIに目覚めた年であり、2024年は政策立案者がより強く反応する年だ。本論文は,合成メディアガバナンスの実装の多様な事例の収集として初めて知られるものである。これは、合成メディアガバナンスを実際に使用するために適用、拡張、拡張、洗練できる領域を強調している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:27:56 GMT)
DropKAN: Regularizing KANs by masking post-activations [1.2]
コルモゴロフ・アルノルドネットワーク(KAN)における活性化関数重みの共適応を防止する正規化手法を提案する。 DropKanは、Kans計算グラフ内のポストアクティベーションの一部をランダムにマスキングし、保持されたポストアクティベーションをスケールアップする。最小限のコーディング作業を必要とするこの単純な手順は、正規化効果を持ち、一貫してkansのより優れた一般化につながることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:48:47 GMT)
RING-NeRF : Rethinking Inductive Biases for Versatile and Efficient Neural Fields [1.2]
本稿では2つの帰納バイアスを含むRING-NeRFアーキテクチャを提案する。単一の再構成プロセスは、誘導バイアスを生かし、オンパー性能を実験的に示す。また、これらの帰納バイアスを生かした単一再構成プロセスを設計し、オンパー性能を実験的に実証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:47:30 GMT)
Learning a Sparse Neural Network using IHT [1.1]
本稿では、高度なスパース最適化の分野、特に非線形微分可能関数に対処する分野の成果に依拠する。 NNのトレーニングの計算能力が増大するにつれて、モデルがより多くのパラメータで複雑になる。本稿では,ニューラルネットワーク(NN)トレーニングの領域において,そのような収束の理論的前提が適用可能であるかを検討することを目的とする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:51:36 GMT)
Hybrid Dynamic Pruning: A Pathway to Efficient Transformer Inference [1.1]
本稿では,頭部の疎度を用いてトランスフォーマーを高速化し,疎度をブロックし,注意の計算を減らし,メモリアクセスを減らし,新しいアルゴリズムアーキテクチャの共設計手法を提案する。注目スコアと注目ヘッドの巨大な冗長性を観測し、実行時に注目行列内の重要でないブロックをプルーする整数ベースの行平衡ブロックプルーニングを提案する。また、実行時に重要でないヘッドを検出およびプルーする整数ベースのヘッドプルーニングを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:15:16 GMT)
Agent-E: From Autonomous Web Navigation to Foundational Design Principles in Agentic Systems [1.1]
本稿では,新しいWebエージェントであるAgent-Eの構築について紹介する。 Agent-Eは、最先端のWebエージェントよりも多くのアーキテクチャ改善を導入している。我々は,Agent-Eが他のSOTAテキストおよびマルチモーダルWebエージェントを,ほとんどのカテゴリで10～30%上回っていることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:44:28 GMT)
Enhancing Facial Expression Recognition through Dual-Direction Attention Mixed Feature Networks: Application to 7th ABAW Challenge [1.0]
我々は,ECCV 2024における第7回ABAWチャレンジへのコントリビューションについて紹介する。両方向注意混合特徴ネットワークをマルチタスク表情認識に活用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:11:37 GMT)
Proximity-based Self-Federated Learning [1.0]
本稿では,近接型自己フェデレーション学習という,新しい完全分散型フェデレーション学習戦略を提案する。従来のアルゴリズムとは異なり、我々の手法は、地理的近接とモデル精度に基づいて、クライアントが近隣ノードとモデルを共有し、調整することを奨励する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:44:45 GMT)
Explaining Deep Neural Networks by Leveraging Intrinsic Methods [1.0]
この論文はeXplainable AIの分野に貢献し、ディープニューラルネットワークの解釈可能性の向上に重点を置いている。中心となる貢献は、これらのネットワークをより解釈しやすくすることを目的とした新しい技術の導入である。第2に、この研究は、訓練された深層ニューラルネットワーク内のニューロンに関する新しい研究を掘り下げ、その活性化値に関連する見過ごされた現象に光を当てた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:20:17 GMT)
Pseudo-keypoint RKHS Learning for Self-supervised 6DoF Pose Estimation [0.9]
6自由度ポーズ推定(6DoF PE)におけるシミュレーションと実領域ギャップに対処する。本稿では,RKHS の学習可能なカーネルを用いて,このギャップを効果的に狭める,自己監督型キーポイント投票ベースの 6DoF PE フレームワークを提案する。提案手法は,合成真実のポーズを持つ純粋合成データに基づいて事前学習されたアダプタネットワークであり,この元となる合成ドメインからターゲットとなる実領域へネットワークパラメータを進化させる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:10:09 GMT)
Experimental Demonstration of a Quantum-Optimal Coronagraph Using Spatial Mode Sorters [0.9]
理想的な直接イメージングコロナグラフは、外惑星検出と局在化の量子情報限界を達成するために示されている。空間モード(de)多重化を用いた量子最適コロナグラフを実験的に実装した。我々は、1000:1の恒星-惑星のコントラスト比の下で、主星からのサブ回折距離$(sigma)$での人工外惑星のローカライズに成功した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:55:39 GMT)
WebAssembly and Security: a review [0.9]
私たちは7つの異なるセキュリティカテゴリを識別することで121の論文を分析します。このギャップを埋めるために、WebAssemblyのセキュリティを扱う研究の包括的なレビューを提案しています。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:37:28 GMT)
Detecting quantum properties in physical systems using proxy witnesses [0.8]
我々は、拡張性、量子コヒーレンス、アクティベーション、ステアビリティ、絡み合いなどの量子特性のプロキシ証人について議論する。これらの代理証人は、多体系(viz)、量子ハイゼンベルクモデル、量子J1-J2モデルなど、広く検討されているいくつかの例に適用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:05:47 GMT)
Revolutionizing Genomics with Reinforcement Learning Techniques [0.8]
強化学習(Reinforcement Learning, RL)は、幅広い問題を解決する強力なツールとして登場した。 RLアルゴリズムは、最小限の人間の監督で経験から学ぶことができる。 RLを使用する大きなメリットの1つは、ラベル付きトレーニングデータ収集に伴うコスト削減である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:14:57 GMT)
A graph-based formalism for surface codes and twists [0.8]
我々は、ツイストで曲面コードを構築するための厳密な形式主義を提供する。曲面コードを任意の2次元多様体上に埋め込まれたグラフ$G$に関連付ける。レートや距離など,さまざまなコード特性を計算し,バインドする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:42:40 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7]
我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:27:14 GMT)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.7]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:30:42 GMT)
Urban Traffic Forecasting with Integrated Travel Time and Data Availability in a Conformal Graph Neural Network Framework [0.7]
本稿では,駅間の移動時間をグラフニューラルネットワークアーキテクチャの重み付き隣接行列に組み込む新しい枠組みを提案する。不確実性に対処するために、リアルタイムの検証残差に基づいて予測間隔を調整するAdaptive Conformal Prediction (ACP) 手法を用いる。実験の結果,提案モデルでは,MAEが約24%,RMSEが8%,次世代モデルが約24%向上した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:11:07 GMT)
ER-FSL: Experience Replay with Feature Subspace Learning for Online Continual Learning [0.7]
オンライン連続学習(OCL)では、新しいデータに適応しながら古いデータからの知識を保持するディープニューラルネットワークが1回しかアクセスできない。既存のリプレイベースのメソッドは、古いデータからバッファ化されたサンプルを再生し、新しいデータの現在のサンプルを学習することで、忘れを軽減します。本研究では,同じ特徴空間における学習と再生が,忘れる問題に対処する上では有効でないことを実証的に発見する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:00:05 GMT)
CCoE: A Compact LLM with Collaboration of Experts [0.6]
我々は、強力なドメインエキスパートを簡単に結合して大きな言語モデル(LLM)に融合するフレームワークを提案する。コード、法、テキストから数学、医学の分野の専門家5人から始めます。その結果、私たちのCCoEフレームワークは、異なるドメインのオリジナルベースモデルにおいて、トレーニングのリソースが少ないだけでなく、推論も簡単に、効率的に10%-20%パフォーマンスを向上できます。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:26:12 GMT)
M2DS: Multilingual Dataset for Multi-document Summarisation [0.5]
MDS(Multi-document Summarisation)は、顧客レビュー、学術論文、医療および法律文書、ニュース記事を含む多様なデータセットを提供する。しかし、これらのデータセットの英語中心の性質は、今日のグローバル化されたデジタルランドスケープにおいて、多言語データセットの顕著な空白を生み出している。本稿では、M2DSについて、その特異な多言語的側面を強調し、我々のデータセットで評価された最先端のMDSモデルからのベースラインスコアを含む。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:25:51 GMT)
Social learning with complex contagion [0.5]
複雑な感染の概念とペイオフバイアス模倣の概念を組み合わせた数学的モデルを導入する。我々のフレームワークは、模倣によって伝統的な社会学習モデルを一般化する。社会システムにおけるより現実的な行動変化を記述した合成フレームワークを提供する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:39:21 GMT)
A Scalable and Generalized Deep Learning Framework for Anomaly Detection in Surveillance Videos [0.5]
ビデオにおける異常検出は、暴力、万引き、破壊など、複雑さ、騒音、多様な活動の性質のために困難である。既存のアプローチでは、広範囲な再トレーニングなしに、さまざまな異常なタスクにディープラーニングモデルを適用するのに苦労しています。本研究では,特徴一般化向上のための伝達学習,特徴表現向上のためのモデル融合,マルチタスク分類という,3つの重要なコンポーネントからなる新しいDLフレームワークを導入する。 RLVSデータセット(違反検出)では97.99%、UCFデータセットでは83.59%の精度を達成した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:41:12 GMT)
Exact projected entangled pair ground states with topological Euler invariant [0.5]
本報告では,非自明なオイラートポロジーを持つギャップ付き凸凸対状態(PEPS)のクラスについて報告する。非相互作用極限において、これらの系は量子幾何学的境界の飽和に関する最適条件を持つ。我々は自由フェルミオンとオイラー位相と相互作用する状態の間に共有される特徴的絡み合いの特徴を明らかにする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:00:00 GMT)
Are Educational Escape Rooms More Effective Than Traditional Lectures for Teaching Software Engineering? A Randomized Controlled Trial [0.5]
本稿では,ソフトウェア工学を教えるための仮想学習室の学習効果について分析する。ランダムに制御された試行を通じて、この活動と伝統的な教育を比較します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:17:23 GMT)
Supersolidity in Rydberg tweezer arrays [0.4]
Rydberg tweezer アレイは、双極子 XY または van-der-Waals Ising ZZ 相互作用で量子磁石を探索するための汎用的なプラットフォームを提供する。本稿では,Rydberg原子間の双極子相互作用とファンダーワール相互作用を組み合わせる手法を提案する。反発相互作用では、現在のRydberg tweezer実験において、ロバストな超固体相の存在を予測する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:21:30 GMT)
A Survey on Code-Based Cryptography [0.4]
有能な量子コンピュータは、現在採用されている非対称暗号システムを全て破壊することができる。 NISTは2016年に、公開鍵暗号(PKE)スキーム、鍵カプセル化機構(KEM)、デジタル署名スキームの標準化プロセスを開始した。 2023年、NISTはポストクォータム署名を新たに要求した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:45:58 GMT)
Investigating Adversarial Vulnerability and Implicit Bias through Frequency Analysis [0.4]
本研究では,これらの摂動と,勾配に基づくアルゴリズムで学習したニューラルネットワークの暗黙バイアスとの関係について検討する。入力画像のそれぞれに対して, 正確な分類や誤分類に必要な最小かつ最も重要な周波数を, 逆摂動バージョンで同定する。その結果,Fourier空間のネットワークバイアスと敵攻撃の標的周波数は高い相関性を示し,新たな敵防御戦略が示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:34:48 GMT)
Enhancing Polygonal Building Segmentation via Oriented Corners [0.4]
本稿では,入力画像から直接ポリゴンを抽出する,OriCornerNetという新しいディープ畳み込みニューラルネットワークを提案する。我々のアプローチは、隣接する角への方向を示すフットプリントマスク、コーナー、配向ベクトルを予測できる深いモデルを含む。 SpaceNet VegasとCrowdAIの小さなデータセットで行った性能評価は、我々のアプローチの競争力を示すものである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:59:06 GMT)
Tomography of parametrized quantum states [0.3]
トモグラフィーの異なる概念を統一する枠組みを導入し、パラメタライズド量子状態のトモグラフィーに有益な自然像を定式化する。本稿では,信号処理技術とトモグラフィー手法を組み合わせることで,パラメータ化された量子状態への近似を復元する明示的アルゴリズムを提案する。類似した方法で、パラメタライズド量子チャネルに適用されるメリットの図形を導出する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:00:04 GMT)
State-dependent mobility edge in kinetically constrained models [0.3]
運動論的に制約された量子東モデルが、量子スカーレッドと多体局在系の間に存在することを示す。私たちはこのシナリオを$textitstate-dependent$ Mobility edgeと名付けます。我々は、古典的シミュレーション力学の複雑さを考察することにより、状態依存型モビリティエッジを特徴づける。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:00:01 GMT)
In-Situ Infrared Camera Monitoring for Defect and Anomaly Detection in Laser Powder Bed Fusion: Calibration, Data Mapping, and Feature Extraction [0.3]
レーザーパウダーベッド融合(LPBF)プロセスは, 溶融プール不安定性, スパッタリング, 温度上昇, 粉体拡散異常による欠陥を生じさせる可能性がある。内部監視による欠陥の特定には、通常、生成された大量のデータを収集、保存、分析する必要がある。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:02:22 GMT)
Strong cubic phase shifts on the photonic vacuum state [0.2]
コヒーレント状態への光子の付加は真空状態に作用する立方相シフトと顕著な類似性を示す効果をもたらす。立方体相互作用の強さは、コヒーレント状態の変位に逆らって変化し、最も強い相互作用は、以前の観測より1桁大きくなった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 02:32:23 GMT)
Data-driven Verification of DNNs for Object Recognition [0.2]
本稿では、勾配のない最適化を用いたディープニューラルネットワーク(DNN)の新しいテスト手法を提案する。画像中の線路を画像中に検出する画像分割タスクに適用することにより,テストしたDNNの弱点の同定に成功していることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:30:02 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2]
Vibravox corpusには38時間の音声サンプルと188人の参加者が異なる音環境下で記録した生理的音が含まれている。音声認識や話者検証など,様々な音声関連課題について一連の実験を行った。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:09:01 GMT)
Fractional Wannier Orbitals and Tight-Binding Gauge Fields for Kitaev Honeycomb Superlattices with Flat Majorana Bands [0.2]
フラクショナル励起は、基礎物理学と量子技術の両方に大きな可能性を秘めている。そこで本研究では,ハニカム格子上のキタエフスピンモデルにおけるπ-フラックスの様々な結晶相における低エネルギーマヨナ分散の進化について検討する。我々は、この超交換相互作用がZ2ゲージ場として作用する条件を特定し、マヨアナ・ワニエ軌道の強結合ホッピングを管理する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:44:39 GMT)
A Survey of AI-Powered Mini-Grid Solutions for a Sustainable Future in Rural Communities [0.2]
本稿では,統計的手法,機械学習アルゴリズム,ハイブリッドアプローチなど,様々な予測モデルについてレビューする。 Prophet、NeuralProphet、N-BEATSといった公開データセットやツールをモデル実装と検証のために検討している。この調査は、将来の研究への推奨で締めくくられ、モデル適応と現実世界のアプリケーションへの最適化における課題に対処する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:23:38 GMT)
Steamroller Problems: An Evaluation of LLM Reasoning Capability with Automated Theorem Prover Strategies [0.2]
GPT4, GPT3.5 TurboおよびGoogleのGeminiモデルの性能をスチームローラー領域の問題に対して評価した。 ATP推論戦略を用いた場合のモデルの性能はワンショットの思考に匹敵することがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:49:23 GMT)
Emerging Quadrature Lattices of Kerr Combs [0.2]
フォトニック二次格子の非エルミート格子効果を初めて実験的に研究した。我々の研究は量子非エルミート物理学とケーラーコムという2つの主要な分野を統一する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:30:07 GMT)
BISON: Blind Identification with Stateless scOped pseudoNyms [0.1]
GoogleやFacebookのような認証プロバイダに認証を委譲することは便利だが、ユーザーのプライバシーを侵害する。我々は、BISON派生プロトコルを提示することで、どちらも必要悪ではないことを示す。サービスプロバイダのIDをIDプロバイダから隠しますが、信頼され、スコープ化され、不変の偽名を生成します。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:26:49 GMT)
An Evaluation of Continual Learning for Advanced Node Semiconductor Defect Inspection [0.1]
本研究は,半導体欠陥検査におけるタスクに依存しないメタラーニング手法を提案する。新しい欠陥クラスとスケールの漸進的な追加を可能にし、より堅牢で一般化されたモデルを作成する。我々は、ADIとAEIの2つのプロセスステップに対して、実際のレジストウェハSEM(Scanning Electron Microscopy)データセットを用いて、我々のアプローチをベンチマークした。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:41:22 GMT)
All-fiber, near-infrared, laser system at 780nm for atom cooling [0.1]
780nmの単純でコンパクトで経済的なレーザーシステムの設計,実装,特性について述べる。 1560nmの2つの半導体レーザーは、1つのエルビウムドープファイバ増幅器で増幅され、周期的に置換されたニオブ酸リチウム結晶で周波数が倍になる。レーザの振幅雑音と直線幅とSHG効率を特徴付ける。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:00:01 GMT)
INTELLECT: Adapting Cyber Threat Detection to Heterogeneous Computing Environments [0.1]
本稿では,IDSのための事前学習MLモデルと構成の動的適応のための結合パイプラインに,特徴選択,モデルプルーニング,微調整技術を統合する新しいソリューションであるINTELLECTを紹介する。我々は,知識蒸留技術を微調整中に組み込むことの利点を実証し,MLモデルが歴史的知識を維持しつつ,局所的なネットワークパターンに一貫して適応できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:34:29 GMT)
Whether to trust: the ML leap of faith [0.0]
信頼は態度として一般的に理解されているが、これを正確に測定したり、管理したりすることはできない。システム全体、ML、およびMLのコンポーネント部分に対する信頼を尊重するので、ほとんどのユーザは、MLを信頼するときに受ける信頼の跳躍を理解していません。信頼を構築するための現在の取り組みは、MLのプロセスを説明するものである。これは、非MLの専門家が、それが複雑であるため理解するのが困難であり、説明は、彼ら自身の(知識のない)精神モデルとは無関係である。本稿では,MLにおける内在的信頼を直接構築する革新的な方法を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:36:19 GMT)
Variational approach to light-matter interaction: Bridging quantum and semiclassical limits [0.0]
我々は,光物質系の力学をシミュレートするための時間依存的変分法を提案する。変分法は、光-物質相互作用の様々な量子モデルに適用できる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 00:53:33 GMT)
Type-level Property Based Testing [0.0]
本稿では,ソフトウェア仕様と依存型付けモデル,コンパイル時の実装の結合を統一する自動フレームワークを提案する。いくつかの興味深いシステムやネットワークプロトコルをモデル化し、型チェッカーで実装が指定された動作であることを検証し、モデルが仕様のセマンティクスにマッチしていることをテストすることができます。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 16:43:41 GMT)
The virial theorem and the method of multipliers in spectral theory [0.0]
電磁量子ハミルトニアンの固有値や他のスペクトル特性の欠如を推定するためにこの手法を用いる方法を示す。我々は、行列値ポテンシャルを持つシュレーディンガー作用素、パウリ型とディラック型の相対論的作用素、複雑なロビン境界条件など、非自己随伴設定における最近の発展に焦点を当てる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:57:15 GMT)
The revised boomerang connectivity tables and their connection to the Difference Distribution Table [0.0]
近年では、拡張ボメラン接続テーブル(EBCT)、下ボメラン接続テーブル(LBCT)、上ボメラン接続テーブル(UBCT)の3つの新しいテーブルが導入されている。本稿では,これらの新しいEBCT, LBCT, UBCTの概念を差分$delta$-uniform関数のためにDDTに接続することで, 文脈で述べる。我々は以前公表されたいくつかの結果を簡単に得る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:44:40 GMT)
The inherent goodness of well educated intelligence [0.0]
本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:04:44 GMT)
The Hellmann-Feynman theorem and the spectrum of some Hamiltonian operators [0.0]
ここでは、よく知られたヘルマン=ファインマンの定理を利用して、いくつかの非相対論的ハミルトン作用素が無限個の有界状態をサポートすることを証明する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:39:10 GMT)
Teaching Quantum Informatics at School: Computer Science Principles and Standards [0.0]
量子情報学はコンピュータサイエンス教育に関係しているが、その教え方についてはほとんど研究されていない。本研究では,デニングの大原理の中に量子情報学を配置し,中等教育のための量子情報学標準を提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:32:37 GMT)
Supersensitive phase estimation by thermal light in a Kerr-nonlinear interferometric setup [0.0]
超感度位相推定は、例えば、Kerr-nonlinear 2モード結合器を介してマッハ-ツェンダー干渉計に注入されたテクスタイトコヒーレントにより達成可能であることを示す。位相誤差は、平均光子数である$barn$より1/barn$以下である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:23:58 GMT)
Steady-State Entanglement Generation via Casimir-Polder Interactions [0.0]
本研究では, 表面近傍のキャシミール・ポルダー相互作用から生じる2つの原子間の定常な絡み合いの発生について検討した。完全な導電性および超伝導表面は、ほぼ0.5の最適な定常収束値を得る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:00:40 GMT)
Socially Assistive Robot in Sexual Health: Group and Individual Student-Robot Interaction Activities Promoting Disclosure, Learning and Positive Attitudes [0.0]
社会支援ロボット(SAR)は、人間よりも信頼できると認識されることもある。学生は人間の教師よりも、SE関連の質問をロボットに尋ねることにオープンだった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:36:21 GMT)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0]
私たちは戦略的思考と意思決定を評価するために、Tic-Tac-Toe、Connect Four、Battleshipといったゲームを使用しています。標準ベンチマークに習熟しているにもかかわらず、GPT-3.5とGPT-4のプレイ能力と、事前トレーニングなしで完全に観察可能なゲームについて推論する能力は、ごくわずかである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:47:30 GMT)
Search Engines, LLMs or Both? Evaluating Information Seeking Strategies for Answering Health Questions [0.0]
我々は,異なるWeb検索エンジン,LLM(Large Language Models)およびRAG(Research-augmented)アプローチを比較した。健康問題に対処する可能性のあるウェブページの品質は、ランキングを下方へ下るにつれて低下しない。評価の結果, Web エンジンは健康問題に対する正しい回答を見つける上で LLM よりも精度が低いことがわかった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:40:39 GMT)
Schmidt modes carrying orbital angular momentum generated by cascaded systems pumped with Laguerre-Gaussian beams [0.0]
Orbital Angular Momentum(OAM)モードは、量子科学とテクノロジーの様々な分野で使われる重要なリソースである。パラメトリックダウンコンバージョン(PDC)によるOAMを含む相関シュミットモードの生成に対する理論的アプローチを提案する。本研究では, ポンプパラメータを変化させることで, 発生モードの数とその個体群を制御できることを実証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:53:40 GMT)
SHARC-VQE: Simplified Hamiltonian Approach with Refinement and Correction enabled Variational Quantum Eigensolver for Molecular Simulation [0.0]
SHARC-VQEは分子シミュレーションの計算コストを大幅に削減する。 SHARC-VQEによる測定結果は、量子回路からのノイズによる誤差が少ない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 04:01:55 GMT)
Resource overheads and attainable rates for trapped-ion lattice surgery [0.0]
本研究では,空間的に分離されたイオン表面符号間の耐故障性格子手術に必要なイオン数を推定する。この結果から,トラップイオン量子コンピュータのスケール化のために,光カップリングの改善が急務であることが示唆された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:37:44 GMT)
RankTower: A Synergistic Framework for Enhancing Two-Tower Pre-Ranking Model [0.0]
大規模ランキングシステムでは、効率性と効率性のバランスをとるためにカスケードアーキテクチャが広く採用されている。オンラインレイテンシの制約に従うために、効率性と精度のバランスを維持することは、プレグレードモデルにとって不可欠である。そこで我々は,ユーザとイテムのインタラクションを効率的に捉えるために,RangeTowerという新しいニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:07:37 GMT)
Quantum-vacuum-induced topological edge polaritons [0.0]
本稿では、量子真空の存在によって引き起こされる位相的エッジ偏光子の形成を明らかにする。このような量子真空誘起エッジ分極は、単一のフォトニックモードとの適切な相互作用の下でスピンフルフェルミオン格子の系で達成できる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:01:04 GMT)
Quantum vs. Symplectic Computers [0.0]
シンプレクティック計算はシンプレクティック変換と測定のシーケンスを含む。シュル「オーディンガー」方程式はその標準的な複素形式で、量子系のユニタリ進化を記述する。この量子シンプレクティック双対性は、量子コンピュータとシンプレクティックコンピュータの能力を高めるために利用することができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:29:41 GMT)
Ontological States in Non-Interacting Quantum Field Theories [0.0]
標準モデルの背後にある存在論的決定論を見つける最初のステップは、量子場論において、存在論的状態として振る舞う状態を見つけることである。標準モデルで発生するすべての非相互作用(3+1-次元)量子場理論に対する存在論的状態を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 09:34:59 GMT)
One-dimensional Dunkl Quantum Mechanics: A Path Integral Approach [0.0]
一次元ウィグナー・ダンクル量子力学におけるプロパゲータを導出する。プロパゲータのスペクトル分解からエネルギースペクトルと対応する境界状態波関数を推定する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:14:44 GMT)
On Stronger Computational Separations Between Multimodal and Unimodal Machine Learning [0.0]
Lu (NeurIPS '23, ALT '24) はマルチモーダル学習の理論を導入する。特に、Lu(ALT '24)は、学習タスクのtextitworst-caseインスタンスに関連する計算分離を示す。基礎的な条件下では、平均ケースのユニモーダルとマルチモーダルの学習タスク間の任意の計算的分離が対応する暗号鍵合意プロトコルを意味することを証明している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:01:45 GMT)
On Diversity in Discriminative Neural Networks [0.0]
機械学習、特にニューラルネットワークでは、多様性は必ずしも強調され、少なくとも明確に識別される概念であるとは限らない。本稿では,様々な多様性原則に基づくニューラルネットワークアーキテクチャを提案する。このアーキテクチャは,MNISTが99.57%,CIFAR-10が94.21%,クラスが25のラベルしか持たない,有望な半教師あり学習精度を期待できる,驚くべき結果を得た。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:26:44 GMT)
Occam Gradient Descent [0.0]
Occam Gradient Descentは、モデルの重みのモデルサイズと勾配勾配を減らし、フィッティングエラーを最小限に抑えるアルゴリズムである。本アルゴリズムは, 減量, 計算, モデルサイズにおいて, 列車後プルーニングの有無にかかわらず, 従来の勾配勾配よりも優れる。 Occam Gradient Descentで訓練されたニューラルネットワークは、勾配降下で訓練されたニューラルネットワークとランダムフォレストの両方で、損失とモデルサイズの両方で優れた性能を発揮する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:35:54 GMT)
Multi evolutional deep neural networks (Multi-EDNN) [0.0]
進化的ディープニューラルネットワーク(EDNN)は偏微分方程式(PDE)を解く大規模なドメインで結合されたPDEを解決するために単一のネットワークを使用することは、多数のネットワークパラメータを必要とし、かなりの計算コストを発生させる。我々は,各状態変数に対して独立ネットワークを用いることで,PDEのシステムを解決するための結合EDNN(C-EDNN)を導入する。また、グローバルドメインを複数の要素に空間的に分割し、各要素に個別のEDNNを割り当て、PDEの局所的進化を解決することで分散EDNN(D-EDNN)を導入する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 03:26:03 GMT)
Measurement-device agnostic quantum tomography [0.0]
本研究では,実測値と推定値とのミスマッチが,この特性の精度を制限していることを示す。これらのアーティファクトを使用して、ミスマッチを検出し、定量化し、実際の測定演算子に関する情報を得る。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:04:16 GMT)
Machine Learning for the identification of phase-transitions in interacting agent-based systems: a Desai-Zwanzig example [0.0]
本稿では,エージェントモデルに対する位相遷移を平均フィールド限界でピンポイントするデータ駆動フレームワークを提案する。この目的のために、多様体学習アルゴリズムであるマップを用いて、データ駆動潜在変数の相似集合を同定する。次に、深層学習フレームワークを用いて、データ駆動座標の共形再パラメータ化を求める。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 01:02:50 GMT)
Machine Learning for Dynamic Management Zone in Smart Farming [0.0]
デジタル農業のアプローチは、伝統的な農業システムを置き換えるために非常に合理的なコストで使用できる。提案手法は, 収率帯の空間的変動の解析に有用である。提案したゾーン管理アプローチは、農家や農夫がより効果的にN型肥料を施すのに役立つ。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:37:57 GMT)
Machine Learning Based Prediction of Proton Conductivity in Metal-Organic Frameworks [0.0]
金属-有機フレームワーク(MOF)は、プロトン交換膜燃料電池における固体電解質としての可能性を持っている。我々は,プロトン伝導性MOFのデータベースを開発し,そのプロトン伝導性を予測するために機械学習技術を適用した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 06:01:42 GMT)
Learning Gaussian Operations and the Matchgate Hierarchy [0.0]
クリフォード階層(Clifford Hierarchy)に類似した構造を持つ、マッチゲート階層(Matchgate Hierarchy)と呼ばれる無限のユニタリゲート群を導入する。 Clifford HierarchyはMatchgate Hierarchyに含まれており、階層のあらゆるレベルの操作を効率的に学習できることを示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:22:58 GMT)
Is Intelligence Artificial? [0.0]
本稿では,自然界,次に人工知能に適用可能な統一的な定義を提案する。コルモゴロフの複素性理論に基づく計量が示唆され、エントロピーに関する測度が導かれる。承認されたAIテストのバージョンは、後に 'acid test' として提示され、フリー思考プログラムが達成しようとするものかもしれない。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 08:52:08 GMT)
Inverse participation ratio and entanglement of edge states in HgTe quantum wells in a finite strip geometry [0.0]
解析的および数値的ハミルトン対角化手法からエッジ状態エネルギーと波動関数に関する情報を抽出する。スピン、運動量$k_x$、位置$y$におけるエッジ状態波動関数の構造の解析は、境界におけるエッジ状態のスピン偏極構造を証明している。還元密度行列(RDM)の純度とエントロピーは、スピンセクターが系の他の部分と絡み合っている領域$(k_x,y)$を知らせる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:46:19 GMT)
Integrability of open boundary driven quantum circuits [0.0]
開境界条件を持つ量子ビット(スピン1/2)の二重量子回路のヤン・バクスター積分性の問題に対処する。我々はこの解を用いて、2ステップの離散時間フロケダイナミクスを持つ変換行列形式から積分可能な回路を構築する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:39:13 GMT)
Honeypot Implementation in a Cloud Environment [0.0]
この論文は、HeiCLOUDの悪意ある活動を調べるために、ハニーポットソリューションを提示している。ハイデルベルク大学の制限されたネットワークゾーンで攻撃者を検出するために、ファイアウォールの漏れを検出する新しい概念が生み出される。仲介インスタンスとして動作するカスタマイズされたOpenSSHサーバが提供される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:35:54 GMT)
High-Quality Tabular Data Generation using Post-Selected VAE [0.0]
本稿では,より少ない実行時間で高品質な合成データを生成できるPSVAEを紹介する。 PSVAEには損失最適化とポストセレクションという2つの主要な概念が組み込まれている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:07:30 GMT)
Hidden time-reversal in driven XXZ spin chains: exact solutions and new dissipative phase transitions [0.0]
境界駆動および消散を受ける XXZ スピン鎖の相互作用モデルが、微妙な時間反転対称性を持つことを示す。我々の厳密な解はまた、電流が流れる純粋で絡み合った定常状態を持つ駆動散逸二重鎖モデルを直接生成する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:12:53 GMT)
Hands-on STEM Learning Experiences using Digital Technologies [0.0]
本研究の目的は,イタリア学校で実施した経験と活動について,この新たなアプローチで概説することである。学生がコラボレーション、創造性、批判的思考、実験、プロトタイピング、コミュニケーション、問題解決など、様々なコア能力を開発するプロジェクトや経験の選択が議論された。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:09:48 GMT)
GraphCNNpred: A stock market indices prediction using a Graph based deep learning system [0.0]
我々は,テキストS&textP 500,NASDAQ,DJI,NYSE,RASELの指標の傾向を予測するために,さまざまなデータソースに適用可能なグラフニューラルネットワークベースの畳み込みニューラルネットワーク(CNN)モデルを提案する。実験の結果,F測度の観点からは,ベースラインアルゴリズム上のすべての指標の予測性能が約4%から15%に向上した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:07:28 GMT)
Floquet systems with continuous dynamical symmetries: characterization, time-dependent Noether charge, and solvability [0.0]
連続力学対称性(CDS)を持つ量子フロケット系について検討する。離散的なものとは違って、CDSはハミルトニアンの$H(t)$を強く制約し、フロケ状態をすべて得ることができる。この結果はフロケ状態の体系的な解法を提供し、準エネルギー図のハイブリダイゼーションを避ける方法を説明する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 23:11:45 GMT)
FarsInstruct: Empowering Large Language Models for Persian Instruction Understanding [0.0]
この研究は、Co-CoLAフレームワークによるトレーニングとFarsInstructデータセットの有効性を示す。現在の執筆時点で、FarsInstructは21の異なるデータセットに200以上のテンプレートで構成されている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:03:55 GMT)
Evaluation of Rounding Functions in Nearest-Neighbor Interpolation [0.0]
評価された丸め関数は、IEEE 754-2008標準で定義された5つの丸め規則の中から選択される。丸め関数がNN画像品質に与える影響を研究・評価するために、フル・ノン・レファレンス画像品質評価指標が使用される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:25:23 GMT)
Estimating Reaction Barriers with Deep Reinforcement Learning [0.0]
複雑な系の安定状態は、関連するポテンシャルエネルギー表面上の局所ミニマに対応する。たいていの場合、システムは局所的な最小値に近づき、希少な大きなゆらぎがミニマ間の遷移に繋がる。本研究の目的は,システム状態空間における2つの安定状態間の最小エネルギー障壁をコスト最小化問題として求めることである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:02:32 GMT)
Estimate Epidemiological Parameters given Partial Observations based on Algebraically Observable PINNs [0.0]
実際には、流行モデルによって推定される人口に対応する全ての軌跡データを得ることはできない。我々は、未知の疫学パラメータを推定するために、代数的可観測性の概念をPINNに導入する。推定パラメータと未観測変数の予測の観点から,代数的に観測可能なPINNとして命名されたPINNの有効性を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:22:12 GMT)
Equality in some symplectic eigenvalue inequalities [0.0]
ワイルの不等式、リドスキーの不等式、シュル=ホルン多元化不等式のシンプレクティックアナログにおいて、必要十分条件を提供する。シンプレクティックワイルとリドスキーの不等式に対する等式条件は、固有値に対する既知の等式条件と類似していることが判明した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:33:32 GMT)
Emergence of second-order coherence in superfluorescence [0.0]
カスケード量子系における超ラジカルバーストの2階量子コヒーレンス関数について検討する。本研究の結果から,ハミルトニアンの結合が根本的に異なるにもかかわらず,カスケード系および対称結合系における超放射能は著しく多くの類似点を有することが明らかとなった。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:30:16 GMT)
Easing Maintenance of Academic Static Analyzers [0.0]
Mopsaは、音を出すことを目的とした静的分析プラットフォームである。この記事では、2017年以来のMopsaのメンテナンスを簡素化するために、私たちが作り出したツールとテクニックについて説明する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:29:21 GMT)
DisorderUnetLM: Validating ProteinUnet for efficient protein intrinsic disorder prediction [0.0]
内因性障害領域の予測は、タンパク質の機能やダイナミクスを理解する上で重要な意味を持つ。近年,タンパク質言語モデル(pLM)に基づく新しい世代の予測器が出現している。本稿では、タンパク質Unetの考え方に基づく新しい障害UnetLM障害予測器について紹介する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:19:59 GMT)
Digitizing lattice gauge theories in the magnetic basis: reducing the breaking of the fundamental commutation relations [0.0]
格子$mathrmSU(2)$ gauge theory Hamiltonian in the $mathitmagnetic$ $mathitbasis$, where the gauge link are unitary and diagonal。デジタル化は、$mathrmSU(2)$群多様体の特定の分割から得られ、この分割上のリー微分の近似によって、正準モータが構成される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 18:47:09 GMT)
Diagnosing thermalization dynamics of non-Hermitian quantum systems via GKSL master equations [0.0]
固有状態熱化仮説の非エルミート量子系への応用は、散逸的量子カオスにおいて最も重要なトピックの1つとなっている。我々は、非エルミート系を記述するゴリーニ-コサコフスキー-スダルシャン-リンドブラッドマスター方程式の2つのバージョンを導出した。この発見は、最近提案された直交確率行列理論が適切な修正を必要とすることを示唆している。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:38:38 GMT)
Comparing Federated Stochastic Gradient Descent and Federated Averaging for Predicting Hospital Length of Stay [0.0]
入院期間(LOS)を確実に予測することは,病院における資源配分の効率化に不可欠である。従来の予測モデリングツールは、医療機関がプライバシー規則を定めているため、十分なデータと多様なデータを取得するのが難しいことが多い。このモデリング手法は、病院外の機密データを抽出することなく、異なる病院からの分散データソースをモデル化することで協調的なモデルトレーニングを促進する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:00:20 GMT)
Classification and reconstruction of images in the problem single-pixel imaging using classical and quantum neural networks [0.0]
シングルピクセルカメラは、可視光スペクトルの外の光範囲に優れた解決策となる。将来的には、量子コンピュータはそのような問題の解をさらにスピードアップすることができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 11:38:57 GMT)
Classical and quantum Merlin-Arthur automata [0.0]
我々はMerlin-Arthur Automaticaを導入し、Merlinが計算の開始点を提供し、入力を読む前にArthurによってスキャンされる。異なる証明書長を用いて結果を示す。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 22:14:08 GMT)
CerberusDet: Unified Multi-Task Object Detection [0.0]
CerberusDetは、複数のオブジェクト検出タスクを処理するために設計されたマルチヘッドモデルを持つフレームワークである。提案されたモデルはYOLOアーキテクチャ上に構築され、バックボーンとネックコンポーネントの両方から視覚的特徴を効率的に共有する。 CerberusDetは、推論時間を36%削減した最先端のデータ固有モデルに匹敵する結果を得た。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 15:00:35 GMT)
Beyond Energy: Teleporting Current, Charge, and More [0.0]
本研究では, (1+1) 次元カイラルディラックシステムについて検討し, 電流と電荷のプロトコルを実行する。最も重要な結果の1つは、システム全体にわたる長距離相関の生成である。フィードバック制御操作によって誘導される新しいカイラルダイナミクスの活性化を見いだす。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:30:36 GMT)
Benchmarking adiabatic transformation by alternating unitaries [0.0]
断熱変換はハミルトニアンの交互ユニタリ作用素として近似することができる。この交互ユニタリ法により, 断熱駆動法よりもエネルギー固有状態の分布が広いことが判明した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:51:38 GMT)
Automated Verification of Equivalence Properties in Advanced Logic Programs -- Bachelor Thesis [0.0]
最適化されたサブプログラムが元のサブプログラムを置き換えることができるかどうかを自動的に検証できるツールを持つことが望ましい。そのため、翻訳ツールのアンセムが開発された。 2つのプログラムが強い同値であることを検証するために、古典論理のための自動定理証明器と併用することができる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 10:23:59 GMT)
Atomic and entanglement dynamics in the mixed squeezed coherent state version of the Jaynes-Cummings interaction [0.0]
放射場の混合状態における圧縮ノイズを含むコヒーレント信号は、コヒーレント状態密度演算子と圧縮状態密度演算子の非ガウス混合とみなす。本研究の目的は、圧縮真空とコヒーレント状態の混合場状態と相互作用する2レベル原子の文脈において、Jaynes-Cummingsモデルの混合状態バージョンを研究することである。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:13:34 GMT)
An atomic probe of dark matter differential interactions with elementary particles [0.0]
標準模型を超えた物理学の探索は、実験物理学の主要な課題の1つである。コマグネトメーターはそのような粒子に対して超高感度プローブを形成する。本研究では,これらのフィールドを発見し,そのスペクトルを測定するマルチ原子種プローブを提案する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 07:23:14 GMT)
An L-BFGS-B approach for linear and nonlinear system identification under $\ell_1$- and group-Lasso regularization [0.0]
線形および非線形離散時間状態空間モデルを同定するための非常に効率的な数値計算法を提案する。提案手法のPython実装は、jax-sysidパッケージで利用可能である。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 05:42:14 GMT)
An Efficient TLS 1.3 Handshake Protocol with VC Certificate Type [0.0]
本稿では,トランスポート層セキュリティ(TLS)ハンドシェイクプロトコルの設計と実装について述べる。 RFC-8446への完全準拠を維持しながら、検証認証(VC)の使用を可能にする。結果として、大規模IoTシステムにおけるセルフソブリンアイデンティティの採用の道が開けた。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:18:16 GMT)
A survey and taxonomy of methods interpreting random forest models [0.0]
ランダムフォレスト(RF)モデルの解釈可能性は、機械学習(ML)コミュニティへの関心が高まりつつある研究トピックである。 RF生成モデルは、多くの深い決定木のために「ブラックボックス」と見なされている。本論文は、RF結果モデルの解釈に文献で使用される手法について、広範囲にレビューすることを目的とする。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 17:33:32 GMT)
A primary quantum current standard based on the Josephson and the quantum Hall effects [0.0]
アンペアの新しい定義では、1秒あたりの基本的な電荷の流れを1部108ドルの相対的な不確実性で制御できる量子電流標準が要求される。本稿では,量子標準と超伝導極低温増幅器を組み合わせた新しい量子電流発生器について述べる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:45:41 GMT)
A new economic and financial theory of money [0.0]
電子通貨の評価はマクロ経済学理論と金融政策の基本方程式に基づく。電子通貨を、サブエコノミーの有形資産に関連付けられた取引株式として捉えていく。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:43:10 GMT)
A Survey on Universal Approximation Theorems [0.0]
本稿ではニューラルネットワーク(NN)の近似能力に関する様々な定理について論じる。本稿では,関数近似の予備結果から得られたUATの体系的概要について述べる。 UATの理論的および数値的な側面は、任意の幅と深さの両方からカバーされている。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:21:53 GMT)
A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks [0.0]
大規模言語モデル(LLM)は多くの異なる自然言語処理(NLP)タスクにおいて顕著なパフォーマンスを示している。プロンプトエンジニアリングは、大きなパフォーマンス向上を達成するために、既に存在するLLMの能力に追加する上で重要な役割を担います。本稿では、異なるプロンプト手法を要約し、それらが用いた異なるNLPタスクに基づいてそれらをまとめる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 20:23:19 GMT)
A Spin-Optical Quantum Computing Architecture [0.0]
フォールトトレラント量子コンピューティング用に設計された適応性とモジュール型ハイブリッドアーキテクチャを提案する。量子エミッターと線形光学的エンタングゲートを組み合わせて、物質ベースのアプローチとフォトニックベースのアプローチの両方の強度を利用する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:29:52 GMT)
A Resolution Independent Neural Operator [0.0]
本稿では,DeepONetの分解能を独立にするためのフレームワークを提供するResolvion Independent Neural Operator (RINO)を紹介する。 RINOにより、DeepONetは任意に、しかし十分に微妙に識別された入力関数を処理できる。任意に処理するRINOの頑健さと適用性(しかし十分に豊富なサンプル入力関数)を実証する。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 21:03:21 GMT)
A High-Speed Hardware Algorithm for Modulus Operation and its Application in Prime Number Calculation [0.0]
提案アルゴリズムは加算演算,減算演算,論理演算,ビットシフト演算のみを用いる。暗号化アプリケーションにおけるスケーラビリティの課題に対処する。このアルゴリズムを50,000までの素数計算に適用すると、実用性と性能上の利点が示される。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 13:24:52 GMT)
A Framework for testing Federated Learning algorithms using an edge-like environment [0.0]
フェデレーテッド・ラーニング(FL)は、多くのクライアントが、データをプライベートかつ分散化しながら、単一の集中型モデルを協調的にトレーニングする機械学習パラダイムである。グローバル集中型モデルアグリゲーションにおける局所モデルの貢献を正確に評価するのは簡単ではない。これはFLにおける大きな挑戦の例であり、一般にデータ不均衡またはクラス不均衡として知られている。本研究では,FLアルゴリズムをより容易かつスケーラブルに評価するためのフレームワークを提案し,実装した。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 19:52:53 GMT)
A Brief Review of Quantum Machine Learning for Financial Services [0.0]
本稿では,ファイナンスに応用可能な量子機械学習における最先端のアルゴリズムと技術について検討する。検討される金融アプリケーションには、リスク管理、クレジットスコアリング、不正検出、株価予測が含まれる。
論文参考訳（メタデータ） (Wed, 17 Jul 2024 14:44:47 GMT)