Fugu-MT: arxivの論文翻訳(概要)

Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.0]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。 DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。 10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:34:13 GMT)
Open Problems in Technical AI Governance [93.9]
テクニカルAIガバナンス(Technical AI Governance)は、AIの効果的なガバナンスを支援するための技術分析とツールである。本論文は、AIガバナンスへの貢献を目指す技術研究者や研究資金提供者のためのリソースとして意図されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:13:56 GMT)
Q-Sparse: All Large Language Models can be Fully Sparsely-Activated [93.5]
Q-Sparseは、スパースアクティベートされた大規模言語モデル(LLM)を訓練するための、シンプルで効果的なアプローチである。 Q-Sparse は LLM における活性化の完全な分散を可能にし、推論においてかなりの効率向上をもたらす。バッチトレーニングと推論のためのBlock Q-Sparseも導入しています。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:57:26 GMT)
Diffusion Models as Data Mining Tools [87.8]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:14:31 GMT)
Modeling and Driving Human Body Soundfields through Acoustic Primitives [79.4]
本研究では,人体が生成する全3次元音場をレンダリングし,高品質な空間オーディオ生成を実現するフレームワークを提案する。我々は,3次元空間の任意の点において,全音響シーンを効率よく,正確にレンダリングできることを実証した。我々の音響プリミティブは、従来の手法に比べて、音場表現が桁違い小さくなり、近接場レンダリングの欠陥を克服する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:25:07 GMT)
Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data [76.9]
大規模言語モデルにおける一般化と記憶の相互作用について検討する。各種のオープンソースLLMとその事前学習コーパスを用いて、モデルのサイズが大きくなるにつれて、タスク関連$n$-gramのペアデータの重要性が増すのを観察する。その結果,LLMの能力は,十分なタスク関連事前学習データによる記憶と一般化の微妙なバランスから生じるという仮説を支持した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:24:40 GMT)
POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.7]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:37:21 GMT)
Learning Rate Curriculum [76.0]
ラーニングレートカリキュラム(LeRaC)と呼ばれる新しいカリキュラム学習手法を提案する。 LeRaCは、ニューラルネットワークの各レイヤ毎に異なる学習率を使用して、最初のトレーニングエポックの間、データに依存しないカリキュラムを作成する。 Smoothing(CBS)によるCurriculum(Curriculum)との比較を行った。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:29:22 GMT)
On the Design and Analysis of LLM-Based Algorithms [74.7]
大規模言語モデル(LLM)はアルゴリズムのサブルーチンとして使用される。 LLMは素晴らしい経験的成功を収めた。我々のフレームワークはLLMベースのアルゴリズムの進歩を約束している。 LLMアルゴリズムのさらなる研究を促進するため、ソースコードはhttps://github.com/modelscope/agentscope/tree/main/examples/paper_llm_based_algorithmで公開しています。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:39:07 GMT)
Consent in Crisis: The Rapid Decline of the AI Data Commons [74.7]
汎用人工知能(AI)システムは、大量の公開Webデータに基づいて構築されている。我々は,AIトレーニングコーパスに基づくWebドメインに対する同意プロトコルの大規模かつ長期的監査を行う。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:50:18 GMT)
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5]
Plucker座標に基づく制御ネットライクなコンディショニング機構を用いた3次元カメラ制御のためのトランスフォーマー映像を試作する。我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:43:10 GMT)
Perturb-and-Project: Differentially Private Similarities and Marginals [74.0]
差分プライバシーのための入力摂動フレームワークを再検討し、入力にノイズを付加する。まず、ペアワイズ・コサイン類似性をプライベートにリリースするための新しい効率的なアルゴリズムを設計する。我々は,$k$の辺縁クエリを$n$の機能に対して計算する新しいアルゴリズムを導出する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:03:37 GMT)
Read and Reap the Rewards: Learning to Play Atari with the Help of Instruction Manuals [69.8]
Read and Rewardは、Atariゲーム開発者がリリースしたマニュアルを読むことで、Atariゲーム上のRLアルゴリズムを高速化する。各種RLアルゴリズムは,設計支援による性能向上とトレーニング速度の向上を実現している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 20:16:44 GMT)
FINEMATCH: Aspect-based Fine-grained Image and Text Mismatch Detection and Correction [67.0]
我々は新しいアスペクトベースのきめ細かいテキストと画像マッチングベンチマークであるFineMatchを提案する。 FineMatchはテキストと画像のミスマッチの検出と修正に焦点を当てている。 FineMatchで訓練されたモデルは、きめ細かいテキストや画像のミスマッチを検出する能力の向上を示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:32:40 GMT)
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception [64.8]
本稿では,様々な知覚タスクの表現を調和させる新しい統一表現RepVFを提案する。 RepVFは、ベクトル場を通じてシーン内の異なるターゲットの構造を特徴付け、シングルヘッドでマルチタスクの学習モデルを可能にする。 RepVF 上に構築された RFTR は,タスク間の固有性を利用したネットワークである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:46:44 GMT)
A Comprehensive Review of Few-shot Action Recognition [64.5]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:53:32 GMT)
Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.7]
グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:11:10 GMT)
DifFace: Blind Face Restoration with Diffused Error Contraction [62.5]
DifFaceは、複雑な損失設計なしで、目に見えない複雑な劣化にもっと優しく対処できる。現在の最先端の手法よりも優れており、特に深刻な劣化の場合には優れている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:04:32 GMT)
Improving Context-Aware Preference Modeling for Language Models [62.3]
本稿では、まず、文脈を選択し、選択した文脈に対する嗜好を評価することによって、不特定性を解決する2段階の選好モデリング手法について考察する。我々は、文脈条件付き嗜好データセットと実験に貢献し、文脈特化選好を評価する言語モデルの能力について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:05:17 GMT)
Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption [61.0]
本研究は、モデルベース強化学習(RL)における敵対的腐敗の課題に取り組む。本稿では,MLE に対する不確実性重みとして全変量 (TV) に基づく情報比を利用する,汚損楽観的 MLE (CR-OMLE) アルゴリズムを提案する。我々は、重み付け手法をオフライン設定にまで拡張し、汚損性悲観的MLE (CR-PMLE) というアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:23:25 GMT)
I Need Help! Evaluating LLM's Ability to Ask for Users' Support: A Case Study on Text-to-SQL Generation [60.0]
性能改善とユーザ負担のトレードオフを評価する指標を提案する。実験の結果、外部からのフィードバックがなければ、多くのLCMは追加的なサポートの必要性を認識するのに苦労していることがわかった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:12:29 GMT)
From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems [59.4]
大規模言語モデル (LLM) は、物理世界の意思決定問題を解くことができる。このモデルの下で、LLM Plannerは、プロンプトを介して言語ベースのサブゴールを反復的に生成することにより、部分的に観測可能なマルコフ決定プロセス(POMDP)をナビゲートする。我々は,事前学習したLLMプランナーが,文脈内学習を通じてベイズ的集計模倣学習(BAIL)を効果的に行うことを証明した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:00:22 GMT)
$\infty$-Brush: Controllable Large Image Synthesis with Diffusion Models in Infinite Dimensions [58.4]
無限次元における新しい条件拡散モデル、制御可能な大画像合成のための$infty$-Brushを導入する。我々の知る限り、$infty$-Brushは関数空間における最初の条件拡散モデルであり、最大4096times4096$ピクセルの任意の解像度で画像を制御できる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:04:49 GMT)
Teach Harder, Learn Poorer: Rethinking Hard Sample Distillation for GNN-to-MLP Knowledge Distillation [56.9]
グラフニューラルネットワーク(GNN)と軽量マルチ層パーセプトロン(MLP) GNNto-MLP Knowledge Distillation (KD)は、よく訓練された教師であるGNNの知識を学生に蒸留することを提案する。本稿では,単純かつ効果的なGNN-to-MLP蒸留(HGMD)フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:13:00 GMT)
LongVLM: Efficient Long Video Understanding via Large Language Models [55.8]
LongVLMはビデオ理解のためのシンプルだが強力なビデオLLMである。ローカル情報とグローバル情報の両方を含むビデオ表現をエンコードする。我々のモデルは、長いビデオ理解のためのより正確な応答を生成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:17:00 GMT)
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit [55.7]
鍵圧縮技術である量子化は、大きな言語モデルを圧縮し、加速することにより、これらの要求を効果的に軽減することができる。本稿では,プラグアンドプレイ圧縮ツールキットであるLLMCについて,量子化の影響を公平かつ体系的に検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:29:51 GMT)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.3]
大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:19:58 GMT)
Long-Term Ad Memorability: Understanding & Generating Memorable Ads [54.2]
広告の記憶可能性に関する大規模な研究は行われていない。 276のブランドをカバーする1749の参加者と2205の広告からなる,最初の記憶可能性データセットであるLAMBDAをリリースする。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 04:23:44 GMT)
Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.2]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:42:24 GMT)
DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control [53.8]
人間の命令によって多様なタスクに熟練した汎用的なインテリジェントホームアシストエージェントを構築することは、AI研究の長期的青写真である。本研究では,具体的エージェントに対する原始的移動操作,すなわち指示された動詞と名詞のペアに基づいて,ナビゲートと対話の仕方について検討する。本研究では、文脈化されたシーンモデリングと効率的な制御における非自明な進歩を特徴とするdisCOを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:39:28 GMT)
EvaSurf: Efficient View-Aware Implicit Textured Surface Reconstruction on Mobile Devices [53.3]
モバイル端末に暗黙的テクスチャを付加したtextbfSurf$ace 再構成手法を提案する。提案手法は,合成と実世界の両方のデータセット上で,高品質な外観と正確なメッシュを再構築することができる。我々の方法は1つのGPUを使ってたった1～2時間でトレーニングでき、40FPS(Frames per second)以上のモバイルデバイス上で実行することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:28:09 GMT)
Generalizable Implicit Motion Modeling for Video Frame Interpolation [52.0]
フローベースビデオフレーム補間(VFI)における動きの重要性 General Implicit Motion Modeling (IMM)は、モーションモデリングVFIの新規かつ効果的なアプローチである。我々のGIMMは、既存のフローベースのVFIワークとスムーズに統合できます。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:34:55 GMT)
Overview of AI-Debater 2023: The Challenges of Argument Generation Tasks [51.7]
第2023回中国影響コンピューティング会議(CCAC 2023)におけるAI-Debater 2023チャレンジの結果を提示する。合計で32のチームがチャレンジに登録し、そこから11の応募をもらいました。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:13:54 GMT)
All Against Some: Efficient Integration of Large Language Models for Message Passing in Graph Neural Networks [51.2]
事前訓練された知識と強力なセマンティック理解能力を持つ大規模言語モデル(LLM)は、最近、視覚とテキストデータを使用してアプリケーションに恩恵をもたらす顕著な能力を示している。 E-LLaGNNは、グラフから限られたノード数を増やして、グラフ学習のメッセージパッシング手順を強化するオンデマンドLLMサービスを備えたフレームワークである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:09:42 GMT)
AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.1]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:28:16 GMT)
Modular Sentence Encoders: Separating Language Specialization from Cross-Lingual Alignment [50.8]
文埋め込みの言語間アライメントの訓練は、個々の言語の意味空間の最適な単言語構造を歪ませる。我々は、言語間の負の干渉を避けるために、言語固有の文エンコーダを訓練する。次に、英語以外のすべてのモノリンガルエンコーダを英語エンコーダにアライメントし、その上にクロスリンガルアライメントアダプタをトレーニングする。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:56:39 GMT)
Two Trades is not Baffled: Condensing Graph via Crafting Rational Gradient Matching [50.3]
大規模グラフの学習はグラフ表現学習において顕著な成果を上げてきたが、そのコストと記憶力の増大が懸念されている。そこで我々は,textbfCraftextbfTing textbfRationatextbf (textbfCTRL) という新しいグラフ手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:44:37 GMT)
PruningBench: A Comprehensive Benchmark of Structural Pruning [50.2]
textitPruningBenchと呼ばれる、構造的プルーニングのための最初の包括的なベンチマークを提示する。 PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。将来の刈り取り方法の実装を容易にするための実装が容易なインターフェースを提供し、その後の研究者が自身の作業をリーダボードに組み込めるようにします。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:56:31 GMT)
OMG: Occlusion-friendly Personalized Multi-concept Generation in Diffusion Models [47.6]
OMGは、単一のイメージ内に複数の概念をシームレスに統合するように設計されたフレームワークである。 OMGはマルチコンセプトパーソナライゼーションにおいて優れた性能を示す。 civitai.comのLoRAモデルは直接利用することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:56:18 GMT)
CrossDehaze: Scaling Up Image Dehazing with Cross-Data Vision Alignment and Augmentation [47.4]
画像デハジングの課題に対処するために,先行と深層学習に基づく手法が提案されている。本稿では,既存のデハージング手法を改善するために,内部および外部データ拡張の新しい手法を提案する。提案手法は, 実際のヘイズフリー画像に最も近いデハズド画像のデハズ化やデハズド画像の生成において, 他の先進的手法よりも著しく優れている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:00:20 GMT)
Progressive Multi-Modality Learning for Inverse Protein Folding [47.1]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。 MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:56:00 GMT)
Blind Image Deconvolution by Generative-based Kernel Prior and Initializer via Latent Encoding [46.4]
ブラインド画像符号化は、画像処理の分野では古典的だが難しい問題である。近年の深部画像先行法(DBID)の進歩は,a世代的アプローチを示す一連の手法を動機づけている。本稿では、事前モデリングをよりよく検討する新しい前世代的アプローチと、カーネルを曖昧にするための生成的アプローチを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:23:56 GMT)
CORT: Class-Oriented Real-time Tracking for Embedded Systems [46.3]
本研究は,マルチクラスオブジェクトトラッキングに対する新しいアプローチを提案する。トラッキング性能をペナルティ化することなく、より小さく予測可能な実行時間を実現することができる。提案手法は,異なるタイプの複数の対象を持つ複雑な都市シナリオにおいて評価された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:12:17 GMT)
An encryption algorithm using a generalization of the Markovski algorithm and a system of orthogonal operations based on T-quasigroups [45.7]
より正確には、中間準群に基づくT-準群に基づくこのアルゴリズムの実装を提案する。本稿では,T-準群に基づくアルゴリズムの実装について述べる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:38:07 GMT)
Temporal Residual Jacobians For Rig-free Motion Transfer [45.6]
データ駆動型モーショントランスファーを実現するための新しい表現としてResidual Temporal Jacobiansを紹介した。我々の手法は、リギングや中間形状へのアクセスを前提とせず、幾何学的かつ時間的に一貫した動きを発生させ、長い動き列の転送に利用できる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:29:22 GMT)
Orthogonal Hyper-category Guided Multi-interest Elicitation for Micro-video Matching [43.8]
マイクロビデオマッチングのためのOPALモデルを提案する。 OPALは、ユーザの多種多様な興味を引き出すために、複数のソフトおよびハードな関心の埋め込みを分離する。 OPALはリコールとヒット率の点で6つの最先端モデルを上回っている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:41:57 GMT)
Efficient Causal Graph Discovery Using Large Language Models [42.7]
提案するフレームワークはBFS (Broadth-first Search) アプローチを用いており,クエリの線形数のみを使用することができる。提案フレームワークは,時間とデータ効率の向上に加えて,様々なサイズの実世界の因果グラフに対して,最先端の結果を達成している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:51:58 GMT)
Trust No Bot: Discovering Personal Disclosures in Human-LLM Conversations in the Wild [40.6]
人間とチャットボットのインタラクションにおける個人の開示を測定することで、ユーザのAIリテラシーをよりよく理解することができる。我々は、実際のユーザが商用のGPTモデルに対して行った個人情報を詳細に分析する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:47:32 GMT)
Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.3]
Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:59:53 GMT)
Smooth Nash Equilibria: Algorithms and Complexity [38.1]
ナッシュ均衡の概念の根本的な欠点は、その計算的推論性である。 $sigma$-smooth Nash均衡では、プレイヤーは$sigma$-smooth戦略への最良の偏差よりも少なくとも高いユーティリティを達成する必要がある。弱いと強い$sigma$-smooth Nash平衡は、Nash平衡よりも優れた計算特性を持つことを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:39:44 GMT)
CodeV: Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4]
本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。 CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:18:15 GMT)
AGLLDiff: Guiding Diffusion Models Towards Unsupervised Training-free Real-world Low-light Image Enhancement [37.3]
本稿では,AGLLDiff (Atribute Guidance Diffusion framework) を提案する。 AGLLDiffはパラダイムをシフトし、通常光画像の露出、構造、色などの望ましい属性をモデル化する。我々の手法は、歪みベースのメトリクスと知覚ベースのメトリクスの点で、現在の非教師なしのLIEメソッドよりも優れています。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:17:48 GMT)
Step-by-Step Reasoning to Solve Grid Puzzles: Where do LLMs Falter? [36.1]
複雑度が異なる274のグリッドベースパズルからなる評価データセットであるGridPuzzleを開発した。第2に, GPT-4, Claude-3, Gemini, Mistral, Llama-2 など LLM の推論鎖を手動で解析した新しい誤り分類法を提案する。第3に、大規模主観的評価のためのLLMベースのフレームワーク(すなわち、誤りを特定する)と客観的な指標であるPuzzleEvalを開発し、推論連鎖の正しさを評価する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:43:07 GMT)
What Radio Waves Tell Us about Sleep [34.7]
本研究では、睡眠中の人から反射される電波からの睡眠と夜間呼吸を受動的にモニタリングする高度な機械学習アルゴリズムを開発した。睡眠時無呼吸(AUROC=0.88)を検知し,睡眠時無呼吸を検知した。このモデルは、睡眠段階と、神経、精神医学、循環器、免疫疾患を含む様々な疾患の間の情報的相互作用を明らかにする。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:38:37 GMT)
Diff-Reg v1: Diffusion Matching Model for Registration Problem [34.6]
既存の手法では、幾何学的あるいは意味的な特徴を利用して潜在的な対応を生成する。従来はシングルパス予測に頼っていた手法は、複雑なシナリオにおいて局所的なミニマと競合する可能性がある。本稿では,ロバスト対応推定のための拡散マッチングモデルを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:03:20 GMT)
Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning [34.3]
以前のデータにおけるビデオテキストペアは通常、完全に一致しないため、クロスモーダルなセマンティクスを正確に反映しないビデオ言語表現につながる可能性がある。完全類似性を達成するために, モーダル表現を正則化するために, 狭義の角辺を持つ対照的な対象を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:15:26 GMT)
Connecting Consistency Distillation to Score Distillation for Text-to-3D Generation [32.5]
本研究では, 整合蒸留理論とスコア蒸留理論を結合させることにより, 現行のスコア蒸留法を解析した。本稿では,これらの問題を緩和するための最適化フレームワークであるGCS( Guided Consistency Sampling)を3D Gaussian Splatting (3DGS)と統合して提案する。本稿では,この問題を緩和するために,BEG方式を3DGSレンダリングに導入する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:56:20 GMT)
Efficient Pre-training for Localized Instruction Generation of Videos [32.1]
手続きビデオはステップバイステップの指示を伝えるのに役立ちます。 Process Transformer (ProcX) は、プロシージャビデオのエンドツーエンドのステップローカライズと命令生成のためのモデルである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:55:37 GMT)
MetaAug: Meta-Data Augmentation for Post-Training Quantization [32.0]
トレーニング後の量子化(PTQ)は、完全な精度モデルを定量化するために、小さなキャリブレーションデータのみを必要とするため、大きな注目を集めている。本稿では,ポストトレーニング量子化の性能向上のためのメタラーニングに基づく新しい手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:18:51 GMT)
Text-based Talking Video Editing with Cascaded Conditional Diffusion [31.2]
テキストベースのトーキングヘッドビデオ編集は、音声ビデオのセグメントを効率的に挿入、削除、置換することを目的としている。これまでの作業では、会話ビデオのトレーニングデータの数分と、カスタマイズされた会話ビデオ編集のための高価なテストタイムの最適化が必要だった。本稿では,音声から高密度ランドマーク運動,動画への動きの2段階からなる,効率的なケースケード条件拡散に基づくフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:55:19 GMT)
Evaluating Large Language Models' Ability Using a Psychiatric Screening Tool Based on Metaphor and Sarcasm Scenarios [31.1]
アスペルガー症候群(Asperger syndrome)と呼ばれるこの症状を持つ子供たちは、皮肉を理解できないことが知られている。本研究では,近年の大規模言語モデルにおけるニュアンスド・ヒューマン・コミュニケーションの理解を評価するために標準化されたテストを用いた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:57:15 GMT)
Automated Patient Positioning with Learned 3D Hand Gestures [29.9]
本稿では,カメラを用いて手の動きを自動的に検出する自動位置決めシステムを提案する。我々のアプローチは、技術者のジェスチャーを認識し解釈するための、新しい多段階パイプラインに依存している。以上の結果から,本システムでは,最小限の技術介入で,正確かつ正確な患者の位置決めが可能であることが示唆された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:32:24 GMT)
Differential Privacy of Cross-Attention with Provable Guarantee [29.3]
クロスアテンションのプライバシセキュリティに対処するために,新たな差分プライバシ(DP)データ構造を設計する。我々の結果は、ユーザが意図的にクロスアテンションシステムに攻撃できる適応的なクエリに対して堅牢である。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:02:27 GMT)
Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL [29.0]
ソフトQ-ラーニングを利用した最適なプロンプトを見つけることを目的としたRLPromptを提案する。結果は有望な結果を示す一方で,プロンプトが不自然に現れることがしばしばあり,その解釈可能性を妨げることが確認されている。この制限をスパルス・ツァリスエントロピー正規化(英語版)を用いて解決する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:10:19 GMT)
Efficient Active Learning Halfspaces with Tsybakov Noise: A Non-convex Optimization Approach [28.5]
本稿では,効率的な能動学習を計算的にラベル付けする問題について検討する。本稿では, 近似値の証明を行う。構造化された未ラベルデータセットの1階定常光点。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:01:06 GMT)
PANDA: Expanded Width-Aware Message Passing Beyond Rewiring [28.0]
グラフ構造における"Over-squashing"は、長距離情報の伝播を妨げる。拡張ワイド・アウェア(PANDA)メッセージパッシングパラダイムを導入する。実験の結果,提案手法は既存の再配線法よりも優れていた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:44:32 GMT)
ProcessPainter: Learn Painting Process from Sequence Data [28.0]
画家の絵画の過程は本質的に段階的に変化しており、異なる画家や様式によって大きく異なる。従来のストロークベースのレンダリング手法は、画像をブラシストロークのシーケンスに分解するが、アーティストの真正なプロセスの複製には不十分である。 ProcessPainterは、最初は合成データに基づいて事前訓練され、その後、特定のアーティストの絵のシーケンスで微調整されるテキスト・ビデオ・モデルである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:23:19 GMT)
Early Detection of Coffee Leaf Rust Through Convolutional Neural Networks Trained on Low-Resolution Images [27.2]
コーヒー葉のさびは、真菌のHemileia vastatrixによって引き起こされた葉病であり、コーヒー生産にとって大きな脅威となる。早期疾患検出を強化するためのディープラーニングモデルは、広範囲な処理能力と大量のデータを必要とする。本稿では,高域通過フィルタを用いたトレーニング画像のコントラスト向上を目的とした前処理手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:24:25 GMT)
GaitMA: Pose-guided Multi-modal Feature Fusion for Gait Recognition [26.7]
歩行認識は、歩行パターンを通して人間の身元を認識する生体計測技術である。我々は、Gait Multi-model Aggregation Network (GaitMA)と呼ばれる新しい歩行認識フレームワークを提案する。まず, 2つのCNN特徴抽出器を用いて, シルエットと骨格の特徴を抽出した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:05:17 GMT)
Is Behavior Cloning All You Need? Understanding Horizon in Imitation Learning [26.5]
シミュレーション学習(Imitation Learning, IL)は、実演から学ぶことによって、連続的な意思決定タスクにおいて専門家の行動を模倣することを目的としている。オンライン行動クローニング(英語版) (BC) は、問題の地平線に好ましくない二次的依存を伴うサンプルの複雑さを引き起こすと考えられている。累積ペイオフの範囲が制御されるたびに、オフラインILにおいて水平非依存のサンプル複雑性を実現することができることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 23:31:56 GMT)
WiFaKey: Generating Cryptographic Keys from Face in the Wild [25.1]
生体計測からユニークな暗号鍵を導出することは、生体計測と誤り訂正符号の間に既存のノイズギャップがあるため、難しい課題である。本研究では,制約のない設定で顔から暗号鍵を生成するために,WiFaKeyという新しいバイオメトリック暗号システムを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:31:06 GMT)
Distributed Neural Representation for Reactive in situ Visualization [23.8]
Inlicit Neural representations (INR) は、大規模ボリュームデータを圧縮するための強力なツールとして登場した。分散ニューラル表現を開発し,それをその場での可視化に最適化する。我々の技術はプロセス間のデータ交換を排除し、最先端の圧縮速度、品質、比率を達成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:14:42 GMT)
Universally Harmonizing Differential Privacy Mechanisms for Federated Learning: Boosting Accuracy and Convergence [22.9]
ディファレンシャル・プライベート・フェデレーション・ラーニング(DP-FL)は協調モデルトレーニングにおいて有望な手法である。本稿では,任意のランダム化機構を普遍的に調和させる最初のDP-FLフレームワーク(UDP-FL)を提案する。その結果,UDP-FLは異なる推論攻撃に対して強い耐性を示すことがわかった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:11:59 GMT)
Exploring the Use of Abusive Generative AI Models on Civitai [22.5]
本稿では,AIGCソーシャルプラットフォームとして最大規模のCivitaiを用いて,乱用コンテンツの生成について検討する。 87Kモデルと2M画像を含む包括的データセットを構築した。これらのプラットフォームをよりよく管理するためのモデレーション戦略について議論する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:59:42 GMT)
Meta-GPS++: Enhancing Graph Meta-Learning with Contrastive Learning and Self-Training [22.5]
そこで我々はMeta-GPS++と呼ばれる少数ショットノード分類のための新しいフレームワークを提案する。まず,同好および異好のグラフ上での識別ノード表現を効率よく学習する手法を採用する。また、ラベルのないノードから貴重な情報を抽出するために自己学習を適用する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:05:12 GMT)
Hyperspectral Unmixing Under Endmember Variability: A Variational Inference Framework [22.1]
本研究は、終端変動(HU-EV)の存在下でのハイパースペクトルアンミックスのための変分推論フレームワークを提案する。 EV対応ノイズリニアミックスモデル (LMM) も検討し, モデルに外れ値の存在も考慮した。提案手法の有効性は, 合成, セミリアル, 実データ実験によって実証される。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:16:14 GMT)
RayFormer: Improving Query-Based Multi-Camera 3D Object Detection via Ray-Centric Strategies [22.0]
RayFormerはカメラにインスパイアされたクエリーベースの3Dオブジェクト検出器である。オブジェクトクエリは、各カメラ線に沿って、一様かつまばらに変換される。画像と鳥の視線の両方で特徴サンプリングポイントの分布を整理する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:23:57 GMT)
Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models [21.5]
ビデオ異常検出は、セキュリティ監視や自動運転といったアプリケーションには不可欠である。既存のVADメソッドは、検出の背後にある根拠をほとんど示さず、現実世界のデプロイメントに対する公衆の信頼を妨げる。本稿では,大言語モデルを用いたVADのためのルールベースの推論フレームワークであるAnomalyRulerを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:56:47 GMT)
DPI: Ensuring Strict Differential Privacy for Infinite Data Streaming [21.3]
クラウドソーシング分析、行動研究、リアルタイム監視といったアプリケーションにとって重要なデータストリーミングは、プライバシー上の重大なリスクに直面している。差分プライバシー(DP)という厳格なプライバシー概念を用いて、データストリームをリリースしようとする最近の取り組みは、プライバシー漏洩の問題に直面している。 Infinite Disclosure (DPI) 上での差分プライベートなデータストリーミングのための新しい手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:12:10 GMT)
Adapt2Reward: Adapting Video-Language Models to Generalizable Robotic Rewards via Failure Prompts [21.2]
一般的な報酬機能は、ロボットの強化学習と計画の中心である。本稿では,ロバストな一般化を伴う映像言語モデルを言語条件の報酬関数に変換する。本モデルは,ロボット計画と強化学習のための新しい環境と新しい指示に対する優れた一般化を示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:22:59 GMT)
Interacting Diffusion Processes for Event Sequence Forecasting [20.4]
拡散生成モデルを組み込んだ新しい手法を提案する。このモデルはシーケンス・ツー・シーケンスの予測を容易にし、過去のイベント・シーケンスに基づいた複数ステップの予測を可能にする。提案手法は,TPPの長期予測において,最先端のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:52:55 GMT)
Large-vocabulary forensic pathological analyses via prototypical cross-modal contrastive learning [20.4]
SongCiは、法医学的な病理学に特化して設計された革新的な視覚言語モデル(VLM)である。 SongCiは、高度なクロスモーダルな自己教師付きコントラスト学習を利用して、法医学解析の精度、効率、一般化性を向上させる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:34:52 GMT)
Difflare: Removing Image Lens Flare with Latent Diffusion Model [19.0]
レンズフレア除去のための新しいアプローチであるDifflareを紹介する。 PTDM(Pre-Trained Diffusion Models)による事前学習を活用するために,トレーニング可能な構造誘導モジュール(Structure Guidance Injection Module, SGIM)を導入する。遅延圧縮による情報損失に対処するために,適応的特徴融合モジュール(AFFM)を導入する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 04:36:39 GMT)
HRNet: Differentially Private Hierarchical and Multi-Resolution Network for Human Mobility Data Synthesization [19.0]
我々は,現実的な人間の移動データを合成するための新しい深層生成モデルである階層・多解ネットワーク(HRNet)を紹介した。まず、差分プライバシーの下で人間の移動データを学習する際の重要な困難を識別する。 HRNetは、階層的なロケーションエンコーディング機構、複数解像度にわたるマルチタスク学習、プライベート事前トレーニングの3つのコンポーネントを統合している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:06:26 GMT)
Symbol Preference Aware Generative Models for Recovering Variable Names from Stripped Binary [18.1]
逆コンパイルにおける顕著な課題は、変数名を復元することである。本稿では,モデルバイアスと潜在的幻覚を緩和しながら生成モデルの強みを利用する新しい手法を提案する。我々は、事前訓練された生成モデルCodeGemma-2BとCodeLlama-7BのプロトタイプGenNmを構築した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:44:17 GMT)
Operationalizing a Threat Model for Red-Teaming Large Language Models (LLMs) [17.7]
Red-teamingは、大規模言語モデル(LLM)の脆弱性を特定するテクニックである。本稿では,LLM に対するリピート攻撃に関する詳細な脅威モデルを提案し,知識の体系化(SoK)を提供する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:05:04 GMT)
Seal: Advancing Speech Language Models to be Few-Shot Learners [17.0]
本稿では,音声モデルの略語であるシールモデルを紹介する。フリーズ言語モデルデコーダでフリーズ音声学習者をブリッジするプロジェクタを訓練するために、Kulback-Leibler分散損失を行う新しいアライメント手法が組み込まれている。結果のSealモデルは、2つの音声理解タスクで数ショットのエンコーダとして頑健な性能を示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:28:12 GMT)
Technical report: Improving the properties of molecules generated by LIMO [16.7]
分子表現、デコーダモデル、代理モデルトレーニングスキームのアブレーティブな研究を行う。実験により,GroupSELFIESを用いた自己回帰トランスフォーマーデコーダが,ランダム生成タスクの最適平均特性を達成することが示唆された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:30:38 GMT)
ARoFace: Alignment Robustness to Improve Low-Quality Face Recognition [16.4]
本稿では、顔認識(FR)に適合した別の品質要因として、FAE(Face Alignment Errors)を考慮した手法を提案する。我々は、FRにおける微分可能な空間変換と逆データ拡張の組合せとして問題を定式化する。提案手法の利点をIJB-B, IJB-C, IJB-S, TinyFaceで評価することにより示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:58:41 GMT)
Dynamic Pricing and Learning with Long-term Reference Effects [16.1]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:14:42 GMT)
ClinicalAgent: Clinical Trial Multi-Agent System with Large Language Model-based Reasoning [16.0]
大規模言語モデル(LLM)とマルチエージェントシステムは、自然言語処理において顕著な能力を示しているが、臨床試験では課題に直面している。臨床用マルチエージェントシステムである臨床エージェントシステム(ClinicalAgent)について紹介する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:52:16 GMT)
On Simultaneous Information and Energy Transmission through Quantum Channels [15.4]
本稿では,キャパシティ・パワー関数の量子古典的類似点を紹介する。我々は、ノイズチャネルを介して古典情報を伝達するための古典情報理論で結果を一般化する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:15:01 GMT)
Intelligent Artistic Typography: A Comprehensive Review of Artistic Text Design and Generation [15.4]
アーティスティックテキスト生成は、可読性を維持しながら、テキストの美的品質を増幅することを目的としている。芸術的なテキストスタイリングは、影、輪郭、色、光、テクスチャなど、テキスト上のテキスト効果に重点を置いている。 Stylistizationは文字の変形に焦点を当て、テキスト内の意味的理解を模倣することで視覚的表現を強化する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:45:09 GMT)
Lightweight Countermeasures Against Static Power Side-Channel Attacks [14.0]
本稿では,静的パワーサイドチャネル攻撃(PSCA)に対する新たな防御戦略を提案する。 PSCAは暗号セキュリティにとって重要な脅威である。商用28nmノードを用いた実験結果から,攻撃に要する労力の大幅な増加が示唆された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:23:24 GMT)
Dual High-Order Total Variation Model for Underwater Image Restoration [13.8]
水中画像の高画質化と復元(UIER)は,水中画像の画質向上のための重要な手段である。拡張水中画像形成モデル(UIFM)に基づく効果的な変分フレームワークを提案する。提案フレームワークでは,重み係数に基づく色補正とカラーバランスを組み合わせることで,減衰した色チャネルを補償し,色キャストを除去する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:06:37 GMT)
GPU-accelerated Evolutionary Multiobjective Optimization Using Tensorized RVEA [13.3]
本稿では,GPUアクセラレーションの進歩を活用するために,大規模な進化的参照ベクトルガイドアルゴリズム(TensorRVEA)を提案する。大規模集団と問題次元を含む数値ベンチマークテストでは、RVEAは一貫して高い計算性能を示し、1000ドル以上のスピードアップを達成している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:51:42 GMT)
Transformer-based RGB-T Tracking with Channel and Spatial Feature Fusion [13.0]
クロスモーダルチャネルと空間的特徴を直接融合することにより、視覚変換器の性能を向上させる方法を示す。 CSTNetは3つの公開RGB-T追跡ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:17:11 GMT)
EarthMarker: Visual Prompt Learning for Region-level and Point-level Remote Sensing Imagery Comprehension [13.0]
EarthMarkerと呼ばれる最初の視覚的プロンプトモデルが提案され、画像レベル、領域レベル、ポイントレベルRSの解釈に優れる。多様な多粒度視覚知覚能力を持つEarthMarkerを実現するために、クロスドメイン位相学習戦略を開発した。 RSの視覚的プロンプトデータの欠如に対処するため、マルチモーダルな視覚的プロンプト命令を備えたRSVPというデータセットを構築した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:20:28 GMT)
PASSION: Towards Effective Incomplete Multi-Modal Medical Image Segmentation with Imbalanced Missing Rates [12.8]
不均衡な欠落率下での不完全なマルチモーダル医用画像分割のためのPreference-Aware Self-diStillations (PASSION)を提案する。 PASSIONは、異なるバックボーン間で一貫したパフォーマンス改善のためのプラグイン・アンド・プレイモジュールとして機能することが検証されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:53:20 GMT)
Improving EEG Classification Through Randomly Reassembling Original and Generated Data with Transformer-based Diffusion Models [12.7]
本稿では,トランスフォーマーを用いた拡散確率モデルと生成データに基づくデータ拡張手法を提案する。脳波信号の特徴として,信号の事前処理を行う定数要素スケーリング手法を提案する。提案手法は,生成したデータを時間領域の原データでランダムに再集合し,ビジナルデータを取得する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:58:14 GMT)
FairViT: Fair Vision Transformer via Adaptive Masking [12.6]
Vision Transformer (ViT) は優れた性能を発揮し、様々なコンピュータビジョンタスクにおいて有望な可能性を実証している。しかし、ほとんどの ViT ベースの作品は公平性を考慮しておらず、CNN 指向の debiased アルゴリズムを直接 ViT に適用できるかどうかは不明である。提案するFairViTは,新しい正確かつ公平なViTフレームワークである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:10:37 GMT)
Falcon2-11B Technical Report [12.5]
5兆以上のトークンでトレーニングされた基盤モデルであるFalcon2-11Bと、ビジョン・トゥ・テキストモデルであるFalcon2-11B-vlmを紹介する。我々は,多段階アプローチによるFalcon2-11Bの訓練中に得られた知見を報告する。また,学習期間中のバッチサイズを倍増させる効果と,学習率によるトレーニング損失のスパイクの影響を報告する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:23:15 GMT)
Representing Topological Self-Similarity Using Fractal Feature Maps for Accurate Segmentation of Tubular Structures [12.0]
本研究では,FDをピクセルレベルまで拡張することにより,フラクタル特徴を深層学習モデルに組み込む。得られたフラクタル特徴写像(FFM)はモデルへの追加入力と損失関数の重み付けとして組み込まれる。 5つの管状構造データセットの実験は、我々のアプローチの有効性とロバスト性を検証する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:22:59 GMT)
Influencer: Empowering Everyday Users in Creating Promotional Posts via AI-infused Exploration and Customization [11.9]
Influenは、初心者クリエイターが高品質なプロモーションポストデザインを作るのを助けるインタラクティブなツールだ。インフルエンサー内では,ユーザが直感的に新しいアイデアを生成できる多次元レコメンデーションフレームワークをコントリビュートする。 Influentialは、コンテキスト認識の画像とキャプション探索をサポートする総合的なプロモーションポストデザインシステムを実装している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:27:49 GMT)
Denoising Long- and Short-term Interests for Sequential Recommendation [11.8]
LSIDN(Long-term Interest Denoising Network)を提案する。我々は,長期金利モデルにセッション間行動ノイズを導入することを避けるために,セッションレベルの関心抽出と進化戦略を採用している。 2つの公開データセットによる実験の結果、LSIDNは最先端モデルよりも一貫して優れていた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:52:14 GMT)
Data Sharing for Mean Estimation Among Heterogeneous Strategic Agents [11.4]
通常の分布からサンプルを収集することにより,$m$エージェントがベクトル$muinmathbbRd$を推定する協調学習問題について検討する。独自の作業を行う代わりに、エージェントはコストの安いデータを収集し、それと引き換えに他のデータと共有することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:45:40 GMT)
Can MLLMs Perform Text-to-Image In-Context Learning? [11.3]
テキスト・ツー・イメージ ICL (T2I-ICL) の特徴と潜在的な用途はいまだ検討されていない。我々は6つの最先端マルチモーダル言語モデル(MLLM)をベンチマークする。我々は、主な課題を、マルチモーダルと画像生成の固有の複雑さとして認識し、微調整やチェーン・オブ・ソートのような戦略がこれらの困難を緩和する助けとなることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:52:29 GMT)
GreenStableYolo: Optimizing Inference Time and Image Quality of Text-to-Image Generation [11.1]
GreenStableYoloはパラメータを改善し、Stable DiffusionがGPU推論時間を短縮し、NSGA-IIとYoloを使用して画像生成品質を向上させるように促す。画像品質はStableYolo(画像品質のみを考慮)に比べ,画像品質のトレードオフが比較的小さい(18%)にもかかわらず,GreenStableYoloは推論時間(266%)を大幅に短縮し,526%の高ボリュームを実現している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:14:24 GMT)
Thompson Sampling Itself is Differentially Private [10.9]
まず、マルチアームバンディットに対する古典的なトンプソンサンプリングアルゴリズムは、変更することなく、差分的にプライベートであることを示す。次に、すべてのアームを一定回数プレプルするといった単純な修正が、より厳格なプライバシー保証を提供することを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:01:03 GMT)
Improving Citation Text Generation: Overcoming Limitations in Length Control [10.6]
引用テキスト生成の鍵となる課題は、生成されたテキストの長さがターゲットの長さとしばしば異なり、生成の質が低下することである。本研究では,科学的引用文の長さ予測の限界について詳細な研究を行い,所望の長さの推定値の利用について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:10:37 GMT)
CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting [10.3]
群集密度予測タスクは,過去の群集密度マップから今後,群集密度マップがどのように変化するかを予測することを目的としている。過去の群衆密度マップは、歩行者のミス検出のため、しばしば不完全である。本稿では,クラウド密度予測(CrowdMAC)のためのMAsked crowd density Completionフレームワークを提案する。 CrowdMACは、部分的に隠された過去の群衆密度マップから、将来の群衆密度マップを予測するために同時に訓練されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:18:43 GMT)
A Tale of Single-channel Electroencephalogram: Devices, Datasets, Signal Processing, Applications, and Future Directions [10.2]
単一チャネル脳波(英: Single- Channel Electroencephalogram、EEG)は、脳活動を監視するための費用効率が高く、快適で非侵襲的な方法である。本稿では,開発動向,デバイス,データセット,信号処理方法,最近の応用,今後の方向性について論じる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:36:17 GMT)
ActionDiffusion: An Action-aware Diffusion Model for Procedure Planning in Instructional Videos [10.2]
ActionDiffusionは、講義ビデオにおけるプロシージャ計画のための新しい拡散モデルである。本手法は,行動間の時間的依存関係の学習と拡散過程における行動計画の認知を統一する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:55:05 GMT)
Recent Advances in Generative AI and Large Language Models: Current Status, Challenges, and Perspectives [10.2]
生成人工知能(AI)と大規模言語モデル(LLM)の出現は、自然言語処理(NLP)の新しい時代を象徴している。本稿では,これらの最先端技術の現状を概観し,その顕著な進歩と広範囲な応用を実証する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:48:35 GMT)
VITS : Variational Inference Thompson Sampling for contextual bandits [10.0]
我々は、文脈的帯域幅に対するトンプソンサンプリング(TS)アルゴリズムの変種を導入・解析する。ガウス変分推論に基づく新しいアルゴリズムであるValational Inference Thompson sample VITSを提案する。我々は,VITS が線形文脈帯域に対して従来の TS の次元とラウンド数で同じ順序のサブ線形後悔境界を達成することを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:38:26 GMT)
FedDM: Enhancing Communication Efficiency and Handling Data Heterogeneity in Federated Diffusion Models [9.6]
FedDMは拡散モデルの連合トレーニング用に設計された新しいトレーニングフレームワークである。拡散モデルのバックボーンとしてU-Netアーキテクチャを利用するトレーニングアルゴリズムの組を提案する。 DDPMのFashionMNIST (28x28解像度), CIFAR-10 (32x32解像度), CelebA (64x64解像度), LDMのLSUN Church Outdoors (256x256解像度)について検討した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:54:41 GMT)
Reduced Effectiveness of Kolmogorov-Arnold Networks on Functions with Noise [9.5]
データセットのノイズは、Kolmogorov-Arnoldネットワークの性能を著しく低下させる。ノイズの影響を軽減するため,重畳法と重畳法を組み合わせたオーバーサンプリング手法を提案する。オーバーサンプリングとフィルタリングの両方の手法を適用することで、ノイズの有害な影響を低減できると結論付けている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:17:10 GMT)
Heterogeneous Peridynamic Neural Operators: Discover Biotissue Constitutive Law and Microstructure From Digital Image Correlation Measurements [9.1]
データ駆動型モデリングのためのヘテロPNO (HeteroPNO) アプローチを提案する。我々のゴールは、不均一繊維配向場という形で、材料微細構造とともに非局所法則を学ぶことである。その結果、ヘテロPNOアーキテクチャーは異方性ヘテロジニアス応答変形機構を持つ組織のモデルを学ぶことができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:57:06 GMT)
A New Dataset and Framework for Real-World Blurred Images Super-Resolution [9.1]
我々は,Real-world Blur-kept Super-Resolution (ReBlurSR) データセットという,ぼやけた画像に適した新しい超解像データセットを開発した。本稿では,Cross Disentanglement Module (CDM) とCross Fusion Module (CFM) の2つの主要モジュールからなるPerceptual-Blur-adaptive Super-Resolution (PBaSR)を提案する。これら2つのモジュールを統合することで、PBaSRは、追加の推論やデプロイメントコストを伴わずに、一般的なデータと曖昧なデータの両方でコメンタブルなパフォーマンスを実現する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:07:03 GMT)
Constrained Decoding for Secure Code Generation [9.0]
本稿では、コードLLMがセキュアかつ正しいコードを生成する能力を測定するための新しいベンチマークであるCodeGuard+を紹介する。我々は,現在最先端の防御技術であるプレフィックスチューニングが,セキュアなコードを生成するが機能的正当性を犠牲にしているため,従来考えられていたほど強力ではないことを示す。セキュアなコードを生成するための制約付き復号法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:14:03 GMT)
Do Generative AI Models Output Harm while Representing Non-Western Cultures: Evidence from A Community-Centered Approach [8.8]
本研究では,生成人工知能(GAI)モデル,特にテキスト・ツー・イメージ・ジェネレータ(T2Is)が非西洋文化の表現に与える影響について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:01:37 GMT)
Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.8]
本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:34:20 GMT)
Noise-Tolerant Unsupervised Adapter for Vision-Language Models [8.6]
NtUAは、雑音耐性のない教師なし適応器で、非競合なターゲットサンプルをほとんど持たない効果的なターゲットモデルの学習を可能にする。 NtUAは、視覚的特徴を定式化したキー値キャッシュとして機能し、少数の未ラベルのターゲットサンプルの擬似ラベルをキー値ペアとして予測する。 NtUAは、広く採用されている複数のベンチマークにおいて、一貫して優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:47:40 GMT)
SE(3)-bi-equivariant Transformers for Point Cloud Assembly [8.3]
一対の点雲が与えられた場合、アセンブリの目標は、一方の点雲ともう一方の点雲を整合させる厳密な変換を回復することである。このタスクは、点雲がオーバーラップされない可能性があり、任意の初期位置を持つため、難しい。 BITR (SE(3)-bi-equivariant transformer) という手法を提案する。入力が厳格に摂動されると、出力がそれに従って変換されることを保証する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:04:40 GMT)
RepNeXt: A Fast Multi-Scale CNN using Structural Reparameterization [8.3]
軽量畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、パラメータ効率と低レイテンシに好まれる。本研究では,資源拘束型アプリケーションに適した多目的視覚バックボーンを開発するために,CNNとViTの相補的な利点について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:45:15 GMT)
Flatness-aware Sequential Learning Generates Resilient Backdoors [8.0]
近年、バックドア攻撃は機械学習モデルのセキュリティに対する新たな脅威となっている。本稿では,連続学習(CL)技術を活用して,バックドアのCFに対処する。レジリエントなバックドアを生成可能な,SBL(Sequential Backdoor Learning)という新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:30:05 GMT)
Auxiliary task discovery through generate-and-test [7.8]
補助的なタスクは、エージェントに補助的な予測と制御目的を学習させることで、データ効率を向上させる。本稿では,表現学習のアイデアに基づく強化学習における補助的タスク発見へのアプローチについて検討する。本研究は,これらの特徴が主課題にどの程度有用かに基づいて,補助課題の有用性を示す新しい尺度を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:54:39 GMT)
Strongly Isomorphic Neural Optimal Transport Across Incomparable Spaces [7.5]
本稿ではGromov-Monge問題の基本的性質の1つに根ざした新しいニューラルな定式化について述べる。学習可能なOTマップを2つのコンポーネントに分解することで、この特性を運用する。我々のフレームワークは、様々な空間にわたるOTマップを学習するための有望なアプローチを提供する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:27:11 GMT)
BiasAlert: A Plug-and-play Tool for Social Bias Detection in LLMs [7.3]
BiasAlertは、LLM(Large Language Models)のオープンテキスト世代における社会的バイアスを検出するために設計されたプラグアンドプレイツールである。外部の人間の知識と固有の推論能力を統合し、バイアスを確実に検出する。大規模な実験により、BiasAlertはGPT4-as-A-Judgeのような最先端の手法でバイアスを検出するのに優れていた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:59:46 GMT)
RGB2Point: 3D Point Cloud Generation from Single RGB Images [7.0]
RGB2Pointは、Transformerをベースにした3Dポイントクラウド生成のための、未提示のシングルビューRGBイメージである。本実装では,SOTA拡散モデルよりも15,133倍高速に結果を生成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:06:33 GMT)
Latent Conditional Diffusion-based Data Augmentation for Continuous-Time Dynamic Graph Model [6.9]
連続時間動的グラフ(CTDG)は、現実世界の関係を正確にモデル化する。既存のCTDGモデルは、ノイズと限られた歴史的データから生じる課題に直面する。我々はCTDGに適した遅延拡散に基づくグラフデータ拡張法であるCondaを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:44:09 GMT)
Fusion of Movement and Naive Predictions for Point Forecasting in Univariate Random Walks [6.9]
方法はランダムウォークの変種定義から導かれ、将来の値に対するランダムなエラー項は、方向記号で乗算された正のランダムなエラーとして表現される。 0.55のような中程度の運動予測精度で、ナイーブ予測を確実に上回る。正確な点予測が難しいが、正確な運動予測が可能である場合、特に有利である。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:52:02 GMT)
Political Leanings in Web3 Betting: Decoding the Interplay of Political and Profitable Motives [6.5]
我々は、Web3予測市場における賭けに基づく政治的傾きを測定するために、PBLS(Political Betting Leaning Score)を構築した。我々は4,500のイベントと8,500の市場にわたる15,000以上のアドレスを合成し、彼らの政治的傾きの強さと方向性を米国が捉えている。本研究は,分散市場における意思決定の理解に寄与し,Web3予測環境における行動分析の強化に寄与する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:17:19 GMT)
Strategic Coupon Allocation for Increasing Providers' Sales Experiences in Two-sided Marketplaces [6.3]
プラットフォーム上での販売経験を積む成功したプロバイダの数を増やすために、パーソナライズされたプロモーションを提案する。このアプローチを利用することで、少数のプロバイダによって独占されることなく、販売を経験する機会を同程度に確保します。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:55:12 GMT)
Decoupled Prompt-Adapter Tuning for Continual Activity Recognition [6.2]
アクション認識技術は、監視システムを通じたセキュリティ向上、医療における患者監視の改善、製造業や補助技術といった分野におけるシームレスな人間とAIのコラボレーションを促進する上で、重要な役割を担っている。 Decoupled Prompt-Adapter Tuning (DPAT) は、空間的時間的情報を取得するためのアダプタを統合する新しいフレームワークであり、デカップリングトレーニング戦略を通じて破滅的な忘れを軽減するための学習可能なプロンプトである。 DPATは、いくつかの挑戦的なアクション認識ベンチマークにおいて、常に最先端のパフォーマンスを達成し、連続的なアクション認識の領域における我々のモデルの有効性を実証する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:56:04 GMT)
FMamba: Mamba based on Fast-attention for Multivariate Time-series Forecasting [6.2]
多変量時系列予測(MTSF)のためのFMambaという新しいフレームワークを導入する。技術的には、まず、埋め込み層を介して入力変数の時間的特徴を抽出し、次に高速アテンションモジュールを介して入力変数間の依存関係を計算する。多層パーセプトロンブロック(MLP-block)を通して入力特徴を選択的に扱い、変数の時間的依存関係を抽出する。最後に、FMambaは、線形層であるプロジェクターを通して予測結果を得る。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:14:05 GMT)
Simulation of integrated nonlinear quantum optics: from nonlinear interferometer to temporal walk-off compensator [6.1]
本稿では, 断熱導波路, 材料異方性, 線形光学部品, 光子損失, 検出器などの様々な特徴を正確にモデル化できる非線形量子フォトニクスシミュレーションフレームワークを提案する。提案手法は,光子対波源のスクイーズパラメータと量子周波数変換器の変換効率を,ポンプ出力に頼らずに向上させることができることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:15:26 GMT)
CoCoG-2: Controllable generation of visual stimuli for understanding human concept representation [6.1]
本稿では,生成した視覚刺激を類似性判定タスクに統合するCoCoG-2という新しいフレームワークを提案する。 CoCoG-2は、トレーニング不要誘導アルゴリズムを使用して、生成の柔軟性を向上させる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:52:32 GMT)
ECRTime: Ensemble Integration of Classification and Retrieval for Time Series Classification [6.1]
112のUCRデータセットに対する実験結果から、ECRは既存のディープラーニングベースの手法と比較して最先端(ソータ)であることが示された。 ECRTimeは、現在最も正確なディープラーニング分類器であるInceptionTimeを精度で上回っている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:17:23 GMT)
Economy Watchers Survey provides Datasets and Tasks for Japanese Financial Domain [5.9]
中央政府機関が発行する資料を用いて,2つの大規模データセットを構築した。データセットは3つの日本の金融NLPタスクを提供する。私たちのデータセットは包括的で最新のように設計されており、自動更新フレームワークを活用しています。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:35:14 GMT)
Bag of Tricks to Boost Adversarial Transferability [5.8]
ホワイトボックス設定で生成された逆例は、しばしば異なるモデル間で低い転送可能性を示す。そこで本研究では,既存の敵攻撃の微妙な変化が攻撃性能に大きく影響することを発見した。既存の敵攻撃の綿密な研究に基づいて、敵の移動性を高めるためのトリックの袋を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:11:22 GMT)
Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities [5.6]
MRIの脳病変のモデルは通常、特定の疾患のために開発され、事前に定義されたMRIモダリティのセットでデータに基づいて訓練される。それぞれのモデルでは、MRIの異なるデータを使って疾患を分類することはできないし、他の種類の疾患も分類できない。我々は、フェデレートラーニングフレームワークが、トレーニング中に見られるすべての疾患の分類において非常に有望な、単一のモデルをトレーニングできることを示します。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:09:46 GMT)
OTCE: Hybrid SSM and Attention with Cross Domain Mixture of Experts to construct Observer-Thinker-Conceiver-Expresser [5.4]
我々は、より生体模倣的なアイデアを持つ新しいアーキテクチャ、Observer-Thinker-Conceiver-Expresser (OTCE)を提案する。 OTCEは、有名な中規模のオープンソース言語モデルと、小規模の言語モデリングタスクで競合することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:35:45 GMT)
Gaussian Stochastic Weight Averaging for Bayesian Low-Rank Adaptation of Large Language Models [5.4]
細調整された大規模言語モデル(LLM)は、しばしば過剰な自信とキャリブレーションに悩まされる。本稿では,Low-Rank Adaptation (LoRA) とGaussian Weight Averaging (SWAG) を組み合わせた簡単な組み合わせを提案する。本手法は,配電系統における配電系統の性能向上を反映して,配電系統の配電系統変更に対するロバスト性が高いことを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 04:36:27 GMT)
Differentiating Through Integer Linear Programs with Quadratic Regularization and Davis-Yin Splitting [5.2]
問題となるのがリニアプログラム(ILP)である場合について検討する。結果のスキームが最近導入されたヤコビ自由バックプロパゲーション(JFB)と互換性があることを証明する。提案手法は, 最短経路問題とクナップサック問題という2つの代表的なICPに対する実験により, 前方パス上のこの組み合わせDYS, 後方パス上のJFBが, 既存のスキームよりも高次元問題に対してより効果的にスケールするスキームを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:49:12 GMT)
RoIPoly: Vectorized Building Outline Extraction Using Vertex and Logit Embeddings [5.1]
航空画像や衛星画像から建物概要を抽出する新しいクエリベースの手法を提案する。クエリとして各ポリゴンを定式化し、潜在的ビルディングの最も関連性の高い領域に対してクエリの注意を拘束する。本手法は,2次元フロアプラン再構築データセットであるStructured3Dを用いて,ベクトル化建物アウトライン抽出データセット(CrowdAI)と2次元フロアプラン再構築データセット(Structured3D)について評価する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:12:51 GMT)
Applicability of Large Language Models and Generative Models for Legal Case Judgement Summarization [5.1]
近年,抽象的な要約モデルやLarge Language Model (LLM) などの生成モデルが広く普及している。本稿では,判例判断要約におけるそのようなモデルの適用性について検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:50:41 GMT)
JaFIn: Japanese Financial Instruction Dataset [4.8]
本研究は,命令チューニングによる領域適応の有効性を実証する。本研究では,日本語金融分野における大規模言語モデル(LLM)の指導データセットを構築した。次に、 JaFIn を用いて、複数の LLM に対して命令チューニングを適用し、金融に特化したモデルが元のモデルよりもドメイン適応性が高いことを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:27:52 GMT)
TrustRate: A Decentralized Platform for Hijack-Resistant Anonymous Reviews [4.8]
私たちはTrustRateを紹介します。これは、真正、匿名、改ざん防止レビューのための、エンドツーエンドの分散、ハイジャック耐性プラットフォームです。数千のノード規模のプロトタイプの実装と評価により、当社のプラットフォームの有効性と性能を実証する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:59:25 GMT)
TraveLLM: Could you plan my new public transit route in face of a network disruption? [4.6]
我々は,大規模言語モデル(LLM)に依存するディスラプションに直面して公共交通機関のルーティングを計画するプロトタイプTraveLLMを開発した。各種のテストケースは、さまざまな気象条件、緊急イベント、新しい交通サービスの導入など、さまざまなシナリオで設計されている。比較分析により, LLM, 特に GPT-4 がナビゲーション計画に有効であることが示された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:25:34 GMT)
Gauges and Accelerated Optimization over Smooth and/or Strongly Convex Sets [4.5]
我々は、滑らかかつ/または強い凸集合上で定義される実現可能性および制約付き最適化問題を考察する。これらの設定において,新しい拡張性,プロジェクションフリー,アクセラレーションファーストオーダー手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:09:10 GMT)
Subgraph Clustering and Atom Learning for Improved Image Classification [4.5]
本稿では,特徴抽出のための畳み込みニューラルネットワーク(CNN)と構造モデリングのためのグラフニューラルネットワーク(GNN)の長所を融合した,新しいハイブリッド画像分類モデルであるグラフサブグラフネットワーク(GSN)を提案する。 GSNはk平均クラスタリングを使用してグラフノードをクラスタにグループ化し、サブグラフの作成を容易にする。これらの部分グラフを使用して、辞書学習のための代表原子を学習し、スパースでクラス区別可能な特徴の識別を可能にする。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:32:00 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3]
大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。 LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:50:34 GMT)
Unveiling the Decision-Making Process in Reinforcement Learning with Genetic Programming [4.2]
不理解性は、現実世界で(深い)強化学習を使用するための選択肢ではない。我々は、すでに訓練されたエージェントの意思決定プロセスの説明を生成するための遺伝的プログラミングフレームワークを提案する。私たちは性能に匹敵するが、ハードウェアリソースや計算時間を大幅に削減する必要があることを示しています。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:45:03 GMT)
Post-Measurement Pairing Quantum Key Distribution with Local Optical Frequency Standard [4.2]
測定後偶然のペアリングにより、ユーザのレーザーの差分位相を追跡する必要がなくなる。セットアップのリピータライクな動作を確認し,504km以上のファイバで15.94ビット/秒の有限サイズセキュアキーレート(SKR)を達成する。我々の研究は、局所周波数標準による効率的なミューティユーザ量子ネットワークへの道を開くものである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:26:05 GMT)
Self-supervised transformer-based pre-training method with General Plant Infection dataset [4.0]
本研究では、コントラスト学習とマスクド画像モデリング(MIM)を組み合わせた高度なネットワークアーキテクチャを提案する。提案するネットワークアーキテクチャは,植物害虫や病原体認識タスクに対処し,優れた検出精度を実現する。私たちのコードとデータセットは、植物害虫の研究と病気の認識を促進するために公開されます。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:48:35 GMT)
Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base [3.9]
ゴールデン・レトリバーは、広大な産業知識基地を効率的に航行するように設計されている。 Golden-Retrieverは、ドキュメント検索の前に、リフレクションベースの質問強化ステップを組み込む。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:10:46 GMT)
Discrimination of bosonic dephasing quantum channels [3.7]
本研究では,2つのボソニックデフォーカス量子チャネルの識別の可能性について検討する。入力エネルギー制約が存在する場合、誤差確率の上限を導出する。我々は、これらの結果を単発から複数発の識別に拡張し、振る舞いを精査する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:01:03 GMT)
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages [3.7]
本稿では,大規模言語モデル (LLM) における機械翻訳 (MT) における2つの課題に対処するために,コントラッシブアライメント命令 (MT Instruct) を導入する。 1つは、サポート対象の言語を、これまで見つからなかった言語に拡張することである。もう1つは、低リソース言語におけるデータの欠如に関連している。 BLOOMZモデルを微調整した結果,(1)LLMはMTInstructを用いて効果的に未確認言語を翻訳できる,(2)識別器に基づく命令は,生成言語を言語間命令として優れ,(4)AlignInstructは30のゼロショット方向のパフォーマンスを改善した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:13:38 GMT)
MixLoRA: Enhancing Large Language Models Fine-Tuning with LoRA-based Mixture of Experts [3.6]
MixLoRAは、リソース効率の良いスパースMoEモデルを構築するためのアプローチである。評価の結果,MixLoRAはマルチタスク学習シナリオにおける最先端PEFT法と比較して約9%精度が向上していることがわかった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:26:49 GMT)
Realistic Surgical Image Dataset Generation Based On 3D Gaussian Splatting [3.5]
本研究は, 合成外科用データセットを生成するために3次元ガウススプラッティングを用いた新しい手法を提案する。手術現場でツールやカメラのポーズとともに画像を取得することのできるデータ記録システムを開発した。このポーズデータを用いて、シーンを合成的に再現し、合成画像の品質を直接比較できるようにする。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:20:07 GMT)
FedPartWhole: Federated domain generalization via consistent part-whole hierarchies [3.2]
Federated Domain Generalization (FedDG)は、テスト時に見えないドメインに一般化するという課題に取り組むことを目的としている。本稿では、バックボーンモデルアーキテクチャの観点から、この問題に対処するフェデレーションドメイン一般化に対する新しいアプローチを提案する。提案手法は,パラメータが少ないにもかかわらず,比較可能なサイズの畳み込みアーキテクチャを12%以上向上させる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:43:52 GMT)
A2E: Attribute-based Anonymity-Enhanced Authentication for Accessing Driverless Taxi Service [3.2]
本稿では,A2E(Attribute-based Anonymity Enhanced)認証方式を提案する。セキュリティ面から、A2Eは属性検証可能性を持ち、再実行可能なシグネチャに基づいてユーザ属性クレデンシャルを設計することで達成される。さらに、A2Eは、リングシグネチャとシークレット共有を利用した分散型認証発行機構を設計し、匿名性を向上した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 04:51:51 GMT)
MedMAE: A Self-Supervised Backbone for Medical Imaging Tasks [3.1]
本稿では,Masked Autoencoderと呼ばれる自己教師付き学習技術を用いて,医療画像の大規模未ラベルデータセットとバックボーンを事前訓練する。このバックボーンは、様々な種類の医療画像の視覚的表現を学ぶために訓練されるため、あらゆる医療画像タスクの事前訓練されたモデルとして使用することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:29:04 GMT)
Mapping the Unseen: Unified Promptable Panoptic Mapping with Dynamic Labeling using Foundation Models [3.1]
本稿では,UPPM法について述べる。 UPPMは、従来のパン光学マッピング技術に動的ラベリング戦略を取り入れている。その結果、UPPMは、リッチなセマンティックラベルを生成しながら、シーンやセグメントオブジェクトを正確に再構築できることがわかった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:41:53 GMT)
Software Companies Responses to Hybrid Working [3.1]
本研究では,ハイブリッドワークに対するソフトウェア企業の対応について検討する。その結果, 個人, 組織レベルでは, 負の反応よりも高い正の反応が認められた。その結果, ハイブリッドワークは, 新型コロナウイルス19の波によって信頼性が増した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:12:28 GMT)
Eikonal Approximation for Floquet Scattering [3.0]
アイコナール近似(EA)は様々な高エネルギー散乱問題で広く用いられている。本研究では、時間非依存ハミルトニアンの散乱問題から周期ハミルトニアンの散乱問題への近似を一般化する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:14:04 GMT)
Universal Medical Imaging Model for Domain Generalization with Data Privacy [2.9]
本稿では,複数の局所モデルからグローバルモデルへ知識を伝達するフェデレート学習手法を提案する。主な目的は、幅広い医療画像タスクを実行できるグローバルモデルを訓練することである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:24:15 GMT)
From Ad Identifiers to Global Privacy Control: The Status Quo and Future of Opting Out of Ad Tracking on Android [2.8]
2013年以降、Googleはユーザーがシステム設定でAndroidの広告追跡を制限することを許可している。アプリはGPC(Global Privacy Control)の下で広告追跡からオプトアウトを尊重しなければならない分析の結果,AndroidシステムレベルのオプトアウトとGPC信号の両方が広告追跡を制限することは滅多にないことがわかった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:06:23 GMT)
Not Only Rewards But Also Constraints: Applications on Legged Robot Locomotion [2.7]
本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:50:22 GMT)
Out of spuriousity: Improving robustness to spurious correlations without group annotations [2.6]
本稿では,突発的相関に依存しない完全トレーニングネットワークからサブネットワークを抽出する手法を提案する。提案手法の最悪のグループ性能の増加は、完全に訓練された高密度ネットワークにサブネットワークが存在するという仮説の強化に寄与する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 20:24:14 GMT)
Base and Exponent Prediction in Mathematical Expressions using Multi-Output CNN [2.4]
本研究は、多出力畳み込みニューラルネットワーク(CNN)を用いた数学的表現の画像から基底と指数の両方を予測するための単純化された効果的なアプローチを提案する。このモデルは、実世界の条件をシミュレートするために、ランダムノイズ、フォントサイズの変化、およびブラーインテンシティを組み込んだ、指数式を含む10,900の合成画像に基づいて訓練される。実験結果から,モデルがベースおよび指数値の予測において高い精度を達成し,ノイズや入力画像の変化に対するこのアプローチの有効性が証明された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:23:40 GMT)
Mapping Patient Trajectories: Understanding and Visualizing Sepsis Prognostic Pathways from Patients Clinical Narratives [2.3]
本稿では,臨床ノートから得られた敗血症予後経路の体系的手法を提案する。これらの経路を可視化することは、様々な状況における病気の進行の可能性と方向性に光を当てる。これにより、医療提供者は個別の患者に対してよりパーソナライズされ効果的な医療戦略を実施することができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:45:55 GMT)
Enhancing Skin Disease Classification Leveraging Transformer-based Deep Learning Architectures and Explainable AI [2.3]
皮膚疾患は世界の人口の3分の1以上に影響を与えるが、その影響は過小評価されることが多い。深層学習技術は皮膚疾患の特定を含む様々なタスクに多くの可能性を示してきた。この研究では、31のクラスを持つ皮膚疾患データセットを使用し、Vision Transformers、Swin Transformers、DivoV2のすべてのバージョンと比較した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:38:00 GMT)
Deep Learning CT Image Restoration using System Blur and Noise Models [2.3]
本稿では,劣化した画像入力とシステムの曖昧さとノイズを両立させ,モデリングとディープラーニングのアプローチを組み合わせる手法を提案する。その結果,システムボケと雑音特性を表す補助入力を用いた深層学習モデルの有効性が示された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:17:35 GMT)
Efficient Intrusion Detection: Combining $χ^2$ Feature Selection with CNN-BiLSTM on the UNSW-NB15 Dataset [2.2]
侵入検知システム(IDS)は、従来のコンピュータシステムにおけるサイバー攻撃の検出と防止に重要な役割を果たしてきた。 Internet of Things(IoT)デバイスで利用可能な限られた計算リソースは、従来のコンピューティングベースのIDSをデプロイする上での課題である。本稿では、軽量畳み込みニューラルネットワーク(CNN)と双方向長短期記憶(BiLSTM)を組み合わせた効果的なIDSモデルを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:41:16 GMT)
Characterizing Encrypted Application Traffic through Cellular Radio Interface Protocol [2.2]
5G無線通信が,ユーザのアプリケーションをリアルタイムに正確に推測するためのサイドチャネルとなることを示す。オンラインショッピング、音声/ビデオ会議、ビデオストリーミング、Over-The-Top(OTT)メディアプラットフォームという4つの異なるカテゴリのアプリケーションについて検討する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:33:09 GMT)
Stochastic optimization with arbitrary recurrent data sampling [2.1]
最も一般的に使われているデータサンプリングアルゴリズムは、軽度な仮定の下にある。特定のクラスの繰り返し最適化アルゴリズムに対して、他のプロパティは不要であることを示す。我々は,データセットをカバーするサンプリングアルゴリズムを選択することで,収束を加速できることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:56:48 GMT)
Latent Pollution Model: The Hidden Carbon Footprint in 3D Image Synthesis [2.1]
本研究では,2次元および3次元潜伏拡散モデル(LDM)のトレーニングおよびデータ生成段階における炭素排出量を解析した。 2Dモデルと3Dモデルのトレーニングは、それぞれ10kmと90kmの走行に匹敵する。実験の場所は最大94回まで二酸化炭素排出量を増加させ、年末までも最大50%の排出量に影響を及ぼす可能性がある。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:44:44 GMT)
Adversarial Sparse Teacher: Defense Against Distillation-Based Model Stealing Attacks Using Adversarial Examples [2.0]
対人スパース教師 (AST) は蒸留モデル盗難攻撃に対する堅牢な防御方法である。提案手法は, 逆例を用いて教師モデルを訓練し, スパースロジット応答を生成し, 出力分布のエントロピーを増大させる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:46:07 GMT)
Mapping the Technological Future: A Topic, Sentiment, and Emotion Analysis in Social Media Discourse [2.0]
本研究は、2021年から2023年までの150万ツイートに対する感情と感情の分析とともにBERTopicをモデル化する。予想されるテクノロジー主導の未来を特定し、400人の主要な世論指導者(KOL)が伝達する感情を捉えている。肯定的な感情は、肯定的な予感が支配的であり、否定的な感情よりも有意に優れていた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:15:30 GMT)
Requiem for a drone: a machine-learning based framework for stealthy attacks against unmanned autonomous vehicles [2.0]
ソフトウェアのみのブラックボックスアプローチであるRequiemを紹介します。レキエムは、無人航空機(UAV)などの目標システムをミッションパラメータから著しく逸脱させる。本システムは,搭載型異常検知器による検出を回避しつつ,センサ値を変更することでこれを実現している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:58:14 GMT)
Structure Your Data: Towards Semantic Graph Counterfactuals [1.9]
概念に基づく対実的説明(CE)は、モデル予測にどの高レベルな意味的特徴が寄与するかを理解するための代替シナリオを考える説明である。本研究では,入力データに付随する意味グラフに基づくCEを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:23:05 GMT)
Automatic Generation of Fashion Images using Prompting in Generative Machine Learning Models [1.9]
本研究では、2つの異なる大言語モデルと、ファッション画像作成のための安定拡散モデルを用いて、カスタマイズされたファッション記述を生成する手法について検討する。 AI駆動のファッションクリエイティビティにおける適応性を強調して、ゼロショットや少数ショット学習といったテクニックの促進に重点を置いています。評価は、CLIPscoreのような定量的メトリクスと質的な人間の判断を組み合わせることで、創造性、コヒーレンス、さまざまなスタイルの美的魅力を強調します。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:37:51 GMT)
Inferring Ingrained Remote Information in AC Power Flows Using Neuromorphic Modality Regime [1.9]
我々は、エッジプロセッサとしてスパイキングニューラルネットワーク(SNN)を用いて、交流電力流中のリモート情報を推定する。我々は、電力変換器のスイッチングのための変調パルスを得るために、遅延駆動型非教師なしヘビアン学習ルールを利用する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 14:20:22 GMT)
PolyR-CNN: R-CNN for end-to-end polygonal building outline extraction [1.7]
PolyR-CNNは、リモートセンシング画像から直接ベクトル化されたビルディングポリゴンとバウンディングボックスを予測するための効率的で完全に統合されたアプローチである。また,PolyR-CNNは最先端手法と比較して競争精度が高いことを示す。 CrowdAIデータセットで実施された実験によると、PolyR-CNNは平均精度79.2(AP)を達成した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:48:54 GMT)
Nonreciprocal Quantum Sensing [1.5]
駆動信号の検知における非相互結合の利点について検討する。単一の非相互結合は測定精度を最大2倍に向上させることができる。非零温度散逸環境では、非相互量子センシングは相互量子センシングよりも熱雑音に対する堅牢性が高いことを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:31:50 GMT)
On Context-aware Detection of Cherry-picking in News Reporting [1.4]
対象とするニュース記事における重要文の欠落を識別し,チェリーピックされた文を検出する新しい手法を提案する。評価モデルでは,F-1スコアが89%,重要な文が検出できる。その結果,文の重要度を評価する際に,他の物語から外部知識を取り入れることの有効性が示された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 20:38:55 GMT)
EEGMamba: Bidirectional State Space Models with Mixture of Experts for EEG Classification [1.4]
我々はEEGMambaというユニバーサルEEG分類ネットワークを導入する。 Spatio-Temporal-Adaptive (ST-Adaptive)モジュール、Bidirectional Mamba、Mixture of Experts (MoE)をシームレスに統合し、複数のタスクの統一フレームワークに統合する。我々は,8つの公開EEGデータセット上で実験を行い,実験結果から4種類のタスクにおいて優れた性能を示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:15:47 GMT)
An Explainable Fast Deep Neural Network for Emotion Recognition [1.3]
本研究では、映像解析による感情分類の枠組みにおける二元的ディープニューラルアーキテクチャの説明可能性手法について検討する。我々は、感情的な感覚の中で重要な顔のランドマークの動きを理解するために、革新的な説明可能な人工知能アルゴリズムを採用している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:59:08 GMT)
Comments on Friedman's Method for Class Distribution Estimation [1.3]
クラス分布推定の目的は、クラスラベルの観測を伴わないテストデータセットにおいて、事前クラス確率の値を決定することである。クラス分布推定のための線形方程式系を設計するための一般的な枠組みの文脈において、フリードマンの手法の特性と、Friedman(文献ではDeBias法と呼ばれる)によって言及された別のアプローチについて論じる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:59:08 GMT)
Simultaneous Verification of Genuine Multipartite Nonlocality and Full Network Nonlocality [1.3]
1つの実験で2種類の非局所性を同時に検証する手法を提案する。単一ネットワークベルの不等式に違反して高忠実度フォトニック量子ネットワークにおける非局所性の両方を観測する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:17:23 GMT)
Toward Efficient Convolutional Neural Networks With Structured Ternary Patterns [1.2]
畳み込みニューラルネットワーク(ConvNets)は、ローカルデバイスリソースに厳しい要求を課す。本稿では,静的畳み込みフィルタを用いて効率的なConvNetアーキテクチャの設計を行う。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:18:42 GMT)
L2O-$g^{\dagger}$: Learning to Optimize Parameterized Quantum Circuits with Fubini-Study Metric Tensor [1.1]
We propose L2O-$gdagger$, a $textitquantum-aware$ learned that leverage the Fubin-Study metric and long short-term memory network。 L2O-$gdagger$ は以前の L2O 一般化と比較して分布が強いことを示す。我々の小説『textitquantum-aware$ learn, L2O-$gdagger$』は、VQAの課題に対処する上での進歩を示している。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:52:27 GMT)
CourseAssist: Pedagogically Appropriate AI Tutor for Computer Science Education [1.1]
このポスターでは、コンピュータサイエンス教育用に作られた新しいLLMベースのチューターシステムであるCourseAssistを紹介している。一般的なLLMシステムとは異なり、CourseAssistは検索強化生成、ユーザ意図分類、質問分解を使用して、AI応答を特定のコース材料や学習目標と整合させる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:21:02 GMT)
Investigating the use of Snowballing on Gray Literature Reviews [0.9]
そこで本研究では,Snowballing (SB) によるQ&Aサイトへのアプローチについて検討する。レビューのための新しい有効な議論を見つけるために、2つのSBアプローチを適用する方法に関するガイドラインを提供する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:53:19 GMT)
Conversational Rubert for Detecting Competitive Interruptions in ASR-Transcribed Dialogues [0.6]
割り込みを自動的に分類するシステムは、コールセンター、特に顧客満足度モニタリングとエージェントモニタリングのタスクで利用することができる。我々は、ASRで書き起こされた顧客サポート電話対話からなる社内データセットをロシア語で作成し、テキストベースの割り込み分類モデルを開発した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:25:53 GMT)
Bayesian identification of nonseparable Hamiltonians with multiplicative noise using deep learning and reduced-order modeling [0.6]
本稿では,非分離型ハミルトニアン系を学習するための構造保存型ベイズ的アプローチを提案する。本研究では,ハイ次元システムに対するベイズ同定のコスト効率向上のための新しいアルゴリズムを開発した。訓練目的としてベイズ後部を使用すれば,ハミルトン平均二乗誤差の724倍の改善が得られることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:04:54 GMT)
Visual Geo-Localization from images [0.5]
本稿では,GPSデータに頼らずに画像から位置の地理的な位置を決定できる視覚的位置情報化システムを提案する。提案手法は, 位置認識のためのスケール不変特徴変換(SIFT), 道路接合型識別のための従来の画像処理, 道路接合の分類のためのVGG16モデルを用いたディープラーニングの3つの主要な手法を統合する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 15:47:21 GMT)
Traditional Readability Formulas Compared for English [0.5]
伝統的な英語の可読性の公式(方程式)は、主に20世紀に開発された。多くの研究者は依然として様々なNLPアプリケーションに頼っている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 01:00:19 GMT)
Decentralized Federated Anomaly Detection in Smart Grids: A P2P Gossip Approach [0.4]
本稿では,ランダムウォーク(Random Walk)とエピデミック(Epidemic)という2つの主要なゴシッププロトコルに基づく分散化フェデレーション異常検出手法を提案する。従来のフェデレートラーニングに比べて,トレーニング時間の35%が顕著に改善されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:45:06 GMT)
Diff4VS: HIV-inhibiting Molecules Generation with Classifier Guidance Diffusion for Virtual Screening [0.4]
新しいHIV阻害分子の同定は、エイズ流行と戦う上で非常に重要である。ここでは、誘導拡散モデルと配位子に基づく仮想スクリーニング戦略を組み合わせて、潜在的なHIV阻害分子を発見する。実験により、Diff4VSは他の方法よりも候補となるHIV阻害分子を生成できることが示されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:34:02 GMT)
A Semantic Framework for Neuro-Symbolic Computing [0.4]
我々は、知識ベースを符号化できるコンポーネントと条件を規定する意味的エンコーディングの形式的定義を提供する。この定義により、多くのニューロシンボリックアプローチが説明できる。これは、既存のニューロシンボリックシステムの全ファミリーのセマンティックエンコーディングのより広い文脈に配置することで、将来のニューロシンボリックエンコーディングへのガイダンスを提供することが期待されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:42:36 GMT)
Physics-informed active learning with simultaneous weak-form latent space dynamics identification [0.3]
非線形力学(WENDy)の弱形式推定をgLaに導入する。オートエンコーダとWENDyは同時に訓練され、高次元データの潜時空間のダイナミクスを発見する。 WgLa は gLa よりも桁違いに優れ,相対誤差は 1-7% である。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:21:42 GMT)
Data Augmentation in Graph Neural Networks: The Role of Generated Synthetic Graphs [0.2]
本研究では,データ拡張のための生成グラフについて検討する。生成したグラフを実グラフと組み合わせることのパフォーマンスを比較し、生成したグラフの量が異なることがグラフ分類タスクに与える影響を調べる。その結果,グラフデータの拡張,一貫性のあるラベルの確保,分類性能の向上など,新たなアプローチが導入された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:05:26 GMT)
RAVE: Residual Vector Embedding for CLIP-Guided Backlit Image Enhancement [0.2]
本稿では,教師なしバックライト画像強調作業におけるCLIP指導の新たな修正を提案する。この手法は,CLIP埋め込み空間内のプロンプト(負・正のサンプル)と対応する画像(バックライト画像/ウェルリット画像)とのテキストイメージの類似性を制約することにより,プロンプトペアを学習する。テキスト埋め込みの空間でプロンプトをチューニングする代わりに、品質を損なうことなく、埋め込みを直接調整できることが示される。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:57:08 GMT)
CBCTLiTS: A Synthetic, Paired CBCT/CT Dataset For Segmentation And Style Transfer [0.2]
CBCTLiTS(CBCTLiTS)は,高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・ CBCTデータは5つの異なる品質レベルで提供され、視覚的品質の高い多数の投影から、厳密なアーティファクトを持つ少数の投影まで到達する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:47:20 GMT)
Evaluation of deep learning models for Australian climate extremes: prediction of streamflow and floods [0.2]
近年、洪水のような気候の極端は、オーストラリアにとって重要な環境と経済の危険を生み出している。ディープラーニングの手法は、短時間の地平線上で、小規模から中規模の極端な事象を予測することを約束している。大規模な急激な洪水に対処するアンサンブルベースの機械学習アプローチを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 23:45:04 GMT)
Text Style Transfer: An Introductory Overview [0.2]
テキストスタイル転送(TST)は、スタイルに依存しないコンテンツを保存しながらテキストスタイルの属性を操作する自然言語生成において重要なタスクである。 TSTを対象とする属性は、丁寧さ、著者シップ、攻撃的言語の緩和、感情の修正、テキストの形式調整など、多岐にわたる可能性がある。本稿では,その課題,既存アプローチ,データセット,評価尺度,サブタスク,アプリケーションについて概説する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:54:55 GMT)
Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper's Encoder for Efficient Parameter Reduction in Automated Assessment [0.1]
本研究は, 発声音声における不一致の同定における最後のエンコーダ層の役割を明らかにするものである。計算効率が良く、訓練のためのパラメータが83.7%少なくなり、提案されたアプローチは様々な方言や言語に適応できるようになった。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:00:30 GMT)
Enhancing Profitability and Investor Confidence through Interpretable AI Models for Investment Decisions [0.1]
本稿では、SHAPに基づく説明可能性技術を利用して投資提案を予測するための解釈可能な意思決定モデルを提案する。提案されたソリューションは、予測されたレコメンデーションに影響を与える要因に関する貴重な洞察を提供するだけでなく、さまざまなタイプの投資家にも影響を及ぼす。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 16:16:55 GMT)
Virtual Z gates and symmetric gate compilation [0.0]
オープンな量子システム設定において,コンパイル方法が重要な結果をもたらすことを示す。仮想Z回転に関して対称なコンパイルを選択することが重要であることを実験的に示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:07:08 GMT)
Tomographic entanglement indicators in a coupled oscillator model [0.0]
我々は、同じ自然周波数の2つの結合線形高調波発振器からなる単純なモデルにおける絡み合いについて検討した。標準エンタングルメント測度(サブシステム線形エントロピーとサブシステムフォン・ノイマンエントロピー)といくつかのトモグラフィエンタングルメント測度を計算する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:04:02 GMT)
To Be, Or Not To Be?: Regulating Impossible AI in the United States [0.0]
論文は、Impossible AIの3つの例を、開発、展開、批判、政府の規制を通じて追跡している。我々は,これらのシステムの基本的不確実性を中心とし,クリティハイプに対する注意を喚起する機能優先アプローチを推し進める。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:37:13 GMT)
The Missing Curve Detectors of InceptionV1: Applying Sparse Autoencoders to InceptionV1 Early Vision [0.0]
スパースオートエンコーダ(SAE)に関する最近の研究は、ニューラルネットワークから解釈可能な特徴を抽出する上で有望であることを示している。本稿では、よく研究された畳み込みニューラルネットワークであるInceptionV1の初期の視覚層にSAEを適用する。以上の結果から,SAEは個々のニューロンから明らかでない新しい解釈可能な特徴を発見できることが示された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:32:28 GMT)
Sim-CLIP: Unsupervised Siamese Adversarial Fine-Tuning for Robust and Semantically-Rich Vision-Language Models [0.0]
広範に使用されているCLIPビジョンエンコーダの敵攻撃に対する堅牢性を向上する,教師なし逆向き微調整手法であるSim-CLIPを提案する。 Sim-CLIPは、コサイン類似性の損失を伴うSiameseアーキテクチャを利用することで、大きなバッチサイズや運動量エンコーダを必要とせずに、意味的に意味があり、攻撃耐性のある視覚表現を学習する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:53:52 GMT)
Retrieval Augmented Generation Integrated Large Language Models in Smart Contract Vulnerability Detection [0.0]
分散ファイナンス(DeFi)には、スマートコントラクトの脆弱性による大きな損失が伴っている。攻撃が頻発するにつれて、監査サービスの必要性と需要が高まっている。本研究では,大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)を統合することにより,既存のフレームワークを構築する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:46:42 GMT)
Qudit non-Clifford interleaved benchmarking [0.0]
クリフォードゲートの集合とは異なる雑音を持つクーディットTゲートを特徴付けるスキームを導入する。 qubitの場合に制限を加えることにより、二面体ベンチマークスキームを復元する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 18:52:57 GMT)
Quadratic Formulation of Mutual Information for Sensor Placement Optimization using Ising and Quantum Annealing Machines [0.0]
我々は,センサの配置を複数の候補位置から決定する問題に対処し,最小限のセンサ数で情報取得を最大化することを目的とする。選択したセンサ位置のデータと他データとの相互情報(MI)を目的関数として定義した。例として,センサ配置の3つの候補に対する目的関数の最適解を,量子アニールマシンを用いて計算した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 04:46:02 GMT)
Preictal Period Optimization for Deep Learning-Based Epileptic Seizure Prediction [0.0]
我々は頭皮脳波(EEG)信号を用いた発作予測のための競合的深層学習モデルを開発した。オープンアクセス型CHB-MITデータセットを対象とした19名の小児患者を対象に,本モデルを訓練・評価した。各患者のOPPを用いて、平均感度は99.31%、特異性は95.34%、AUCは99.35%、F1-スコアは97.46%と正しく同定された。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:49:14 GMT)
Phase estimation via number-conserving operation inside the SU(1,1) interferometer [0.0]
ホモダイン検出による位相測定の精度向上のための理論的手法を提案する。本稿では,数保存操作が位相感度,量子フィッシャー情報,量子クレーマー・ラオ境界に与える影響を,理想的・光子損失の両方のシナリオで解析する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 05:34:43 GMT)
PERCORE: A Deep Learning-Based Framework for Persian Spelling Correction with Phonetic Analysis [0.0]
本研究では,ディープラーニング技術と音声解析をシームレスに統合したペルシャ語スペル訂正システムを提案する。提案手法は,文脈分析と音韻的洞察を効果的に組み合わせ,非単語と実単語の綴り誤りを正確に補正する。広帯域データセットの徹底的な評価により,既存手法と比較してシステムの性能が向上することを確認した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:41:04 GMT)
Non-local quench spectroscopy of fermionic excitations in 1D quantum spin chains [0.0]
エンフレンチ分光法はスピン鎖中のフェルミオン準粒子の分散関係を正確に再構成できることを理論的に示す。我々の分析は、量子スピン鎖のクエンチダイナミクスの新しい正確な結果に基づいている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 08:24:01 GMT)
Non-Reference Quality Assessment for Medical Imaging: Application to Synthetic Brain MRIs [0.0]
本研究では,3次元ResNetをトレーニングすることで脳MRI品質を評価するための,ディープラーニングに基づく新しい非参照手法を提案する。このネットワークは、MRIスキャンでよく見られる6つの異なるアーティファクトで品質を推定するように設計されている。その結果、歪みを正確に推定し、複数の視点から画質を反映する性能が向上した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 22:05:30 GMT)
Korean Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0]
韓国のレストランレビューに対するアスペクトベース感性分析(ABSA)の調査は特に欠落している。韓国語などの低リソース言語におけるABSAの直感的で効果的なフレームワークを提案する。英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 09:32:01 GMT)
Intelligence Analysis of Language Models [0.0]
本研究では,Large Language Models (LLMs) の Abstraction and Reasoning Corpus (ARC) データセットに対する有効性を検証する。このデータセットは、抽象推論能力をテストするための代表的なベンチマークとして機能する。モデル性能向上におけるChain-of-Thought(CoT)手法の適用性を検討した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:48:16 GMT)
Integrated BIM and Machine Learning System for Circularity Prediction of Construction Demolition Waste [0.0]
本研究では,機械学習(ML)を用いた可変モデリング(VM)による分解定量化を推し進める。 2280のプロジェクトの解体データセットは、MLモデリングに利用された。本研究は, 建物解体からリサイクル・埋立処分資材の量を予測するシステムを開発した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:32:46 GMT)
Implementing Fairness: the view from a FairDream [0.0]
私たちはAIモデルをトレーニングし、不平等を検出して修正するために、独自の公正パッケージFairDreamを開発します。本実験は,FairDreamの特性として,真理を条件としたフェアネスの目標を達成できることを実証した。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 06:06:24 GMT)
Hyperdimensional Computing for Node Classification and Link Prediction [0.0]
超次元表現を用いたグラフ上のトランスダクティブ学習法を提案する。提案手法は, ランダム投影を用いたデータサンプルを高次元空間に符号化する。ディープラーニングの手法が必要とするような,高価な反復的なトレーニングの必要性を回避します。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 03:46:13 GMT)
Gibbs Sampling of Continuous Potentials on a Quantum Computer [0.0]
周期的実数値関数からギブスをサンプリングする量子アルゴリズムを構築した。我々のアルゴリズムは、関数の量子オラクルに対するゼロエスオーダークエリを生成する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:35:17 GMT)
Enhancing Wildfire Forecasting Through Multisource Spatio-Temporal Data, Deep Learning, Ensemble Models and Transfer Learning [0.0]
本稿では,衛星データアルゴリズムとディープラーニング技術の適用を含むマルチソースアンサンブルデータの統合を通じて,山火事予測の新しいアプローチを提案する。主な焦点は、山火事の予測において、人的活動における気象シーケンスの重要性と、特定の気象パラメータを理解することである。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 02:00:13 GMT)
Enhancing Microgrid Performance Prediction with Attention-based Deep Learning Models [0.0]
本研究の目的は、グリッド不安定性に寄与する電力振動を特徴とするマイクログリッドシステムの運用上の課題に対処することである。畳み込みとGRU(Gated Recurrent Unit)の強みを活かした統合戦略が提案されている。このフレームワークは、包括的な負荷予測を行うMulti-Layer Perceptron(MLP)モデルによって固定されている。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:24:11 GMT)
Enhancing High-Energy Particle Physics Collision Analysis through Graph Data Attribution Techniques [0.0]
本稿では、シミュレーション粒子衝突データセットを用いて、グラフ分類パイプライン内の影響分析を統合する。グラフニューラルネットワークを初等訓練に用いることにより,学習サンプルの同定に勾配に基づくデータ影響法を適用した。破棄された要素を分析することで、イベント分類タスクに関するさらなる洞察を得ることができる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 12:40:03 GMT)
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels [0.0]
海洋の破片は、鳥類、魚、その他の動物の生命に重大な生態学的脅威をもたらす。伝統的に残骸の堆積を評価する方法には、労働集約的かつ高価な手作業による調査が含まれる。本研究では,ドローンが捉えた空中画像を利用して遠隔地ゴミ調査を行うフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:06:27 GMT)
Data Efficient Contrastive Learning in Histopathology using Active Sampling [0.0]
ディープラーニングアルゴリズムは、デジタル病理学において堅牢な定量的分析を提供することができる。これらのアルゴリズムは大量の注釈付きトレーニングデータを必要とする。アドホックなプリテキストタスクを用いて特徴を学習するための自己教師付き手法が提案されている。そこで本研究では,小規模なプロキシネットワークを用いたトレーニングセットから情報的メンバを積極的に抽出する手法を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 23:29:28 GMT)
Complementarity relationship between coherence and path distinguishability in an interferometer based on induced coherence [0.0]
我々は、2つの干渉光子の間の一階のコヒーレンスをリンクする相補性関係を導出する。導出された関係は、単一光子系を超え、生成される光子-流速に対して有効であることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 13:21:09 GMT)
Classification and magic magnetic-field directions for spin-orbit-coupled double quantum dots [0.0]
スピンベースの量子コンピューティングの基本的な構築ブロックは、スピン軌道結合が著しい二重量子ドットで実証されている。スピン軌道結合された二重量子ドットは、g$テンソルの多次元空間の分割に従って6つのクラスに分類できることを示す。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 11:39:42 GMT)
ChatGPT and post-test probability [0.0]
われわれはChatGPTにベイズ規則の医学的診断方法の例を挙げる。医療変数名の導入は,ChatGPTが犯す誤りの数の増加につながることを示す。感度と特異性に関する最近の解説を踏まえて,本研究の結果について論じる。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 00:54:58 GMT)
Can VLMs be used on videos for action recognition? LLMs are Visual Reasoning Coordinators [0.0]
本稿では,大規模言語モデル (LLM) が,自然言語通信によって複数の視覚言語モデル (VLM) を効率的にコーディネートする方法を示す。本研究は,同手法が行動認識のための監視ビデオに適用できるかどうかを考察する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 10:26:28 GMT)
Automatic Real-word Error Correction in Persian Text [0.0]
本稿では,ペルシャ語テキストにおける高精度かつ効率的な実単語誤り訂正のための最先端手法を提案する。我々は,誤り検出と訂正の有効性を高めるために,意味解析,特徴選択,高度な分類器を用いる。本手法は,検出段階で96.6%,補正時に99.1%の精度でF測定を行う。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 07:50:52 GMT)
Asynchronous Telegate and Teledata Protocols for Distributed Quantum Computing [0.0]
分散量子演算のコストは、絡み合った光子と古典情報の分散によるレイテンシが高い。本稿では,非同期な古典通信を実現するために,テレゲートプロトコルとテレデータプロトコルの拡張を提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 21:36:53 GMT)
Alternative Methods to SHAP Derived from Properties of Kernels: A Note on Theoretical Analysis [0.0]
本研究では,LIME のカーネルにおける AFA (Additive Feature Attribution) の一般的および分析的表現を導出する。我々は、カーネルの適切な性質を持つ新しいAFAや、協調ゲーム理論におけるLS前核と一致するいくつかの新しいAFAを提案する。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 17:02:21 GMT)
A study on general visual categorization of objects into animal and plant groups using global shape descriptors with a focus on category-specific deficits [0.0]
動物と植物の一般的な分類は、テクスチャ情報を処理せずに視覚的に識別可能であることを示す。結果は教師なし学習機構と教師なし学習機構の両方を用いて評価される。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 19:55:22 GMT)
A Measure for Level of Autonomy Based on Observable System Behavior [0.0]
観測可能な行動を用いて自律性のレベルを予測するための潜在的尺度を提案する。また,提案手法を取り入れたアルゴリズムを提案する。この測定とアルゴリズムは、実行時に自律システムを比較する方法に興味のある研究者や実践者にとって重要である。
論文参考訳（メタデータ） (Sat, 20 Jul 2024 20:34:20 GMT)