Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation [106.4] 本稿では,ビデオ中の異常検出のための非常に高速なフレームレベルモデルを提案する。
複数の高精度なオブジェクトレベルの教師モデルから知識を抽出することで、異常を検出することを学ぶ。
提案モデルでは,これまで聞こえなかった1480 FPSの速度のため,速度と精度の最良のトレードオフを実現している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:01:00 GMT)
Case2Code: Learning Inductive Reasoning with Synthetic Data [105.9] プログラムの表現性と正確性を利用したtextbfCase2Code タスクを提案する。
まず、合成したCase2Codeタスクにおける代表LLMを評価し、LLMにおいてケース・ツー・コード誘導が困難であることを実証する。
実験結果から,このような帰納的学習は,Case2Codeの性能だけでなく,学習用LLMの各種符号化能力の向上にも寄与することがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:35:00 GMT)
RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.4] Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:49:34 GMT)
$\textit{GeoHard}$: Towards Measuring Class-wise Hardness through Modelling Class Semantics [90.9] この作業は、$textitclass-wise hardness$という概念を正式に開始する。
8つの自然言語理解(NLU)データセットに対する実験は、学習パラダイム、モデル、人間の判断にまたがる一貫した硬さ分布を示す。
$textitGeoHard$は、$textitPearson$のクラスワイド硬度測定の相関で、インスタンスレベルのメトリクスを59%以上上回る。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:53:39 GMT)
Learning Task Decomposition to Assist Humans in Competitive Programming [90.5] タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。
我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。
人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:24:44 GMT)
HIMO: A New Benchmark for Full-Body Human Interacting with Multiple Objects [86.9] HIMOは、複数のオブジェクトと相互作用するフルボディの人間のデータセットである。
HIMOは3.3K 4D HOIシーケンスと4.08M 3D HOIフレームを含む。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:47:34 GMT)
Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [85.9] 複数のエージェントが"tit for tat"の状態で議論を表現するマルチエージェント議論(MAD)フレームワークを提案し、審査員が議論プロセスを管理して最終解を得る。
我々のフレームワークは、深い熟考を必要とするタスクに役立ちそうなLSMにおける散発的思考を奨励する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:56:01 GMT)
Any Target Can be Offense: Adversarial Example Generation via Generalized Latent Infection [83.7] GAKerは任意のターゲットクラスに対して逆例を構築することができる。
本手法は,未知のクラスに対する攻撃成功率を約14.13%で達成する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:24:09 GMT)
GeoGaussian: Geometry-aware Gaussian Splatting for Scene Rendering [83.2] ガウススプレイティング最適化の過程で、その構造が意図的に保存されていない場合、シーンの幾何学は徐々に悪化する。
我々はこの問題を緩和するためにGeoGaussianと呼ばれる新しいアプローチを提案する。
提案するパイプラインは、新しいビュー合成と幾何再構成において最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:11:14 GMT)
WildDeepfake: A Challenging Real-World Dataset for Deepfake Detection [82.4] 我々は,インターネットから完全に収集された707のディープフェイクビデオから抽出された7,314の顔シーケンスからなる新しいデータセットWildDeepfakeを紹介した。
既存のWildDeepfakeデータセットと我々のWildDeepfakeデータセットのベースライン検出ネットワークを体系的に評価し、WildDeepfakeが実際により困難なデータセットであることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:59:39 GMT)
Establishing Knowledge Preference in Language Models [80.7] 言語モデルは事前学習を通じて大量の事実知識を符号化することが知られている。
このような知識はユーザーからの要求に応えるには不十分かもしれない。
進行中のイベントに関する質問に答える場合には、最新のニュース記事を使って回答を更新する必要がある。
ある事実がモデルで編集されると、更新された事実はモデルによって学習されたすべての事前知識をオーバーライドする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 23:16:11 GMT)
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold [79.9] DragGANはGAN(Generative Adversarial Network)を制御する新しい方法である
DragGANを使えば、ピクセルの行き先を正確に制御して、動物、車、人間、風景などのさまざまなカテゴリのポーズ、形状、表現、レイアウトを操作することができる。
定性的かつ定量的な比較は、画像操作や点追跡のタスクにおいて、以前のアプローチよりもDragGANの利点を示している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:27:55 GMT)
Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.8] 大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。
本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。
攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:34:45 GMT)
Interpreting the Weight Space of Customized Diffusion Models [79.1] 本研究では,多種多様な拡散モデルによる重みの空間について検討する。
私たちは6万以上のモデルのデータセットを作成して、このスペースをポップアップさせ、それぞれが異なる人の視覚的アイデンティティを挿入するために微調整されたベースモデルです。
我々は、この空間の3つの即時応用、サンプリング、編集、反転を実演する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:01:11 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6] 人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:33:26 GMT)
Non-Vacuous Generalization Bounds for Large Language Models [78.4] 事前訓練された大言語モデルに対して、最初の空でない一般化境界を提供する。
より大きいモデルはより優れた一般化バウンダリを持ち、より小さなモデルよりも圧縮可能であることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:32:47 GMT)
Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models [76.4] 本稿では,Reliable and Efficient Concept Erasure (RECE)を提案する。
派生した埋め込みによって表現される不適切なコンテンツを緩和するために、RECEはそれらをクロスアテンション層における無害な概念と整合させる。
新たな表現埋め込みの導出と消去を反復的に行い、不適切な概念の徹底的な消去を実現する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:04:28 GMT)
Position: Considerations for Differentially Private Learning with Large-Scale Public Pretraining [75.3] 大規模なWebスクレイプデータセットの使用は、差分プライバシ保存と見なすべきかどうかを疑問視する。
Webデータ上で事前訓練されたこれらのモデルを“プライベート”として公開することで、市民のプライバシーに対する信頼を意味のあるプライバシの定義として損なう可能性があることを警告します。
公的な事前学習がより普及し、強力になるにつれて、私的な学習分野への道のりを議論することで、我々は結論づける。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:53:58 GMT)
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5] Plucker座標に基づく制御ネットライクなコンディショニング機構を用いた3次元カメラ制御のためのトランスフォーマー映像を試作する。
我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:59:05 GMT)
EmoBench: Evaluating the Emotional Intelligence of Large Language Models [73.6] EmoBenchは、確立された心理学理論に基づいて、マシン感情知能(EI)の包括的な定義を提案するベンチマークである。
EmoBenchには、英語と中国語で400の手作りの質問が含まれている。
以上の結果から,既存の大規模言語モデルのEIと平均的な人間の間には,かなりのギャップがみられ,今後の研究に向けての有望な方向性が浮かび上がっている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:30:58 GMT)
Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text and Image [70.0] Open-vocabulary 3D object detection (OV-3DDet) は、新しい3Dシーン内において、目に見えないものの両方をローカライズし、認識することを目的としている。
視覚基盤モデルを利用して、3Dシーンにおける新しいクラスを発見するための画像的ガイダンスを提供する。
オープン語彙の3Dオブジェクト検出における基礎モデルの可能性を明らかにするとともに,精度と一般化の大幅な向上を示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:50:09 GMT)
Patch-Level Training for Large Language Models [69.7] 本稿では,Large Language Models (LLM) に対するパッチレベルのトレーニングを紹介する。
パッチレベルのトレーニングでは、言語モデルの短いパッチシーケンスをフィードし、次のパッチを予測するようにトレーニングします。
これに続いて、モデルは推論モードに合わせて、残りのトレーニングデータに対するトークンレベルのトレーニングを継続する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:48:39 GMT)
Online Pseudo-Zeroth-Order Training of Neuromorphic Spiking Neural Networks [69.3] スパイクニューラルネットワーク(SNN)を用いた脳誘発ニューロモルフィックコンピューティングは、有望なエネルギー効率の計算手法である。
最近の手法では、空間的および時間的バックプロパゲーション(BP)を利用しており、ニューロモルフィックの性質に固執していない。
オンライン擬似ゼロオーダートレーニング(OPZO)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 12:09:00 GMT)
GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.1] GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:27:41 GMT)
Generative AI for Low-Carbon Artificial Intelligence of Things with Large Language Models [67.0] ジェネレーティブAI(GAI)は、AIoT(Artificial Intelligence of Things)の二酸化炭素排出量を減らす大きな可能性を秘めている
本稿では, 炭素排出量削減のためのGAIの可能性について検討し, 低炭素AIoTのための新しいGAI対応ソリューションを提案する。
本稿では,Large Language Model (LLM) を利用したCO_2排出最適化フレームワークを提案し,このフレームワークにより,プラグ可能なLLMとRetrieval Augmented Generation (RAG) モジュールを設計する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:32:46 GMT)
Towards continually learning new languages [66.4] 言語のバッチ学習は経済的に有益だが、大きな課題は破滅的な忘れ方だ。
我々は,破滅的忘れを抑えるために,重量分解特性と弾性重みの固化特性を組み合わせる。
私たちは、すべての言語をゼロからトレーニングするのに比べ、破滅的な忘れものもなく、合理的なパフォーマンスで26の言語を達成しています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:56:04 GMT)
Visual Concept-driven Image Generation with Text-to-Image Diffusion Model [66.0] テキスト・ツー・イメージ(TTI)モデルは複雑なシーンの高解像度画像を生成するという印象的な結果を示した。
近年のアプローチでは、これらの手法をパーソナライズ技術で拡張し、ユーザ認証の概念の統合を可能にしている。
しかし、人間の被写体のような複数の相互作用する概念を持つ画像を生成する能力は、1つにまたがったり、複数にまたがったりする概念は、いまだに説明がつかないままである。
これらの課題に対処する概念駆動型TTIパーソナライズフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:47:16 GMT)
QuRating: Selecting High-Quality Data for Training Language Models [64.8] データ品質に関する人間の直感をキャプチャできる事前学習データを選択するQuRatingを導入する。
本稿では,書体,専門知識,事実とトリビア,教育的価値の4つの特性について検討する。
ペアの判断からスカラー評価を学習するためにQurモデルをトレーニングし、それを4つの基準ごとに品質評価付き260Bのトレーニングコーパスにアノテートするために使用します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:50:11 GMT)
CityGaussian: Real-time High-quality Large-Scale Scene Rendering with Gaussians [64.7] CityGaussianは、大規模な3DGSのトレーニングとレンダリングを効率化するために、新しい分別/分別トレーニングアプローチとLevel-of-Detail(LoD)戦略を採用している。
我々のアプローチは最先端のレンダリング品質を実現し、大規模なシーンを全く異なるスケールで一貫したリアルタイムレンダリングを可能にする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:56:34 GMT)
From Fake to Real: Pretraining on Balanced Synthetic Images to Prevent Spurious Correlations in Image Recognition [64.6] 我々はFrom Fake to Realと呼ぶシンプルで簡単に実装できる2段階のトレーニングパイプラインを提案する。
実データと合成データを別々にトレーニングすることで、FFRは実データと合成データの統計的差異にモデルを公開しない。
実験の結果,FFRは3つのデータセットに対して,最先端のグループ精度を最大20%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:07:01 GMT)
Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment [64.5] 本稿では,検出されたテキストと画像のペア間の相違点の詳細な説明を行う。
我々は、大きな言語モデルと視覚的接地モデルを活用して、与えられた画像に対して妥当なキャプションを保持するトレーニングセットを自動構築する。
また,テキストと視覚的ミスアライメントアノテーションを組み合わせた新たな人為的なテストセットも公開する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:12:26 GMT)
PersLLM: A Personified Training Approach for Large Language Models [63.8] 社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:13:22 GMT)
Instruction-Driven Game Engines on Large Language Models [60.3] IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:27:37 GMT)
Towards Understanding and Improving Knowledge Distillation for Neural Machine Translation [59.3] この知識は,教師のトップ1の予測から得られたものである。
我々はtextbfTop-1 textbfInformation textbfEnhanced textbfKnowledge textbfDistillation (TIE-KD) という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:36:30 GMT)
VegeDiff: Latent Diffusion Model for Geospatial Vegetation Forecasting [58.1] 地理空間植生予測タスクのためのVegeDiffを提案する。
VegeDiffは、植物の変化過程の不確かさを確率的に捉えるために拡散モデルを使用した最初の企業である。
植生の変化の不確かさを捉え、関連する変数の複雑な影響をモデル化することで、VegeDiffは既存の決定論的手法より優れている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:15:52 GMT)
Towards AI-Powered Video Assistant Referee System for Association Football [58.0] Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。
VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。
マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:09:03 GMT)
Improving SAM Requires Rethinking its Optimization Formulation [57.6] Sharpness-Aware Minimization (SAM) は、もともとネットワークの重みと有界摂動がそれぞれ同じ差分損失を最小/最大化しようとするゼロサムゲームとして定式化されている。
我々は SAM を 0-1 の損失を用いて再定式化すべきであると主張する。連続緩和として、最小化(最大化)プレイヤーが 0-1 の損失に対して上界(より下界)をサロゲートする単純なアプローチに従う。これは BiSAM と呼ばれる双レベル最適化問題として SAM の新たな定式化につながる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:22:33 GMT)
EvSign: Sign Language Recognition and Translation with Streaming Events [57.4] イベントカメラは、動的手の動きを自然に知覚し、手話作業のための豊富な手作業の手がかりを提供する。
イベントベースSLRおよびSLTタスクのための効率的なトランスフォーマーベースフレームワークを提案する。
計算コストは0.34%に過ぎず,既存の最先端手法に対して良好に機能する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:16:35 GMT)
The Role of Language Imbalance in Cross-lingual Generalisation: Insights from Cloned Language Experiments [57.3] 本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。
学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。
分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:59:01 GMT)
MoME: Mixture of Multimodal Experts for Generalist Multimodal Large Language Models [57.1] 本稿では,タスク干渉を緩和し,汎用MLLMを得るためのマルチモーダルエキスパート(MoME)の混合を提案する。
私たちのMoMEは、視覚専門家の混合(MoVE)と言語専門家の混合(MoLE)の2つの重要なコンポーネントで構成されています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:31:38 GMT)
Continuously Learning New Words in Automatic Speech Recognition [57.0] 本稿では,新たな単語認識のための自己教師付き連続学習手法を提案する。
過去の研究から,メモリ拡張型自動音声認識モデルを用いた。
提案手法により,新たな単語の出現頻度が高くなると,新たな単語のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:01:26 GMT)
Estimating the Energy Footprint of Software Systems: a Primer [56.2] ソフトウェアシステムのエネルギーフットプリントの定量化は、最も基本的な活動の1つです。
この文書は、この分野で研究を始めたい研究者の出発点となることを目的としている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:07:08 GMT)
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On [55.4] 一般的な7B言語モデル上での教師付き微調整(SFT)であるSkywork-Mathモデルシリーズを紹介する。
Skywork-Math 7Bは競争レベルのMATHベンチマークで51.2%の精度を達成した。
我々は,LLMの数学推論能力を高めるために,研究用と産業用の両方で,いくつかの実践的なテイクアウトを提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:28:33 GMT)
SafePowerGraph: Safety-aware Evaluation of Graph Neural Networks for Transmission Power Grids [55.4] 我々は,電力システム(PS)におけるグラフニューラルネットワーク(GNN)のための,最初のシミュレータに依存しない,安全指向のフレームワークであるSafePowerGraphを紹介する。
SafePowerGraphは複数のPFシミュレータとOPFシミュレータを統合し、エネルギー価格の変動や電力線停止など、さまざまなシナリオでGNNのパフォーマンスを評価する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:01:38 GMT)
Towards Scalable Automated Alignment of LLMs: A Survey [54.8] 本稿では,最近登場した自動アライメントの手法を体系的にレビューする。
既存の自動アライメント手法をアライメント信号のソースに基づいて4つの主要なカテゴリに分類する。
本稿では,アライメントの基本的役割から,自動アライメント技術の実現を可能にする重要な要因について論じる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:26:31 GMT)
The Foundation Model Transparency Index v1.1: May 2024 [54.8] 2023年10月、インデクスは100の透明性指標について10の主要なファンデーションモデル開発者を評価した。
当時、開発者は非常に限られた情報を公開しており、平均スコアは100点中37点だった。
開発者は、平均して100点中58点を獲得し、v1.0よりも21点改善している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:03:37 GMT)
Out of Length Text Recognition with Sub-String Matching [54.6] 本稿では,これをOOL(Out of Length)テキスト認識と呼ぶ。
サブ文字列マッチング(SMTR)を用いたOOLテキスト認識手法を提案する。
SMTRは2つのクロスアテンションベースのモジュールから構成される: 1つは、複数の文字を含むサブストリングを次のクエリと前のクエリにエンコードし、もう1つは、サブストリングをマッチングし、次の文字列と前の文字を同時に認識する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:02:17 GMT)
TurkishMMLU: Measuring Massive Multitask Language Understanding in Turkish [54.5] 本稿では,最初のマルチタスク,複数選択のトルコQAベンチマーク,トルコMMLUを紹介する。
トルコMMLUには1万以上の質問があり、トルコの高校教育カリキュラムとは9つの異なるテーマをカバーしている。
多言語オープンソース(Gemma、Llama、MT5)、クローズドソース(GPT 4o、Claude、Gemini)、トルコ適応モデル(Trendyolなど)を含む20以上のLLMを評価した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:28:55 GMT)
MuggleMath: Assessing the Impact of Query and Response Augmentation on Math Reasoning [54.2] 大規模言語モデルを用いた数学推論では、クエリの進化と多様な推論経路による微調整データ拡張が実験的に有効である。
本研究では,数理推論におけるそのようなデータ拡張に関する調査を行い,これらの疑問に答えることを意図している。
コードと拡張データはhttps://github.com/OFA-Sys/8k-Scel.comで公開しています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:46:17 GMT)
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models [54.1] トレーニングデータを自動的に生成する最初のスケーラブルで信頼性の高いAutoIFを導入する。
AutoIFは命令追従データ品質の検証をコード検証に変換する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:33:35 GMT)
E5-V: Universal Embeddings with Multimodal Large Language Models [51.6] 汎用マルチモーダル埋め込みを実現するためのMLLMに適応する新しいフレームワークであるE5-Vを導入する。
MLLMをプロンプトで活用することにより、E5-Vは異なるタイプの入力間のモダリティギャップを効果的に橋渡しする。
E5-Vは細調整なしでもマルチモーダル埋め込みにおいて高い性能を達成する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:04:12 GMT)
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos [51.5] 任意の長さのビデオの解釈に適した手法を提案する。
また,TVQA-longベンチマークを導入し,視覚とテキストコンテンツの両方に疑問を呈する長編ビデオの理解におけるモデルの能力を評価する。
以上の結果から,本モデルでは長大・短大双方の理解が大幅に改善されていることが示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:59:32 GMT)
Laugh Now Cry Later: Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech [51.5] EmoCtrl-TTSは感情制御可能なゼロショットTSであり、あらゆる話者に対してNVで高い感情的な音声を生成することができる。
高品質な感情音声生成を実現するために、EmoCtrl-TTSは擬似ラベルに基づく27,000時間以上の表現データを用いて訓練される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:54:15 GMT)
To Believe or Not to Believe Your LLM [51.3] 大規模言語モデル(LLM)における不確実性定量化について検討する。
疫学的な不確実性が大きい場合にのみ確実に検出できる情報理論の指標を導出する。
定式化の利点を実証する一連の実験を行う。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:55:51 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models [51.2] 我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する学習自由パラダイムであるPointSegを提案する。
PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。
ScanNet、ScanNet++、KITTI-360データセット上の14.1$%、12.3$%、12.6$%のmAPは、最先端のトレーニングフリーモデルを大きく上回っている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:31:23 GMT)
Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts [50.2] 本稿では,2Dポイントやボックスプロンプトから3Dオブジェクトを自動的にラベル付けするアルゴリズムを提案する。
従来のアートとは異なり、自動ラベルはバウンディングボックスの代わりに3D形状を予測し、特定のデータセットのトレーニングを必要としない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:32:53 GMT)
Mamba-PTQ: Outlier Channels in Recurrent Large Language Models [49.2] 本研究では,マンバモデルが注目型LLMで観測された異常チャネルと同じパターンを示すことを示す。
本研究では,SSMの定量化が難しい理由は,トランスフォーマーベースLLMで見られるような,アクティベーションアウトレーヤによるものであることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:21:06 GMT)
Generalizable Human Gaussians for Sparse View Synthesis [48.5] そこで本研究では,光写実的かつ正確な視線レンダリングを可能にする,一般化可能なヒトガウシアンを学習するための新しい手法を提案する。
このアプローチの重要な革新は、3次元ガウスパラメータの学習を、人間のテンプレートの2次元UV空間上で定義された回帰プロセスに再構成することである。
提案手法は,データ内一般化とクロスデータセット一般化設定の両方において,最近の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:56:30 GMT)
Similarity of Neural Architectures using Adversarial Attack Transferability [47.7] ニューラルネットワーク間の定量的かつスケーラブルな類似度尺度を設計する。
我々は69の最先端画像ネット分類器を大規模に解析する。
我々の結果は、異なるコンポーネントを持つ多様なニューラルアーキテクチャの開発がなぜ必要かについての洞察を提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:10:22 GMT)
MUSES: The Multi-Sensor Semantic Perception Dataset for Driving under Uncertainty [46.4] MUSES(MUlti-Sensor Semantic 知覚データセット)を導入する。
データセットはフレームカメラ、ライダー、レーダー、イベントカメラ、IMU/GNSSセンサーを統合する。
MUSESは、様々な視覚条件下でモデルを評価するのに、トレーニングと挑戦の両方に効果的であることを証明している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:31:44 GMT)
The Better Angels of Machine Personality: How Personality Relates to LLM Safety [46.3] LLM(Large Language Models)における人格特性と安全能力の関係は謎のままである。
LLMの性格特性が安全性と密接に関連していることが判明した。
ISTJからISTPへパーソナリティを誘導すると、プライバシとフェアネスのパフォーマンスが約43%と10%向上した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:36:29 GMT)
NL2Contact: Natural Language Guided 3D Hand-Object Contact Modeling with Diffusion Model [45.0] NL2Contactは、段階拡散モデルを利用して制御可能な接触を生成するモデルである。
手と接触の言語記述を与えられたNL2Contactは、現実的で忠実な3Dハンドオブジェクト接触を生成する。
ポーズの最適化と新しい人間のグリップ生成のためのモデルの適用例を示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:46:40 GMT)
Table Meets LLM: Can Large Language Models Understand Structured Table Data? A Benchmark and Empirical Study [44.4] 大規模言語モデル(LLM)は、自然言語(NL)に関連する課題を解決するために、数ショットの推論器として魅力的になってきている。
LLMの構造的理解能力を評価するためのベンチマークを設計して,これを理解しようと試みる。
重要な値や範囲識別など,効率的な構造的プロンプトのための$textitself-augmentation$を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:26:03 GMT)
Rethinking the Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A Review [43.3] 自動走行は、個人、公共、貨物の移動に革命をもたらす可能性がある。
安全と進歩を促進するために、多くの研究は周囲の交通の将来の動きを予測するモジュールに依存している。
最近のモデルでは、双方向の相互作用をモデル化するための共同または相互依存的なステップで予測と計画を統合する傾向が強まっている。
我々は、最先端のディープラーニングベースの予測と計画を体系的にレビューし、統合された予測と計画モデルに焦点を当てる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:35:26 GMT)
Molecule Language Model with Augmented Pairs and Expertise Transfer [43.3] AMOLE は,(1) 構造的類似性を保った分子文対を増大させ,2) 分子間の専門知識を伝達する。
様々な下流タスクに関する大規模な実験は、コンプレッション分子におけるAMOLEの優位性とその説明を実証している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:09:25 GMT)
On the Effect of (Near) Duplicate Subwords in Language Modelling [43.2] ほぼ重複したサブワードがLMトレーニング効率に及ぼす影響について検討する。
完全に複製された環境でトレーニングを行う場合、LMには約17%のデータが必要であることが分かりました。
副語重複はLM訓練効率に悪影響を及ぼすが、自然に重複の近くで起こることは予想されるほどは似ていないかもしれない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:39:39 GMT)
Symmetric Replay Training: Enhancing Sample Efficiency in Deep Reinforcement Learning for Combinatorial Optimization [42.9] 本稿では,SRT (symmetric replay training) と呼ばれる簡易かつ効果的な手法を提案する。
提案手法は,オンラインインタラクションを伴わない対称領域の探索を促進するために,高解像度サンプルを活用する。
実世界のタスクに適用した多種多様なDRL法に対して,本手法を一貫したサンプル効率向上効果を示す実験結果を得た。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:55:45 GMT)
MoAI: Mixture of All Intelligence for Large Language and Vision Models [42.2] Mixture of All Intelligence (MoAI)は、命令調整型大規模言語および視覚モデル(LLVM)である。
MoAIは外部セグメンテーション、検出、SGG、OCRモデルの出力から得られる補助的な視覚情報を使用する。
MoAIは、多数のゼロショットビジョン言語(VL)タスクにおいて、オープンソースとクローズドソースのLLVMの両方を著しく上回っている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:57:46 GMT)
SUMix: Mixup with Semantic and Uncertain Information [42.0] 混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。
そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:46:52 GMT)
Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models [42.0] 現在のエージェントフレームワークは、シングルエージェント実行への依存に悩まされ、モジュール間通信が堅牢でないことが多い。
協調的なMARLにおける協調行動を可能にするための協調エージェントとして,大規模言語モデルを訓練するためのフレームワークを提案する。
伝搬ネットワークは、放送意図をチームメイト固有のコミュニケーションメッセージに変換し、指定されたチームメイトと関連する目標を共有する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:14:00 GMT)
Crossing exceptional points in non-Hermitian quantum systems [41.9] 例外点を越えた非エルミート系における2光子量子状態の挙動を明らかにする。
例外点において、光子の量子干渉のスイッチングを実演する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:04:00 GMT)
Exploring the Untouched Sweeps for Conflict-Aware 3D Segmentation Pretraining [41.1] LiDARカメラによる3D画像の事前学習は、3D知覚タスクと関連する応用に有意な可能性を示唆している。
未探索フレームからLiDAR-画像ペアを精巧に選択するための,ビジョン・ファウンデーション・モデル駆動型サンプル探索モジュールを提案する。
我々の手法は、既存の最先端の事前訓練フレームワークを3つの主要な公道走行データセットで一貫して上回っている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:32:55 GMT)
Interpretable by Design: Wrapper Boxes Combine Neural Performance with Faithful Attribution of Model Decisions to Training Data [40.8] モデル予測のための忠実な例に基づく説明を生成するための一般的なアプローチであるラッパーボックスを提案する。
ニューラルネットワークを通常のように訓練した後、学習された特徴表現は古典的な解釈可能なモデルに入力され、実際の予測を実行する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 19:30:42 GMT)
Mutual Information Guided Optimal Transport for Unsupervised Visible-Infrared Person Re-identification [39.7] 非監視型赤外線人物再識別 (USVI-ReID) は, ラベル情報を用いることなく, 異質な歩行者画像を取得することを目的とした, 難易度の高い検索課題である。
本稿では,モデルの相互情報に基づいて,教師なしVI-ReIDの最適化目標を導出する。
彼らの指導のもと、モデルトレーニングと相互モダリティマッチングの交互にループ反復的なトレーニング戦略を設計する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:32:07 GMT)
A Three-Stage Algorithm for the Closest String Problem on Artificial and Real Gene Sequences [39.6] ストロースト文字列問題(Closest String Problem)は、与えられた文字列の集合に属するすべての列から最小距離の文字列を見つけることを目的としたNPハード問題である。
本稿では,次の3段階のアルゴリズムを提案する。まず,検索領域を効果的に見つけるために,検索空間を削減するために,新しいアルファベットプルーニング手法を適用する。
第二に、解を見つけるためのビーム探索の変種を用いる。この方法は、部分解の期待距離スコアに基づいて、新たに開発された誘導関数を利用する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:26:27 GMT)
PanoVOS: Bridging Non-panoramic and Panoramic Views with Transformer for Video Segmentation [39.3] パノラマビデオデータセットPanoVOSを提案する。
データセットは150本のビデオに高解像度と多様なモーションを提供する。
パノラマ空間整合変換器(PSCFormer)は,従来のフレームのセマンティック境界情報を,現在のフレームとの画素レベルのマッチングに有効に利用することができる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:44:21 GMT)
EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.0] 知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。
ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。
The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:55:42 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.6] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:45:49 GMT)
Struct-X: Enhancing Large Language Models Reasoning with Structured Data [38.6] 構造Xは5つの重要なフェーズを通して動作する:read-model-fill-reflect-reason'
構造化データをグラフ埋め込みを用いて位相空間にエンコードする。
行方不明のエンティティ情報を知識検索モジュールで埋める。
最後のフェーズでは、選択したトークンでトポロジネットワークを構築する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:06:25 GMT)
JointDreamer: Ensuring Geometry Consistency and Text Congruence in Text-to-3D Generation via Joint Score Distillation [38.3] textbfJoint textbfScore textbfDistillation (JSD) を提案する。
JSDは、スコア蒸留サンプリングにおける3次元不整合問題を著しく軽減する。
筆者らのフレームワークであるJointDreamerは,テキストから3D生成の新しいベンチマークを構築している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:23:47 GMT)
Graph Signal Processing for Cross-Domain Recommendation [37.9] クロスドメインレコメンデーション(CDR)は、高密度ドメインからのユーザ-イテムインタラクションを活用して、データ空間とコールドスタート問題を緩和することにより、従来のレコメンデーションシステムを拡張する。
既存のCDR手法の多くは、重複するユーザの割合と、ソースドメインとターゲットドメインの固有の相違に敏感である。
GSPに基づく統一CDRフレームワークであるCGSPを提案し、ターゲットのみの類似性とソースブリッジの類似性を柔軟に組み合わせて構築されたクロスドメイン類似性グラフを利用する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:52:45 GMT)
LookupViT: Compressing visual information to a limited number of tokens [36.8] ビジョントランスフォーマー (ViT) は、多くの業界グレードのビジョンソリューションのデファクト選択として登場した。
しかし、それらの推論コストは、トークン数の複雑さに悩まされる各レイヤにおける自己注意を計算するため、多くの設定で禁止される可能性がある。
本研究では、この情報空間を利用してViT推論コストを削減するLookupViTを紹介する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:22:43 GMT)
Can You Learn Semantics Through Next-Word Prediction? The Case of Entailment [36.8] Merrillらは、理論上、最適なLMによって予測される文共起確率は、構成文の詳細な関係を反映すべきであると主張している。
本稿では,その理論をニューラルネットワークから包含関係を復号化するために利用できるか検討する。
それらのテストに類似したテストは、自然文間の係り受け関係を復号することができるが、完全には成立しない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:49:42 GMT)
Progressive Classifier and Feature Extractor Adaptation for Unsupervised Domain Adaptation on Point Clouds [36.6] 非教師なしドメイン適応(UDA)は、ポイントクラウド分析の分野において重要な課題である。
本稿では,3次元UDAのための分類器と特徴抽出器を深く結合した新しいフレームワークを提案する。
われわれのPCFEAはマクロレベルとマイクロレベルという2つの異なる視点から3D UDAを実施している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:46:28 GMT)
Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms [34.6] モノグラフは、平均報酬決定過程(MDPs)の文脈内で制約された様々なモデルベースおよびモデルフリーアプローチの探索に焦点を当てている
このアルゴリズムは制約付きMDPの解法として検討されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:32:18 GMT)
The First to Know: How Token Distributions Reveal Hidden Knowledge in Large Vision-Language Models? [34.3] 本研究では線形プローブを用いてLVLMの出力層における隠れた知識を隠蔽する。
本報告では,最初のトークンのロジット分布は命令に応答するかどうかを決定するのに十分な情報を含んでいることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:54:38 GMT)
Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.6] 我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。
Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。
私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:46:37 GMT)
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers [31.5] 生成的トレーニングは視覚言語モデルを構築する上で強力であることが示されている。
ゼロショット判別ベンチマークでは、生成的および差別的目的で訓練されたモデルの間にはまだパフォーマンスのギャップがある。
本稿では,分類作業における生成学習の有効性を向上させることにより,このギャップを狭めることを目的とする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:10:24 GMT)
Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments [31.4] 本稿では,階層型階層型ニューラルネットワーク(SHNN)を提案する。
SHNNはまずグローバル空間をタスク割り当てによってローカルエンティティレベルのグラフに動的に分離する。
その後、局所的なエンティティレベルのグラフを渡って、局所的な参照フレームを考案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:37:34 GMT)
TriNeRFLet: A Wavelet Based Triplane NeRF Representation [31.4] 本研究では,NRFの2次元ウェーブレットに基づくマルチスケールトリプレーン表現を提案する。
また, 拡散モデルとTriNeRFLetを組み合わせた新しい超解像法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:14:34 GMT)
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models [30.7] 我々は、VLN特化モデルとLLMに基づくナビゲーションパラダイムの分割を橋渡しする。
我々は、効果的な行動予測とナビゲーション推論のために、LCMとナビゲーションポリシーネットワークを組み込む方法を利用する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:44:26 GMT)
Base Models for Parabolic Partial Differential Equations [30.6] パラボリック偏微分方程式(PDE)は、様々な数学的対象の進化をモデル化するために多くの分野に現れる。
このPDEの異なるパラメータに対応する複数のシナリオにおいて、パラメトリックPDEに対する解の解や関数を計算することがしばしば必要である。
本稿では,メタラーニングを基盤としたパラボリックPDEの解を見つけるためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:04:28 GMT)
MerRec: A Large-scale Multipurpose Mercari Dataset for Consumer-to-Consumer Recommendation Systems [30.4] 我々は、Mercuri eコマースプラットフォームからソースされたC2Cレコメンデーションに特化した、最初の大規模データセットであるMerRecを紹介します。
MerRecには user_id, item_id, session_id といった標準機能だけでなく,タイムスタンプアクションタイプや製品分類,テキスト製品属性といったユニークな要素も含まれている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:09:31 GMT)
Clustered-patch Element Connection for Few-shot Learning [29.9] 本稿では,ミスマッチ問題を修正するために,新しいクラスタ化パッチ要素接続層を提案する。
我々のCECNetは、分類ベンチマークで最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:51:29 GMT)
Direct Unlearning Optimization for Robust and Safe Text-to-Image Models [29.9] モデルが潜在的に有害なコンテンツを生成する能力を取り除くために、未学習の技術が開発されている。
これらの手法は敵の攻撃によって容易に回避され、生成した画像の安全性を確保するには信頼性が低い。
T2IモデルからNot Safe For Work(NSFW)コンテンツを除去するための新しいフレームワークであるDirect Unlearning Optimization (DUO)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:19:11 GMT)
Modeling Relational Patterns for Logical Query Answering over Knowledge Graphs [29.5] そこで我々は,複雑な空間における回転により,クエリ領域を幾何学的円錐と代数的クエリ演算子として定義する新しいクエリ埋め込み手法RoConEを開発した。
いくつかのベンチマークデータセットに対する実験結果から,論理的問合せ処理の強化のための関係パターンの利点が確認された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:57:25 GMT)
Binomial Self-compensation for Motion Error in Dynamic 3D Scanning [29.2] オブジェクトが静的でなければならないというPSPの基本的な仮定は、動的測定において破られる。
本研究では,4ステップPSPの動作誤差を効果的かつ柔軟に除去するBSCアルゴリズムを提案する。
我々のBSCは、カメラの取得率(90fps)に匹敵する深度マップのフレームレートを実現しつつ、既存の動作誤差低減手法よりも優れています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:01:14 GMT)
ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data [28.6] ProcTagは、文書命令データの有効性を評価するデータ指向の手法である。
実験により、既存のオープンソースおよび生成された文書VQA/インストラクションデータセットをProcTagでサンプリングすることは、インストラクションデータを評価する現在の方法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:29:59 GMT)
OMG-Net: A Deep Learning Framework Deploying Segment Anything to Detect Pan-Cancer Mitotic Figures from Haematoxylin and Eosin-Stained Slides [27.8] 本研究では,デジタル化された全スライド画像(WSI)におけるMFを検出する人工知能(AI)アプローチを提案する。
ここでは、社内の軟部組織腫瘍データセット(STMF)と、IPAC、TUPAC、CCMCT、CMC、MIDOG++の5つのオープンソースの有糸分裂データセットを組み合わせることで、最大の有糸分裂像のパン・カンサデータセットを確立する。
次に、2段階のフレームワーク(Optimized Mitoses Generator Network (OMG-Net))を用いてMFを分類した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:53:37 GMT)
Less is More: Sparse Watermarking in LLMs with Enhanced Text Quality [27.6] テキストに分散した生成されたトークンの小さなサブセットに透かしを適用することで、このトレードオフを緩和することを目的とした新しいタイプの透かしであるスパース透かしを提案する。
提案手法は,従来の透かし手法よりも高い品質のテキストを生成しつつ,高い検出性を実現することを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:52:12 GMT)
Weakly-Supervised 3D Hand Reconstruction with Knowledge Prior and Uncertainty Guidance [27.2] 所要の3Dデータを取得することは、制御された環境に特殊な機器を配置することを必要とするため、完全教師付き単眼3Dハンドリコンストラクションは困難であることが多い。
本稿では,人間の手の構造や機能を理解する上で確立された基本原理を活用することによって,そのような要求を回避する弱教師付き手法を提案する。
提案手法は広く採用されている FreiHAND データセットに対して約21% の性能向上を実現する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:05:34 GMT)
A Novel Dependency Framework for Enhancing Discourse Data Analysis [27.2] この研究はPDTBアノテーションを依存性構造に変換することに重点を置いている。
改良されたBERTベースの談話を用いて、英語、中国語、その他の言語でPDTBスタイルのコーパスから派生した依存性データの妥当性を検証している。
その結果,PDTB依存性データは有効であり,両者の依存関係距離には強い相関関係があることが示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:55:00 GMT)
Scissorhands: Scrub Data Influence via Connection Sensitivity in Networks [26.4] 我々は、訓練されたモデルからデータの影響を消すために、Scisorhandsの新しい機械学習アプローチを提案する。
画像分類と画像生成タスクにまたがって実施した実験の結果,Scisorhandsが競争性能を示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:34:04 GMT)
The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation [26.2] この研究は、拡散モデルが芸術的創造性や専門知識を必要とするプロンプトから画像を生成する方法を探る。
本稿では,現実的なシナリオと幻想的なシナリオを融合した新しい評価フレームワークであるRealistic-Fantasy Benchmark(RFBench)を紹介する。
広汎な人的評価とGPTに基づく構成的評価は、我々のアプローチが最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:04:10 GMT)
Improving Air Mobility for Pre-Disaster Planning with Neural Network Accelerated Genetic Algorithm [26.1] 気象災害に関連する緊急作戦は、航空機と空港の両方での空輸に大きな課題をもたらす。
そこで本稿では,空港の運用スケジュールを事前に調整するためのフレームワークを提案する。
次に、避難計画のための新しいニューラルネットワーク(NN)高速化遺伝的アルゴリズム(GA)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:59:41 GMT)
Gaussian Splatting on the Move: Blur and Rolling Shutter Compensation for Natural Camera Motion [25.5] 本稿では,カメラの動きに適応し,手持ち映像データを用いた高品質なシーン再構成を実現する手法を提案する。
合成データと実データの両方を用いて、既存の手法よりもカメラの動きを軽減できる性能を示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:50:14 GMT)
Learning in Deep Factor Graphs with Gaussian Belief Propagation [25.5] 我々は,すべての関連する量をグラフィカルモデルにおけるランダム変数として扱い,学習と予測の両方を異なる観測ノードでの推論問題とみなす。
本実験は,更新が本質的に局所的である信念伝播(BP)を用いて,これらの問題を効率的に解けることを示す。
私たちのアプローチはディープネットワークに拡張することができ、継続的な学習を行う自然な手段を提供します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:03:50 GMT)
Improving Adversarial Transferability via Model Alignment [25.4] 本稿では,トランスファー可能な逆方向摂動を生成するためのモデルアライメント手法を提案する。
さまざまなモデルアーキテクチャを用いたImageNetデータセットの実験では、アライメントされたソースモデルから発生する摂動が、転送可能性を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:45:09 GMT)
SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition [25.3] 我々はSkateFormer(SkateFormer)と呼ばれる新しい手法を提案する。
SkateFormerは、さまざまなタイプの骨格と時間の関係に基づいて関節とフレームを分割する。
アクション適応的な方法で、アクション認識に不可欠なキージョイントやフレームに選択的にフォーカスすることができる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:00:42 GMT)
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections [25.2] Splatfacto-Wは、ガウスごとのニューラルカラー特徴と画像ごとの外観をレンダリングプロセスに組み込む、自明なアプローチである。
提案手法は,3DGSに比べて平均5.3dBのPak Signal-to-Noise Ratio(PSNR)を向上し,NeRF法に比べて150倍のトレーニング速度を向上し,3DGSと同様のレンダリング速度を実現する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:02:54 GMT)
Accelerating the inference of string generation-based chemical reaction models for industrial applications [25.1] 本稿では,自動回帰SMILESジェネレータの投機的復号化による推論を高速化する手法を提案する。
反応予測と1段階の逆合成では3倍高速な推算が可能であり,精度は低下しない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:43:17 GMT)
Toward INT4 Fixed-Point Training via Exploring Quantization Error for Gradients [25.0] 大振幅勾配の誤差の低減は量子化性能を著しく向上させることを示す。
また、大きな勾配に対する小さな量子化誤差を維持するために、量子化間隔を適応的に調整する間隔更新アルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:06:12 GMT)
MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline [24.9] 本稿では,Large Language Models (LLMs) を反復的なフィードバック学習に活用する,学習不要のパイプラインであるMERLINを紹介する。
MERLINは、クエリの埋め込みをユーザの視点から洗練し、クエリとビデオコンテンツのアライメントを強化する。
MSR-VTT、MSVD、ActivityNetといったデータセットの実験結果は、MERLINがRecall@1を大幅に改善し、既存のシステムよりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:45:02 GMT)
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning [24.7] 本稿では,数理推論にコードアシストと自己補正を併用した思考の分解を利用した大規模言語モデル(LLM)について紹介する。
DotaMathモデルは複雑な数学的タスクに対処し、それらをより単純な論理的なサブタスクに分解し、コードを利用してこれらのサブタスクを解決する。
そこで我々は,DotaMathQAの模倣学習を用いて,オープンソースのLLMと比較して優れた性能を示すDotaMathモデルを訓練した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:13:05 GMT)
Model Provenance via Model DNA [23.9] 本稿では,機械学習モデルの特徴を表現した新しいモデルDNAについて紹介する。
本研究では,対象モデルの事前学習モデルであるかどうかを識別できるモデル証明同定のための効率的なフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:53:32 GMT)
Uncertainty Calibration with Energy Based Instance-wise Scaling in the Wild Dataset [23.2] エネルギーモデルに基づく新しいインスタンスワイドキャリブレーション手法を提案する。
本手法は,ソフトマックス信頼性スコアの代わりにエネルギースコアを組み込むことにより,不確実性を考慮した適応的な検討を可能にする。
実験では,提案手法はスペクトル間のロバストな性能を一貫して維持することを示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:14:55 GMT)
CaBaFL: Asynchronous Federated Learning via Hierarchical Cache and Feature Balance [23.1] 有望な分散機械学習パラダイムとしてのフェデレートラーニング(FL)は、AIoT(Artificial Intelligence of Things)アプリケーションで広く採用されている。
FLの効率性と推論能力は、トラグラーの存在と大規模なAIoTデバイス間のデータの不均衡により、著しく制限されている。
本稿では,階層型キャッシュベースのアグリゲーション機構と機能バランス誘導型デバイス選択戦略を含む,CaBaFLという新しいFLアプローチを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:56:18 GMT)
Building Intelligence Identification System via Large Language Model Watermarking: A Survey and Beyond [22.9] 大規模言語モデル(LLM)は多種多様な産業に統合され、不正な複製と誤用により重大なセキュリティリスクが生じる。
本稿では,識別過程を体系化し,より正確でカスタマイズされた透かしを実現する相互情報理論に基づく数学的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:08:14 GMT)
Select and Distill: Selective Dual-Teacher Knowledge Transfer for Continual Learning on Vision-Language Models [22.9] 大規模視覚言語モデル(VLM)は、目に見えない領域データに対して強力なゼロショット一般化能力を示す。
訓練済みのVLMを下流の一連のタスクに適応させることは、しばしば以前に学んだ知識を忘れてしまう。
本稿では,これまでに学習した知識とゼロショット機能を維持するために,独特なSelective Dual-Teacher Knowledge Transferフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:53:25 GMT)
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation [22.8] Part-Aware Network (PANet) は、航空機の翼や尾などの3Dオブジェクトの異なる部分のローカライズと理解を目的としている。
提案手法は,任意のビュー下での3次元オブジェクト認識処理において,既存のビューベースアグリゲーションベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:52:05 GMT)
AudienceView: AI-Assisted Interpretation of Audience Feedback in Journalism [21.2] AudienceViewは、ジャーナリストがオーディエンスフィードバックを分類し解釈するのを助けるオンラインツールだ。
このようなツールがジャーナリストのワークフローにどのように役立つかを検討し,文脈認識と人的判断の重要性を強調した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:41:35 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0] 既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。
これまでの研究は、悪天候をシミュレートしたり、トレーニング中に普遍的なデータ拡張を採用することでこの問題に対処してきた。
本稿では,性能劣化の主な原因を特定するために,新たな戦略データ拡張手法を提案する。
提案手法はセマンティックKITTI-to-SemanticSTFベンチマークで39.5 mIoUを達成し,ベースラインを8.1%改善し,新たな最先端技術を確立した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:50:27 GMT)
Preventing Catastrophic Overfitting in Fast Adversarial Training: A Bi-level Optimization Perspective [21.0] 対人訓練(AT)は、敵例(AE)に対する効果的な防御方法となっている。
Fast AT (FAT) はトレーニングプロセスのガイドに単一ステップの攻撃戦略を採用している。
FAT法は破滅的なオーバーフィッティング問題に悩まされる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:53:20 GMT)
The Future of Learning: Large Language Models through the Lens of Students [20.6] 学生はChatGPTの効率を学習と情報探索に活用するというジレンマに悩まされる。
学生はChatGPTを従来のAIよりも「人間的」だと考えている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:40:37 GMT)
SambaLingo: Teaching Large Language Models New Languages [16.7] 我々は,LLMの新たな言語への適応に関する包括的調査を行う。
本研究は,語彙拡張や直接選好最適化など,このプロセスの主要なコンポーネントについて述べる。
9つの言語と2つのパラメータスケールでこれらの実験をスケールします。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:30:56 GMT)
Close the Sim2real Gap via Physically-based Structured Light Synthetic Data Simulation [16.7] 我々は、RGBと物理的にリアルな深度画像を生成する革新的な構造化光シミュレーションシステムを導入する。
ロボット産業の把握シナリオに適したRGBDデータセットを作成します。
sim2realのギャップを減らし、深層学習訓練を強化することにより、深層学習モデルを産業環境に適用しやすくする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:57:14 GMT)
Continual Learning for Adaptable Car-Following in Dynamic Traffic Environments [16.6] 自動運転技術の継続的な進化には、多様なダイナミックな交通環境に適応できる自動車追従モデルが必要である。
従来の学習ベースのモデルは、連続的な学習能力の欠如により、目に見えないトラフィックパターンに遭遇する際のパフォーマンス低下に悩まされることが多い。
本稿では,この制限に対処する連続学習に基づく新しい車追従モデルを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:32:52 GMT)
Investigating and Defending Shortcut Learning in Personalized Diffusion Models [16.6] ショートカット学習のレンズを通して、パーソナライズされた拡散モデルの微調整過程を詳しく調べる。
この微調整時のミスアライメントは、モデルがノイズパターンと識別子を関連付ける原因となり、性能が低下する。
提案手法は,まず画像に固有の意味的意味を潜時空間で認識する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:02:01 GMT)
Security Matrix for Multimodal Agents on Mobile Devices: A Systematic and Proof of Concept Study [16.6] マルチモーダル大規模言語モデルの推論能力の急速な進歩は、モバイルデバイス上での自律エージェントシステムの開発をきっかけにしている。
ヒトと機械の相互作用効率が向上したにもかかわらず、MLLMベースの移動エージェントシステムのセキュリティリスクは体系的に研究されていない。
本稿では,MLLMシステムの設計におけるセキュリティ意識の必要性を強調し,今後の攻撃・防御手法の研究の道を開く。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:36:56 GMT)
Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates [16.5] 本稿では,酵素をすべての官能基にまたがって設計する統一モデルを学ぶためのアプローチであるEnzyGenを提案する。
我々のキーとなるアイデアは、酵素のアミノ酸配列とその3D座標を、所望の触媒機能に対応する機能的に重要な部位と基質に基づいて生成することである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:14:32 GMT)
In-Context Probing Approximates Influence Function for Data Valuation [16.4] そこで本研究では,文脈内探索によるデータ評価が,学習データ選択に影響を及ぼすことを示す。
実験結果から, 文脈内探索と勾配に基づく影響フレームワークは, トレーニングデータのランク付け方法に類似していることがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:06:56 GMT)
Evaluating the transferability potential of deep learning models for climate downscaling [16.3] 複数の気候データセットを用いた深層学習ダウンスケーリングモデルのトレーニングの有効性を評価し,より堅牢で伝達可能な表現を学習する。
ダウンスケーリングモデルの空間的, 変動的, 製品移動可能性について実験的に評価し, これらの異なるアーキテクチャの一般化可能性について考察する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 12:10:24 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3] NOVICは、革新的なuN制約付きOpen Vocabulary Imageである。
埋め込みスペースを利用して、純粋なテキストから画像へのゼロショット転送を可能にする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:23:42 GMT)
Evaluating Linguistic Capabilities of Multimodal LLMs in the Lens of Few-Shot Learning [15.9] 本研究では,VALSEベンチマークを用いたマルチモーダル大規模言語モデル(MLLM)の性能評価を目的とした。
我々は,モデルサイズや事前学習データセットの異なる最先端MLLMの包括的評価を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:26:47 GMT)
InfoNorm: Mutual Information Shaping of Normals for Sparse-View Reconstruction [15.9] 多視点画像からの3次元表面再構成はシーン理解とインタラクションに不可欠である。
ニューラルレージアンス場(NeRF)や符号付き距離関数(SDF)といった近年の暗黙的な表面表現は、観測情報の欠如を解決するために様々な幾何学的先行法を用いている。
本稿では,高度に相関したシーンポイントの表面正規化における相互情報を明確に促進することにより,幾何学的モデリングの正規化を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:46:25 GMT)
The Role of Network and Identity in the Diffusion of Hashtags [15.8] 本稿では,Twitter上の人気ハッシュタグ1,337の拡散における2つの社会的要因の役割を包括的に調査する。
カスケードはネットワークとアイデンティティの組み合わせでモデル化されるのが最適である。
機能の組み合わせごとにどのハッシュタグが最適かを予測することができ、これを使ってパフォーマンスをさらに向上します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:51:49 GMT)
A Recent Survey of Heterogeneous Transfer Learning [15.8] 異種移動学習は 様々なタスクにおいて 重要な戦略となっている。
データベースとモデルベースの両方のアプローチを網羅した60以上のHTLメソッドの広範なレビューを提供する。
自然言語処理,コンピュータビジョン,マルチモーダル学習,バイオメディシンの応用について検討する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:56:45 GMT)
Think Big, Generate Quick: LLM-to-SLM for Fast Autoregressive Decoding [15.7] 大規模言語モデル(LLM)は、実際にはユビキタスなものとなり、翻訳、要約、命令の追従といった生成タスクに広く利用されている。
本稿では,異なるサイズの言語モデルを組み合わせて,自己回帰復号化の効率を高めるハイブリッド手法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:59:48 GMT)
Pack and Detect: Fast Object Detection in Videos Using Region-of-Interest Packing [15.2] そこで我々は,ビデオにおけるオブジェクト検出の計算要求を削減するためのPack and Detectを提案する。
ImageNetのビデオオブジェクト検出データセットを使用した実験は、PaDがフレームに必要なFLOPSの数を4.99ドル削減できることを示している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:09:10 GMT)
Temporal receptive field in dynamic graph learning: A comprehensive analysis [15.2] 本稿では,動的グラフ学習における時間受容領域の包括的解析について述べる。
その結果,適切な時間的受容場を選択すれば,モデルの性能が大幅に向上することが示された。
一部のモデルでは、過度に大きなウィンドウがノイズを発生させ、精度を低下させる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:46:53 GMT)
Dual-level Adaptive Self-Labeling for Novel Class Discovery in Point Cloud Segmentation [15.0] そこで我々は,点雲セグメンテーションにおける新しいクラス発見に挑戦し,見受けられるクラスの意味的知識に基づいて,新しいクラスを発見する。
既存の研究は、解の退化を避けるために、新しいクラスに等しいクラスサイズの制約を単純化したオンラインポイントワイズクラスタリング手法を提案する。
本研究では,モデル学習中に不均衡なクラスに対して,高品質な擬似ラベルを適応的に生成する新たな自己ラベル方式を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:14:46 GMT)
Federated Learning Can Find Friends That Are Advantageous [15.0] フェデレートラーニング(FL)では、クライアントデータの分散の性質と均一性は、機会と課題の両方を示します。
本稿では,FLトレーニングに参加するクライアントに対して適応的なアグリゲーション重みを割り当てるアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:49:30 GMT)
Shap-Mix: Shapley Value Guided Mixing for Long-Tailed Skeleton Based Action Recognition [14.8] 長い尾の学習は、重要な時空間運動パターンの欠如により、準最適である。
そこで我々は,末尾カテゴリーの代表動作パターンをマイニングすることで長尾学習を改善するShap-Mixを提案する。
我々の実験では、長い尾とバランスの取れた環境下での顕著なパフォーマンス改善が示されています。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:25:51 GMT)
TransCAD: A Hierarchical Transformer for CAD Sequence Inference from Point Clouds [14.6] 物理物体の3次元スキャンによりCADモデルを推定する3次元リバースエンジニアリングは、有望な研究方向である。
本稿では,ポイントクラウドからCADシーケンスを予測するエンドツーエンドトランスフォーマーアーキテクチャであるTransCADを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:24:36 GMT)
UTG: Towards a Unified View of Snapshot and Event Based Models for Temporal Graphs [14.6] スナップショットベースおよびイベントベース機械学習モデルを統一するフレームワークであるUTG(Unified Temporal Graph)を導入する。
時系列リンク予測タスクにおいて、スナップショットとイベントベースモデルの両方を時間グラフの両タイプで評価する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:35:24 GMT)
Denoising Diffusions in Latent Space for Medical Image Segmentation [14.5] 拡散モデル(DPM)は画像生成において顕著な性能を示しており、しばしば他の生成モデルよりも優れている。
医用画像セグメンテーションのための潜在空間で拡散する新しい条件生成モデリングフレームワーク(LDSeg)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:44:38 GMT)
Efficient and Flexible Differet-Radix Montgomery Modular Multiplication for Hardware Implementation [14.5] DRMMMと呼ばれる反復モンゴメリーモジュラー乗算の効率的な並列変乗法を提案し、複数の反復で商を計算できるようにする。
提案した変種に基づいて,高速な動作を実現するための高性能ハードウェア実装アーキテクチャを設計する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:24:15 GMT)
Attribute Based Interpretable Evaluation Metrics for Generative Models [14.4] 属性強度の分布に関するトレーニングセットから生成された画像の集合のばらつきを計測する新しい評価プロトコルを提案する。
我々のメトリクスは、生成モデルの説明可能な評価の基礎を築いた。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:13:08 GMT)
IICPilot: An Intelligent Integrated Circuit Backend Design Framework Using Open EDA [14.4] IICPilotはLLM技術に基づくインテリジェントICバックエンド設計システムである。
LangChainのマルチエージェントフレームワークは、異なる設計タスクを効率的に処理する。
IICPilotはバックエンド設計ワークフローを、特定のオープンソースEDAツールから分離する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:02:01 GMT)
Privacy-Preserving Adaptive Re-Identification without Image Transfer [14.3] Re-ID(DUDA-Rid)のためのプライバシ保護型分散非教師付きドメイン適応のための新しい設定法を提案する。
エッジデバイス内で直接、人物Re-IDモデルを適応する新しいソリューションであるFed-Protoidを紹介します。
提案実験は,Fed-Protoidが精度と通信効率の両面から評価されたすべての手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:12:44 GMT)
Exploring State Space and Reasoning by Elimination in Tsetlin Machines [14.2] Tsetlin Machine(TM)は機械学習(ML)において大きな注目を集めている。
TMは、単語の埋め込みを構築し、節を使ってターゲット語を記述するために使われる。
これらの節の記述能力を高めるために,節の定式化におけるReasoning by Elimination(RbE)の概念を検討した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:42:34 GMT)
SmartQuant: CXL-based AI Model Store in Support of Runtime Configurable Weight Quantization [14.1] 近年の研究では、生成的AIモデルに対する推論において、異なる重みの重要性が文脈依存的な変化を示すことが明らかになっている。
これは自然に、生成するAI推論効率を改善するために、ウェイト量子化を適応的に設定する有望な可能性を示す。
急速に成熟したCXLエコシステムに動機づけられたこの研究は、このギャップを埋めるためのCXLベースの設計ソリューションを開発する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:39:49 GMT)
An Empirical Study of Static Analysis Tools for Secure Code Review [14.1] 静的アプリケーションセキュリティテストツール(SAST)は、セキュリティ問題の識別を強化する可能性がある。
ほとんどのSAST研究は、対象プログラムの合成または完全に脆弱なバージョンに依存している。
我々は、悪用可能な脆弱性に寄与する実際のコード変更のデータセットを使用して、C/C++ SASTを調査する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:15:39 GMT)
IW-GAE: Importance Weighted Group Accuracy Estimation for Improved Calibration and Model Selection in Unsupervised Domain Adaptation [13.8] グループ精度を推定することにより,モデルの校正とモデル選択に対処する新たな視点を提案する。
実験の結果,モデルキャリブレーションタスクでは22%,モデル選択タスクでは14%,最先端性能では22%向上した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:53:29 GMT)
Improved Nonlocality Certification via Bouncing between Bell Operators and Inequalities [13.3] 非局所性認証を改善するための最適化手法を提案する。
いくつかのハミルトン模型が古典的境界を改良した新しい不等式に写像できることを示す。
本稿では,70以上の超伝導量子ビットを用いたXXZ型ハニカム格子モデルに適用する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:47:22 GMT)
Is Sarcasm Detection A Step-by-Step Reasoning Process in Large Language Models? [13.2] 本稿ではSarcasmCueという新しいプロンプトフレームワークを紹介する。
これには4つのプロンプト戦略、$viz.$ chain of contradiction (CoC)、Graph of cues (GoC)、baging of cues (BoC)、 tensor of cues (ToC)が含まれる。
提案した4つのプロンプト法は,標準IOプロンプト法,CoT,ToTをかなりのマージンで上回り,非シーケンシャルプロンプト法は一般的には逐次プロンプト法よりも上であることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:42:03 GMT)
GUME: Graphs and User Modalities Enhancement for Long-Tail Multimodal Recommendation [13.1] 本稿では,長期マルチモーダルレコメンデーションのための新しいグラフとユーザモダリティエンハンスメント(GUME)を提案する。
具体的には、アイテム間のマルチモーダルな類似性を用いて、まずユーザ-テムグラフを拡張します。
次に、明示的なインタラクション機能と拡張された関心機能という2つのタイプのユーザモダリティを構築します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:29:00 GMT)
Private Heterogeneous Federated Learning Without a Trusted Server Revisited: Error-Optimal and Communication-Efficient Algorithms for Convex Losses [12.6] Inter-Silo Record-Level Differential Privacy (ISRL-DP)は、各サイロのデータ漏洩を防止する。
異種サイロデータの存在下で最適な過大なリスク境界を実現する新しいISRL-DP FLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 23:25:57 GMT)
CDFL: Efficient Federated Human Activity Recognition using Contrastive Learning and Deep Clustering [12.5] HAR(Human Activity Recognition)は、多様なセンサーからのデータを介し、人間の行動の自動化とインテリジェントな識別に不可欠である。
中央サーバー上のデータを集約し、集中処理を行うことによる従来の機械学習アプローチは、メモリ集約であり、プライバシの懸念を高める。
本研究は,画像ベースHARのための効率的なフェデレーション学習フレームワークCDFLを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:17:53 GMT)
Robust teleportation of a surface code and cascade of topological quantum phase transitions [12.4] 本研究では,小ベル計測を用いた長距離絡み合った表面コード状態の伝送プロトコルについて検討する。
無限に弱い絡み合いは、自己双対位相曲面コードをテレポートするのに十分である。
我々のプロトコルは、動的にRydberg原子配列で容易に実装でき、量子測定のパワーを実演するためのガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:59:53 GMT)
The Linear Representation Hypothesis and the Geometry of Large Language Models [12.4] インフォーマルに、「線形表現仮説」とは、高次概念がある表現空間の方向として線型に表現されるという考え方である。
線形表現(linear representation)とは何か?
対実対を用いて線形表現のすべての概念を統一する方法を示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:24:27 GMT)
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem [12.2] 本研究は, 強化学習環境においてアクセントを付加した, 伝達不良の原因の1つを概念化したものである。
モデルは、微調整の初期段階に訪れない下流タスクの状態部分空間を劣化させる。
標準的な知識保持技術が問題を緩和し、事前訓練された能力を最大限に活用できることを示します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:29:19 GMT)
KESIC: Kerberos Extensions for Smart, IoT and CPS Devices [11.9] Kerberosは、ヘビーウェイトプロトコルとリソース制約のあるデバイスの性質のため、IoTデバイスに直接適していない。
本稿では,IoTデバイスのマルチユーザアクセスを効率的かつセキュアにするためのシステムであるKESICを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:29:18 GMT)
MEDFuse: Multimodal EHR Data Fusion with Masked Lab-Test Modeling and Large Language Models [11.8] MEDFuseは構造化および非構造化の医療データを統合するフレームワークである。
10種類のマルチラベル分類タスクにおいて、90%以上のF1スコアを達成している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:17:09 GMT)
DVLO: Deep Visual-LiDAR Odometry with Local-to-Global Feature Fusion and Bi-Directional Structure Alignment [11.8] 画像のピクセルは規則的で密度が高いが、LiDARポイントは非順序であり、スパースである。
本稿では,双方向構造アライメントを有するDVLO(ローカル・グローバル・フュージョン・ネットワーク)を提案する。
本手法は,KITTI odometry と FlyingThings3D シーンフローデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:03:33 GMT)
Semi-supervised Segmentation of Histopathology Images with Noise-Aware Topological Consistency [11.8] TopoSemiSegは、ラベルのない画像からトポロジカル表現を学習する最初の半教師付き手法である。
教師と学生モデルの表現を整合させるため,雑音を考慮したトポロジカル整合性損失を導入する。
病理組織像データセットを用いた実験により,本手法の優位性を示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:51:20 GMT)
Dynamics of discrete solitons in the fractional discrete nonlinear Schrödinger equation with the quasi-Riesz derivative [11.7] この方程式は、近傍のカップリングが長距離相互作用と結合される新しい離散系を表す。
系の線形スペクトルにおける格子波の分散関係とそれに対応する伝搬帯域は、LIの全ての値に対して正確な形で現れる。
単一部位および2部位の離散ソリトンの形成について, 反連続限界から検討した。
離散ソリトン(英語版)の移動性も、システムのピエルス・ナバロポテンシャル障壁の推定によって考慮されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:52:18 GMT)
A Multi-Modal Simulation Framework to Enable Digital Twin-based V2X Communications in Dynamic Environments [10.7] 近年,物理無線環境のためのディジタルツイン(DT)が,伝播環境の正確な仮想表現として提案されている。
本稿では,V2X通信シナリオのDT作成のための新しいデータ駆動ワークフローを提案する。
本稿では,V2Xリンク復元のためのDT支援ブロックハンドオーバタスクに関するフレームワークについて紹介する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:24:22 GMT)
Recovery of damaged information via scrambling in indefinite casual order [10.6] スクランブルは、ローカルオペレーターとのローカル情報へのアクセスを防止する。
不確定因果順序でスクランブルすることで、損傷した量子情報を復元する改良手法を示す。
クラウドベースの量子コンピュータであるQuafuについて実験を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:42:40 GMT)
Federated Representation Learning in the Under-Parameterized Regime [10.6] フェデレート・表現学習(FRL)は、クライアントが共通の表現をトレーニングし、パーソナライズされた頭を維持しながら連携する、パーソナライズド・フェデレーション・ラーニング(FL)フレームワークである。
本稿では、新しいFRLアルゴリズムFLUTEを提案し、線形モデルに対するサンプルの複雑さと収束率を理論的に特徴づける。
実験により、FLUTEは、合成タスクと実世界のタスクの両方において、最先端のFRLソリューションよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:11:08 GMT)
Maintenance Strategies for Sewer Pipes with Multi-State Degradation and Deep Reinforcement Learning [10.5] 本研究は, 下水道資産に適用される診断・健康管理フレームワークにおける2つの課題に対処する。
我々は、下水道管の劣化過程を表すために多状態劣化モデル(MSDM)を用い、保守戦略を考案するために深層強化学習(DRL)を用いる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 12:07:07 GMT)
A Novel GAN Approach to Augment Limited Tabular Data for Short-Term Substance Use Prediction [10.5] 薬物使用者の短期的物質使用行動(PWUD)を正確に予測するための機械学習モデルの有用性が注目されている。
本稿では,米国大平原における258PWUDの縦断調査データを用いて,新しいGANを開発した。
以上の結果から,提案したGANの強化データを用いてトレーニングすると,マリファナ,メス,アンフェタミン,コカインの使用において,Aの13.4%,Bの15.8%の予測性能(AUROC)が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 23:03:24 GMT)
Towards Revisiting Visual Place Recognition for Joining Submaps in Multimap SLAM [10.4] 視覚SLAMシステムにおけるサブマップマージにおける最新のVPR手法の適用効果について検討する。
ポストプロセッシングパイプラインとメトリクスのセットを使って、現代のVPRコンポーネントの影響を推定します。
我々はORB-SLAM3のマップマージ性能を改善した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:39:20 GMT)
Serialized Point Mamba: A Serialized Point Cloud Mamba Segmentation Model [9.7] シリアライズされたポイントクラウドマンバモデル(シリアライズされたポイントマンバ)を開発した。
自然言語処理におけるMambaモデルの成功に触発されて,Serialized Point Cloud Mamba Modelを提案する。
Scannetでは76.8 mIoU、S3DISでは70.3 mIoUが達成された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:26:58 GMT)
DrJAX: Scalable and Differentiable MapReduce Primitives in JAX [9.7] DrJAXは大規模分散および並列機械学習アルゴリズムをサポートするように設計されたライブラリである。
DrJAXはMapReduce計算のビルディングブロックをJAXのプリミティブとして組み込みます。
DrJAX計算はXLA HLOに直接変換することができ、幅広いMLトレーニングプラットフォームとの柔軟な統合を可能にする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:41:39 GMT)
Facial Affect Recognition based on Multi Architecture Encoder and Feature Fusion for the ABAW7 Challenge [9.6] 第7回ABAWコンペティションの課題に対処するためのアプローチを提案する。
コンテストは、Valence Arousal(VA)推定、Expression(Expr)分類、AU(Action Unit)検出の3つのサブチャンジで構成されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:01:34 GMT)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting [9.6] 時系列予測手法は、異なるシナリオに適用する場合、柔軟であるべきです。
本稿では、各フーリエ成分を個別に予測し、異なる周波数の出力を動的に融合する周波数動的融合(FreDF)を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:54:41 GMT)
VoicePilot: Harnessing LLMs as Speech Interfaces for Physically Assistive Robots [9.5] LLM(Large Language Models)を利用した音声インタフェースにより、個人はロボットに高度なコマンドや微妙な好みを伝えることができる。
高度なタスク計画とコード生成のためのロボットへのインタフェースとしてLLMを統合するためのフレームワークが提案されているが、人間中心の考慮を組み込むことはできなかった。
本稿では,身体支援ロボットの音声インタフェースとしてLLMを組み込むための枠組みについて,食事ロボットを用いた3段階の試験を反復的に構築し,11人の高齢者を対象に,独立した生活施設で評価を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:38:16 GMT)
Scalable Monte Carlo for Bayesian Learning [9.5] この本は、マルコフ連鎖モンテカルロ(MCMC)アルゴリズムにおける高度なトピックに関する大学院レベルの紹介を提供することを目的としている。
これらのトピックのほとんどは、最近10年ほど前に現れており、この分野ではかなりの実践的、理論的進歩を導いてきた。
特に注目されているのは、データ量、あるいはデータ次元に関してスケーラブルな方法である。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:19:56 GMT)
PrE-Text: Training Language Models on Private Federated Data in the Age of LLMs [9.4] PrE-Text合成データは、デバイス上で訓練された小さなモデルよりも優れていることを示す。
また,PrE-TextのDP合成データを用いて大規模モデルを微調整することで,大規模言語モデル(LLM)の性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:09:22 GMT)
Characterizing Biphoton Spatial Wave Function Dynamics with Quantum Wavefront Sensing [9.1] 量子シャック・ハートマン波面センサを導入し、双光子空間波動関数の効率的かつ参照不要な計測を行う。
我々の研究は、量子物理および適応光学における決定的なステップであり、高次相関やトポロジカルパターンで量子光学場を特徴づける道を開く。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:49:48 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.0] 従来の溶解度予測技術は、しばしば分子トラクチャーの複雑な性質を捉えるのに失敗し、予測と実際の結果の間に顕著な違いをもたらす。
本研究では,注目に基づくトランスフォーマー,Long Short-Term Memory(LSTM)ネットワーク,GCN(Graph Convolutional Networks)を組み合わせた新しいディープラーニングフレームワークを提案する。
相関係数(R2$)が0.59、ルート平均角誤差(RMSE)が0.57、ベンチマークモデルのスコアが0.52(R2$)と0.61(RMSE)を上回った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:35:31 GMT)
COKE: Causal Discovery with Chronological Order and Expert Knowledge in High Proportion of Missing Manufacturing Data [8.9] 現実世界のデータセットは、最大90%の欠落したデータと数百のセンサーから高次元性を示す。
現実の状況に類似したシナリオで欠落したデータを扱う従来の方法は、専門家の知識を効果的に活用することができなかった。
我々は,センサ間の専門知識と時間順を利用して,データ不足を抑えることにより,データセットの因果グラフを構築することを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:51:27 GMT)
Importance Weighted Expectation-Maximization for Protein Sequence Design [8.7] そこで本研究では,IsEM-Proという,特定の適合基準に向けてタンパク質配列を生成する手法を提案する。
中心となるIsEM-Proは、独立に学習されたマルコフランダムフィールド(MRF)の構造特徴によって強化された潜在生成モデルである。
8つのタンパク質配列設計タスクの実験により、我々のIsEM-Proは、平均的なフィットネススコアで少なくとも55%以上のパフォーマンスで過去のベストメソッドよりも優れていたことが示される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:21:28 GMT)
Runtime Verification and Field-based Testing for ROS-Based Robotic Systems [8.7] ROSベースのシステムを設計して実行時検証とフィールドベースのテストを可能にするための明確なガイダンスはありません。
本稿では,現場でのロボットの開発,検証,テストにおいて,開発者やQAチームを支援するガイドラインを提供することで,このギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:28:31 GMT)
Improving the classification of extreme classes by means of loss regularisation and generalised beta distributions [8.6] 本稿では,一級・一級の分類性能を向上させるための一級正規化手法を提案する。
極端なクラスのパフォーマンスは、その感度を考慮に入れた新しいメトリクスを使って比較される。
提案手法により, 一般化されたベータ分布は, 極端なクラスにおける分類性能を向上することが示された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:57:42 GMT)
LLM Inference Serving: Survey of Recent Advances and Opportunities [8.6] 本稿では,Large Language Model (LLM) サービスシステムの最近の進歩について概観する。
コアLLM復号機構を変更することなく性能と効率を向上させるシステムレベルの拡張について検討する。
この調査は、この急速に発展する分野における最新の発展を振り返りたいLLM実践者にとって、貴重なリソースとなる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:11:47 GMT)
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains [8.4] 大規模言語モデル(LLM)は近年,顕著な汎用性を示している。
健康状況に合わせて様々なオープンソース LLM が利用可能であるにもかかわらず、汎用 LLM を医療分野に適用することは重大な課題である。
我々は、Mistralを基盤モデルとして、バイオメディカルドメインに適したオープンソースのLLMであるBioMistralを紹介した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:34:00 GMT)
Universal framework for simultaneous tomography of quantum states and SPAM noise [8.4] 本稿では,量子状態と測定ノイズの同時トモグラフィーを行うアルゴリズムを提案する。
本手法は、ユニタリ演算によって誘導される線形作用素空間の特性の解析に基づく。
一般の場合、このゲージ自由度は避けられないが、状態やノイズ特性に関する事前の知識を用いて、この縮退性を破ることができる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:00:56 GMT)
Private and Federated Stochastic Convex Optimization: Efficient Strategies for Centralized Systems [8.4] 本稿では,集中型システムにおけるフェデレートラーニング(FL)におけるプライバシ保護の課題に対処する。
我々は、同種および異種データ分布に対する最適収束率を維持しつつ、微分プライバシ(DP)を確保する手法を考案した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:19:58 GMT)
CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs [7.9] 現在のカスタマサービスモデルは、カスタマプロファイルと限定的に統合されている。
既存のAPI統合は、現実世界のカスタマーサービスシナリオに不可欠な精度とエラー回避の多様性を強調している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:26:47 GMT)
Collaborative Design for Job-Seekers with Autism: A Conceptual Framework for Future Research [7.8] 最近の経験的発見は、自閉症患者と新しいデザインによる社会的環境との連携が、いかに雇用機会を向上させるかを示し始めている。
この研究は、将来の研究者や実践者が、自閉症のある求職者の協調設計を改善するために適用できる、実行可能なガイドラインと概念的フレームワークを提供することを目的としている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 19:24:03 GMT)
Towards Lower Bounds on the Depth of ReLU Neural Networks [7.4] より多くの層を追加することで、正確に表現可能な関数のクラスが厳密に増加するかどうかを考察する。
We settled an old conjecture about piecewise linear function by Wang and Sun (2005) in affirmative。
対数深度を持つ関数を表すのに必要なニューラルネットワークのサイズについて上限を述べる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:15:49 GMT)
Leveraging Environment Interaction for Automated PDDL Generation and Planning with Large Language Models [7.3] 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。
潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。
LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 19:50:51 GMT)
FETCH: A Memory-Efficient Replay Approach for Continual Learning in Image Classification [7.3] クラス増分連続学習は研究の重要な領域である。
以前の作品では、リプレイと圧縮されたリプレイ技術を用いて、有望な結果が得られた。
この作業は、GDumbのパイプラインで圧縮されたリプレイを評価することである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:54:03 GMT)
StyleForge: Enhancing Text-to-Image Synthesis for Any Artistic Styles with Dual Binding [7.3] 多様な芸術様式にまたがるパーソナライズされたテキスト・ツー・イメージ合成のための新しいアプローチであるSingle-StyleForgeを紹介した。
また、複数のトークンを部分的なスタイル属性に結合することで、画像の品質とテキストアライメントを向上させるMulti-StyleForgeを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:15:10 GMT)
Resource-efficient Medical Image Analysis with Self-adapting Forward-Forward Networks [7.2] 医療画像解析のための高速自己適応型フォワードネットワーク(SaFF-Net)を提案する。
CFFAは、高度な画像解析に適したパラメータ効率の補正であり、元のFFAの速度と一般化の制約を克服する。
提案手法により、より効果的なモデルトレーニングが可能となり、FFAにおいて任意に選択されたグッドネス関数に対して、これまで必要とされていた要求を排除できる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:35:37 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [7.1] リスク分析の原則はコンテキストレスです。
リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。
大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:02:46 GMT)
A Practical Solver for Scalar Data Topological Simplification [7.1] 本稿では,トポロジカル単純化の最適化のための実践的アプローチを提案する。
フィラメントループを除去する標準的なトポロジカル手法よりも,本手法が優れていることを示す。
また,本手法は表面処理における遺伝子欠陥の修復にも有効であることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:25:32 GMT)
MSD: A Benchmark Dataset for Floor Plan Generation of Building Complexes [7.0] textbfModified Swiss Dwellings (MSD) - 大規模なフロアプランデータセット。
MSDは中規模から大規模の複合住宅の5.3K以上のフロアプランがあり、18.9K以上のアパートをカバーしている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:24:53 GMT)
Reliability Function of Classical-Quantum Channels [7.0] 信頼性関数(Reliability function)は、通信速度がチャネルのキャパシティ以下である場合、復号エラー確率の指数的減衰を表す。
主な寄与は誤差指数に対する下界であり、これはペッツ形式におけるレナイ発散によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:30:27 GMT)
Breaking Boundaries: Investigating the Effects of Model Editing on Cross-linguistic Performance [6.9] 本稿では,多言語文脈における知識編集技術を検討することにより,言語的平等の必要性を戦略的に識別する。
Mistral, TowerInstruct, OpenHathi, Tamil-Llama, Kan-Llamaなどのモデルの性能を,英語,ドイツ語,フランス語,イタリア語,スペイン語,ヒンディー語,タミル語,カンナダ語を含む言語で評価した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:37:54 GMT)
Long-time properties of generic Floquet systems are approximately periodic with the driving period [6.9] フロッケ量子系は、周期的なハミルトニアンによって支配される。
任意の大きさのフロケ系では、離散時間結晶の挙動は厳密に無限の時間に持続しない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:11:00 GMT)
Open-Vocabulary Object Detectors: Robustness Challenges under Distribution Shifts [6.5] VLM(Vision-Language Models)は近年,画期的な成果を上げている。
VLMベースのオープン語彙オブジェクト検出は、従来のオブジェクト検出フレームワークの機能を拡張する。
本研究では,最近のOV基盤オブジェクト検出モデルのゼロショット機能について,包括的ロバスト性評価を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:49:36 GMT)
Enhanced Self-supervised Learning for Multi-modality MRI Segmentation and Classification: A Novel Approach Avoiding Model Collapse [6.3] 多モードMRI(Multi-modality magnetic resonance imaging)は、コンピュータ支援診断のための補完的な情報を提供する。
従来のディープラーニングアルゴリズムは、病変をセグメント化し、磁気共鳴画像で疾患を分類する特定の解剖学的構造を特定するのに適している。
自己教師付き学習(SSL)は、事前学習によりラベル付きデータから特徴表現を効果的に学習することができ、自然画像解析に有効であることが示されている。
ほとんどのSSLメソッドはマルチモードMRIの類似性を無視し、モデルが崩壊する。
ハイブリッドマスクパターン(HMP)とピラミッドバーローツイン(PBT)を組み合わせた多モードMRIマスク自動エンコーダの確立と検証を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:05:57 GMT)
Compound Expression Recognition via Multi Model Ensemble for the ABAW7 Challenge [6.3] 複合表現認識(CER)は、効果的な対人相互作用に不可欠である。
本稿では,この複雑さに対処するアンサンブル学習に基づくソリューションを提案する。
提案手法はRAF-DBデータセット上で高い精度を示し,ゼロショット学習によりC-EXPR-DBの一部の表現を認識できる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:59:34 GMT)
Generalized Robust Fundus Photography-based Vision Loss Estimation for High Myopia [6.2] VF推定の一般化ロバスト性を高めるための新しいパラメータ効率フレームワークを提案する。
本手法は, RMSE, MAE, 係数相関において, 内部および外部の検証において, 既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:59:32 GMT)
Fast Context-Based Low-Light Image Enhancement via Neural Implicit Representations [6.1] 現在のディープラーニングベースの低照度画像強調手法は高解像度画像としばしば競合する。
我々は、未露出画像の2次元座標を照明成分にマッピングすることで、拡張過程を再定義する、CoLIEと呼ばれる新しいアプローチを導入する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:51:52 GMT)
Across Platforms and Languages: Dutch Influencers and Legal Disclosures on Instagram, YouTube and TikTok [6.1] 本稿では,法的基準に基づいて,インフルエンサーが開示を遵守するかどうかを,透過的に測定する手法を提案する。
本手法をオランダメディア公社に登録された150人のオランダ人インフルエンサーの内容を反映した独自のデータセットに適用する。
インフルエンサーのマーケティングは、一般的にソーシャルメディア上では公表されていないが、大きなインフルエンサーは必ずしも開示基準に準拠しているとは限らない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:59:52 GMT)
A Framework for QoS of Integration Testing in Satellite Edge Clouds [6.1] 衛星エッジクラウドにサービステストの質を統合するためのフレームワークを提案する。
このフレームワークは、衛星ネットワークトポロジの変更を統合し、衛星エッジクラウドクラスタテスト環境を作成し、管理することができる。
実験の結果,サテライトエッジクラウドクラスタにおける主要なサービス品質メトリクスをテストするためのフレームワークの能力を検証することができた。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:36:03 GMT)
A Unifying Post-Processing Framework for Multi-Objective Learn-to-Defer Problems [6.0] Learn-to-Deferは、学習アルゴリズムが独立した作業ではなく、人間専門家のチームとして機能することを可能にするパラダイムである。
本稿では,様々な制約下での学習・遅延システムに対するベイズ最適解を求める。
本アルゴリズムは,一組のベースラインに対する制約違反による改善を示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:32:30 GMT)
TaylorShift: Shifting the Complexity of Self-Attention from Squared to Linear (and Back) using Taylor-Softmax [6.0] 本稿では,線形時間と空間におけるトークン間相互作用の完全な計算を可能にするテイラーソフトマックスの新たな再構成であるTaylorShiftを紹介する。
具体的には,TaylorShiftは800トークンまでのシーケンスのメモリ効率を向上し,約1700トークン以上の入力の推論を高速化することを示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:32:01 GMT)
n-Step Temporal Difference Learning with Optimal n [5.9] 我々は,n段階時間差(TD)学習におけるnの最適値を求める問題を考察する。
最適化問題に対する目的関数は平均根平均二乗誤差(RMSE)である。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:07:13 GMT)
Muting Whisper: A Universal Acoustic Adversarial Attack on Speech Foundation Models [5.9] モデル動作を操作するために,「特殊トークン」を敵攻撃によって利用することができることを示す。
本稿では,Whisper の $texttt|endoftext|>$ token の普遍的な音響的実現方法を提案する。
実験では、同じ0.64秒の対向音声セグメントが、ターゲットのWhisper ASRモデルを97%以上の音声サンプルでミュートできることを示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:59:26 GMT)
Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation [5.9] 本研究は自動運転の制御最適化問題における安全性問題に対処する。
本稿では,条件付きバリュー・アット・リスクに基づくソフトアクター批判を利用して,ポリシー最適化のための新しいモデルベースアプローチを提案する。
本手法では, 安全探索を誘導する最悪のアクターを導入し, 予測不可能なシナリオにおいても, 安全要件の厳密な遵守を確保する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:30:57 GMT)
A LLM Benchmark based on the Minecraft Builder Dialog Agent Task [5.6] 本研究では,空間的指向性タスクにおけるLLM能力を評価するのに適したLCMベンチマークにMinecraftビルダータスクを適用することを提案する。
このアプローチにより、異なるエージェントの特定の長所や短所を探索し、空間的推論とベクトルベースの数学の挑戦的な領域におけるLLMの能力をテストすることができると信じている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:52:23 GMT)
HTD-Mamba: Efficient Hyperspectral Target Detection with Pyramid State Space Model [5.5] ハイパースペクトルターゲット検出(HTD)は、ピクセルレベルの複雑な背景から興味のある対象を特定する。
本稿では, HTD-Mamba というピラミッド状態空間モデル (SSM) を用いた効率的な自己教師型 HTD 手法を提案する。
4つの公開データセットで行った実験により,提案手法は定量評価と定性評価の両方において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:12:48 GMT)
Enhancing the Utility of Privacy-Preserving Cancer Classification using Synthetic Data [5.4] 深層学習は、乳がん検出において放射線科医を補助する大きな可能性を秘めている。
最適なモデルパフォーマンスを達成することは、データの可用性と共有の制限によって妨げられます。
従来のディープラーニングモデルでは、センシティブなトレーニング情報を不注意にリークすることができる。
この研究は、プライバシー保護のディープラーニング技術の有用性の定量化を探求するこれらの課題に対処する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:52:45 GMT)
In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery [5.2] 本稿では,記号回帰のタスクにLarge Language Models(LLM)を利用する,最初の包括的フレームワークを紹介する。
In-Context Symbolic Regression (ICSR) は、外部LLMで関数形式を反復的に洗練し、その係数を外部LLMで決定するSR手法である。
以上の結果から,LLMは与えられたデータに適合するシンボリック方程式の発見に成功し,最高のSRベースラインの総合性能を4つのベンチマークで評価した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:29:18 GMT)
Diverse Part Synthesis for 3D Shape Creation [5.2] 部分ベース表現の形で3次元形状にニューラルネットワークを使用する手法は、ここ数年で導入されている。
現在の方法では、個々の形状部品をユーザの好みに応じて容易に再生することはできない。
ユーザが個別の部品に対して多種多様な提案を生成できるようにする技術について検討する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:12:53 GMT)
Fisheye-Calib-Adapter: An Easy Tool for Fisheye Camera Model Conversion [5.2] 本稿では,従来提案されていた魚眼カメラモデルに対する変換ツールを提案する。
ユーザーフレンドリーでシンプルだが、非常に高速で正確で、幅広いモデルの変換機能を提供する。
SLAMなどのアプリケーションでは,本システムを用いて変換したモデルが正しく動作することが確認された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:32:14 GMT)
Domain-specific or Uncertainty-aware models: Does it really make a difference for biomedical text classification? [4.7] ドメインの特異性と不確実性認識が組み合わさって、モデル自身の不確実性を合理的に推定する方法について論じる。
ドメインの特異性と不確実性に対する認識は、しばしばうまく組み合わせられるが、正確なタスクはより強く重み付けされている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:52:46 GMT)
Subgraph-Aware Training of Text-based Methods for Knowledge Graph Completion [4.7] 微調整事前学習言語モデル(PLM)は、最近知識グラフ補完(KGC)を改善する可能性を示している。
我々は, (i) サブグラフ認識のミニバッチを併用して, (ii) ハードネガティブサンプリングを促進するためのサブグラフ認識学習フレームワークKGC(SATKGC) と, (ii) ハードエンティティとハードネガティブトリプルにもっと焦点を合わせるための新しいコントラスト学習手法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:25:37 GMT)
Virtual Gram staining of label-free bacteria using darkfield microscopy and deep learning [4.7] グラム染色は微生物学で1世紀以上にわたって最も頻繁に使われている染色プロトコルの1つである。
本稿では,学習したディープニューラルネットワークを用いたラベルのない細菌の仮想グラム染色について紹介する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:28:03 GMT)
Security of discrete-modulated continuous-variable quantum key distribution [4.6] 離散変調を持つ連続変数量子鍵分布は、情報理論のセキュリティを提供する可能性がある。
離散変調量子鍵分布プロトコルにおけるコヒーレント攻撃に対する有限サイズセキュリティを証明した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:39:52 GMT)
Opportunities and Challenges of Urban Agetech: from an Automated City to an Ageing-Friendly City [4.6] 高齢者の介護、高齢化、高齢者の生活の維持が重要視されている。
本論文は, 都市型老化技術の概念を提唱し, 家庭外の老化技術が近代的高齢化に欠かせない都市に欠かせない役割を担っている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:29:11 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [4.4] 本稿では,クエリの洗練にガイドドドキュメントを利用するフレームワークである GuideCQR を紹介する。
具体的には、キーワードを拡大し、再ランクされた文書から期待された回答を生成し、それらをフィルタリング処理で統一する。
実験の結果,ガイド付き文書によって強化されたクエリは,従来のCQR法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:39:16 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3] 大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。
LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。
本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:27:17 GMT)
Intensity correlations in the Wigner representation [4.3] 量子状態の2階相関関数 $g(2) (0)$ に対するコンパクトな表現をウィグナー関数の項で導き出す。
直接光計測により$g(2) (0)$を同時に測定し、ホモダインのトモグラフィーによりウィグナー関数を再構成する実験を行う。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:00:00 GMT)
Crafting the Path: Robust Query Rewriting for Information Retrieval [4.3] 本稿では,検索システムに適した新しい構造化クエリ書き換え手法であるCrafting the Pathを提案する。
本研究では,本手法がモデルの内部パラメータの知識に依存せず,事実的不正確なクエリを生成することを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:11:28 GMT)
Parameter Generation of Quantum Approximate Optimization Algorithm with Diffusion Model [3.7] 量子コンピューティングは最適化の分野に革命をもたらす可能性を示している。
本研究では,量子近似最適化アルゴリズム(QAOA)の高速初期パラメータを生成するために,機械学習モデルを訓練する。
我々の拡散モデルでは, 高い性能パラメータの分布を学習し, 最適パラメータに近い新しいパラメータを学習できることが示されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:18:27 GMT)
SimPB: A Single Model for 2D and 3D Object Detection from Multiple Cameras [3.6] ビュービュー内の2Dオブジェクトと、複数のカメラからBEV空間内の3Dオブジェクトを同時に検出するSimPBと呼ばれる単一のモデルを提案する。
ハイブリッドデコーダは複数のマルチビュー2Dデコーダ層と複数の3Dデコーダ層で構成され、それぞれの検出タスク用に特別に設計されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:56:33 GMT)
Liouvillian skin effect in a one-dimensional open many-body quantum system with generalized boundary conditions [3.6] リウビリアン皮膚効果(LSE)と呼ばれる1次元散逸型量子多体系における皮膚効果について検討する。
我々は、ベーテ・アンザッツの利点を生かした、正確に解けるモデルのリウヴィリアン超作用素を解くことにより、一般化境界条件に対する LSE の存在を厳密に同定する。
我々の研究は、一般化された境界条件に対してLSEを示す、正確に解ける散逸性量子多体格子系のプロトタイプ的な例を提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:20:07 GMT)
EmoFace: Audio-driven Emotional 3D Face Animation [3.6] EmoFaceは、鮮やかな感情的ダイナミクスを備えた顔アニメーションを作成するための、新しいオーディオ駆動の方法論である。
提案手法では,複数の感情で表情を生成でき,ランダムだが自然な点滅や眼球運動を生成できる。
提案手法は、ビデオゲームでプレイ不可能なキャラクターの対話アニメーションを作成し、バーチャルリアリティ環境でアバターを駆動するのに有効である。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:32:16 GMT)
Context-Aware Fuzzing for Robustness Enhancement of Deep Learning Models [3.5] 我々は、コンテキスト信頼(CC)と呼ばれる新しいテスト指標を提案する。
CCは、テストケースの予測ラベルに予測される平均確率の観点から、テストケースの周囲のサンプルを通してテストケースを測定する。
Cloverは、これらのペアのシードとテストケースの差分を計算する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:31:10 GMT)
On the Complexity of Identification in Linear Structural Causal Models [3.4] 空間内で動作するジェネリック識別のための,新しい音響および完全アルゴリズムを提案する。
また,同定が一般に困難であることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:11:26 GMT)
Conspiracy theories and where to find them on TikTok [3.4] TikTokがオンラインの有害で危険なコンテンツを宣伝し、増幅する可能性を懸念する声が上がっている。
本研究は、陰謀論を推し進める動画の存在を分析し、その有病率を低く見積もっている。
ビデオの音声の書き起こしを抽出した後の陰謀論を識別するために,最先端のオープン言語モデルの有効性を評価する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:28:11 GMT)
CoSIGN: Few-Step Guidance of ConSIstency Model to Solve General INverse Problems [3.4] 我々は, 高い復元品質を維持しつつ, 推論ステップの境界を1-2 NFEに推し進めることを提案する。
本手法は拡散型逆問題解法における新しい最先端技術を実現する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:57:50 GMT)
Chaotic Hedging with Iterated Integrals and Neural Networks [3.3] 半マルティンゲールのすべての$p$-可積分函数が、[1,infty$]の$pに対して、その反復積分の和として表されることを示す。
また、すべての金融デリバティブが$Lp$-senseで任意に近似可能であることも示している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:16:15 GMT)
A Survey of Scam Exposure, Victimization, Types, Vectors, and Reporting in 12 Countries [3.3] 本研究は,12カ国における詐欺暴露,被害者化,タイプ,ベクター,報告に関する全国的な調査を通じて,このギャップに対処するものである。
まず、裕福でない国の住民が詐欺で財政的に損失を被っていることがわかりました。
第二に、インターネットは世界中の詐欺において重要な役割を担い、一人当たりのGNIは特定の詐欺タイプや接触ベクトルと強く結びついている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:35:56 GMT)
RoDUS: Robust Decomposition of Static and Dynamic Elements in Urban Scenes [3.1] 都市景観における静的および動的要素を分解するパイプラインであるRoDUSについて述べる。
提案手法では、4Dセマンティック情報と組み合わされた堅牢なカーネルベースの初期化を用いて学習プロセスを選択的にガイドする。
特に,KITTI-360およびPandasetデータセットを用いた実験により,挑戦的な都市景観を正確に静的かつ動的成分に分解する手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:43:54 GMT)
Characterization of Political Polarized Users Attacked by Language Toxicity on Twitter [3.0] 本研究は,左,右,センター利用者の言語毒性フローを初めて調査することを目的とする。
5億件以上のTwitter投稿が調査された。
その結果、左派ユーザーは右派やセンター派よりもはるかに有毒な回答が得られた。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:49:47 GMT)
Progressive enhancement and restoration for mural images under low-light and defected conditions based on multi-receptive field strategy [3.0] そこで本稿では,MER (Mural Enhancement and Restoration net) と呼ばれる欠陥領域の自動検出手法を用いた2段階復元モデルを提案する。
我々の2段階モデルは、復元された画像の視覚的品質を向上するだけでなく、関連する計量評価において、評価可能な結果も達成する。
我々は提案したモデルを利用して、古代の壁画の復元のためのウェブサイトを開設した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:36:57 GMT)
Enhancing Gaussian Process Surrogates for Optimization and Posterior Approximation via Random Exploration [3.0] ガウス過程シュロゲートモデルの精度を高めるために、ランダムな探索ステップに依存する新しいノイズフリーベイズ最適化戦略。
新しいアルゴリズムは、古典的なGP-UCBの実装の容易さを維持しているが、さらなる探索がそれらの収束を促進する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:42:12 GMT)
BrainVoxGen: Deep learning framework for synthesis of Ultrasound to MRI [3.0] 本研究は,脳の3次元超音波画像から3次元MRIボリュームを合成するための新しいディープラーニングフレームワークを提案する。
本研究は、神経画像領域における医療診断と治療計画における変革的応用を約束する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:52:47 GMT)
ARTEMIS: A Mixed Analog-Stochastic In-DRAM Accelerator for Transformer Neural Networks [3.0] ARTEMISは、トランスフォーマーモデルのための混合アナログ確率型インDRAMアクセラレータである。
解析の結果、ARTEMISはGPU、TPU、CPU、最先端のPIMトランスハードウェアアクセラレータと比較して、少なくとも3.0倍のスピードアップ、1.8倍のエネルギー、そして1.9倍のエネルギー効率を示した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:08:14 GMT)
Towards Learning Contrast Kinetics with Multi-Condition Latent Diffusion Models [2.9] DCE-MRI時間系列の時間条件画像合成が可能な潜時拡散モデルを提案する。
以上の結果から,本手法が現実的な多列性脂肪飽和乳房DCE-MRIを生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:04:45 GMT)
Combining Federated Learning and Control: A Survey [2.9] この調査は、(非線形)制御アプリケーションにおける適応性、スケーラビリティ、一般化、プライバシを高めるために、フェデレートラーニング(FL)とコントロールを組み合わせる概要を提供する。
FLは、データプライバシを保持しながら、分散デバイス間の協調学習を可能にする、モデルトレーニングに対する分散アプローチを提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:20:28 GMT)
Strawberry detection and counting based on YOLOv7 pruning and information based tracking algorithm [2.8] 本研究は,イチゴの花,未熟果実,成熟果実の検出を迅速かつ正確に行うことができる深層学習モデル(YOLOv7とその変種)の検出ヘッドの最適刈り取り法を提案した。
特にPruning-YOLOv7-tiny with detection head 3とPruning-YOLOv7-tiny with head 2 and 3は最高の推論速度(毎秒163.9フレーム)と検出精度(89.1%)を達成した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:41:57 GMT)
Automate or Assist? The Role of Computational Models in Identifying Gendered Discourse in US Capital Trial Transcripts [2.8] 本稿では,女性被告に対する米国資本裁判において,ジェンダーバイアス言語を識別する,ハイテイクな問題に自動システムを追加するケーススタディを提案する。
多くの典型的なNLPタスクとは異なり、数ヶ月の資本試験で性別バイアスに注釈を付けることは、多くの個人による判断の呼び出しを伴う複雑なタスクであった。
計算モデルは、注釈に基づく研究で法の専門家を支援する貴重な機会を提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:30:04 GMT)
On the Pauli Spectrum of QAC0 [2.3] 我々は、$mathsfQAC0$のパウリスペクトルが低度濃度を満たすと推測する。
我々は新しい回路の低境界と学習結果を応用として得る。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:47:34 GMT)
Conditional Quantile Estimation for Uncertain Watch Time in Short-Video Recommendation [2.3] 条件量子推定(CQE)という新しい推定手法を導入する。
CQEは、量子レグレッションを使用して、時計時間のニュアンス分布をキャプチャする。
また、条件付き予測、保守的推定、動的量子化の組み合わせを含む量子化予測を強化するためのいくつかの戦略を設計する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:25:35 GMT)
Sharif-STR at SemEval-2024 Task 1: Transformer as a Regression Model for Fine-Grained Scoring of Textual Semantic Relations [2.3] 本稿では,RoBERTa変換器の微調整技術を利用して,トラックA内の文レベルSTR(Supervised)について検討する。
以上の結果から,特にラテン言語におけるSTR性能の有望な進歩が示唆された。
しかし、我々のアプローチはアラビア語のような言語で困難に遭遇し、わずか0.38の相関しか見られず、結果として20位になった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:25:18 GMT)
Tutorial on Quantum Error Correction for 2024 Quantum Information Knowledge (QuIK) Workshop [2.1] 我々は、2024年IEEE国際情報理論シンポジウム(ISIT 2024)の第1回量子情報知識ワークショップ(QuIK)の参加者に対して、量子計算の基礎と量子エラー補正の簡単なレビューを行う。
これは包括的なレビューではないが、読者が概念や研究の方向性を深く掘り下げるために、多くの参考資料を提供している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:58:32 GMT)
Skeleton Recall Loss for Connectivity Conserving and Resource Efficient Segmentation of Thin Tubular Structures [2.1] 容器、神経、道路、コンクリートクラックなどの細い管状構造を正確に分断することは、コンピュータビジョンにおいて重要な課題である。
DiceやCross-Entropyのような標準的なディープラーニングベースのセグメンテーション損失関数は、しばしば構造的な接続性やトポロジーを犠牲にしてオーバーラップに焦点を当てる。
我々は,GPUベースの計算を低コストなCPU操作で回避し,これらの課題を効果的に解決する新しいSkeleton Recall Lossを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:46:41 GMT)
How we won BraTS 2023 Adult Glioma challenge? Just faking it! Enhanced Synthetic Data Augmentation and Model Ensemble for brain tumour segmentation [2.1] ディープラーニングは、脳腫瘍をセグメント化するための最先端技術である。
大量の高品質なデータが必要ですが、入手は困難です。
我々は、データ拡張に非従来的なメカニズムを用いることで、この問題に対処する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:47:18 GMT)
Minimum discrepancy principle strategy for choosing $k$ in $k$-NN regression [2.0] 保持データを用いずに、$k$-NN回帰推定器でハイパーパラメータ$k$を選択するための新しいデータ駆動戦略を提案する。
本稿では,早期停止と最小一致原理に基づく実践的戦略を実践的に容易に導入することを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:28:01 GMT)
Deep Generative Attacks and Countermeasures for Data-Driven Offline Signature Verification [2.0] 本研究では,データ駆動型オフライン署名検証(DASV)システムの生成攻撃に対する脆弱性について検討する。
本稿では,DASVシステムに挑戦する誤認識シグネチャを作成する上で,VAE(Variversaational Autoencoders)とCGAN(Conditional Generative Adrial Networks)の有効性について検討する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:44:45 GMT)
Anatomical basis of human sex differences in ECG identified by automated torso-cardiac three-dimensional reconstruction [2.0] 女性では脳梗塞後のMI診断の欠失率と予後不良率が高い。
女性におけるSTj振幅の低下は、より小さな心室にも関係している。
後MIT波振幅とR軸偏差は、女性においてより後方および水平の心位置と強く関連している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:28:38 GMT)
Mutual Information Bounded by Fisher Information [2.0] 我々は、フィッシャー情報の観点から、相互情報に対する一般的な上限を導出する。
次にそれらを量子ケースに一般化し、量子フィッシャー情報の観点からホレヴォ情報を束縛する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 12:05:30 GMT)
Continuous reasoning for adaptive container image distribution in the cloud-edge continuum [1.9] 本稿では,コンテナイメージをクラウドエッジ連続体に複製する新たな宣言的アプローチを提案する。
リソースの可用性、ネットワークとストレージのコストを考慮すると、最適な配置を決定するために論理プログラミングを活用します。
ASPとPrologの継続的推論を組み合わせることで、コストの最適化と意思決定の迅速化を両立させることができることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:33:52 GMT)
Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation [1.9] 我々は、シーンテキストをソース言語(例えばヒンディー語)からターゲット言語(例えば、英語)に視覚的に翻訳するタスクについて研究する。
視覚翻訳は、シーンテキストの認識と翻訳だけでなく、翻訳された画像の生成も含む。
本稿では、シーンテキスト認識、機械翻訳、シーンテキスト合成のための最先端モジュールを組み合わせた視覚翻訳のためのケースケードフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:53:23 GMT)
Is That Rain? Understanding Effects on Visual Odometry Performance for Autonomous UAVs and Efficient DNN-based Rain Classification at the Edge [1.9] 最先端のローカルトラッキングと軌道計画は通常、飛行制御アルゴリズムにカメラセンサーを入力して実行される。
最先端のビジュアル・オドメトリーシステムでは, 1.5mの最悪ケース平均追跡誤差が可能であることを示す。
我々は、モバイルおよび制約されたデプロイメントシナリオに適したディープニューラルネットワークモデルのセットをトレーニングし、これらの雨の条件を効率的に正確に分類できる範囲を判断する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:47:25 GMT)
Semantic-Aware Representation of Multi-Modal Data for Data Ingress: A Literature Review [1.9] LLM(Large Language Models)のような生成AIは、テキスト、画像、オーディオ、ビデオなどのマルチモーダルデータを処理するために広く採用されている。
このデータを効率的に管理することは、データ量が2倍にならないため、業界倍の課題となっている。
本研究では,モノモーダル,マルチモーダル,クロスモーダルデータから埋め込みを抽出するセマンティック・アウェア技術に着目した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:49:11 GMT)
Comparison of estimation limits for quantum two-parameter estimation [1.9] 長岡クラム-ラオ境界とルワン不確実性関係の到達可能性を比較した。
これらの2つの限界は、物理的に達成可能な精度について異なる情報を提供できることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:37:08 GMT)
What's Distributive Justice Got to Do with It? Rethinking Algorithmic Fairness from the Perspective of Approximate Justice [1.8] 不完全な意思決定システムという文脈では、個人間での利益/利益の理想的な分配がどのようなものになるかだけを気にすべきではない、と私たちは主張する。
このためには、アルゴリズムフェアネス研究者として、分配的正義を見極め、公正性基準を使用する方法を再考する必要がある。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:13:23 GMT)
Tiny Models are the Computational Saver for Large Models [1.8] 本稿では,TinySaverについて紹介する。TinySaverは,大規模モデルを適応的に置き換えるために小さなモデルを用いる,早期に出現する動的モデル圧縮手法である。
この手法をImageNet-1k分類で評価した結果,最大90%の演算数を削減できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:12:28 GMT)
RIMformer: An End-to-End Transformer for FMCW Radar Interference Mitigation [1.8] RIMformerと呼ばれる新しいFMCWレーダ干渉緩和法は、エンドツーエンドのTransformerベース構造を用いて提案される。
このアーキテクチャは、時間領域IF信号をエンドツーエンドで処理するように設計されている。
その結果,提案したRIMformerは干渉を効果的に軽減し,ターゲット信号の復元を可能にすることがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:01:27 GMT)
Pretraining Data and Tokenizer for Indic LLM [1.8] 我々は,多言語Indic大言語モデル構築のためのデータ準備のための新しいアプローチを開発する。
われわれの厳密なデータ取得は、Common Crawl、Indic Book、ニュース記事、Wikipediaなど、オープンソースとプロプライエタリなソースにまたがっている。
Indic言語毎に、冗長で低品質なテキストコンテンツを効果的に除去するカスタムプリプロセッシングパイプラインを設計する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:06:27 GMT)
Turkish Delights: a Dataset on Turkish Euphemisms [1.8] この研究は、潜在的至上主義用語(PET)に関する現在の計算作業をトルコ語に拡張する。
本稿では,トルコのPETデータセットについて紹介する。
トルコ語におけるPETのエウヘミスティックな例と非エウヘミスティックな例を挙げる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:13:42 GMT)
Profiling quantum circuits for their efficient execution on single- and multi-core architectures [1.7] 本研究では,量子ビット相互作用グラフとゲート依存性グラフから抽出したグラフ理論に基づくメトリクスを紹介する。
量子ビット相互作用とゲート依存性グラフの両方に根ざしたパラメータ間の接続と、量子回路マッピングのパフォーマンス指標を明らかにする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:08:50 GMT)
MoCheQoS: Automated Analysis of Quality of Service Properties of Communicating Systems [1.7] MoCheQoSは、メッセージパッシングシステムのQoS特性を分析するための有界モデルチェッカーである。
本研究は,MoCheQoSの適用性を評価するための2つのケーススタディである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:09:58 GMT)
Navigating the Smog: A Cooperative Multi-Agent RL for Accurate Air Pollution Mapping through Data Assimilation [1.7] 本稿では,自律型ドローンが空飛ぶ探偵として機能する,空気質マッピングの新しい手法を提案する。
当社のソリューションでは、ダイナミックなクレジット割り当てを備えたリターン機能を採用しており、ドローンによる情報測定の優先順位付けを可能にしている。
空気の質以外にも、このソリューションは山火事の検出や管理といった多様な環境問題に対処する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:24:27 GMT)
Novel Deep Neural Network Classifier Characterization Metrics with Applications to Dataless Evaluation [1.7] 本研究では、サンプルデータセットを使わずに、ディープニューラルネットワーク(DNN)分類器のトレーニング品質を評価する。
CAFIR10およびCAFIR100データセットを用いて学習したResNet18の手法に関する実証的研究により、DNN分類器のデータレス評価が実際に可能であることを確認した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:40:46 GMT)
ModalChorus: Visual Probing and Alignment of Multi-modal Embeddings via Modal Fusion Map [1.7] マルチモーダル埋め込みの視覚的探索とアライメントのための対話型システムであるModalChorusを設計する。
1) モーダル・フュージョン・マップ (MFM) を埋め込んだ新しい次元減少法である。
ケーススタディでは、ゼロショット分類からクロスモーダル検索と生成までのシナリオにおいて、ModalChorusが直感的に誤調整と効率的な再調整の発見を容易にすることが示されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:49:56 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6] 言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。
これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。
また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:28:36 GMT)
Beyond the Veil of Similarity: Quantifying Semantic Continuity in Explainable AI [1.6] 本稿では,説明可能なAI手法と機械学習モデルにおける意味連続性を測定するための新しい指標を提案する。
我々は、入力の漸進的な変化が、異なるXAI手法によって提供される説明にどのように影響するかを観察する実験を行う。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:32:41 GMT)
A polynomial-time classical algorithm for noisy quantum circuits [1.3] 雑音量子回路のための時空古典的アルゴリズムを提供する。
我々のアプローチは、雑音が非局所的相関を指数的に減衰させるという直感に基づいている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:48:39 GMT)
Evaluating graph-based explanations for AI-based recommender systems [1.2] 本稿では,AIによるレコメンデーションに対するユーザの認識を改善するために,グラフに基づく説明の有効性について検討する。
ユーザがグラフベースの説明を,機能の重要性を含む設計よりも有用であると認識していることが分かりました。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:28:49 GMT)
From Principles to Practices: Lessons Learned from Applying Partnership on AI's (PAI) Synthetic Media Framework to 11 Use Cases [1.2] 2023年は世界が生成的AIに目覚めた年であり、2024年は政策立案者がより強く反応する年だ。
本論文は,合成メディアガバナンスの実装の多様な事例の収集として初めて知られるものである。
これは、合成メディアガバナンスを実際に使用するために適用、拡張、拡張、洗練できる領域を強調している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:27:56 GMT)
Learning a Sparse Neural Network using IHT [1.1] 本稿では、高度なスパース最適化の分野、特に非線形微分可能関数に対処する分野の成果に依拠する。
NNのトレーニングの計算能力が増大するにつれて、モデルがより多くのパラメータで複雑になる。
本稿では,ニューラルネットワーク(NN)トレーニングの領域において,そのような収束の理論的前提が適用可能であるかを検討することを目的とする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:51:36 GMT)
Hybrid Dynamic Pruning: A Pathway to Efficient Transformer Inference [1.1] 本稿では,頭部の疎度を用いてトランスフォーマーを高速化し,疎度をブロックし,注意の計算を減らし,メモリアクセスを減らし,新しいアルゴリズムアーキテクチャの共設計手法を提案する。
注目スコアと注目ヘッドの巨大な冗長性を観測し、実行時に注目行列内の重要でないブロックをプルーする整数ベースの行平衡ブロックプルーニングを提案する。
また、実行時に重要でないヘッドを検出およびプルーする整数ベースのヘッドプルーニングを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:15:16 GMT)
Agent-E: From Autonomous Web Navigation to Foundational Design Principles in Agentic Systems [1.1] 本稿では,新しいWebエージェントであるAgent-Eの構築について紹介する。
Agent-Eは、最先端のWebエージェントよりも多くのアーキテクチャ改善を導入している。
我々は,Agent-Eが他のSOTAテキストおよびマルチモーダルWebエージェントを,ほとんどのカテゴリで10~30%上回っていることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:44:28 GMT)
A graph-based formalism for surface codes and twists [0.8] 我々は、ツイストで曲面コードを構築するための厳密な形式主義を提供する。
曲面コードを任意の2次元多様体上に埋め込まれたグラフ$G$に関連付ける。
レートや距離など,さまざまなコード特性を計算し,バインドする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 03:42:40 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7] 我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。
量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。
本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:27:14 GMT)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.7] ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 09:30:42 GMT)
Urban Traffic Forecasting with Integrated Travel Time and Data Availability in a Conformal Graph Neural Network Framework [0.7] 本稿では,駅間の移動時間をグラフニューラルネットワークアーキテクチャの重み付き隣接行列に組み込む新しい枠組みを提案する。
不確実性に対処するために、リアルタイムの検証残差に基づいて予測間隔を調整するAdaptive Conformal Prediction (ACP) 手法を用いる。
実験の結果,提案モデルでは,MAEが約24%,RMSEが8%,次世代モデルが約24%向上した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:11:07 GMT)
Social learning with complex contagion [0.5] 複雑な感染の概念とペイオフバイアス模倣の概念を組み合わせた数学的モデルを導入する。
我々のフレームワークは、模倣によって伝統的な社会学習モデルを一般化する。
社会システムにおけるより現実的な行動変化を記述した合成フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:39:21 GMT)
A Scalable and Generalized Deep Learning Framework for Anomaly Detection in Surveillance Videos [0.5] ビデオにおける異常検出は、暴力、万引き、破壊など、複雑さ、騒音、多様な活動の性質のために困難である。
既存のアプローチでは、広範囲な再トレーニングなしに、さまざまな異常なタスクにディープラーニングモデルを適用するのに苦労しています。
本研究では,特徴一般化向上のための伝達学習,特徴表現向上のためのモデル融合,マルチタスク分類という,3つの重要なコンポーネントからなる新しいDLフレームワークを導入する。
RLVSデータセット(違反検出)では97.99%、UCFデータセットでは83.59%の精度を達成した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:41:12 GMT)
Are Educational Escape Rooms More Effective Than Traditional Lectures for Teaching Software Engineering? A Randomized Controlled Trial [0.5] 本稿では,ソフトウェア工学を教えるための仮想学習室の学習効果について分析する。
ランダムに制御された試行を通じて、この活動と伝統的な教育を比較します。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:17:23 GMT)
In-Situ Infrared Camera Monitoring for Defect and Anomaly Detection in Laser Powder Bed Fusion: Calibration, Data Mapping, and Feature Extraction [0.3] レーザーパウダーベッド融合(LPBF)プロセスは, 溶融プール不安定性, スパッタリング, 温度上昇, 粉体拡散異常による欠陥を生じさせる可能性がある。
内部監視による欠陥の特定には、通常、生成された大量のデータを収集、保存、分析する必要がある。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:02:22 GMT)
Strong cubic phase shifts on the photonic vacuum state [0.2] コヒーレント状態への光子の付加は真空状態に作用する立方相シフトと顕著な類似性を示す効果をもたらす。
立方体相互作用の強さは、コヒーレント状態の変位に逆らって変化し、最も強い相互作用は、以前の観測より1桁大きくなった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 02:32:23 GMT)
Data-driven Verification of DNNs for Object Recognition [0.2] 本稿では、勾配のない最適化を用いたディープニューラルネットワーク(DNN)の新しいテスト手法を提案する。
画像中の線路を画像中に検出する画像分割タスクに適用することにより,テストしたDNNの弱点の同定に成功していることを示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:30:02 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2] Vibravox corpusには38時間の音声サンプルと188人の参加者が異なる音環境下で記録した生理的音が含まれている。
音声認識や話者検証など,様々な音声関連課題について一連の実験を行った。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:09:01 GMT)
Fractional Wannier Orbitals and Tight-Binding Gauge Fields for Kitaev Honeycomb Superlattices with Flat Majorana Bands [0.2] フラクショナル励起は、基礎物理学と量子技術の両方に大きな可能性を秘めている。
そこで本研究では,ハニカム格子上のキタエフスピンモデルにおけるπ-フラックスの様々な結晶相における低エネルギーマヨナ分散の進化について検討する。
我々は、この超交換相互作用がZ2ゲージ場として作用する条件を特定し、マヨアナ・ワニエ軌道の強結合ホッピングを管理する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:44:39 GMT)
A Survey of AI-Powered Mini-Grid Solutions for a Sustainable Future in Rural Communities [0.2] 本稿では,統計的手法,機械学習アルゴリズム,ハイブリッドアプローチなど,様々な予測モデルについてレビューする。
Prophet、NeuralProphet、N-BEATSといった公開データセットやツールをモデル実装と検証のために検討している。
この調査は、将来の研究への推奨で締めくくられ、モデル適応と現実世界のアプリケーションへの最適化における課題に対処する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:23:38 GMT)
Steamroller Problems: An Evaluation of LLM Reasoning Capability with Automated Theorem Prover Strategies [0.2] GPT4, GPT3.5 TurboおよびGoogleのGeminiモデルの性能をスチームローラー領域の問題に対して評価した。
ATP推論戦略を用いた場合のモデルの性能はワンショットの思考に匹敵することがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:49:23 GMT)
An Evaluation of Continual Learning for Advanced Node Semiconductor Defect Inspection [0.1] 本研究は,半導体欠陥検査におけるタスクに依存しないメタラーニング手法を提案する。
新しい欠陥クラスとスケールの漸進的な追加を可能にし、より堅牢で一般化されたモデルを作成する。
我々は、ADIとAEIの2つのプロセスステップに対して、実際のレジストウェハSEM(Scanning Electron Microscopy)データセットを用いて、我々のアプローチをベンチマークした。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 16:41:22 GMT)
All-fiber, near-infrared, laser system at 780nm for atom cooling [0.1] 780nmの単純でコンパクトで経済的なレーザーシステムの設計,実装,特性について述べる。
1560nmの2つの半導体レーザーは、1つのエルビウムドープファイバ増幅器で増幅され、周期的に置換されたニオブ酸リチウム結晶で周波数が倍になる。
レーザの振幅雑音と直線幅とSHG効率を特徴付ける。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:00:01 GMT)
Whether to trust: the ML leap of faith [0.0] 信頼は態度として一般的に理解されているが、これを正確に測定したり、管理したりすることはできない。
システム全体、ML、およびMLのコンポーネント部分に対する信頼を尊重するので、ほとんどのユーザは、MLを信頼するときに受ける信頼の跳躍を理解していません。
信頼を構築するための現在の取り組みは、MLのプロセスを説明するものである。これは、非MLの専門家が、それが複雑であるため理解するのが困難であり、説明は、彼ら自身の(知識のない)精神モデルとは無関係である。
本稿では,MLにおける内在的信頼を直接構築する革新的な方法を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:36:19 GMT)
Variational approach to light-matter interaction: Bridging quantum and semiclassical limits [0.0] 我々は,光物質系の力学をシミュレートするための時間依存的変分法を提案する。
変分法は、光-物質相互作用の様々な量子モデルに適用できる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 00:53:33 GMT)
The virial theorem and the method of multipliers in spectral theory [0.0] 電磁量子ハミルトニアンの固有値や他のスペクトル特性の欠如を推定するためにこの手法を用いる方法を示す。
我々は、行列値ポテンシャルを持つシュレーディンガー作用素、パウリ型とディラック型の相対論的作用素、複雑なロビン境界条件など、非自己随伴設定における最近の発展に焦点を当てる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:57:15 GMT)
The revised boomerang connectivity tables and their connection to the Difference Distribution Table [0.0] 近年では、拡張ボメラン接続テーブル(EBCT)、下ボメラン接続テーブル(LBCT)、上ボメラン接続テーブル(UBCT)の3つの新しいテーブルが導入されている。
本稿では,これらの新しいEBCT, LBCT, UBCTの概念を差分$delta$-uniform関数のためにDDTに接続することで, 文脈で述べる。
我々は以前公表されたいくつかの結果を簡単に得る。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:44:40 GMT)
The inherent goodness of well educated intelligence [0.0] 本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。
インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:04:44 GMT)
The Hellmann-Feynman theorem and the spectrum of some Hamiltonian operators [0.0] ここでは、よく知られたヘルマン=ファインマンの定理を利用して、いくつかの非相対論的ハミルトン作用素が無限個の有界状態をサポートすることを証明する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:39:10 GMT)
Teaching Quantum Informatics at School: Computer Science Principles and Standards [0.0] 量子情報学はコンピュータサイエンス教育に関係しているが、その教え方についてはほとんど研究されていない。
本研究では,デニングの大原理の中に量子情報学を配置し,中等教育のための量子情報学標準を提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:32:37 GMT)
Supersensitive phase estimation by thermal light in a Kerr-nonlinear interferometric setup [0.0] 超感度位相推定は、例えば、Kerr-nonlinear 2モード結合器を介してマッハ-ツェンダー干渉計に注入されたテクスタイトコヒーレントにより達成可能であることを示す。
位相誤差は、平均光子数である$barn$より1/barn$以下である。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:23:58 GMT)
Socially Assistive Robot in Sexual Health: Group and Individual Student-Robot Interaction Activities Promoting Disclosure, Learning and Positive Attitudes [0.0] 社会支援ロボット(SAR)は、人間よりも信頼できると認識されることもある。
学生は人間の教師よりも、SE関連の質問をロボットに尋ねることにオープンだった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:36:21 GMT)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0] 私たちは戦略的思考と意思決定を評価するために、Tic-Tac-Toe、Connect Four、Battleshipといったゲームを使用しています。
標準ベンチマークに習熟しているにもかかわらず、GPT-3.5とGPT-4のプレイ能力と、事前トレーニングなしで完全に観察可能なゲームについて推論する能力は、ごくわずかである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:47:30 GMT)
Search Engines, LLMs or Both? Evaluating Information Seeking Strategies for Answering Health Questions [0.0] 我々は,異なるWeb検索エンジン,LLM(Large Language Models)およびRAG(Research-augmented)アプローチを比較した。
健康問題に対処する可能性のあるウェブページの品質は、ランキングを下方へ下るにつれて低下しない。
評価の結果, Web エンジンは健康問題に対する正しい回答を見つける上で LLM よりも精度が低いことがわかった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:40:39 GMT)
Schmidt modes carrying orbital angular momentum generated by cascaded systems pumped with Laguerre-Gaussian beams [0.0] Orbital Angular Momentum(OAM)モードは、量子科学とテクノロジーの様々な分野で使われる重要なリソースである。
パラメトリックダウンコンバージョン(PDC)によるOAMを含む相関シュミットモードの生成に対する理論的アプローチを提案する。
本研究では, ポンプパラメータを変化させることで, 発生モードの数とその個体群を制御できることを実証する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:53:40 GMT)
SHARC-VQE: Simplified Hamiltonian Approach with Refinement and Correction enabled Variational Quantum Eigensolver for Molecular Simulation [0.0] SHARC-VQEは分子シミュレーションの計算コストを大幅に削減する。
SHARC-VQEによる測定結果は、量子回路からのノイズによる誤差が少ない。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 04:01:55 GMT)
Resource overheads and attainable rates for trapped-ion lattice surgery [0.0] 本研究では,空間的に分離されたイオン表面符号間の耐故障性格子手術に必要なイオン数を推定する。
この結果から,トラップイオン量子コンピュータのスケール化のために,光カップリングの改善が急務であることが示唆された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:37:44 GMT)
RankTower: A Synergistic Framework for Enhancing Two-Tower Pre-Ranking Model [0.0] 大規模ランキングシステムでは、効率性と効率性のバランスをとるためにカスケードアーキテクチャが広く採用されている。
オンラインレイテンシの制約に従うために、効率性と精度のバランスを維持することは、プレグレードモデルにとって不可欠である。
そこで我々は,ユーザとイテムのインタラクションを効率的に捉えるために,RangeTowerという新しいニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 08:07:37 GMT)
Machine Learning for the identification of phase-transitions in interacting agent-based systems: a Desai-Zwanzig example [0.0] 本稿では,エージェントモデルに対する位相遷移を平均フィールド限界でピンポイントするデータ駆動フレームワークを提案する。
この目的のために、多様体学習アルゴリズムであるマップを用いて、データ駆動潜在変数の相似集合を同定する。
次に、深層学習フレームワークを用いて、データ駆動座標の共形再パラメータ化を求める。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 01:02:50 GMT)
Machine Learning for Dynamic Management Zone in Smart Farming [0.0] デジタル農業のアプローチは、伝統的な農業システムを置き換えるために非常に合理的なコストで使用できる。
提案手法は, 収率帯の空間的変動の解析に有用である。
提案したゾーン管理アプローチは、農家や農夫がより効果的にN型肥料を施すのに役立つ。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:37:57 GMT)
Machine Learning Based Prediction of Proton Conductivity in Metal-Organic Frameworks [0.0] 金属-有機フレームワーク(MOF)は、プロトン交換膜燃料電池における固体電解質としての可能性を持っている。
我々は,プロトン伝導性MOFのデータベースを開発し,そのプロトン伝導性を予測するために機械学習技術を適用した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 06:01:42 GMT)
Inverse participation ratio and entanglement of edge states in HgTe quantum wells in a finite strip geometry [0.0] 解析的および数値的ハミルトン対角化手法からエッジ状態エネルギーと波動関数に関する情報を抽出する。
スピン、運動量$k_x$、位置$y$におけるエッジ状態波動関数の構造の解析は、境界におけるエッジ状態のスピン偏極構造を証明している。
還元密度行列(RDM)の純度とエントロピーは、スピンセクターが系の他の部分と絡み合っている領域$(k_x,y)$を知らせる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:46:19 GMT)
Integrability of open boundary driven quantum circuits [0.0] 開境界条件を持つ量子ビット(スピン1/2)の二重量子回路のヤン・バクスター積分性の問題に対処する。
我々はこの解を用いて、2ステップの離散時間フロケダイナミクスを持つ変換行列形式から積分可能な回路を構築する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 15:39:13 GMT)
Honeypot Implementation in a Cloud Environment [0.0] この論文は、HeiCLOUDの悪意ある活動を調べるために、ハニーポットソリューションを提示している。
ハイデルベルク大学の制限されたネットワークゾーンで攻撃者を検出するために、ファイアウォールの漏れを検出する新しい概念が生み出される。
仲介インスタンスとして動作するカスタマイズされたOpenSSHサーバが提供される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:35:54 GMT)
High-Quality Tabular Data Generation using Post-Selected VAE [0.0] 本稿では,より少ない実行時間で高品質な合成データを生成できるPSVAEを紹介する。
PSVAEには損失最適化とポストセレクションという2つの主要な概念が組み込まれている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 21:07:30 GMT)
Hidden time-reversal in driven XXZ spin chains: exact solutions and new dissipative phase transitions [0.0] 境界駆動および消散を受ける XXZ スピン鎖の相互作用モデルが、微妙な時間反転対称性を持つことを示す。
我々の厳密な解はまた、電流が流れる純粋で絡み合った定常状態を持つ駆動散逸二重鎖モデルを直接生成する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:12:53 GMT)
Hands-on STEM Learning Experiences using Digital Technologies [0.0] 本研究の目的は,イタリア学校で実施した経験と活動について,この新たなアプローチで概説することである。
学生がコラボレーション、創造性、批判的思考、実験、プロトタイピング、コミュニケーション、問題解決など、様々なコア能力を開発するプロジェクトや経験の選択が議論された。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:09:48 GMT)
GraphCNNpred: A stock market indices prediction using a Graph based deep learning system [0.0] 我々は,テキストS&textP 500,NASDAQ,DJI,NYSE,RASELの指標の傾向を予測するために,さまざまなデータソースに適用可能なグラフニューラルネットワークベースの畳み込みニューラルネットワーク(CNN)モデルを提案する。
実験の結果,F測度の観点からは,ベースラインアルゴリズム上のすべての指標の予測性能が約4%から15%に向上した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:07:28 GMT)
Floquet systems with continuous dynamical symmetries: characterization, time-dependent Noether charge, and solvability [0.0] 連続力学対称性(CDS)を持つ量子フロケット系について検討する。
離散的なものとは違って、CDSはハミルトニアンの$H(t)$を強く制約し、フロケ状態をすべて得ることができる。
この結果はフロケ状態の体系的な解法を提供し、準エネルギー図のハイブリダイゼーションを避ける方法を説明する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 23:11:45 GMT)
FarsInstruct: Empowering Large Language Models for Persian Instruction Understanding [0.0] この研究は、Co-CoLAフレームワークによるトレーニングとFarsInstructデータセットの有効性を示す。
現在の執筆時点で、FarsInstructは21の異なるデータセットに200以上のテンプレートで構成されている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:03:55 GMT)
Evaluation of Rounding Functions in Nearest-Neighbor Interpolation [0.0] 評価された丸め関数は、IEEE 754-2008標準で定義された5つの丸め規則の中から選択される。
丸め関数がNN画像品質に与える影響を研究・評価するために、フル・ノン・レファレンス画像品質評価指標が使用される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 22:25:23 GMT)
Estimating Reaction Barriers with Deep Reinforcement Learning [0.0] 複雑な系の安定状態は、関連するポテンシャルエネルギー表面上の局所ミニマに対応する。
たいていの場合、システムは局所的な最小値に近づき、希少な大きなゆらぎがミニマ間の遷移に繋がる。
本研究の目的は,システム状態空間における2つの安定状態間の最小エネルギー障壁をコスト最小化問題として求めることである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:02:32 GMT)
Estimate Epidemiological Parameters given Partial Observations based on Algebraically Observable PINNs [0.0] 実際には、流行モデルによって推定される人口に対応する全ての軌跡データを得ることはできない。
我々は、未知の疫学パラメータを推定するために、代数的可観測性の概念をPINNに導入する。
推定パラメータと未観測変数の予測の観点から,代数的に観測可能なPINNとして命名されたPINNの有効性を示す。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:22:12 GMT)
Equality in some symplectic eigenvalue inequalities [0.0] ワイルの不等式、リドスキーの不等式、シュル=ホルン多元化不等式のシンプレクティックアナログにおいて、必要十分条件を提供する。
シンプレクティックワイルとリドスキーの不等式に対する等式条件は、固有値に対する既知の等式条件と類似していることが判明した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:33:32 GMT)
Emergence of second-order coherence in superfluorescence [0.0] カスケード量子系における超ラジカルバーストの2階量子コヒーレンス関数について検討する。
本研究の結果から,ハミルトニアンの結合が根本的に異なるにもかかわらず,カスケード系および対称結合系における超放射能は著しく多くの類似点を有することが明らかとなった。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:30:16 GMT)
DisorderUnetLM: Validating ProteinUnet for efficient protein intrinsic disorder prediction [0.0] 内因性障害領域の予測は、タンパク質の機能やダイナミクスを理解する上で重要な意味を持つ。
近年,タンパク質言語モデル(pLM)に基づく新しい世代の予測器が出現している。
本稿では、タンパク質Unetの考え方に基づく新しい障害UnetLM障害予測器について紹介する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:19:59 GMT)
Digitizing lattice gauge theories in the magnetic basis: reducing the breaking of the fundamental commutation relations [0.0] 格子$mathrmSU(2)$ gauge theory Hamiltonian in the $mathitmagnetic$ $mathitbasis$, where the gauge link are unitary and diagonal。
デジタル化は、$mathrmSU(2)$群多様体の特定の分割から得られ、この分割上のリー微分の近似によって、正準モータが構成される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 18:47:09 GMT)
Diagnosing thermalization dynamics of non-Hermitian quantum systems via GKSL master equations [0.0] 固有状態熱化仮説の非エルミート量子系への応用は、散逸的量子カオスにおいて最も重要なトピックの1つとなっている。
我々は、非エルミート系を記述するゴリーニ-コサコフスキー-スダルシャン-リンドブラッドマスター方程式の2つのバージョンを導出した。
この発見は、最近提案された直交確率行列理論が適切な修正を必要とすることを示唆している。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 10:38:38 GMT)
Comparing Federated Stochastic Gradient Descent and Federated Averaging for Predicting Hospital Length of Stay [0.0] 入院期間(LOS)を確実に予測することは,病院における資源配分の効率化に不可欠である。
従来の予測モデリングツールは、医療機関がプライバシー規則を定めているため、十分なデータと多様なデータを取得するのが難しいことが多い。
このモデリング手法は、病院外の機密データを抽出することなく、異なる病院からの分散データソースをモデル化することで協調的なモデルトレーニングを促進する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:00:20 GMT)
Classification and reconstruction of images in the problem single-pixel imaging using classical and quantum neural networks [0.0] シングルピクセルカメラは、可視光スペクトルの外の光範囲に優れた解決策となる。
将来的には、量子コンピュータはそのような問題の解をさらにスピードアップすることができる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 11:38:57 GMT)
Atomic and entanglement dynamics in the mixed squeezed coherent state version of the Jaynes-Cummings interaction [0.0] 放射場の混合状態における圧縮ノイズを含むコヒーレント信号は、コヒーレント状態密度演算子と圧縮状態密度演算子の非ガウス混合とみなす。
本研究の目的は、圧縮真空とコヒーレント状態の混合場状態と相互作用する2レベル原子の文脈において、Jaynes-Cummingsモデルの混合状態バージョンを研究することである。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:13:34 GMT)
An atomic probe of dark matter differential interactions with elementary particles [0.0] 標準模型を超えた物理学の探索は、実験物理学の主要な課題の1つである。
コマグネトメーターはそのような粒子に対して超高感度プローブを形成する。
本研究では,これらのフィールドを発見し,そのスペクトルを測定するマルチ原子種プローブを提案する。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 07:23:14 GMT)
An L-BFGS-B approach for linear and nonlinear system identification under $\ell_1$- and group-Lasso regularization [0.0] 線形および非線形離散時間状態空間モデルを同定するための非常に効率的な数値計算法を提案する。
提案手法のPython実装は、jax-sysidパッケージで利用可能である。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 05:42:14 GMT)
An Efficient TLS 1.3 Handshake Protocol with VC Certificate Type [0.0] 本稿では,トランスポート層セキュリティ(TLS)ハンドシェイクプロトコルの設計と実装について述べる。
RFC-8446への完全準拠を維持しながら、検証認証(VC)の使用を可能にする。
結果として、大規模IoTシステムにおけるセルフソブリンアイデンティティの採用の道が開けた。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:18:16 GMT)
A survey and taxonomy of methods interpreting random forest models [0.0] ランダムフォレスト(RF)モデルの解釈可能性は、機械学習(ML)コミュニティへの関心が高まりつつある研究トピックである。
RF生成モデルは、多くの深い決定木のために「ブラックボックス」と見なされている。
本論文は、RF結果モデルの解釈に文献で使用される手法について、広範囲にレビューすることを目的とする。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 17:33:32 GMT)
A primary quantum current standard based on the Josephson and the quantum Hall effects [0.0] アンペアの新しい定義では、1秒あたりの基本的な電荷の流れを1部108ドルの相対的な不確実性で制御できる量子電流標準が要求される。
本稿では,量子標準と超伝導極低温増幅器を組み合わせた新しい量子電流発生器について述べる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:45:41 GMT)
A new economic and financial theory of money [0.0] 電子通貨の評価はマクロ経済学理論と金融政策の基本方程式に基づく。
電子通貨を、サブエコノミーの有形資産に関連付けられた取引株式として捉えていく。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:43:10 GMT)
A Survey on Universal Approximation Theorems [0.0] 本稿ではニューラルネットワーク(NN)の近似能力に関する様々な定理について論じる。
本稿では,関数近似の予備結果から得られたUATの体系的概要について述べる。
UATの理論的および数値的な側面は、任意の幅と深さの両方からカバーされている。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:21:53 GMT)
A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks [0.0] 大規模言語モデル(LLM)は多くの異なる自然言語処理(NLP)タスクにおいて顕著なパフォーマンスを示している。
プロンプトエンジニアリングは、大きなパフォーマンス向上を達成するために、既に存在するLLMの能力に追加する上で重要な役割を担います。
本稿では、異なるプロンプト手法を要約し、それらが用いた異なるNLPタスクに基づいてそれらをまとめる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 20:23:19 GMT)
A High-Speed Hardware Algorithm for Modulus Operation and its Application in Prime Number Calculation [0.0] 提案アルゴリズムは加算演算,減算演算,論理演算,ビットシフト演算のみを用いる。
暗号化アプリケーションにおけるスケーラビリティの課題に対処する。
このアルゴリズムを50,000までの素数計算に適用すると、実用性と性能上の利点が示される。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 13:24:52 GMT)
A Framework for testing Federated Learning algorithms using an edge-like environment [0.0] フェデレーテッド・ラーニング(FL)は、多くのクライアントが、データをプライベートかつ分散化しながら、単一の集中型モデルを協調的にトレーニングする機械学習パラダイムである。
グローバル集中型モデルアグリゲーションにおける局所モデルの貢献を正確に評価するのは簡単ではない。
これはFLにおける大きな挑戦の例であり、一般にデータ不均衡またはクラス不均衡として知られている。
本研究では,FLアルゴリズムをより容易かつスケーラブルに評価するためのフレームワークを提案し,実装した。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 19:52:53 GMT)
A Brief Review of Quantum Machine Learning for Financial Services [0.0] 本稿では,ファイナンスに応用可能な量子機械学習における最先端のアルゴリズムと技術について検討する。
検討される金融アプリケーションには、リスク管理、クレジットスコアリング、不正検出、株価予測が含まれる。
論文参考訳(メタデータ) (Wed, 17 Jul 2024 14:44:47 GMT)