Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling [128.2] InternVL 2.5は、InternVL 2.0上に構築された高度マルチモーダル大規模言語モデル(MLLM)シリーズである。
InternVL 2.5は、GPT-4oやClaude-3.5-Sonnetといった主要な商用モデルと競合する競争力を持つ。
このモデルが、マルチモーダルAIシステムの開発と適用のための新しい標準を設定することで、オープンソースコミュニティに貢献できることを願っています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:42:20 GMT)
Images are Achilles' Heel of Alignment: Exploiting Visual Vulnerabilities for Jailbreaking Multimodal Large Language Models [107.9] マルチモーダル大言語モデル(MLLM)の無害アライメント問題について検討する。
そこで本研究では,テキスト入力における悪意のある意図の有害性を隠蔽し,増幅する,HADESという新しいジェイルブレイク手法を提案する。
実験の結果、HADESは既存のMLLMを効果的にジェイルブレイクし、LLaVA-1.5では90.26%、Gemini Pro Visionでは71.60%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:30:37 GMT)
RGB-D Indiscernible Object Counting in Underwater Scenes [105.1] IOC(Indiscernible object counting)は、周囲に混在する物体を数えることを目的としている。
我々は,5,637個の高解像度画像と024,659個の注釈付き中心点を含む大規模データセットIOCfish5Kを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:45:59 GMT)
Dynamic Multimodal Fusion via Meta-Learning Towards Micro-Video Recommendation [97.8] メタマルチモーダルフュージョン(MetaMMF)と呼ばれるメタラーニングに基づく新しいマルチモーダルフュージョンフレームワークを開発する。
メタMMFは、入力タスクのマルチモーダル特徴から抽出されたメタ情報に基づいて、メタラーナを介して、アイテム固有の融合関数としてニューラルネットワークをパラメータ化する。
我々は3つのベンチマークデータセットに対して広範な実験を行い、最先端のマルチモーダルレコメンデーションモデルに対する大幅な改善を実証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:51:43 GMT)
Improved off-policy training of diffusion samplers [93.7] 本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:56:11 GMT)
Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards [93.2] このタイプの最も人気のあるベンチマークであるArenaは、ランダムに選択された2つのモデル間のより良いレスポンスを選択するようユーザに求めることで、モデルをランク付けする。
攻撃者は、約1000票の費用で、リーダーボードを変更できる(お気に入りのモデルを宣伝したり、ライバルを降格させる)。
私たちの攻撃は2つのステップで構成されている。まず、攻撃者が95%以上の精度で特定の応答を生成するためにどのモデルを使用したかを決定する方法を示し、次に、攻撃者はこの情報を使ってターゲットモデルに対して一貫して投票することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:12:38 GMT)
Amortizing intractable inference in diffusion models for vision, language, and control [89.7] 本稿では,p(mathbfx)$以前の拡散生成モデルとブラックボックス制約,あるいは関数$r(mathbfx)$からなるモデルにおいて,データ上の後部サンプルである $mathbfxsim prm post(mathbfx)propto p(mathbfx)r(mathbfx)$について検討する。
我々は,データフリー学習目標である相対軌道バランスの正しさを,サンプルから抽出した拡散モデルの訓練のために証明する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:14:27 GMT)
The Sound of Water: Inferring Physical Properties from Pouring Liquids [85.3] 注水液の音響・視覚観測と物理の関連性について検討した。
本研究の目的は, 液位, 容器形状, 注水速度, 充填時間などの物性を自動的に推定することである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:20:35 GMT)
SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation [84.1] 本論文は、完全教師なし産業異常検出(すなわち、ノイズデータ付き教師なしAD)を初めて検討したものである。
メモリベースの非教師なしAD手法であるSoftPatchとSoftPatch+を提案する。
既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
様々なノイズシナリオで実施された総合的な実験により、SoftPatchとSoftPatch+はMVTecAD、ViSA、BTADのベンチマークで最先端のADメソッドよりも優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:11:06 GMT)
BlobGEN-Vid: Compositional Text-to-Video Generation with Blob Video Representations [82.9] 既存のビデオ生成モデルは、複雑なテキストプロンプトに従い、複数のオブジェクトを合成するのに苦労する。
我々は,BlobGEN-Vidというブロブグラウンドビデオ拡散モデルを開発し,ユーザがオブジェクトの動きを制御し,細かいオブジェクトの外観を制御できるようにする。
U-NetとDiTをベースとした動画拡散モデルに基づいてBlobGEN-Vidを構築する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:17:06 GMT)
Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models [79.6] 複数の画像に対して自由かつ正確なグラウンド化を行うことができる最初のマルチイメージグラウンドモデルであるMigicianを紹介する。
本モデルでは,既存のMLLMよりも21.61%,さらに大きな70Bモデルよりもはるかに優れたマルチイメージグラウンド機能を実現している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:38:32 GMT)
Sparse Attention Vectors: Generative Multimodal Model Features Are Discriminative Vision-Language Classifiers [79.5] 生成型大規模マルチモーダルモデル(LMM)は、画像キャプションや視覚的質問応答など、様々な視覚言語(VL)タスクに優れる。
本稿では,LMMを識別タスクに効果的に活用する手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:45:26 GMT)
ExACT: Teaching AI Agents to Explore with Reflective-MCTS and Exploratory Learning [78.4] ExACTは、エージェントアプリケーションのためのo1のようなモデルを構築するために、テスト時間検索と自己学習を組み合わせるアプローチである。
リフレクティブモンテカルロ木探索(Reflective Monte Carlo Tree Search, R-MCTS)は、AIエージェントがその場で意思決定空間を探索する能力を高めるために設計された新しいテストタイムアルゴリズムである。
次に,探索学習(Exploratory Learning)という,外部探索アルゴリズムに頼らずに,エージェントに推論時間での探索を教える新しい学習戦略を紹介する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:51:53 GMT)
LLM360 K2: Scaling Up 360-Open-Source Large Language Models [77.0] 我々は、LLM360 K2-65Bモデルのトレーニングについて詳述し、私たちの360度OPEN SOURCEアプローチを、プロジェクトLLM360の下で最大かつ最も強力なモデルにスケールアップした。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:26:43 GMT)
Value Compass Leaderboard: A Platform for Fundamental and Validated Evaluation of LLMs Values [76.7] 大きな言語モデル(LLM)は目覚ましいブレークスルーを達成し、その価値を人間と一致させることが必須になっている。
既存の評価は、バイアスや毒性といった安全性のリスクに焦点を絞っている。
既存のベンチマークはデータ汚染の傾向があります。
個人や文化にまたがる人的価値の多元的性質は、LLM値アライメントの測定において無視される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:53:56 GMT)
LLMic: Romanian Foundation Language Model [76.1] ルーマニア語に特化して設計された基礎言語モデルである LLMic について述べる。
英語からルーマニア語への翻訳作業において,事前学習後の言語翻訳のための微調整 LLMic が既存の解よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:14:45 GMT)
MIO: A Foundation Model on Multimodal Tokens [74.9] マルチモーダルトークン上に構築された新しい基礎モデルMIOを紹介する。
MIOは、エンドツーエンドの自己回帰的な方法で、音声、テキスト、画像、ビデオを理解し、生成することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:41:44 GMT)
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.4] BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:58:03 GMT)
Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner [72.2] 医療の安全性と有効性を理解するためには,観測データから因果量の推定が重要である。
医療従事者は、平均因果量の推定だけでなく、治療効果のランダム性をランダムな変数として理解する必要がある。
このランダム性はアレタリック不確実性と呼ばれ、治療効果の利益や量子化の確率を理解するために必要である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:13:38 GMT)
Imagine while Reasoning in Space: Multimodal Visualization-of-Thought [70.7] 大型言語モデル(LLM)とマルチモーダル大規模言語モデル(MLLM)の複雑な推論を強化するために、CoTプロンプト(Chain-of-Thought)が有効であることが証明された。
我々は新しい推論パラダイムであるMultimodal Visualization-of-Thought (MVoT)を提案する。
MLLMにおいて、推論トレースの画像視覚化を生成することにより、視覚的思考を可能にする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:23:57 GMT)
Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance [70.0] 本稿では,人間の顔の基盤モデルを用いた最初のSDSベースの手法であるArc2Avatarについて述べる。
我々のアバターは人間の顔メッシュテンプレートとの密接な対応を維持しており、ブレンドシェープによる表現生成を可能にしている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:22:30 GMT)
Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.9] クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:39:30 GMT)
Barcodes as Summary of Loss Function Topology [65.3] ニューラルネットワークの深さと幅の増大は局所的なミニマのバーコード低下を示す。
これはニューラルネットワークの学習と一般化特性にいくつかの自然な意味を持つ。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:34:11 GMT)
EdgeTAM: On-Device Track Anything Model [65.1] Segment Anything Model (SAM) 2はさらに、イメージからビデオへの入力をメモリバンク機構を通じて拡張する。
私たちはSAM 2をより効率的にし、同等のパフォーマンスを維持しながらモバイルデバイス上でも動作できるようにすることを目標としています。
計算コストを削減するために,新しい2次元空間知覚器を利用するEdgeTAMを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:11:07 GMT)
TimeLogic: A Temporal Logic Benchmark for Video QA [64.3] 時間的論理的質問を自動的に生成するTimeLogic QA(TLQA)フレームワークを導入する。
私たちはSTAR、Breakfast、AGQA、CrossTaskの4つのデータセットを活用し、カテゴリ毎に2kと10kのQAペアを生成します。
時間的複雑性の異なる16カテゴリの時間論理に対して,ビデオQAモデルの時間的推論性能を評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:12:59 GMT)
CSTA: Spatial-Temporal Causal Adaptive Learning for Exemplar-Free Video Class-Incremental Learning [62.7] クラスインクリメンタルな学習課題は、空間的外観と時間的行動の関与の両方を学習し、保存することを必要とする。
本稿では,各クラス固有のインクリメンタル情報要件を調整し,新しいクラスパターンを学習するためのアダプタを分離するフレームワークを提案する。
異なる種類の情報間のインクリメントと記憶の衝突を減らすために,因果補償機構を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:34:55 GMT)
The Lessons of Developing Process Reward Models in Mathematical Reasoning [62.2] Process Reward Models (PRM) は、推論プロセスにおける中間エラーを特定し、緩和することを目的としている。
我々は,モンテカルロ (MC) 推定とLarge Language Models (LLM) を効果的に統合するコンセンサスフィルタリング機構を開発した。
私たちは、既存のオープンソース代替品よりも優れた、最先端のPRMを新たにリリースしています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:10:16 GMT)
MVICAD2: Multi-View Independent Component Analysis with Delays and Dilations [61.6] 本稿では,時間的遅延と拡張の両面において,被験者間でソースを異にするMVICAD(Multi-View Independent Component Analysis with Delays and Dilations)を提案する。
本稿では, 正則化と最適化手法を用いて, 性能向上を図るため, 正則化と最適化手法を用いて, その可能性の近似を導出する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:47:02 GMT)
Divergences between Language Models and Human Brains [59.1] 我々は,人間と機械語処理の相違点を体系的に探求する。
我々は、LMがうまく捉えられない2つの領域、社会的/感情的知性と身体的常識を識別する。
以上の結果から,これらの領域における微調整LMは,ヒト脳反応との整合性を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:22:06 GMT)
Parallel Key-Value Cache Fusion for Position Invariant RAG [56.0] 大規模言語モデル(LLM)は、コンテキスト内の関連する情報の位置に敏感である。
入力コンテキスト順序に関係なく,デコーダのみのモデルに対して一貫した出力を生成するフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:50:30 GMT)
WebWalker: Benchmarking LLMs in Web Traversal [55.4] WebWalkerQAは,LLMがWebトラバースを実現する能力を評価するためのベンチマークである。
本稿では,WebWalkerを提案する。WebWalkerは,探索的・批判的パラダイムを通じて,人間のようなWebナビゲーションを模倣するマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:58:07 GMT)
Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.1] 本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:35:54 GMT)
An empirical study of LLaMA3 quantization: from LLMs to MLLMs [54.9] LLaMAファミリーは、最も強力なオープンソースの大規模言語モデル(LLM)の1つである。
LLaMA3モデルは、15T以上のデータに対する超大規模事前トレーニングによって、様々な領域で優れたパフォーマンスを実現している。
我々は,LLaMA3の1-8ビットおよび様々なデータセット上で,LLaMA3の学習後量子化とLoRA微調整(LoRA-FT)の10種類の既存手法を評価し,LLaMA3の低ビット量子化性能を明らかにする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:01:13 GMT)
ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning [54.8] 我々は、チャート領域における既製のマルチモーダル言語モデル(MLLM)の能力をベンチマークする。
ChartXは18種類のチャートタイプ,7つのチャートタスク,22のディシプリナトピック,高品質なチャートデータを含むマルチモーダルな評価セットである。
我々は、解釈可能なパターンに強く依存するマルチモーダルタスクに対する新しい視点を提供するため、ChartVLMを開発した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:14:51 GMT)
SecAlign: Defending Against Prompt Injection with Preference Optimization [52.5] アドリアルプロンプトは外部データソースに注入され、システムの意図した命令をオーバーライドし、悪意のある命令を実行する。
我々は、好みの最適化技術に基づくSecAlignと呼ばれる新しいディフェンスを提案する。
本手法は,訓練中に見られたものよりもはるかに高度な攻撃に対しても,様々なプロンプトインジェクションの成功率を約0%に低下させる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:45:57 GMT)
Online inductive learning from answer sets for efficient reinforcement learning exploration [52.0] エージェントポリシーの近似を説明可能な近似を表す論理規則の集合を学習するために,帰納的な解集合プログラムの学習を利用する。
次に、学習ルールに基づいて回答セット推論を行い、次のバッチで学習エージェントの探索をガイドします。
本手法は,初回トレーニングにおいても,エージェントが達成した割引リターンを著しく向上させる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:13:22 GMT)
Large Action Models: From Inception to Implementation [51.8] 大規模アクションモデル(LAM)は動的環境内でのアクション生成と実行のために設計されている。
LAMは、AIを受動的言語理解からアクティブなタスク完了に変換する可能性を秘めている。
創発から展開まで,LAMを体系的に開発するための総合的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:47:21 GMT)
Autoencoded UMAP-Enhanced Clustering for Unsupervised Learning [49.2] 本稿では,低次元空間にデータを非線形に埋め込み,次に従来のクラスタリングアルゴリズムを用いて非教師なし学習を行う手法を提案する。
この埋め込みはデータのクラスタビリティを促進し、オートエンコーダニューラルネットワークのエンコーダとUMAPアルゴリズムの出力の2つのマッピングで構成されている。
MNISTデータに適用した場合、AUECはクラスタリング精度において最先端技術よりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:30:38 GMT)
II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models [49.1] マルチモーダルな大言語モデル(MLLM)は、様々なベンチマークで新しいブレークスルーをもたらしている。
本稿では,画像の高次知覚評価を目的とした画像意味理解ベンチマークII-Benchを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:33:47 GMT)
Towards an Information Theoretic Framework of Context-Based Offline Meta-Reinforcement Learning [48.8] 我々は,COMRLアルゴリズムが,タスク変数$M$と,その潜在表現$Z$の相互情報目的を,様々な近似境界を実装して最適化していることを示す。
実演として、$I(Z; M)$の教師付きおよび自己教師型実装を提案し、対応する最適化アルゴリズムがRLベンチマークの幅広いスペクトルにわたって顕著な一般化を示すことを実証的に示す。
本研究は,COMRL法の情報理論基盤を構築し,強化学習の文脈におけるタスク表現学習の理解を深める。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:58:30 GMT)
Hierarchical Superpixel Segmentation via Structural Information Theory [48.5] スーパーピクセルセグメンテーションは多くの高レベルのコンピュータビジョンタスクの基礎となっている。
構造情報理論に基づく階層的スーパーピクセルセグメンテーション手法であるSIT-HSSを提案する。
SIT-HSSは、最先端の教師なしスーパーピクセルセグメンテーションアルゴリズムよりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:39:43 GMT)
UnCommon Objects in 3D [48.3] 3Dディープラーニングと3D生成AIのための新しいオブジェクト中心データセットである、Uncommon Objects in 3D (uCO3D)を紹介する。
uCO3Dは3Dアノテーション付きオブジェクトの高解像度ビデオのコレクションとしては最大で、360ドル(約3万3000円)のカバレッジが保証されている。
我々は,MVImgNet,CO3Dv2,uCO3Dで大規模3Dモデルをトレーニングし,後者を用いて優れた結果を得た。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:59:20 GMT)
Data Enrichment Work and AI Labor in Latin America and the Caribbean [48.1] 我々はラテンアメリカとカリブ海の16カ国で100人のクラウドワーカーを対象に調査を行った。
これらの労働者は、彼らの家族から強い支持と賞賛を受けながら、彼らのデジタル労働に対する誇りと敬意を示していた。
群衆の仕事は、財政と職業の独立への足掛かりとも見なされた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:11:47 GMT)
Fixing the Scale and Shift in Monocular Depth For Camera Pose Estimation [47.7] 本稿では,2つのカメラ間の相対的なポーズを,関連する単眼深度に対応する点対応から推定する新しい枠組みを提案する。
2台の校正カメラ, 2台の未校正カメラ, 2台の未校正カメラ, 2台の未校正カメラ, 3台の未校正カメラ, 3台の非校正カメラ, 3台の非校正カメラの焦点長を比較検討した。
従来の研究と比較すると、我々の解法は2つの大規模な実世界のデータセットに対して最先端の結果が得られる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:13:33 GMT)
Empirical Evaluation of the Implicit Hitting Set Approach for Weighted CSPs [46.0] 重み付きCSP問題に対する既存の参照アルゴリズムの代替策について検討する。
我々の実証研究は、WCSPにとって最良の選択肢を特定するのは容易ではないことを示している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:59:28 GMT)
Multi-megabase scale genome interpretation with genetic language models [46.0] フェンフォーマー(英: Phenformer)は、機械的仮説を生成するために学習する多スケールの遺伝的言語モデルである。
我々は,150万以上の個体から得られた全ゲノムシークエンシングデータを用いて,Phenformerが既存の方法よりも優れた機械的仮説を生成することを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:00:40 GMT)
A Comprehensive Study of Structural Pruning for Vision Models [45.2] PruningBenchと呼ばれる、構造的プルーニングのための最初の総合的なベンチマークを提示する。
PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。
本論文では、オンラインプルーニングプラットフォームを用いて、プルーニングタスクをカスタマイズし、すべての結果を再現する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:38:09 GMT)
Data and System Perspectives of Sustainable Artificial Intelligence [43.2] 持続可能なAIは、環境への影響を減らし、持続可能性を達成することを目的としたAIのサブフィールドである。
本稿では、これらの問題に対処するための現在の課題、機会、例題ソリューションについて論じる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:04:23 GMT)
Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models [43.2] 大規模マルチモーダルモデル(LMM)の多言語機能を活用した並列多言語プロンプトを構築する。
3つのベンチマークにおける2つのLMM実験により,提案手法であるPMT2Iが,一般に優れた性能,構成,きめ細かな評価を達成できることが判明した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:41:23 GMT)
RAD-DINO: Exploring Scalable Medical Image Encoders Beyond Text Supervision [43.1] 言語による事前学習は、画像から意味論的に意味のある特徴を抽出する貴重な方法であることが証明されている。
生体画像エンコーダRAD-DINOについて検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:14:52 GMT)
CAB: Comprehensive Attention Benchmarking on Long Sequence Modeling [43.0] ロングレンジ・アリーナ(Long Range Arena、LRA)は、標準的な双方向(または非因果的な)自己注意のみに焦点を当てている。
本研究では,4つの注意パターンを持つ詳細な注意条件下で,包括的注意ベンチマーク(CAB)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:20:10 GMT)
Beyond the Surface: An NLP-based Methodology to Automatically Estimate CVE Relevance for CAPEC Attack Patterns [42.6] 本稿では,自然言語処理(NLP)を利用して,共通脆弱性・暴露(CAPEC)脆弱性と共通攻撃パターン・分類(CAPEC)攻撃パターンを関連付ける手法を提案する。
実験による評価は,最先端モデルと比較して優れた性能を示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:39:52 GMT)
Anomalous Agreement: How to find the Ideal Number of Anomaly Classes in Correlated, Multivariate Time Series Data [42.5] 本稿では,時系列間の異常の同期を利用してクラスタ品質を評価するSynchronized Anomaly Agreement Index (SAAI)を紹介する。
本研究では,SAAI の最大化により,相関時系列における乱数 K の真数を求めるタスクの精度が SSC と比較して 0.23 向上し,X-Means に比べて 0.32 向上したことを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:04:55 GMT)
Machine Learning-Enhanced Characterisation of Structured Spectral Densities: Leveraging the Reaction Coordinate Mapping [41.9] スペクトル密度は、開量子系におけるシステム-環境相互作用に関する必須情報を符号化する。
反応座標マッピングを用いて,機械学習を利用して重要な環境特徴を再構築する。
ローレンツピークの和として表されるスペクトル密度が構造化された散逸スピンボソンモデルに対し、観測可能なシステムの時間進化はニューラルネットワークによって1、2、3ローレンツピークのスペクトル密度を分類することができることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:02:04 GMT)
Seeing the Unseen: Learning Basis Confounder Representations for Robust Traffic Prediction [41.6] 交通予測はインテリジェント交通システムと都市コンピューティングにとって不可欠である。
各種統計・深層学習手法を用いて, 過去の交通データXと将来の交通状況Yの関係を確立することを目的とする。
X -> Y の関係は、しばしば X と Y の両方に同時に影響を与える外部共同設立者の影響を受けている。
既存のディープラーニングトラフィック予測モデルでは、共同創業者の問題に対処するために、古典的なフロントドアとバックドアの調整が採用されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:43:22 GMT)
Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model [40.8] 我々は、IDデータとより挑戦的なOODシナリオの両方の下で、事前学習されたディープラーニングモデルの性能を評価することによって、新しいアプローチを提案する。
動作の速い手から指を横切る動作や動きのぼやけなど,特異かつ稀な条件を取り入れた。
その結果、産業用データセットでトレーニングされたモデルは、非工業用データセットでトレーニングされたモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:52:46 GMT)
Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning [40.4] 本稿では,画像上の2次元短距離軌跡として行動を表現することを提案する。
これらの動作、つまりモーショントラックは、人間の手やロボットのエンドエフェクターの動作の予測方向を捉えます。
画像観察を受信し,動作トラックを動作として出力する,MT-pi(Motion Track Policy)と呼ばれるILポリシをインスタンス化する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:01:44 GMT)
Decoding Musical Evolution Through Network Science [39.6] 私たちはNetwork Scienceを使って音楽の複雑さを分析します。
それぞれの構成を重み付き指向ネットワークとして表現し,その構造特性について検討する。
その結果、クラシックとジャズの合成は、近年発達したジャンルよりも複雑さとメロディ的な多様性が高いことが明らかとなった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:39:44 GMT)
Step-by-Step Mastery: Enhancing Soft Constraint Following Ability of Large Language Models [39.1] 大規模言語モデル(LLM)には、複数の制約を含む命令に従うことが不可欠である。
ソフト制約は意味論的に関連しており、自動手法による検証が難しい。
高品質なアウトプットを自動的に獲得するパイプラインを設計し,カリキュラム学習に基づくトレーニングパラダイムを導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:06:10 GMT)
Lifelong Learning of Large Language Model based Agents: A Roadmap [39.0] 連続的・漸進的な学習として知られる生涯学習は、人工知能(AGI)を前進させる重要な要素である
この調査は、生涯学習を大規模言語モデル(LLM)に組み込むための潜在的テクニックを体系的にまとめる最初のものである。
これらの柱が集合的に連続的な適応を可能にし、破滅的な忘れを軽減し、長期的なパフォーマンスを向上させる方法について強調する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:42:04 GMT)
On the Robustness of Object Detection Models on Aerial Images [38.9] DOTA-v1.0に基づく新しいベンチマークを2つ導入する。
第1のベンチマークは、19の一般的な汚職を含むが、第2のベンチマークは、クラウド崩壊状態に焦点を当てている。
回転不変モデリングと強化されたバックボーンアーキテクチャはモデルの堅牢性を向上させることができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:49:22 GMT)
Intelligent System for Automated Molecular Patent Infringement Assessment [38.5] PatentFinderは、特許侵害のための小さな分子を正確かつ包括的に評価できる、新しいマルチエージェントおよびツール強化インテリジェンスシステムである。
PatentFinderは、特許請求と分子構造を協調的に分析する5つの特殊エージェントを備えている。
PatentFinderは、詳細かつ解釈可能な特許侵害報告を自律的に生成し、精度の向上と解釈可能性の向上を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:03:57 GMT)
ADKGD: Anomaly Detection in Knowledge Graphs with Dual-Channel Training [38.4] 本稿では、二重チャネル学習(ADKGD)を用いた知識グラフにおける異常検出アルゴリズムを提案する。
両チャネル間のスコアリング関数の精度を向上させるために,KL(Kullback-leibler)-loss成分を導入する。
実験の結果,ADKGDは最先端の異常検出アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:22:52 GMT)
CDS: Data Synthesis Method Guided by Cognitive Diagnosis Theory [38.3] 本研究では,認知診断理論(CDT)を用いた大規模言語モデル(LLM)の精度評価と目標拡張を目的とした認知診断合成(CDS)手法を提案する。
複雑なタスクを個別の知識ポイントに分解することで、CDSはモデルの弱点をターゲットとするデータを正確に識別し、合成し、モデルの性能を向上させる。
このフレームワークは、知識点評価、合成、データ拡張、フィルタリングによって駆動される包括的なパイプラインを提案し、最適なシナリオにおいて最大11.12%の改善を達成し、モデルの数学的およびコーディング能力を大幅に改善する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:13:59 GMT)
LDMapNet-U: An End-to-End System for City-Scale Lane-Level Map Updating [38.3] レーンレベルの更新は正確な変更情報を必要とし、隣接するデータとの整合性を確保する必要がある。
従来の手法では、3段階のアプローチコンストラクション、変更検出、そしてしばしば精度の制限による手動検証の更新を利用する。
都市規模レーンレベルの地図更新のための新しいエンドツーエンドパラダイムを実装したLDMapNet-Uを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:21:29 GMT)
Pamba: Enhancing Global Interaction in Point Clouds via State Space Model [37.4] 我々は、SSMベースのアーキテクチャであるMambaをポイントクラウドドメインに導入し、線形複雑性の下で強力なグローバルモデリング機能を備えた新しいアーキテクチャであるPambaを提案する。
Pambaは、ScanNet v2、ScanNet200、S3DIS、nuScenesなど、いくつかの3Dポイントクラウドセグメンテーションタスクの最先端結果を取得する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:36:58 GMT)
Thickness dependence of the mechanical properties of piezoelectric high-$Q_m$ nanomechanical resonators made from aluminium nitride [36.9] 窒化アルミニウム(AlN)から作製した引張歪圧電膜の材料特性について検討する。
SI200nm以下のAlNナノメカニカル共振器は1012ドル,Hzの高Qf生成物を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:38:23 GMT)
WeCromCL: Weakly Supervised Cross-Modality Contrastive Learning for Transcription-only Supervised Text Spotting [36.9] 転写のみのSupervised Text Spottingは、テキストスポッターを文字のみに依存して学習することを目的としている。
我々は、この課題を、弱々しく監視されたクロスモダリティコントラスト学習問題として定式化する。
WeCromCLと呼ばれるシンプルで効果的なモデルを構築し、弱い教師付きでシーンイメージ内の各転写を検出できる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:58:40 GMT)
Enhancing the sensitivity of single microwave photon detection with bandwidth tunability [36.1] 超伝導トランスモン量子ビットを用いたマイクロ波光子カウンタ装置の特性について報告する。
出力感度は3 cdot 10-23 MathrmW/sqrtmathrmHz$に達する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:21:29 GMT)
Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss [35.7] 本稿では,初期雑音に基づくアプローチと新たな動きの整合性損失を組み合わせた,シンプルで効果的な解を提案する。
次に、生成したビデオに類似した特徴相関パターンを維持するために、動きの整合性損失を設計する。
このアプローチは、トレーニング不要のセットアップの利点を保ちながら、さまざまなモーションコントロールタスク間の時間的一貫性を改善する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:53:08 GMT)
A Multiplexed Programmable Quantum Photonic Network [34.8] 量子ネットワークにおける絡み合い分布は、量子セキュア通信、分散量子コンピューティング、センシングのための次世代技術を可能にする。
将来の量子ネットワークは密接な接続を必要とし、複数のパーティが再設定可能な方法で絡み合った状態を共有することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:35:41 GMT)
Graph Contrastive Learning on Multi-label Classification for Recommendations [34.8] マルチラベル分類のためのグラフコントラスト学習モデル(MCGCL)を提案する。
MCGCLはコントラスト学習を活用してレコメンデーションの有効性を高める。
マルチラベル分類タスクにおいて,Amazon Reviewsの実際のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:29:29 GMT)
The infrastructure powering IBM's Gen AI model development [34.7] IBMは、生成的AIモデル開発を支えるハイブリッドクラウドインフラストラクチャについて説明している。
Velaは、IBM Cloudに直接統合されたAI最適化スーパーコンピュータ機能である。
Blue Velaは大規模で汎用的なオンプレミスホスティング環境である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:53:34 GMT)
Efficient Large Foundation Models Design: A Perspective From Model and System Co-Design [34.1] 本稿では,基礎モデルに基づく現代的効率的なトレーニングと推論技術に焦点を当てる。
モデルとシステムデザイン 異なる側面からのトレーニングと推論を最適化し、計算資源を節約する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:02:27 GMT)
Video Quality Assessment for Online Processing: From Spatial to Temporal Sampling [33.3] 本稿では、少なくともVQAモデルにビデオを送る際には、いかに少ない情報を保持するべきかを検討する。
空間次元と時間次元の両方から映像情報を徹底的にサンプリングし、強く圧縮された映像を安定なVQAモデルに入力する。
6つの公開ビデオ品質データベース上で,共同空間および時間的サンプリングに関する総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:45:32 GMT)
DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models [32.9] 本研究では,人間医師と比較して,大規模言語モデル(LLM)の推論能力と解釈可能性を評価することを目的とする。
臨床注記用診断推論データセット(DiReCT)は、511の臨床注記を含む。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:13:56 GMT)
The Essentials of AI for Life and Society: An AI Literacy Course for the University Community [32.8] 本稿では,テキサス大学オースティン校で,AIリテラシーを促進するワンクレジットコースの開発について述べる。
我々は14週間のセミナー・スタイルのコースを設計し、AIの基本から、偽情報や雇用を含む社会的な関心事まで幅広いトピックを講義する、学際的な話者グループを組み込んだ。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:08:32 GMT)
AI-Driven Early Mental Health Screening: Analyzing Selfies of Pregnant Women [32.5] うつ病や不安障害は世界中で何百万もの人に影響を与え、精神疾患の重荷に大きく貢献する。
早期スクリーニングは、精神疾患のタイムリーな同定が治療成績を大幅に改善するので、効果的な介入に不可欠である。
本研究は、顔中心の自撮りを与えられたユビキタスな抑うつ不安スクリーニングのためのAIモデルの可能性について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:54:31 GMT)
Design of 2D Skyrmionic Metamaterial Through Controlled Assembly [31.9] 本研究は単層膜内における超イオン性メタマテリアルの構築経路に焦点を当てる。
自己安定化機構により、驚くほど安定ないくつかの超イオン性メタマテリアル(長寿命)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:38:07 GMT)
Collaborative Learning for 3D Hand-Object Reconstruction and Compositional Action Recognition from Egocentric RGB Videos Using Superquadrics [31.8] 境界ボックスに対する3次元オブジェクト表現の代替としてスーパークワッドリックを活用することを提案する。
テンプレートレスオブジェクト再構成とアクション認識の両タスクで有効性を示す。
また,動詞と名詞の訓練組み合わせがテスト分割と重複しない,より困難な課題を考慮し,行動の構成性についても検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:26:05 GMT)
Cocoa: Co-Planning and Co-Execution with AI Agents [31.7] 対話型設計パターンを実装するシステムであるCocoaについて紹介する。
Cocoaは人間とAIの取り組みを調和させ、柔軟に機関の委任を可能にする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:41:47 GMT)
A Survey of Embodied AI in Healthcare: Techniques, Applications, and Opportunities [31.2] 医療におけるEmAI」は、アルゴリズム、ロボティクス、バイオメディシンといった多様な分野にまたがる。
医療のためのEmAIの"脳"の概要を包括的に紹介し、認識、アクティベーション、計画、記憶のためのAIアルゴリズムを紹介します。
我々は、技術的な障壁を議論し、倫理的考察を探求し、医療におけるEmAIの将来を前方視する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:35:52 GMT)
Multipartite quantum correlated bright frequency combs [29.3] 実験により、窒化ケイ素上に集積されたマイクロ共振器から発生する明るい周波数コムの多部量子相関が実証された。
その結果, 2モードから複数パーティ間の相関が, 2.5$, dB および 2$, dB の低雑音化によって観測された。
報告されたデモは、量子技術応用のための次世代のオンチップマルチパーティライトソースへの道を開いた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:00:44 GMT)
Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators [29.1] 多変量関数に対する任意の順序の微分テンソルの任意の収縮を効率的に行う方法を示す。
物理インフォームドニューラルネットワーク(PINN)に適用すると,1000$times$ Speed-upと1000$times$ Speed-upが提供される。
30$times$1次ADによるランダム化によるメモリ削減。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:43:15 GMT)
Matching Free Depth Recovery from Structured Light [28.9] 構造化光システムにより撮像された画像から深度を推定するための新しい手法を提案する。
本手法では,密度ボクセル格子を用いてシーン形状を表現し,自己教師付き可変ボリュームレンダリングを用いて学習する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:03:49 GMT)
GFairHint: Improving Individual Fairness for Graph Neural Networks via Fairness Hint [28.7] グラフニューラルネットワーク(GNN)のアルゴリズムフェアネスは注目されている。
本稿では,GNNにおける個々人の公平性を促進する新しい手法GFairHintを提案する。
GFairHintは、データセットとさまざまなバックボーンモデルの組み合わせで、最も公正な結果を達成する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:17:38 GMT)
ACCon: Angle-Compensated Contrastive Regularizer for Deep Regression [28.5] ディープレグレッションでは、特徴空間における連続ラベル間の関係を捉えることが、関心の高まりを惹きつけている根本的な課題である。
既存のアプローチは、しばしばオーダーアウェアな表現学習や距離に基づく重み付けに依存している。
本研究では, アンカーと負のサンプル間のコサイン距離を補正する, 深部回帰のための角度補償型コントラスト正規化器を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:55:59 GMT)
PSA-VLM: Enhancing Vision-Language Model Safety through Progressive Concept-Bottleneck-Driven Alignment [28.0] 本稿では,視覚的モダリティの安全性向上を目的とした,プログレッシブなコンセプトベースアライメント戦略であるPSA-VLMを提案する。
提案手法は,VLMの安全性ベンチマークにおいて,最先端の安全性を実現する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:39:04 GMT)
Three-view Focal Length Recovery From Homographies [27.7] 本稿では,3次元ホモグラフから焦点距離を復元する手法を提案する。
2つのホモグラフ間の正規ベクトルの整合性を調べることによって、焦点距離とホモグラフの間の新しい明示的な制約を導出する。
3次元ホモグラフは1つか2つの焦点距離の回復を可能にする2つの制約を与えることを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:17:17 GMT)
A Mixed-Integer Conic Program for the Moving-Target Traveling Salesman Problem based on a Graph of Convex Sets [27.6] 本稿では,移動目標トラベリングセールスマン問題(MT-TSP)の最適解を求める新しい定式化を提案する。
問題は、補給所から始まるエージェントの最も短い経路を見つけ、割り当てられた時間ウィンドウ内で1度だけ移動対象のセットを訪れ、補給所に戻ることである。
MT-TSPのためのMICP(Mixed Conic Program)の定式化について検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:28:04 GMT)
Universal Training of Neural Networks to Achieve Bayes Optimal Classification Accuracy [27.1] ベイズ誤り率を達成するために,最小化によって分類モデルを適用したベイズ最適学習閾値(BOLT)の損失を導入する。
数値実験により、BOLTで訓練されたモデルが、クロスエントロピーのモデルと同等以上の性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:55:11 GMT)
Imitating from auxiliary imperfect demonstrations via Adversarial Density Weighted Regression [27.1] 本稿では,適応密度回帰(Adversarial Density Regression)と呼ばれる,一段階の教師付き模倣学習フレームワークを提案する。
実演を生かして、専門家の分布に合わせるために、未知の品質で学んだポリシーを正すことを目的としている。
AdroitドメインとKitchenドメインのタスクの真理的な報酬を利用する場合、IQLよりも89.5%改善されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:27:56 GMT)
OblivCDN: A Practical Privacy-preserving CDN with Oblivious Content Access [27.0] textsfOblivCDNは、既存の現実世界のインターネット-CDNインフラとのシームレスな統合を念頭に設計した、実用的なプライバシ保護システムである。
実世界のストリーミング評価では、OblivCDNは素晴らしいパフォーマンスを示し、わずか5.6ドル秒で256ドルMBの動画をダウンロードした。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:23:23 GMT)
ListConRanker: A Contrastive Text Reranker with Listwise Encoding [27.0] 本稿では,Listwise-encoded Contrastive text reRanker (ListConRanker)を提案する。
これは、エンコーディングプロセス中に他のパスと比較するのに役立ちます。
これは、中国語のMassive Text Embedding Benchmarkの再評価ベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:51:46 GMT)
Variable Bregman Majorization-Minimization Algorithm and its Application to Dirichlet Maximum Likelihood Estimation [26.4] 本稿では,微分可能部分の和として表現される凸関数と,非滑らかな項を最小化する,新しいブレグマン降下アルゴリズムを提案する。
VBMM(Variable Bregman Majorization-Minimization)アルゴリズムと呼ばれるこの手法は、Bregman Proximal Gradient法を拡張している。
数値実験により、VBMMアルゴリズムは収束速度において既存の手法よりも優れていることを確認した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:16:12 GMT)
Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model [26.2] LALM(Large Audio-Language Models)は、音声知覚や理解に関わるタスクにおいて顕著な性能を示す。
しかし、それらの推論能力は、複雑な現実世界の問題を解決するのに重要なものであり、まだ未解明のままである。
聴覚モダリティを越えた推論能力を高めるため, LALMへのCoT推論の統合を初めて実施する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:54:40 GMT)
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding [26.0] 本稿では,音声を正確に書き起こし,構造化コンテンツを同時に抽出できる共同音声認識・構造学習フレームワーク(JSRSL)を提案する。
提案手法は, 従来のシーケンス・ツー・シーケンス法よりも, 書き起こし能力と抽出能力の両面で優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:43:46 GMT)
MOS-Attack: A Scalable Multi-objective Adversarial Attack Framework [25.7] 多目的セットベースアタック(MOSアタック)
本稿では,複数の損失関数を有効利用し,その相互関係を自動的に解明する新たな攻撃フレームワークを提案する。
MOSアタックは、損失関数の減少による優れた結果を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:00:34 GMT)
Zero-Shot Scene Understanding for Automatic Target Recognition Using Large Vision-Language Models [25.7] LVLM(Large Vision-Language Models)は、ゼロショット方式で様々な条件で物体を認識できる創発的特性を示す。
本稿では,LVLMの検出能力とLVLMの認識信頼性を組み合わせた新しいパイプラインを提案する。
本研究では,軍用車両の認識における各種LVLMの性能を比較する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:11:27 GMT)
MLLM-CompBench: A Comparative Reasoning Benchmark for Multimodal LLMs [24.9] 比較能力は、人工知能(AGI)においてほとんど探索されていない
MLLM-CompBenchはマルチモーダル大言語モデル(MLLM)の比較推論能力を評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:04:59 GMT)
Implementing LoRa MIMO System for Internet of Things [24.9] 現代のIoTアプリケーションは、LoRaが提供するものよりも高いスループットを必要とする。
本研究は、LoRaの帯域制限に対処する空間多重化アルゴリズムと、LoRa多重入力多重出力(MIMO)システムを導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:22:17 GMT)
AlphaNet: Scaling Up Local Frame-based Atomistic Foundation Model [24.9] 我々は,原子系の高精度かつ効率的なシミュレーションを実現するための,局所的フレームベース同変モデルであるAlphaNetを提案する。
欠陥グラフェン, フォルメート分解, ゼオライト, 表面反応など, さまざまなデータセットでAlphaNetの有効性を検証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:28:47 GMT)
Skip Mamba Diffusion for Monocular 3D Semantic Scene Completion [24.4] 3Dセマンティックシーンの補完は、自律システムにおける複数の下流タスクに不可欠である。
状態空間の進歩と拡散生成モデルを利用した独自のニューラルモデルを提案する。
本手法は単眼画像入力による3次元セマンティックシーン補完性能を実現する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:18:58 GMT)
HeadGAP: Few-Shot 3D Head Avatar via Generalizable Gaussian Priors [24.2] 本稿では,高忠実かつアニマタブルなロバスト性を持つ数発のインザミルドデータから,新たな3Dヘッドアバター生成手法を提案する。
本稿では,事前学習とアバター生成フェーズからなるフレームワークを提案する。
我々のモデルは、効果的にヘッドプレッシャを活用し、それらを数ショットのパーソナライズに一般化することに成功している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:42:11 GMT)
Pedestrian Trajectory Prediction Based on Social Interactions Learning With Random Weights [24.0] 歩行者の社会的相互作用をモデル化する既存の方法は、事前に定義されたルールに依存しており、非明示的な社会的相互作用を捉えるのに苦労している。
本稿では,GAN(Generative Adversarial Networks)をグラフシーケンスデータに適用するDTGANという新しいフレームワークを提案する。
提案するDTGANは優れた性能を示し,歩行者の意図を十分に理解することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:45:01 GMT)
Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [23.5] 我々は、科学的思考のための新しい混合開始ツールであるSideatorに貢献する。
ユーザが提供する論文セットから、Sideatorはこれらおよび関連する論文からキーファセット(目的、メカニズム、評価)を抽出する。
またSideatorは、ユーザーが文学を検索することで、アイデアの斬新さを判断するのに役立つ。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:45:30 GMT)
The Devil is in the Spurious Correlation: Boosting Moment Retrieval via Temporal Dynamic Learning [23.4] 本稿では,モーメント検索のための時間動的学習手法を提案する。
提案手法は,モーメント検索,QVHighlights,Charades-STAの2つの一般的なベンチマークに対して,新しい最先端性能を確立する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:13:06 GMT)
Constructing Set-Compositional and Negated Representations for First-Stage Ranking [23.1] 本稿では,クエリの否定的な部分のみをペナライズするDistangled Negationと,交点を扱うLSRの能力を向上するCombined Pseudo-Termアプローチを紹介する。
私たちのゼロショットアプローチは競争力があり、しばしば合成データに基づいて調整されたレトリバーよりも優れています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:32:38 GMT)
SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis [22.1] シンクロナイズドモーション拡散戦略を用いた多体インタラクション合成法SyncDiffを紹介する。
動きの忠実度を高めるため,周波数領域の動作分解手法を提案する。
また、異なる身体運動の同期を強調するための新しいアライメントスコアも導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:46:06 GMT)
Protego: Detecting Adversarial Examples for Vision Transformers via Intrinsic Capabilities [22.0] トランスフォーマーモデルは自然言語処理に優れており、ビジョンコミュニティはコンピュータビジョン問題におけるその実装を探求している。
本稿では、VTモデルの脆弱性を明らかにするために、3つの事前訓練されたViTモデルに対する6つの共通敵攻撃の攻撃能力について検討する。
本稿では,VTモデルが敵攻撃を防ぐために,変圧器固有の機能を利用した検出フレームワークProtegoを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:54:19 GMT)
GIM: A Million-scale Benchmark for Generative Image Manipulation Detection and Localization [21.8] 我々はSAM, LLM, 生成モデルの強力な機能を統合するローカルな操作データ生成パイプラインを構築している。
1)大規模では、AIが操作する画像と実画像が100万組以上含まれている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:34:40 GMT)
Valley2: Exploring Multimodal Models with Scalable Vision-Language Design [21.8] Valley2は、すべてのドメインのパフォーマンスを向上させるために設計された、新しいマルチモーダルな大規模言語モデルである。
Valley2は、Eコマースベンチマークにおける最先端(SOTA)のパフォーマンスを達成し、同様のサイズのオープンソースモデルを大きなマージンで上回る。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:34:19 GMT)
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation [21.3] 本稿では,MLLM-MSRモデルを提案する。
動的ユーザの嗜好を捉えるために,2段階のユーザ選好要約法を設計する。
次に、ユーザ嗜好の動的変化を捉えるために、繰り返しユーザー嗜好要約生成パラダイムを用いる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:48:09 GMT)
Dataset Distillation via Committee Voting [21.0] 我々は$bf C$ommittee $bf V$oting for $bf D$ataset $bf D$istillation (CV-DD)を紹介する。
CV-DDは、複数のモデルや専門家の集合知を利用して高品質な蒸留データセットを作成する新しいアプローチである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:59:48 GMT)
Path Loss Prediction Using Deep Learning [20.6] 通信リンクに沿った障害はしばしば暗黙的に、あるいは代表的クラッタの高さや全障害深さなどの派生メトリクスを通して考慮される。
畳み込みニューラルネットワークを用いて高分解能障害物高さマップから特徴抽出を自動的に行う経路固有経路損失予測法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:03:46 GMT)
Investigating Map-Based Path Loss Models: A Study of Feature Representations in Convolutional Neural Networks [20.6] 畳み込みニューラルネットワークにおけるスカラー特徴の表現法について検討する。
画像チャネルとしてのスカラー特徴の表現が最強の一般化をもたらすことが判明した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:15:01 GMT)
LLM4Vuln: A Unified Evaluation Framework for Decoupling and Enhancing LLMs' Vulnerability Reasoning [20.5] 脆弱性推論機能を分離し評価する統合評価フレームワークを導入する。
私たちは、Solidity、Java、C/C++で147の地道的脆弱性と147の非脆弱性ケースを使用して実験を行い、合計3,528のシナリオでそれらをテストしました。
本研究は,知識強化,文脈補充,即時的スキームの様々な影響を明らかにするものである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:10:24 GMT)
QSteed: Quantum Software of Compilation for Supporting Real Quantum Device [20.4] 本稿では、実際の量子コンピューティングデバイスや量子コンピューティングクラスタにデプロイ可能な量子コンパイルシステムであるQSteedを紹介する。
量子タスクを効果的にコンパイルし、複数の量子バックエンドを管理するという課題を満たすように設計されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:59:27 GMT)
Subject Representation Learning from EEG using Graph Convolutional Variational Autoencoders [20.4] GC-VASEはグラフ畳み込みに基づく変分オートエンコーダであり、脳波データからの主観的表現学習にコントラスト学習を利用する。
本手法は,主観的識別に適した分割ラテント空間アーキテクチャを用いて,頑健な主観的潜在表現をうまく学習する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:29:31 GMT)
EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [20.2] 微分可能なニューラルアーキテクチャサーチ(DARTS)は、高い探索効率でアーキテクチャ設計のマニュアルプロセスを自動化する。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
EM-DARTSは、最先端の認識性能につながる最適なアーキテクチャを実現できることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:26:17 GMT)
Stronger Than You Think: Benchmarking Weak Supervision on Realistic Tasks [19.5] 弱監督 (WS) はラベル効率の学習において一般的な手法であり、様々なノイズがあるが安価なラベルを用いて自動的にトレーニングデータに注釈を付ける。
広く使われているにもかかわらず、WSとその実践的価値は、そのセットアップに多くのノブがあるため、ベンチマークするのは難しいです。
我々は、WSの実際の利用をより正確に反映するように設計された新しいベンチマークであるBOXWRENCHを紹介します。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:29:31 GMT)
Don't Command, Cultivate: An Exploratory Study of System-2 Alignment [19.5] o1システムカードは、o1モデルをOpenAIの中でもっとも堅牢なものとして識別する。
モデル安全性に及ぼすシステム2思考パターンの影響について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:22:38 GMT)
VAGeo: View-specific Attention for Cross-View Object Geo-Localization [19.5] クロスビューオブジェクトジオローカライゼーション(CVOGL)は、衛星画像内の捕獲された地上画像やドローン画像への関心の対象を見つけることを目的としている。
本稿では,正確なCVOGLのためのビュー固有アテンションジオローカライズ手法(VAGeo)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:42:18 GMT)
Dynamic Prototype Rehearsal for Continual Learning in ECG Arrhythmia Detection [19.4] 我々は,心電図不整脈検出のための新しい連続学習法であるDREAM-CLを提案する。
DREAM-CLは、トレーニングセッション毎に学習行動に基づいてデータをクラスタリングすることで、代表プロトタイプを選択する。
我々は,2つの広く使用されているECG不整脈データセットを用いて,時間増加,クラス増加,リード増加のシナリオについて検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:37:10 GMT)
Beyond Security-by-design: Securing a compromised system [19.1] デジタルインフラストラクチャは、前例のない規模で収束と接続が見られます。
これは、現在の重要な国家インフラと、本質的に非常にサイバー物理的である新しい未来のシステムの両方に当てはまる。
これは、セキュリティ・バイ・デザインのパラダイムを超えて、セキュア・ア・コンプロミケート・システムという課題を受け入れる必要がある、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:01:41 GMT)
Inferring State Machine from the Protocol Implementation via Large Language Model [18.9] ステートマシンは、より多くの脆弱性を公開するためのプロトコル分析の有効性を高める上で、重要な役割を果たす。
動的解析に基づく従来の手法は、カバー範囲が限られているため、しばしば重要な状態遷移を見落としている。
本稿では,Large Language Models (LLM) を利用したProtocolGPTという,革新的な状態マシン推論手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:50:53 GMT)
Learning Spectral Methods by Transformers [18.9] 多層トランスフォーマーは、十分な数の事前学習インスタンスを与えられた場合、アルゴリズム自体を学習可能であることを示す。
この学習パラダイムは、コンテキスト内学習設定とは異なるものであり、人間の脳の学習手順と似ている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:53:34 GMT)
MovieCharacter: A Tuning-Free Framework for Controllable Character Video Synthesis [18.3] MovieCharacterは、文字ビデオ合成のためのチューニング不要のフレームワークである。
我々のフレームワークは、合成タスクを別々に管理可能なモジュールに分解します。
既存のオープンソースモデルを活用し、確立されたテクニックを統合することで、MovieCharacterは印象的な合成結果を達成する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:06:17 GMT)
PoAct: Policy and Action Dual-Control Agent for Generalized Applications [18.3] 本稿では、汎用アプリケーションのためのポリシーとアクションデュアル・コントロル・エージェント(PoAct)を提案する。
PoActは、推論ポリシーを動的に切り替え、アクション空間を変更することで、高品質なコードアクションとより正確な推論パスを達成することを目指している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:28:40 GMT)
Stochastic thermodynamics and the Ericsson nano engine -- Efficiency from equilibrium results [18.3] 準定常状態におけるサイクルの効率を数値計算する。
システムバス結合強度を増大させることで,サイクルの効率を最大に調整できることが判明した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:05:38 GMT)
Light Transport-aware Diffusion Posterior Sampling for Single-View Reconstruction of 3D Volumes [18.1] 本稿では,雲など複数の光散乱効果が一様であるフィールドの単一ビュー再構成手法を提案する。
我々は、新しいベンチマークデータセットに基づいて訓練された無条件拡散モデルを用いて、体積場の未知分布をモデル化する。
物理的に基づく微分可能な体積は、潜在空間における光輸送に関して体積勾配を与えるために用いられる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:30:39 GMT)
GPT as a Monte Carlo Language Tree: A Probabilistic Perspective [18.0] 大規模言語モデル(LLM)は、大規模ウェブクローリングデータセット内の潜伏分布を学習すると考えられている。
本稿では,モンテカルロ言語木を用いて任意の言語データセットを表現できる,という新しい視点を提案する。
実験の結果、同じデータセット上でトレーニングされた異なるGPTモデルが、GPT-Tree可視化において大きな構造的類似性を示すことがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:04:57 GMT)
RMAvatar: Photorealistic Human Avatar Reconstruction from Monocular Video Based on Rectified Mesh-embedded Gaussians [18.0] モノクロビデオからアバターを学習するために、メッシュ上にガウススプラッティングを組み込んだ新しい人間のアバター表現であるRMAvatarを紹介した。
明示的なメッシュ幾何を用いて仮想人間の動きと形状を表現し、ガウススプラッティングによる暗黙の外観レンダリングを行う。
RMAvatarは、レンダリング品質と定量的評価の両方について最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:32:44 GMT)
Multi-Head Explainer: A General Framework to Improve Explainability in CNNs and Transformers [17.9] MHEX(Multi-Head Explainer)は、CNNとTransformerベースのモデルの説明可能性と精度を高める汎用的でモジュール化されたフレームワークである。
MHEXは3つのコアコンポーネントで構成されている。タスク関連機能を動的に強調するアテンションゲート、ターゲットクラスに関連するきめ細かい詳細をキャプチャするために初期レイヤをガイドするDeep Supervision、洗練されたローカル表現とグローバル表現を統一して包括的なサリエンシマップを生成する等価マトリックスである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:42:14 GMT)
Event-based Video Person Re-identification via Cross-Modality and Temporal Collaboration [17.7] 本稿では,イベントベースのビデオ人物ReIDのためのCross-Modality and Temporal Collaboration(CMTC)ネットワークを提案する。
動作情報と外観情報を活用するための時間的協調モジュールを提案する。
実験の結果,この手法はイベントベースの映像人物ReIDのタスクにおいて,他者よりも優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:03:28 GMT)
The Quest for Visual Understanding: A Journey Through the Evolution of Visual Question Answering [17.4] VQA(Visual Question Answering)は、コンピュータビジョン(CV)と自然言語処理(NLP)のギャップを埋める分野である。
2015年の創業以来、VQAは急速に進化し、ディープラーニング、アテンションメカニズム、トランスフォーマーベースのモデルが進歩してきた。
この調査は、VQAの初期から、注意機構、構成的推論、視覚言語による事前学習手法の台頭など、大きなブレークスルーを経ている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:43:33 GMT)
Efficient Quantum Circuit Compilation for Near-Term Quantum Advantage [17.4] 本稿では,ターゲット量子回路をレンガ壁配置に近似的にコンパイルする手法を提案する。
この新しい回路設計は、実際の量子コンピュータで直接実装できる2量子CNOTゲートで構成されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:04:39 GMT)
Can Vision-Language Models Evaluate Handwritten Math? [17.4] FERMATは、手書きコンテンツのエラーを検出し、ローカライズし、修正するVision-Language Modelsの能力を評価するために設計されたベンチマークである。
我々は、エラー検出、ローカライゼーション、修正の3つのタスクにまたがる9つのVLMをベンチマークする。
Gemini-1.5-Proは誤り訂正率が最も高い。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:52:55 GMT)
Duplex: Dual Prototype Learning for Compositional Zero-Shot Learning [17.0] 合成ゼロショット学習(CZSL)は、学習中に欠落した視覚状態や物体の新たな構成をモデルが認識できるようにすることを目的としている。
そこで我々はDuplexを提案する。Duplexは、セマンティックとビジュアルのプロトタイプを、慎重に設計されたデュアルブランチアーキテクチャを通して統合する新しいデュアルプロトタイプ学習手法である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:04:32 GMT)
Concentration of Measure for Distributions Generated via Diffusion Models [16.9] 拡散モデルからサンプリングされたデータは、任意のランダムベクトルの1ドルでのプロジェクションが、その平均値から高い確率でそれほど遠くないという測定特性の濃度を満たすことを示す。
次に,多クラス分類タスクに対する拡散生成データに基づいて,勾配降下(SGD)を用いた一般化線形モデルを訓練する。
言い換えれば、テストエラーは線形設定における拡散生成データの1階と2階の統計にのみ依存する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:13:01 GMT)
Directional Smoothness and Gradient Methods: Convergence and Adaptivity [16.8] 我々は、最適化の経路に沿った目的の条件付けに依存する勾配降下に対する新しい準最適境界を開発する。
我々の証明の鍵となるのは方向の滑らかさであり、これは、目的の上のバウンドを開発するために使用する勾配変動の尺度である。
我々は,方向の滑らかさの知識を使わずとも,ポリアクのステップサイズと正規化GDが高速で経路依存の速度を得ることを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:48:32 GMT)
Finite Sample Identification of Partially Observed Bilinear Dynamical Systems [16.7] 部分的に観察された双線形力学系の実現を学習する問題を考察する。
入力出力サンプルの1つの軌道が与えられた場合、システムのマルコフ様パラメータを学習するための有限時間解析を提供する。
我々の分析は、学習精度とサンプルの複雑さに影響を与えるシステム理論量に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:24:14 GMT)
ArkAnalyzer: The Static Analysis Framework for OpenHarmony [16.7] ArkTSはOpenHarmonyモバイルオペレーティングシステム用のアプリケーション開発専用の新しいプログラミング言語である。
ArkAnalyzerはArkAnalyzerという名前のフレームワークで、オープンソースプロジェクトとして公開されている。
我々のArkAnalyzerは上記の問題に対処し、すでに多くの基本的な静的解析機能を統合している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:50:42 GMT)
Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad [16.2] 本稿では,複雑な機械学習タスクに一貫した適応アルゴリズムKATEを提案する。
我々はKATEと他の最先端適応アルゴリズムAdam AdaGradを比較し、異なる問題を持つ数値実験を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:05:07 GMT)
Enhancing Retrieval-Augmented Generation: A Study of Best Practices [16.2] 我々は,クエリ拡張,新しい検索戦略,新しいコントラシティブ・インコンテクスト学習RAGを取り入れた高度なRAGシステム設計を開発する。
本研究は,言語モデルのサイズ,プロンプトデザイン,文書チャンクサイズ,知識ベースサイズ,検索ストライド,クエリ拡張手法,文レベルでのコンテキスト検索など,重要な要素を体系的に検討する。
本研究は,RAGシステムの開発に有効な知見を提供し,文脈的豊かさと検索・生成効率のバランスを図った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:07:55 GMT)
MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning [16.2] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:28:49 GMT)
Explainable Metrics for the Assessment of Neurodegenerative Diseases through Handwriting Analysis [16.1] 運動機能障害はパーキンソン病(PD)やアルツハイマー病(AD)などの神経変性疾患(ND)の共通徴候である
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:03:56 GMT)
Now Let's Make It Physical: Enabling Physically Trusted Certificate Issuance for Keyless Security in CAs [15.9] 本稿では,CAに対するPKI(Physically Unclonable Function, PUF)の信頼結合を用いた新しいセキュリティ拡張であるArmored Coreを提案する。
Armored Coreでは、デジタルキーを使わずに物理的に信頼された「署名」を生成するために、CAのためのPUFベースのX.509v3証明書関数セットを設計する。
私たちはArmored Coreを,Let's Encrypt PebbleやCertbotなど,現実世界のPKIシステムに統合しています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:57:00 GMT)
Situational Scene Graph for Structured Human-centric Situation Understanding [15.9] 本研究では,人的対象関係とそれに対応する意味特性の両方をエンコードするために,SSGというグラフベースの表現を提案する。
セマンティックディテールは、当初単一のアクションを表現するように設計された状況フレームにインスパイアされた、事前に定義された役割と値として表現される。
間もなくコードとデータセットをリリースします。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:07:25 GMT)
Geometric Scattering on Measure Spaces [15.8] 測度空間上での幾何散乱の一般統一モデルを導入する。
未知多様体をランダムにサンプリングして得られる有限測度空間を考える。
本稿では, 関連するグラフ散乱変換が基礎多様体上の散乱変換を近似するデータ駆動グラフを構築するための2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:38:18 GMT)
Buster: Implanting Semantic Backdoor into Text Encoder to Mitigate NSFW Content Generation [15.7] NSFWコンテンツ生成を防止するために,テキストエンコーダにバックドアを注入するTextitBusterという革新的なフレームワークを提案する。
Busterは明示的なプロンプトではなく深いセマンティック情報を活用し、NSFWプロンプトをターゲットの良性プロンプトにリダイレクトする。
実験の結果,バスターは9つの最先端ベースラインを上回り,少なくとも91.2%のNSFW除去率を達成できた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:22:02 GMT)
An Enhanced Zeroth-Order Stochastic Frank-Wolfe Framework for Constrained Finite-Sum Optimization [15.7] 本稿では,制約付き有限サム最適化問題に対処するため,ゼロ階凸計算を改良したFrank-Wolfeを提案する。
本手法では,ゼロ次オラクルによる近似を効果的に低減する新しい二重分散低減フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:53:19 GMT)
FlowDAS: A Flow-Based Framework for Data Assimilation [15.6] FlowDASは、状態遷移ダイナミクスと生成前の学習を統合するために補間剤を用いた新しい生成モデルベースのフレームワークである。
実験では,ローレンツシステムから高次元流体超解像タスクに至るまで,様々なベンチマークにおいてFlowDASの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:03:41 GMT)
The Paradox of Success in Evolutionary and Bioinspired Optimization: Revisiting Critical Issues, Key Studies, and Methodological Pathways [15.3] 進化的およびバイオインスパイアされた計算は、多様なアプリケーション領域にわたる複雑な最適化問題に効率的に対処するために重要である。
それらは大規模で複雑な探索空間における準最適解の発見に優れており、多くの分野において有意義である。
しかしながら、どちらの領域も、不十分なベンチマーク、問題固有のオーバーフィッティング、不十分な理論的根拠、そして生物学的メタファーによってのみ正当化された過剰な提案など、コアにおける課題に悩まされている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:37:37 GMT)
A Multi-Modal Deep Learning Framework for Pan-Cancer Prognosis [15.1] 本稿では,UMPSNetというディープラーニングモデルを提案する。
UMPSNetはテキストテンプレートに4種類の重要なメタデータ(画像情報、癌型情報、治療プロトコル、診断結果)を統合し、テキストエンコーダを導入してテキストの特徴を抽出する。
multi-modality of patient data and joint training を取り入れることで、UMPSNetは全てのSOTAアプローチより優れている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:29:42 GMT)
Quantum space-time Poincaré inequality for Lindblad dynamics [15.0] 我々は、ハミルトン成分を詳細なバランスの取れたリンドブラディアンに組み込むことで、そのスペクトルギャップを一般化することができることを示した。
非可換な$L2$-ノルムの収束に対する明示的で建設的な指数的減衰推定を導出する。
この分析は、時空ポアンカーの不等式の量子アナログを確立することに依存する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:31:14 GMT)
QuantuneV2: Compiler-Based Local Metric-Driven Mixed Precision Quantization for Practical Embedded AI Applications [14.4] QuantuneV2は、組み込みAIアプリケーションのためのコンパイラベースの混合精度量子化手法である。
我々はQuantuneV2が従来の方法に比べて10.28パーセントの精度向上と12.52パーセントのスピード向上を達成したことを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:41:54 GMT)
Unveiling Code Clone Patterns in Open Source VR Software: An Empirical Study [14.1] 345のオープンソースVRプロジェクトにおいて,ソフトウェアクローンの大規模定量分析を行った。
われわれの研究は、VRソフトウェアにおけるクローン現象に関する多くの洞察を導き、慎重に定式化された7つの研究質問に導かれる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:51:23 GMT)
TempoGPT: Enhancing Temporal Reasoning via Quantizing Embedding [14.0] 本稿では,マルチモーダル時系列データ構築手法とマルチモーダル時系列言語モデル(TLM, TempoGPT)を提案する。
ホワイトボックスシステム内の変数-システム関係を解析することにより,複雑な推論タスクのためのマルチモーダルデータを構築する。
広範な実験により、TempoGPTは時間的情報を正確に知覚し、結論を論理的に推論し、構築された複雑な時系列推論タスクにおける最先端の処理を達成することが示されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:47:05 GMT)
Entailed Between the Lines: Incorporating Implication into NLI [13.8] 我々は、多くの言語タスクのコアツールである自然言語推論(NLI)に焦点を当てている。
最先端のNLIモデルとデータセットは、テキストから明示的ではなく、包含が示唆される範囲のケースを認識するのに苦労していることに気付きました。
インプリードNLIデータセット(INLI)を導入し、現在のLLMが幅広いインプリッドエンタテインメントを認識し、暗黙的エンタテインメントと明示的エンタテインメントを区別できるようにする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:09:44 GMT)
A Closer Look at AUROC and AUPRC under Class Imbalance [13.8] 機械学習(ML)において、精度-リコール曲線(AUPRC)の下の領域は、クラス不均衡なタスクに対する受信操作特性(AUROC)の下の領域とモデルの比較において優れた指標である、という主張が広く主張されている。
本稿では,AUROC と AUPRC のモデル誤りの有無を理論的に評価し,AUPRC がクラス不均衡の場合に一般的に優れているものではないことを明確にする。
第2に、半合成および実世界のフェアネスデータセットの実験を用いて、我々の理論を実証的に支持する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:21:35 GMT)
CureGraph: Contrastive Multi-Modal Graph Representation Learning for Urban Living Circle Health Profiling and Prediction [13.7] 都市保健予測のためのマルチモーダル表現学習フレームワークであるCureGraphを提案する。
CureGraphは、各地区の都市生活圏における高齢者の一般的な慢性疾患の頻度を推定する。
クロスモーダルな空間依存を捉え、高齢者の健康に配慮した都市環境を包括的に理解する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:30:38 GMT)
Robot Synesthesia: A Sound and Emotion Guided AI Painter [13.2] 本稿では,ロボット合成と呼ばれるロボット塗装プロセスの指導に音声と音声を用いたアプローチを提案する。
一般音に対しては,模擬絵画を符号化し,同じ潜在空間に入力音を符号化する。音声では,音声をその書き起こしテキストと音声のトーンに分離する。テキストを用いて内容を制御する一方で,そのトーンからの感情を推定し,絵のムードを導出する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:18:24 GMT)
PROTECT: Protein circadian time prediction using unsupervised learning [13.1] 本研究では,時間ラベルやタンパク質や遺伝子の事前知識を必要とせず,プロテオームデータから概日サンプル相を予測する新しい手法を開発した。
時間ラベル付きおよび未ラベルのプロテオミクスデータを用いて本手法を検証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:21:20 GMT)
Research on the Online Update Method for Retrieval-Augmented Generation (RAG) Model with Incremental Learning [13.1] 提案手法は,知識保持と推論精度の観点から,既存の主流比較モデルよりも優れている。
実験の結果,提案手法は知識保持と推論精度の観点から,既存の主流比較モデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:16:14 GMT)
Neural Probabilistic Circuits: Enabling Compositional and Interpretable Predictions through Logical Reasoning [13.0] 我々はニューラル確率回路(NPC)と呼ばれる本質的に透明なモデルアーキテクチャを提案する。
NPCは論理的推論を通じて構成的および解釈可能な予測を可能にする。
我々は,NPCが解釈可能性と性能のバランスを保ち,エンドツーエンドのブラックボックスモデルと競合する結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:47:49 GMT)
SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing [12.9] 本稿では,SST-EM(Semantic, Spatial, and Temporal Evaluation Metric)について紹介する。
SST-EMは,(1)VLMを用いたフレームからのセマンティック抽出,(2)物体検出による主物体追跡,(3)LLMエージェントによる焦点対象の精細化,(4)ビジョン変換器を用いた時間的整合性評価の4つの構成要素から構成される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:37:08 GMT)
Multiple-gain Estimation for Running Time of Evolutionary Combinatorial Optimization [12.8] 本稿では,反復中の集団の適応傾向を推定するマルチゲインモデルを提案する。
提案モデルは平均ゲインモデルの改良版であり,数値最適化のための進化的アルゴリズムの実行時間を推定するアプローチである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:24:36 GMT)
Differential privacy and Sublinear time are incompatible sometimes [12.8] 片方向境界に基づく単純な問題は、差分プライベートアルゴリズムとサブ線形時間アルゴリズムの両方をもたらすことを示す。
我々は、微分プライベートである厳密な'サブ線形時間アルゴリズムを認めない。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:24:09 GMT)
Erasing Noise in Signal Detection with Diffusion Model: From Theory to Application [12.8] 雑音拡散モデル(DM)に基づく信号検出手法を提案する。
これは最大確率(ML)推定法より優れている。
BPSK と QAM の変調方式では、DM ベースの手法はシンボル誤り率を著しく低くする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:02:15 GMT)
A Spatio-Temporal Neural Network Forecasting Approach for Emulation of Firefront Models [12.7] モデルエミュレーションのための専用時間ニューラルネットワークベースのフレームワークを提案する。
提案手法は、ニューラルネットワークに基づくアプローチにおいてしばしば困難となる、空間的および時間的細部での予測を近似することができる。
実証実験では、シミュレーションとエミュレートされたファイアフロント間の良好な一致が示され、平均的なジャカードスコアは0.76である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:26:07 GMT)
Unveiling the Potential of Text in High-Dimensional Time Series Forecasting [12.7] 本稿では,時系列モデルと大規模言語モデルを統合する新しいフレームワークを提案する。
マルチモーダルモデルにインスパイアされた本手法では, 時系列データとテキストデータを重塔構造で結合する。
テキストを組み込んだ実験により,高次元時系列予測性能が向上することが示された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:10:45 GMT)
Rethinking Knowledge in Distillation: An In-context Sample Retrieval Perspective [12.6] 本稿では,蒸留の知識を再定義し,各試料と対応するインコンテキストサンプルとの関係を把握する。
KDは学習ラベルのスムーズな正規化(LSR)の一種であるので,まず,教師のインコンテキストサンプルからの知識が,学習者のトレーニングとそれに対応するサンプルの定期化に不可欠であることを示す理論的分析を行う。
そこで本研究では,様々なKDパラダイムにおいて,その優位性を示す新しいコンテキスト内知識蒸留(IC-KD)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:43:21 GMT)
Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport [12.6] エントロピー規則化ワッサースタイン2コストとその非バイアスバージョンであるシンクホーン発散を用いた確率測定の合成と解析について検討する。
合成問題は、これらのコストに関して、$m$次元の単純集合に属する係数のセットを与えられた$m$参照測度をバリセンタの計算によって構成する。
解析問題は、ワッサーシュタイン-2距離における最も近いバリセンタの係数を、与えられた測度$mu$まで求めることである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:16:53 GMT)
IP-FaceDiff: Identity-Preserving Facial Video Editing with Diffusion [12.5] 既存のモデルでは、編集品質の低下、高い計算コスト、多種多様な編集における顔認証の保存の困難といった課題に直面している。
本稿では,事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルのリッチな潜時空間を活用する新しい顔画像編集フレームワークを提案する。
本手法は,ビデオシーケンス全体の時間的一貫性を維持しながら編集時間を80%削減する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:08:27 GMT)
SafePowerGraph-LLM: Novel Power Grid Graph Embedding and Optimization with Large Language Models [12.3] このレターではSafePowerGraph-LLMを紹介します。これは大規模言語モデル(LLM)を使用して最適潮流問題を解決するために明示的に設計された最初のフレームワークです。
OPF問題に特化して,LLMのためのテキスト内学習と微調整プロトコルを新たに導入した。
本研究では,LLMアーキテクチャ,サイズ,微調整の影響を明らかにし,現実的なグリッドコンポーネントや制約を扱うフレームワークの能力を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:01:58 GMT)
Leveraging ASIC AI Chips for Homomorphic Encryption [12.2] ホモモルフィック暗号化(HE)は強力なプライバシー保証を提供するが、平文での計算よりもはるかに多くのリソースを必要とする。
このレイテンシ問題を緩和するためにアクセラレータが登場したが、ASICのコストが高い。
HEプリミティブは、すでにクラウドに広くデプロイされているTPUのような既存のASIC AIアクセラレータ上で、AIオペレータに変換され、アクセラレーションされることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:08:14 GMT)
A User's Guide to $\texttt{KSig}$: GPU-Accelerated Computation of the Signature Kernel [12.1] シグネチャカーネルは、シーケンシャルおよびテンポラルデータのための正定カーネルである。
この章では、署名カーネルを演算するためのGPUアクセラレーションアルゴリズムを実装した、$textttKSig$、$textttScikit-Learn$互換Pythonパッケージについて短い紹介を行う。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:11:13 GMT)
Kite: How to Delegate Voting Power Privately [12.0] 我々は、メンバの投票権の委譲を$textitprivate$で行えるプロトコルであるKiteを紹介した。
有権者は、誰に委任されたかを知ることなく、自由に委任し、証明し、権限を再委譲することができる。
公に記録されている唯一の情報は、投票者がその投票を誰かに委任または再委任したことである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:57:45 GMT)
Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos [11.9] そこで本研究では,病理組織特異的な命令問合せ/問合せの大規模データセットであるQuilt-Instructを紹介した。
Quilt-Instructを使ってQult-LLaVAをトレーニングします。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:08:28 GMT)
MedicalNarratives: Connecting Medical Vision and Language with Localized Narratives [11.2] MedicalNarrativesは、Think-Aloudの研究で収集されたデータと、本質的に類似した医療教育ビデオから収集されたデータセットである。
我々のデータセットは、ビデオと記事から4.7Mの画像テキストペアを含み、100万のサンプルには、トレースとバウンディングボックスの形で密集したアノテーションが含まれている。
MedicalNarrativesの有用性を評価するために、12の医療ドメインにまたがるデータセットを用いて、CLIPアーキテクチャに基づいてGenMedClipをトレーニングする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:33:36 GMT)
SFC-GAN: A Generative Adversarial Network for Brain Functional and Structural Connectome Translation [11.1] 構造Functional Connectivity GAN(SFC-GAN)は、脳コネクトーム間の双方向翻訳のための新しいフレームワークである。
これらのコネクトームのトポロジ的整合性を維持するため、我々は、グローバルなコネクトームパターンとローカルなコネクトームパターンの両方を捉える際に、モデルを導く構造保存損失を用いる。
本フレームワークは,SCとFC間の翻訳において優れた性能を示し,類似性およびグラフ特性評価においてベースラインモデルより優れた性能を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:30:41 GMT)
Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method [11.0] そこで我々は,新たな暴力検出フレームワークを提案する。
一助多目的学習(unimodal multiple-instance learning)は、一助多目的学習(unimodal semantic features)、多モーダルアライメント(multimodal alignment)、多モーダル融合(multimodal fusion)、最終検出(final detection)からなる。
ベンチマークデータセットによる実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:14:25 GMT)
Bandit Pareto Set Identification: the Fixed Budget Setting [11.0] マルチアームバンディットモデルにおける純粋探索問題について検討する。
目的は、平均値が他の分布よりも均一に悪くない分布を特定することである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:38:40 GMT)
Kriging and Gaussian Process Interpolation for Georeferenced Data Augmentation [10.9] 本研究は,ラ・ルエニオンのサトウキビ群集におけるコメルナ・ベンガルシス L. の存在を予測することを目的として,ジオレファレンスデータの拡張手法について検討した。
収集データの空間特性と高コスト化を考慮し,異なるカーネルを持つガウス過程 (GP) と,様々なヴァリグラムを持つクリッピングの2つのアプローチを評価した。
その結果,GPベースの手法,特にGP-COMBを用いた場合,付加的なデータを必要とすることなく回帰アルゴリズムの性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:29:09 GMT)
A4O: All Trigger for One sample [10.8] 提案されたバックドアディフェンダーは、トリガーが統一された方法で現れるという仮定に依存することが多い。
本稿では,この単純な仮定が抜け穴を生じさせ,より洗練されたバックドア攻撃を回避できることを示す。
我々は,複数の種類のバックドアトリガーを組み込んだ新たなバックドア攻撃機構を設計し,ステルスネスと有効性に着目した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:38:58 GMT)
Near-deterministic quantum search algorithm without phase design [10.8] グローバーのアルゴリズムは、4つのうち1つを探索した場合にのみ、確実にターゲット状態を見つけることができる。
決定論的探索アルゴリズムは8,16,32のうち1つを探索する際にも設計される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:51:22 GMT)
Inhomogeneous graph trend filtering via a l2,0 cardinality penalty [10.6] グラフ信号の断片的スムーズさを推定するために,$ell_2,0$-norm Penalized Graph Trend Filtering (GTF) モデルを提案する。
提案したGTFモデルは,エッジセットが大きいデータセットに対して,既存のモデルよりも効率的に解けることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:03:38 GMT)
Galapagos: Automated N-Version Programming with LLMs [10.6] 大規模言語モデルを用いたプログラム変種の自動生成を提案する。
プログラムの変種を生成するツールであるGal'apagosを設計、開発、評価する。
我々は現実世界のCコードのN-Versionコンポーネントを作成することでGal'apagosを評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:25:37 GMT)
Blind Estimation of Sub-band Acoustic Parameters from Ambisonics Recordings using Spectro-Spatial Covariance Features [10.5] 10個の周波数帯域にわたる残響時間(T60)、直接残響率(DRR)、明瞭度(C50)を盲目的に推定する統合フレームワークを提案する。
提案フレームワークは, 時間, スペクトル, およびFOA信号の空間情報を効率的に表現する, Spectro-Spatial Co Vector (SSCV) と呼ばれる新しい特徴を利用する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:43:45 GMT)
Initialization is Critical to Whether Transformers Fit Composite Functions by Reasoning or Memorizing [10.2] トランスフォーマーは様々なタスクにわたって印象的な能力を示してきたが、構成問題におけるパフォーマンスは議論の的となっている。
パラメータ初期化尺度は、モデルが推論(推論に基づく)解を学習するかどうかを決定する上で重要な役割を果たす。
さらに、推論(推論に基づく)ソリューションは、複雑さのバイアスが低く、単一のアンカーに対する個々のマッピングを学習できる重要な要素である、と仮定する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:35:37 GMT)
Advancing Student Writing Through Automated Syntax Feedback [10.1] 本研究は, 学生の統語能力を高める上で, 構文フィードバックが重要な役割を担っていることを明らかにする。
本稿では,英語構文の理解と応用を高めるために,Essay-Syntax-Instructという特殊なデータセットを導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:10:02 GMT)
Advancing Single-Snapshot DOA Estimation with Siamese Neural Networks for Sparse Linear Arrays [10.1] スパース線形アレイにおける単発ショット信号処理はますます重要になっている。
本稿では,スパース増層を特徴とする新しいサイムズニューラルネットワーク(SNN)を提案する。
本稿では,詳細な特徴分析と性能評価により,提案手法のDOA推定性能の向上を実証する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:59:04 GMT)
Inferring Interpretable Models of Fragmentation Functions using Symbolic Regression [10.1] 本稿では, 実験データから直接, フラグメンテーション関数の関数形式を推定する最初の研究について述べる。
この研究は、QCD関連の現象学研究や、より一般的には科学に追従するアプローチである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:25:14 GMT)
Quilt-1M: One Million Image-Text Pairs for Histopathology [9.9] われわれはYouTubeを使って802,144ドルの画像とテキストのペアからなるビジョン言語データセットをキュレートしている。
我々はQUILTをTwitter、研究論文、インターネットなど他の情報源のデータセットと組み合わせてQUILT-1Mを作成します。
本モデルでは,新しい病理像の分類を行うため,ゼロショットとリニアプローブの両タスクにおいて最先端のモデルより優れる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:16:34 GMT)
TiEBe: A Benchmark for Assessing the Current Knowledge of Large Language Models [9.7] Timely Events Benchmark (TiEBe)は,グローバルおよび地域的に重要なイベントに焦点を当てた,11,000以上の質問応答ペアを含むデータセットである。
我々のベンチマークでは,LLMは,よりバランスの取れたグローバルな知識表現の必要性を強調し,現実的なリコールにおいて相当な地理的格差を示すことを示した。
TiEBeは継続的な学習戦略を評価するツールとして機能し、過去の知識を忘れずに新しい情報を取得するモデルの能力に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:58:32 GMT)
LEO: Boosting Mixture of Vision Encoders for Multimodal Large Language Models [9.7] 本研究は、ハイブリッドMLLMのための視覚トークンの融合戦略を探求し、LEOの設計に繋がる。
Leoは、適応後の融合戦略と適応型タイリングを組み込んだデュアルブランチビジョンエンコーダフレームワークを備えた、新しいMLLMである。
LEOは、モデルアーキテクチャやトレーニングレシピを変更することなく、自律運転の専門領域に適応できることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:29:55 GMT)
Evaluating Agent-based Program Repair at Google [9.6] エージェントベースのプログラム修復は、複雑なバグをエンドツーエンドで自動的に解決する。
最近の研究は、人気のあるオープンソースSWE-Benchにおけるエージェントベースの修復アプローチの使用について検討している。
本稿では,企業コンテキストにおけるバグに対処するためのエージェント的アプローチの適用可能性について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:09:25 GMT)
VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation Extraction [9.5] ドキュメントレベルの関係抽出(DocRE)は、ドキュメント内のエンティティペア間の関係を特定することを目的としている。
既存のほとんどの手法は、一様ラベルの分布を仮定し、現実の非バランスなデータセット上での最適以下の性能をもたらす。
組込み空間からのデータを強化するために生成モデルを用いた新しいデータ拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:43:11 GMT)
Combining LLM decision and RL action selection to improve RL policy for adaptive interventions [9.4] 我々は、RLポリシーをリアルタイムで更新するために、LLM(Large Language Models)の成功にインスパイアされています。
テキストベースのユーザの好みは、ユーザの好みを即時に組み込むために、オンザフライでのアクション選択に影響を与える。
提案手法は,RLポリシーを改善しつつ,テキストベースのユーザ嗜好を考慮し,適応的介入におけるパーソナライズを改善することができることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:03:20 GMT)
Experimental Realization of Criticality-Enhanced Global Quantum Sensing via Non-Equilibrium Dynamics [9.3] 我々は、摂動イジングスピンモデルの非平衡ダイナミクスを活用することにより、臨界減速を緩和する臨界センシングスキームを導入する。
我々の研究は、非平衡臨界力学によって強化された気象学の応用を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:00:24 GMT)
Attention when you need [8.9] タスク関連機能に注意を払っていると、タスクのパフォーマンスが向上するが、注意を払うには、独自のメタボリックコストが伴う。
本研究は,マウスの強化学習に基づく規範モデルを構築し,その利点と注意コストのバランスについて考察する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:08:47 GMT)
Kolmogorov-Arnold Network for Remote Sensing Image Semantic Segmentation [8.9] 本稿では,DeepKANSegという新しいセマンティックセグメンテーションネットワークを提案する。
まず,kanをベースとしたDeep機能改善モジュール,すなわちDeepKANを紹介する。
第2に、グローバルローカル複合デコーダにおける従来の多層パーセプトロン(MLP)層をKANベースの線形層、すなわちGLKANに置き換える。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:06:51 GMT)
KD-MSLRT: Lightweight Sign Language Recognition Model Based on Mediapipe and 3D to 1D Knowledge Distillation [8.9] 本稿では,3次元から1次元へのクロスモーダル多知識蒸留手法と,新しいエンドツーエンドのテキスト修正フレームワークを提案する。
PHOENIX14とPHOENIX14Tデータセットのワード誤り率(WER)は最先端のCorrNetと比較して少なくとも1.4%低下する。
また、中国語手話データセットの収集とリリースも行い、専門的な訓練語彙を開発した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:47:53 GMT)
Information-Theoretic Dual Memory System for Continual Learning [8.8] 我々はITDMS(Information-Theoretic Dual Memory System)と呼ばれる革新的なデュアルメモリシステムを提案する。
このシステムは、一時的および新規なサンプルを保持するように設計された高速メモリバッファと、重要かつ情報的なサンプルを保存するための遅いメモリバッファから構成される。
提案手法は,一連の連続学習実験を通じて厳密に評価され,提案システムの有効性を実証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:01:12 GMT)
Agentic Copyright Watermarking against Adversarial Evidence Forgery with Purification-Agnostic Curriculum Proxy Learning [8.7] 不正使用と不正なAIモデルの配布は、知的財産に深刻な脅威をもたらす。
モデル透かしはこの問題に対処するための重要なテクニックとして登場した。
本稿では,透かしモデルへのいくつかの貢献について述べる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:55:29 GMT)
Improving key rates by tighter information reconciliation leakage estimation for quantum key distribution [8.6] 従来の研究は、量子鍵分布(QKD)におけるセキュア鍵レート(SKR)と最大伝送距離を改善するために、情報漏洩を正確に推定することを目的としていた。
本稿では,量子部が後処理に与える影響を考察し,SKRを改善するために情報和解リークをより正確に推定する手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:54:56 GMT)
Enhancing Online Reinforcement Learning with Meta-Learned Objective from Offline Data [8.6] 強化学習(RL)における大きな課題は、スパース報酬から最適な政策を学ぶことの難しさである。
我々は,オフラインデータから知識を抽出する目的をメタ学習するGILD(Generalized Imitation Learning from Demonstration)を開発した。
課題である4つのMuJoCoタスクにおいて、GILDで拡張された3つのRLアルゴリズムが、最先端の手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:11:12 GMT)
Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images [8.5] 本稿では、視線推定と視線追跡技術の進歩において、視基盤モデルSAM 2の変換可能性について検討する。
私たちはSAM 2を、VRセットアップやウェアラブルアイトラッカーを使用して記録された世界最大の統合データセットを含む、さまざまなデータセットから1400万以上のアイイメージでテストしました。
注目すべきは、瞳孔分割タスクにおいてSAM 2は、目の画像のみに基づいて訓練されたドメイン固有モデルのパフォーマンスと一致し、微調整なしで、最大93%の得点を達成していることである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:19:14 GMT)
Boosting Sclera Segmentation through Semi-supervised Learning with Fewer Labels [8.3] 本稿では,ラベル付きサンプルを限定した新しいスクレラセグメンテーションフレームワークを提案する。
本研究では,領域固有の改良と画像に基づく空間変換を統合し,セグメンテーション性能を向上させる半教師付き学習手法を用いる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:38:49 GMT)
Pre-Trained Large Language Model Based Remaining Useful Life Transfer Prediction of Bearing [8.3] 軸受などの回転機械の余寿命(RUL)を正確に予測することは、機器の信頼性を確保し、予期せぬ工業的失敗を最小限に抑えるために不可欠である。
従来のデータ駆動型ディープラーニング手法は、データ分散の一貫性のないトレーニングとテスト、長期予測の限定的な一般化などにより、実践的な環境での課題に直面している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:38:12 GMT)
C2PD: Continuity-Constrained Pixelwise Deformation for Guided Depth Super-Resolution [8.2] 本研究では,空間特性の空間的利用を最大化し,実世界の物質を抽象的に認識する手法を提案する。
我々はガイド深度超解像問題を,連続物体のような力で変形できる理想的な塑性を有する粗流の変形に変換する。
特に本手法は,GDSRの4つの広く採用されているベンチマークにおいて,大規模タスクと一般化可能性に大きな利点があることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:04:37 GMT)
MSV-Mamba: A Multiscale Vision Mamba Network for Echocardiography Segmentation [8.1] 新興モデルであるMambaは、多様なビジョンや言語タスクに広く適用されている、最先端のアプローチの1つだ。
本稿では,大画面マルチスケールマンバモジュールと階層的特徴融合を併用したU字型深層学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:22:10 GMT)
Benchmarking Abstractive Summarisation: A Dataset of Human-authored Summaries of Norwegian News Articles [8.1] ノルウェーのニュース記事の高品質な人間によるサマリーのデータセットを紹介する。
このデータセットは、生成言語モデルの抽象的な要約能力のベンチマークを目的としている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:08:29 GMT)
Confident Pseudo-labeled Diffusion Augmentation for Canine Cardiomegaly Detection [7.9] 肥大した心臓を特徴とする犬の心肥大は、検出されていない場合、深刻な健康リスクを引き起こす。
現在の検出モデルは、しばしば小さく、注釈の付かないデータセットに依存している。
犬の心内膜を同定するための信頼的擬似ラベル付き拡散拡張モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:10:19 GMT)
CoNOAir: A Neural Operator for Forecasting Carbon Monoxide Evolution in Cities [7.8] 一酸化炭素 (CO) は、産業、自動車、および国内要求のために化石燃料からエネルギーを生成するため、都市部において主要な汚染物質である。
COの進化をリアルタイムで予測することで、効果的な早期警戒システムや介入戦略の展開が可能になる。
我々は,CO濃度を効果的に予測できる,ニューラル演算子,すなわちコンプレックス・ニューラル・オペレーター・フォー・エア・クオリティ(CoNOAir)に基づく機械学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:02:23 GMT)
E2ESlack: An End-to-End Graph-Based Framework for Pre-Routing Slack Prediction [7.8] E2ESlackは,スラック予測のためのエンドツーエンドグラフベースのフレームワークである。
私たちの知る限りでは、これは経路レベルのスラックスを事前に予測できる最初の作品です。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:53:23 GMT)
The Streetscape Application Services Stack (SASS): Towards a Distributed Sensing Architecture for Urban Applications [7.7] ストリートスケープアプリケーションは、多様なセンサーとリアルタイムな意思決定を統合するアプリケーションを通じて、安全、移動性、生活の質を改善することを目的としている。
Street Application Services Stack (SASS)は、これらの課題に、マルチモーダルデータ同期、時間的データ融合、分散エッジコンピューティングの3つのコアサービスで対処する。
私たちは、リアルタイムでスケーラブルな都市アプリケーションをサポートするために、SASSがいかに抽象化とパフォーマンスを提供するかを示します。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:43:47 GMT)
Dynami-CAL GraphNet: A Physics-Informed Graph Neural Network Conserving Linear and Angular Momentum for Dynamical Systems [7.6] Dynami-CAL GraphNetは、複雑な多体力学系の正確、解釈可能、リアルタイムモデリングを提供する。
基本的な保存法則に従う物理的に一貫性があり、スケーラブルな予測を提供する。
これは、異種相互作用と外部力の効率よく処理しながら、力とモーメントの推測を可能にする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:41:56 GMT)
ConSim: Measuring Concept-Based Explanations' Effectiveness with Automated Simulatability [7.4] 概念に基づく説明は、複雑なモデル計算を人間の理解可能な概念にマッピングすることで機能する。
既存の評価指標は、しばしば考えられる概念の誘導された空間の品質にのみ焦点をあてる。
自動シミュラビリティによる概念記述の計測のための評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:39:54 GMT)
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion [7.3] 本稿では,既存の動的ニューラルネットワークの研究をコンピュータビジョンの文脈で合成し,統合する調査を行う。
動的ニューラルネットワークは, 適応性, ノイズ低減, 情報優先化において, センサフュージョンの文脈で特に有用である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:24:49 GMT)
SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting [7.2] 本稿では,高忠実度3DGSに高密度SLAMを組み込むことにより,リアルタイム・高密度化を実現するフレームワークを提案する。
本手法では,SLAMから高密度点雲を利用することにより,ガウスモデルを動的に更新・密度化するSLAM-Informed Adaptive Densificationを導入する。
ReplicaとTUM-RGBDデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:28:13 GMT)
D3RM: A Discrete Denoising Diffusion Refinement Model for Piano Transcription [7.1] 離散拡散モデルを用いたピアノの書き起こしのための新しいアーキテクチャを提案する。
提案手法は,F1スコアの点から,従来の拡散型ピアノ書き起こしモデルとベースラインモデルより優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:06:15 GMT)
Mitigating Out-of-Entity Errors in Named Entity Recognition: A Sentence-Level Strategy [7.1] 文レベル情報を完全に活用する新しいフレームワーク,すなわちS+NERを提案する。
5つのベンチマークデータセットに対する実験により、S+NERは最先端のOOE-NERモデルより優れていることが示された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:13:38 GMT)
TIMRL: A Novel Meta-Reinforcement Learning Framework for Non-Stationary and Multi-Task Environments [6.9] 本稿では,ガウス混合モデルと変圧器ネットワークを利用したメタ強化学習手法を提案する。
タスクの分類はトランスフォーマーネットワークを介して符号化され、タスクに対応するガウス成分を決定する。
実験の結果,提案手法は試料の効率を劇的に改善し,タスクの分類を正確に認識することがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:11:33 GMT)
Hardware implementation of timely reliable Bayesian decision-making using memristors [6.8] ベイズ定理は事象を確率として定量化し、確率規則に基づいて決定を下す。
ベイズ定理は効率的なユーザ・シーンの相互作用を可能にするために応用できる。
ベイズ定理を実装するために,メムリスタに基づく確率論的計算手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:32:01 GMT)
Selective band interaction and long-range hopping in a structured environment with giant atoms [6.8] 分散バンドとフラットバンドの両方を特徴とする1次元のラグ格子を提案する。
結合点間の相対位相を変調することにより、巨大原子はどちらのバンドとも選択的に相互作用する。
両方のバンドと同時に相互作用する小さな原子とは異なり、制御可能な位相を持つ単一の巨大原子は分散または平らなバンドとのみ相互作用する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:05:05 GMT)
FaceOracle: Chat with a Face Image Oracle [6.8] 我々は、AIアシスタントであるFaceOracleを紹介した。これは、ユーザーが標準準拠のアルゴリズムを使用して自然な会話で顔画像を分析するのを助ける。
私たちは、発行機関の専門家がFaceOracleを彼らのワークフローに組み込む方法を示す概念実証を実装しています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:53:48 GMT)
Eye Sclera for Fair Face Image Quality Assessment [6.8] スクレラ領域は、顔画像の品質を評価するために、人口変動や肌の色に非依存である。
異なる肌のトーンを表わす個体の顔データセットの分析は、スクレラが顔のダイナミックレンジ、過度、過度な露出を測定する代替手段であることを示している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:33:03 GMT)
FlashRNN: Optimizing Traditional RNNs on Modern Hardware [6.7] 状態追跡機能は、時系列タスクと論理的推論にとって重要である。
LSTMやGRUのような従来のRNNは、厳密にシーケンシャルな処理を犠牲にしてこれらの機能を備えている。
我々は、Tritonのハードウェア最適化FlashRNNとカーネルをレジスタレベルに最適化することで、これらのネットワークがどれだけ高速になるかを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:34:22 GMT)
Simulink Mutation Testing using CodeBERT [6.5] BERTiMuSはSimulinkモデルをテキスト表現に変換し、派生したテキストからトークンをマスクし、CodeBERTを使用してマスクされたトークンを予測する。
BERTiMuSは,CodeBERTのみに依存して,文献に記録されているSimulink変異パターンをブロックベースで生成できることを示す。
BERTiMuS は FIM と相補的であり、(b) 変異テストの要求に見合った概念を考えると、BERTiMuS は FIM より優れている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:37:01 GMT)
Fundamental Limits of Covert Communication over Classical-Quantum Channels [6.4] 固定有限サイズの入力アルファベットを持つ一般メモリレス古典量子チャネルにおける秘密通信について検討する。
平方根法則(SRL)は、$n$入力状態の積が用いられる場合、この設定で秘密通信を管理する。
また、送信前に通信相手が秘密に共有するJ_rm SRLsqrtn+o(sqrtn)$ bitsが必要であることも示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:47:15 GMT)
Relativistic model of spontaneous wave-function localization induced by nonHermitian colored noise [6.4] 本研究では、フェルミオン密度演算子を普遍色雑音に結合したランダムな非エルミタン作用に基づく自然波動関数崩壊のモデルを提案する。
観測可能な宇宙の大きさが大きくなるにつれて減少する雑音による局所化長を解析的に決定する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:17:05 GMT)
Toward a Better Understanding of Probabilistic Delta Debugging [6.4] アドバンストなddminであるProbDDが提案され、最先端のパフォーマンスを実現している。
ProbDDの詳細な理論的解析を行い、確率とサブセットサイズの変化の傾向を明らかにする。
本稿では,ProbDDの簡易版であるCDDを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:57:43 GMT)
Radial Distortion in Face Images: Detection and Impact [6.4] 低品質、操作(意図的または意図的)、歪んだ画像は顔認識システム(FRS)の性能を低下させる。
本稿では,エロメントシナリオにおける放射歪みの検出とフラグ付けが可能な効果的な放射歪み検出モデルを提案する。
顔画像品質評価(FIQA)アルゴリズムとして検出モデルを定式化し、FRS性能に対する放射歪みの影響を慎重に検査する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:19:16 GMT)
Continual Learning with Strategic Selection and Forgetting for Network Intrusion Detection [6.3] 侵入検知システム(IDS)はデジタルインフラの保護に不可欠である。
本稿では,IDSの新しい連続学習手法であるSSF(Strategic Selection and Forgetting)を提案する。
提案手法は,新しいサンプルを選択的に選択する戦略的サンプル選択アルゴリズムと,古いサンプルをドロップする戦略的忘れ機構を備える。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:00:49 GMT)
Multimodal semantic retrieval for product search [6.2] プロダクトイメージは、e-commence検索のインタラクションに不可欠であり、製品探索において顧客にとって重要な要素である。
商品の純文表現とは対照的に,e-commence searchにおける商品項目のマルチモーダル表現を構築した。
商品のマルチモーダル表現スキームは,セマンティック検索における購入リコールや関連精度の向上を示すことができることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:34:26 GMT)
Evaluating Human Perception of Novel View Synthesis: Subjective Quality Assessment of Gaussian Splatting and NeRF in Dynamic Scenes [6.2] GS法とNeRF法の両方を含むNVS技術の品質評価のための2つの主観的な実験を行った。
この研究は、360度デグ、前面、一視点のフォトリアリスティック映像をカバーし、よりリッチで多くのリアルシーンを提供する。
動くオブジェクトを持つ動的シーンにおけるNVSメソッドの影響を調査するのは、これが初めてである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:01:27 GMT)
Am I Infected? Lessons from Operating a Large-Scale IoT Security Diagnostic Service [6.1] ユーザのIoTデバイスをスキャンして、その安全性を判断するWebサービスを立ち上げました。
このサービスの目的は、日本のユーザのIoTデバイスの脆弱性やマルウェアの感染を診断し、治療することである。
脆弱性のあるデバイスを持つ417ユーザのうち、151ユーザが再確認と再診断を行い、75が改善した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:40:53 GMT)
ScVLM: Enhancing Vision-Language Model for Safety-Critical Event Understanding [5.9] SCEの重症度とタイプを分類するために,教師付きおよびコントラスト学習技術を統合した新しいハイブリッド手法であるScVLMを紹介する。
提案手法は,第2戦略ハイウェイ研究プログラム自然言語駆動学習データセットから8,600以上のSCEを用いて訓練し,評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:27:06 GMT)
Bitcoin Under Volatile Block Rewards: How Mempool Statistics Can Influence Bitcoin Mining [5.9] Bitcoinがより半減期を経験するにつれて、プロトコル報酬はゼロに収束し、取引手数料がマイナー報酬の主要な源となる。
以前のBitcoinのセキュリティ分析では、固定ブロック報酬モデルまたは高度に単純化された揮発性モデルが検討されている。
本稿では,より現実的な揮発性モデルに基づく鉱業戦略開発のための強化学習ツールを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:03:04 GMT)
Privacy-Preserving Authentication: Theory vs. Practice [5.8] 暗号はゼロ知識証明や高度なシグネチャスキームのようなエキサイティングなプリミティブを提供する。
このようなプリミティブは、高レベルのプライバシー保護を組み込んだオンライン認証と認証を実現することができる。
本稿では、問題、暗号化ができること、デプロイ例、広く普及する障壁について考察する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:04:05 GMT)
Investigating Large Language Models in Inferring Personality Traits from User Conversations [5.7] 大規模言語モデル(LLM)は、多様なドメインにまたがる目覚ましい人間のような能力を示している。
本研究は, GPT-4o と GPT-4o mini が, ビッグファイブの性格特性を推測し, ユーザの会話から BFI-10 項目のスコアを生成できるかどうかを評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:09:58 GMT)
A Unified Framework for Automated Code Transformation and Pragma Insertion [5.7] 高レベルの合成、ソース・ソース・コンパイラ、およびプラグマ挿入のための様々な設計空間探索技術により、生成された設計結果の品質が大幅に向上した。
これらのツールは、開発時間を短縮し、パフォーマンスを向上するといった利点を提供する。
しかしながら、高品質な結果を達成するには、通常、個別または前処理ステップとして実行される、追加の手動コード変換とタイリング選択が必要になることが多い。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:11:28 GMT)
CMAR-Net: Accurate Cross-Modal 3D SAR Reconstruction of Vehicle Targets with Sparse Multi-Baseline Data [5.7] マルチベースライン合成開口レーダ(SAR)3次元トモグラフィは重要なリモートセンシング技術である。
限られた開口部のデータに依存したスパース3D SARの最近の進歩は、費用対効果の代替手段として注目されている。
異種情報を統合することで3次元SAR画像の高精細化を実現する3D-SAR再構成ネットワーク(CMAR-Net)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:44:43 GMT)
Estimating quantum relative entropies on quantum computers [5.6] 量子コンピュータ上の2つの未知の量子状態から量子相対エントロピーとPetz R'enyiの発散を推定するための最初の量子アルゴリズムを提案する。
これは、相対エントロピーの二次近似、量子f-分岐の変分表現、およびエルミート作用素をパラメータ化する新しい手法を組み合わせることで達成される。
我々は,数値シミュレーションによるアルゴリズムの検証を行い,今後の量子ハードウェアデバイスへの展開の基礎を定めている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:00:24 GMT)
Foundation Models at Work: Fine-Tuning for Fairness in Algorithmic Hiring [5.5] 対象の微調整に強化学習を活用するAutoRefineを提案する。
本稿では,言語バイアスがレコメンデーションシステムに影響を及ぼすアルゴリズム的採用プラットフォームにおいて発生する問題の方法を示す。
本モデルは,多様性と公正度基準を満たすために,職務記述におけるバイアスを検出し,規制する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:36:17 GMT)
Explainable Artificial Intelligence: A Survey of Needs, Techniques, Applications, and Future Direction [5.4] 説明可能な人工知能(XAI)は、これらのモデルがどのように意思決定や予測を行うかを説明することによって、課題に対処する。
既存の研究では、XAIの基本概念、その一般的原理、およびXAI技術の範囲について検討されている。
本稿では、共通用語と定義、XAIの必要性、XAIの受益者の必要性、XAI手法の分類、および異なる応用分野におけるXAI手法の適用に関する総合的な文献レビューを提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:29:56 GMT)
A Survey of Early Exit Deep Neural Networks in NLP [5.4] ディープニューラルネットワーク(DNN)は、幅広いタスクにわたるアートパフォーマンスを実現するために、ますます大きくなっている。
高い計算要求により、リソース制約のあるアプリケーションには適さない。
初期のエグジット戦略は、適応推論を有効にすることで、有望な解決策を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:08:52 GMT)
TFLAG:Towards Practical APT Detection via Deviation-Aware Learning on Temporal Provenance Graph [5.4] Advanced Persistent Threat (APT) はますます複雑化し、隠蔽されている。
近年の研究では、証明グラフから詳細な情報を抽出するグラフ学習技術が取り入れられている。
本稿では,高度な異常検出フレームワークであるTFLAGを紹介する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:08:06 GMT)
PPO-Q: Proximal Policy Optimization with Parametrized Quantum Policies or Values [5.3] PPO-Qは、PPOアルゴリズムのアクターまたは批判部分にハイブリッド量子古典的ネットワークを統合する。
PPO-Qは、訓練パラメータを著しく減らした複雑な環境において、最先端の性能を達成する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:40:40 GMT)
Probabilistic Forecasting of Irregular Time Series via Conditional Flows [5.0] 本稿では,不規則サンプル時系列の確率予測のための新しいモデルProFITiを提案する。
このモデルは過去の観測や待ち行列や時間に基づく時系列の今後の値に関する共同分布を学習する。
4つのデータセットに対して広範な実験を行い、提案モデルが以前最高のモデルよりも4ドル高い確率を提供することを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:59:24 GMT)
Digital Operating Mode Classification of Real-World Amateur Radio Transmissions [4.9] 我々は17個のデジタル動作モードから98種類のパラメータ化無線信号を生成し,それぞれを70cm(UHF)アマチュア無線帯域に送信した。
3つの軽量MLモデルは、ランダム文字をペイロードとして制限された非送信信号のスペクトログラムにのみ訓練された。
我々の最良のモデルであるEfficientNetB0は17の動作モードで93.80%、98のパラメータ化された無線信号で85.47%の精度を達成した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:48:35 GMT)
Initial Findings on Sensor based Open Vocabulary Activity Recognition via Text Embedding Inversion [4.8] 本稿では,まず各アクティビティを自然言語に変換することで制限を克服するフレームワークであるOpen Vocabulary HAR(OV-HAR)を提案する。
自動回帰型大規模言語モデル(LLM)に依存する他の研究とは異なり、OV-HARはそのようなモデルの計算オーバーヘッドを伴わずにオープンな語彙認識を実現する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:24:10 GMT)
Integral Probability Metrics Meet Neural Networks: The Radon-Kolmogorov-Smirnov Test [4.8] 与えられた滑らか度$k geq 0$のRBV空間における単位球である$mathcalF$の関数について検討する。
このテストは、よく知られた古典的コルモゴロフ・スミルノフ(KS)テストの多次元および高次滑らか性への一般化と見なすことができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:53:39 GMT)
Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales [4.8] 本稿では,標準的な心理アンケートを自然言語推論のプロンプトに再構成する方法を示す。
我々は、88種類の公開モデルを用いて、人間のようなメンタルヘルス関連構造の存在を実証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:08:07 GMT)
Are LLMs Good Cryptic Crossword Solvers? [4.5] クリプティッククロスワード(英: Cryptic crosswords)とは、様々なレベルの言語を操り、様々な種類のワードプレイに対処するソルバの能力に依存するパズルである。
従来の研究では、現代のNLPモデルにおいても、そのようなパズルを解くことが難しいことが示唆されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:46:59 GMT)
Enhancing LLM's Ability to Generate More Repository-Aware Unit Tests Through Precise Contextual Information Injection [4.4] プロンプトエンジニアリングによって導かれる大規模言語モデル(LLM)は、幅広いタスクを扱う能力に注目を集めている。
LLMは、プロジェクトのグローバルな文脈に対する認識の欠如により、焦点メソッドや関数の単体テストを生成する際に幻覚を示す可能性がある。
我々は,レポジトリ対応の単体テストを生成するLLMの能力を向上するRATesterを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:43:36 GMT)
Preference-Consistent Knowledge Distillation for Recommender System [4.2] プロジェクタの制約が欠如しているため、ユーザの好みを転送するプロセスが妨げられる可能性が高い。
プロジェクタの2つの正規化項からなるPCKDを提案する。
選好スコアの高い項目に着目し, 選好の不整合を著しく軽減し, 特徴量に基づく知識蒸留の性能向上を図る。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:19:53 GMT)
Exploring Feature-based Knowledge Distillation for Recommender System: A Frequency Perspective [4.2] 周波数の観点から特徴量に基づく知識蒸留を推奨するために分析する。
我々は,知識重みを再分配することによって重要な知識を強調することを提案する。
広範囲にわたる実験により、FreqDはレコメンダシステムに対する最先端の知識蒸留法よりも一貫して、著しく優れていることが示された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:10:18 GMT)
DrLLM: Prompt-Enhanced Distributed Denial-of-Service Resistance Method with Large Language Models [4.2] 本稿では,Large Language Models (LLM) を用いたゼロショットシナリオにおける異常なトラフィック情報のマイニングを目的としたDrLLMを提案する。
DrLLMと既存のアプローチのギャップを埋めるために、トラフィックデータのグローバルおよびローカル情報を推論パラダイムに組み込み、知識埋め込み、トークン埋め込み、プログレッシブロール推論という3つのモジュールを設計する。
我々のアブレーション実験は、ゼロショットシナリオにおけるDrLLMの適用性を実証し、ネットワーク領域におけるLLMの可能性をさらに実証する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:12:09 GMT)
A data-driven approach to discover and quantify systemic lupus erythematosus etiological heterogeneity from electronic health records [4.2] 全身性エリテマトーデス(Systemic lupus erythematosus, SLE)は、多くの症状を呈する複雑な疾患である。
マルチモーダル不完全なEHRデータから確率的独立情報源を発見するためのデータ駆動型手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:00:31 GMT)
Robust Single Object Tracking in LiDAR Point Clouds under Adverse Weather Conditions [4.1] LiDAR点雲における3次元物体追跡は、屋外知覚にとって重要な課題である。
現在の3DSOTメソッドの素晴らしいパフォーマンスにもかかわらず、それらをクリーンなデータセットで評価することは、包括的なパフォーマンスを反映していない。
主な障害の1つは、3DSOTの評価のための悪天候ベンチマークの欠如である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:44:35 GMT)
Estimating Musical Surprisal in Audio [4.1] シンボリック・ミュージックにおけるサブプライムのプロキシとしての自己回帰モデルからのワンステップ予測の情報コンテンツ(IC)
我々は、事前訓練されたオートエンコーダネットワークの圧縮遅延音声表現を予測するために、自己回帰変換モデルを訓練する。
音声・音楽の特徴とICの関係について検討し,音節の変動や声の大きさと相関し,低音域,不協和性,リズムの複雑度,および音声・音楽の特徴に関連するオンセット密度を推定した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:46:45 GMT)
Layer-Wise Security Framework and Analysis for the Quantum Internet [4.0] 本研究では,量子インターネットのさまざまな層にまたがる脆弱性とその対策について検討する。
我々は,潜在的な攻撃の深刻度を評価し,軽減戦略の有効性を評価し,多様なネットワーク構成の脆弱性を特定する。
この調査結果は、量子インターネットのセキュリティ次元に関する継続的な研究の必要性を浮き彫りにして、その堅牢性を確保し、その採用を奨励し、社会への影響を最大化するものである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:44:42 GMT)
Controlling Equational Reasoning in Large Language Models with Prompt Interventions [4.0] 本稿では,Large Language Models (LLMs) における幻覚率を,シンボルデータ生成フレームワークを用いて制御する方法を検討する。
シンボルエンジンを用いて導出タスクのデータを生成し、数学的導出の特徴を摂動させるために目的の介入を適用する。
次に、細調整されたT5モデル、GPTモデル、LLaMaモデルを含む、様々なLLMに対する迅速な介入の効果を評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:01:23 GMT)
BeFA: A General Behavior-driven Feature Adapter for Multimedia Recommendation [4.0] マルチメディアレコメンデータシステムは、ユーザの好みをモデル化するために行動情報とコンテンツ情報を活用することに重点を置いている。
事前訓練された機能エンコーダは、過剰な嗜好と関係のない詳細を含む、コンテンツ全体から機能を同時に抽出することが多い。
本稿では,これらの問題に対処するために,効果的で効率的な行動駆動型特徴適応器(BeFA)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:39:04 GMT)
FlexQuant: Elastic Quantization Framework for Locally Hosted LLM on Edge Devices [4.0] メモリの柔軟性は、メモリが共有され動的に変動する統一メモリを持つエッジデバイスにとって不可欠である。
我々は、量子化されたモデルの集合を生成する新しい弾力性フレームワークFlexQuantを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:58:00 GMT)
OCTolyzer: Fully automatic toolkit for segmentation and feature extracting in optical coherence tomography and scanning laser ophthalmoscopy data [3.8] OCTolyzerはOCT/SLOデータにおけるレチノコロイド解析のための最初のオープンソースツールキットである。
OCTデータとSLOデータの2つの分析スイートを備えており、ディープラーニングに基づく解剖学的セグメンテーションを容易にする。
OCT/SLOデータを再現可能で臨床的に意義のある網膜脈絡膜の特徴に変換することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:23:55 GMT)
ML-assisted Randomization Tests for Detecting Treatment Effects in A/B Experiments [3.8] 本稿では, 複雑な処理効果に対するランダム化試験を構築した。
このアプローチの重要な特徴は、フレキシブル機械学習(ML)モデルを使用することです。
このアプローチは、現代のMLツールの予測力とランダム化手順の有限サンプル妥当性を組み合わせる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:14:58 GMT)
Code and Pixels: Multi-Modal Contrastive Pre-training for Enhanced Tabular Data Analysis [3.6] MT-CMTM(Multi-task Contrastive Masked Tabular Modeling)を提案する。
これらのデータモーダル間の相乗効果を最適化し、コントラスト学習とマスク付き表形式モデリングを組み合わせた二重戦略を用いる。
我々のアプローチの中心は、残差接続と注意機構を備えた1次元畳み込みニューラルネットワーク(1D-ResNet-CBAM)である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:12:18 GMT)
Sub-2 Kelvin characterization of nitrogen-vacancy centers in silicon carbide nanopillars [3.6] 我々は、4H-SiCの窒素空孔(NV)中心である有望な近赤外線量子エミッタを選択し、それをアンサンブルレベルに統合する。
我々は、光クライオスタットのチャンバー内に、互換性のある超伝導ナノワイヤ単光子検出器を内蔵し、ICECAPシステムを構築した。
ICECAP測定では,NVアンサンブル放出のライン幅を最大14倍に拡大することは認められなかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:35:17 GMT)
A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization [3.5] RankNet-Inspired Surrogate-assisted Hybrid Metaheuristic (RI-SHM)を提案する。
提案アルゴリズムは,最大300次元の大規模カバレッジ最適化タスクを,望ましくは1,800以上の目標を効果的に処理できる。
EMVOPの最先端アルゴリズムと比較すると、RI-SHMは全てのテストインスタンスで56.5ドル%まで性能が向上している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:49:05 GMT)
Diff-Ensembler: Learning to Ensemble 2D Diffusion Models for Volume-to-Volume Medical Image Translation [3.4] Diff-Ensemblerは,効率的かつ効率的なボリューム翻訳のためのハイブリッド2D-3Dモデルである。
3次元医用画像の高分解能・モダリティ変換において,本モデルは優れた精度とボリュームリアリズムを実現する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:54:21 GMT)
Detection of AI Deepfake and Fraud in Online Payments Using GAN-Based Models [3.3] 本研究では,GAN(Generative Adversarial Networks)を用いて,オンライン決済システムにおけるAIディープフェイクや不正行為を検出する。
支払い画像の微妙な操作を識別することで、オンライン決済のセキュリティを高める新しいGANモデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:10:54 GMT)
Simplifying CLIP: Unleashing the Power of Large-Scale Models on Consumer-level Computers [3.2] Contrastive Language-Image Pre-Training (CLIP) はその優れたゼロショット性能と下流タスクへの優れた転送性のために注目を集めている。
しかし、そのような大規模モデルのトレーニングは通常、実際の計算とストレージを必要とするため、一般ユーザにとって消費者レベルのコンピュータでは障壁となる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:29:53 GMT)
Evaluating Pre-Trained Models for Multi-Language Vulnerability Patching [3.2] 本稿では,事前学習型言語モデルであるCodeBERTとCodeT5の脆弱性パッチ自動適用の可能性について検討する。
これらのモデルの精度、計算効率、脆弱性のあるコードパッチの長さがパフォーマンスに与える影響について評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:51:05 GMT)
Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective [3.2] セマンティックセグメンテーションと圧縮の間には根本的な関係があることを論じる。
PrIncipled SemantiC SegemenTation(DEPICT)のためのホワイトボックス完全注意型Decoderを考案した。
ADE20Kで行った実験では、DEPICTはブラックボックスであるSegmenterよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:42:03 GMT)
Pantomime: Towards the Anonymization of Motion Data using Foundation Motion Models [3.2] 動きデータに対する全体匿名化手法であるパントマイムを提案する。
パントマイムは、識別精度を10%に抑えながら、運動列の自然性を維持することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:22:30 GMT)
Inductive Learning of Robot Task Knowledge from Raw Data and Online Expert Feedback [3.1] ロボットの自律性の向上は、特に人間とロボットの相互作用シナリオにおいて、信頼と社会的受容の課題を引き起こす。
これはロボット認知能力の解釈可能な実装を必要としており、おそらくはタスク仕様の定義のための論理としての形式的手法に基づいている。
本稿では,タスク仕様を抽出するノイズの多い例から,帰納的論理プログラミングに基づくオフラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:25:46 GMT)
Topic-Aware Knowledge Graph with Large Language Models for Interoperability in Recommender Systems [3.1] 我々は,大規模言語モデル(LLM)を用いて,側面情報と文脈情報の両方から一般トピックと特定トピックを抽出する一貫したアプローチを提案する。
実験結果から,多様な知識グラフ間での推薦性能が大幅に向上した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:17:38 GMT)
Improving Forward Compatibility in Class Incremental Learning by Increasing Representation Rank and Feature Richness [3.1] 本稿では,前方互換性向上を目的としたRFR法を提案する。
本研究は,破滅的忘れ込みを緩和しつつ,新規タスク性能を高めるためのアプローチの有効性を実証するものである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:32:48 GMT)
Context Matters: Leveraging Contextual Features for Time Series Forecasting [3.0] 既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:42:06 GMT)
Retail Central Bank Digital Currency: Motivations, Opportunities, and Mistakes [2.9] 世界中の各国が中央銀行デジタル通貨(CBDC)の設計について調査を行っている
CBDCは、現金と中央銀行の予備金と共に中央銀行によって発行される。
CBDCは個人や企業によって通常の商業に適した金として使われる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:08:29 GMT)
Intent-Interest Disentanglement and Item-Aware Intent Contrastive Learning for Sequential Recommendation [2.9] 本研究では,ユーザの行動の包括的理解のために,ユーザの行動を,ユーザの安定した嗜好である意図に分解する方法を示す。
また,同じインタラクションで発生した意図を一致させ,対応する意図によって発生した項目の組み合わせと意図を一致させる,項目認識のコントラスト学習も導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:09:01 GMT)
Measure transfer via stochastic slicing and matching [2.9] 本稿では,スライシング・アンド・マッチ法によって定義される移動度と近似問題の反復的スキームについて検討する。
本論文の主な貢献はスライシング・アンド・マッチングスキームに対するほぼ確実な収束証明である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:26:08 GMT)
Large Language Models for Interpretable Mental Health Diagnosis [2.9] 大規模言語モデル(LLM)と制約論理プログラミング(CLP)の強みを組み合わせた精神保健診断のための臨床意思決定支援システム(CDSS)を提案する。
我々のCDSSは、LCMを用いて診断マニュアルを論理プログラムに翻訳し、既製のCLPエンジンを用いて患者の診断を問い合わせるソフトウェアツールである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:26:09 GMT)
MathReader : Text-to-Speech for Mathematical Documents [2.9] 我々は、微調整されたT5モデルであるOCRとTSを効果的に統合するMathReaderを提案する。
MathReaderはMicrosoft Edgeに比べてWERを0.510から0.281に、Adobe Acrobatと比べて0.617から0.281に削減した。
これは、文書を聴きたい、特に視覚障害者が直面する不便さを軽減するのに大いに貢献する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:47:05 GMT)
Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity [2.8] 新たな損失関数であるクラス距離重み付きクロスエントロピー(CDW-CE)を提案する。
これは、予測されたクラスと実際のクラスが遠く離れているときに、誤分類をより厳しく罰する。
以上の結果から,CDW-CEは日常的な画像分類タスクの性能を一貫して向上させることがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:07:46 GMT)
Generative Assignment Flows for Representing and Learning Joint Distributions of Discrete Data [2.6] 離散確率変数の結合確率分布の表現のための新しい生成モデルを提案する。
このアプローチでは、分解分布の統計部分多様体上のランダム化代入フローによる測度輸送を用いる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:18:53 GMT)
Teaching Empirical Research Methods in Software Engineering: An Editorial Introduction [2.5] 近年、経験的ソフトウェア工学が注目され、ソフトウェア工学における科学的実践のデファクトスタンダードとなった。
現在、経験的研究の設計、指揮、報告、レビューのための広範囲なガイドラインが提供されているが、経験的ソフトウェア工学の教育には、同様の注意が払われていない。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:42:43 GMT)
Quantum Wasserstein Compilation: Unitary Compilation using the Quantum Earth Mover's Distance [2.5] 量子回路コンパイル(QCC)は、任意の量子アルゴリズムの実行において重要なコンポーネントである。
次数1の量子ワッセルシュタイン距離に基づく量子ワッセルシュタインコンパイル(QWC)コスト関数と呼ばれるVQCCオブジェクト関数を提案する。
生成逆数ネットワークにおいて、局所的なパウリ可観測値の測定に基づく推定方法を用いて、所定の量子回路を学習する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:58:08 GMT)
Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications [2.5] 遷移性の仮定を伴わないペアワイズ比較データに対する統計モデル群を提案する。
提案した推定器は、データの空間レベルに効果的に適応するミニマックスレート最適性を達成する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:05:41 GMT)
Containers as the Quantum Leap in Software Development [2.5] QLEAP (2022-24) は、コンテナをアーキテクチャ設計の要素として利用するプロジェクトである。
この文書は、プロジェクトから学んだ重要な教訓を集めます。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:58:57 GMT)
Affirmative Hackathon for Software Developers with Disabilities: An Industry Initiative [2.4] 包括的雇用とマネジメントの経験を持つ熟練したプロフェッショナルの欠如は、企業がソフトウェア開発チームのPWD表現を効果的に増やすことを妨げます。
本稿では,ブラジルのソフトウェア企業Zup Innovationが,PWD開発者を惹きつけるために,50人の参加者による完全リモート肯定的ハッカソンを開催した経験を報告する。
私たちの発見は、同様の課題に対処し、技術チームへのさらなる関与を促進するために、他の企業に教訓を与えています。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:04:01 GMT)
A Preliminary Survey of Semantic Descriptive Model for Images [2.4] 本研究は北京宮殿博物館の ACP コレクションを利用して,図形学理論と用語抽出・マッピングの新しいワークフローを統合した意味モデルを構築した。
SDMは,より芸術的な知識組織とACPの文化的探究を支援するのに有効である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:40:28 GMT)
A minimal coalition logic [2.4] 並列ゲームモデルの3つの仮定は強すぎると論じる。
本稿では,3つの仮定を持たない一般的な並列ゲームモデルに基づく連立論理を提案し,その完全性を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:47:41 GMT)
Enhancing Team Diversity with Generative AI: A Novel Project Management Framework [2.3] 本稿では、チームの多様性とプロジェクト管理の強化にAIの実践的応用を探求することを目的とする。
このフレームワークは、学術および研究プロジェクトチームにおけるチーム構成の統一という共通の課題に対処するために設計されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:39:06 GMT)
Communication-Efficient, 2D Parallel Stochastic Gradient Descent for Distributed-Memory Optimization [2.3] この研究は、1D $s$-step SGD と Averaging (FedAvg) を用いた 1D Federated SGD の作業を一般化し、2D 並列 SGD 法 (HybridSGD) を生成する。
C++ と MPI で全てのアルゴリズムを実装し,Cray EX スーパーコンピュータシステム上での性能評価を行う。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:56:39 GMT)
On the Convergence of Continual Federated Learning Using Incrementally Aggregated Gradients [2.3] 機械学習の聖杯は、連続的フェデレーション学習(CFL)によって、ストリーミングデータから学習しながら、AIシステムの効率、プライバシ、スケーラビリティを高めることである。
本稿では、エッジベースのメモリ勾配更新と、現在のデータに対する集約勾配からなる新しいリプレイメモリベースのフェデレーション戦略を提案する。
我々は,C-FLAGが,タスクとクラスインクリメンタル設定の両方において,精度や忘れなどの指標に関して,最先端のベースラインを上回っていることを実証的に示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:25:57 GMT)
Modeling Latent Neural Dynamics with Gaussian Process Switching Linear Dynamical Systems [2.2] ガウス過程スイッチング線形力学系(gpSLDS)の2つの目的をバランスさせるアプローチを開発する。
我々の手法は、非線形力学をガウス過程(GP-SDE)で記述した微分方程式による潜在状態の進化をモデル化した以前の研究に基づいている。
本手法は, 離散状態境界近傍の力学における人工振動など, rSLDS の重要な限界を解消するとともに, 力学の後方不確かさを推定する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 00:43:34 GMT)
A Unified Approach to Extract Interpretable Rules from Tree Ensembles via Integer Programming [2.1] ツリーアンサンブルは非常に人気のある機械学習モデルであり、教師付き分類と回帰タスクの有効性で知られている。
我々の研究は、訓練された木アンサンブルから最適化されたルールのリストを抽出することを目的としており、ユーザーは完全なモデルの予測力をほとんど保持する凝縮された解釈可能なモデルを提供する。
我々の広範な計算実験は,木アンサンブルに対する予測性能と忠実度の観点から,本手法が他のルール抽出法と競合することを示す統計的に有意な証拠を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:58:43 GMT)
MusicLIME: Explainable Multimodal Music Understanding [2.1] マルチモーダル音楽モデル用に設計されたモデルに依存しない特徴重要度説明法であるMusicLIMEを紹介する。
MusicLIMEは、音声と歌詞の機能がどのように相互作用し、予測に寄与するかを明らかにし、モデルの意思決定の全体像を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:34:16 GMT)
UNetVL: Enhancing 3D Medical Image Segmentation with Chebyshev KAN Powered Vision-LSTM [2.1] 畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)により,3次元医用画像セグメンテーションが著しく進展した。
これらの手法は、長距離依存の獲得と計算効率のバランスをとるのに苦労する。
時間情報処理の最近の進歩を生かした新しいアーキテクチャであるUNETVLを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:33:28 GMT)
EVA-S2PLoR: A Secure Element-wise Multiplication Meets Logistic Regression on Heterogeneous Database [2.1] 本稿では, 効率よく, 検証し, 正確な2次元ロジスティック回帰フレームワーク(EVA-S2PLoR)を提案する。
我々のフレームワークは、主にセキュアな2次元ベクトル要素ワイド乗算と、データディスガージング技術に基づく乗算、相反関数、シグモイド関数を含む。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:27:23 GMT)
Spectral complexity of deep neural networks [2.1] 我々は,ネットワークアーキテクチャの複雑さを特徴付けるために,制限場の角パワースペクトルを用いる。
そこで我々は,ニューラルネットワークを低次,スパース,高次と分類する。
本稿では,この分類が標準アクティベーション関数の様々な特徴,特にReLUネットワークの空間特性を如何に強調するかを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:41:53 GMT)
Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models [2.1] 関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:12:41 GMT)
DefVerify: Do Hate Speech Models Reflect Their Dataset's Definition? [2.1] DefVerifyは、ユーザーが指定したヘイトスピーチの定義を符号化する3段階の手順である。
DefVerifyを使用して、一般的な6つのヘイトスピーチベンチマークデータセットに適用した場合、定義とモデル動作のギャップを見つけます。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:23:35 GMT)
Rate-adaptive Reconciliation for Experimental Continuous-variable Quantum Key Distribution with Discrete Modulation over a Free-space Optical Link [2.1] キーを安全に交換する手法として,連続可変量子鍵分布(CV-QKD)が提案されている。
自由空間光(FSO)チャネルはCV-QKDにとって興味深いチャネルであり、無線で鍵を共有できる。
しかし, 乱流現象によるFSOチャネルの不安定性は, システム性能の低下を引き起こす可能性がある。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:39:38 GMT)
TimberVision: A Multi-Task Dataset and Framework for Log-Component Segmentation and Tracking in Autonomous Forestry Operations [2.0] 51kのトランク成分を含む2k以上の注釈付きRGB画像からなるTimberVisionデータセットを紹介した。
我々は、両方のタスクに対してモデルによって検出されたコンポーネントを統一されたトランク表現に融合する汎用フレームワークを導入する。
私たちのソリューションは幅広いアプリケーションシナリオに適しており、他のセンサーのモダリティと簡単に組み合わせることができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:30:01 GMT)
Quantifying Polarization: A Comparative Study of Measures and Methods [2.0] 社会的分断の鍵を握る政治分極は、オンラインとオフラインの会話を形作る役割について注目を集めている。
本研究は,5つの広く用いられている偏光測定値を評価し,その強度と弱点を合成データセットを用いて検証する。
偏極分布におけるモード検出を改善するために,クラインバーグのバースト検出アルゴリズムの新たな適応法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:43:23 GMT)
FinerWeb-10BT: Refining Web Data with LLM-Based Line-Level Filtering [2.0] 本稿では,LLMに基づくラインレベルのフィルタリング手法を導入し,トレーニングデータの品質を向上させる。
我々は、GPT-4o miniを使用して、FineWebから2万のドキュメントサンプルをラインレベルでラベル付けし、低品質の行に対して記述的なラベルを作成できるようにします。
フィルタリングの影響をテストするため、元のデータセットとフィルタリングデータセットの両方でGPT-2モデルをトレーニングする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:26:50 GMT)
Distance Measure Based on an Embedding of the Manifold of K-Component Gaussian Mixture Models into the Manifold of Symmetric Positive Definite Matrices [2.0] 本稿では、K成分のガウス混合モデルの対称正定行列多様体への埋め込みに基づいて、ガウス混合モデル(GMM)間の距離を求める。
このフレームワークの有効性は、標準機械学習ベンチマークの実験を通じて実証され、UIUC、KTH-TIPS、テクスチャ認識データセットでそれぞれ98%、92%、93.33%の精度を達成した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:52:43 GMT)
"Near Data" and "Far Data" for Urban Sustainability: How Do Community Advocates Envision Data Intermediaries? [1.9] データ・インターミディエートはデータ・アクセスと利用を促進する上で重要なステークホルダーである。
コミュニティの支持者は、これらの社会的不正と変化の機会の場所に住んでいる。
本稿では,コミュニティがデータ仲介者に対して提供しているユニークな視点について考察する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:47:44 GMT)
Telegram as a Battlefield: Kremlin-related Communications during the Russia-Ukraine Conflict [1.9] 本稿では,プロクレムリンチャネルとアンチクレムリンテレグラムチャネルの両方からのポストのデータセットを提案する。
データセットは404のプロクレムリンチャネルと4,109,645のポスト、114の反クレムリンチャネルと1,117,768のポストで構成されている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:58:55 GMT)
AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR [1.9] 文内コードスイッチングは,音声認識システムにおいて重要な課題である。
AdaCSは、適応バイアスアテンションモジュールをエンコーダ・デコーダネットワークに統合する正規化モデルである。
実験の結果,AdaCSはベトナムのCS ASR正規化において,従来の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:27:00 GMT)
Rethinking AI Cultural Evaluation [1.8] 現在の評価方法は、主にMultiple-choice Question (MCQ)データセットに依存している。
本研究は,MCQに基づく評価と,非拘束的相互作用において伝達される値との間に有意な相違点が認められた。
MCQを超えて、よりオープンな、コンテキスト固有のアセスメントを採用することをお勧めします。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:42:37 GMT)
Deep Generative Clustering with VAEs and Expectation-Maximization [1.8] 本稿では,変分オートエンコーダ(VAE)を期待最大化フレームワークに統合する新しいディープクラスタリング手法を提案する。
提案手法は,各クラスタの確率分布をVAEでモデル化し,モデルパラメータの更新を交互に行う。
これにより、各クラスタから有効なクラスタリングと新しいサンプルの生成が可能になる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:26:39 GMT)
Tiny Models are the Computational Saver for Large Models [1.8] 本稿では,TinySaverについて紹介する。TinySaverは,大規模モデルを適応的に置き換えるために小さなモデルを用いる,早期に出現する動的モデル圧縮手法である。
この手法をImageNet-1k分類で評価した結果,最大90%の演算数を削減できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:38:41 GMT)
ML Mule: Mobile-Driven Context-Aware Collaborative Learning [1.8] 我々は、より堅牢で分散し、パーソナライズされた新しい機械学習手法を提案する。
我々のアプローチは、従来の、フェデレートされた、完全に分散化された学習システムの主な欠点に対処する。
その結果,ML Mule は既存の手法に比べて高速に収束し,モデル精度が向上した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:16:13 GMT)
Principles for Responsible AI Consciousness Research [1.8] 今、あるいは近い将来に、意識的なAIシステムを構築することができるかもしれない。
大量の意識的なシステムが作り出され、苦しめられる場合もあります。
我々は、責任ある研究のための5つの原則を提案し、研究組織は、これらの方針に関する原則に自発的に公的なコミットメントをすべきであると主張している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:59:53 GMT)
Scaling Up ESM2 Architectures for Long Protein Sequences Analysis: Long and Quantized Approaches [1.8] 本稿では,ESM2アーキテクチャの長大かつ量子化されたバージョンを提示し,入力サイズを2,048アミノ酸に2倍にする。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:26:29 GMT)
Proactive Distributed Emergency Response with Heterogeneous Tasks Allocation [1.8] 交通インシデント管理(TIM)プログラムは、緊急リソースの配置を即時インシデント要求に調整する。
環境におけるインシデントの進化に固有の相互依存を無視しながら、現在のデプロイメント決定は短命です。
本研究は,分散制約最適化問題(DCOP)に基づく新しいプロアクティブフレームワークを開発し,上記の制約に対処する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:38:21 GMT)
RbRL2.0: Integrated Reward and Policy Learning for Rating-based Reinforcement Learning [1.7] 強化学習(Reinforcement Learning, RL)は、関連する累積リターン/リワードに基づいて様々な経験からポリシーを学習する。
本稿では,効率的な政策学習のために収集した経験を識別することで,人間の意思決定過程を模倣する新しいRL手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:19:34 GMT)
Performance Optimization of Ratings-Based Reinforcement Learning [1.6] 本稿では,評価に基づく強化学習(RbRL)の性能向上のための複数の最適化手法について検討する。
RbRLは、報酬のない環境下での報酬関数を、標準強化学習による後続の政策学習のために推論するために開発された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:56:24 GMT)
Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures [1.6] 糖尿病網膜症や緑内障などの眼疾患は、公衆衛生上の重大な課題となる。
深層学習モデルは、網膜イメージングのような医療画像を分析する強力なツールとして登場した。
課題は、モデル適合性と不確実性の推定であり、これは臨床的な意思決定に不可欠である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:06:23 GMT)
Adaptive Noise-Tolerant Network for Image Segmentation [1.6] そこで本研究では,非完全・ノイズセグメンテーションとオフザシェルフセグメンテーションアルゴリズムを組み合わせることで,適応型ノイズ耐性ネットワーク(ANTN)モデルにより,より優れたセグメンテーション結果が得られるかどうかを考察する。
1)複数のノイズラベルを1つのディープラーニングモデルに統合できる,(2)確率的パラメータを含む雑音分割モデリングは、与えられたテスト画像の外観に応じて適応する,という2つの新しい側面で、ノイズラベルのディープラーニングを画像セグメンテーションに拡張する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:49:34 GMT)
A Heterogeneous Multimodal Graph Learning Framework for Recognizing User Emotions in Social Networks [1.5] この研究は、不均一グラフ学習に基づくソーシャルネットワークにおけるパーソナライズされた感情予測の新しい定式化を提案する。
HMG-Emoには動的コンテキスト融合モジュールが含まれており、ソーシャルメディアデータに様々なモダリティを適応的に統合することができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:21:33 GMT)
Lessons From Red Teaming 100 Generative AI Products [1.5] 近年では、生成型AIシステムの安全性とセキュリティを調査するためのプラクティスとして、AIレッド・チームリングが登場している。
私たちは、レッドチームと現実世界のリスクの調整を目的とした実践的なレコメンデーションを提供します。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:36:33 GMT)
IoT-Based Real-Time Medical-Related Human Activity Recognition Using Skeletons and Multi-Stage Deep Learning for Healthcare [1.5] IoT(Internet of Things)とモバイル技術は、患者のリアルタイムモニタリングと診断を可能にすることによって、医療を大きく変革した。
HMR(Human Motion Recognition)は、高い計算要求、低い精度、限られた適応性といった課題を継続する。
本研究は,IoTと統合した多段階深層学習技術を活用したMRHA検出のための新しいHMR手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:41:57 GMT)
Derivation of effective gradient flow equations and dynamical truncation of training data in Deep Learning [1.4] 本稿では,ReLUアクティベーション関数を用いたDeep Learningにおいて,累積バイアスと重みを規定する明示的な方程式を導出する。
この研究の主な動機は、教師あり学習における解釈可能性の問題に光を当てることである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:17:28 GMT)
Representation Learning of Point Cloud Upsampling in Global and Local Inputs [1.4] 本研究では,表現学習を通して,点雲のアップサンプリングがグローバルレベルとローカルレベルの両方に与える影響について検討した。
目標は、グローバルとローカルの両方のインプットから事前の知識を活用することで、ポイントクラウドにおけるスパーシリティとノイズの問題に対処することである。
深層学習を利用した一連のオートエンコーダモデルを用いて実験を行い,グローバル入力とローカル入力の両方で解釈可能性を得た。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:13:25 GMT)
LLM-Net: Democratizing LLMs-as-a-Service through Blockchain-based Expert Networks [1.4] 本稿では,LLM(Large Language Models)をサービスとして民主化するブロックチェーンベースのフレームワークであるLLM-Netを紹介する。
LLM-Netは、集合計算資源と分散ドメインの専門知識を活用することで、様々な特定のドメインに対して微調整されたエキスパートモデルを導入している。
我々のシミュレーションはClaude 3.5 Sonnet, Llama 3.1, Grok-2, GPT-4oといった最先端のLCM上に構築され, サービス品質維持における評価に基づくメカニズムの有効性を検証した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:56:05 GMT)
D3MES: Diffusion Transformer with multihead equivariant self-attention for 3D molecule generation [1.4] 本稿では,拡散モデルDiffusion Transformerとマルチヘッド同型自己アテンションを組み合わせた3次元分子生成のための拡散モデルを提案する。
この方法は、2つの主要な課題に対処する: 水素原子を除去した後、分子の表現を学ぶことによって生成分子に水素原子を正しく取り付けること; 同時に複数のクラスにまたがる分子を生成できない既存のモデルの限界を克服すること。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:16:11 GMT)
Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production [1.3] 本研究では,自動車生産環境における人工知能適用の有効性について検討した。
データ構造は、コンテキストの特徴を識別するために分析され、ワンホット符号化を使用して前処理される。
この研究は、高度に可変された生産データにAIメソッドを効果的に適用し、ビジネス価値を付加できることを実証している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:28:03 GMT)
Label Calibration in Source Free Domain Adaptation [1.2] 本稿では,疑似ラベル改善のための予測不確かさとソフトマックス校正手法を提案する。
我々は,事前および非事前目標知識SFDA設定において,明らかな深層学習損失と情報損失と,校正ソフトマックスとの組み合わせを取り入れた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 05:57:09 GMT)
Anonymization of Documents for Law Enforcement with Machine Learning [1.2] 本稿では,スキャンした文書の画像を自動的に匿名化するシステムを提案する。
匿名化後のさらなる法医学的処理の可能性を検討する。
提案手法は、純粋に自動的なリアクションシステムと、参照匿名化の簡易なコピー・ペースト方式の両方より優れていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:47:00 GMT)
An Adaptive Collocation Point Strategy For Physics Informed Neural Networks via the QR Discrete Empirical Interpolation Method [1.2] QR離散経験補間法(QR-DEIM)を用いた適応的コロケーション点選択法を提案する。
我々のQR-DEIMに基づく手法は既存の手法と比較してPINNの精度を向上することを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:24:15 GMT)
Deep Learning-Based Residual Useful Lifetime Prediction for Assets with Uncertain Failure Modes [1.2] 複数の障害モードを持つシステムの既存の予後モデルは、現実のアプリケーションにおいていくつかの課題に直面している。
本研究は,混合(log-location-scale distribution)と深層学習を組み合わせた2つの予後モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:44:02 GMT)
HADES: Hardware Accelerated Decoding for Efficient Speculation in Large Language Models [1.2] 大規模言語モデル(LLM)は、人間に似たテキストを理解し、生成することで自然言語処理に革命をもたらした。
本稿では,LLMの性能とエネルギー効率を向上させる新しい手法であるハードウェア高速化復号法(HADES)を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:33:01 GMT)
Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification [1.1] ニューラルネットワーク(NN)を用いた画像分類は、産業プロセスで広く使われている。
NNは、アウト・オブ・ディストリビューション(OOD)データに直面すると、確実だが誤った予測をする傾向がある。
複数の独立したNNで構成されたディープアンサンブルは、強い性能を示すことが示されているが、計算コストが高い。
本研究では,産業プロセスの画像分類における効率的なNNアンサンブルの予測と不確実性について検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:51:13 GMT)
ViSoLex: An Open-Source Repository for Vietnamese Social Media Lexical Normalization [1.1] ViSoLexはベトナムのソーシャルメディアテキストの語彙正規化の課題に対処するために設計されたオープンソースのシステムである。
ソースコードを公開することで、ViSoLexはベトナムのより堅牢な自然言語処理ツールの開発に貢献することを目指している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:47:13 GMT)
Reconstruction of quantum states by applying an analytical optimization model [1.0] 実測値のサイズを制限した場合,既存のアルゴリズムよりも改良が可能であることを示す。
本研究は, 再現問題における解の多重性について, 生成状態と測定モデルによる検討を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:21:08 GMT)
Dataset Distillation as Pushforward Optimal Quantization [1.0] そこで本稿では,ImageNet-1Kデータセットの性能向上を目的とした,最先端データ蒸留法D4Mの簡易拡張を提案する。
エンコーダ・デコーダ構造を組み込んだ場合、実験的に成功した不整合法を最適な量子化問題として再定義できることを実証する。
特に, 既存の不整合データセット蒸留法を古典的最適量子化法とワッサーシュタインバリセンタ問題にリンクし, 拡散型生成前処理のための蒸留データセットの整合性を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:41:52 GMT)
Map Imagination Like Blind Humans: Group Diffusion Model for Robotic Map Generation [1.0] ロボットが入力情報に制限のある点雲マップを生成するためのグループ拡散モデル(GDM)に基づくアーキテクチャを提案する。
視覚的知覚データや深度データを使わずに,視覚障害者の心的地図の想像・生成能力からインスピレーションを得た。
公開データセットの実験を行った結果,提案手法は経路データのみに基づいて合理的な地図を生成でき,さらに複雑なLiDARデータを組み込んだ地図を作成できることがわかった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:11:53 GMT)
Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMs [1.0] GPT-3.5 と GPT-4o の2つの大規模言語モデル (LLM) について,細調整された小言語モデル (SLM) とBART-large,および2つの大規模言語モデル (LLM) の創作的創作能力を評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:37:03 GMT)
Quantum-enhanced Markov Chain Monte Carlo for systems larger than your Quantum Computer [0.9] より小さな量子コンピュータを用いて量子計算を行えるように,アルゴリズムの粒度を粗くする枠組みを導入する。
本手法は他の古典的および量子的手法と容易に組み合わせられ,様々な量子ハードウェア仕様に適応できる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:52:27 GMT)
LitmusKt: Concurrency Stress Testing for Kotlin [0.8] LitmusKt - Kotlinで並列プログラムをテストする最初のツールです。
このツールの斬新さは、Kotlinがマルチプラットフォーム言語であるという事実にも関係している。
LitmusKtを使用して、Kotlinコンパイラに新たなバグを発見しました。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:40:34 GMT)
Scalable UTXO Smart Contracts via Fine-Grained Distributed State [0.8] UTXOベースのスマートコントラクトプラットフォームは、効率のボトルネックに直面している。
コントラクトに送信されるすべてのトランザクションは、更新されたコントラクト状態全体を指定する必要があります。
本稿では,拡張UTXOブロックチェーン上でのスマートコントラクトの効率的な実行手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:54:31 GMT)
Crowdsourced human-based computational approach for tagging peripheral blood smear sample images from Sickle Cell Disease patients using non-expert users [0.7] シックル細胞病(SCD)患者における末梢血スミア(PBS)画像解析のための人為的計算手法を提案する。
我々は、PBS画像のラベル付けをクラウドソースするために、Mechanical Turk microtask Marketを使用しました。
次に、専門家がタグ付けした赤血球IDBデータセットを用いて、提案手法の精度と信頼性を評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:42:55 GMT)
Vacuum fluctuations induced decoherence of a diamagnetic nanosphere [0.7] 本稿では、磁場の真空揺らぎの存在下での反磁性ナノ粒子の脱コヒーレンス率を簡易に導出する。
その結果,電界成分による真空揺らぎの存在下での誘電体材料との相似性を示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:00:02 GMT)
HyperQuery: Beyond Binary Link Prediction [0.7] ノードレベルのクラスタリングを用いた新しい特徴抽出手法を導入し,ノードレベルのラベルからのデータの統合によってシステム性能が向上することを示す。
我々の自己教師型アプローチは、いくつかのハイパーエッジ予測と知識ハイパーグラフ補完ベンチマークに基づいて、アートベースラインの状態を大幅に改善する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:46:24 GMT)
Multipartite entanglement distribution in Bell-pair networks without Steiner trees and with reduced gate cost [0.7] 本稿では,任意のベルペアネットワーク上でGHZ状態を生成するプロトコルを提案する。
実世界のネットワークモデルにおいて,本プロトコルがゲートコストを低減させることを示す数値的な証拠を提示する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:37:18 GMT)
AlgoRxplorers | Precision in Mutation -- Enhancing Drug Design with Advanced Protein Stability Prediction Tools [0.7] 単一点アミノ酸変異がタンパク質の安定性に与える影響を予測することは、疾患のメカニズムを理解し、薬物開発を促進するために不可欠である。
タンパク質の安定性はギブス自由エネルギーの変化によって定量化され(DeltaDelta G$)、これらの変異の影響を受けている。
本研究は,タンパク質の安定性の景観を特徴的に表現するために,伝達学習を活用し,異なるモデルからの相補的情報を融合するディープニューラルネットワークの応用を提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:17:01 GMT)
Implicit Neural Representations for Registration of Left Ventricle Myocardium During a Cardiac Cycle [0.7] 本研究は、心電図(CT)におけるDIR用INRの使用を拡大し、LVmyoの登録に焦点をあてた。
LVmyoの周辺での登録精度を高めるため、CTフレームからLVmyoの符号付き距離フィールドとHounsfield Unit値を統合する。
我々のフレームワークは高い登録精度を示し、LVmyo運動のさらなる解析を容易にする時間的登録のための堅牢な方法を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:58:02 GMT)
Exploring the Use of Contrastive Language-Image Pre-Training for Human Posture Classification: Insights from Yoga Pose Analysis [0.7] 本研究では,人間の姿勢の分類におけるコントラスト言語-画像事前訓練(CLIP)の有効性を評価することを目的とする。
82のクラスを持つ15,301の画像(実画像と合成画像)に転写学習を適用することで、有望な結果が得られた。
3826イメージでテストされた微調整のCLIPモデルは、85%以上の精度を実現している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:20:44 GMT)
Fast sampling and model selection for Bayesian mixture models [0.6] ベイズ混合モデルの積分後続分布からサンプリングする2つのモンテカルロアルゴリズムについて述べる。
最初のアルゴリズムは従来の崩壊したギブスのサンプルであり、異常な動きがある。
2つ目は最初の部分の上に構築され、以前のオーバーコンポーネントの割り当てからリジェクションなしのサンプリングを追加する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:58:37 GMT)
Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU [0.6] 同型暗号(FHE)とゼロ知識証明(ZKP)が分散環境におけるデータセキュリティのソリューションとして出現している。
本稿では,Multi-word modular arithmetic (MoMA) の形式化を行い,大きなビット幅の整数演算を機械語上の演算に分解する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:15:44 GMT)
3DGS-to-PC: Convert a 3D Gaussian Splatting Scene into a Dense Point Cloud or Mesh [0.6] 3DGS-to-PCは、3DGSのシーンを高密度で高精度な点雲に変換することができる。
このパッケージは非常にカスタマイズ可能で、既存の3DGSパイプラインに簡単に統合できる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:52:28 GMT)
Encrypted Computation of Collision Probability for Secure Satellite Conjunction Analysis [0.5] $mathcalP_c$計算の精度と精度は、計算資源とデータ可用性の制限によってしばしば損なわれる。
提案プロトコルである Encrypted $mathcalP_c$ はモンテカルロ推定アルゴリズムと暗号解を統合する。
本研究は,$mathcalP_c$計算のためのセキュアなMPCプロトコルを開発することにより,セキュアな接続解析を推し進める。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:48:22 GMT)
Median of Means Sampling for the Keister Function [0.5] 本研究では,Kester関数積分計算における平均平均値サンプリングと比較して,平均値サンプリングの性能について検討した。
その結果, 平均値の平均値が103点以上であれば, 平均値よりも常に高い値が得られた。
この研究は、より大きいサンプルサイズで平均値の優れた性能に関する過去の理論的予測も確認した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:34:51 GMT)
Realization of a Laughlin state of two rapidly rotating fermions [0.5] 光学式ツイーザにおける2つの高速回転するフェルミオン原子のラウリン状態を実現する。
我々の研究は、回転する原子ガスにおける分数量子ホール状態の原子間結合の基礎を築いた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:00:35 GMT)
Uncertainty Guarantees on Automated Precision Weeding using Conformal Prediction [0.5] 本稿では,深層学習に基づく画像分類による精密雑草作業における共形予測について述べる。
共形予測手法の詳細なプレゼンテーションの後、このパイプラインを実世界の2つのシナリオで評価する。
以上の結果から,少なくとも90%の雑草散布が保証されていることが確認できた。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:30:10 GMT)
Non-Markovian two-time correlation functions for optomechanical systems [0.5] 空洞光学系の2時間相関関数(TTCF)について検討した。
数値シミュレーションは,(1)マルコフ政権と非マルコフ政権の長期定常状態が異なること,(2)時間依存TTCFが環境に関する情報を明らかにすること,の2つの主要な結論を支持する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:30:28 GMT)
Explainable AI for Classifying UTI Risk Groups Using a Real-World Linked EHR and Pathology Lab Dataset [0.5] 尿路感染症(UTIs)の特徴付けにリンクEHRデータセットを活用する
臨床専門知識からUTIリスク推定フレームワークを導入し,個別の患者タイムラインにまたがってUTIリスクを推定する。
リスクグループ間で臨床および人口統計学的予測値の違いが判明した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:01:14 GMT)
Dataset-Agnostic Recommender Systems [0.5] DAReSは、微調整を必要とせずに、単一のシステムがさまざまなデータセットに自律的に適応できるようにすることを目的としている。
DareSは、さまざまなアプリケーションドメインにまたがるレコメンデーションシステムを構築するための、より効率的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:01:00 GMT)
Accelerating genetic optimization of nonlinear model predictive control by learning optimal search space size [0.4] 遺伝的アルゴリズム(GA)は一般に非線形モデル予測制御の最適化問題を解決するために用いられる。
本稿では,NMPCの遺伝的最適化を最適探索空間サイズを学習することで高速化することを提案する。
提案手法はGAの計算時間を短縮し、収束率を改善して入力を制御し、安定かつ実現可能なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:53:11 GMT)
When lies are mostly truthful: automated verbal deception detection for embedded lies [0.4] 我々は2,088件の真偽と偽造文を注釈付き埋め込み嘘で収集した。
そこで本研究では,微調整言語モデル(Llama-3-8B)が真理文を分類し,埋め込み型言語が64%の精度で嘘をつくことを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:16:05 GMT)
Improving DeFi Accessibility through Efficient Liquidity Provisioning with Deep Reinforcement Learning [0.3] 本稿では,DeFiプロトコルにおける流動性提供を最適化するために,深層強化学習(DRL)を適用した。
より効率的な流動性管理を促進することで、この取り組みはDeFi市場をよりアクセスしやすくし、幅広い参加者を包括的にすることを目的としている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:27:11 GMT)
Union: A Trust-minimized Bridge for Bitcoin [0.3] 我々は、Bitcoinとセカンダリブロックチェーン間のBTCのセキュアな転送を可能にする、信頼最小化ブリッジプロトコルであるUnionを提示する。
Unionは、Bitcoin上で楽観的な証明システムBitVMXのマルチパーティ版を使用して、少なくとも1人の参加者が正直なままであるという前提の下で安全に動作するブリッジを作成している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:03:51 GMT)
How GPT learns layer by layer [0.3] 我々は,Othelloゲームプレイで訓練されたGPTベースのモデルであるOthelloGPTを,表現学習のためのテストベッドとして分析する。
我々は、スパースオートエンコーダ(SAE)と線形プローブを比較し、SAEがより頑丈で、構成的特徴に対する不整合な洞察を提供することを示した。
SAEを使ってタイル色とタイル安定性に関連する機能をデコードします。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:42:55 GMT)
Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway [0.3] S'ami言語で書かれたテキストのOCRを評価し改善する。
以上の結果から,TranskribusとTrOCRはTesseractよりも優れていることがわかった。
また、訓練済みの微調整モデルや手動アノテーションを補足することで、S'ami言語に対して正確なOCRが得られることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:07:51 GMT)
Masking Countermeasures Against Side-Channel Attacks on Quantum Computers [0.3] 本稿では、サイドチャネル攻撃に対する防御のために、量子コンピュータのトランスパイラを変更することを提案する。
我々は、IBMの量子コンピュータにこの保護を実装した例を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:14:55 GMT)
Generalizable Graph Neural Networks for Robust Power Grid Topology Control [0.2] グラフニューラルネットワーク(GNN)は、計算におけるグラフ構造を反映したMLモデルのクラスである。
GNN層のみを利用するグリッドトポロジ制御のための最初のGNNモデルを提案する。
我々は、同種および異種GNNと完全連結ニューラルネットワーク(FCNN)の両方を模倣学習タスクに基づいて訓練する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:31:36 GMT)
Digital Twin for Smart Societies: A Catalyst for Inclusive and Accessible Healthcare [0.2] デジタルツインは、都市動態のリアルタイムモニタリング、シミュレーション、最適化を可能にする。
本稿では,スマートシティの発展にともなう包括的医療を促進するデジタル双生児の可能性について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:57:15 GMT)
Detection of entanglement via moments of positive maps [0.2] 我々は,これらのモーメントに基づいて,正の地図のモーメントと基準を再検討し,絡みを検知した。
2otimes 4$システムの場合、還元マップのモーメントは束縛された絡み合った状態の族を検出することができる。
3つのキュービット系に対して、その1つのキュービットに還元写像を適用することは部分的転置演算と等価である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:09:14 GMT)
Efficient Event-based Delay Learning in Spiking Neural Networks [0.1] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わるエネルギー効率の高い代替手段として注目を集めている。
遅延を伴うSNNのための新しいイベントベーストレーニング手法を提案する。
提案手法は,現在の時間的遅延学習手法のメモリの半分以下を用いており,最大26倍高速であることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:44:34 GMT)
A monthly sub-national Harmonized Food Insecurity Dataset for comprehensive analysis and predictive modeling [0.1] 本稿では,4つの主要なデータソースを統合するオープンソースリソースであるHFID(Harmonized Food Insecurity dataset)を紹介する。
HFIDは食品安全保障の専門家や人道機関にとって重要なツールであり、食料安全保障状況を分析するための統一された資源を提供する。
科学コミュニティはまた、HFIDを利用してデータ駆動予測モデルを開発することができ、将来の食糧危機の予測と予防の能力を高めることができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:42:59 GMT)
A Secure Remote Password Protocol From The Learning With Errors Problem [0.0] 本稿では,LWE(Learning with error)問題から量子後SRPプロトコルを提案する。
提案手法の正確性と安全性に関する厳密な証明と分析を行う。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:01:50 GMT)
Zero-temperature phase-flip rate in a biased parametric oscillator [0.0] 変調周波数の半分の余剰ドライブは、状態対称性を持ち上げる効果的なバイアスを与える。
状態から「シャロウ」状態へ切り替える確率は異常に小さくなる。
結果は、非相互量子イジングシステムを実装するための道を開く。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:52:18 GMT)
VibrantVS: A high-resolution multi-task transformer for forest canopy height estimation [0.0] 本稿では,4バンド国立農業画像プログラム (NAIP) 画像を用いたキャノピー高さモデル (CHM) 推定のための視覚変換器 (ViT) モデルの適用について検討する。
我々は,このモデルの有効性を,他の3つのベンチマーク・ピアレビューモデルと比較し,エコリージョンやクラスの高さにまたがる精度と精度で比較した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:22:52 GMT)
Understanding and Benchmarking Artificial Intelligence: OpenAI's o3 Is Not AGI [0.0] OpenAIのo3は、インテリジェンスを測定するためのベンチマークであるARC-AGIで87.5%のハイスコアを達成した。
これにより,大規模言語モデル(LLM)に基づくシステム,特にo3は,人工知能(AGI)に対する知性や進歩を示すのか,という疑問が提起される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:28:01 GMT)
Transient effects in quantum refrigerators with finite environments [0.0] 3つの量子ビットからなる小さな量子冷蔵庫を探索し、それぞれが環境に接触し続ける。
過渡的な状態においては、全ての量子ビットがマルコフ環境に接続されている場合と比較して、冷たい量子ビットの温度がさらに低下することを示した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:34:30 GMT)
Topological Operations Around Exceptional Points via Shortcuts to Adiabaticity [0.0] 所望の位相演算を生成する頑健なプロトコルを開発する。
われわれの戦略は近道と断定に頼っているが、ささいな拡張ではない。
非エルミート系において,過渡運転や超断続運転のような断続的近道が適切な制御プロトコルではない理由を論じる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:26:31 GMT)
Theory of Multimode Squeezed Light Generation in Lossy Media [0.0] 損失媒体で発生する多重モード励起光の特性を記述するための統一的理論的アプローチを示す。
ガウス状態の重要なクラスについて、2階相関関数のマスター方程式を導出する。
ブロードバンドモードを導入するための様々な技術や戦略を考えることができる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:32:06 GMT)
The importance of visual modelling languages in generative software engineering [0.0] GPT-4は、単に自然言語ではなく、画像とテキストの入力を受け入れる。
私たちの知る限りでは、マルチモーダルGPTを通じてソフトウェアエンジニアリングタスクが実行される同様のユースケースを調査する研究は他にありません。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:42:09 GMT)
The exact convex roof for GHZ-W mixtures for three qubits and beyond [0.0] ブロッホ球面内のすべての状態に対して、正方根の凸屋根の正確な解を示す。
作用仮説は、最適分解はゼロ状態ロックと呼ばれることができるゼロポリトープからできるだけ多くの状態を含むというものである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:40:36 GMT)
The Spoils of Algorithmic Collusion: Profit Allocation Among Asymmetric Firms [0.0] 企業間の非対称性の影響について, 異なるオリゴポリおよびバルゲイン溶液の予測力について検討した。
消費者も企業も非対称性の恩恵を受けることができる。
以上の結果から, 対称産業が共謀に苦しむ傾向にあるという共通信念は, もはや成り立たない可能性が示唆された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:16:48 GMT)
Tensor decomposition technique for qubit encoding of maximal-fidelity Lorentzian orbitals in real-space quantum chemistry [0.0] ガウス型解からMOを多ビット状態として符号化する効率的なスキームを提案する。
提案手法は様々な量子化学系のMOを符号化する強力なツールであることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:08:20 GMT)
Synthetic Data for Portfolios: A Throw of the Dice Will Never Abolish Chance [0.0] 本稿では、特にポートフォリオやリスクマネジメントにおいて、生成モデルの限界についてより深く理解することを目的としている。
私たちは、モデル開発の分離不能な性質と、パラドックスに触れることで望ましいユースケースを強調します。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:54:15 GMT)
Synthetic Data and Health Privacy [0.0] この視点では、個人の健康データの代わりに合成データを使用することで、生成的人工知能とプライバシーの保護について論じる。
個人の健康データの代わりに合成データを使用する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:23:14 GMT)
Steering Large Language Models using Conceptors: Improving Addition-Based Activation Engineering [0.0] 本稿では,事前学習したLLMの出力を,推論時にその活性化を操作することによって制御する,アクティベーションエンジニアリングについて検討する。
本稿では,活性化ベクトルの集合を楕円体領域として表現する数学的構成法を提案する。
本実験は,複数のステアリングタスクにおいて,概念的手法が従来の手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:53:02 GMT)
State-space reduction techniques exploiting specific constraints for quantum search Application to a specific job scheduling problem [0.0] 最先端の量子探索アルゴリズムは、高密度に到達するまでこれらの元素の密度を単調に増加させることで、分布内の特定の元素の探索を可能にする。
本研究は、スケジューリング問題の特定の制約を利用して、問題サイズの関数としてほぼ2次的に増加する状態の初期重ね合わせを構築することを提案する。
量子エミュレータに関する数値的な結果は、状態空間削減アプローチの可能性を強調し、より小さく、より関連性の高い解空間に焦点をあてることで、より効率的な量子探索プロセスをもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:06:27 GMT)
State transfer in discrete-time quantum walks via projected transition matrices [0.0] 我々は、ピーク状態移動を、ユニタリ進化の下で初期状態と目標状態の間で達成できる最も高い状態移動と定義する。
グラフの様々な族上の弧反転(Grover)ウォークにおけるピーク状態伝達のスペクトル的特徴を与える。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:39:08 GMT)
Stabilization of quantum properties under intrinsic decoherence in presence of external magnetic fields [0.0] 量子状態特性の挙動は、外部磁場の存在によって変更することができる。
本研究は,本態性脱コヒーレンス下で二重井戸電位に閉じ込められた2つのスピン1-粒子をモデル系として検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:32:46 GMT)
Smells-sus: Sustainability Smells in IaC [0.0] この研究は、広く採用されているInfrastructure as Code(IaC)ツールであるTerraformに焦点を当てている。
持続可能性嗅覚を7つ定義し,19人のIaC実践者を対象に調査を行った。
最も一般的な臭いはモノリシックインフラストラクチャであり、スクリプトの9.67%に現れる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 20:24:10 GMT)
Smart Learning in the 21st Century: Advancing Constructionism Across Three Digital Epochs [0.0] 本稿では,建設主義の進化を教育の枠組みとして考察する。
それは、パーソナルコンピューティングの出現、ネットワーク化された社会、そして現在の生成AIの時代という3つの重要な時代における、その関連性と変革を辿る。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:04:06 GMT)
Simulating the Hubbard Model with Equivariant Normalizing Flows [0.0] ボルツマン分布を正確に学習するために正規化フローがうまく適用されている。
本稿では,ハバードモデルに対するボルツマン分布の学習に,フローの正規化が有効であることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:40:42 GMT)
Secure quantum bit commtiment from separable operations [0.0] 分割可能な操作のみを行うようにコミット当事者に制限を課すことで、セキュアな量子ビットコミット方式が実現可能であることを示す。
具体的には、完全に隠蔽されたビットコミットプロトコルにおいて、分割可能な操作に制限された正直なコミットパーティが、コミットを変更しようとする場合、高い確率で検出されることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:15:11 GMT)
Second quantization for classical nonlinear dynamics [0.0] トリ上の無限次元回転系を通した測度保存エルゴード流の可観測物の進化を表現するための枠組みを提案する。
バナッハ代数スペクトルである $sigma(F_w(mathcal H_tau)$ が、潜在的無限次元のトーラス族に分解されることを示す。
また、このスキームでは、有限次元トーラス上の関数を任意の大きさの$sigma(F_w(mathcal H_tau)$で再現することにより、元のシステムの可観測性を表現する手順も採用している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:36:53 GMT)
SL-YOLO: A Stronger and Lighter Drone Target Detection Model [0.0] 本稿では,小型目標検出のボトルネックを解消する革命モデルSL-YOLO(Stronger and Lighter YOLO)を提案する。
本稿では,最も難易度の高い環境においても,非並列検出精度を確保することのできる,大規模機能融合の先駆的手法を提案する。
VisDrone 2019データセットの実験結果によると,mAP@0.5が43.0%から46.9%に向上した。
モデルパラメータは 11.1M から 9.6M に減少し、FPS は 132 に到達し、資源制約のある環境でのリアルタイムの小さな物体検出に理想的な解となる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:22:25 GMT)
SCC-YOLO: An Improved Object Detector for Assisting in Brain Tumor Diagnosis [0.0] 我々は,SCConvアテンション機構をYOLOv9に統合し,新しいSCC-YOLOアーキテクチャを開発した。
SCC-YOLOは脳腫瘍検出の最先端に到達した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:10:16 GMT)
Revisiting the Bohr Model of the Atom through Brownian Motion of the Electron [0.0] 我々は、ブラウン運動による電子の挙動を記述するために力学を取り入れることで、水素原子のボーアモデルを強化する。
従来の量子力学とは対照的に、我々のモデルは単一粒子の位置の統計的平均化を行うことによってボルン則を導出する。
非常に短い時間スケールで、単一粒子位置の統計的平均化が不十分なため、波動関数に基づく単一電子確率分布が不十分であることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:08:48 GMT)
Reality of the Eigenvalues of the Hilbert-Pólya Hamiltonian [0.0] Hilbert-P'olya Conjecture に対してハミルトニアンを提案する。
我々は、変換されたハミルトニアンの固有函数が二乗可積分であること、そして決定的に、固有値が実であることを明確に示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:47:40 GMT)
RIOT-based smart metering system for privacy-preserving data aggregation using watermarking and encryption [0.0] 本研究では,可逆な透かしとAES暗号を用いたプライバシー保護型データ集約プロトコルを提案する。
プロトコルには、LSBシフト方式の可逆透かし(RLS)を使用する低周波スマートメータと、差分展開方式の可逆透かし(RDE)を使用する高周波スマートメータがある。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:58:59 GMT)
Quasi Inverse of Qubit Channels for Mixed States [0.0] キュービットチャネルの準逆をユニタリ写像として、$mathcalEi$とする。
トレース距離に基づく定義は、擬似逆入力状態から混合入力状態への容易に一般化を可能にした。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:57:42 GMT)
Quantum-like product states constructed from classical networks [0.0] 量子的なゲートが古典的なネットワーク上でどのように作用し、状態空間における量子的な操作を可能にするかを示す。
量子的なゲートが古典的なネットワーク上でどのように作用し、状態空間における量子的な操作を可能にするかを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:22:55 GMT)
Quantum signal processing without angle finding [0.0] 量子信号処理(QSP)は、量子アルゴリズムにおける統一計算として登場した。
計算集約的な角度決定ステップをバイパスする新しいQSP手法を提案する。
量子コンピューティングにおけるQSPの適用性を大幅に拡大する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:35:56 GMT)
Quantum anomalous Hall effect for metrology [0.0] 磁気トポロジカル絶縁体における量子異常ホール効果(QAHE)は、量子電気力学に革命をもたらす大きな可能性をもたらす。
主な課題は、トポロジカル絶縁体の大部分を十分に絶縁させ、抵抗量子化の堅牢性を改善することである。
本稿では,QAHEの概要を述べるとともに,トポロジカル材料の成長とキャラクタリゼーションの側面を論じるとともに,磁気ドープシステムで実現されたQAHE抵抗標準への道を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:47:26 GMT)
Quantifying non-Markovianity via local quantum Fisher information [0.0] 我々は,非マルコフ性の定量化のための新しい手法を,メトロジー的非古典的相関に着目して導入する。
このアプローチは、局所量子フィッシャー情報(LQFI)として知られる多成分量子系に対する量子相関の非調和的な尺度に基づいている。
開相関二部晶系の非マルコフ的進化は、量子状態の量子性において、それぞれ増加または減少に対応することを実証する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:31:57 GMT)
Prioritizing Risk Factors in Media Entrepreneurship on Social Networks: Hybrid Fuzzy Z-Number Approaches for Strategic Budget Allocation and Risk Management in Advertising Construction Campaigns [0.0] 複雑なオンラインメディアの普及はイデオロギー形成の過程を加速させた。
費用と効果の異なるメディアチャネルは、最適な資金配分を優先するジレンマを提示する。
マーケティングの生産性を高めるためには、すべてのチャネルに予算を分散してビジネス成果を最大化する方法を決定することが重要です。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:18:17 GMT)
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud [0.0] 我々は、ポイントクラウドデータに特化して設計された統合埋め込み予測アーキテクチャであるPoint-JEPAを紹介する。
入力空間の再構成や追加のモダリティを回避しつつ、最先端の手法による競合結果を得る。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:34:18 GMT)
Periodically poled thin-film lithium niobate ring Mach Zehnder coupling interferometer for efficient quantum frequency conversion [0.0] 本稿では,リング・Mach Zehnder干渉計と周期的に極化した薄膜窒化リチウム導波路を結合した量子周波数変換器のユニークな設計法を提案する。
提案装置は、ダイヤモンド中のSiV中心などの量子メモリからの単一光子を、ノイズ光子レート0.1Hz未満のmWポンプパワーで最大90%の変換効率を提供するテレコム波長に変換する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:12:41 GMT)
Optimally Solving Simultaneous-Move Dec-POMDPs: The Sequential Central Planning Approach [0.0] 本稿では、分散実行のためのシーケンシャルモブ集中型トレーニングという、新しい、よりスケーラブルな代替手段を提案する。
さらに、ベルマンの最適性原理の適用性を高め、3つの新しい性質を提起する。
2-および多-エージェント領域の実験は、我々の新しいアプローチの優位性を確認した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:19:48 GMT)
Non-Markovian dynamics of collectively-encoded qubits [0.0] 集団符号化された量子ビットは、制御されていない不均一な退化に悩まされる。
時間周波数位相空間における変位と解釈できることを示す。
Rydberg超原子を用いて,この機構を実験的に検討した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:32:01 GMT)
New Circuit for Quantum Adder by Constant [0.0] 古典的な$n$-bit定数を量子$n$-qubit整数モジュラーにインプレース加算するための新しい回路を提案する。
我々の回路は、$n-3$ ancilla qubitsを使用し、Tカウントは$4n-5$である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 04:52:01 GMT)
Necessary and sufficient condition for constructing a single qudit insertion/deletion code and its decoding algorithm [0.0] 単一削除誤りと単一挿入誤りの正当性は等価であることを示す。
我々は、新しい1つのqudit挿入/削除コードを構築し、その復号アルゴリズムを説明する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:59:18 GMT)
Multi-face emotion detection for effective Human-Robot Interaction [0.0] 本研究では,移動型ヒューマノイドロボットに組み込まれた顔の感情検出インタフェースを提案する。
表情認識のためのディープニューラルネットワークモデルを開発し評価した。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:12:47 GMT)
Modified Jarzynski equality in a microcanonical ensemble [0.0] 従来のジャジンスキーの等式はマイクロカノニカルアンサンブルで用意されたシステムには当てはまらないことを示す。
マイクロカノニカルな作業のゆらぎとエントロピー生産を結合する修正等式を導出する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 23:05:51 GMT)
Model-Agnostic Cosmological Inference with SDSS-IV eBOSS: Simultaneous Probing for Background and Perturbed Universe [0.0] Sloan Digital Sky Survey IV (SDSS-IV)拡張バリオン振動分光サーベイ (eBOSS) から得られたデータにインプリントされた微妙な特徴を、背景と摂動宇宙の複合プローブとして探索する。
SDSSのみを用いてバリオン音響振動(BAO)と赤方偏移(RSD)を赤方偏移の関数として再構成する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:50:54 GMT)
Lung Cancer detection using Deep Learning [0.0] コンボリューショナルニューラルネットワークス(CNN)とサポートマシン(SVM)のハイブリッドモデルを用いた肺癌検出について検討する。
この研究は、CTスキャン(Computed Tomography scan)をデータセットとしてトレーニングすることで、このハイブリッドモデルを使用する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:44:08 GMT)
Local-photon model of the momentum of light [0.0] 我々は光の運動量を空間変換のジェネレータとして量子力学で定義する。
我々は、空気からより密度の高い誘電体媒体へ遷移するフォトニック波パケットの運動量ダイナミクスを解析する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:37:02 GMT)
Lifshitz tail states in non-Hermitian disordered photonic lattices [0.0] バンドエッジ付近のアンダーソン局在は、リフシッツ尾状態の形で異常に弱い局在を示す。
リフシッツの尾状態は、ほぼ同一のオンサイトエネルギーを持つ連続した部位の集合に対応する。
アンダーソン局所化が想像上のオンサイトポテンシャルの障害によって引き起こされるとき、リフシッツ尾状態がシステムの力学を支配し、実験的に観測可能であることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 06:53:43 GMT)
Large Language Models: New Opportunities for Access to Science [0.0] KM3NeTニュートリノ検出器のオープンサイエンス環境構築における検索型Augmented Generation-enhanced chatアプリケーションの取り込みは、我々の科学に大規模言語モデルが広く適用される可能性を探究するための焦点となる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:58:27 GMT)
Knowledge Distillation and Enhanced Subdomain Adaptation Using Graph Convolutional Network for Resource-Constrained Bearing Fault Diagnosis [0.0] 複雑な教師モデルからコンパクトで効率的な学生モデルに知識を伝達する進歩的知識蒸留フレームワークを提案する。
再生ケルネルヒルベルト空間(RKHS)における平均および分散統計を利用してラベル間の事前確率分布を組み込むELMMSD(Enhanced Local Maximum Mean Squared Discrepancy)を導入する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:05:47 GMT)
Interpretable machine-learning for predicting molecular weight of PLA based on artificial bee colony optimization algorithm and adaptive neurofuzzy inference system [0.0] 本稿では,Artificial Bee Colony (ABC)アルゴリズムとArtificial Neural Networks (ANN)とAdaptive Network-based Fuzzy Inference System (ANFIS)の2つの教師付き学習手法の統合について論じる。
ABCアルゴリズムの目的は、実験的なPLA分子量と予測されたPLA分子量の2乗誤差(RMSE)を最小限に抑えることである。
その結果,ABC-ANFISを用いた場合,最低RMSEは282Daとなり,予測には4つの重要なパラメータが同定された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:55:04 GMT)
Information Scrambling with Higher-Form Fields [0.0] ゲージ場に対する$U(1)$保存電流を含むOTOCは、遅くとも拡散的に変化する。
後期のOTOCは、$U(1)$の電荷保存を持つ高次場の普遍的な特徴であると思われる、電力法則の尾を持つ。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:06:19 GMT)
Improving the Performance of Echo State Networks Through State Feedback [0.0] 非線形力学系を用いた貯留層計算は、ニューラルネットワークに代わる費用対効果を提供する。
ESNの潜在的な欠点は、固定された貯水池が特定の問題に必要な複雑さを提供していないことである。
本稿では, 貯留状態の一部の成分を入力を介してネットワークにフィードバックすることにより, 所定のESNの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:21:03 GMT)
Improved Regret Bounds for Online Fair Division with Bandit Learning [0.0] アイテムの種類が有限であればオンラインフェアディビジョンを学習し、そのアイテムのプレイヤー値は未知の方法で分布からランダムに描画される。
この設定では、分割不可能なアイテムの列がランダムなオンラインプロセスに従って到着し、各アイテムは1人のプレイヤーに割り当てられなければならない。
高い確率で比例制約満足度を保証し、$tildeO(sqrtT)$ regretを達成できることが示される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:48:58 GMT)
Hybrid Scheme of Post-Quantum Cryptography and Elliptic-Curve Cryptography for Certificates -- A Case Study of Security Credential Management System in Vehicle-to-Everything Communications [0.0] 本研究では,V2X通信における課題を克服するために,PQCとECCのハイブリッド認証方式を提案する。
PQCは量子コンピューティング攻撃に耐性のあるセキュリティレベルを確立するために使用され、ECCは匿名証明書を確立するために使用される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:59:59 GMT)
High-dimensional entanglement witnessed by correlations in arbitrary bases [0.0] 量子技術の発展において、認証の絡み合いは重要なステップである。
特に、相互バイアスのないベース(MUB)は、よく理解され、常に絡み合った認証のために使用されるパラダイム的な例である。
ここでは、MUBの相関関係から任意のベースへの絡み込み認証ツールボックスを拡張する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:00:00 GMT)
Guided SAM: Label-Efficient Part Segmentation [0.0] オブジェクト部品の正確な位置決めは、オブジェクト認識やロボット操作といったタスクに不可欠である。
最近のパートセグメンテーション手法は、広範なトレーニングデータと労働集約アノテーションを必要とする。
本稿では,Segment-Anything Model (SAM) を関連オブジェクトへ誘導する新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:02:33 GMT)
Global Search for Optimal Low Thrust Spacecraft Trajectories using Diffusion Models and the Indirect Method [0.0] 長周期の低推力非線形最適宇宙船軌道グローバルサーチは、計算的かつ時間的に高価な問題である。
生成機械学習モデルは、条件パラメータに関して、ソリューション構造がどのように変化するかを学ぶために訓練することができる。
最先端拡散モデルは、グローバル検索フレームワーク内での軌道最適化のための間接的アプローチと統合される。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 01:49:17 GMT)
Glitch in Time: Exploiting Temporal Misalignment of IMU For Eavesdropping [0.0] 慣性測定ユニット(IMU)は、音響盗聴攻撃に対して脆弱である。
Googleは、IMUへの許可なしアクセスに対して200Hzのレート制限を課し、このようなサイドチャネル攻撃を中和することを目指している。
本研究は,これらの保護を回避する新たなエクスプロイトであるSTAGを紹介する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:58:25 GMT)
Generating Poisoning Attacks against Ridge Regression Models with Categorical Features [0.0] 機械学習(ML)モデルは、大規模なデータセットから情報を抽出する非常に強力なツールになっている。
MLモデルは外部からの攻撃に弱いため、期待するタスクを過小評価したり、逸脱させたりすることができる。
本稿では,区分的特徴を明示する数値的カテゴリー的特徴の両方を含むリッジ回帰モデルに対する強力な攻撃を生成することを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:40:52 GMT)
FusionSORT: Fusion Methods for Online Multi-object Visual Tracking [0.0] 複数物体の視覚的追跡において,検出をトラックレットに関連付けるための4つの異なる融合法を検討する。
これらの融合法には、IoUに基づく最小重み付け和、カルマンフィルタ(KF)ゲーティング、ハダマードのコスト積が含まれる。
我々はMOT17、MOT20、DanceTrackデータセットの検証セットについて広範な評価を行う。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:48:06 GMT)
Functional Consistency across Retail Central Bank Digital Currency and Commercial Bank Money [0.0] 小売CBDCの採用は、決済市場と小売預金の両方を断片化するリスクがある。
我々は、規制された小売デジタルマネーのあらゆる形態における機能的整合性を達成するために必要な共通の運用特性を同定する。
デジタルポンドと商業銀行マネーにまたがって機能的整合性を提供するような単一の設計オプションは存在しないと結論付けている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:03:30 GMT)
Floquet-engineered system-reservoir interaction in the transverse field Ising model [0.0] スピン波の1次元における制御伝搬に対するFloquet-Engineered transverse field Isingモデルについて報告する。
我々のスキームは、システム-貯留層相互作用のためのカップリング・デカップリング・スキーム、および量子ネットワークにおけるルーティングに応用できるかもしれない。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:58:34 GMT)
Finding eigenvectors with a quantum variational algorithm [0.0] 本稿では、既知の量子回路を持つユニタリ行列のランダム固有ベクトルを求めるハイブリッド変分量子アルゴリズムを提案する。
このアルゴリズムは、パラメタライズド量子回路によって生成される試行状態に関するSWAPテストに基づいている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 18:10:53 GMT)
Faster quantum chemistry simulations on a quantum computer with improved tensor factorization and active volume compilation [0.0] 分子系の電子構造計算におけるいくつかの進歩を紹介する。
これらの進歩の1つは、ブロックイン対称性シフトハイパーコントラクション(BLISS-THC)のための新しいフレームワークである。
本稿では,計算に挑戦するベンチマーク分子P450に焦点をあてて,提案手法のベンチマークを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:57:06 GMT)
Extracting Participation in Collective Action from Social Media [0.0] 本稿では,ソーシャルメディア投稿から集団行動に参加することの表現を識別する新しいテキスト分類器について紹介する。
我々の分類は、参加を捉え、それを4つのレベルに分類する: 集団的問題を認識し、行動の呼び出しに関わり、行動の意図を表現し、活動的な関与を報告する。
以上の結果から,より小さな言語モデルでは,参加者の表現を確実に検出でき,より大規模なモデルと競合する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:36:41 GMT)
Extracting Manifold Information from Point Clouds [0.0] カーネルベースの手法は$mathbbRd$のサブセットのシグネチャ関数を構成するために提案される。
点雲の解析と解析が主な応用である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:20:02 GMT)
Exposing a Fatal Flaw in Sample-based Quantum Diagonalization Methods [0.0] そこで本研究では,QSCI手法が実用性を著しく損なうような基本的な制約に直面していることを示す。
QSCIは原則として、高品質なCI拡張を実現することができるが、新しい決定因子を見つけるのに非効率に苦しむことを実証する。
このことは、QSCIがより効率的な古典的応用に遅れるにつれて、量子化学応用における実用性を妨げている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:30:43 GMT)
Exploring the encoding of linguistic representations in the Fully-Connected Layer of generative CNNs for Speech [0.0] 本研究は,音声合成のためのCNNの完全連結層が言語関連情報をエンコードする方法を初めて明らかにした。
本研究は,CNN(ciwGAN)における語彙的特異な潜伏符号が,FC層重みの語彙的不変な部分語彙表現を共有していることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:24:52 GMT)
Exploring energy minimization to model strain localization as a strong discontinuity using Physics Informed Neural Networks [0.0] 弾塑性固体における(規則化された)強い不連続キネマティクスについて考察する。
ニューラルネットワーク(ANN)を用いて,対応する数学的モデルを識別する
1次元および2次元の数値例を通して、エネルギー最小化による弾塑性固体のひずみ局在の計算モデルが実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:32:28 GMT)
Explore the Use of Time Series Foundation Model for Car-Following Behavior Analysis [0.0] 自動車追従行動のモデル化は、交通シミュレーション、運転パターンの分析、複雑な交通の流れの理解に不可欠である。
機械学習とディープラーニングは複雑なパターンをキャプチャするが、大きなラベル付きデータセットが必要である。
ファンデーションモデルは、膨大な多様な時系列データセットに基づいて事前訓練された、より効率的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:13:32 GMT)
Exact density profile in a tight-binding chain with dephasing noise [0.0] 無限区間の雑音を呈する強結合鎖の多体力学を理論的に検討する。
領域壁の平均粒子密度プロファイルの正確な解と,その交互初期条件を得る。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:05:08 GMT)
Eradicating Social Biases in Sentiment Analysis using Semantic Blinding and Semantic Propagation Graph Neural Networks [0.0] SProp GNNは、テキスト中の感情を予測するために、構文構造と単語レベルの感情的手がかりにのみ依存している。
特定の単語に関する情報にモデルを意味的に盲目にすることで、政治的またはジェンダー的バイアスのような社会的バイアスに対して堅牢である。
SProp GNNは、2つの異なる予測タスクと2つの言語でのレキシコンベースの代替よりもパフォーマンスが優れていることを示している。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:21:21 GMT)
Equivalence between exponential concentration in quantum machine learning kernels and barren plateaus in variational algorithms [0.0] 本研究では,変分量子アルゴリズムにおけるバレンプラトー(BP)間の厳密な接続と,機械学習のための量子カーネルの指数集中を定式化する。
この結果から,BPフリーな量子回路を構築するための提案手法が,機械学習に有用な量子カーネルの構築に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:01:26 GMT)
Enhancing Talent Employment Insights Through Feature Extraction with LLM Finetuning [0.0] 遠隔作業の可利用性、報酬構造、教育要件、作業経験の好みなどの変数を識別する堅牢なパイプラインを開発する。
本手法は,従来の解析ツールの限界を克服するために,意味的チャンキング,検索拡張生成(RAG),微調整DistilBERTモデルを組み合わせる。
細調整されたモデルの包括的評価を行い、その強度、限界、スケーリングの可能性について分析する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:49:49 GMT)
Encoded probabilistic imaginary-time evolution on a trapped-ion quantum computer for ground and excited states of spin qubits [0.0] 量子コンピュータを用いて、ダイヤモンドと窒化アルミニウムのスピン欠陥に対する低エネルギー有効ハミルトニアンを解く。
スピン一重項状態は密度汎関数理論(DFT)を用いて計算することは困難であり、これは複数のスレーター行列式によって記述されるべきである。
これは、符号化されたPITE回路が捕捉されたイオン量子コンピュータ上で実行される最初の例である。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 10:49:57 GMT)
Emergent effects of scaling on the functional hierarchies within large language models [0.0] 小型モデルによる解析(Llama-3.2-3b; 28層)
アイテムレベルのセマンティクスは、最も早く強く表される(層2-7)、次に2-item関係(層8-12)、続いて4-item類似(層10-15)
深いレイヤは、意味のある抽象化なしで、コンテキストウィンドウの初期部分から情報を圧縮する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:27:39 GMT)
Eigenstate Thermalization Hypothesis: A Short Review [0.0] 本稿では、量子平衡と固有状態熱化仮説(ETH)の基本的な概念を、物理学界の幅広い聴衆に提示する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:50:08 GMT)
Efficient discrimination between real and complex quantum theories [0.0] ベル型パラメータ上の複素-実有界のより大きい比で実数に基づく量子論の不合理性を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:57:36 GMT)
ESURF: Simple and Effective EDU Segmentation [0.0] 語彙と文字n-gramの特徴に基づいてEDU境界を同定し,それらを分割する手法を提案する。
本手法は, 単純性に拘わらず, セグメンテーションや技術談話の状態において, 他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:18:52 GMT)
Dynamics in an emergent quantum-like state space generated by a nonlinear classical network [0.0] この作業は、グラフが古典的なシステムと私たちが量子ライク(QL)と呼ぶ状態空間を接続するのに役立つフレームワークを活用する。
グラフを介してQL状態空間にマップする,大規模でダイナミックな古典システムの具体例について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:17:53 GMT)
Device-Bound vs. Synced Credentials: A Comparative Evaluation of Passkey Authentication [0.0] パスキーを使用することで、FIDO Allianceは、パスキープロバイダを介して、ユーザのデバイス間でFIDO2認証情報を同期する機能を導入している。
これは、デバイスを失うことに対するユーザの懸念を緩和し、パスワードレス認証への移行を促進することを目的としている。
クレデンシャルシンクリングが,セキュリティ保証に関する専門家の間でも議論を巻き起こしていることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:00:18 GMT)
Depth and Image Fusion for Road Obstacle Detection Using Stereo Camera [0.0] 本稿では,道路上の物体の検知に2つの手法を組み合わせて行う。
道路上の物体の出現時期や大きさや形状が事前に分かっていないため,ML/DLベースのアプローチは適用できない。
この問題を解決するために、RGB法で小さなコントラストオブジェクトの探索を補完する深度と画像の融合法を開発し、SLICスーパーピクセルセグメンテーションを用いたステレオ画像ベースアプローチで障害物検出を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:54:26 GMT)
DID Link: Authentication in TLS with Decentralized Identifiers and Verifiable Credentials [0.0] 本稿では,TLS 1.3の新しい認証方式であるDID Linkについて述べる。
これはTLS準拠の方法で、台帳入りのDIDを備えた自己発行のX.509証明書を認証する権限を与える。
原型実装では、検証材料がキャッシュされている場合、DID LinkのTLSハンドシェイク期間と、台帳から取得された場合、合理的な長期化を示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:33:25 GMT)
Constructing and explaining machine learning models for chemistry: example of the exploration and design of boron-based Lewis acids [0.0] 我々は、説明可能なAI技術を活用して、ホウ素系ルイス酸の合理的設計を探求する。
ルイス酸は電子受容性のために有機反応において重要な役割を果たす。
化学空間を適切に定義された分子足場に限定することにより,高精度な予測が可能となった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 14:51:24 GMT)
Classifying two-body Hamiltonians for Quantum Darwinism [0.0] 有限次元自由度の任意の集まりから形成される環境と相互作用する任意の有限次元系の一般的なモデルを考える。
そのようなモデルは、ハミルトニアンに入る系に作用する作用素の集合が、可観測点と互いに可観測点との可換関係の集合を満たす場合、量子ダーウィン主義をサポートすることを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:00:30 GMT)
Chemical potential and variable number of particles control the quantum state: Quantum oscillators as a showcase [0.0] 様々な粒子の性質が系のエネルギーに必須条件をもたらすことを示す。
特に化学ポテンシャルは、系のスペクトルと対応する量子状態を外部に操作できる制御パラメータの役割を担っている。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 17:12:11 GMT)
Charge transport limited by nonlocal electron-phonon interaction. II. Numerically exact quantum dynamics in the slow-phonon regime [0.0] 断熱限界付近の1次元ピエルスモデルにおけるキャリア輸送について検討した。
過渡的局所化シナリオ (TLS) はHEOM力学を高温および強い相互作用において非常によく近似する。
この適度な状態における我々の発見はTLSの限界を示し、最も先進的な量子古典シミュレーションの結果を支持する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:33:57 GMT)
Charge transport limited by nonlocal electron-phonon interaction. I. Hierarchical equations of motion approach [0.0] 相関関数は階層的な運動方程式から得ることができることを示す。
一次元ピエルスモデルにおけるキャリアの数値的正確な運動量を計算する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:33:53 GMT)
Characterization of Entanglement in Higher Dimensional Bipartite as well as Multipartite Quantum System and its Application [0.0] 両分節および三分節の絡み合いの特性について検討した。
陰性部分転位(NPT)の検出に成功するいくつかの分離性基準を確立した。
本稿では,これらの絡み検出基準を実験的に実現するための理論的アイデアを提案する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:48:35 GMT)
Characterisation of Open Quantum System Dynamics based on Information Back-flow [0.0] 単位力学では、一般化されたトレース距離測度は、非マルコビアン性(英語版)を目撃するトレース距離測度に勝らないことを示す。
ここでは、標準トレース距離測度が不十分であり、一般化された測度が必要な非単位チャネルのクラスを決定する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:41:25 GMT)
Can QBism exist without Q? Morphophoric measurements in generalised probabilistic theories [0.0] 形態素測定に基づく理論は、量子力学の基礎となるQBのアプローチの主な特徴を保っていることを示す。
特に、SIC-POVM向けに設計されたQBismの原始方程式('Urgleichung')を、GPTのモルフォリックなケースにどのように拡張するかを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 11:18:12 GMT)
Bridging Smart Meter Gaps: A Benchmark of Statistical, Machine Learning and Time Series Foundation Models for Data Imputation [0.0] スマートグリッドにおける時系列データのギャップは、バイアス消費の分析や信頼性の高い予測を妨げる可能性がある。
生成人工知能(Generative Artificial Intelligence)は、従来の統計手法よりも優れた、有望なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 12:41:27 GMT)
Bipartite polygon models: entanglement classes and their nonlocal behaviour [0.0] 我々は、qubit状態空間を含む幅広い操作理論のクラスにおけるハーディの非局所的挙動について検討する。
この結果から, 明示的な操作モデルに関連付けられるような, ほとんど量子相関の探索されていないクラスが明らかになった。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:58:39 GMT)
Beyond the semiclassical approximation in atom interferometry [0.0] 弱無調波トラップにおける原子干渉計の位相シフトを評価するための量子摂動的アプローチについて述べる。
半古典的近似の形式は、アンハーモニック摂動において一階に有効であることが判明した。
位置座標におけるパワー3から6の1次元摂動の解析結果を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:43:29 GMT)
Beyond the Power Law: Estimation, Goodness-of-Fit, and a Semiparametric Extension in Complex Networks [0.0] ベイズ推定法を導入し,従来の手法よりも精度の高い推定値を求める。
また,Kolmogorov-Smirnov 試験の有効性を向上させるため,新しい適合性試験の評価を行った。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 03:08:53 GMT)
Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning [0.0] この研究は、量子ドット計測の分析に説明可能な機械学習技術を適用する可能性と利点を実証する。
自動化された透明な量子ドットデバイスチューニングのさらなる進歩の道を開く。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:21:58 GMT)
Are queries and keys always relevant? A case study on Transformer wave functions [0.0] ドット製品アテンションメカニズム(ドット製品アテンションメカニズム)は、元々自然言語処理タスク用に設計されたもので、現代のトランスフォーマーの基盤となっている。
本稿では,変分波動関数のパラメトリゼーションの特定の領域において,トランスフォーマーの適応性について検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:23:47 GMT)
An Investigation into Seasonal Variations in Energy Forecasting for Student Residences [0.0] LSTMやGRUなどのベースラインモデルの性能を,最先端の予測手法とともに評価する。
この結果から、どのモデルも全てのシーズンで他のモデルより一貫して優れていないことが判明した。
The proposed Hyper Network based LSTM and MiniAutoEncXGBoost models exhibit strong adaptability to seasonal variation。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:43:22 GMT)
AdaPRL: Adaptive Pairwise Regression Learning with Uncertainty Estimation for Universal Regression Tasks [0.0] 回帰学習のための適応型ペアワイズ学習フレームワーク(AdaPRL)を提案する。
AdaPRLはデータポイント間の相対的な差異を活用し、予測の不確実性を定量化するために深い確率モデルと統合する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 07:49:28 GMT)
AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India [0.0] 糖尿病網膜症(DR:diabetic retinopathy)は、特にインドでは、農村部では網膜専門医へのアクセスが制限されている主要な視覚障害の原因である。
本研究の目的は, DR検出および有病率評価のための人工知能を用いた糖尿病網膜症スクリーニングシステムを評価することである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 08:56:05 GMT)
A simple model for entangled photon generation in resonant structures [0.0] 共振構造における自発的なダウンコンバージョンを記述するモデルを提案する。
光子対を生成するのに必要な計算を単純化することにより、我々のモデルは複雑な共振構造を設計しやすくすることを約束する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 15:18:31 GMT)
A method for estimating roadway billboard salience [0.0] 本研究は,運転者の視点から撮影した画像における道路広告の重要性を考察する。
道路沿いの広告を検出するニューラルネットワークの有効性を評価し、YOLOv5とFaster R-CNNモデルに焦点を当てる。
本研究は,都市高速道路走行中に捉えた視線追跡セッションのデータベースを構築し,サリエンシモデルを評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 13:56:31 GMT)
A cohomology-based Gromov-Hausdorff metric approach for quantifying molecular similarity [0.0] 本研究では,コホモロジーに基づくGromov-Hausdorff法を導入して,1次元および高次元(コホモロジー群)の解析を行う。
幾何学的情報を取り入れることで,従来の持続的ホモロジー手法と比較して深い洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 09:50:51 GMT)
A Step Toward Interpretability: Smearing the Likelihood [0.0] 本稿では,機械が活用する物理的エネルギースケールの分離と同定のための定義とそれに対応する実用的な方法を提案する。
我々は、(近似)スケーリング法則が極端な値理論の結果であることを示す。
例えば、クォークとグルーオンジェットの識別について検討し、スミアーズの可能性を構築し、分解能が低下するにつれて識別力が着実に増加することを示す。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 19:09:42 GMT)
A Review on the Security Vulnerabilities of the IoMT against Malware Attacks and DDoS [0.0] インターネット・オブ・メディカル・モノ(IoMT)は、医療機器を接続して患者の治療結果を監視することで医療産業を変革した。
本報告では,IoMT機器の脆弱性を概観し,重大な脅威に着目し,緩和策を検討する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 21:29:06 GMT)
A Review of Detection, Evolution, and Data Reconstruction Strategies for False Data Injection Attacks in Power Cyber-Physical Systems [0.0] 現代の電力網における情報システムと物理システムの統合は、偽データインジェクション攻撃(FDIA)の脆弱性を高めた
本稿では、FDIA検出、進化、データ再構成戦略を概観し、ドメイン間の協調、多時期的進化、ステルス特性について述べる。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 22:28:04 GMT)
A Proposed Large Language Model-Based Smart Search for Archive System [0.0] 本研究では,デジタルアーカイブシステムにおけるスマート検索のための新しいフレームワークを提案する。
Retrieval-Augmented Generation (RAG) アプローチを用いることで、自然言語クエリの処理を可能にする。
本稿では,システムのアーキテクチャと実装について述べるとともに,その性能を4つの実験で評価する。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 02:53:07 GMT)
A Novel Approach to Network Traffic Analysis: the HERA tool [0.0] サイバーセキュリティの脅威は、堅牢なネットワーク侵入検知システムの必要性を浮き彫りにする。
これらのシステムは、パターンを検出し、脅威を予測する機械学習モデルをトレーニングするためのデータセットに大きく依存している。
HERAは、フローファイルとラベル付きまたは未ラベルのデータセットをユーザ定義の機能で生成する、新たなオープンソースツールである。
論文参考訳(メタデータ) (Mon, 13 Jan 2025 16:47:52 GMT)