Altogether: Image Captioning via Re-aligning Alt-text [118.3] 画像に関連付けられた既存のalt-textを編集・修正する鍵となるアイデアに基づいて、Altogetherの原理的なアプローチについて検討する。
トレーニングデータを生成するために、アノテータは既存のalt-textから始まり、それを複数のラウンドで画像コンテンツにアライメントする。
我々は、このデータに基づいて、大規模にアルトテキストを再調整するプロセスを一般化するキャプタを訓練する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:46:27 GMT)
A Greedy Strategy for Graph Cut [95.3] GGCと呼ばれるグラフカットの問題を解決するための欲求戦略を提案する。
これは、各データサンプルがクラスタと見なされる状態から始まり、2つのクラスタを動的にマージする。
GGCはサンプル数に関してほぼ線形な計算複雑性を持つ。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:49:42 GMT)
Towards Visual Grounding: A Survey [87.4] 2021年以降、視覚的な接地は大幅に進歩し、接地事前訓練のような新しい概念が生まれている。
この調査は、初心者と経験豊富な研究者の両方に適しているように設計されており、重要な概念を理解し、最新の研究成果を追跡するための貴重な情報源となっている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:34:35 GMT)
Demystifying CLIP Data [86.3] Contrastive Language-Image Pre-Training (CLIP) はコンピュータビジョンの先進的な研究と応用を行っている。
メタデータ変換言語画像事前学習(MetaCLIP)について紹介する。
MetaCLIPは生のデータプールとメタデータ(CLIPの概念から派生したもの)を取り、メタデータの分布に対してバランスの取れたサブセットを生成する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:50:04 GMT)
AdaDiff: Adaptive Step Selection for Fast Diffusion Models [82.8] 我々は、インスタンス固有のステップ利用ポリシーを学ぶために設計された軽量フレームワークであるAdaDiffを紹介します。
AdaDiffはポリシーメソッドを使用して最適化され、慎重に設計された報酬関数を最大化する。
我々は3つの画像生成と2つのビデオ生成ベンチマークの実験を行い、本手法がベースラインと同じような視覚的品質を実現することを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:23:34 GMT)
UniRestorer: Universal Image Restoration via Adaptively Estimating Image Degradation at Proper Granularity [79.9] We present our UniRestorer with improve restoration performance。
具体的には、劣化空間上で階層的クラスタリングを行い、マルチグラニュラリティ・ミックス・オブ・エキスパート(MoE)復元モデルを訓練する。
UniRestorerは、既存の劣化診断法と -aware 法とは対照的に、劣化推定を利用して劣化特定回復の恩恵を受けることができる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:09:08 GMT)
ChatGarment: Garment Estimation, Generation and Editing via Large Language Models [79.5] ChatGarmentは、大規模な視覚言語モデル(VLM)を活用して、3D衣服の見積もり、生成、編集を自動化する新しいアプローチである。
ウィジェット内の画像やスケッチから縫製パターンを推定し、テキスト記述から生成し、ユーザー指示に基づいて衣服を編集することができる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:24:34 GMT)
B-AVIBench: Towards Evaluating the Robustness of Large Vision-Language Model on Black-box Adversarial Visual-Instructions [74.0] LVLM(Large Vision-Language Models)は、ユーザからの視覚的指示に応答する上で、大きな進歩を見せている。
画像とテキストを含むこれらの命令は、意図的および意図しない攻撃の両方に影響を受けやすい。
B-AVIBenchは,様々なブラックボックス・アドミラル・ビジュアル・インストラクションに直面する場合のLVLMのロバスト性を解析するためのフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:32:00 GMT)
ConsistentID: Portrait Generation with Multimodal Fine-Grained Identity Preserving [64.9] ConsistentIDは、微細なマルチモーダル顔のプロンプト下での多彩な画像生成のための革新的な手法である。
我々は、50万以上の顔画像を持つ、きめ細かいポートレートデータセットFGIDを提示し、既存の顔データセットよりも多様性と包括性を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:42:44 GMT)
AdvAnchor: Enhancing Diffusion Model Unlearning with Adversarial Anchors [61.0] セキュリティ上の懸念から、研究者たちは微調整によって不適切な概念を学ばざるを得なくなった。
最近の微調整手法は、望ましくない概念を排除し、他の概念を保存することの間のかなりの性能のトレードオフを示す。
本稿では,貿易問題を軽減するために,敵対的アンカーを生成する新しいアプローチであるAdvAnchorを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:44:07 GMT)
DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.7] Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:13:44 GMT)
Generate to Discriminate: Expert Routing for Continual Learning [59.7] Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。
我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:42:02 GMT)
LLM-Virus: Evolutionary Jailbreak Attack on Large Language Models [59.3] 既存のジェイルブレイク攻撃は主に不透明な最適化手法と勾配探索法に基づいている。
進化的ジェイルブレイクと呼ばれる進化的アルゴリズムに基づくジェイルブレイク攻撃手法であるLSM-Virusを提案する。
この結果から, LLM-Virus は既存の攻撃手法と比較して, 競争力や性能に優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:48:57 GMT)
VersaGen: Unleashing Versatile Visual Control for Text-to-Image Synthesis [59.1] 本稿では,テキスト・トゥ・イメージ(T2I)合成における多目的視覚制御を可能にする生成AIエージェントVersaGenを提案する。
我々は,凍結したT2Iモデルに適応器を訓練し,テキスト支配拡散プロセスに視覚情報を適応させる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:59:45 GMT)
Can Watermarked LLMs be Identified by Users via Crafted Prompts? [55.5] この研究は、透かし付き大言語モデル(LLM)の非受容性を初めて研究したものである。
我々は、よく設計されたプロンプトを通して透かしを検出する、Water-Probeと呼ばれる識別アルゴリズムを設計する。
実験の結果、ほとんどの主流の透かしアルゴリズムは、よく設計されたプロンプトと容易に識別できることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:39:59 GMT)
Lower bounds on transformers with infinite precision [55.4] 一層ソフトマックス変圧器に対する第1下界を無限精度で証明する。
我々は、Peng, Narayanan, Papadimitriouが考える関数合成と、Sanford, Hsu, Telgarskyが考えるSUM$$タスクの2つのタスクに対してそうする。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:09:25 GMT)
MAKIMA: Tuning-free Multi-Attribute Open-domain Video Editing via Mask-Guided Attention Modulation [55.1] 拡散ベースのテキスト・トゥ・イメージ(T2I)モデルは,グローバルビデオ編集タスクにおいて顕著な結果を示した。
我々は、オープンドメインビデオ編集のための事前訓練されたT2Iモデル上に構築された、チューニング不要なMAEフレームワークであるMAKIMAを紹介する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:36:51 GMT)
Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.1] 基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:51:14 GMT)
VELoRA: A Low-Rank Adaptation Approach for Efficient RGB-Event based Recognition [54.3] 本稿では,RGBイベントに基づく分類のために,事前学習した基盤視覚モデルに適応するための新しいPEFT戦略を提案する。
また、2重モードのフレーム差は、フレーム差バックボーンネットワークを介してモーションキューをキャプチャすると考えられている。
ソースコードと事前トレーニングされたモデルはurlhttps://github.com/Event-AHU/VELoRAでリリースされる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:38:23 GMT)
Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents [53.8] 大規模言語モデル(LLM)は、様々な言語関連タスクにまたがる顕著なゼロショットの一般化を実証している。
本稿では、情報検索(IR)における関連性ランキングのためのジェネレーティブLLMについて検討する。
LLMのデータ汚染に関する懸念に対処するため,我々はNovereEvalという新しいテストセットを収集した。
実世界のアプリケーションの効率を向上させるため、ChatGPTのランキング能力を小さな特殊モデルに蒸留する可能性を探る。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:20:54 GMT)
Extract Information from Hybrid Long Documents Leveraging LLMs: A Framework and Dataset [52.3] 大規模言語モデル(LLM)は、テキストと表のデータを含むハイブリッドテキストを理解し解析することができる。
本研究では,LLMがHLD(Hybrid Long Document)を処理できるようにするための自動情報抽出フレームワーク(AIE)を提案し,HLDからの情報抽出の4つの重要な側面を分析する実験を行った。
HLDにおけるデータセット不足の問題に対処し、今後の作業を支援するために、金融レポート数値抽出(FINE)データセットを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:54:14 GMT)
DFME: A New Benchmark for Dynamic Facial Micro-expression Recognition [51.3] マイクロ・エクスプレッション(ME)は、人間の真の感情を明らかにする、自然に、微妙で、過渡的な表情である。
MEデータ不足は、先進的なデータ駆動型MERモデルの開発を著しく妨げている。
本稿では,動的自発的なMEデータベースを収集・注釈することで,MEデータ不足を克服する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:22:26 GMT)
Equation discovery framework EPDE: Towards a better equation discovery [50.8] 進化的最適化に基づく発見フレームワークであるEPDEアルゴリズムを強化する。
提案手法は基本関数や個人差分といった基本構造ブロックを用いて用語を生成する。
我々は,提案アルゴリズムの耐雑音性および全体的な性能を,最先端の方程式探索フレームワークであるSINDyの結果と比較することによって検証する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:58:44 GMT)
A Contrastive Pretrain Model with Prompt Tuning for Multi-center Medication Recommendation [50.4] マルチセンター医薬品推奨のためのTEMPT(Prompt Tuning)を用いた新しいconTrastive prEtrain Modelを提案する。
そこで我々は,一般的なファインタニングを採用するのではなく,各病院の特定情報をキャプチャするための新しいプロンプトチューニング手法を考案した。
提案モデルを検証するため,公立のeICU多施設医療データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:12:02 GMT)
Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.2] RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:04:01 GMT)
STNMamba: Mamba-based Spatial-Temporal Normality Learning for Video Anomaly Detection [49.0] ビデオ異常検出(VAD)は、インテリジェントなビデオシステムの可能性から広く研究されている。
CNNやトランスフォーマーをベースとした既存の手法の多くは、依然としてかなりの計算負荷に悩まされている。
空間的時間的正規性の学習を促進するために,STNMambaという軽量で効果的なネットワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:49:23 GMT)
Distilled Transformers with Locally Enhanced Global Representations for Face Forgery Detection [48.3] 顔画像の正当性を検出するために,顔偽造検出(FFD)を行う。
本研究では, ローカルおよびグローバルな偽物の両方を抽出する蒸留トランス (DTN) ネットワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:00:27 GMT)
Learning in Multiple Spaces: Few-Shot Network Attack Detection with Metric-Fused Prototypical Networks [47.2] 本稿では,数発の攻撃検出に適した新しいマルチスペースプロトタイプ学習フレームワークを提案する。
Polyakの平均的なプロトタイプ生成を活用することで、このフレームワークは学習プロセスを安定化し、稀でゼロデイの攻撃に効果的に適応する。
ベンチマークデータセットによる実験結果から、MSPLは、目立たない、新しい攻撃タイプを検出する従来のアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 00:09:46 GMT)
No Preference Left Behind: Group Distributional Preference Optimization [47.0] Group Distribution Preference Optimization (GDPO) は、言語モデルをグループ内の好みの分布と整合させる新しいフレームワークである。
GDPOは、グループの信念分布の統計的推定を用いて言語モデルを校正する。
GDPOはトレーニング中にこのアライメントギャップを一貫して削減します。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 23:30:47 GMT)
Invariant debiasing learning for recommendation via biased imputation [46.7] 不変情報と変量情報の両方からユーザの偏りのない嗜好を自動的に学習する,新しい軽量知識蒸留フレームワーク(KDDebias)を提案する。
提案手法は,推薦システムにおけるSOTA非教師付きバイアスモデルと比較して,50%未満の学習パラメータで大幅な改善を実現する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:57:02 GMT)
Time Series Forecasting with LLMs: Understanding and Enhancing Model Capabilities [46.0] 大規模言語モデル(LLM)は多くの分野に適用され、近年急速に発展してきた。
近年の研究では、大規模な言語モデルを、さらなる微調整を行なわずに、アンフェロショット時系列推論として扱っている。
本研究は,LLMが周期性に欠けるデータセットにおいて,明確なパターンや傾向を持つ時系列予測において良好に機能することを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:31:51 GMT)
No-regret learning in harmonic games: Extrapolation in the face of conflicting interests [45.9] 学習は任意の初期状態からナッシュ均衡に収束し、すべてのプレイヤーは、ほとんどのO(1)後悔において保証される。
結果は、ハーモニックゲームにおける非回帰学習の深い理解を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:28:13 GMT)
AuctionNet: A Novel Benchmark for Decision-Making in Large-Scale Games [45.0] AuctionNetは、大規模な広告オークションにおける入札決定のためのベンチマークである。
この環境は、現実世界の広告オークションの完全性と複雑さを効果的に再現する。
このデータセットには、1000万件の広告機会、48の多様な自動入札エージェント、そして5億件以上のオークション記録が含まれている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:30:51 GMT)
"My life is miserable, have to sign 500 autographs everyday": Exposing Humblebragging, the Brags in Disguise [44.6] テキスト中のハンブルブラッグを自動的に検出するタスクを導入する。
本研究では, 機械学習, ディープラーニング, および大規模言語モデルを用いて, ハンブルブラッギングを4タプルで定義し, 評価する。
実験の結果,ヒトでもハンブルブラッグの検出は容易ではないことがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:14:55 GMT)
The Emotional Spectrum of LLMs: Leveraging Empathy and Emotion-Based Markers for Mental Health Support [41.5] RACLETTEは、最先端のベンチマークと比較すると、感情的精度が優れていることを示す対話システムである。
本研究では,ユーザの感情プロファイルを,メンタルヘルスアセスメントの解釈マーカーとして用いる方法を示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:42:29 GMT)
OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System [41.1] OneKEは、ドッカー化されたスキーマ誘導知識抽出システムである。
Webと生のPDFブックから知識を抽出することができる。
諸藩(科学、ニュースなど)を支えている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:01:30 GMT)
Face-StyleSpeech: Enhancing Zero-shot Speech Synthesis from Face Images with Improved Face-to-Speech Mapping [37.6] 顔画像に条件付けされた自然な音声を生成するゼロショットテキスト音声合成モデルであるFace-StyleSpeechを提案する。
本研究では, 顔画像から, ベースラインよりも自然な音声を効果的に生成できることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 12:31:01 GMT)
Implementing Trust in Non-Small Cell Lung Cancer Diagnosis with a Conformalized Uncertainty-Aware AI Framework in Whole-Slide Images [37.4] TRUECAMは、非小細胞肺癌におけるデータとモデル信頼性の両方を保証するために設計されたフレームワークである。
TRUECAMでラップされたAIモデルは、分類精度、堅牢性、解釈可能性、データ効率の点で、そのようなガイダンスが欠けているモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:22:47 GMT)
Generative Regression Based Watch Time Prediction for Video Recommendation: Model and Performance [35.3] ショートビデオレコメンデーションシステムにおいて、時計時間予測(WTP)が重要な課題として浮上している。
シーケンス生成に基づくWTPのための新しい生成回帰(GR)パラダイムを提案する。
4つの公開データセットと1つの産業データセットに対する最先端アプローチに対して,本手法の評価を行った。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:48:55 GMT)
DEGSTalk: Decomposed Per-Embedding Gaussian Fields for Hair-Preserving Talking Face Synthesis [35.2] 長髪のリアルな話し顔を生成するための3次元ガウススプラッティング(3DGS)に基づく話し顔合成法を提案する。
その結果,DESTalkは既存の手法に比べて現実性や合成品質の向上を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:23:31 GMT)
Stable-TTS: Stable Speaker-Adaptive Text-to-Speech Synthesis via Prosody Prompting [34.5] Stable-TTSは、高品質な事前トレーニングデータセットの小さなサブセットを活用する、話者適応型TSフレームワークである。
先行サンプルの高品質な韻律を活用しつつ、ターゲット話者の音色を効果的に捉え、韻律の整合性を実現する。
雑音の多いターゲット音声サンプルにおいて, 安定TTSの有効性を示す実験を行った。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:54:30 GMT)
ComparisonQA: Evaluating Factuality Robustness of LLMs Through Knowledge Frequency Control and Uncertainty [34.2] 283Kの抽象的な質問を含む比較QAベンチマークを導入する。
このようなペア間の知識周波数の差は、エンティティ周波数にのみ関連しているため、制御可能な比較を保証する。
実験により、LLMは低周波知識に関して特にロバスト性を示すことが明らかとなった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:51:08 GMT)
Deep Learning for Detecting and Early Predicting Chronic Obstructive Pulmonary Disease from Spirogram Time Series [32.3] 慢性閉塞性肺疾患 (COPD) は閉塞を特徴とする慢性肺疾患である。
本研究では,新しい深層学習に基づくアプローチであるDeepSpiroを紹介し,今後のCOPDリスクの早期予測を目的とした。
DeepSpiroは4つの主要なコンポーネントで構成されている: ボリュームフロー曲線を安定化するためのSpiroSmoother、様々な長さのキーパッチを通じてボリューム変動パターンをキャプチャするSpiroEncoder、異種データを統合するSpiroExplainer、およびキーパッチの凹度に基づいて未診断高リスク患者の疾患リスクを予測するSpiroPredictorである。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:18:37 GMT)
A Comprehensive Survey of Small Language Models in the Era of Large Language Models: Techniques, Enhancements, Applications, Collaboration with LLMs, and Trustworthiness [31.8] 小言語モデル(SLM)は、低推論のレイテンシ、コスト効率性、効率的な開発、カスタマイズと適応性に対して、ますます好まれています。
これらのモデルは、リソース制限された環境とドメイン知識の獲得に特に適しています。
資源制約のある設定に特化タスクと適合性を持たせる能力によってSLMを定義することを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:18:36 GMT)
Calibre: Towards Fair and Accurate Personalized Federated Learning with Self-Supervised Learning [30.0] クライアント間でデータが異質である場合、SSLを使用してトレーニングされたグローバルモデルは、高品質なパーソナライズされたモデルを学ぶことができない。
SSL表現のキャリブレーション用に設計された,新たな個人用フェデレーション学習フレームワークであるCalibreを提案する。
Calibreは、クライアントの平均精度と公正性の両方の観点から、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:43:39 GMT)
Explainable Semantic Federated Learning Enabled Industrial Edge Network for Fire Surveillance [29.9] 火災監視において、産業用IoT(Industrial Internet of Things)デバイスは、大規模な監視データを頻繁に送信する必要がある。
我々は,IIoTデバイスがセマンティック通信を通じて警告を送ることができる産業用エッジセマンティックネットワーク(IESN)を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:45:15 GMT)
Deep Generalized Schrödinger Bridges: From Image Generation to Solving Mean-Field Games [29.6] 一般化Schr"odinger Bridges (GSBs) は、最も可能性の高い粒子の進化を分析するために用いられる数学的枠組みである。
本稿では,実践的利用の促進を目的としたアルゴリズム的視点に焦点を当てた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:31:53 GMT)
Distinguishability-guided Test Program Generation for WebAssembly Runtime Performance Testing [28.9] 高性能はWebAssembly(Wasm)の重要な設計目標である
Wasmランタイムパフォーマンステストの研究は、いまだに高品質なテストプログラムの不足に悩まされている。
特に、WarpGenは3つのWasmランタイムで7つの新しいパフォーマンス問題を特定している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:51:23 GMT)
How To Think About End-To-End Encryption and AI: Training, Processing, Disclosure, and Consent [28.5] エンドツーエンド暗号化(E2EE)は、通信を保護するための金の標準となり、世界中の数十億のユーザに対して強力な機密性とプライバシ保証をもたらしている。
E2EEシステムを含む人工知能(AI)モデルの広範な統合に向けた動きは、深刻なセキュリティ上の懸念を提起している。
この研究は、AIモデルとE2EEアプリケーションの互換性について批判的な検証を行います。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:59:21 GMT)
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning [27.3] 実顔画像の基本表現を学習するための自己教師付き事前学習フレームワークを提案する。
我々のモデルは、教師付き事前学習、視覚的および顔的自己指導型学習技術よりも優れており、タスク特化SOTA法よりも優れています。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:48:32 GMT)
LLM-based Multi-Agent Systems: Techniques and Business Perspectives [26.7] マルチモーダル (multi-modal) な大規模言語モデルの時代において、ほとんどの操作プロセスは LLM エージェントを使って再構成および再生することができる。
発達の自然なトレンドとして、呼び出しツールは自律的なエージェントになりつつあるため、完全なインテリジェントシステムはLLMベースのマルチエージェントシステム(LaMAS)であることが判明した。
従来の単一LLMエージェントシステムと比較して、LaMASは、動的タスク分解と有機的特殊化の利点、システム変更の柔軟性の向上、および、各エンティティに対する収益化の実現可能性を有する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 12:48:11 GMT)
Caesar: A Low-deviation Compression Approach for Efficient Federated Learning [26.6] 低次元圧縮手法を用いた新しいFLフレームワークCaesarを提案する。
私たちはCaesarを、40台のスマートフォンと80台のNVIDIA Jetsonデバイスを備えた2つの物理プラットフォームに実装しました。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:20:36 GMT)
CrossSpeech++: Cross-lingual Speech Synthesis with Decoupled Language and Speaker Generation [25.8] CrossSpeech++は、言語と話者情報をアンタングルする方法である。
これにより、言語間音声合成の品質が大幅に向上する。
さまざまなメトリクスを使って広範な実験を行い、CrossSpeech++が大幅な改善を実現していることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:32:49 GMT)
Maintain Plasticity in Long-timescale Continual Test-time Adaptation [25.8] 連続的なテスト時間領域適応は、訓練済みのソースモデルを調整することを目的としており、静止しないターゲット環境において、時間とともにうまく機能する。
可塑性は、非定常環境に対する予測を継続的に調整するモデルの能力を指す。
モデルの可塑性を維持するため, 単純かつ効果的なアダプティブ・スリンク・リストア(ASR)を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:47:40 GMT)
An analytic theory of creativity in convolutional diffusion models [25.0] 我々は、畳み込み拡散モデルにおける創造性の最初の分析的、解釈可能、予測的理論を得る。
我々の理論は、事前学習された自己認識可能なUNetsの出力を部分的に予測する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 22:33:29 GMT)
MaIR: A Locality- and Continuity-Preserving Mamba for Image Restoration [24.7] 我々は,新しいマンバ画像復元モデル(MaIR)を提案する。
MAIRはNested S-shaped Scanning Strategy (NSS)とSequence Shuffle Attention Block (SSA)で構成されている。
NSSとSSAのおかげで、MaIRは14の挑戦的なデータセットにまたがって40のベースラインを越えた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:40:39 GMT)
Mining Platoon Patterns from Traffic Videos [24.4] 本稿では,ビデオデータからコモーメントパターンを緩和し,共通経路における連続性要求を除去する手法を提案する。
MaxGrowthと呼ばれる新しい列挙フレームワークを開発し、緩和されたパターンを効率的に検索する。
私たちのMaxGrowthは、ベースラインアルゴリズムよりも最大2桁高速です。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:16:38 GMT)
A Robust Federated Learning Framework for Undependable Devices at Scale [24.3] 統合学習システムでは、スマートフォンなどの多くのデバイスは、トレーニング中に(例えば、WiFiから頻繁に切断される)非依存であることが多い。
既存のFLフレームワークは、常に信頼できる環境を前提としており、信頼できないデバイスをトレーニングから除外している。
提案するFLUDEは,予測不可能な環境に効果的に対処する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:28:52 GMT)
Unsupervised Cross-Domain Image Retrieval via Prototypical Optimal Transport [24.1] 教師なしクロスドメイン画像検索は、ラベル付きデータに頼ることなく、さまざまな領域で同じカテゴリを共有する画像を検索することを目的としている。
従来のアプローチでは、UCIRの問題をドメイン内表現学習とドメイン間特徴アライメントという2つの異なるタスクに分解していた。
本稿では,UCIR に最適化された新規な Optimal Transport の定式化である ProtoOT を紹介する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:50:30 GMT)
Entering Real Social World! Benchmarking the Social Intelligence of Large Language Models from a First-person Perspective [22.3] 社会知能は認知知能、状況知能、行動知能の3つの柱の上に構築されている。
EgoSocialArenaは、個人の視点から、大規模言語モデルの社会的インテリジェンスを体系的に評価することを目的としている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:46:16 GMT)
SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis [22.1] シンクロナイズドモーション拡散戦略を用いた多体インタラクション合成法SyncDiffを紹介する。
動きの忠実度を高めるため,周波数領域の動作分解手法を提案する。
また、異なる身体運動の同期を強調するための新しいアライメントスコアも導入する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 10:12:12 GMT)
MAFT: Efficient Model-Agnostic Fairness Testing for Deep Neural Networks via Zero-Order Gradient Search [20.5] モデル非依存フェアネステスト(MAFT)と呼ばれる新しいブラックボックス個別フェアネステスト法を提案する。
我々は,MAFTが大規模ネットワークへの適用性を向上しつつ,最先端のホワイトボックス手法と同等の有効性を実証した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:07:06 GMT)
ProtCLIP: Function-Informed Protein Multi-Modal Learning [18.6] ProtCLIPは,機能認識タンパク質の埋め込みを表現した多モード基盤モデルである。
当社のProtCLIPは,5つのクロスモーダル変換ベンチマークにおいて,平均75%の大幅な改善を実現している。
実験により,タンパク質多量性基盤モデルとしてのProtCLIPの異常なポテンシャルが検証された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:23:47 GMT)
SegKAN: High-Resolution Medical Image Segmentation with Long-Distance Dependencies [18.4] 本稿では,SegKanという革新的なモデルを提案する。
我々は,画像埋め込みのための新しい畳み込みネットワーク構造を採用することにより,従来の埋め込みモジュールを改善した。
我々は,従来の視覚変換器モデルにおいて,パッチブロック間の空間的関係を時間的関係に変換することで,パッチブロック間の関係を捕捉する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:27:21 GMT)
On Finding Small Hyper-Gradients in Bilevel Optimization: Hardness Results and Improved Analysis [18.1] 双レベル最適化は、そうでなければ斜め最適化問題の内部構造を明らかにする。
双レベル最適化における共通のゴールは、パラメータの集合の解に暗黙的に依存する超対象である。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:44:48 GMT)
General Geospatial Inference with a Population Dynamics Foundation Model [17.7] Population Dynamics Foundation Model (PDFM)は、多様なデータモダリティ間の関係を捉えることを目的としている。
まず、アメリカ合衆国全土の郵便番号と郡のための地理インデックス付きデータセットを構築した。
次に、グラフニューラルネットワークを用いて、このデータと位置間の複雑な関係をモデル化する。
我々は、PDFMと最先端の予測基盤モデルであるTimesFMを組み合わせることで、失業と貧困を予測する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:16:20 GMT)
Bridging Context Gaps: Enhancing Comprehension in Long-Form Social Conversations Through Contextualized Excerpts [17.3] 我々は,小グループ会話における理解度の向上に焦点をあてた。
我々は、理解、可読性、共感を改善するために効果的な文脈化のためのアプローチを示す。
今後の作業をサポートするために、Human-annotated Salient Excerptsデータセットをリリースします。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:29:53 GMT)
On dataset transferability in medical image classification [17.3] 医用画像分類において、電流伝達可能性推定法は、しばしば準最適である。
本稿では,特徴量と勾配を組み合わせ,対象タスクに対するソースモデル特徴の適合性と適応性を両立させる新しい伝達可能性指標を提案する。
その結果,提案手法は両方の設定で既存の転送可能性指標より優れていることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:00:04 GMT)
Geo-ConvGRU: Geographically Masked Convolutional Gated Recurrent Unit for Bird-Eye View Segmentation [17.0] 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクに大きな影響を与えている。
CNNは、畳み込み操作の局所的な性質のために、長距離依存を明示的にモデル化するのに苦労している。
我々は,Bird's-Eye Viewセグメンテーションに適したシンプルな,かつ効果的なモジュールであるGeo-ConvGRU(Geo-ConvGRU)を紹介した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:59:48 GMT)
Seed-CTS: Unleashing the Power of Tree Search for Superior Performance in Competitive Coding Tasks [16.9] コード生成に特化して設計された新しいトークンレベルの木探索手法を提案する。
GPT4o-0513(0.245)のpass@100性能を超え,LiveCodeBench-Hardで0.305のパスレートを実現した。
本研究は,競合レベルのコード生成タスクの性能を著しく向上させる木探索の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:30:02 GMT)
Efficient Multi-Agent Collaboration with Tool Use for Online Planning in Complex Table Question Answering [16.8] 複雑なテーブル質問応答(TQA)は、複数のステップや複数カテゴリの推論のような複雑な推論を必要とする質問に答えることを目的としている。
以前のアプローチでは、クローズドソースの大規模言語モデル(LLM)か、微調整のオープンウェイトLLMを利用することで、顕著な性能を示した。
クローズドソースモデルや微調整を必要としないフレームワークであるMulti-Agent Collaboration with Tool Use (MACT)を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:13:33 GMT)
Efficient and Scalable Deep Reinforcement Learning for Mean Field Control Games [16.6] 平均場制御ゲーム(MFCG)は、無限に多くの相互作用するエージェントのシステムを解析するための強力な理論的枠組みを提供する。
本稿では,MFCGの近似平衡解に対する拡張性のある深層強化学習(RL)手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:04:53 GMT)
A Hybrid Quantum-Classical Autoencoder Framework for End-to-End Communication Systems [16.3] 我々は、パラメータ化量子回路と古典的ディープニューラルネットワーク(DNN)を組み合わせた、新しいハイブリッド量子古典型オートエンコーダアーキテクチャを導入する。
提案手法の有効性を実証し,従来のDNNおよび従来のチャネル符号化方式と同等のブロック誤り率(BLER)を達成できることを明らかにする。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 18:39:05 GMT)
Searching from Area to Point: A Hierarchical Framework for Semantic-Geometric Combined Feature Matching [16.2] 我々は,特徴的意味領域マッチングを含むマッチング画像領域として,点マッチングの初期探索空間を設定した。
この検索空間は、有意な特徴による点マッチングを好んでおり、最近のTransformerベースのマッチング手法の精度制限を緩和している。
本稿では、画像間のセマンティックな領域マッチングを最初に見つけるために、A2PM(Area to Point Matching)という階層的な特徴マッチングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:08:53 GMT)
Discrete Curvature Graph Information Bottleneck [15.9] 本稿では,情報伝達構造を最適化する新しい離散曲率グラフ情報ボトルネック(CurvGIB)フレームワークを提案する。
CurvGIBは、リッチ曲率最適化のための変分情報ボトルネック(VIB)の原理を進化させ、最適な情報伝達パターンを学習する。
様々なデータセットの実験は、CurvGIBの優れた有効性と解釈可能性を示している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:33:55 GMT)
A Nearly Optimal Single Loop Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness [15.7] 本稿では、上層関数が非定常で、潜在的に非有界な滑らかさを持ち、下層関数が凸であるような二層最適化の問題を考察する。
既存のアルゴリズムはネストループに依存しており、これは重要なチューニング作業を必要とし、実用的ではない。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:40:27 GMT)
Learning Adaptive and View-Invariant Vision Transformer with Multi-Teacher Knowledge Distillation for Real-Time UAV Tracking [15.6] AVTrackは,リアルタイムなUAV追跡のための変圧器ブロックを選択的に活性化するアダプティブフレームワークである。
視角の極端な変化に伴う課題に対処するために,相互情報(MI)を用いたビュー不変表現を提案する。
AVTrack-MDと呼ばれる新しいMIベースの多教師知識蒸留(MD)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:57:44 GMT)
ST$^3$: Accelerating Multimodal Large Language Model by Spatial-Temporal Visual Token Trimming [14.9] $textbfST3$は、再トレーニングせずにMLLM推論を高速化するように設計されたフレームワークである。
$textbfST3$は、既存のトレーニング済みMLLMにシームレスに統合できる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 10:17:29 GMT)
Shifting Spotlight for Co-supervision: A Simple yet Efficient Single-branch Network to See Through Camouflage [14.5] Co-Supervised Spotlight Shifting Network (CS$3$Net)は、光源のシフトがカモフラージュを公開する方法にインスパイアされた、コンパクトな単一ブランチフレームワークである。
我々のスポットライトシフト戦略は、境界線をハイライトする監督信号を生成することで、マルチブランチ設計を置き換える。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:00:33 GMT)
Transformer-Based Contrastive Meta-Learning For Low-Resource Generalizable Activity Recognition [14.4] 一般化可能なHARのためのトランスフォーマーに基づくコントラストメタラーニング手法であるTACOを提案する。
TACOは、モデルの一般化可能性を明確に考慮したトレーニングにおいて、仮想ターゲットドメインを合成することでDSに対処する。
評価の結果,TACOは様々な低リソースDSシナリオにおいて顕著に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:57:12 GMT)
On the Compositional Generalization of Multimodal LLMs for Medical Imaging [14.4] マルチモーダル大言語モデル(MLLM)は、医療分野において大きな可能性を秘めている。
それらの能力は、特定の医療領域における不十分なデータによって制限されることが多く、一般化のためにMLLMによってどのような種類の画像が使用できるかを理解する必要性を強調している。
本稿では,合成一般化(CG)モデルを用いた学習要素の組換えによる新しい組み合わせの理解手法を提案する。
実験の結果、MLLMはCGを使って見えない医療画像を理解することができ、マルチタスクトレーニングで観察される一般化の主要因の1つとしてCGを特定した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:50:00 GMT)
From Generalist to Specialist: A Survey of Large Language Models for Chemistry [14.3] 大言語モデル(LLM)は我々の日常生活を大きく変え、自然言語処理(NLP)の新しいパラダイムを確立した。
LLMの大規模なWebベースのテキストへの事前学習は、特に化学において先進的な科学的発見には不十分である。
化学におけるプレトレインド言語モデル(PLM)について、いくつかの研究がレビューされているが、化学指向のLSMに特に焦点を絞った系統的な調査は、顕著に行われていない。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:40:25 GMT)
Multi-field quantum conferencing overcomes the network capacity limit [14.3] 量子会議により、量子ネットワーク内の複数のノードが、プライベートメッセージブロードキャストのためのセキュアなグループキーを共有することができる。
キーレートは、複数粒子の絡み合った状態をネットワークに分散するリピータレスキャパシティによって制限される。
本稿では,グリーンベルガー=ホルン=ザイリンガー状態の事実上の確立を含む,この限界を破る実用的マルチフィールドスキームを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:04:28 GMT)
MambaVO: Deep Visual Odometry Based on Sequential Matching Refinement and Training Smoothing [13.8] MambaVOは、堅牢でマンバベースのシーケンシャルなマッチング改善を行い、マッチング品質を高めるためのスムーズなトレーニングを行う。
公開ベンチマークでは、MambaVOとMamba++がSOTAの精度性能を示し、低メモリ要求でリアルタイム実行性能を保証する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:42:48 GMT)
Optimal Control for Open Quantum System in Circuit Quantum Electrodynamics [13.8] オープン量子系のためのエネルギー・時間効率パルスを設計するためのポントリャーギン最大原理に基づく量子最適制御フレームワークを提案する。
この結果は, 散逸性開系における効率的な制御に向けての重要なステップであり, 回路量子力学における量子ビットの読み出しが向上した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:25:39 GMT)
Fine-grained and Explainable Factuality Evaluation for Multimodal Summarization [13.7] マルチモーダル要約は入力テキストと画像に基づいて簡潔な要約を生成することを目的としている。
マルチモーダル要約モデルの現実性を評価するために,2つのきめ細かな説明可能な評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:06:51 GMT)
Cross-Modal Mapping: Eliminating the Modality Gap for Few-Shot Image Classification [13.2] 本稿では,画像特徴をテキストの特徴空間にマッピングする,シンプルで効率的なクロスモーダルマッピング(CMM)手法を提案する。
11ベンチマークの結果は、従来の方法と比べて平均3.5%改善したことを示している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 10:40:21 GMT)
An Ordinary Differential Equation Sampler with Stochastic Start for Diffusion Bridge Models [13.0] 拡散ブリッジモデルは、純粋なガウスノイズではなく、劣化した画像から生成過程を初期化する。
既存の拡散ブリッジモデルは、しばしば微分方程式のサンプリングに頼り、推論速度が遅くなる。
拡散ブリッジモデルの開始点を有する高次ODEサンプリング器を提案する。
本手法は, 既訓練拡散ブリッジモデルと完全に互換性があり, 追加の訓練は不要である。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:32:26 GMT)
Canonical Factors for Hybrid Neural Fields [12.3] ファクター機能ボリュームは、よりコンパクトで、効率的で、解釈不能なニューラルネットワークを構築するための簡単な方法を提供する。
本研究では,これらのアーキテクチャが軸方向の信号に対して持つ望ましくないバイアスを特徴付ける。
本研究では、これらの変換とシーンの外観を同時に学習する2次元モデル問題において、効率を大幅に向上させることに成功した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 12:34:32 GMT)
Multi-View Empowered Structural Graph Wordification for Language Models [12.2] 本稿では,LLM-graphアライメントのためのエンドツーエンドのモダリティアライメントフレームワークについて紹介する。
提案手法は LLM とのトークンレベルアライメントを容易にするために設計されており,グラフの内在的' を理解可能な自然言語に効果的に翻訳することができる。
我々のフレームワークは、LLMとGNN間のトークンレベルのアライメントを実現するための、有望な試みである、ある視覚的解釈可能性、効率、堅牢性を保証する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:16:58 GMT)
A Robust Adversarial Ensemble with Causal (Feature Interaction) Interpretations for Image Classification [9.9] 本稿では,識別的特徴と生成的モデルを組み合わせた深層アンサンブルモデルを提案する。
提案手法は,特徴抽出のためのボトムレベル事前学習型識別ネットワークと,逆入力分布をモデル化したトップレベル生成型分類ネットワークを統合する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:06:20 GMT)
Hawkes based Representation Learning for Reasoning over Scale-free Community-structured Temporal Knowledge Graphs [9.7] 我々は、ホークスプロセスに基づく進化表現学習ネットワーク(HERLN)と呼ばれる新しいTKG推論モデルを提案する。
HERLNはTKGの構造情報と進化パターンを同時に学習する。
実験の結果,HERLNは最先端モデルよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:47:51 GMT)
Imitation Learning from Suboptimal Demonstrations via Meta-Learning An Action Ranker [9.7] 模倣学習における大きなボトルネックは、多数の専門家によるデモンストレーションの要求である。
メタラーニング・アクション・ローダ(ILMAR)による模倣学習という新しい手法を提案する。
ILMARは、限定された専門家によるデモンストレーションと補足的なデモに重み付けされた行動クローニング(BC)を実装している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:06:44 GMT)
A Measure of the System Dependence of Automated Metrics [9.6] メトリクスがすべてのシステムを公平かつ一貫して扱うようにすることが、同じように重要である、と私たちは主張する。
本稿では,この側面を評価する手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:21:27 GMT)
An archaeological Catalog Collection Method Based on Large Vision-Language Models [9.2] アーティファクト画像、形態的記述、発掘情報などの重要な要素を含む考古学的カタログは、アーティファクトの進化や文化遺産を研究する上で不可欠である。
既存のLarge Vision-Language Modelとその派生データ収集手法は、正確な画像検出とモーダルマッチングにおいて課題に直面している。
本稿では,文書のローカライゼーション,ブロック理解,ブロックマッチングという3つのモジュールからなるアプローチを踏襲する大規模視覚言語モデルに基づく新しい考古学的カタログ収集手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:10:41 GMT)
MADiff: Text-Guided Fashion Image Editing with Mask Prediction and Attention-Enhanced Diffusion [9.1] 編集領域をより正確に識別するためにMADiffモデルを提案する。
Atention-Enhanced Diffusion Model は編集サイズを強化するために提案されている。
提案手法は,編集領域のマスクを正確に予測し,ファッション画像編集における編集サイズを大幅に向上させることができる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:34:49 GMT)
Time-Series Foundation Model for Value-at-Risk Forecasting [9.1] 広範囲で多様なデータセットで事前トレーニングされたファンデーションモデルは、比較的最小限のデータを持つゼロショット設定で使用できる。
TimesFMと呼ばれるGoogleのモデルの性能を従来のパラメトリックモデルと非パラメトリックモデルと比較する。
提案手法のバックテスト結果から,提案手法を改良したTimesFMモデルの方が従来手法より常に優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 12:34:52 GMT)
Cluster-Enhanced Federated Graph Neural Network for Recommendation [8.9] 本稿では、CFedGRという推薦のためのクラスタ強化フェデレーショングラフニューラルネットワークフレームワークを提案する。
このフレームワークは、プライバシ保護の方法で個々のグラフを拡張するために、高次の協調シグナルを導入する。
デバイスとサーバ間の通信を減らすために、2つの効率的な戦略が考案されている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:27:42 GMT)
ReZG: Retrieval-Augmented Zero-Shot Counter Narrative Generation for Hate Speech [8.8] ソーシャルメディア上でのヘイトスピーチ(HS)は、社会保障に深刻な脅威をもたらす。
本研究では,Retrieval-Augmented Zero-shot Generation (ReZG)を提案する。
我々は, PLM が異なる知識保存, カウンター, フラレンシ制約関数を利用できるように, エネルギーベースの制約付き復号機構を実装した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 11:50:15 GMT)
StyleAutoEncoder for manipulating image attributes using pre-trained StyleGAN [8.7] StyleAutoEncoderは、事前トレーニングされた生成モデルのプラグインである。
要求された画像の属性を操作することができる。
これは少なくとも、最先端のアルゴリズムと同様に画像属性を操作するのに効果的である。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:30:48 GMT)
INFELM: In-depth Fairness Evaluation of Large Text-To-Image Models [8.3] マルチモーダルAIシステムは、人間のような認知をエミュレートすることで、産業応用の可能性を秘めている。
また、有害な内容の増幅や社会的偏見の強化など、重大な倫理的課題も生じている。
本稿では,広く使用されているテキスト・ツー・イメージ・モデルにおける奥行きの公平性評価であるINFELMを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:28:19 GMT)
SAD-TIME: a Spatiotemporal-fused network for depression detection with Automated multi-scale Depth-wise and TIME-interval-related common feature extractor [8.3] うつ病は重度の精神疾患であり、正確な診断はうつ病患者の治療とリハビリに欠かせない。
より客観的な診断方法を探すために、研究者は、うつ病を識別するディープラーニングベースの方法の実験を開始した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:10:45 GMT)
Lillama: Large Language Models Compression via Low-Rank Feature Distillation [8.1] ライラマ(英: Lillama)は、低ランク重量で活性化を蒸留する圧縮法である。
1つのA100 GPUでMixtral-8x7Bを数分で圧縮し、100億のパラメータを削除し、元のパフォーマンスの95%以上を保持した。
非トランスフォーマーアーキテクチャを一般化し、99%のパフォーマンスを維持しながら、Mamba-3Bを20%圧縮する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:45:12 GMT)
ArgMed-Agents: Explainable Clinical Decision Reasoning with LLM Disscusion via Argumentation Schemes [8.0] ArgMed-Agentsは、大きな言語モデル(LLM)が相互作用を通じて説明可能な臨床判断を下せるためのフレームワークである。
我々は、ArgMed-Agentsの形式モデルを構築し、理論的保証の予想を示す。
設定実験により、ArgMed-Agentsは、他のプロンプト手法と比較して、複雑な臨床的意思決定推論問題の精度を向上するだけでなく、より重要なのは、ユーザーの信頼を高めるための意思決定説明を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:40:48 GMT)
VisTabNet: Adapting Vision Transformers for Tabular Data [7.6] 大規模な事前訓練されたモデルを、小さなデータセットで定義された下流タスクに転送することは困難である。
クロスモーダル・トランスファー学習手法であるVisTabNetを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:40:46 GMT)
An Anomaly Detection System Based on Generative Classifiers for Controller Area Network [7.5] 現代の車両は様々な種類の攻撃を受けやすいため、攻撃者はコントロールを獲得し、安全クリティカルなシステムを妥協することができる。
車両へのサイバー攻撃を検出するために、いくつかの侵入検知システム(IDS)が文献で提案されている。
本稿では,自動車ネットワークにおける異常検出のための新しい生成型分類器を用いたIDSを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:59:33 GMT)
LLM Reasoning Engine: Specialized Training for Enhanced Mathematical Reasoning [7.5] 数学的推論タスクにおける大規模言語モデルの能力を高めるための新しい手法を提案する。
このギャップを埋める必要性に感銘を受け、私たちのアプローチには質問パラフレーズ戦略が組み込まれています。
モデルの学習プロセスを導くために 専門的な訓練目的が 使われています。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:48:33 GMT)
Retrieval-Augmented Feature Generation for Domain-Specific Classification [7.4] 本稿では,ドメイン分類タスクに特有の合理的かつ説明可能な特徴を生成するためのRAFGを提案する。
ドメイン知識を解釈可能な新しい特徴を生成するために,既存の特徴情報検索を行い,潜在的な特徴関連を識別する。
生成過程における特徴の検証とフィルタリングを行うため,機能生成のためのLarge Language Model (LLM) ベースのフレームワークを開発した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:16:38 GMT)
An Addressable and Tunable Module for Donor-based Scalable Silicon Quantum Computing [6.7] ドナーベースのスピン量子ビットは、大規模な量子ビットアレイを構築するための有望なシリコン量子コンピューティングルートを提供する。
最先端のデバイス設計はスケーラビリティの課題に直面しており、特にチューナブルな2量子結合を実現し、キュービットアドレス性を確保する。
本稿では,各モジュールが2量子ゲートと1つのドナーに1つの追加ドナーを導入することで,可変2量子ゲートとアドレス可能な1量子ゲートの両方を持つ表面コード互換アーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:12:49 GMT)
Real-time Calibration Model for Low-cost Sensor in Fine-grained Time series [6.6] 対数重み付き注意力を利用した効果的なセンサキャリブレーションのためのTESLA, Transformer と呼ばれるモデルを開発した。
TESLAは高性能なディープラーニングモデルであるTransformersを使用して、非線形コンポーネントの校正とキャプチャを行う。
実験により、TESLAは既存の新しいディープラーニングモデルよりも精度、キャリブレーション速度、エネルギー効率が優れていることが示された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:58:46 GMT)
Freshness and Informativity Weighted Cognitive Extent and Its Correlation with Cumulative Citation Count [6.5] 我々は認知範囲を再考し、もともとはクォータ内のユニークなフレーズの数として定義されていた。
フレッシュネスとInformative Weighted Cognitive Extent(FICE)について紹介する。
FICEはクォータ内の平均累積引用数と強い相関を示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 18:54:29 GMT)
Causal Discovery on Dependent Binary Data [6.5] 本稿では,関係するバイナリデータに基づく因果グラフ学習のためのデコレーションに基づくアプローチを提案する。
我々は,潜在ユーティリティ変数のサンプルの生成とデコレーションを行うEMライクな反復アルゴリズムを開発した。
提案手法は因果グラフ学習の精度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:55:42 GMT)
Leveraging Edge Intelligence and LLMs to Advance 6G-Enabled Internet of Automated Defense Vehicles [6.3] この研究は、重要な防衛アプリケーションにおいて、これらの技術の潜在能力をフルに実現しようとするビジョンによって、機会と課題を提示する。
6Gの出現は、IoMDT(Internet of Military Defense Things)の領域内でのIoADV(Internet of Automated Defense Vehicles)の概念を強化する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 23:07:25 GMT)
AfriHG: News headline generation for African Languages [6.2] AfriTeVa V2 のようなアフリカ中心の Seq2seq モデルは、多言語 mT5-base モデルよりも優れていることを示す。
また, 313Mパラメータの微調整AfriTeVa V2は, 13Bパラメータ以上のAya-101 LLMに競合することを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:34:17 GMT)
LoL-PIM: Long-Context LLM Decoding with Scalable DRAM-PIM System [6.2] 大規模言語モデル(LLM)は数万のトークンのシーケンスを処理する。
Processing-in-Memory (PIM) は、計算をデータに移動させることでメモリ帯域幅を最大化する。
LoL-PIM はマルチノード PIM アーキテクチャであり、ハードウェアとソフトウェアの共同設計により長期のコンテキスト LLM を高速化する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:38:16 GMT)
Activity-aware Human Mobility Prediction with Hierarchical Graph Attention Recurrent Network [6.1] 本稿では,HGARN(Hierarchical Graph Attention Recurrent Network)を用いて人体移動予測を行う。
具体的には、過去の移動記録に基づいて階層グラフを構築し、複雑な時間-活動-位置の依存関係をキャプチャするために階層グラフ注意モジュールを使用する。
モデル評価において,HGARNの既存手法に対して,既存手法(例えば,以前に訪れた場所に戻る)と爆発的手法(すなわち,新しい場所を訪れる)の両方で,HGARNの性能を検証した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:14:37 GMT)
Understanding Deep Learning via Notions of Rank [5.4] この論文は、ディープラーニングの理論を発展させる鍵としてランクの概念を提唱している。
特に、勾配に基づくトレーニングは、いくつかのニューラルネットワークアーキテクチャにおいて、低ランクに対する暗黙の正規化を誘導できると確認する。
明示的な正規化スキームとデータ前処理アルゴリズムを設計するための我々の理論の実践的意味を述べる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 23:53:31 GMT)
Comparative Analysis of Listwise Reranking with Large Language Models in Limited-Resource Language Contexts [5.3] 本研究では,リミテッド・ソース・アフリカ言語を対象としたリストワイド・リランクにおける大規模言語モデル(LLM)の性能を評価する。
RankGPT3.5, Rank4o-mini, RankGPTo1-mini, RankClaude-sonnetを言語間の文脈で比較した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:30:05 GMT)
Transforming CCTV cameras into NO$_2$ sensors at city scale for adaptive policymaking [5.2] 都市CCTVカメラが擬似Notextsubscript2センサーとしてどのように機能するかを示す。
ロンドンのモビリティーパターンを解析した結果、特定のトラフィックパターンがNOtextsubscript2レベルにどのように影響するかが明らかになった。
これらの発見は、汚染を減らすために現在実施されている都市政策の有効性に疑問を投げかけた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:01:44 GMT)
Reusing Legacy Code in WebAssembly: Key Challenges of Cross-Compilation and Code Semantics Preservation [4.8] WebAssemblyコンパイラがコードの再利用性をどのように満たしているかを調査する。
レガシーC/C++コードをWebAssemblyにクロスコンパイルする際の重要な課題を特定します。
WasmCheckerを使用して、WebAssemblyコンパイラが必ずしもコードセマンティクスを保存するとは限らないことを目撃する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:24:41 GMT)
Towards Ideal Temporal Graph Neural Networks: Evaluations and Conclusions after 10,000 GPU Hours [4.5] TGNN(Temporal Graph Neural Networks)は、さまざまなドメインにわたる動的インタラクションをモデリングするための強力なツールとして登場した。
我々は、TGNNモデリングに関する既存の多くの研究が設計空間を不十分に探索し、最適でない設計へと繋がると主張している。
本稿では,よく知られたTGNNモジュール間の設計空間探索を行うための実用的な比較評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:02:29 GMT)
Self-Assembly of a Biologically Plausible Learning Circuit [4.5] 本稿では,生物学的に検証可能で,バックプロパゲーションと同様に機能するネットワークの重みを更新する回路を提案する。
我々の提案の重要な予測は、初期ランダム接続とヘテロシナプス可塑性規則から生じる基本回路の自己組織化の驚くべき性質である。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:41:19 GMT)
Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensation [4.5] 大規模言語モデル(LLM)の量子化は、特にハードウェアリソースが限られているデバイス上の設定において、最近人気を集めている。
量子化の重要な利点を保ちつつ、低ビットLLMの品質を向上させる推論スキームであるQDECを提案する。
本稿では,最先端の量子化手法を改良し,QDECの有効性を示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:51:02 GMT)
Will you donate money to a chatbot? The effect of chatbot anthropomorphic features and persuasion strategies on willingness to donate [4.4] パーソナライズ戦略とパーソナライズ戦略がユーザの認識と寄付可能性に与える影響について検討する。
その結果, 人格化されたチャットボットとの相互作用は, 人類同型感を誘発するが, 寄付意欲が増すわけではないことが示唆された。
実際、一般的に使われている人為的特徴(名前や物語など)は、寄付コンテキストにおけるAIエージェントに対する否定的な態度につながった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:17:46 GMT)
Cyclic Quantum Annealing: Searching for Deep Low-Energy States in 5000-Qubit Spin Glass [4.4] 提案した量子アルゴリズムは、記録時間内に深い低エネルギー状態を見つけることができることを示す。
また、スピングラスの低エネルギーな風景にも複雑な構造が見られる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:36:28 GMT)
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.4] 拡散モデルのための新しい状態空間アーキテクチャを提案する。
入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:52:22 GMT)
SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection [4.4] 本稿では、オブジェクトクラスが自然に長い尾の分布に従うような環境でのオブジェクト検出の課題に焦点を当てる。
既存のロングテール検出アプローチでは、外部のImageNetラベルを使用して、ローショットのトレーニングインスタンスを拡張している。
我々は、人間のアノテーションの負担を伴わずに簡単に収集できる、任意のラベルのない画像を活用するための、より汎用的なアプローチを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:29:40 GMT)
Optimal and Feasible Contextuality-based Randomness Generation [4.2] Kochen-Speckerコンテキスト性に基づく半測定独立ランダムネス生成プロトコルは魅力的な特徴を提供する。
一つの量子ビットが非コンテキストであることを示す。すなわち、この量子ビット相関は非コンテキスト隠れ変数(NCHV)モデルで説明できる。
我々は、特定の文脈性テストのクラスに対する、量子的および一般整合性(非シグナリング)の敵による攻撃の可能性について指摘する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 12:11:07 GMT)
The Fifth International Verification of Neural Networks Competition (VNN-COMP 2024): Summary and Results [3.9] 第5回国際ニューラルネットワークコンペティション(VNN-COMP 2024)を要約する。
VNN-COMPは、最先端のニューラルネットワーク検証ツールの公平かつ客観的な比較を容易にするために毎年開催されている。
このレポートは、このコンペティションのこのイテレーションから学んだルール、ベンチマーク、参加ツール、結果、教訓を要約する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:07:00 GMT)
Enhancing Diffusion Models for Inverse Problems with Covariance-Aware Posterior Sampling [3.9] 例えば、コンピュータビジョンでは、インペイント、デブロアリング、超解像といったタスクは、逆問題として効果的にモデル化できる。
DDPMは、追加のタスク固有のトレーニングを必要とせずに、線形逆問題に対する有望な解決策を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:17:44 GMT)
Large Language Models for Mathematical Analysis [3.7] この研究は、数学的推論における重要なギャップに対処し、信頼できるAIの進歩に寄与する。
DEMI-MathAnalysisデータセットを開発した。
また,LLMの問題解決能力を高めるためのガイドフレームワークも設計した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:37:55 GMT)
Typical entanglement entropy in systems with particle-number conservation [3.7] 本研究では, 任意の粒子を含む系において, 典型的な二部交絡エントロピーを$langle S_Arangle_N$で計算する。
量子カオススピンとボソン系の高励起固有状態の絡み合いエントロピーについて述べる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:36:30 GMT)
Decoding Emotion: Speech Perception Patterns in Individuals with Self-reported Depression [3.5] 本研究は, 自己報告型抑うつとインド住民の感情音声知覚との関連について検討した。
いずれの感情刺激にも抑うつ群と非抑うつ群の間に有意な差は認められなかった。
うつ病によるPANASスコアは,非抑うつ群よりも有意に高かった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:54:25 GMT)
MobileNetV2: A lightweight classification model for home-based sleep apnea screening [3.5] 本研究は、心電図(ECG)と呼吸信号から抽出した特徴を早期OSAスクリーニングに利用した、新しい軽量ニューラルネットワークモデルを提案する。
ECG信号は睡眠段階を予測するための特徴スペクトログラムを生成するのに使用され、呼吸信号は睡眠関連呼吸異常を検出するために用いられる。
これらの予測を統合することで、AHI(apnea-hypopnea index)を精度良く算出し、OSAの正確な診断を容易にする。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:37:25 GMT)
Adversarial Robustness for Deep Learning-based Wildfire Detection Models [3.5] 本稿では,山火事検出モデルの対角的堅牢性を評価するための,最初のモデルに依存しないフレームワークであるWARPを紹介する。
WARPは、大域的および局所的な敵攻撃手法を用いて、煙像の多様性の限界に対処する。
WARPの包括的な堅牢性分析は、山火事固有のデータ拡張戦略の開発に寄与した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:06:29 GMT)
Infrequent Resolving Algorithm for Online Linear Programming [3.2] 既存のオンライン線形プログラミング(OLP)アルゴリズムは、LPベースアルゴリズムとLPフリーアルゴリズムの2つのカテゴリに分類される。
本稿では,LPを数個の時間点で解き,他の時間点で1次計算を行うアルゴリズムを提案する。
本研究は,販売地平線の開始時と終了時の両方で解決する価値を強調し,提案方針の性能保証を証明するための新しい枠組みを提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:33:17 GMT)
Scoring with Large Language Models: A Study on Measuring Empathy of Responses in Dialogues [3.2] 本研究では,対話における応答の共感を測り,評価する上で,大規模言語モデルがいかに効果的かを調べるための枠組みを開発する。
我々の戦略は、最新かつ微調整されたLLMの性能を明示的で説明可能な特徴で近似することである。
以上の結果から,組込みのみを用いる場合,ジェネリックLLMに近い性能が得られることがわかった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:37:57 GMT)
Topic-Aware Knowledge Graph with Large Language Models for Interoperability in Recommender Systems [3.1] 我々は,大規模言語モデル(LLM)を用いて,側面情報と文脈情報の両方から一般トピックと特定トピックを抽出する一貫したアプローチを提案する。
実験結果から,多様な知識グラフ間での推薦性能が大幅に向上した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:27:45 GMT)
Delayed Random Partial Gradient Averaging for Federated Learning [3.0] 我々は、フェデレートラーニング(FL)を強化するために、遅延ランダム部分勾配平均化(DPGA)を提案する。
DPGAでは、クライアントはサーバと部分的なローカルモデル勾配しか共有しないが、ローカルモデルにおける共有部分のサイズは更新率によって決定される。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:14:27 GMT)
YAD: Leveraging T5 for Improved Automatic Diacritization of Yorùbá Text [2.8] 本稿では、Yorub'a diacritizationシステムを評価するために、Yorub'a Automatic diacritization (YAD)ベンチマークデータセットを提案する。
また、Yorub'aのテキスト・トゥ・テキスト・トランスフォーマーであるT5モデルを事前訓練し、このモデルが複数言語で訓練されたT5モデルより優れていることを示した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:03:30 GMT)
Anatomy of information scrambling and decoherence in the integrable Sachdev-Ye-Kitaev model [2.5] 時間外相関関数(OTOC)による情報スクランブルの成長
我々は、積分可能なSachdev-Ye-Kitaev(SYK)モデルに対するOTOCの完全時間依存性を解析的に計算する。
環境の影響は、OTOCが浴とのカップリング強度の逆転よりも3倍も長く、全体的に指数関数的に崩壊することである。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:39:26 GMT)
Experimental investigation of a quantum Otto heat engine with shortcuts to adiabaticity implemented using counter-adiabatic driving [2.5] 我々は核磁気共鳴(NMR)量子プロセッサにスピン1/2原子核を用いた量子オットー熱エンジンを実験的に実装した。
本研究は, 対断走行による近道断熱技術を用いて, その性能について検討した。
非断熱機関と比較して, 短絡断熱により駆動される量子オットー熱機関の性能は著しく向上した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:08:22 GMT)
Continuous and Reversible Electrical Tuning of Fluorescent Decay Rate via Fano Resonance [2.4] 補助量子オブジェクト(QO)は、金属殻ナノ粒子のプラズモンスペクトルにファノ透過性を導入することができる。
CSNPのホットスポットに位置する補助QOはLDOSを修飾できるので、励起双極子の崩壊速度が変化する。
この現象は、統合量子技術で実装するための貴重な道具として現れる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:20:19 GMT)
RFPPO: Motion Dynamic RRT based Fluid Field - PPO for Dynamic TF/TA Routing Planning [2.3] 本稿では、動的TF/TAルーティング計画のためのモーションダイナミックRTベース流体場(PPO)を提案する。
報酬関数は障害物回避、地形追従、地形回避、安全な飛行のための戦略を促進するように設計されている。
実DEMデータによる実験結果から,衝突のない軌道計画により長距離飛行のタスクを完了できることが示されている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:42:02 GMT)
Predicting Customer Lifetime Value Using Recurrent Neural Net [2.2] 本稿では,SaaS(Software as a Service)アプリケーションにおけるユーザ寿命を予測するためのニューラルネットワークアプローチを提案する。
このアプローチは,買収(新規ユーザ)とローリング(既存ユーザ)のライフタイム値の両方を,さまざまな時間軸で予測するために適用される。
その結果, 絶対誤差の中央値と光勾配の上昇モデル, Buy Before You Dieモデルが有意に改善することが判明した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 23:16:40 GMT)
Efficient Evaluation of Optical Quantum Modules via Dual-Photon High-Dimensional Interference [2.0] 本稿では,高次元のHong-Ou-Mandel干渉に基づく2光子量子モジュール評価法を提案する。
本手法では,光量子モジュールの高速評価を実現するために,多自由度光子符号化を用いる。
本手法をプログラマブルシリコンフォトニックチップ上で検証し,光学量子モジュールの性能を正確に評価できることを実証した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:23:26 GMT)
Injecting Explainability and Lightweight Design into Weakly Supervised Video Anomaly Detection Systems [2.0] 本稿では,知識蒸留とクロスモーダルコントラスト学習を活用したTCVADS(Two-stage Cross-modal Video Anomaly Detection System)を提案する。
実験結果から,TCVADSはモデル性能,検出効率,解釈可能性において既存手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:24:35 GMT)
Accurate Coresets for Latent Variable Models and Regularized Regression [2.0] 正確なコアセットを構築するための統一的なフレームワークを導入する。
一般問題に対する正確なコアセット構築アルゴリズムを提案する。
本研究は, 実データを用いた実験により, 理論的知見を裏付けるものである。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:01:49 GMT)
TeLU Activation Function for Fast and Stable Deep Learning [1.9] 双曲型Tangent Exponential Linear Unit(TeLU)は、TeLU(x)=xtanh(exp(x))として定義されるニューラルネットワーク隠れ活性化関数である。
TeLUの設計はキーアクティベーション関数の中核原理に基づいており、強い収束を達成する。
我々の結果は、TeLUが活性化関数の新しい標準を設定する可能性を強調し、ディープニューラルネットワークにおけるより効率的で安定した学習を促進する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:50:08 GMT)
BaiJia: A Large Scale Role-Playing Agent Corpus of Chinese Historical Charcaters [1.7] 各種の歴史的文字からなる大規模ロールプレイングエージェント「BaiJia」を包括的に紹介する。
BaiJiaは、大規模な言語モデル(LLM)でAI駆動の歴史的ロールプレイングエージェントに関わることのできる、低リソースデータのパイオニアとして注目に値する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:01:26 GMT)
Automated Code Review In Practice [1.6] Qodo、GitHub Copilot、CoderabbitなどのAI支援ツールが、大規模な言語モデル(LLM)を使用して自動レビューを提供する。
本研究では,LLMに基づく自動コードレビューツールが産業環境に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:16:43 GMT)
Conformal Risk Control for Pulmonary Nodule Detection [1.4] 肺癌検診における肺結節検出の1例を経験したので報告する。
我々は、共形リスク制御(CRC)と呼ばれる不確実性定量化手法により高度な検出モデルを強化する。
安全クリティカルな医療領域における予測の不確実性の指標として, 整合性保証付き予測セットが魅力的であることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:41:57 GMT)
Spatial Clustering of Citizen Science Data Improves Downstream Species Distribution Models [1.4] 生息環境選択の生物学的プロセスとは別途、観察過程をモデル化することで不完全な検出を行う。
既存の現場建設のアプローチは、いくつかの観測や/または地理的距離のみを放棄し、環境の類似性を考慮しない。
オレゴン州における31種の鳥類の下流種分布モデルへの影響について, サイト構築に対する10のアプローチを比較した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:54:24 GMT)
Hades: Homomorphic Augmented Decryption for Efficient Symbol-comparison -- A Database's Perspective [1.4] 本稿では,暗号化データの効率的かつセキュアな比較を可能にする新しい暗号フレームワークであるHADESを紹介する。
Ring Learning with Errors (RLWE)問題に基づいて、HADESはCPAセキュリティを提供し、周波数分析攻撃を軽減するために摂動認識暗号化を組み込んでいる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:47:14 GMT)
Taming Thiemann's Hamiltonian constraint in canonical loop quantum gravity: reversibility, eigenstates and graph-change analysis [1.4] 近似を必要とせずにハミルトン制約の作用を実装できる新しい数値ツールを開発した。
我々の研究は、ループ量子重力における新しい世代の計算への道を切り開いており、グラフ変化の結果とその現象を考慮し、理解することができる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:56:30 GMT)
Computing the graph-changing dynamics of loop quantum gravity [1.4] ハミルトニアン制約を通したグラフ変換力学を実装した最初の数値ツールを紹介する。
量子幾何学的オブザーバブルはグラフ保存トランケーションと異なる振る舞いを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:12:15 GMT)
A survey on pioneering metaheuristic algorithms between 2019 and 2024 [1.2] 過去30年間に500以上の新しいメタヒューリスティックアルゴリズムが提案され、スローダウンはない。
本評価は, 年次引用基準, 対応課題の幅など, 重要な基準に重点を置いている。
我々は過去6年間の最も影響力のある23のメタヒューリスティックアルゴリズムの最近のハイインパクト応用を探求し、その利点と限界に光を当てている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:41:57 GMT)
MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping [1.2] 少数の例だけで、クエリイメージ内のオブジェクトをセグメント化するという課題に、Semanticは対処している。
本稿では,トランスアーキテクチャに基づく新しいFew-shot Semanticフレームワークを提案する。
150万のパラメータしか持たないモデルでは,既存の手法の限界を克服しつつ,競争性能を実証している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:45:22 GMT)
Influence of the coupled-dipoles on photosynthetic performance in a photosynthetic quantum heat engine [1.2] 結合双極子による光合成性能への影響を2チャージ分離経路量子熱エンジン(QHE)モデルを用いて検討した。
その結果、光合成性能は大幅に向上するが、結合双極子によって量子干渉は非活性化された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:48:35 GMT)
Charge-transport enhanced by the quantum entanglement in the Photosystem II reaction center [1.0] 光化学系II反応中心(PSII RC)における電荷輸送における量子絡み合いの役割を明らかにする。
量子エンタングルメントは2つの吸収光子チャネルを持つ量子熱エンジン(QHE)モデルを介して電荷輸送に規制上の利点をもたらすことを示す。
光合成における量子エンタングルメントの役割への洞察は、将来、生体模倣光合成デバイスのための新しい実験戦略を動機付ける可能性がある。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:18:46 GMT)
Children's Acquisition of Tail-recursion Sequences: A Review of Locative Recursion and Possessive Recursion as Examples [0.9] 再帰は人間の自然言語の性質である。
再帰や影響要因に対する子どもの獲得経路の理解はいまだに議論の余地が残っている。
言語習得装置により,幼児は短時間で再帰を素早く得ると仮定した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:47:38 GMT)
STAYKATE: Hybrid In-Context Example Selection Combining Representativeness Sampling and Retrieval-based Approach -- A Case Study on Science Domains [0.8] 大規模言語モデル(LLM)は、科学的な情報抽出のための潜在的なソリューションを提供する、文脈内で学習する能力を示す。
STAYKATE(StaYKATE)は,アクティブラーニングからの代表性サンプリングの原理と,一般的な検索に基づくアプローチを組み合わせた静的・動的ハイブリッド選択法である。
3つのドメイン固有のデータセットにまたがる結果は、STAYKATEが従来の教師付き手法と既存の選択方法の両方より優れていることを示している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:13:50 GMT)
An experimental study on fairness-aware machine learning for credit scoring problem [0.7] 本稿では,信用スコアリングにおける公平性を考慮した機械学習の総合的研究について述べる。
この研究では、財務データセット、予測モデル、公正度測定など、信用スコアの重要な側面について調査している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 23:27:07 GMT)
Gradient Descent Methods for Regularized Optimization [0.7] 勾配降下法(GD法)は、微分可能な対象関数の数値最適化に使用される主要な手法の1つである。
GDのより効果的なバージョンは、近位勾配降下と呼ばれ、ソフトスレッディング(Soft-thresholding)と呼ばれる技術を用いて、イテレーション更新をゼロに縮小する。
本稿では, 可変ステップサイズを組み込んだ近位GD法のための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 10:54:15 GMT)
Building a Rich Dataset to Empower the Persian Question Answering Systems [0.6] このデータセットはNextQuADと呼ばれ、23,918の質問と回答を含む7,515のコンテキストを持つ。
2つの事前学習言語モデルを用いて,BERTに基づく質問応答モデルをこのデータセットに適用した。
開発セットの評価では、0.95 Exact Match (EM)と0.97 Fl_scoreを示している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:53:25 GMT)
Global Search of Optimal Spacecraft Trajectories using Amortization and Deep Generative Models [0.6] パラメータ化された大域的探索問題を,高品質な解に対するアトラクションの局所的な流域の近傍を支援して条件付き確率分布をサンプリングするタスクとして定式化する。
この手法は、円形に制限された3体問題における低推力宇宙船軌道最適化問題でベンチマークされる。
また,低推力宇宙船軌道最適化問題のマルチモーダルファンネル構造を詳細に解析する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:57:12 GMT)
ERUP-YOLO: Enhancing Object Detection Robustness for Adverse Weather Condition by Unified Image-Adaptive Processing [0.5] 霧や低照度などの悪天候に対する画像適応型物体検出法を提案する。
本フレームワークでは, 後段物体検出に適した画像強調を行うために, 可変プリプロセッシングフィルタを用いる。
我々は,統一画像処理(ERUP)-YOLOによる拡張ロバストネス(Enhanced Robustness)と呼ばれる提案手法をYOLOv3検出器に適用することにより評価した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:26:32 GMT)
Neuromorphic circuit for temporal odor encoding in turbulent environments [0.5] 常気流埋設人工臭気の金属酸化物(MOx)ガスセンサ記録について検討した。
我々は,この特徴をアナログスパイクに抽出・符号化するニューロモルフィック電子鼻フロントエンド回路を設計し,ガス検出と濃度推定を行った。
結果として生じるニューロモルフィック鼻は、データ効率の良いリアルタイムのロボットプルームナビゲーションシステムを可能にする。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 11:12:18 GMT)
Out-of-distribution generalization via composition: a lens through induction heads in Transformers [0.5] GPT-4のような大きな言語モデル(LLM)は、しばしば創造的であり、しばしばプロンプトにいくつかのデモがある新しいタスクを解く。
これらのタスクは、トレーニングデータとは異なる分布を一般化するモデルを必要とする -- アウト・オブ・ディストリビューション(OOD)一般化(out-of-distribution)と呼ばれる。
隠れルールに従ってインスタンスが生成される設定におけるOOD一般化について検討する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:15:28 GMT)
DDD-GenDT: Dynamic Data-driven Generative Digital Twin Framework [0.4] デジタルツイン(DT)技術は、物理システムの振る舞いをシミュレートし、予測し、最適化するためのトランスフォーメーションアプローチとして登場した。
本稿では、動的データ駆動型アプリケーションシステム(DDDAS)にインスパイアされた、デジタルツインツフレームワーク(DDD-GenDT)の動的データ駆動型生成手法を提案する。
本研究では, コンピュータ数値制御(CNC)加工プロセスにDDD-GenDTを適用し, NASAのミリング摩耗データセットにおけるスピンドル電流測定データを例として用いた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:13:30 GMT)
Average mutual information for random fermionic Gaussian quantum states [0.4] 混合ガウス状態と固定スペクトルのアンサンブル上で平均化されたバイパルタイト系における典型的な相互情報を計算する。
我々は,レベル密度と平均相互情報に基づいて,サブシステムにおける平均フォン・ノイマンエントロピーを評価する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:11:21 GMT)
The Design of an LLM-powered Unstructured Analytics System [0.4] 本稿では,非構造化分析システムであるArynの設計と,その設計を動機づけるテネットとユースケースについて述べる。
Arynには、自然言語クエリをSycamoreスクリプトに変換するクエリプランナのLunaと、生のPDFとドキュメントイメージを取得するDocParseが含まれている。
NTSB(National Transportation Safety Board)のリアルタイムレポートに照らして、RAGよりも精度の高い分析クエリを実現するために、これらの部品が組み合わさった方法を示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 05:14:14 GMT)
Election of Collaborators via Reinforcement Learning for Federated Brain Tumor Segmentation [0.2] フェデレートラーニング(FL)は、分散データセット間の協調モデルトレーニングを可能にする。
本稿では,RL-HSimAgg,新しい強化学習(RL)と類似性重み付けアルゴリズム(simAgg)を提案する。
Epsilon-greedy (EG) とUpper confidence bound (UCB) アルゴリズムの連合脳病変分節に対する効果を実証した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:54:06 GMT)
IMSSA: Deploying modern state-space models on memristive in-memory compute hardware [0.2] ディープラーニングにおける重要な課題は、長い時間的シーケンスを処理することだ。
トランスフォーマーはこのタスクの最先端になったが、過剰なメモリ要求に悩まされている。
構造化状態空間シーケンシャル(S4)モデルが最近登場し、非常に長いシーケンスコンテキストの処理を可能にしながら、固定されたメモリ状態を提供する。
我々は,S4Dモデルのサイズと計算要求を大幅に削減し,S4モデルのパワーをエッジハードウェアにもたらすことを目的としている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:58:31 GMT)
Uncertainty Quantified Deep Learning and Regression Analysis Framework for Image Segmentation of Skin Cancer Lesions [0.0] 深層学習モデル(DLM)は、しばしば医療画像から正確な腫瘍の分類と分類を行う。
DLMは、Dice係数やパフォーマンスへの自信などのイメージセグメンテーションメカニズムに対するフィードバックを欠いているが、現実の臨床環境では目に見えない画像を処理する場合、課題に直面している。
本研究は2つのDLMについて報告する。1つはスクラッチから訓練し、もう1つは転写学習に基づいて、モンテカルロのドロップアウトまたはベイズ・バイ・バックプロップ不確かさを、一般に公開されているThe International Skin Imaging Collaboration-19 dermoscopy image databaseから推定する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 04:06:44 GMT)
Ultratight confinement of atoms in a Rydberg empowered optical lattice [0.0] 本稿では,サブ波長空間構造を持つ原子型光学格子の創出について述べる。
このポテンシャルは、3レベルリドベルク配位原子の非線形光学応答を利用して生成される。
これらの超狭トラップ技術の開発は、Rydberg-Fermiゲート、アトムトロニクス、量子ウォーク、Hubbardモデル、中立原子量子シミュレーションなどの応用に大いに期待できる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:35:39 GMT)
Transport of magnetically sensitive atoms in a magnetic environment [0.0] 希土類超低温原子は、多くのファノ・フェシュバッハ共鳴と基底状態の磁気双極子モーメントにより特に魅力的である。
磁性原子の輸送の場合, 磁場を直接測定し, 調整することで損失を低減できることを実証した。
このアプローチにより、原子の85%が主室から科学室に移動でき、原子分極崩壊のない26Wの中程度のレーザーパワーで38cm離れた場所にある。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:44:17 GMT)
Towards Real-Time 2D Mapping: Harnessing Drones, AI, and Computer Vision for Advanced Insights [0.0] このプロジェクトでは、ドローン画像と機械学習とコンピュータビジョンを統合した最先端マッピングシステムを導入する。
このシステムは最小の遅延時間でシームレスで高解像度の地図を生成し、防衛作戦において戦略的優位性を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:47:18 GMT)
Towards General Purpose Robots at Scale: Lifelong Learning and Learning to Use Memory [0.0] このテーマは、記憶と生涯学習という、長い時間をかけて動くロボットにとっての2つの重要な課題に対処することに焦点を当てている。
まず,連続世界ベンチマークにおける最先端性能を実現するトラジェクトリベースディープ生成再生法であるt-DGRを紹介する。
第2に,人間の実演を利用してエージェントに効果的なメモリ利用を教えるフレームワークを開発する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:13:48 GMT)
The quantum Kibble-Zurek mechanism: the role of boundary conditions, endpoints and kink types [0.0] ライドバーグ原子量子シミュレータの最近の実験では、キブル・ズレーク機構は量子相転移の性質を解明するために用いられている。
本研究では, 境界条件, 終点の位置, およびkink演算子の定義における微妙さについて検討する。
驚くべきことに、キブル・ズレーク臨界スケーリングは、固定境界条件が対称か反対称かで等しく正確であるように見える。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 15:51:54 GMT)
The importance of visual modelling languages in generative software engineering [0.0] GPT-4は、単に自然言語ではなく、画像とテキストの入力を受け入れる。
私たちの知る限りでは、マルチモーダルGPTを通じてソフトウェアエンジニアリングタスクが実行される同様のユースケースを調査する研究は他にありません。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:08:27 GMT)
Stronger together? The homophily trap in networks [0.0] ホモフィリー(他と結びつく傾向)は多様性を阻害し、不平等を拡大する。
ネットワークの25%以下にマイノリティーサイズが落ちると、ホモフィリートラップが発生することを示す。
我々の研究は、社会集団が構造的コストを伴わずにホモフィリーの恩恵を受けるためには、重要なサイズが必要であることを明らかにしている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:14:16 GMT)
SIC-POVMs and orders of real quadratic fields [0.0] 低次元のワイル・ハイゼンベルクSICの構造と分類に関する既知のデータを示す。
我々は、SICのガロア倍数は、オーバーオーダーの$mathcalO_Delta$と1対1で対応していると推測する。
我々は、Appleby, Flammia, McConnell, Yard の類体仮説を洗練し、a を定義する等角線に対するベクトルエントリの比によって生成される$mathbbQ(sqrt(d+1)(d-3))$ 上の正確な類体を予測する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:18:49 GMT)
Quantum state testing beyond the polarizing regime and quantum triangular discrimination [0.0] 三角偏差とジェンセン・シャノンの発散に関する時間境界分布試験問題に対して適切な量子アナログを導入する。
これらの新しい$mathsfQSZK$-complete問題は、分極状態を超えたQSDPに対する$mathsfQSZK$の封じ込めを改善する。
量子エントロピー差分問題に対して単純な$mathsfQSZK$-hardnessを確立する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 00:05:04 GMT)
Quantum phase estimation and realistic detection schemes in Mach-Zehnder interferometer using SU(2) coherent states [0.0] 量子パラメータ推定において、量子クラム・ラオ境界(QCRB)は、偏りのない推定器で達成可能な精度の基本的な極限を設定する。
スピンコヒーレント入力状態に対するQCRBを3つの検出方式で実現できることを示す。
最大圧力は、全角運動量量子数$j$が高いときに得られる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:37:15 GMT)
Quantum algorithm for collisionless Boltzmann simulation of self-gravitating systems [0.0] 衝突のないボルツマン方程式(CBE)を解くための効率的な量子アルゴリズムを提案する。
我々は,自己重力系の量子シミュレーションを行うアルゴリズムを拡張し,重力を計算する手法を取り入れた。
これにより、将来の量子コンピュータで大規模なCBEシミュレーションを実行できる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:22:15 GMT)
Quantum Transport in Interacting Spin Chains: Exact Derivation of the GUE Tracy-Widom Distribution [0.0] 本研究では,Bethe ansatz法による1次元折り畳みXXZモデルにおける量子スピン輸送について検討した。
折り畳み型 XXZ モデルの正確な解法と XXZ モデルの数値解析に基づいて、最左端のアップスピンを見つける確率の普遍的挙動について議論する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:15:12 GMT)
Plastic Waste Classification Using Deep Learning: Insights from the WaDaBa Dataset [0.0] 本研究では、畳み込みニューラルネットワーク(CNN)とYOLO(You Only Look Once)のようなオブジェクト検出モデルに焦点を当てる。
その結果, YOLO-11mの精度は98.03%, mAP50(0.990)で, YOLO-11nも同様だがmAP50(0.992)であった。
YOLO-10nのような軽量モデルはより高速に訓練されたが精度は低く、MobileNet V2は優れた性能(97.12%の精度)を示したが、オブジェクト検出では不足していた。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 18:00:52 GMT)
Overcoming Intensity Limits for Long-Distance Quantum Key Distribution [0.0] 量子鍵分配(QKD)は、量子力学によって確保された暗号鍵の共有を可能にする。
BB84プロトコルは単一光子源を仮定するが、実用システムは光子数分割攻撃に弱いコヒーレントパルスに依存する。
観測データから直接鍵パラメータを推定するためにベイズ推定を適用することにより、高い強度が確実に許されることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:40:23 GMT)
On the Validity of Traditional Vulnerability Scoring Systems for Adversarial Attacks against LLMs [0.0] 本研究は,脆弱性スコアの決定における一般および特定指標の影響について検討した。
さまざまな研究論文から引用され、オンラインデータベースを通じて得られた攻撃は、複数の脆弱性メトリクスを使用して評価された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:08:37 GMT)
Machine and Deep Learning for Credit Scoring: A compliant approach [0.0] 本稿では,現行の規制体制に挑戦し,新たなBASEL 2と3の準拠技術を導入することを目的としている。
このようなアルゴリズムを使用することで、性能が大幅に向上し、デフォルトのキャプチャレートが向上することを示す。
さらに、Shapley Valuesのパワーを活用して、これらの比較的単純なモデルは、現在の規制システムが考えているようなブラックボックスではないことを証明します。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:46:43 GMT)
Machine Learning Approaches to the Shafarevich-Tate Group of Elliptic Curves [0.0] 我々は機械学習モデルを訓練し、$mathbbQ$の楕円曲線のシャファレヴィチ・テイト群の順序を予測する。
我々は、トレーニング中に見られない群の順序を予測し、最近エルキースとクラグスブルンによって発見されたランク29の楕円曲線に適用できる回帰モデルを開発する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 11:21:22 GMT)
Leveraging Social Media Data and Artificial Intelligence for Improving Earthquake Response Efforts [0.0] デジタル時代には、リアルタイム情報共有は前例のないレベルに達している。
本研究は、X(元Twitter)上の2,920件の投稿と5,980件の返信を含む8,900件のソーシャルメディアインタラクションに関する実験的分析を含む。
その結果,ソーシャルメディアプラットフォームをリアルタイムな状況認識ツールとして効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 11:08:06 GMT)
Leveraging Large Language Models for Enhancing Autonomous Vehicle Perception [0.0] 大規模言語モデル(LLM)は、動的環境、センサー融合、文脈推論の課題に対処するために用いられる。
本稿では,ALMをAV知覚に組み込むことにより,文脈理解の高度化を実現する新しい枠組みを提案する。
実験により,LLMはAV知覚システムの精度と信頼性を著しく向上することが示された。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 17:58:44 GMT)
Leveraging Large Language Models For Optimized Item Categorization using UNSPSC Taxonomy [0.0] 国連標準製品サービスコード(UNSPSC)は、在庫のカタログ化のための標準化されたシステムを提供する。
本稿では,項目記述に基づくUNSPSCコードへの在庫データの分類を自動化するために,LLM(Large Language Models)の展開について検討する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 00:12:13 GMT)
Learning physical unknowns from hydrodynamic shock and material interface features in ICF capsule implosions [0.0] 高エネルギー密度物理(HEDP)と慣性閉じ込め融合(ICF)では、予測モデリングは、モデル化システムの様々な側面を特徴づけるパラメータの不確実性によって複雑である。
本研究では,そのパラメータを直接推測するために,外装衝撃プロファイルと外装材料エッジから得られた疎流体力学特性の集合を定義する。
推定パラメータは, 密度場, 流体衝撃, およびデータに整合した外縁特性を得るために, 流体力学コードで利用できることを示す。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:05:41 GMT)
Interleaved dual-species arrays of single atoms using a passive optical element and one trapping laser [0.0] 我々は、ルビジウム(Rb)とセシウム(Cs)の原子をトラップするために、単一レーザビームで照射された微細加工された光学素子を用いて実演する。
このトラップ法は、アクティブな光電子成分と複数のレーザー波長を使用する一般的な手法と比較して単純で堅牢であり、他の原子種にも容易に適用できる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:29:11 GMT)
Improving SSVEP BCI Spellers With Data Augmentation and Language Models [0.0] SSVEPスペルは障害者のための有望なコミュニケーションツールである。
SSVEPスペルのためのディープニューラルネットワークは、しばしば未確認の被験者に対して低い精度と低い一般化性に悩まされる。
本稿では,SSVEPスペルのパフォーマンス向上のために,データ拡張と言語モデリングを組み合わせたハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:52:11 GMT)
Improved models for ideal Fermi gas and ideal Bose gas using quantum phase space [0.0] 理想フェルミガスと理想ボースガスの現行モデルに改良を導入することができる。
改良されたモデルの構築は、量子力学の位相空間表現の概念の利用に基づいている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:57:57 GMT)
IITR-CIOL@NLU of Devanagari Script Languages 2025: Multilingual Hate Speech Detection and Target Identification in Devanagari-Scripted Languages [0.0] 本研究は,デバナガリ文字言語におけるヘイトスピーチ検出とターゲット識別に関連する2つのサブタスクに焦点を当てた。
Subtask Bはヘイトスピーチをオンラインテキストで検出するが、Subtask Cはヘイトスピーチの特定のターゲットを特定する必要がある。
我々は、事前訓練された多言語変換モデル ia-multilingual-transliterated-roberta に基づいて構築されたディープニューラルネットワークであるMultilingualRobertaClass モデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 21:27:17 GMT)
Hybrid-Order Topological Phase And Transition in 1H Transition Metal Compounds [0.0] 1H遷移金属化合物中のハイブリッド秩序トポロジカル絶縁体を予測した。
1H-TMCはd軌道バンドギャップによる2階の位相相を示す。
本研究により,2次元電子材料とアンダースコアスピントロニクスのハイブリッド秩序トポロジカル位相が明らかとなった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 08:14:04 GMT)
Holographic fermions in the Dyonic Gubser-Rocha black hole [0.0] このモデルには磁場と運動量緩和の両方が含まれている。
磁場強度と運動量緩和が増加するにつれて、二重磁場のスペクトル関数は著しく変化する。
磁気散乱速度の解析により,フェルミ液体領域ではほぼゼロであり,非フェルミ液体領域では顕著に増加し,最終的に絶縁状態の最大値に達することが明らかとなった。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:17:14 GMT)
High-fidelity social learning via shared episodic memories enhances collaborative foraging through mnemonic convergence [0.0] 社会的学習は、個人が他人を観察し、模倣することによって知識を得ることを可能にする。
本研究では,集団採餌におけるエピソード記憶と社会学習の相互関係について検討した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:55:38 GMT)
Generalized group designs: overcoming the 4-design-barrier and constructing novel unitary 2-designs in arbitrary dimensions [0.0] ユニタリ設計は、いくつかの量子情報プロトコルにおいて必須のツールである。
本稿では,グループ設計を高度に一般化するための新しい構成法を提案する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:03:58 GMT)
GSplatLoc: Ultra-Precise Camera Localization via 3D Gaussian Splatting [0.0] 超精密ポーズ推定に3次元ガウススプラッティングの可変レンダリング機能を利用するカメラローカライズ手法であるGSplatLocを提案する。
GSplatLocは、高密度マッピングのローカライズのための新しいベンチマークを設定し、ロボット工学や拡張現実のような正確なリアルタイムローカライズを必要とするアプリケーションに重要な意味を持つ。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:14:14 GMT)
From Worms to Mice: Homeostasis Maybe All You Need [0.0] 本稿では, 生物の神経回路における可塑性の関連様式の基礎となる, 単純な神経XORモチーフを提案する。
このXORモチーフは、受信信号と参照信号との相違を単に信号する。
複雑化を伴う各種生物のコネクトームにおけるXORモチーフの出現状況について検討した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 09:17:09 GMT)
First qualitative observations on deep learning vision model YOLO and DETR for automated driving in Austria [0.0] 本研究は,You Only Look Once (YOLO) のような単段および二段2次元物体検出アルゴリズムの適用性について検討する。
この研究は、オーストリアの道路状況と交通シナリオによって引き起こされる固有の課題に焦点を当てている。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 16:34:33 GMT)
Exploring Grassmann manifolds in topological systems via quantum distance [0.0] パラメータ空間上で定義された量子状態はグラスマン多様体を形成する。
我々は、状態間の量子距離を定量化するために、マルチレベルシステムのプロジェクタを用いる。
多次元スケーリング法を用いて、量子距離をユークリッド空間に埋め込まれた再構成多様体に変換する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:29:00 GMT)
Enhancing Transfer Learning for Medical Image Classification with SMOTE: A Comparative Study [0.0] 本稿では,医療画像における多ラベル画像分類へのトランスファーラーニング(TL)の適用について検討し,拡張する。
以上の結果から, TLモデルは脳腫瘍の分類に優れ, ほぼ最適測定値が得られた。
我々は,SMOTE(Synthetic Minority Oversampling Computing Technique)とTLと従来の機械学習(ML)手法を統合し,精度を1.97%向上し,リコール(感度)を5.43%向上し,特異度を0.72%向上させる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 18:15:07 GMT)
EEG Right & Left Voluntary Hand Movement-based Virtual Brain-Computer Interfacing Keyboard Using Hybrid Deep Learning Approach [0.0] 我々は,任意のキーストロークを正確に識別できる脳波ベースのBMIシステムを開発した。
提案手法は,脳波信号の解釈モデルとして,BiGRU-Attentionを用いたハイブリッドニューラルネットワークアーキテクチャを用いる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 02:15:27 GMT)
DepthMamba with Adaptive Fusion [0.0] 本研究では,様々な雑音のポーズ設定下での深度推定システムを評価するために,新しいロバストネスベンチマークを提案する。
この課題に対処するために,単一ビューと複数ビューブランチの深さ推定結果を融合した2分岐ネットワークアーキテクチャを提案する。
提案手法は,動的オブジェクトやテクスチャレス領域など,難易度の高いシーンでよく機能する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 01:17:47 GMT)
Contextual Feedback Loops: Amplifying Deep Reasoning with Iterative Top-Down Feedback [0.0] 我々は、トップダウンフィードバックを組み込んで中間表現を洗練させる反復的なメカニズムとして、コンテキストフィードバックループ(CFL)を導入する。
我々の結果は、CFLが現代のディープラーニングアーキテクチャにそのような文脈推論を組み込むための、単純かつ強力な方法を提供することを示唆している。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:00:45 GMT)
Comprehensive Review of EEG-to-Output Research: Decoding Neural Signals into Images, Videos, and Audio [0.0] 機械学習と生成モデリングの最近の進歩は、知覚経験の再構築における脳波の応用を触媒している。
本稿では,脳波から出力までの研究を体系的にレビューし,最先端のジェネレーティブ手法,評価指標,データ課題に焦点をあてる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:50:56 GMT)
Collaborative filtering based on nonnegative/binary matrix factorization [0.0] データを疎結合とする協調フィルタリングに適用可能な改良型NBMFアルゴリズムを提案する。
修正手法では、評価行列の未定格要素をマスキングし、協調フィルタリング性能を向上させる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 06:07:17 GMT)
BikeNodePlanner: a data-driven decision support tool for bicycle node network planning [0.0] 自転車ノードネットワークは、番号付きサインポストからなるレクリエーションサイクリストを対象としたウェイフィニングシステムである。
BikeNodePlannerは完全なオープンソースの意思決定支援ツールで、オープンソースの地理情報システムQGISで動作するモジュール型のPythonスクリプトで構成されている。
BikeNodePlannerは、自転車ノードネットワーク計画のためのデータ駆動決定サポートを提供するので、地域計画、自転車観光、農村サイクリングの促進に大いに役立つ。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 20:55:04 GMT)
Artificial Intelligence for Sustainable Urban Biodiversity: A Framework for Monitoring and Conservation [0.0] 都市部の急速な拡大は生物多様性の保全に挑戦し、革新的な生態系管理を必要としている。
本研究では, 都市生物多様性保全における人工知能(AI)の役割とその応用, 実装の枠組みについて検討する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 03:18:56 GMT)
Aligning Graphical and Functional Causal Abstractions [0.0] 因果抽象化により、異なるレベルの粒度の因果モデルを関連付けることができる。
モデルが原因と効果に一致するように、因果的抽象化のフレームワークは一貫性の概念を定義します。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 13:35:07 GMT)
Advanced Attacks On Qubit-Ensemble Based Quantum Coins [0.0] アンサンブルベースの量子トークンプロトコルは、同じ準備された量子ビットのアンサンブルを含む非クロンブルトークンを実装することができる。
プロトコルに対する高度な攻撃は、サブアンサンブルの測定が実行可能であり、個々のキュービットも測定可能であると仮定できる。
我々は、ブルートフォース最適化を用いた高度な攻撃に対して、IBM Quantum Platformの現実的なパラメータを使用した。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 19:10:01 GMT)
AI-based Wearable Vision Assistance System for the Visually Impaired: Integrating Real-Time Object Recognition and Contextual Understanding Using Large Vision-Language Models [0.0] 本稿では,音のビープ機構を通じてユーザに対してリアルタイムフィードバックを提供するために,人工知能(AI)技術を用いたウェアラブル視覚支援システムを提案する。
大規模視覚言語モデル(LVLM)を用いたユーザ環境におけるオブジェクトの詳細な記述を提供する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:26:39 GMT)
A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0] Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 14:07:21 GMT)
"Efficient Complexity": a Constrained Optimization Approach to the Evolution of Natural Intelligence [0.0] 情報理論、生物物理学、バイオインフォマティクス、熱力学の結合における根本的な疑問は、外部刺激に関する情報が事前に入手できない自然環境における自然知性の発達を導く原理とプロセスに関するものである。
制約付き最適化の枠組みでは,自然学習の情報プロセスの記述に新たなアプローチが提案されている。
構造の複雑さ、可変性、効率性、あるいは提案された形式主義に基づく学習モデルのアーキテクチャの関係に関する非自明な結論は、ニューラルネットワークを生物学的および人工知能における小さな知能ユニットの協調グループとしての有効性を説明することができる。
論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:30:30 GMT)