Overview of AI and Communication for 6G Network: Fundamentals, Challenges, and Future Research Opportunities [156.4] 本稿では,6GネットワークにおけるAIと通信の概要を概観する。
我々はまず、AIを無線通信に組み込むことの背景にある要因と、AIと6Gの収束のビジョンを概観する。
講演はその後、6Gネットワーク内でAIの統合を想定する詳細な説明へと移行する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:36:23 GMT)
MV-VTON: Multi-View Virtual Try-On with Diffusion Models [91.7] 画像ベースの仮想試着の目的は、与えられた衣服を自然に身に着けている対象者の画像を生成することである。
既存の方法は、前頭服を用いた正面試着のみに焦点をあてる方法である。
本稿では,服の複数ビューからドレッシング結果を再構築することを目的としたMulti-View Virtual Try-ON(MV-VTON)を紹介する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:31:28 GMT)
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model [77.8] 本稿では,LCM(Latent Consistency Model)を組み込んだDreamLCMを提案する。
提案手法は, 対象3次元モデルの最適化のために, 高精度かつ詳細な勾配を与えることができる。
DreamLCMは、生成品質とトレーニング効率の両面で最先端の結果を達成する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:31:00 GMT)
Noise-Tolerant Hybrid Prototypical Learning with Noisy Web Data [72.3] 我々は,大量の関連性はあるがノイズの多いラベル付けされたWeb画像から,バイアスのない分類器を学習する際の課題に焦点をあてる。
クリーンで多くのノイズの多いシナリオでは、無関係なノイズのある画像が存在するため、クラスプロトタイプは深刻なバイアスを受けることができる。
提案手法では,ノイズ画像の明瞭な分割による多様性を考慮し,最適化の相違を克服する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:21:43 GMT)
How to Learn a New Language? An Efficient Solution for Self-Supervised Learning Models Unseen Languages Adaption in Low-Resource Scenario [72.0] 音声認識(ASR)における音声自己監視学習(SSL)モデルの性能向上
低リソース言語 ASR では、事前訓練された言語と低リソース言語のドメインミスマッチ問題に遭遇する。
これらの問題に対処するためのアダプタに基づく従来型の効率的な微調整手法を拡張した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:07:32 GMT)
An Empirical Study of Catastrophic Forgetting in Large Language Models During Continual Fine-tuning [70.5] カタストロフィック・ナッシング(英: Catastrophic forgetting、CF)は、機械学習において、モデルが以前に学習した情報を忘れたときに発生する現象である。
本研究では,大規模言語モデルにおける連続的調律時の忘れ現象を実験的に評価する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:09:00 GMT)
RETTA: Retrieval-Enhanced Test-Time Adaptation for Zero-Shot Video Captioning [69.2] Retrieval-Enhanced Test-Time Adaptation (RETTA) と呼ばれる新しいゼロショットビデオキャプションフレームワークを提案する。
一般的なビデオテキスト検索モデルXCLIP、一般的な画像テキストマッチングモデルCLIP、テキストアライメントモデルAnglE、テキスト生成モデルGPT-2の4つのキーモデルを用いてビデオとテキストをブリッジする。
そこで本研究では,GPT-2,XCLIP,CLIP,AnglEの4つのフリーズモデルにおいて,学習可能なトークンを通信媒体として用いることを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:00:56 GMT)
Cluster-Aware Similarity Diffusion for Instance Retrieval [64.4] 拡散に基づく再ランク付け(diffusion-based re-level)は、隣り合うグラフで類似性の伝播を実行することで、インスタンスを検索する一般的な方法である。
本稿では,新しいクラスタ・アウェア類似性(CAS)拡散モデルを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:13:23 GMT)
Layer-Level Self-Exposure and Patch: Affirmative Token Mitigation for Jailbreak Attack Defense [57.9] ジェイルブレイク攻撃は 意図しない 有害な出力を 引き起こす脆弱性を悪用する
私たちは、jailbreak攻撃を防御するために設計された新しい方法論であるLayer-AdvPatcherを紹介します。
我々は,2つのモデル,4つのベンチマークデータセット,および複数の最先端のジェイルブレイクベンチマークに関する広範な実験を行い,アプローチの有効性を実証した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 19:06:03 GMT)
Motif Channel Opened in a White-Box: Stereo Matching via Motif Correlation Graph [57.7] ステレオマッチングのための新しい学習パラダイムであるMoCha-V2を提案する。
MoCha-V2はMotif correlation Graph (MCG)を導入し、機能チャネル内で「モチーフ」と呼ばれる反復的なテクスチャをキャプチャする。
得られたモチーフ特徴を利用してステレオマッチングプロセスの幾何学的構造を復元する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:20:07 GMT)
Early Period of Training Impacts Adaptation for Out-of-Distribution Generalization: An Empirical Study [56.3] 本稿では,学習力学,分布外一般化,ニューラルネットワークトレーニングの初期段階との関係について検討する。
トレーニングの初期においてトレーニング可能なパラメータの数を変更することで,OODの結果が大幅に改善できることが示唆された。
画像データとテキストデータの両方で実験したところ、訓練の初期段階は、IDとOODのパフォーマンスを最小限の複雑さで改善できる一般的な現象であることがわかった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:51:17 GMT)
ReTaKe: Reducing Temporal and Knowledge Redundancy for Long Video Understanding [55.3] 長時間ビデオ理解のための時間的視覚的冗長性と知識的冗長性を両立させるトレーニングフリー手法である$bfReTaKe$を導入する。
DPSelectは、人間の映像知覚と密接に一致している視覚的特徴に基づいて、局所的な最大ピーク距離を持つビデオを特定する。
PivotKVはピボットとしてVideoBenchsを使用し、注意スコアの低い非テキストトークンに対してKVキャッシュ圧縮を実行する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:11:48 GMT)
Grade Inflation in Generative Models [53.2] その結果,合成データの2次元分布と地絡データの2次元分布を比較することで,より優れた結果が得られることがわかった。
我々は、すべてのデータポイントを等しく評価するスコアも、これらと同様に、グレードインフレーションを示すことを提案する。
等密度スコアと負の次数R'enyiエントロピーの関連を同定する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 00:52:03 GMT)
Layout2Scene: 3D Semantic Layout Guided Scene Generation via Geometry and Appearance Diffusion Priors [52.6] 本稿では,3次元オブジェクト位置の正確な制御をインジェクションするプロンプトとして,追加のセマンティックレイアウトを用いたテキスト・ツー・シーン生成手法(Layout2Scene)を提案する。
幾何学および外見生成における2次元拡散先行をフル活用するために,意味誘導幾何拡散モデルと意味誘導幾何誘導拡散モデルを導入する。
我々の手法は、最先端のアプローチに比べて、より可塑性でリアルなシーンを生成することができる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:20:13 GMT)
Facial Attractiveness Prediction in Live Streaming: A New Benchmark and Multi-modal Method [52.0] われわれはLiveBeautyについて紹介する。LiveBeautyは、大規模な顔の魅力予測データセットである。
ライブストリーミングプラットフォームから直接1万枚の顔画像が収集される。
ライブストリーミングにおける顔の魅力を測定するために,マルチモーダルFAP法を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:43:35 GMT)
DiffusionAttacker: Diffusion-Driven Prompt Manipulation for LLM Jailbreak [51.8] 大規模言語モデル (LLM) は、慎重に入力を行うと有害なコンテンツを生成する可能性がある。
本稿では,拡散モデルにインスパイアされたジェイルブレイク書き換えのためのエンドツーエンド生成手法であるDiffusionAttackerを紹介する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:44:32 GMT)
Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models [51.2] 提案するSafe LoRAは,選択した層からのLoRA重みの投影を安全に整合した部分空間に導入することにより,オリジナルのLoRA実装に対する単純なワンライナーパッチである。
我々の実験は、純粋に悪意のあるデータに対して微調整を行う場合、Safe LoRAは元のアライメントモデルと同様の安全性を保っていることを示した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:51:46 GMT)
FEDLAD: Federated Evaluation of Deep Leakage Attacks and Defenses [50.9] フェデレーテッド・ラーニング(Federated Learning)は、分散型機械学習パラダイムをプライバシ保護するものだ。
近年の研究では、Deep Leakageと呼ばれる勾配技術によって、民間の真実データを復元できることが判明している。
本稿では、Deep Leakage攻撃と防御を評価するための総合的なベンチマークであるFEDLAD Framework(Federated Evaluation of Deep Leakage Attacks and Defenses)を紹介する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:20:57 GMT)
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use [50.3] 995のユーザクエリと3,912の関連ツールからなるデータセットであるToolHopを提示する。
ToolHopは、多様なクエリ、意味のある相互依存性、ローカル実行可能なツール、詳細なフィードバック、検証可能な回答を保証する。
5つのモデルファミリーにまたがる14のLSMを評価し、マルチホップツールの使用シナリオを扱う上で重要な課題を明らかにした。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:06:55 GMT)
Concept Discovery in Deep Neural Networks for Explainable Face Anti-Spoofing [49.7] 最近の偽造防止モデルでは、「この顔は偽物だ」としか言えないが、「なぜ偽物なのか」と答える説明が欠けている。
提案するSPED(SPoofing Evidence Discovery)は,スプーフ概念を探索し,発見概念に基づいて信頼性の高い説明を提供するX-FAS法である。
実験の結果,SPEDは信頼性のある説明を生成できることがわかった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:42:03 GMT)
A completely uniform transformer for parity [49.3] パリティ言語を認識する3層定数次元変換器を構築した。
これにより、入力長に応じて位置符号化を使用するChiangとCholakの構築が改善される。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:32:13 GMT)
Generalizing from SIMPLE to HARD Visual Reasoning: Can We Mitigate Modality Imbalance in VLMs? [48.4] 視覚言語モデル(VLM)は、視覚的質問応答(VQA)や画像キャプションといったタスクにおいて印象的である。
画像に多段階推論を適用する能力は、モダリティの不均衡や脆さの知覚を引き起こす。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:36:38 GMT)
Scaling Laws for Floating Point Quantization Training [47.2] 低精度トレーニングは、トレーニングと下流推論コストの削減に有効な戦略と考えられている。
本稿では,浮動小数点量子化目標,指数ビット,マティーサビットの影響,および浮動小数点量子化訓練におけるスケーリング係数の算出について,徹底的に検討する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 02:30:41 GMT)
HALO: Hadamard-Assisted Lossless Optimization for Efficient Low-Precision LLM Training and Fine-Tuning [45.4] 本稿では,トランスフォーマーのための新しい量子化学習手法HALOを提案する。
我々は,アダマール回転を前方と後方の両方で組み合わせることで,低精度計算における外周を緩和する。
提案手法は,高効率カーネル実装を基盤として,PEFT法とPEFT法の両方をサポートする。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:41:54 GMT)
Neural Network Prediction of Strong Lensing Systems with Domain Adaptation and Uncertainty Quantification [45.0] MVE(Mean-variance Estimator)は、ニューラルネットワークの予測からアレタリック(データ)の不確実性を得るための一般的なアプローチである。
本研究では、強いレンズデータに対する非教師なし領域適応(UDA)と組み合わせて、MVEの有効性を初めて研究する。
MVE に UDA を追加すると,UDA なしで MVE モデルより約 2 倍精度が向上することがわかった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:49:38 GMT)
LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry [44.5] LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。
実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。
LaDeには3つの特徴がある。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 02:08:03 GMT)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models [44.0] 我々は,大規模モデルの認知的マルチモーダル推論と問題解決能力を評価するために設計された新しいデータセットNTSEBenchを紹介する。
データセットには2728の質問があり、合計4,642の画像が26種類に分類されている。
これらの質問は、インドのNTSE試験から引き出され、視覚的およびテキスト的一般適性の問題が混在している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:15:39 GMT)
Unified Guidance for Geometry-Conditioned Molecular Generation [41.9] 非条件拡散モデルの幾何学的ガイダンスを制御するためのフレームワークであるUniGuideを紹介する。
構造ベース,フラグメントベース,リガンドベースの薬物設計などの応用がUniGuideフレームワークでどのように構成されているかを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:58:01 GMT)
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling [40.8] ACE++は、様々な画像生成および編集タスクに取り組むインストラクションベースの拡散フレームワークである。
FLUX.1-Fill-devによって提案されたインペイントタスクの入力形式にヒントを得て、ACEに導入されたLong-context Condition Unit(LCU)を改善する。
画像生成の先行を最大限に活用するために,強力なテキスト・画像拡散モデルを微調整する作業を最小限に抑えるための2段階のトレーニング手法を開発した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:40:58 GMT)
Multi-layer Radial Basis Function Networks for Out-of-distribution Detection [39.2] 放射基底関数ネットワーク(RBFN)は本質的に分類信頼度とOOD検出をリンクする。
我々は、容易に訓練できる多層ラジアル基底関数ネットワーク(MLRBFN)を開発した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:11:42 GMT)
GS-DiT: Advancing Video Generation with Pseudo 4D Gaussian Fields through Efficient Dense 3D Point Tracking [38.1] ビデオ拡散変換器(DiT)を直接訓練して4Dコンテンツを制御するには、高価なマルチビュービデオが必要である。
モノクロ・ダイナミック・ノベル・ビュー・シンセサイザー (MDVS) に触発され, 擬似4次元ガウス場を映像生成に適用した。
プレトレーニング済みのDiTを微調整して、GS-DiTと呼ばれるレンダリングされたビデオのガイダンスに従ってビデオを生成する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:55:33 GMT)
Pamba: Enhancing Global Interaction in Point Clouds via State Space Model [37.4] 我々は、SSMベースのアーキテクチャであるMambaをポイントクラウドドメインに導入し、線形複雑性の下で強力なグローバルモデリング機能を備えた新しいアーキテクチャであるPambaを提案する。
Pambaは、ScanNet v2、ScanNet200、S3DIS、nuScenesなど、いくつかの3Dポイントクラウドセグメンテーションタスクの最先端結果を取得する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:32:16 GMT)
LLM-Forest: Ensemble Learning of LLMs with Graph-Augmented Prompts for Data Imputation [37.1] 巨大なコーパスで訓練された大規模言語モデル(LLM)は、データ生成に強い可能性を示している。
筆者らは,自信に基づく重み付き投票を伴う,数発の学習用LLM"ツリー"の"フォレスト"を導入した,新しいフレームワーク LLM-Forest を提案する。
このフレームワークは、2部情報グラフという新しい概念に基づいて構築され、高品質な関連する隣り合うエントリを識別する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 00:33:08 GMT)
RTLMarker: Protecting LLM-Generated RTL Copyright via a Hardware Watermarking Framework [37.0] 本稿では, RTL コードに透かしを埋め込んだハードウェア透かしフレームワーク RTLMarker を提案する。
本稿ではルールベースのVerilogコード変換を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:38:28 GMT)
IRIS: A Bayesian Approach for Image Reconstruction in Radio Interferometry with expressive Score-Based priors [36.1] 本稿では,Score-based model (IRIS) を用いたラジオ干渉計測のためのイメージングについて紹介する。
我々は、紫外線空間におけるガウス確率と組み合わせて、銀河の光学像に基づいて訓練されたスコアベースモデルを用いて、原始惑星円盤の像を推測する。
従来の電波干渉画像アルゴリズムと比較して,この枠組みの利点を実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:11:53 GMT)
TrackGo: A Flexible and Efficient Method for Controllable Video Generation [33.6] 条件付きビデオ生成に自由形マスクと矢印を利用する新しい手法であるTrackGoを紹介する。
また、時間的自己注意層にシームレスに統合されるように設計された効率的で軽量なアダプタである、制御実装のためのTrackAdapterを提案する。
実験の結果,新しい手法はTrackAdapterによって強化され,FVD,FID,MCスコアなどの重要な指標における最先端のパフォーマンスが得られた。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:45:44 GMT)
Revisiting Tampered Scene Text Detection in the Era of Generative AI [33.4] 提案手法は,視覚的および見えない偽造型の両方を識別する能力について,法医学モデルの評価を行う。
本稿では,画像中の選択したテキストのテクスチャを微調整し,これらの領域を特定するためにモデルを訓練する,新しい効果的なトレーニングパラダイムを提案する。
また,テキストの特徴を識別することで,オープンセットの一般化を改善するフレームワークであるDAFを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 19:32:17 GMT)
The Dark Side of Rich Rewards: Understanding and Mitigating Noise in VLM Rewards [31.8] VLM(Vision-Language Models)は、エンボディエージェントを訓練するための報酬信号を生成するために使われるようになっている。
我々の研究によると、VLM報酬によって誘導されるエージェントは、本質的な報酬のみを使用するエージェントに比べて、しばしばパフォーマンスが劣っている。
ノイズを緩和する新しい報奨関数であるBiMIを導入する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:03:34 GMT)
Intent-Aware DRL-Based NOMA Uplink Dynamic Scheduler for IIoT [30.1] 産業用インターネット・オブ・モノのユーザ機器(IIoT UE)を意図的(QoS要求品質)とランダムなトラフィック到着で支援する問題について検討する。
利用可能な通信資源のスケジューリング方法を学ぶために,DRLに基づく時間周波数リソースの集中型動的スケジューラを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:51:55 GMT)
Graph Structure Learning for Spatial-Temporal Imputation: Adapting to Node and Feature Scales [29.5] 空間時間インプット(GSLI)のためのマルチスケールグラフ構造学習フレームワークについて紹介する。
本フレームワークは,異なる特徴の異なるグローバル空間相関に対応するために,ノードスケールグラフ構造学習を包含する。
我々のフレームワークは、プロミネンスモデリングと統合され、計算過程においてより重要なノードと特徴を強調します。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:30:45 GMT)
NushuRescue: Revitalization of the Endangered Nushu Language with AI [28.3] NushuRescueは、最小限のデータで絶滅危惧言語上で大きな言語モデルをトレーニングするために設計された、AI駆動のフレームワークである。
我々は,500文のNushu- Chinese並列コーパスであるNCGoldを開発した。
ヌシュレスキューは50の文に対して48.69%の翻訳精度を達成し、異なる長さの98の漢文を新たに翻訳したNASilverを作成した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:55:05 GMT)
Test-time Computing: from System-1 Thinking to System-2 Thinking [28.1] テストタイムコンピューティングの概念をSystem-1モデルに遡る。
システム1モデルからシステム2モデルへの移行において,テストタイムコンピューティングが果たす重要な役割を強調した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:24:20 GMT)
Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware Decoding [27.5] コードスイッチング自動音声認識(ASR)はアクセント、聴覚的類似性、シームレスな言語スイッチによる言語混乱による課題に直面している。
我々は,大規模多言語事前学習音声認識モデルであるWhisperを,エンコーダ部とデコーダ部の両方からCSに適応させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:55:00 GMT)
NeurDB: On the Design and Implementation of an AI-powered Autonomous Database [27.1] 本稿では,AIによる自律データベースNeurDBを紹介する。
NeurDBは、データとワークロードのドリフトへの適応性を備えた、AIとデータベースの融合をさらに深める。
実証的な評価によると、NeurDBはAI分析タスクの管理において、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:52:40 GMT)
SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.2] 本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案するフレームワークを5つのテキスト・テキスト・ベンチマークで評価する。
本手法はベースラインモデルの性能を継続的に向上させる。
私たちのフレームワークは、他の高度なメソッドよりもトークン効率が高いので、より競争力があります。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:05:57 GMT)
LoRaConnect: Unlocking HTTP Potential on LoRa Backbones for Remote Areas and Ad-Hoc Networks [26.2] LoRaネットワーク上でのWebアクセスを可能にするLoRaWebを提案する。
LoRaWebハードウェアは、クライアントデバイスが接続し、Webブラウザを使用してWebページにアクセスするWiFiホットスポットをテザリングする。
LoRaWebは、要求者と応答者の間の効果的なメッセージ交換の課題に対処するための同期手順を実装している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:41:53 GMT)
DeTrack: In-model Latent Denoising Learning for Visual Object Tracking [25.0] 本稿では,視覚的物体追跡問題を認知学習プロセスとして定式化するための新しいパラダイムを提案する。
拡散モデルにインスパイアされた学習は、目に見えないデータに対するモデルの堅牢性を高める。
境界ボックスにノイズを導入し、トレーニング用ノイズボックスを生成し、テストデータに対するモデルロバスト性を向上する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:28:50 GMT)
Towards Urban General Intelligence: A Review and Outlook of Urban Foundation Models [24.9] 機械学習技術の統合は、インテリジェントな都市サービスの発展の基盤となっている。
ChatGPTのような基盤モデルの最近の進歩は、機械学習と人工知能の分野でパラダイムシフトをもたらした。
UFM(Urban Foundation Models)に注目が集まる一方で、急速に発展するこの分野は重要な課題に直面している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:45:51 GMT)
Partial Identifiability for Domain Adaptation [24.1] iMSDAと呼ばれる実用的なドメイン適応フレームワークを提案する。
iMSDAは、ベンチマークデータセット上で最先端のドメイン適応アルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:30:30 GMT)
Remote Inference over Dynamic Links via Adaptive Rate Deep Task-Oriented Vector Quantization [24.1] 本稿では、動的リンク上のリモート推論に適した学習圧縮機構である適応レートタスク指向ベクトル量子化(ARTOVeQ)を提案する。
我々は、ARTOVeQが連続的な改良原理によって徐々に洗練される低レイテンシ推論をサポートするように拡張されていることを示す。
数値的な結果から,提案手法は複数のレートで動作し,幅広いビット予算をサポートする遠隔深部推論を実現し,より多くのビットを交換して徐々に改善する高速推論を容易にする。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:38:13 GMT)
From Chain to Tree: Refining Chain-like Rules into Tree-like Rules on Knowledge Graphs [24.0] 本稿では,知識グラフのツリーライクなルールの概念を提案し,適用範囲を拡大する。
本稿では,チェーンライクなルールをツリーライクなルールに書き換えるための効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:42:29 GMT)
FedRSClip: Federated Learning for Remote Sensing Scene Classification Using Vision-Language Models [23.8] 本稿では,VLM,特にCLIPに基づくリモートセンシング画像分類のための最初のフェデレーション学習フレームワークであるFedRSCLIPを提案する。
FedRSCLIPは、Prompt Learningを導入することで、フェデレーション環境におけるデータ不均一性と大規模モデル伝送の課題に対処する。
提案モデルの有効性を検証するため,既存の3つのリモートセンシング画像分類データセットに基づいてFed-RSICデータセットを構築した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:10:27 GMT)
Exploring Gradient Subspaces: Addressing and Overcoming LoRA's Limitations in Federated Fine-Tuning of Large Language Models [22.0] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,直接重み付けと併用したGaLoreの方が,FlexLoRAやFFA-LoRAといったフェデレートされたLoRA法よりも,テキストや画像のモダリティが優れていることが示唆された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:22:03 GMT)
Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants [21.8] 本稿では,3段階の能力を含む階層型能力分類法を提案する。
新しいベンチマークの問題を発生させるために、セミオートマチックなデータパイプラインを構築します。
メインストリームのマルチモーダル大言語モデル(MLLM)について,Face-Human-Benchを用いて評価を行った。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:42:36 GMT)
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities [21.7] BiGRは、生成訓練のためのコンパクトなバイナリ潜在符号を用いた、新しい条件付き画像生成モデルである。
BiGRは、同じフレームワーク内で生成と識別を統一する最初の条件付き生成モデルである。
以上の結果から,BiGRは生成的・識別的タスクを効果的に統合し,さらなる発展の道を開くことが示唆された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:51:24 GMT)
Towards Omni-RAG: Comprehensive Retrieval-Augmented Generation for Large Language Models in Medical Applications [21.5] 大規模言語モデル(LLM)は、医療上の課題に対処する約束を持っているが、医療知識の限られた統合のために幻覚を引き起こすことが多い。
この課題に対して,多様な知識ソースの属性に合わせてコンテキストに適合したクエリを定式化することが課題である。
既存のアプローチは、ソース計画を見落としているか、モデルがソースと実際のコンテンツに対する期待を誤っているため、効果的にそれを達成することができないかのいずれかである。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:03:14 GMT)
Interactive Information Need Prediction with Intent and Context [21.0] 本研究では,事前検索コンテキストを選択することで,ユーザの情報ニーズをインタラクティブに予測する方法について検討する。
この予測プロセスは多くのケースで可能であり、ユーザが提供する部分探索インテントは、大規模な事前検索コンテキストを緩和するのに役立ちます。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 19:47:57 GMT)
Can Impressions of Music be Extracted from Thumbnail Images? [20.6] 音楽データとそれに対応する自然言語記述からなる大規模な公開データセットは、音楽キャプションとして知られています。
音楽サムネイル画像から推定される非音楽的側面を取り入れた音楽キャプションデータを生成する手法を提案する。
非音楽的側面を含む約360,000字幕のデータセットを作成し,音楽検索モデルを訓練した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:51:38 GMT)
MetaNeRV: Meta Neural Representations for Videos with Spatial-Temporal Guidance [20.2] 未確認ビデオの高速NeRV表現のための新しいフレームワークであるMetaNeRVを提案する。
本稿では,MetaNeRVの表現能力を向上させるための時空間ガイダンスを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:12:30 GMT)
Investigating Large Language Models for Code Vulnerability Detection: An Experimental Study [20.1] システムのセキュリティ問題に対処し、予防するためには、コードの脆弱性検出が不可欠である。
従来の学習ベースの脆弱性検出方法は、微調整された中規模シーケンスモデルか、スクラッチから小さなニューラルネットワークをトレーニングするどちらかに依存していた。
大規模事前学習言語モデル(LLM)の最近の進歩は、様々なコードインテリジェンスタスクにおいて顕著な機能を示した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:59:57 GMT)
From Aleatoric to Epistemic: Exploring Uncertainty Quantification Techniques in Artificial Intelligence [19.4] 不確実性定量化(英: Uncertainty Quantification、UQ)は、人工知能(AI)システムにおいて重要な側面である。
本稿では,AIにおける不確実性定量化技術の進化について概説する。
様々な分野におけるUQの多様な応用について検討し、意思決定、予測精度、システムの堅牢性への影響を強調した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:14:47 GMT)
SemiEpi: Self-driving, Closed-loop Multi-Step Growth of Semiconductor Heterostructures Guided by Machine Learning [19.2] SemiEpiは、半導体ヘテロ構造の分子線エピタキシー(MBE)成長を実行するために設計された自動運転プラットフォームである。
SemiEpiは最適な初期条件を特定し、多段階ヘテロ構造成長実験を提案する。
InAs量子ドット(QD)ヘテロ構造の成長を最適化し、SemiEpiのパワーを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:05:05 GMT)
Transformers Simulate MLE for Sequence Generation in Bayesian Networks [18.9] In-context maximum max estimation (MLE) に基づくベイズネットワークにおける変圧器の自己回帰生成機能について検討する。
ベイジアンネットワークの条件確率を文脈に応じて推定できる単純な変圧器モデルが存在することを実証する。
さらに、このような変圧器が理論上存在するだけでなく、訓練を通じて効果的に得られることを、広範な実験で実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:56:51 GMT)
Learning Spectral Methods by Transformers [18.9] 多層トランスフォーマーは、十分な数の事前学習インスタンスを与えられた場合、アルゴリズム自体を学習可能であることを示す。
この学習パラダイムは、コンテキスト内学習設定とは異なるものであり、人間の脳の学習手順と似ている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:27:55 GMT)
Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence Benchmarks [18.6] 本研究は,テキスト対敵防衛のための広範囲なベンチマークを提示する。
我々のベンチマークでは、幅広いデータセットを取り込み、最先端の防御メカニズムを評価し、重要なタスクを含むように評価を拡張している。
この領域でベンチマークを行うための新しい標準を確立することで、より堅牢で信頼性の高い自然言語処理システムへの進歩を加速することを目指している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:39:52 GMT)
On Finding Small Hyper-Gradients in Bilevel Optimization: Hardness Results and Improved Analysis [18.1] 双レベル最適化は、そうでなければ斜め最適化問題の内部構造を明らかにする。
双レベル最適化における共通のゴールは、要素の集合の解に暗黙的に依存する超対象である。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 06:43:46 GMT)
SRAGAN: Saliency Regularized and Attended Generative Adversarial Network for Chinese Ink-wash Painting Generation [17.2] 本論文は、実際の絵を中国の伝統的な墨画に翻訳する問題に対処する。
本稿では、画像コンテンツを正規化するために、不適切なI2Iフレームワークに塩分検出を組み込むことを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:27:15 GMT)
Revolutionizing Encrypted Traffic Classification with MH-Net: A Multi-View Heterogeneous Graph Model [16.8] MH-Netは、マルチビューの不均一なトラフィックグラフを利用する、ネットワークトラフィックを分類するための新しいアプローチである。
我々は、学習したトラフィック単位表現の堅牢性を強化するために、マルチタスク方式でコントラスト学習を採用する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:50:41 GMT)
A Survey of RWKV [16.6] Receptance Weighted Key Value (RWKV)モデルは、Transformerアーキテクチャに代わる新しい選択肢を提供する。
自己アテンションに大きく依存する従来のトランスフォーマーとは異なり、RWKVは最小限の計算要求で長距離依存を捕捉する。
本稿では,このギャップを,RWKVアーキテクチャとその基本原理,および様々な応用の総合的なレビューとして埋めようとしている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:54:06 GMT)
Gradient Weight-normalized Low-rank Projection for Efficient LLM Training [16.0] 大規模言語モデル(LLM)は様々なタスクにおいて顕著な性能を示してきたが、計算資源に対する需要の増大は大きな課題となっている。
これを解決するために、パラメータ効率のよい微細チューニング法(PEFT)が開発されているが、完全な微細チューニングに比べて性能が劣ることが多い。
我々はGradNormLoRPを導入し、パラメータとメモリ効率を両立させながら、完全な微調整に匹敵する性能を維持した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:12:27 GMT)
Energy Optimization of Multi-task DNN Inference in MEC-assisted XR Devices: A Lyapunov-Guided Reinforcement Learning Approach [15.9] 仮想と現実世界を融合した拡張現実(XR)は、未来のネットワークの重要な応用である。
我々は、マルチタスク推論のための分散キューモデルを開発し、リソース競合問題とキュー結合の問題に対処した。
我々は、XR機器の消費電力を最小限に抑えるために、リアプノフ誘導近似最適化アルゴリズム(LyaPPO)を考案した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:07:41 GMT)
Look Before You Leap: An Exploratory Study of Uncertainty Measurement for Large Language Models [15.7] 本研究では,不確実性のレンズを用いたLarge Language Models(LLM)のリスク評価について検討する。
本研究は,LLMの不確かさ・非実効性予測に対する不確実性推定の有効性を検証した。
我々の研究から得た洞察は、信頼性の高いLCMの設計と開発に光を当てた。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 06:15:04 GMT)
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.7] 最適化モデルのための半自動データ合成フレームワークOR-Instructを紹介する。
また,実用的なOR問題を解く上で,LLMを評価するための最初の産業ベンチマークであるIndustrialORを紹介した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:35:49 GMT)
KnowRA: Knowledge Retrieval Augmented Method for Document-level Relation Extraction with Comprehensive Reasoning Abilities [15.6] 文書レベルの関係抽出(Doc-RE)は、複数の文にわたるエンティティ間の関係を抽出することを目的としている。
既存のDoc-REメソッドのほとんどは、単一推論能力を最適化することに重点を置いている。
外部知識を受け入れるか否かを自律的に判断するために,知識検索強化手法である KnowRA が提案された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 17:22:02 GMT)
AHMSA-Net: Adaptive Hierarchical Multi-Scale Attention Network for Micro-Expression Recognition [15.0] マイクロ圧縮認識のための適応階層型マルチスケールアテンションネットワーク(AHMSA-Net)を設計する。
AHMSA-Netはアダプティブ階層フレームワークとマルチスケールアテンションメカニズムの2つの部分から構成される。
AHMSA-Netは、複合データベース上で78.21%の認識精度を達成している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:40:12 GMT)
Protected Test-Time Adaptation via Online Entropy Matching: A Betting Approach [15.0] オンライン自己学習によるテスト時間適応のための新しい手法を提案する。
提案手法は,マーチンガレットとオンライン学習の概念を組み合わせることで,分布変化に反応可能な検出ツールを構築する。
実験結果から, 分散シフト時のテスト時間精度は, 精度とキャリブレーションを保ちながら向上することが示された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:20:03 GMT)
A Statistical Hypothesis Testing Framework for Data Misappropriation Detection in Large Language Models [14.8] 我々は,LLMが他のLLMが生成したデータを組み込んだかどうかを判断するために,データ誤り検出の問題に焦点をあてる。
この問題に対処するため,著作権付きトレーニングデータに透かしを埋め込む手法を提案し,仮説テスト問題としてデータ誤用の検出を定式化する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:47:42 GMT)
Watch Video, Catch Keyword: Context-aware Keyword Attention for Moment Retrieval and Highlight Detection [14.8] ビデオモーメント検索とハイライト検出の目標は、与えられたテキストクエリに基づいて特定のセグメントとハイライトを特定することである。
この制限を克服する新しいビデオコンテキスト対応キーワードアテンションモジュールを提案する。
視覚的特徴とテキスト的特徴の微妙なアライメントを高めるために,キーワード認識型コントラスト学習を用いたキーワード重み検出モジュールを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:01:27 GMT)
Bayesian Optimization of Functions over Node Subsets in Graphs [14.7] グラフ上での最適化のための新しいフレームワークを提案する。
元のグラフの各$k$-nodeを、新しいグラフのノードにマップします。
人工環境と実環境環境の両方における実験により,提案したBOフレームワークの有効性が示された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 02:21:19 GMT)
Distilling Desired Comments for Enhanced Code Review with Large Language Models [14.1] 本稿では,コードレビューデータセットからDRCを識別することで,蒸留データセットを自動構築するデータセット蒸留手法Desiviewを提案する。
150K以上のレビューエントリからなるCodeReviewerデータセットの実験では、Desiviewは88.93%、80.37%、86.67%、84.44%の精度、リコール、正確性、F1という印象的なパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 06:20:51 GMT)
LWFNet: Coherent Doppler Wind Lidar-Based Network for Wind Field Retrieval [13.8] コヒーレントドップラー・ウィンドライダー(CDWL)は,高空間・時間分解能風速検出において最も適した手法であると考えられている。
スペクトルセントロイド推定のような伝統的な手法は、高高度での信頼性と正確な風の回収結果が得られないことが多い。
本稿では,Transformer と Kolmogorov-Arnold ネットワークをベースとした最初のLidar-based Wind Field (WF) 検索ニューラルネットワーク LWFNet を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 17:55:11 GMT)
BeSplat: Gaussian Splatting from a Single Blurry Image and Event Stream [13.6] 3D Gaussian Splatting (3DGS)は、長いトレーニング時間や遅いレンダリング速度といった重要な課題に効果的に対処している。
本研究では,1つの動きブル画像とそれに対応するイベントストリームから,シャープな放射場(ガウススプラッツ)の回復を実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:19:48 GMT)
Depth Any Camera: Zero-Shot Metric Depth Estimation from Any Camera [13.5] 本稿では,強力なゼロショット距離深度推定フレームワークであるDepth Any Camera (DAC)について述べる。
このフレームワークは、新しいアプリケーションで使用される特定のカメラタイプに関係なく、既存の3Dデータをすべて活用できるように設計されている。
DACは最先端のゼロショット距離推定を達成し、複数の魚眼および360度データセットでデルタ-1の精度を最大50%向上させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:22:40 GMT)
Automated Security Response through Online Learning with Adaptive Conjectures [13.3] 我々はITインフラに対する自動セキュリティ対応について研究する。
我々は攻撃者とディフェンダーとの相互作用を部分的に観察された非静止ゲームとして定式化する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:16:19 GMT)
Efficient Deployment of Large Language Models on Resource-constrained Devices [12.6] 様々な下流タスクのために、リソース制約されたデバイス上でLLM(Large Language Models)を微調整する必要がある。
FedSpineは、PEFT(Efficient Fine-Tuning)と構造化プルーニングを組み合わせたフレームワークで、リソース制約のあるデバイスにLLMを効率的にデプロイする。
我々はFedSpineが1.4Times$$$timesで微調整を高速化し、最終的な精度を他のベースラインと比べて同じ間隔で0.4%-4.5%向上できることを示した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:38:11 GMT)
Neural Reflectance Fields for Radio-Frequency Ray Tracing [12.5] レイトレーシングは複雑な環境下での高周波(RF)信号の伝搬をモデル化するために広く用いられている。
送信機から受信機へのRF信号の経路損失から材料反射率を効率的に学習することでこの問題に対処する。
RF信号の振幅と位相の両方をモデル化することにより、光からRF領域への神経反射場をモデル化する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 06:52:35 GMT)
Distillation Learning Guided by Image Reconstruction for One-Shot Medical Image Segmentation [12.3] 1ショットの医用画像分割法(MIS)は、しばしば登録エラーや低品質の合成画像に悩まされる。
知識蒸留に基づく新しいワンショットMISフレームワークを提案する。
これは、画像再構成によって導かれる蒸留プロセスを通じて、ネットワークが実際の画像を直接「見る」ことを可能にする。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:21:11 GMT)
Denoising Variational Autoencoder as a Feature Reduction Pipeline for the Diagnosis of Autism based on Resting-state fMRI [11.9] 静止状態fMRIデータを用いた特徴量削減パイプラインを提案する。
rs-fMRIから機能接続データを抽出するためにクラドック・アトラスとパワー・アトラスを用いた。
変分オートエンコーダを用いることで,提案したパイプラインは接続機能を5つの潜在ガウス分布に圧縮する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:50:03 GMT)
Incentive-Compatible Federated Learning with Stackelberg Game Modeling [11.9] 適応ガンマベースのStackelbergゲームに基づく新しいフェデレートラーニングフレームワークであるFLammaを紹介する。
当社のアプローチでは、サーバがリーダとして機能し、動的に崩壊要因を調整し、クライアントはフォロワーとして、その効用を最大化するローカルエポックの数を最適に選択します。
時間が経つにつれて、サーバはクライアントの影響を徐々にバランスさせ、最初は高いコントリビューションのクライアントに報酬を与え、その影響を徐々にレベルアップさせ、システムをStackelberg Equilibriumに誘導する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:04:41 GMT)
An Analysis Framework for Understanding Deep Neural Networks Based on Network Dynamics [11.4] ディープニューラルネットワーク(DNN)は、ディープ層にまたがる異なるモードのニューロンの割合を合理的に割り当てることで、情報抽出を最大化する。
このフレームワークは、"フラット・ミニマ効果(flat minima effect)"、"グロッキング(grokking)"、二重降下現象(double descend phenomena)など、基本的なDNNの振る舞いについて統一的な説明を提供する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:23:21 GMT)
Efficient Graph Condensation via Gaussian Process [11.3] グラフ凝縮は、性能を維持しながら大きなグラフのサイズを減らす。
既存の手法はしばしば二段階最適化に依存しており、広範囲なGNNトレーニングとスケーラビリティの制限を必要とする。
本稿では,ガウス過程を用いたグラフ凝縮法(GCGP)を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:43:07 GMT)
Toward Attention-based TinyML: A Heterogeneous Accelerated Architecture and Automated Deployment Flow [11.1] 我々は、オクタコアクラスタと量子化されたアテンションのためのアクセラレータを備えた小さなMLパワーエンベロープで、アテンションベースのモデルを実証する。
デプロイメントフローにより,エンド・ツー・エンドの8ビットトランスフォーマー推定が可能となり,2960 GOp/J,154 GOp/sの先進エネルギー効率とスループットを実現した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:01:18 GMT)
Actively Learning Combinatorial Optimization Using a Membership Oracle [10.8] 会員オラクルを用いて未知の線形制約を用いて最適化問題を解くことを検討する。
意思決定者の目標は、オラクルの呼び出し数に関する予算の対象となる最善の解決策を見つけることである。
代用線形制約を学習し、活用することで問題を解決するために、古典的なフレームワークを適応させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:06:42 GMT)
Backdoor Token Unlearning: Exposing and Defending Backdoors in Pretrained Language Models [10.0] トレーニング期間中にトリガトークンを積極的に検出・中和するバックドアトークンアンラーニング(BTU)と呼ばれる新しい防衛手法を提案する。
裏口学習は, 単語埋め込み層において, 裏口トークンパラメータとクリーントークンパラメータの区別を生じさせ, 裏口攻撃の成功は裏口トークンパラメータに大きく依存する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:22:13 GMT)
Towards Decoding Developer Cognition in the Age of AI Assistants [9.9] 本稿では,生理的計測(EEGとアイトラッキング)とインタラクションデータを組み合わせて,AI支援プログラミングツールの開発者による使用状況を調べるための制御された観察的研究を提案する。
私たちは、認知負荷とタスク完了時間を計測しながら、AIアシストの有無に関わらず、プログラムタスクを完了させるために、プロの開発者を募集します。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:25:21 GMT)
AMM: Adaptive Modularized Reinforcement Model for Multi-city Traffic Signal Control [9.9] 交通信号制御(TSC)は重要かつ広く研究されている方向である。
実世界の交通環境における実験の膨大なコストのため, 実世界への強化学習(RL)手法の適用は困難である。
1つの可能な解決策は、トレーニングされたモデルをターゲット環境に適応させるTSCドメイン適応である。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:59:08 GMT)
Hengqin-RA-v1: Advanced Large Language Model for Diagnosis and Treatment of Rheumatoid Arthritis with Dataset based Traditional Chinese Medicine [9.4] 本稿では,中国伝統医学(TCM)に特化した最初の大規模言語モデルであるHengqin-RA-v1を紹介する。
また,古代中国医学文献,古典文献,現代臨床研究から収集したRA特異的データセットであるHQ-GCM-RA-C1も紹介した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:46:51 GMT)
TAPAS: Thermal- and Power-Aware Scheduling for LLM Inference in Cloud Platforms [9.4] 生成型大規模言語モデル(LLM)の需要の増加は、クラウドにおける熱と電力管理に課題をもたらしている。
本研究では,クラウド上でのLLM推論クラスタを対象としたサーマルアウェアフレームワークであるTAPASを提案する。
大規模GPUクラスタに対する評価は, 熱・パワースロットリング現象を著しく低減し, システム効率を向上することを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:51:17 GMT)
Query3D: LLM-Powered Open-Vocabulary Scene Segmentation with Language Embedded 3D Gaussian [9.3] 本稿では,自律運転におけるオープンな3次元シーンクエリのための新しい手法を提案する。
そこで我々は,Large Language Models (LLMs) を用いて,文脈的に正のフレーズを生成するとともに,肯定的な単語によるセグメンテーションとシーン解釈を支援することを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 19:09:04 GMT)
Bias Unveiled: Investigating Social Bias in LLM-Generated Code [9.1] 大規模言語モデル(LLM)は、自動コード生成の分野を大幅に進歩させた。
本研究では,LLM生成コードの社会的バイアスの評価と緩和を目的とした,新しいフェアネスフレームワークであるSolarを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:21:23 GMT)
Towards Multimodal Metaphor Understanding: A Chinese Dataset and Model for Metaphor Mapping Identification [9.1] 我々は、特定のターゲットドメインとソースドメインのアノテーションを含む中国のマルチモーダルメタファー広告データセット(CM3D)を開発した。
我々は,これらのマッピングを識別するための認知過程をシミュレートする,CPMMIM (Chain-of-NLP) Prompting-based Metaphor Mapping Identification Model) を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:15:03 GMT)
The Meta-Representation Hypothesis [9.0] 人間は抽象的推論を行うために高いレベルのメタ表現に依存している。
メタ表現学習による一般化性能の利点を示す。
また、エージェント間の深層相互学習(DML)がメタ表現に収束するのに役立つと仮定する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:06:17 GMT)
Traits of a Leader: User Influence Level Prediction through Sociolinguistic Modeling [8.9] 本研究では,人口統計と人格データを活用することで,ベースラインを大幅に上回るモデルを構築した。
このアプローチは、8つの異なるドメインのランクDCGスコアを一貫して改善する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 22:37:19 GMT)
From thermodynamics to protein design: Diffusion models for biomolecule generation towards autonomous protein engineering [8.2] まず拡散モデルの定義と特徴を述べ,拡散確率モデルとスコアベース生成モデルという2つの戦略に焦点をあてる。
タンパク質設計、ペプチド生成、薬物発見、タンパク質-リガンド相互作用におけるそれらの応用について論じる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 22:36:43 GMT)
FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance [7.9] 視覚トークン列の長さを削減するために設計された,シンプルで効果的なプラグアンドプレイモジュールであるFOLDERを紹介する。
我々は、異なる還元戦略によってもたらされた情報損失を分析し、視覚的冗長性を取り除きながら鍵情報を保存するFOLDERを開発した。
FOLDERは、オリジナルのモデルと同等またはそれ以上のパフォーマンスを達成すると同時に、最大70%のビジュアルトークンを削除することで、複雑さを劇的に低減する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:28:45 GMT)
On Uniform, Bayesian, and PAC-Bayesian Deep Ensembles [7.9] 本研究では,ベイズアンサンブルのサンプリングと重み付けは,特に一般化性能の向上に適していないという議論をレビューする。
2次PAC-ベイジアン一般化境界の最小化により重みが最適化されるモデルの重み付き平均は、一般化を改善することができることを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:17:09 GMT)
A system for objectively measuring behavior and the environment to support large-scale studies on childhood obesity [7.6] 複数の行動・環境指標を収集・抽出する統合システムを提案する。
私たちのゴールは、設計原則、実装プロセス、統合アルゴリズムの評価に関する詳細な説明を提供することです。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:27:09 GMT)
CCIS-Diff: A Generative Model with Stable Diffusion Prior for Controlled Colonoscopy Image Synthesis [7.2] 拡散アーキテクチャに基づく高品質な大腸内視鏡画像合成のための制御された生成モデルを提案する。
本手法は, 臨床記述に適合するポリープの空間特性(ポリープ位置と形状)と臨床特性の両方を正確に制御する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:10:02 GMT)
Observation-Augmented Contextual Multi-Armed Bandits for Robotic Search and Exploration [6.6] 我々は、観測増強CMAB(OA-CMAB)と呼ばれるコンテキスト多重武装バンディット(CMAB)の新たな変種を導入する。
OA-CMABでは、外部観測は文脈特徴の関数であり、観測結果の上に隠れパラメータを推測する証拠を提供する。
我々は最近開発された確率論的セマンティック・アソシエーション技術に基づいて,OA-CMABに対する頑健なベイズ推定過程を導出する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:52:37 GMT)
HonkaiChat: Companions from Anime that feel alive! [6.5] 本稿では,会話プロンプトに動的イベントを埋め込むことにより,制約に対処するイベント駆動対話フレームワークを提案する。
覚醒を減らしながら、会話のエンゲージメントと自然さを著しく向上させることが、イベント駆動のプロンプトによって示される。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:02:02 GMT)
A Semantically-Aware, Kernel-Enhanced, and Divergence-Rich Paradigm for Direct Preference Optimization [6.3] 大規模言語モデル(LLM)は、多くのアプリケーションをアンロックしただけでなく、様々な値や好みと整合させることの難しさも浮き彫りにしている。
直接選好最適化(DPO)は、アライメントの中心であるが、固定された発散と限られた特徴変換によって制約される。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 00:08:52 GMT)
Fitting Different Interactive Information: Joint Classification of Emotion and Intention [6.1] 本稿では,ICASSP MEIJU@2025 Track I において,低リソースマルチモーダル感情と意図認識に着目した最初のソリューションである。
本稿では,ラベル付きデータで訓練されたモデルを用いて擬似ラベルラベリングを行い,信頼性の高いサンプルとラベルを選択し,低リソースの問題を緩和する。
改良された処理データに基づき,テストセットのスコア0.5532を達成し,トラックのチャンピオンシップを勝ち取る。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:23:27 GMT)
Unsupervised Search for Ethnic Minorities' Medical Segmentation Training Set [5.9] 本稿では、医療画像におけるデータセットバイアスの重大な問題について、特に人種差に着目して検討する。
分析の結果, 医学的セグメンテーションデータセットは, 主に収集部位の人口構成に影響され, かなり偏りがあることが判明した。
本稿では,過小評価された人種グループに焦点をあてて,これらのバイアスを減らすことを目的とした,新たなトレーニングセット検索戦略を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:04:47 GMT)
Autoencoders in Function Space [5.6] オートエンコーダは、元の決定論的形式と変分的定式化(VAE)の両方に広く応用されている。
本稿では,自動エンコーダ(FAE)と変分自動エンコーダ(FVAE)の関数空間バージョンを導入し,解析し,展開する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 17:14:53 GMT)
A New Interpretation of the Certainty-Equivalence Approach for PAC Reinforcement Learning with a Generative Model [5.2] 本稿では,CEMが実際にTTMの応用と見なされるという驚くべき発見に起因した理論的研究を提案する。
我々は,非定常MPPと定常MPPの双方に対して,CEMの試料複雑度上限を(3)改良した。
また, 有限ホライズン MDP に対する標本複雑性の低い値を示し, 非定常 MDP に対する上界の最小値最適性を確立する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:37:34 GMT)
Cracks in The Stack: Hidden Vulnerabilities and Licensing Risks in LLM Pre-Training Datasets [5.0] トレーニングデータの質を向上させるために,自動ソースコード自動計算手法を提案する。
Stack v2データセットを用いてこの手法を評価し,データセットのコードバージョンのうち17%に新しいバージョンがあることを確認した。
私たちは、AIツールが生成する出力の信頼性を高める可能性があり、自動データキュレーションのプロセス改善に刺激を与えることを期待しています。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:54:25 GMT)
Deep Transfer Learning: Model Framework and Error Analysis [4.9] 本稿では,単ドメインダウンストリームタスクに対して,サンプル$n$を多用したディープトランスファー学習のためのフレームワークを提案する。
我々のフレームワークは、ダウンストリームタスクに寄与するアップストリーム機能を明確に特定し、アップストリームドメインとダウンストリームタスクの間に明確な関係を確立する。
誤り解析により、下流教師ありタスクにおけるリプシッツ関数の学習における収束率を大幅に向上できることが示された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:45:00 GMT)
Unveiling the Threat of Fraud Gangs to Graph Neural Networks: Multi-Target Graph Injection Attacks Against GNN-Based Fraud Detectors [4.7] 最近の発見は、詐欺がギャングや集団としてますます組織化されていることを示唆している。
本研究では,詐欺集団が不正行為を虚偽化して不正なノードを良心と誤分類することを目的とした攻撃シナリオを設計する。
これらのシナリオに基づいて,実世界の3件の詐欺事件における詐欺集団の攻撃をシミュレートすることにより,GNNベースの詐欺検知器に対する敵攻撃について検討した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:40:43 GMT)
DenseGNN: universal and scalable deeper graph neural networks for high-performance property prediction in crystals and molecules [4.6] 本稿では,Dense Connectivity Network (DCN), Hierarchical Node-Edge-Graph Residual Networks (HRN), Local Structure Orders Embedding (LOPE)を活用するDenseGNNを紹介する。
DenseGNNは、JARVIS-DFT、Material Project、QM9などのデータセット上での最先端のパフォーマンスを実現し、GIN、Schnet、Hamnetといったモデルのパフォーマンスを改善している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:41:28 GMT)
An Integrated Artificial Intelligence Operating System for Advanced Low-Altitude Aviation Applications [4.6] 本稿では,低高度航空に適した高性能人工知能オペレーティングシステムを提案する。
リアルタイムタスク実行、計算効率、シームレスなモジュールコラボレーションといった重要な課題に対処する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:28:09 GMT)
Interpretable Neural ODEs for Gene Regulatory Network Discovery under Perturbations [4.6] 本稿では、生物学的に有意な神経常微分方程式(ニューラル・オード)を組み込んだ新しいフレームワークであるPerturbODEを提案し、摂動下での細胞状態の軌跡をモデル化する。
シミュレーションおよび実際の過剰表現データセット間での軌道予測とGRN推論におけるPerturbODEの有効性を実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:04:23 GMT)
Block-regularized 5$\times$2 Cross-validated McNemar's Test for Comparing Two Classification Algorithms [4.6] クロスバリデーション法はHO法を複数回繰り返し,安定な推定を行う。
ブロック規則化された5$times$2 CV (BCV) は、他のCV法よりも優れていることを示す多くの先行研究で示されている。
提案した5$times$2 BCV McNemarのシミュレーションおよび実世界のデータセットにおける有意な型I誤差と有望なパワーを実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:50:57 GMT)
Automated Detection of Epileptic Spikes and Seizures Incorporating a Novel Spatial Clustering Prior [4.4] センサの空間的位置に基づいて,まずMEGチャネルをクラスタリングするパラダイムを導入する。
次に、信号の空間的クラスタリングと時間的変化を統合するために、新しい畳み込み入力モジュールを設計する。
提案手法は,2つの中心から収集した大規模実世界のMEGデータセットであるSanbo-CMRのF1スコア94.73%を達成し,最先端のアプローチを1.85%上回った。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 02:06:13 GMT)
Improving Summarization with Human Edits [3.9] 本稿では,人間のフィードバック,すなわち人間編集に焦点をあてる。
トレーニングループにおいて,人文編集データとモデル生成データの両方を併用する新しい手法であるシーケンスアライメント(un)Likelihood Training(SALT)を提案する。
実験では、一般領域要約から医療領域要約まで、人間のフィードバック探索を拡張した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:33:16 GMT)
Simultaneous analysis of approximate leave-one-out cross-validation and mean-field inference [3.5] アロキシマト・リート・ワン・アウトインデックス・クロス・バリデーション (ALO-CV) は高次元状態における単一一般化の誤差を推定する手法である。
ALO-CVは、ALO-CVが残余量と線形誤差項に近似する証拠を提供する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:34:14 GMT)
Decoding fMRI Data into Captions using Prefix Language Modeling [3.4] 本稿では、DINOv2モデルによる画像の埋め込みを、対応するfMRI信号から予測することにより、脳信号を画像キャプションにデコードする方法を提案する。
また,fMRI信号から画像埋め込み空間への3次元畳み込みニューラルネットワークマッピングについて検討し,ボクセルの位置情報のより良い説明を行う。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:06:25 GMT)
LeetDecoding: A PyTorch Library for Exponentially Decaying Causal Linear Attention with CUDA Implementations [3.4] LeetDecodingは、基本的な演算子のための計算ルーチンの大規模なセットを提供する最初のPythonパッケージである。
LeetDecodingを使えば、研究者は因果線形注意を指数的に減衰させる新しい計算手法をベンチマークし評価することができる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:11:26 GMT)
On the Independence Assumption in Quasi-Cyclic Code-Based Cryptography [3.3] 最も効率的な提案は、構造化符号の復号化の難しさを前提としている。
HQCは2つの巡回ブロックからなる行列によって生成される準循環符号に基づいている。
準巡回符号の平均ケース削減に対する本結果の影響を考察する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:43:08 GMT)
MedSegDiffNCA: Diffusion Models With Neural Cellular Automata for Skin Lesion Segmentation [3.3] 本研究は拡散型医用画像分割のための3つのNAAに基づく改善を提案する。
Lesionセグメンテーションの評価によると、MultiCBAM-MedSegDiffNCAはUnetベースのモデル性能と87.84%のダイススコアで一致している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:54:27 GMT)
Enhancing Exploratory Learning through Exploratory Search with the Emergence of Large Language Models [3.2] 本研究では,探索探索戦略と探索学習理論を組み合わせることで,この複雑さを解き明かそうとする。
本研究は,高頻度探索とフィードバックループを取り入れたKolbの学習モデルに適応し,学生の深い認知・高次認知スキル開発を促進することを目的としている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:33:16 GMT)
TreeMatch: A Fully Unsupervised WSD System Using Dependency Knowledge on a Specific Domain [3.1] TreeMatchは、元々SemEval 2007 Task 7のデータを使って開発されたWSDシステムである。
システムは、ドメイン固有の知識ベースから引き出された依存性知識を使用して、完全に教師なしの手法に基づいている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:56:04 GMT)
Full error analysis of the random deep splitting method for nonlinear parabolic PDEs and PIDEs [3.0] 我々は[Beck, Becker, Cheridito, Jentzen, Neufeld (2021)で導入されたディープスプリッティングアルゴリズムのランダム化拡張を示す。
我々は高次元非線形放物型PDEと(おそらく)無限活動を持つジャンプを持つPIDEの両方をおよそ解くのに適したランダムニューラルネットワークを使用する。
特に, ランダムな深層分割法は, 10 万次元の非線形 PDE と PIDE をほぼ1秒で解くことができることを実証的に示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:26:18 GMT)
Learning Traffic Signal Control via Genetic Programming [3.0] 複雑な交差点における信号制御の新しい学習手法を提案する。
本手法では,各信号位相に対する位相緊急の概念を設計する。
緊急関数は、現在の道路条件に基づいて特定位相の位相緊急を算出することができる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:19:29 GMT)
GIT-CXR: End-to-End Transformer for Chest X-Ray Report Generation [2.9] 我々は,X線画像の高精度かつ実測的に完全なラジオグラフィーレポートを生成するために,エンドツーエンドのトランスフォーマーベースの手法を設計,評価した。
実験はMIMIC-CXR-JPGデータベースを用いて行われた。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:45:49 GMT)
Can the ontology of Bohmian mechanics consists only in particles? The PBR theorem says no [2.8] 波動関数の意味は、ボヘミア力学において未解決の問題である。
ノーモロジーの見解によれば、宇宙の波動関数や普遍波動関数はノーモロジーである。
PBR定理は、量子力学における波動関数やボヘミア力学における有効波動関数がオンティックであることを証明している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:05:38 GMT)
A no-go result for QBism [2.8] QBismでは、波動関数はエージェントの外の物理的現実の要素を表すのではなく、エージェントの個人的確率割り当てを表す。
本稿では,この波動関数の考え方が保護測定と一致していないことを論じる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:58:24 GMT)
Representation Learning of Lab Values via Masked AutoEncoder [2.8] 逐次的な実験値の計算のためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるLab-MAEを提案する。
MIMIC-IVデータセットの実験的評価は、Lab-MAEが最先端のベースラインを大幅に上回っていることを示している。
Lab-MAEは、患者の人口集団間で同等のパフォーマンスを達成し、臨床予測において公平性を向上させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:26:49 GMT)
Linear Optics to Scalable Photonic Quantum Computing [2.8] 量子フォトニクスの最近の進歩は、フォトニック量子コンピューティング(PQC)に大きな進歩をもたらした。
これらの進歩は理論ポテンシャルと実践的実装のギャップを埋め、PQCを計算、通信、量子センシングの変換技術として位置づける。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:59:58 GMT)
Rethinking IDE Customization for Enhanced HAX: A Hyperdimensional Perspective [2.7] 人-コンピュータインタラクションをモデル化するための超次元ベクトル空間を提案する。
これらの貢献は、統合開発環境(IDE)におけるHDコンピューティングの適用に関するさらなる研究を促すことを目的としている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:53:50 GMT)
How good nnU-Net for Segmenting Cardiac MRI: A Comprehensive Evaluation [2.6] 本研究では, 心臓磁気共鳴画像(MRI)における nnU-Net の性能評価を行った。
2D、3Dフル解像度、3Dロー解像度、3Dカスケード、3Dアンサンブルモデルなど、さまざまなnnU-Net構成を採用しています。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:13:21 GMT)
Advancing Super-Resolution in Neural Radiance Fields via Variational Diffusion Strategies [2.5] 本稿では,ニューラルレンダリングにおけるビュー一貫性超解像(SR)のための拡散誘導フレームワークを提案する。
提案手法は,既存の2次元SRモデルと,変分スコア蒸留(VSD)やLoRAファインチューニングヘルパなどの高度な技術を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:36:42 GMT)
Exploring a Datasets Statistical Effect Size Impact on Model Performance, and Data Sample-Size Sufficiency [2.4] 基礎的な記述的統計測度が、データセットが結果モデルのトレーニングにおいてどれだけ効果的かを示すことができるかどうかを、よりよく確かめるために行われた2つの実験について報告する。
以上の結果から,本手法は適切なサンプルサイズや投影モデルの性能を決定する上では有効ではないことが示唆される。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 22:03:46 GMT)
Swift Cross-Dataset Pruning: Enhancing Fine-Tuning Efficiency in Natural Language Understanding [2.4] 現在の微調整のためのクロスデータセットプルーニング技術は、しばしば計算に高価なサンプルランキングプロセスに依存している。
我々は,TF-IDF埋め込みと幾何中央値を用いたSwift Cross-Dataset Pruning (SCDP)を提案する。
6つの多様なデータセットに対する実験結果から,様々なタスクやスケールにまたがる手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:52:04 GMT)
Transfer learning via Regularized Linear Discriminant Analysis [2.3] 本稿では,正規化ランダム効果線形判別分析による新しい伝達学習手法を提案する。
これらの重みの値とそれに伴う分類誤差率を高次元設定で導出する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:25:37 GMT)
Evolving Skeletons: Motion Dynamics in Action Recognition [2.3] 我々は骨格グラフとハイパーグラフの表現を比較し、動き注入されたポーズに対する静的ポーズを解析する。
本研究は, テイラー変態骨格の強度と限界を強調し, 運動力学の強化の可能性を示した。
本研究は,運動量の多いデータを処理し,行動認識の分野を前進させる,革新的な骨格モデリング技術の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:16:10 GMT)
Predicting Customer Lifetime Value Using Recurrent Neural Net [2.2] 本稿では,SaaS(Software as a Service)アプリケーションにおけるユーザ寿命を予測するためのニューラルネットワークアプローチを提案する。
このアプローチは,買収(新規ユーザ)とローリング(既存ユーザ)のライフタイム値の両方を,さまざまな時間軸で予測するために適用される。
その結果, 絶対誤差の中央値と光勾配の上昇モデル, Buy Before You Dieモデルが有意に改善することが判明した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 04:13:48 GMT)
Developing Safe and Responsible Large Language Model : Can We Balance Bias Reduction and Language Understanding in Large Language Models? [2.1] 本研究では,大規模言語モデルが知識や理解を犠牲にすることなく,安全でバイアスのないアウトプットを生成できるかどうかを考察する。
Safe and Responsible Large Language Model (textbfSR$_textLLM$)を紹介する。
textbfSR$_textLLM$は知識の整合性を保ちながらバイアスを効果的に軽減する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 22:23:35 GMT)
Gaze Behavior During a Long-Term, In-Home, Social Robot Intervention for Children with ASD [2.0] 非定型視線行動は自閉症スペクトラム障害(ASD)の指標である
本研究では、社会ロボット、ALDを持つ子供、介護者との三者間相互作用を促進するために、1か月の在宅介入が与える影響について検討する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:33:22 GMT)
Enhancing Contrastive Learning for Retinal Imaging via Adjusted Augmentation Scales [2.0] 本研究の目的は, 医用画像の高密度分布が, コントラスト学習におけるプレテキストタスクに困難をもたらすという仮説を立てることである。
我々は、異なる拡張戦略の下でモデル性能を探求し、強力な拡張で達成した結果と比較する。
本研究は,医用画像におけるコントラスト学習の効果を高めるために,拡張スケールの最適化が重要であることを示唆する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 06:08:08 GMT)
Predicting IoT Device Vulnerability Fix Times with Survival and Failure Time Models [1.9] 多くのIoTデバイスは、最小限のセキュリティ対策で市場にリリースされており、デバイス毎の平均25の脆弱性を抱えることが多い。
我々は、脆弱性のあるIoTデバイスが修正やパッチを受けるのに要する時間を予測する革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:26:01 GMT)
Event-based quantum contextuality theory [1.9] 本稿では、排他的部分ブール代数を持つ事象に基づく文脈性理論を確立する。
Kochen-Speckerの文脈性は状態独立性と強い文脈性と等価であることを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:26:08 GMT)
Quest for quantum advantage: Monte Carlo wave-function simulations of the Coherent Ising Machine [1.9] 高量子状態におけるCIMのコヒーレント結合戦略を解析する。
システム固有の複雑さのため、最大ネットワークサイズは制限される。
我々はモンテカルロ波動関数法を用いて、波動関数の次元としてスケールし、多数のサンプルを用いる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 22:37:06 GMT)
Neural Error Covariance Estimation for Precise LiDAR Localization [1.9] 本稿では,LiDARマップマッチングにおける局所化誤差の共分散を予測するニューラルネットワークベースのフレームワークを提案する。
評価では,局所化精度が2cm向上し,領域が大幅に向上した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:20:08 GMT)
Journey into Automation: Image-Derived Pavement Texture Extraction and Evaluation [1.6] 平均テクスチャ深さ(MTD)はアスファルト舗装のスキッド抵抗を評価し,道路安全を確保する上で重要である。
本研究では,舗装画像からテクスチャ特徴を抽出し,MTDを評価する自動システムの開発に焦点をあてる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:46:46 GMT)
KM-UNet KAN Mamba UNet for medical image segmentation [1.6] 我々はKM-UNetを提案する。これはKolmogorov-Arnold Networks(KAN)と状態空間モデル(SSM)の強みを組み合わせた新しいU字型ネットワークアーキテクチャである。
我々は,ISIC17,ISIC18,CVC,BUSI,GLASの5つのベンチマークデータセットを用いてKM-UNetを評価する。
我々の知る限り、KM-UNetはKansとSSMを統合した最初の医用画像セグメンテーションフレームワークである。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:21:07 GMT)
Tighnari: Multi-modal Plant Species Prediction Based on Hierarchical Cross-Attention Using Graph-Based and Vision Backbone-Extracted Features [1.5] ヨーロッパにおける植物調査4,716件の結果を予測するモデルを構築した。
本研究では,Swin-Transformer Blockのバックボーンに基づくネットワークを構築し,時間的キューブの特徴を抽出する。
次に,複数のモダリティから特徴を融合できる階層的クロスアテンション機構を設計する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:30:07 GMT)
Floquet engineering in hybrid magnetic quantum systems [1.5] ハイブリッド磁性格子(HML)は、磁気量子体(MQEs)間で量子資源を分散させる量子バスとして考案されている。
HMLはMQEsにデコヒーレンス効果を行使し、その実用性能を損なう可能性がある。
本稿では, MQEsに周期駆動を適用し, 不要な効果を克服し, フロケエンジニアリング手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:14:49 GMT)
Decoding News Bias: Multi Bias Detection in News Articles [1.4] 我々は、ニュース記事に存在する様々なバイアスを調査し、大きな言語モデル(LLM)を用いたデータセットを構築した。
提案手法は広スペクトルバイアス検出の重要性を強調し,ニュース記事の完全性向上のための新たな洞察を提供する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:09:53 GMT)
Gumbel-Softmax Discretization Constraint, Differentiable IDS Channel, and an IDS-Correcting Code for DNA Storage [1.4] 本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした自動エンコーダ方式 THEA-codeを提案する。
オートエンコーダの特徴を識別するために,Gumbel-Softmax離散化制約を提案する。
擬似微分可能なIDSチャネルは、IDS操作の微分可能な代替手段として開発されている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:20:27 GMT)
CHAIR-Classifier of Hallucination as Improver [1.4] 本稿では,大規模言語モデルにおける幻覚検出のための教師付き手法を提案する。
LLaMAモデルの層間におけるトークンスコア(対数炎)を分析することで,最大値,最小値,平均値,標準偏差,傾斜値といった特徴の過剰適合を低減することを目的とした,小さなセットを導出する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:15:02 GMT)
From Language To Vision: A Case Study of Text Animation [1.3] 本稿では,フリーテキストをアニメーションで可視化するテキスト可視化システムを提案する。
本システムは, 基本物理法則の例文を可視化することによって記述する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:00:28 GMT)
Efficient Architectures for High Resolution Vision-Language Models [1.2] この研究は、高解像度画像を効率的に処理する新しいアーキテクチャであるPeyeを紹介している。
Pheyeは、特にきめ細かい画像理解を必要とするタスクにおいて、高いパフォーマンスを維持しながら高い効率を達成する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:41:26 GMT)
AI-powered Digital Twin of the Ocean: Reliable Uncertainty Quantification for Real-time Wave Height Prediction with Deep Ensemble [1.2] 本稿では,長期記憶(LSTM)ネットワークを統合したAIを用いた信頼性リアルタイム波高予測モデルを提案する。
モデルは顕著な精度 (R2 > 0.9) を達成すると同時に, 簡単な校正手法により, 不確かさを50%以上向上させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:45:34 GMT)
LLMs Help Alleviate the Cross-Subject Variability in Brain Signal and Language Alignment [1.2] 本研究の目的は,人間の脳波信号に固有の主題に依存しない意味情報を,深層学習で捉えることができるかどうかを検討することである。
雑音の多い脳波信号から主観非依存の意味的特徴を抽出するために,大言語モデル(LLM)を用いる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:29:39 GMT)
Identifying Surgical Instruments in Pedagogical Cataract Surgery Videos through an Optimized Aggregation Network [1.1] 本稿では白内障手術ビデオにおける手術器具のリアルタイム同定のためのディープラーニングモデルを提案する。
YOLOV9のアーキテクチャにインスパイアされたこのモデルは、プログラマブル・グラディエント・インフォメーション(PGI)機構と、新しい汎用高効率層アグリゲーション・ネットワーク(Go-ELAN)を採用している。
YOLO v5, v7, v8, v9 vanilla, Laptool, DETR に対して評価された Go-ELAN YOLOV9 モデルは,IoU 0.5 において 615 画像のデータセットで 73.74 の優れた mAP を達成している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:18:52 GMT)
Electronic interferometry with ultrashort plasmonic pulses [0.8] ピコ秒プラズモンパルスの形で飛ぶ電子は、達成可能なコヒーレント演算の数で競合する可能性がある。
極短単一電子プラズモンパルスを14マイクロメートルのマッハ・ツェンダー干渉計に注入することにより、これを実現するための重要な一歩を踏み出した。
その結果、超短パルスのオンデマンド注入において、量子コヒーレンスが堅牢であることが確認された。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:06:11 GMT)
Bilingual Sexism Classification: Fine-Tuned XLM-RoBERTa and GPT-3.5 Few-Shot Learning [0.8] 本研究の目的は、自然言語処理モデルを活用することにより、バイリンガル文脈(英語とスペイン語)における性差別の識別を改善することである。
我々はXLM-RoBERTaモデルを微調整し、性差別的コンテンツを分類するための数発の学習プロンプトでGPT-3.5を別々に使用した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:47:20 GMT)
Anonymization by Design of Language Modeling [0.8] 本稿では,言語モデル匿名化の問題に対処するために,プライバシ・バイ・デザイン言語モデリング手法を提案する。
本稿では,BERT に似た言語モデルを専門化する Masking Language Modeling (MLM) 手法と,GPT に似たモデルを専門とする Causal Language Modeling (CLM) 手法を提案する。
モデル特殊化の際,直接識別子と間接識別子の両方を記憶することを避けることで,マスキングと因果言語モデリングの手法は,高ユーティリティを維持しながら高いプライバシを維持するための最良のトレードオフを提供することを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 00:03:18 GMT)
Citation Structural Diversity: A Novel and Concise Metric Combining Structure and Semantics for Literature Evaluation [0.6] 本研究は,引用構造多様性モデルが引用量および長期的影響に与える影響について検討した。
その結果、引用頻度と持続的な学術的影響の両方において、高い引用構造多様性を持つ文献が顕著な優位性を示すことが明らかとなった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:24:37 GMT)
Integrating Deep Learning in Cardiology: A Comprehensive Review of Atrial Fibrillation, Left Atrial Scar Segmentation, and the Frontiers of State-of-the-Art Techniques [0.5] 心房細動(英: atrial fibrillation、AFib)は、心臓不整脈である。
LGE-MRIを用いた心房粗動の分節化の最近の進展を概観する。
AFibの処理と管理における正確な傷痕測定の重要性を強調している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:19:59 GMT)
Framework for lung CT image segmentation based on UNet++ [0.5] 先進的なUNet++モデルをマージする新しいプロセス網を提案する。
多様な手法を取り入れることで、トレーニング結果は類似の作業に対して大きな優位性を示す。
肺スライスCT像を最初に対象としたネットワークとして,我々のネットワークは注目に値する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:23:39 GMT)
Improving Quantum Machine Learning via Heat-Bath Algorithmic Cooling [0.5] 本研究は、量子機械学習(QML)におけるサンプリング効率を高めるために、量子熱力学に根ざしたアプローチを導入する。
我々は,Groverイテレーションや量子位相推定を必要とせずに,トレーニングや予測においてサンプル効率を向上させる量子冷蔵庫プロトコルを開発した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:34:05 GMT)
Generation and optimization of entanglement between atoms chirally coupled to spin cavities [0.4] 有限次元スピン鎖に冷間結合した原子間の絡み合いの発生と最適化について検討する。
エンタングルメント生成を高速化する原子にキラル結合された小さな偶大キャビティは、非キラル結合よりも約50%速くなる。
空洞内の制御された障害は絡み合いの発生を著しく促進し、順調なシステムで達成した障害の最大4倍のコンカレンスを達成する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:28:27 GMT)
GenTREC: The First Test Collection Generated by Large Language Models for Evaluating Information Retrieval Systems [0.3] GenTRECは、Large Language Model (LLM)によって生成された文書から完全に構築された最初のテストコレクションである。
我々は、生成したプロンプトのみに関連する文書を考察する一方、他の文書とトピックのペアは非関連として扱われる。
結果として得られたGenTRECコレクションは96,196のドキュメント、300のトピック、および18,964の関連性"判断"で構成されている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 00:27:36 GMT)
Evaluating Large Language Models Against Human Annotators in Latent Content Analysis: Sentiment, Political Leaning, Emotional Intensity, and Sarcasm [0.3] 本研究では,7つの最先端大規模言語モデル(LLM)の信頼性,一貫性,品質を評価する。
合計33人のアノテータと8つのLDM変種が100のキュレートされたテキストアイテムを評価した。
その結果、人間とLLMは、感情分析と政治的傾倒評価において高い信頼性を示すことが明らかとなった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:28:15 GMT)
A Deep Positive-Negative Prototype Approach to Integrated Prototypical Discriminative Learning [0.3] 本稿では,PbLと識別手法を組み合わせた新しいDPNPモデルを提案する。
DPNPは特徴空間内のほぼ規則的な位置でプロトタイプを編成でき、より低次元の特徴空間においても競争力のある分類精度を達成できることを示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:24:31 GMT)
Chameleon2++: An Efficient Chameleon2 Clustering with Approximate Nearest Neighbors [0.3] 任意の形状、大きさ、密度の高品質なクラスタを識別する階層的クラスタリングアルゴリズム。
Chameleon2の複雑さは$O(n2)$であり、実際に$O(n2logn)$であることを示す。
我々は、正確な$k$-NNサーチを、およそ$k$-NNサーチに置き換える。これにより、アルゴリズムの複雑さをさらに減らし、パフォーマンスを損なうことなく$O(nlogn)$にする。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 17:46:40 GMT)
ComMer: a Framework for Compressing and Merging User Data for Personalization [0.2] 大きな言語モデル(LLM)は、幅広いタスクで優れていますが、特にパーソナライズされたアプリケーションのために、新しいデータにそれらを適用することは、大きな課題を引き起こします。
既存の方法は、プロンプトを通じてモデルに新しいデータを公開することに依存しており、これは文脈のサイズと推論時に計算コストに制限される。
本稿では,ComMer - Compress and Mergeを紹介し, ユーザの文書をコンパクトな表現に圧縮することで, LLMを効率よくパーソナライズする新しいフレームワークについて紹介する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:57:03 GMT)
From Superficial Patterns to Semantic Understanding: Fine-Tuning Language Models on Contrast Sets [0.2] 本研究では,言語モデルの頑健性について,学習中に少量の複雑なコントラスト集合に露出させることで改善する方法について検討した。
このアプローチにより、モデルはパフォーマンスを回復し、コントラストセットで90%近い精度を実現し、多様で挑戦的なトレーニングデータの重要性を強調します。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:19:55 GMT)
GliLem: Leveraging GliNER for Contextualized Lemmatization in Estonian [0.2] GliLemはエストニア人のための新しいハイブリッド補題システムである。
本稿では,事前学習したGliNERモデルの柔軟性を活用し,Vabamorfの補間精度を向上させる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:33:34 GMT)
Prune or Retrain: Optimizing the Vocabulary of Multilingual Models for Estonian [0.2] エストニア語に適合するように多言語エンコーダモデルの語彙を変更すると、その下流のパフォーマンスに影響を及ぼす。
本稿では,2つの語彙適応手法の有効性を評価する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 19:21:45 GMT)
Observing Quantum Coherent Oscillations in a Three-Level Atoms via Electromagnetically Induced Transparency by Two-Dimensional Spectroscopy [0.2] 2次元電子分光法(2DES)は高スペクトル分解能を持ち、原子動力学の研究に有用である。
元々のピークは、EITの導入により4つの小さなピークに分けられている。
一定の高さとは対照的に、ピークの高さは、個体群時間に対して減衰振動を示す。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 03:51:49 GMT)
Towards New Benchmark for AI Alignment & Sentiment Analysis in Socially Important Issues: A Comparative Study of Human and LLMs in the Context of AGI [0.1] 本研究は、社会的輸入問題における様々な大規模言語モデルの感情評価のためのベンチマークの確立に寄与することを目的としている。
GPT-4とBardを含む7つのLDMを解析し、3つの独立したヒトサンプル集団の感情データと比較した。
GPT-4はAGIに対して最も肯定的な感情スコアを記録したが、Bardは中立的な感情に傾いていた。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:18:13 GMT)
Dissipative Landau-Zener tunneling in the crossover regime from weak to strong environment coupling [0.0] ランダウ・ツェナートンネル(Landau-Zener tunneling)は、2段階のシステムにおける、反交差の掃討中の遷移を記述している。
ランダウ・ツェナートンネルの環境との弱い結合から強い結合までの交叉を観測する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:21:16 GMT)
Wigner function method for the Gibbons-Hawking and the Unruh effect [0.0] 膨張する宇宙と休んでいるオブザーバーは、量子真空の中で余分なノイズを経験する。
真空相関の周波数時間ウィグナー関数を用いて時間依存スペクトルを定義する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:56:13 GMT)
Vision-Driven Prompt Optimization for Large Language Models in Multimodal Generative Tasks [0.0] 視覚駆動型プロンプト最適化(VDPO)は、高忠実度画像合成を導く視覚入力からテキストプロンプトを生成する。
VDPOは既存の手法を一貫して上回り、FID、LPIPS、BLEU/CIDErスコアを大幅に改善した。
人間の評価は、視覚的に魅力的でセマンティックにコヒーレントな出力を生成する上で、VDPOの実用的優位性をさらに検証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:01:47 GMT)
Understanding colors of Dufaycolor: Can we recover them using historical colorimetric and spectral data? [0.0] 本稿では,原色を再現するオープンソースツールの開発と開発について述べる。
カラーカラーフィルタ(r'eseau)の製造に使用される染料の歴史的測定値の組み入れについて検討した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:38:47 GMT)
Understand, Solve and Translate: Bridging the Multilingual Mathematical Reasoning Gap [0.0] 大規模言語モデル(LLM)は複雑な推論タスクにおいて例外的な性能を示す。
高リソース言語では強い推論能力があるが、他の言語では大きなパフォーマンスギャップが持続する。
提案するUST(Understand, Solve, and Translate)は,推論と解生成のためのアンカーとして英語を戦略的に利用する手法である。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:57:22 GMT)
Trust and Dependability in Blockchain & AI Based MedIoT Applications: Research Challenges and Future Directions [0.0] 本稿では、医療用モノのインターネット(MedIoT)アプリケーションにおける人工知能(AI)とブロックチェーン技術の統合を批判的にレビューする。
現在の研究を調べることで、データセキュリティと患者のプライバシを強化するブロックチェーンの能力とともに、診断と患者のケアの進歩におけるAIの可能性を強調します。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 20:21:22 GMT)
Sub-Doppler spectroscopy of Rydberg atoms via velocity selection memory in a hot vapor cell [0.0] 熱気相中での共振再分配機構について検討した。
初期速度選択の痕跡は中間(6P1/2)状態の両方の超微細なレベルに残る。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:10:12 GMT)
Quantum noise in time-dependent media and cosmic expansion [0.0] 空で平らな空間では、再正規化された真空エネルギーは正確にゼロであるが、時間依存媒体ではそうではない。
宇宙膨張時の真空エネルギーは、特性因子による放射と物質の重量を効果的に減少させることを示した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:16:29 GMT)
Quantum Perspectivism vs Nietzschean Perspectivism [0.0] 量子パースペクティビズムは、量子力学の解釈とニーチェのパースペクティビズムを理解する物理モデルの両方として機能することが示されている。
このフレームワークは、量子論理、相補性の原理、文脈性を組み合わせて、視点がどのように現実を構成するかを調べる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:26:37 GMT)
Punch Out Model Synthesis: A Stochastic Algorithm for Constraint Based Tiling Generation [0.0] Constraint Based Tiling Generation (CBTG)アルゴリズムは、一連のタイルと配置制約からレベル実現を自動的に生成するのに役立つ。
Punch Out Model Synthesis (POMS, Constraint Based Tiling Generation algorithm) を提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 21:49:50 GMT)
Predicting Vulnerability to Malware Using Machine Learning Models: A Study on Microsoft Windows Machines [0.0] 本研究では機械学習(ML)技術を活用した効果的なマルウェア検出戦略の必要性に対処する。
本研究の目的は、個々のマシンの特定の状況に基づいて、マルウェアの脆弱性を正確に予測する高度なMLモデルを開発することである。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 10:04:58 GMT)
Pixel-Wise Feature Selection for Perceptual Edge Detection without post-processing [0.0] 本稿では,既存EDモデルにシームレスに統合可能なディープネットワークのための新しい特徴選択パラダイムを提案する。
この追加構造を取り入れることで、従来のEDモデルの性能は後処理なしで大幅に向上し、同時に予測の知覚品質も向上する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:28:37 GMT)
Photonic Modes in Twisted Graphene Nanoribbons [0.0] 本研究では, グラフェンナノリボン(TGNR)のフォトニックモードの挙動を解析的手法を用いて検討した。
本稿では,TGNRのヘリカルなねじれがフォトニックモードの進化にどのように影響するかを示すモデルを提案する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:35:24 GMT)
Photon Blockade in Cavity Magnomechanical Systems using Phase-Controlled Feedback [0.0] 各駆動周波数における位相と磁場結合強度の最適化値を導入する。
計算された値は、動的シュロディンガー方程式におけるフォトン二階相関関数を著しく減少させる。
このアプローチは量子センシングと量子計算の応用に強い可能性をもたらす。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:47:27 GMT)
PTEENet: Post-Trained Early-Exit Neural Networks Augmentation for Inference Cost Optimization [0.0] 本稿では,DNNフィードフォワード推論プロセスに「ショートカット」を導入する手法について述べる。
提案手法は、前述した BranchyNet (Teerapittayanon et al., 2016) とEEnet (Demir, 2016) アーキテクチャに基づいて、メインネットワークとアーリーエグジットブランチを共同でトレーニングする。
これらの信頼度拡張の調整しきい値を定義することで、各ブランチから流出するデータの量と、モデルの速度と精度の全体的なトレードオフをリアルタイムで制御できる。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:35:08 GMT)
Overcoming Uncertain Incompleteness for Robust Multimodal Sequential Diagnosis Prediction via Curriculum Data Erasing Guided Distillation [0.0] NECHO v2, NECHO v2は, 欠席頻度が不確実な患者診断の予測精度を高めるために設計された新しいフレームワークである。
まず、不完全なデータの下で、不完全なモダリティ表現の優位性を扱うために、コード中心の診断で設計されたNECHOを修正する。
第2に,修正NECHOを教師と学生の両方に活用して,体系的な知識蒸留を開発する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 13:43:25 GMT)
On the Klein-Gordon scalar field oscillators in a spacetime with spiral-like dislocations in external magnetic fields [0.0] クライン・ゴルドン振動子場(KG)の相対論的ダイナミクスに対する2種類の渦巻き転位の影響について検討した。
どちらの種類のスパイラル転位に対しても、対応する波動関数は転位パラメータの影響を取り入れている。
渦巻転位IIに対するKG発振器(磁場の有無にかかわらず)の正確な可溶性は、周波数が磁場強度によってのみ決定されることを示している。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 05:07:40 GMT)
Long-Range Quantum Tunneling via Matter Wave [0.0] 状態選択型光学格子におけるN$極分離トラップ電位の超低温原子のトンネル化について検討した。
原子から放出される伝播物質波を媒介として、原子の遠隔格子へのコヒーレントトンネルは、系のエネルギースペクトルに境界状態が存在する限り発生する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 07:20:52 GMT)
Learning when to rank: Estimation of partial rankings from sparse, noisy comparisons [0.0] 偏位を学習するための原理的ベイズ手法を開発した。
我々の枠組みはいかなる統計的ランキング法にも適応できる。
従来のランキングよりも、データの微妙な要約が提供される。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 11:04:30 GMT)
LatteReview: A Multi-Agent Framework for Systematic Review Automation Using Large Language Models [0.0] LatteReviewはPythonベースのフレームワークで、大規模言語モデル(LLM)とマルチエージェントシステムを活用して、体系的なレビュープロセスの重要な要素を自動化する。
このフレームワークは、外部コンテキストを組み込むRetrieval-Augmented Generation (RAG)、マルチモーダルレビュー、構造化された入力と出力に対するPydanticベースの検証、大規模データセットを扱う非同期プログラミングなどの機能をサポートしている。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 17:53:00 GMT)
LLMPC: Large Language Model Predictive Control [0.0] 我々は,大規模言語モデルが計画プロンプトを使用する場合,暗黙的な計画コスト関数最小化機能として機能することを示す。
実際の計画コスト関数と評価器を組み込むことにより、LCM計画性能をさらに改善できることを実証する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 09:37:23 GMT)
Harvesting stabilizer entropy and non-locality from a quantum field [0.0] ミンコフスキー時空における加速Unruh-DeWitt検出器を用いて、無質量場の真空状態からSREを抽出する方法を示す。
特に、局所ユニタリ演算によって消去できない特定の非局所形式のSREを収穫することができる。
この非局所SREは、絡み合いと非安定化資源の相互作用を研究するための基本的な量である。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:00:05 GMT)
Face-MakeUp: Multimodal Facial Prompts for Text-to-Image Generation [0.0] LAION-Faceに基づく400万の高品質な顔画像テキストペア(FaceCaptionHQ-4M)のデータセットを構築した。
本研究では, 顔画像の特徴を抽出・学習し, その特徴を拡散モデルに統合し, 拡散モデルにおける顔の識別特性の保存性を高める。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:46:31 GMT)
Experiences and attitudes toward working remotely from home in a time of pandemic: A snapshot from a New Zealand-based online survey [0.0] 本稿では,在宅勤務が可能な参加者のアンケート調査データを用いて,リモートワークの定量的スナップショットを提供する。
遠隔作業が一般的であっただけでなく,ハイブリッド作業アレンジメントも一般的であった。
在宅勤務における最も一般的な障壁は、インターネット速度の遅さ、対面ミーティングへの出席の必要性、在宅勤務スペースの制限だった。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 01:56:59 GMT)
Enhancing IoT based Plant Health Monitoring through Advanced Human Plant Interaction using Large Language Models and Mobile Applications [0.0] 本稿では、植物が人間に「話す」ことを可能にする新しい植物コミュニケーションアプリケーションの開発について述べる。
このアプリは、リアルタイムの対話機能を備えたシームレスなユーザー体験を提供する。
植物とのコネクティビティを育むことで、このシステムは植物ケアのプラクティスを強化し、持続可能性を促進し、AIとIoT技術のための革新的なアプリケーションを導入します。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 18:21:23 GMT)
Empowering Bengali Education with AI: Solving Bengali Math Word Problems through Transformer Models [0.0] 本稿では, 変圧器モデルを用いたベンガルMWPの解法を提案する。
この取り組みをサポートするために、ベンガルの数学問題10,000を含む"PatiGonit"データセットが導入された。
評価の結果、mT5モデルは97.30%の精度を達成した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 16:50:55 GMT)
Decoding specialised feature neurons in LLMs with the final projection layer [0.0] 大規模言語モデル(LLM)は通常、数十億のパラメータを持ち、その操作で解釈することがしばしば困難である。
本稿では, モデルの最終射影層(LMヘッド)を介し, ニューロンの重みを直接トークン確率に復号する手法を提案する。
Llama 3.1 8Bのアッププロジェクションニューロン全体を15分以内で並列化せずにマッピングすることが可能である。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 23:35:47 GMT)
Carleman-lattice-Boltzmann quantum circuit with matrix access oracles [0.0] 流れの格子ボルツマン表現のカールマン線型化を2次元コルモゴロフ流の力学の量子的エミュレートに応用する。
まず、CLB法の実装のためのゲートベース量子回路を定義し、次にCLB行列のスパース特性を利用してブロック符号化技術に基づく量子回路を構築する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 15:32:14 GMT)
CBAM-EfficientNetV2 for Histopathology Image Classification using Transfer Learning and Dual Attention Mechanisms [0.0] 本研究では,EfficientNetV2モデルを用いて特徴抽出を改善し,関連組織領域に焦点を当てた新しいアプローチを提案する。
CBAMを搭載した効率の良いNetV2-XLは、最高精度98.96パーセント、F1スコア98.31パーセントを400倍の精度で達成した。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:58:48 GMT)
Automatized Self-Supervised Learning for Skin Lesion Screening [0.0] 皮膚がんの死亡率が最も高いメラノーマは、世界中で着実に増加している。
様々な専門知識を持つユーザを支援するため、人工知能(AI)意思決定支援ツールが開発された。
本ソリューションは,実世界の広視野画像からUDを識別し,特徴付ける。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 14:25:21 GMT)
Anomalous bulk-edge correspondence of nonlinear Rice-Mele model [0.0] 本研究の目的は, 固有値の非線形性を明らかにするために, イソベの解析を拡張し, 固有値の非線形性を明らかにすることである。
非線形ライス・ミールモデル(RM)を数値的に解き、2種類の非線形固有値を同定する。
我々はこれらの補助非線形固有値に基づいて新しいBECの形式を確立し、非線形物理系の異常BECと呼ぶ。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 08:30:37 GMT)
A Study about Distribution and Acceptance of Conversational Agents for Mental Health in Germany: Keep the Human in the Loop? [0.0] テレセラピーとデジタルヘルスの応用は、医療分野のギャップを埋め、医療専門家を救済するために利用できる。
これらのツールの受容は、その有効性に強い影響を及ぼす要因である。
本研究では,一般市民と医療従事者の両面から考察する。
論文参考訳(メタデータ) (Sun, 05 Jan 2025 12:20:18 GMT)