Segmenting Text and Learning Their Rewards for Improved RLHF in Language Model [96.2] 人間からのフィードバックからの強化学習(RLHF)は、言語モデル(LM)を人間の好みに合わせるために広く採用されている。
本稿では,セグメントレベルの報酬モデルを用いて,学習と活用の両面での優位性を追求する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:17:56 GMT)
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.4] アノテーションの品質向上のために,人間とLMの入力を組み合わせたルーティングフレームワークを提案する。
我々は、人間とLMアノテーションの任意の組み合わせで報酬モデルの性能を予測するために、性能予測モデルを訓練する。
選択したハイブリッド混合物は,一方のみ使用した場合と比較して,報奨モデルの性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:46:28 GMT)
Conservation-informed Graph Learning for Spatiotemporal Dynamics Prediction [84.3] 本稿では,保護インフォームドGNN(CiGNN)について紹介する。
このネットワークは、保守的かつ非保守的な情報が、潜時的行進戦略によって多次元空間を通過する対称性による一般的な対称性保存則に従うように設計されている。
結果は,CiGNNが顕著なベースライン精度と一般化性を示し,様々な時間的ダイナミクスの予測のための学習に容易に適用可能であることを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:36:13 GMT)
BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning [83.0] 配当パイプラインの各ステップにおける推論品質の改善に注力する。
BoostStepは、粗い質問のきめ細かい戦略よりも、より関連性の高い例を提供する。
GPT-4oとQwen2.5-Math-72Bをそれぞれ3.6%と2.0%改善する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:59:13 GMT)
Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction [81.3] 本稿では,知覚,決定,反応を両立させるシステムであるDispiderを紹介する。
実験により、Dispiderは従来のビデオQAタスクにおいて高いパフォーマンスを維持しているだけでなく、ストリーミングシナリオ応答における従来のオンラインモデルを大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:55:10 GMT)
Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.2] 本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:42:20 GMT)
Rydberg Atomic Quantum Receivers for Multi-Target DOA Estimation [77.3] ライドバーグ原子量子受信機(RAQR)は、古典的な無線通信とセンシングのための有望なソリューションとして登場した。
我々はまず、マルチターゲット検出のためのRydberg原子量子一様線形アレイ(RAQ-ULA)支援受信機を考案した。
次に、RAQ-ESPRITと呼ばれる回転不変性に基づく手法を設計することにより、信号パラメータのRydberg原子量子推定を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:42:23 GMT)
LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.3] GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは、ゼロショットソーシャルグラフ生成のための時間ノードとエッジ生成プロセスをシミュレートする。
得られたグラフは7つの主要なマクロ的ネットワーク特性に付着し、微視的グラフ構造測定において11%の改善が達成される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:16:37 GMT)
Mixability of Integral Losses: a Key to Efficient Online Aggregation of Functional and Probabilistic Forecasts [72.3] 基本混合(および指数的に凹)損失関数を適用して機能的予測を比較し、これらの適応が混合可能であることを証明する(exp-concave)。
主な結果の応用として、確率予測に使用される様々な損失関数が混合可能であることを示す(exp-concave)。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:52:07 GMT)
Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows [69.9] 重要サンプリングはモンテカルロシミュレーションで使われる稀な事象シミュレーション手法である。
正規化フローの潜在空間における提案分布を更新し,より効率的なサンプリング法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:18:02 GMT)
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation [69.8] オープンエンドの質問を自動的にマルチ選択フォーマットに変換するエージェントフレームワークであるAutoを紹介します。
Autoを用いて、既存の20のVQAデータセットを統一された多重選択フォーマットに変換することで生成されたベンチマークであるVMCBenchを構築した。
我々はVMCBench上で33の最先端ビジョン言語モデルを評価し、スケーラブルで一貫した再現可能なVLM評価のための新しい標準を設定した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:57:31 GMT)
Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.9] クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:17:53 GMT)
DoubleDiffusion: Combining Heat Diffusion with Denoising Diffusion for Generative Learning on 3D Meshes [67.4] DoubleDiffusionは3次元メッシュ表面の直接生成学習のために、放熱拡散と脱ノイズ拡散を組み合わせたフレームワークである。
本研究は, 3次元表面上での拡散に基づく生成モデルの新しい方向性に寄与し, 3次元アセット生成の分野への応用の可能性を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:34:52 GMT)
SMORE: Simulataneous Map and Object REconstruction [66.7] 本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、世界が厳格に動く物体と背景に分解される動的なシーンの構成モデルを総合的に捉え、最適化する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:25:07 GMT)
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control [66.7] VideoAnydoorは、高忠実度ディテール保存と正確なモーションコントロールを備えたゼロショットビデオオブジェクト挿入フレームワークである。
詳細な外観を保ちながら、微粒な動き制御をサポートするため、我々は画素ワーパーを設計する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:21:59 GMT)
Rethinking Byzantine Robustness in Federated Recommendation from Sparse Aggregation Perspective [65.7] フェデレーションラーニング(FL)に基づいたフェデレーションレコメンデーション(FR)が出現し、個人データをローカルクライアントに保持し、モデルを協調的に更新する。
FR には独自のスパース集約機構があり、各項目の埋め込みは、一般の FL の密集集合において、完全なクライアントではなく、部分的なクライアントによって更新される。
本稿では,単一項目の集約を最小の実行単位として定義することにより,スパースアグリゲーションの下でのビザンチンのロバスト性を再構成する。
本研究では,スパースアグリゲーションの脆弱性を悪用し,敵の知識と能力に沿って分類する,Sp attackという効果的な攻撃戦略のファミリーを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:19:26 GMT)
Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.4] 外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:35:51 GMT)
Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.6] 音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:31:25 GMT)
Automating the Generation of Prompts for LLM-based Action Choice in PDDL Planning [59.5] 大規模言語モデル(LLM)は、様々なNLPタスクに革命をもたらした。
LLMを利用してPDDL入力からNLプロンプトを自動的に生成する方法を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:43:09 GMT)
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild [55.6] 自然景観画像のテキストは、以下の4つの重要な基準を満たす必要がある。
忠実さ:生成されたテキストは写真と同じくらいリアルに表示されるべきである。
推論可能性: テキストは適切なキャリア領域で生成されるべきである。
ユーティリティ: 生成されたテキストは、自然なシーンOCRタスクのトレーニングを容易にする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:09:08 GMT)
KG-CF: Knowledge Graph Completion with Context Filtering under the Guidance of Large Language Models [55.4] KG-CFはランキングベースの知識グラフ補完タスクに適したフレームワークである。
KG-CFは、LLMの推論能力を活用して、無関係なコンテキストをフィルタリングし、現実世界のデータセットで優れた結果を得る。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:52:15 GMT)
Analyzing Fine-tuning Representation Shift for Multimodal LLMs Steering alignment [53.9] モデルの内部構造が微調整によってどのように変化し、新しいマルチモーダルタスクを専門化するかを示す。
我々の研究は、微調整によってマルチモーダル表現がどのように進化するかに光を当て、マルチモーダルタスクにおけるモデル適応を解釈するための新しい視点を提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:37:13 GMT)
Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation [52.3] 我々は、静的な画像をテキスト記述に基づいてリアルな映像シーケンスに変換するI2V(Image-to-Video)生成の課題について検討する。
I2V生成を分解する2段階の合成フレームワークを提案する。 (i) 明示的な中間表現生成段階, (ii) この表現に条件付けされたビデオ生成段階。
提案手法は,マルチオブジェクトおよびハイモーションシナリオを用いた挑戦的ベンチマークにおいて評価し,提案手法が最先端の整合性を実現することを実証的に示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:49:26 GMT)
From Slow Bidirectional to Fast Autoregressive Video Diffusion Models [52.3] 現在のビデオ拡散モデルは、印象的な生成品質を実現するが、双方向の注意依存のため、インタラクティブなアプリケーションに苦戦する。
この制限には、事前訓練された双方向拡散変換器を自己回帰変換器に適応させ、フレームをオンザフライで生成することで対処する。
我々のモデルは、VBench-Longベンチマークで84.27点のスコアを達成し、以前のすべてのビデオ生成モデルを上回った。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:26:42 GMT)
Universal Features Guided Zero-Shot Category-Level Object Pose Estimation [52.3] カテゴリレベルの6-DOFオブジェクトのポーズ推定を実現するゼロショット手法を提案する。
提案手法は,入力RGB-D画像の2次元と3次元の普遍的特徴を利用して,意味的類似性に基づく対応性を確立する。
提案手法は,REAL275およびWild6Dベンチマークにおいて,未知のカテゴリに対して従来手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:10:13 GMT)
A Point Process Model for Optimizing Repeated Personalized Action Delivery to Users [52.3] 本稿では,オンライン広告主におけるユーザ・アドバタイザのインタラクションにインスパイアされた因果推論問題に対するフォーマリズムを提供する。
すると、この形式は時間的マークされた点過程の拡張に特化され、神経点過程はいくつかの興味深い特別ケースに対する実用的な解として提案される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:09:08 GMT)
MObI: Multimodal Object Inpainting Using Diffusion Models [52.1] マルチモーダル・オブジェクト・インペイントのための新しいフレームワークであるMObIを紹介する。
単一の参照RGBイメージを使用して、MObIは既存のマルチモーダルシーンにオブジェクトをシームレスに挿入できる。
マスクの編集だけに頼っている従来の塗り絵とは違って、3Dバウンディングボックスコンディショニングは、オブジェクトの正確な空間的位置決めとリアルなスケーリングを可能にします。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:43:26 GMT)
Prompt-Singer: Controllable Singing-Voice-Synthesis with Natural Language Prompt [50.3] 本稿では,歌手の性別,声域,音量を自然言語で制御できる最初のSVS手法であるPrompt-Singerを提案する。
我々は,マルチスケール階層を持つデコーダのみの変換器に基づくモデルアーキテクチャを採用し,レンジメロディデカップリングされたピッチ表現を設計する。
実験により,本モデルは良好な制御能力と音質が得られることが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:08:24 GMT)
Cavity-assisted quantum transduction between superconducting qubits and trapped atomic particles mediated by Rydberg levels [49.2] 超伝導量子ビットから閉じ込められた原子やイオンの内部状態への量子状態の転送方法を提案する。
相互作用強度, 散逸, 嫌悪のパラメータを実験的に実証するために, 本手法は95%以上の忠実性を達成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:28:18 GMT)
ForgeryGPT: Multimodal Large Language Model For Explainable Image Forgery Detection and Localization [49.1] ForgeryGPTはImage Forgery DetectionとLocalizationタスクを進化させる新しいフレームワークである。
多様な言語的特徴空間からの偽画像の高次相関をキャプチャする。
新たにカスタマイズされたLarge Language Model (LLM)アーキテクチャを通じて、説明可能な生成と対話を可能にする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:39:41 GMT)
Adaptive Pruning of Pretrained Transformer via Differential Inclusions [48.5] 現在の圧縮アルゴリズムは一定の圧縮比でプルーーン変換器であり、各比に対して独自のプルーニングプロセスを必要とする。
本研究では,マスクパラメータの差分包摂性に基づいて,事前学習した変圧器を1つのプルーニング段階内において任意の所望の比率でプルーニングすることを提案する。
このダイナミクスは、ネットワーク構造を識別するサポートセットを持つマスクパラメータの全体正規化ソリューションパスを生成することができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:34:52 GMT)
From Dense to Sparse: Event Response for Enhanced Residential Load Forecasting [48.2] 住宅負荷予測のためのイベント応答型知識ガイド手法(ERKG)を提案する。
ERKGは、異なる家電の電力使用状況の推定、負荷系列からのイベント関連スパース知識のマイニングを取り入れている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:53:38 GMT)
ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models [46.8] 我々はAI統合データキュレーションとアノテーションのエージェントであるScaleMAIを提案する。
まず、ScaleMAIは25,362個のCTスキャンを作成した。
第2に、プログレッシブなヒューマン・イン・ザ・ループのイテレーションを通じて、ScaleMAIはFragship AI Modelを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:12:00 GMT)
VCEval: Rethinking What is a Good Educational Video and How to Automatically Evaluate It [46.7] 本稿では,映像コンテンツの品質を自動評価する作業に焦点をあてる。
これらの原則に基づいて,3つの評価原則を提案し,新しい評価フレームワークであるtextitVCEval を設計する。
本手法は,コンテンツ品質の異なるビデオコースを効果的に識別し,様々な解釈可能な結果を生成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:40:02 GMT)
Understanding the Influence of Data Characteristics on the Performance of Point-of-Interest Recommendation Algorithms [46.4] 関心のポイント(POI)レコメンデーションは旅行者やe-ツーリズムビジネスにとって不可欠である。
従来のレコメンデーションアルゴリズムのパフォーマンスは、スパーシリティ、人気バイアス、嗜好分布などのデータ特性に依存することが知られている。
本研究では,データ特性がレコメンデーション性能に与える影響を定量化する汎用手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:10:46 GMT)
3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration [45.6] マルチインスタンスポイントクラウド登録のための強力な3D焦点マッチングネットワークを提案する。
自己アテンションと横断アテンションを使用することで、オブジェクトセンターを後退させることで、潜在的なマッチングインスタンスを見つけることができる。
提案手法は,マルチインスタンスポイントクラウド登録タスクにおいて,新たな最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:32:41 GMT)
Robust Fast Adaptation from Adversarially Explicit Task Distribution Generation [45.6] タスク識別子上に配置されたタスク分布を明示的に生成する。
我々は、敵の訓練から高速適応を強固にすることを提案する。
この研究は、特にメタラーニングにおけるタスク分散シフトを扱う際に、実践的な意味を持っている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:02:17 GMT)
Brain-Inspired AI with Hyperbolic Geometry [45.0] 経験的証拠は、双曲型ニューラルネットワークが自然言語処理、コンピュータビジョン、複雑なネットワーク分析などのタスクにおいてユークリッドモデルを上回っ、パラメータを少なくし、より良い一般化を示すことを示している。
その初期の採用にもかかわらず、双曲幾何学は、脳にインスパイアされた幾何学的表現を通じて機械学習モデルを改善することを約束している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:15:25 GMT)
SCRREAM : SCan, Register, REnder And Map:A Framework for Annotating Accurate and Dense 3D Indoor Scenes with a Benchmark [43.9] SCRREAMは、シーン内のオブジェクトの完全な高密度メッシュのアノテーションを可能にし、実際の画像シーケンスにカメラのポーズを登録する。
データセットのアノテーションパイプラインの詳細を示し、可能なデータセットの4つのバリエーションを示す。
最近の屋内再建とSLAMのためのパイプラインは、新しいベンチマークとして機能している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:43:05 GMT)
TransPixar: Advancing Text-to-Video Generation with Transparency [43.7] 本稿では,従来のRGB機能を維持しつつ,RGBA生成のための事前学習ビデオモデルを拡張する方法であるTransPixarを紹介する。
提案手法は,多彩で一貫したRGBA動画を効果的に生成し,VFXやインタラクティブなコンテンツ制作の可能性を高める。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:32:16 GMT)
Boosting of Thoughts: Trial-and-Error Problem Solving with Large Language Models [43.1] Boosting of Thoughts (BoT)は、大規模言語モデルによる問題解決のための自動プロンプトフレームワークである。
我々は,BoTが他の先進的なプロンプト手法よりも高い,あるいは同等の問題解決率を達成することを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:18:24 GMT)
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution [42.9] 画像拡散モデルは、GAN法における過平滑化問題に対処するために、実世界のビデオ超解像に適応している。
これらのモデルは静的イメージでトレーニングされるため、時間的一貫性を維持するのに苦労する。
我々は,現実的な空間的詳細と強靭な時間的整合性を達成し,T2Vモデルを現実の超解像に活用する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:36:21 GMT)
RLCP: A Reinforcement Learning-based Copyright Protection Method for Text-to-Image Diffusion Model [42.8] テキスト・画像拡散モデルのための強化学習に基づく著作権保護(RLCP)手法を提案する。
提案手法は,モデル生成データセットの品質を維持しつつ,著作権侵害コンテンツの生成を最小限に抑える。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:48:07 GMT)
ParetoLens: A Visual Analytics Framework for Exploring Solution Sets of Multi-objective Evolutionary Algorithms [42.2] 本稿では,進化的アルゴリズムから導出した解集合の検査と探索を強化するための視覚分析フレームワークを提案する。
ParetoLensは、インタラクティブな視覚表現のスイートを通じて、決定空間と目的空間の両方における解分布の詳細な検査を可能にする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:04:14 GMT)
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking [41.9] ProTrackerは、ビデオの任意の点の堅牢で正確な長期的追跡のための新しいフレームワークである。
私たちのコードとモデルは、公開時に公開されます。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:55:52 GMT)
Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback [40.9] 我々は,LVLM(Large Vision Language Models)における幻覚の検出と緩和について,きめ細かいAIフィードバックを用いて提案する。
プロプライエタリモデルによる小型幻覚アノテーションデータセットを生成する。
そこで本研究では,幻覚緩和モデルの訓練のための選好データセットを自動構築する検出テーマ書き換えパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:58:45 GMT)
TreeLearn: A deep learning method for segmenting individual trees from ground-based LiDAR forest point clouds [40.5] TreeLearnは、森林点雲のツリーインスタンスセグメンテーションのためのディープラーニングアプローチである。
TreeLearnは、データ駆動の方法で、すでにセグメンテーションされたポイントクラウドでトレーニングされている。
我々は、Lidar360ソフトウェアを使って6665本の木の森林点雲上でTreeLearnを訓練した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:26:26 GMT)
Make Imagination Clearer! Stable Diffusion-based Visual Imagination for Multimodal Machine Translation [40.4] 本稿では,多モーダル大言語モデル (MLLM) に安定な拡散に基づくイマジネーションネットワークを導入し,各元文の画像を明示的に生成する。
我々は、生成した画像と原文との整合性を確保するために、強化学習による人間のフィードバックを構築する。
実験結果から,本モデルは既存のマルチモーダルMTとテキストのみのMTよりも優れていた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:58:32 GMT)
The Tabular Foundation Model TabPFN Outperforms Specialized Time Series Forecasting Models Based on Simple Features [40.2] 本稿では,TabPFNと単純な特徴工学を組み合わせ,予測性能を高めるための簡単なアプローチであるTabPFN-TSを提案する。
その単純さとわずか1100万のパラメータにもかかわらず、TabPFN-TSは類似サイズのモデルであるChronos-Miniよりも優れており、65倍のパラメータを持つChronos-Largeよりもわずかに優れている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:38:19 GMT)
A quantum implementation of high-order power method for estimating geometric entanglement of pure states [39.6] この研究は、多ビット純状態の絡み合いの幾何学的測度を推定する反復高次電力法の量子的適応を示す。
現在の(ハイブリッドな)量子ハードウェア上で実行可能であり、量子メモリに依存しない。
標準偏極チャネルに基づく単純な理論モデルを用いて,雑音がアルゴリズムに与える影響について検討する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:17:59 GMT)
ICONS: Influence Consensus for Vision-Language Data Selection [39.5] 我々は、視覚言語データ選択のための勾配駆動型インフルエンス・コンセンサス・アプローチであるICONSを紹介する。
クロスタスク・インフルエンス・コンセンサス(英語版)は、複数のタスクで一貫して価値のあるサンプルを特定するために使用される。
実験により、選択したデータに基づいてトレーニングされたモデル(LLaVA-665Kの20%)が、完全なデータセットを使用して得られた相対的なパフォーマンスの98.6%を達成することが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:17:30 GMT)
Using large language models to promote health equity [39.4] 大規模言語モデル(LLM)は、その社会的影響に対する関心を爆発的に高めた。
ソーシャルエクイティにどう影響するかという議論の多くは、慎重か否定的だ。
AIが一般的に、特にLLMがバイアスを封じ込めている方法は、十分に文書化されている。
LLMがどんな有望なアプリケーションによって株式を促進することができるのか?
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:06:32 GMT)
Visual Large Language Models for Generalized and Specialized Applications [39.0] ビジュアル言語モデル(VLM)は、視覚と言語のための統合的な埋め込み空間を学ぶための強力なツールとして登場した。
強力な推論とマルチタスク能力を示す大規模言語モデルに触発された視覚的大規模言語モデル(VLLM)は、汎用VLMの構築に注目が集まっている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:15:59 GMT)
AIF-SFDA: Autonomous Information Filter-driven Source-Free Domain Adaptation for Medical Image Segmentation [38.9] ドメイン不変情報(DII)からドメイン不変情報(DVI)を分離することは、ドメインシフトを緩和するための重要な戦略である。
医療環境では、データ収集とプライバシに関する懸念は、トレーニングとテストの両方のデータへのアクセスを制限することが多い。
本稿では,自律的にDVIとDIIを分離するAIF-SFDAアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:11:24 GMT)
CrossIn: An Efficient Instruction Tuning Approach for Cross-Lingual Knowledge Alignment [38.4] 英語中心のモデルは、通常他の言語では準最適である。
そこで本研究では,言語間命令チューニングデータの混合合成を利用したCrossInという新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:33:51 GMT)
LDMapNet-U: An End-to-End System for City-Scale Lane-Level Map Updating [38.3] レーンレベルの更新は正確な変更情報を必要とし、隣接するデータとの整合性を確保する必要がある。
従来の手法では、3段階のアプローチコンストラクション、変更検出、そしてしばしば精度の制限による手動検証の更新を利用する。
都市規模レーンレベルの地図更新のための新しいエンドツーエンドパラダイムを実装したLDMapNet-Uを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:14:40 GMT)
Are Your LLMs Capable of Stable Reasoning? [38.0] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な進歩を示している。
しかし、ベンチマークパフォーマンスと実世界のアプリケーションの間には大きな違いがある。
G-Pass@kはモデルの性能を連続的に評価する新しい評価指標である。
本稿では,挑戦的,現代数学的な問題からなる動的ベンチマークであるLiveMathBenchを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:49:55 GMT)
Improving GenIR Systems Based on User Feedback [37.9] 本章では,ユーザフィードバックに基づくGenIRシステムの改善方法について論じる。
GenIRのユーザフィードバックから学ぶさまざまな方法が紹介されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:32:54 GMT)
Underwater Image Restoration Through a Prior Guided Hybrid Sense Approach and Extensive Benchmark Analysis [37.5] このフレームワークは複数のスケールで動作し、提案された textbfDetail Restorer モジュールを使用して、低レベルの詳細な機能を復元する。
3つの実世界の水中データセットのペアトレーニングデータを用いたベンチマークを構築した。
このベンチマークでは,従来型および再学習型23種類の水中画像復元手法を試験し,各手法の計測結果を得た。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:06:37 GMT)
Mixture-of-Experts Graph Transformers for Interpretable Particle Collision Detection [36.6] 本稿では,グラフトランスフォーマーモデルとMixture-of-Expertレイヤを組み合わせることで,高い予測性能を実現する手法を提案する。
我々は、ATLAS実験からシミュレーションイベントのモデルを評価し、希少な超対称性信号イベントの識別に焦点をあてた。
このアプローチは、高エネルギー物理学に適用された機械学習手法における説明可能性の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:28:19 GMT)
SoK: A Review of Cross-Chain Bridge Hacks in 2023 [36.1] クロスチェーン橋は、高度な設計とセキュリティ対策にもかかわらず、様々な攻撃に弱いままである。
本稿では、2022年と2023年のクロスチェーンブリッジハックを分析し、悪用された脆弱性について検討する。
この発見は、橋梁の安全性と運用のレジリエンスに関する業界全体の標準の開発に寄与する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:05:14 GMT)
Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild [35.9] 軽量マルチモーダル大言語モデル(MLLM)に適した革新的学習・推論フレームワークを考案する。
我々の自己組織化アプローチはMLLMを組織的にガイドし、ターゲット問題に関連する視覚的手がかりに集中させ、幻覚を減らし、きめ細かい画像の詳細を記述できるモデルの能力を高める。
各種ベンチマーク実験により,SQの自己探索,ゼロショット視覚推論,幻覚緩和における顕著な能力を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:16:56 GMT)
Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data [35.9] 大規模マルチモーダル命令データセットであるInfinity-MMを導入する。
統一された前処理を実行し、多様性と正確性を保証する4000万以上のサンプルからなるデータセットを作成しました。
タグ付けシステムとオープンソースのVision-Languageモデルに基づく合成命令生成手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:48:47 GMT)
On Penalty-based Bilevel Gradient Descent Method [35.8] バイレベル最適化は、新興機械学習や信号処理問題における幅広い応用を享受している。
最近の二レベルアルゴリズムの進歩は、暗黙の勾配法を通した双レベル最適化問題に主眼を置いている。
本研究では,ペナルティ手法のレンズを用いて,二段階問題に挑戦する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:56:30 GMT)
InfiFusion: A Unified Framework for Enhanced Cross-Model Reasoning via LLM Fusion [35.6] 本稿では,複数のドメイン特化モデルを効率的なピボットモデルに統合する戦略について検討する。
複数のLLMの強度を組み合わせるための2つの融合戦略を提案する。
GSM8K,MATH,HumanEvalの各タスクにおいて,9.27%,8.80%,8.89%の精度向上を実現した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:29:55 GMT)
ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses [35.3] 局所的な特徴マッチングのための効率的なトランスフォーマーベースネットワークアーキテクチャを提案する。
YFCC100Mデータセットでは、我々のマッチング精度は最先端のトランスフォーマーベースのアーキテクチャであるLoFTRと競合する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:19:15 GMT)
When Should Selfish Miners Double-Spend? [35.2] 攻撃者は、そのプライベートブランチが一定の長さに達するまで頑強に行動し、その後、自己中心的に行動するように切り替える戦略を構築する。
各攻撃サイクルにおいて、スタバボーンのレベルが$k$以上であれば、敵に無コストでやってくる二重投射のリスクがあることが示される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:59:26 GMT)
Ultrasound-QBench: Can LLMs Aid in Quality Assessment of Ultrasound Imaging? [34.5] Ultrasound-QBenchは、超音波画像の品質評価タスクにおいて、マルチモーダル大言語モデル(MLLM)を体系的に評価する包括的なベンチマークである。
評価の結果,MLLMは超音波画像品質分類における低レベル視覚タスクの予備的機能を有することがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:58:31 GMT)
VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset [34.4] マルチモーダル理解と生成のためのビジョン・オーディエンジュ・オムニ・ペセプション事前学習モデル(VALOR)を提案する。
VALORは、視覚、音声、言語の関係をエンドツーエンドで共同でモデル化する。
一連の公開モダリティベンチマークにおいて、最先端のパフォーマンスを新たに達成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:10:55 GMT)
Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models [34.2] 本稿では,視覚トークン化器のトレーニングにおいて,潜在空間と事前学習された視覚基盤モデルとの整合性を提案する。
提案するVA-VAEは遅延拡散モデルの再構成世代フロンティアを著しく拡張する。
私たちは、LightningDiTと呼ばれるトレーニング戦略とアーキテクチャ設計を改善した拡張DiTベースラインを構築します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:28:11 GMT)
MLP Fusion: Towards Efficient Fine-tuning of Dense and Mixture-of-Experts Language Models [33.9] 訓練済みの言語モデル(PLM)を微調整することは、多くの自然言語処理アプリケーションにおいて主要な戦略として現れる。
一般的なアプローチ(量子化や蒸留など)は、PLM微細チューニングの計算/メモリを減らすために広く研究されている。
微調整に特化して設計されたワンショット圧縮技術を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:08:53 GMT)
WorldPose: A World Cup Dataset for Global 3D Human Pose Estimation [33.6] WorldPoseは、野生における多人数のグローバルポーズ推定の研究を進めるための、新しいデータセットである。
我々はHDカメラの静的多視点設定を利用して、前例のない精度で3Dプレーヤーのポーズと動きを復元する。
得られたデータセットは80以上のシークエンスで構成され、約2.5万の3Dポーズと総走行距離は120km以上である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:24:38 GMT)
Holistic Semantic Representation for Navigational Trajectory Generation [33.6] ナビゲーション生成のためのHOSER(Holistic Semantic Representation)フレームワークを開発した。
我々は,HOSERが最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:11:12 GMT)
Integrating Language-Image Prior into EEG Decoding for Cross-Task Zero-Calibration RSVP-BCI [33.3] 現在のRSVP復号法は単一のRSVPタスク内における脳波信号の復号化に有効であるが,異なるRSVPタスクに直接適用した場合,その復号性能は著しく低下する。
本研究では,クロスタスクゼロ校正RSVP復号性能の向上を目的とした。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:38:05 GMT)
CHAT: Beyond Contrastive Graph Transformer for Link Prediction in Heterogeneous Networks [32.7] コントラスト型異種グラーフ変圧器(CHAT)
興味のあるノードを選択的に保持する新しいサンプリングベースのグラフトランスフォーマー技術。
複数のサンプリングを合成して予測精度を高めるアンサンブルリンク予測器。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:56:58 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:53:18 GMT)
Large Language Model Enhanced Recommender Systems: Taxonomy, Trend, Application and Future [31.3] 本稿では,Large Language Model (LLM) を利用したレコメンダシステム(RS)の強化を目的とした最新の研究成果について報告する。
我々は、LLMをオンラインシステムに組み込む動き、特に推論時にの使用を避けることで、この分野における重要な変化を識別する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:27:00 GMT)
Brick-Diffusion: Generating Long Videos with Brick-to-Wall Denoising [31.3] Brick-Diffusionは、任意の長さの長いビデオを生成することができる訓練不要のアプローチである。
提案手法では, ブロック・ツー・ウォール・デノナイズ戦略を導入し, 潜伏剤をセグメントにデノナイズし, その後の繰り返しにストライドを適用した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:19:15 GMT)
AE-NeRF: Augmenting Event-Based Neural Radiance Fields for Non-ideal Conditions and Larger Scene [31.1] 非理想的条件からイベントベースNeRFを学習する際の課題を解決するために,AE-NeRFを提案する。
本手法は,イベントベース3次元再構成における新しい最先端技術を実現する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:00:22 GMT)
Dataset Decomposition: Faster LLM Training with Variable Sequence Length Curriculum [30.5] 大規模言語モデル(LLM)は、固定長トークンシーケンスからなるデータセットで一般的に訓練される。
最近の注目実装では、クロスドキュメントの注意を隠蔽し、トークンの塊の有効長を削減している。
本稿では,新しい可変シーケンス長トレーニング手法であるデータセット分解を導入する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:51:47 GMT)
Characterizing the Accuracy-Communication-Privacy Trade-off in Distributed Stochastic Convex Optimization [30.5] M$クライアントの分散環境でのDP-SCO(差分プライベート凸最適化)の問題点を考察する。
目的は,100万ドル規模のクライアントを対象とした協調作業を用いて,凸人口減少を最小限に抑えるアルゴリズムを設計することである。
我々は,新しい下位境界と分散DP-SCOの新しいアルゴリズムを用いて,一致した逆と達成可能性を求める。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:57:05 GMT)
Trust Modeling in Counseling Conversations: A Benchmark Study [30.2] 患者とセラピストとの治療結合は、直接的に効果的なメンタルヘルスカウンセリングを促進する。
私たちの信頼の定義には、患者が自己表現する意思とオープン性が含まれます。
我々の研究は、治療相互作用における信頼の進化の展開を目的としている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:02:30 GMT)
MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models [30.1] MotionBenchは、ビデオ理解モデルの詳細な動作理解を評価するために設計された評価ベンチマークである。
さまざまなソースから収集されたデータが含まれており、現実世界のビデオコンテンツの広範な表現が保証されている。
我々のベンチマークは、より有能な映像理解モデルの開発をガイドし、動機づけることを目的としている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:57:38 GMT)
MDP3: A Training-free Approach for List-wise Frame Selection in Video-LLMs [30.1] ビデオ大言語モデル(ビデオ-LLM)は、ビデオの理解に大きな進歩をもたらした。
本稿では,クエリ関連性,リストワイド多様性,シーケンシャル性という,フレーム選択の3つの重要な原則に従わなければならないことを強調する。
フレーム選択のための動的プログラミング(MDP3)を用いたマルコフ決定点プロセスを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:55:55 GMT)
HOGSA: Bimanual Hand-Object Interaction Understanding with 3D Gaussian Splatting Based Data Augmentation [29.8] 本稿では,2次元手動物体間相互作用のための3次元ガウススプラッティングに基づくデータ拡張フレームワークを提案する。
メッシュベースの3DGSを用いてオブジェクトとハンドをモデル化し、マルチレゾリューション入力画像によるレンダリングのぼかし問題に対処する。
両手オブジェクトに対する片手握りポーズ最適化モジュールを拡張し、両手オブジェクト間相互作用のさまざまなポーズを生成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:48:17 GMT)
Dr. Tongue: Sign-Oriented Multi-label Detection for Remote Tongue Diagnosis [28.9] 舌の診断は、西洋や伝統中国医学において欠かせない道具である。
新型コロナウイルスの感染拡大により、正確な遠隔医療評価の必要性が高まっている。
署名指向マルチラベル属性検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:40:45 GMT)
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models [28.7] PRMベンチ(PRM Bench)は, PRMの微細な誤差検出機能を評価するための, プロセスレベルのベンチマークである。
PRMBenchは、6,216の慎重に設計された問題と83,456のステップレベルラベルで構成され、複数の次元にわたるモデルを評価する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:31:45 GMT)
Multi-Task Program Error Repair and Explanatory Diagnosis [28.7] マルチタスクプログラムエラー修復・説明診断(mPRED)のための新しい機械学習手法を提案する。
ソースコードのエンコードには事前訓練された言語モデルが使用され、ダウンストリームモデルはエラーを特定して修復するために特別に設計されている。
プログラム構造を可視化・解析するために,プログラム構造の可視化にグラフニューラルネットワークを用いる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:33:32 GMT)
CodeVision: Detecting LLM-Generated Code Using 2D Token Probability Maps and Vision Models [28.7] 大規模言語モデル(LLM)の台頭により、自動コード生成が大幅に改善され、ソフトウェア開発の効率が向上した。
事前訓練されたモデルや透かしなどの既存の検出方法は、適応性と計算効率の制限に直面している。
本稿では,視覚モデルと組み合わせた2次元トークン確率マップを用いた新しい検出手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:15:10 GMT)
A Simple-but-effective Baseline for Training-free Class-Agnostic Counting [28.2] CAC(Class-Agnostic Counting)は、いくつかの参照例だけで、与えられた画像内のオブジェクトを正確にカウントすることを目指している。
近年の取り組みでは、既存の基礎モデルを利用することで、トレーニングなしでこれを達成できることが示されている。
我々は、このパフォーマンスギャップを効果的に橋渡しし、強力なベースラインとして機能する、トレーニング不要のソリューションを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:58:34 GMT)
Sentiment-guided Commonsense-aware Response Generation for Mental Health Counseling [28.2] 反応生成にコモンセンス認識を取り入れた感情誘導機構であるEmpResを提案する。
ファンデーションモデルを活用し、コモンセンスの知識を活用することで、EmpResはクライアントの肯定的な感情を効果的に形作る応答を生成することを目指している。
以上の結果から,ユーザの91%がシステムの有効性を認め,80%が満足度を示し,85.45%以上がインターフェースの使用を継続し,他の人に推奨していることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:41:52 GMT)
CALM: Curiosity-Driven Auditing for Large Language Models [27.3] 本稿では,LLMを監査エージェントとして微調整するために,大規模言語モデルのための好奇心駆動型監査(CALM)を提案する。
CALMは、有名人を含む嫌悪的な完成をうまく識別し、ブラックボックス設定の下で特定の名前を引き出す入力を明らかにする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:14:34 GMT)
Multi-Modal One-Shot Federated Ensemble Learning for Medical Data with Vision Large Language Model [27.3] 我々は、革新的なワンショットマルチモーダル・フェデレート・アンサンブル学習フレームワークであるFedMMEを紹介する。
FedMMEは、医用画像からテキストレポートを作成するために、視覚的大言語モデルを活用している。
RSNAデータセットでは、既存のワンショットのフェデレーション学習アプローチを17.5%以上上回っている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:36:28 GMT)
Domain-Agnostic Co-Evolution of Generalizable Parallel Algorithm Portfolios [27.1] 一般化は、データからトレーニングする際の中核的な目的である。
並列アルゴリズムポートフォリオ(PAP)とインスタンス人口を同時に進化させることによって、共進化的アプローチはこの課題に対処する。
本研究は,パラメタライズドサーチ(DACE)のドメインに依存しない共進化という,汎用的で既成のPAP構築手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:29:48 GMT)
P3S-Diffusion:A Selective Subject-driven Generation Framework via Point Supervision [26.8] 本稿では,P3S-Diffusionについて紹介する。
P3S-Diffusionは最小のコストラベル(例えば点)を利用して主観的画像を生成する。
これらの点から拡張されたベースマスクを生成することができ、さらなるセグメンテーションモデルの必要性を回避できる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:50:36 GMT)
HaWoR: World-Space Hand Motion Reconstruction from Egocentric Videos [26.8] HaWoRは、エゴセントリックなビデオから世界座標のハンドモーション再構成のための高忠実度手法である。
正確なカメラ軌道推定を実現するために,適応型エゴセントリックSLAMフレームワークを提案する。
本研究では,HawoRが手動再建と世界フレームカメラの軌跡推定の両面において,最先端の性能を実現することを実証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:29:33 GMT)
Registering Source Tokens to Target Language Spaces in Multilingual Neural Machine Translation [26.7] 我々は,デコーダのみのMNMTモデルの新たな最先端化を実現するために登録を導入する。
具体的には、レジスタと呼ばれるターゲット言語を指定する人工トークンのセットを入力シーケンスに挿入する。
大規模ベンチマークであるEC-40の実験により,本手法が関連する手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:42:54 GMT)
Forward Once for All: Structural Parameterized Adaptation for Efficient Cloud-coordinated On-device Recommendation [26.4] Forward-OFAはデバイス固有のネットワークを動的に構築するための新しいアプローチである。
構築されたネットワークのパラメータに対するリアルタイム行動の構造誘導マッピングを確立する。
実世界のデータセットの実験では、Forward-OFAの有効性と効率が示されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:32:16 GMT)
Revisiting In-Context Learning with Long Context Language Models [26.1] In-Context Learning (ICL) は、言語モデルが入力コンテキストで提供される例に基づいて予測を行う手法である。
LCLM(Long Context Language Models)の出現により、コンテキストに含まれるサンプルの数が大幅に増加した。
4つのタスクにまたがる18のデータセットに関する広範な実験を通じて、LCLMの文脈でこれらのアプローチを再考する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:45:06 GMT)
Normalizing Batch Normalization for Long-Tailed Recognition [25.8] 頻繁なクラスに対するバイアスは、特徴にエンコードされる可能性がある。つまり、稀なクラスを識別する上で重要な役割を果たす稀な特徴は、頻繁な特定の特徴よりもはるかに弱い。
我々は、特徴バイアスを明示的に修正するために、バッチ正規化層のパラメータを正規化する、単純で効果的なアプローチを導入します。
我々の手法は過去の最先端を著しく上回る。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:29:46 GMT)
Detecting Defective Wafers Via Modular Networks [24.7] 本稿では,製造プロセスの構造を具現化した時系列段階データセットを用いて学習したモジュールネットワーク(MN)を提案する。
これはKQI予測をステージモジュールの組み合わせとして分解し、組成半導体製造をシミュレートする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:11:37 GMT)
OpenGU: A Comprehensive Benchmark for Graph Unlearning [24.6] Graph Unlearning(GU)は、プライバシに敏感なアプリケーションにとって重要なソリューションとして登場した。
最初のGUベンチマークであるOpenGUでは、16のSOTA GUアルゴリズムと37のマルチドメインデータセットが統合されている。
既存のGUメソッドに関する決定的な結論は8ドルもしますが、その一方で、その制限について貴重な洞察を得ています。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:57:32 GMT)
ICFNet: Integrated Cross-modal Fusion Network for Survival Prediction [24.3] 本稿では,スライド画像全体,ゲノム表現プロファイル,患者の人口統計,治療プロトコルを統合した総合的クロスモーダル・フュージョン・ネットワーク(ICFNet)を提案する。
ICFNetは、5つのパブリックTCGAデータセットで最先端のアルゴリズムより優れている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:49:08 GMT)
Cross-Dialect Information Retrieval: Information Access in Low-Resource and High-Variance Languages [23.9] 地域や文化特有の知識は、方言で書かれた文書にしか見つからない。
我々は、ウィキペディアから抽出された7つのドイツ語方言からなる最初のドイツ語方言検索データセット、WikiDIRを紹介した。
マルチリンガルエンコーダを用いたゼロショット・クロスリンガル変換手法は, 極低リソース化には適さないことを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:27:27 GMT)
An Image-based Typology for Visualization [23.7] 可視化画像の質的解析に基づいて,画像に基づく可視化のタイプロジーを導出する。
その結果、画像の型付けは多くの目的に役立てることができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:15:12 GMT)
Leader Rotation Is Not Enough: Scrutinizing Leadership Democracy of Chained BFT Consensus [23.6] 我々は4つの代表的連鎖型BFTプロトコルの指導的民主主義を、特に攻撃下で精査する。
我々の結果は、リーダーのローテーションは、リーダーシップ民主主義の保証を提供するには不十分であることを示している。
本稿では,その指導的民主主義を改善するために,評価された3つのプロトコルをカスタマイズした対策を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:27:34 GMT)
Qinco2: Vector Compression and Search with Improved Implicit Neural Codebooks [23.6] QINCo2は,BigANNの16バイトベクトル圧縮では34%,Deep1Mでは8バイトエンコーディングでは24%の検索精度向上を実現している。
ベクトル圧縮のためのQINCo2と、数十億近い近接探索のための4つのデータセットの実験を行った。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:20:22 GMT)
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design [23.5] 本稿では、強化学習システムにまたがるパラメータを最適化するフレキシブルなローコードプラットフォームであるnameを提示する。
AgentForgeは最適化問題を数行のコードで定義し、インターフェースドのいずれかに渡すことを可能にする。
本稿では,視覚に基づくRL問題に対する性能評価について述べる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:32:59 GMT)
SecBench: A Comprehensive Multi-Dimensional Benchmarking Dataset for LLMs in Cybersecurity [23.3] SecBenchは、サイバーセキュリティドメインの大規模言語モデル(LLM)を評価するために設計されたベンチマークデータセットである。
このデータセットは、オープンソースから高品質なデータを収集し、サイバーセキュリティ質問設計コンテストを組織することで構築された。
16個のSOTA LLMのベンチマーク結果はSecBenchのユーザビリティを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:22:50 GMT)
Unsupervised Domain Adaptation for Occlusion Resilient Human Pose Estimation [23.1] 排除は人間のポーズ推定アルゴリズムにとって重要な課題である。
OR-POSE: Occlusion Resilient Human POSE Estimationのための教師なしドメイン適応を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:30:37 GMT)
OpenLKA: an open dataset of lane keeping assist from market autonomous vehicles [23.1] レーンキーピング・アシスト(LKA)は近年の自動車の標準機能となっている。
LKAシステムの運用特性と安全性能は未調査のままである。
フロリダ州タンパの大手自動車メーカーからLKAシステムを広範囲にテストした。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:46:10 GMT)
DeCon: Detecting Incorrect Assertions via Postconditions Generated by a Large Language Model [22.4] 対象問題に対するLLM生成後条件による誤認識を効果的に検出する,DeCon という新しい手法を提案する。
デコンは64%以上(それぞれGPT-3.5とGPT-4で検出された63%と65.5%)の誤ったアサーションを4つの最先端LCMで検出できる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:25:28 GMT)
Horizon Generalization in Reinforcement Learning [22.4] 一般化のレンズを通してゴール条件付きRLを研究するが、従来のランダム拡張とドメインランダム化の意味ではそうではない。
地平線一般化の概念は計画の不変性と密接に関連していることを示す。
目標に向かって航行する政策は、その目標に向かう途中のルートポイントに向かっているように、同じ行動を選択する。したがって、近くの目標に到達するために訓練された政策は、任意に距離を置く目標に達することに成功すべきである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:42:46 GMT)
CCStereo: Audio-Visual Contextual and Contrastive Learning for Binaural Audio Generation [21.6] バイノーラルオーディオ生成(BAG)は、視覚的プロンプトを用いてモノラルオーディオをステレオオーディオに変換することを目的としている。
現在のモデルは、部屋の環境に過度に適合し、きめ細かい空間的詳細を失うリスクがある。
本稿では,音声-視覚条件正規化層を取り入れた新しい音声-視覚生成モデルを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:04:21 GMT)
E-ICL: Enhancing Fine-Grained Emotion Recognition through the Lens of Prototype Theory [21.5] 本稿では,プロトタイプ理論の観点からICLの性能低下の原因を明らかにする。
感情認識のための感情文脈学習法(E-ICL)を提案する。
EDOS, Empathetic-Dialogues, EmpatheticIntent, GoEmotionsの詳細な感情データセット実験により, E-ICLが優れた感情予測性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:52:41 GMT)
Grasp, See, and Place: Efficient Unknown Object Rearrangement with Policy Structure Prior [21.2] ロボットがオブジェクトをRGB-D画像で指定された目標設定に再構成することを想定する、未知のオブジェクト再構成のタスクに焦点をあてる。
近年の研究では、学習に基づく知覚モジュールを組み込んだ未知の物体再構成システムについて検討している。
本稿では,結合構造を持つ二重ループシステム GSP を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:42:49 GMT)
Enhancing Quantum State Reconstruction with Structured Classical Shadows [20.9] 提案手法では,提案手法を用いてQSTの性能を保証した古典影法(PCS)を提案する。
PCSは、ターゲット部分空間にプロジェクションステップを組み込むことで、標準CSメソッドを拡張している。
行列積演算子状態に対して、PCS法は、$O(n2)$トータル状態コピーで基底構造を復元できることを実証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:09:38 GMT)
The FACTS Grounding Leaderboard: Benchmarking LLMs' Ability to Ground Responses to Long-Form Input [19.7] FACTS Groundingは、与えられた文脈に対して実際に正確であるテキストを生成する言語モデルの能力を評価する。
モデルは2つのフェーズで自動判断モデルを用いて評価される。
FACTSグラウンディングのリーダーボードは、時間とともにアクティブに維持される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:28:04 GMT)
FlipedRAG: Black-Box Opinion Manipulation Attacks to Retrieval-Augmented Generation of Large Language Models [19.4] Retrieval-Augmented Generation (RAG)は、知識データベースから関連する情報を動的に取得することで、幻覚とリアルタイムの制約に対処する。
本稿では,より現実的で脅迫的なシナリオとして,RAGに対する議論の的となっている論点に対する意見操作について紹介する。
本稿では、転送ベースであるFlipedRAGと呼ばれる新しいRAGブラックボックス攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:24:57 GMT)
Key-value memory in the brain [19.3] キーバリューメモリシステムは、記憶(値)と検索(キー)に使用される表現を区別する
これにより、キーバリューメモリシステムは、ストレージの忠実度と検索の識別性を同時に最適化できる。
我々は、キーバリューメモリの計算基盤、現代の機械学習システムにおけるその役割、心理学と神経科学の関連概念、数多くの経験的パズルへの応用、そして生物学的実装の可能性についてレビューする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:46:40 GMT)
Quality Estimation based Feedback Training for Improving Pronoun Translation [18.7] 名詞翻訳は神経機械翻訳(NMT)における長年の課題である
本稿では,文脈認識型NMTシステムにおける代名詞と全体的な翻訳品質の向上を目的とした新しいフレームワークであるProNMTを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:34:51 GMT)
GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT [18.5] sCT生成のためのグローバルローカル特徴・コントラスト学習フレームワークを提案する。
Mamba-Enhanced UNet (MEUNet) は、Mambaブロックを高解像度UNetのスキップ接続に統合することで実現されている。
SynthRAD2023データセットの実験では、GLFCはオリジナルのCBCTと比較してsCTのSSIMを77.91%から91.50%改善した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:11:47 GMT)
LiLMaps: Learnable Implicit Language Maps [18.3] 本稿では、視覚言語機能の統合により、漸進的な暗黙マッピングを強化するアプローチを提案する。
具体的には、(i)シーンに新しいオブジェクトが現れたときに使用できる暗黙の言語マップのためのデコーダ最適化手法を提案し、(ii)異なる視聴位置間の一貫性のない視覚言語予測の問題に対処する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:04:56 GMT)
3D-ViTac: Learning Fine-Grained Manipulation with Visuo-Tactile Sensing [18.2] 本稿では,ロボットのためのマルチモーダルセンシング学習システムであるtextbf3D-ViTacを紹介する。
このシステムは、高密度センシングユニットを備えた触覚センサーを備えており、それぞれが3$mm2$の面積をカバーしている。
低コストのロボットでも精密な操作が可能であり、視覚のみのポリシーよりもはるかに優れていることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:23:50 GMT)
To Analyze and Regulate Human-in-the-loop Learning for Congestion Games [18.0] 混雑ゲームでは、利己的なユーザは最短経路に群がり、ソーシャルプランナーは情報や支払いインセンティブを通じて、そのような利己的なルーティングを規制する仕組みを設計する。
我々は,到着時パスを過度に発見しようとする場合にのみ最新の交通情報を公開すると同時に,過度に発見したい場合にその情報を隠蔽する,新しい選択情報開示機構を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:41:45 GMT)
Validating Large-Scale Quantum Machine Learning: Efficient Simulation of Quantum Support Vector Machines Using Tensor Networks [17.8] 本稿では,大規模量子回路のシミュレーションに有効なテンソルネットワーク方式を提案する。
我々のシミュレーターは、最大784キュービットのQSVMをうまく処理し、1つの高性能GPU上で数秒でシミュレーションを完了する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:30:36 GMT)
Interactive 3D Medical Image Segmentation with SAM 2 [17.5] ビデオで訓練した次世代のMeta SAMモデルSAM 2のゼロショット機能について, 医用画像のセグメンテーションについて検討する。
3D画像のシーケンシャルな2Dスライスをビデオフレームとして扱うことで、SAM 2は単一のフレームから3Dボリューム全体へのアノテーションの完全な伝達を可能にする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:00:07 GMT)
Exploring Information Processing in Large Language Models: Insights from Information Bottleneck Theory [17.4] 大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。
本稿では,情報ボトルネック理論の観点から,情報処理におけるLLMの動作機構について考察する。
情報圧縮に基づくコンテキスト学習(IC-ICL)とタスク空間誘導ファインタニング(TS-FT)の2つの新しいアプローチを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:49:09 GMT)
Enhancing Trustworthiness of Graph Neural Networks with Rank-Based Conformal Training [17.1] 等角予測は統計的に保証された不確実性推定を生成することができる。
本稿では,GNN(RCP-GNN)のトレーニングフレームワークにおけるランクベースのCPを提案し,信頼性の高い不確実性推定を行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:19:24 GMT)
Convexity in ReLU Neural Networks: beyond ICNNs? [17.0] 1階層のReLUネットワークで実装された凸関数はすべて、同じアーキテクチャのICNNで表現可能であることを示す。
また,多数のアフィン領域を持つReLUニューラルネットワークに対して,正確な凸性チェックを可能にする数値計算手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:53:59 GMT)
Balancing Efficiency and Expressiveness: Subgraph GNNs with Walk-Based Centrality [16.9] HyMNは、サブグラフGNNの計算コストを軽減しつつ、メッセージパッシングニューラルネットワーク(MPNN)の限界に効果的に対処する。
本手法は他のサブグラフサンプリング手法よりも優れた性能を示し、フルバグのサブグラフGNNと競合することを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:20:54 GMT)
The Scaling Law for LoRA Base on Mutual Information Upper Bound [16.5] 微調整では、モデル性能、モデルパラメータ、データ複雑性の法則がこの分野において問題となっている。
そこで我々は,Mutual Information Upper Bound (MIUB) 理論に基づく内部メトリクスを提案し,大規模モデルLORAファインタニングのスケーリング法則について検討する。
提案したMIUB測度は、クロスエントロピーやパープレキシティと比較して、ロラ微調整のスケーリング法則とより正確かつ安定に一致している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:19:19 GMT)
Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance [16.0] 不均衡な分類と急激な相関は、データサイエンスと機械学習における一般的な課題である。
近年の進歩は、大規模言語モデルの柔軟性と生成能力を生かして合成サンプルを生成することを提案した。
本稿では,不均衡な分類とスプリアス相関に対処する上で,合成試料の役割を体系的に研究する新たな理論基盤を開発する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:37:48 GMT)
Beyond Pass or Fail: A Multi-dimensional Benchmark for Mobile UI Navigation [15.8] UIナビゲーションにおける既存モデルの多次元評価のための新しいベンチマークSphinxを提案する。
Sphinxには、不変ベースの検証、知識探索、知識拡張生成など、多次元評価のための包括的なツールキットが含まれている。
我々は、Sphinx上で13の異なる構成を持つ8つの大言語およびマルチモーダルモデルをベンチマークした。評価結果は、これらのモデルすべてがSphinxで苦労し、全てのテスト生成タスクで失敗していることを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:10:11 GMT)
Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV [15.6] 医用画像修復のための最初のRWKVモデルであるRestore-RWKVを提案する。
本稿では,線形計算複雑性を伴う大域的依存関係を捕捉する再帰的WKV(Re-WKV)アテンション機構を提案する。
実験の結果,Restore-RWKV は様々な医療画像復元作業において SOTA の性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:27:33 GMT)
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map [15.6] 交通標識から運転規則を抽出するための新しいデータセットであるMapDRを紹介する。
MapDRには1万ドル以上の注釈付きビデオクリップがあり、交通標識規則と車線との複雑な相関関係を捉えている。
交通標識規則の統合において重要なギャップを埋め、信頼性の高い自動運転システムの開発に寄与する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:07:55 GMT)
Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation [15.6] 心臓血管疾患(CVD)と心臓ジスシンフォニー(英語版)は、米国で主要な公衆衛生上の問題である。
本稿では,心的セグメンテーションのための新しい効率的適応型フェデレート学習法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:57:18 GMT)
Multilevel Semantic-Aware Model for AI-Generated Video Quality Assessment [15.5] 本稿では,AI生成ビデオ品質評価のためのマルチレベルセマンティック・アウェアモデルであるMSA-VQAを紹介する。
我々の階層的なフレームワークは、ビデオコンテンツを3つのレベル(フレーム、セグメント、ビデオ)で分析します。
ビデオと条件付きプロンプト間のセマンティック一貫性を確保するために,CLIPのテキストエンコーダを用いたPrompt Semantic Supervision Moduleを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:18:11 GMT)
MVP: Multimodal Emotion Recognition based on Video and Physiological Signals [15.5] ビデオと生理の合理化を図ったMultimodal for Video and Physioアーキテクチャを設計する。
MVPは、長い入力シーケンス(1-2分)の使用を可能にするために注意の利益を利用する
その結果,MVPは表情映像,EDA,ECG/ECGに基づく感情認識の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:09:22 GMT)
Personalized Fashion Recommendation with Image Attributes and Aesthetics Assessment [15.4] 利用可能な情報、特に画像を2つのグラフ属性に変換することで、より正確なファッションレコメンデーションを提供することを目指している。
画像とテキストを2つのコンポーネントとして分離する従来の手法と比較して,提案手法は画像とテキスト情報を組み合わせてよりリッチな属性グラフを作成する。
IQON3000データセットの予備実験により,提案手法はベースラインと比較して競争精度が向上することを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:31:10 GMT)
Fast and Sample Efficient Multi-Task Representation Learning in Stochastic Contextual Bandits [15.3] 本研究では,表現学習が文脈的包帯問題の学習効率を向上させる方法について検討する。
本稿では,予測勾配勾配(GD)と最小化推定器に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:38:48 GMT)
Foundations of Platform-Assisted Auctions [15.3] 本研究では,プラットフォーム支援オークションを無許可環境で研究するための新しいモデルを提案する。
本稿では,効率的なプラットフォーム支援オークションの設計に暗号がいかに役立つかを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:04:26 GMT)
RDD4D: 4D Attention-Guided Road Damage Detection And Classification [15.3] 本稿では,個々の画像から多様な道路被害タイプを抽出する新しい道路被害検出データセットを提案する。
また、Attention4Dブロックを利用したRDD4Dというモデルも提供しています。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:48:04 GMT)
CAMP: Collaborative Attention Model with Profiles for Vehicle Routing Problems [15.1] プロファイル車両ルーティング問題(PVRP)は、異種静電容量車両ルーティング問題(HCVRP)の一般化である。
マルチエージェント強化学習を用いてPVRPの効率的な解法を学習する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:37:56 GMT)
Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification [15.1] 本稿では,動的少ショットテキスト分類のためのグラフベースのオンライン検索拡張生成フレームワークであるGORAGを提案する。
GORAGは、すべてのターゲットテキストの側情報を抽出し、適応情報グラフを構築し、維持する。
実証的な評価は、GORAGがより包括的で正確な文脈情報を提供することで、既存のアプローチよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:43:31 GMT)
A Soft Sensor Method with Uncertainty-Awareness and Self-Explanation Based on Large Language Models Enhanced by Domain Knowledge Retrieval [14.9] Few-shot Uncertainty-aware and Self-Explaining Soft Sensor (LLM-FUESS) というフレームワークを提案する。
LLM-FUESSには、ゼロショット補助可変セレクタ(LLM-ZAVS)と不確実性認識Few-shot Soft Sensor(LLM-UFSS)が含まれている。
提案手法は,最先端の予測性能,強靭性,柔軟性を実現し,従来の手法のトレーニング不安定性を効果的に軽減する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:43:29 GMT)
Adversarial Vulnerabilities in Large Language Models for Time Series Forecasting [14.6] 本稿では,Large Language Models (LLMs) に基づく時系列予測のための攻撃フレームワークを提案する。
実験により, 対向攻撃は, ランダムノイズよりもはるかに深刻な性能劣化を引き起こすことが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:32:48 GMT)
LightGNN: Simple Graph Neural Network for Recommendation [14.5] グラフニューラルネットワーク(GNN)は、協調的なレコメンデーションにおいて優れたパフォーマンスを示している。
既存のGNNパラダイムは、大規模でノイズの多い実世界のデータセットを扱う場合、スケーラビリティと堅牢性の課題に直面している。
軽量・蒸留方式のGNNプルーニングフレームワークであるLightGNNについて述べる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:59:55 GMT)
Foundations of GenIR [14.5] この章では、情報アクセスシステムにおける現代の生成AIモデルの基盤的影響について論じている。
従来のAIとは対照的に、生成AIモデルの大規模なトレーニングと優れたデータモデリングにより、高品質で人間らしい応答を生成することができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:38:29 GMT)
Single-Channel Distance-Based Source Separation for Mobile GPU in Outdoor and Indoor Environments [14.3] 本研究では,屋外環境における距離ベースソース分離(DSS)の意義を強調する。
室内環境に着目した既存の研究とは異なり、提案モデルは屋外音源の特徴を捉えるように設計されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:32:24 GMT)
Multi-field quantum conferencing overcomes the network capacity limit [14.3] 量子会議により、量子ネットワーク内の複数のノードが、プライベートメッセージブロードキャストのためのセキュアなグループキーを共有することができる。
キーレートは、複数粒子の絡み合った状態をネットワークに分散するリピータレスキャパシティによって制限される。
本稿では,グリーンベルガー=ホルン=ザイリンガー状態の事実上の確立を含む,この限界を破る実用的マルチフィールドスキームを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:03:55 GMT)
MSA-CNN: A Lightweight Multi-Scale CNN with Attention for Sleep Stage Classification [14.2] マルチスケール・アテンション畳み込みニューラルネットワーク(MSA-CNN)を導入する。
時間的および空間的特徴抽出を分離し、コスト効率のよい大域的空間畳み込みを用いることにより、モデル複雑性をさらに低減する。
以上の結果から,MSA-CNNは3つのデータセットの全てのベースラインモデルに対して,精度とCohen's kappaを比較検討した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:46:02 GMT)
Offline-to-online hyperparameter transfer for stochastic bandits [14.0] 本稿では,バンディット問題から収集したオフラインデータにアクセス可能な転送学習環境について検討する。
タスク間(タスク数)とタスク内(タスク毎のアームプル数)のバウンダリを提供する。
UCBとLinUCBの探索パラメータやGP-UCBのチューニングノイズパラメータなど,いくつかの古典的アルゴリズムに適用した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:05:48 GMT)
Theoretical Foundations of Deep Selective State-Space Models [14.0] ディープSSMは、さまざまなドメインセットで優れたパフォーマンスを示す。
最近の研究で、線形リカレンス電力が入力と隠れ状態の間の乗法的相互作用を可能にすることが示されている。
ランダム線形再帰が単純な入力制御遷移を備える場合、隠れ状態は強力な数学的対象の低次元射影であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:43:25 GMT)
Dissecting Bit-Level Scaling Laws in Quantizing Vision Generative Models [13.9] 言語型モデルは様々な量子化設定において拡散型モデルより一貫して優れていることを示す。
この観察は、言語スタイルのモデルは、ビットレベルのスケーリング法則が優れていることを示唆し、モデルの品質とトータルビットとのトレードオフをより良くする。
蒸留プロセスにおける「暗黙的知識」と「明示的知識」のバランスをとることにより、蒸留知識の伝達を最適化するTopKLDを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:23:07 GMT)
Floquet geometric squeezing in fast-rotating condensates [13.8] 異方性ポテンシャルを周期的に駆動するFloquet-based state-preparationプロトコルを提案する。
このプロトコルは単一サイクロトロンモードのスクイーズを促進するだけでなく、2モードのスクイーズを可能にする。
我々の研究は、超低温の量子気体中の多様な幾何学的に圧縮された状態を実現するための、高度に制御可能なノブを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:15:51 GMT)
Mjolnir: Breaking the Shield of Perturbation-Protected Gradients via Adaptive Diffusion [13.8] フェデレートラーニングにおける勾配摂動保護のシールドを破ろうとする試みについて紹介する。
摂動抵抗性勾配漏洩攻撃であるMjolnirを導入する。
Mjolnirは、オリジナルのモデル構造や外部データへのアクセスを必要とせずに、勾配から摂動を取り除くことができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:37:01 GMT)
DRCap: Decoding CLAP Latents with Retrieval-Augmented Generation for Zero-shot Audio Captioning [13.6] DRCapはデータ効率が高く柔軟なゼロショットオーディオキャプションシステムである。
トレーニングにはテキストのみのデータが必要で、微調整を加えることなく、新しいドメインに迅速に適応できる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:52:02 GMT)
Deep-Relative-Trust-Based Diffusion for Decentralized Deep Learning [12.9] 分散学習戦略により、エージェントの集合は集中集約やオーケストレーションを必要とせずに、ローカルデータセットから効率的に学習することができる。
本稿では,最近導入されたニューラルネットワークの類似度尺度であるディープ・リレーショナル・トラスト(DRT)に基づく,DRT拡散と呼ばれる新しい分散学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:31:36 GMT)
Unsupervised Training of Convex Regularizers using Maximum Likelihood Estimation [12.6] 本稿では,雑音測定に基づいて,凸型ニューラルネットワークに基づく画像正規化項をトレーニングするために,最大限界推定を用いた教師なし手法を提案する。
実験により,提案手法は,様々な画像汚職操作者を対象とした類似の教師付きトレーニング手法と比較して,ほぼ競合する先行手法を生成することを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:28:17 GMT)
Reinforcement Learning from Automatic Feedback for High-Quality Unit Test Generation [12.5] 大規模言語モデル(LLM)は自動テストケース生成で人気を集めている。
LLMは大量のオープンソースコードでトレーニングされているため、ベストプラクティスに従わないテストケースをしばしば生成します。
静的解析に基づく品質指標に基づく高品質な単体テストを生成するために,RLSQM(Reinforcement Learning from Static Quality Metrics)を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:31:18 GMT)
Reinforcement Learning from Automatic Feedback for High-Quality Unit Test Generation [12.5] 大規模言語モデル(LLM)は、テストケースの自動生成を含むコード生成で人気を集めている。
LLMは、多くの場合、大量の公開コードでトレーニングされ、ベストプラクティスに従わないテストケースを含む。
RLSQM(Reinforcement Learning from Static Quality Metrics)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:41:09 GMT)
A Backdoor Attack Scheme with Invisible Triggers Based on Model Architecture Modification [12.4] 従来のバックドア攻撃では、トレーニングデータに特定のトリガーで悪意のあるサンプルを注入する。
より高度な攻撃は、モデルのアーキテクチャを直接変更する。
本論文では、新たなバックドア攻撃方法を示す。
モデルアーキテクチャ内にバックドアを埋め込んで,目立たない,ステルス的なトリガを生成する機能を備えている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:42:37 GMT)
Lean classical-quantum hybrid neural network model for image classification [12.4] 本稿では,変分回路の4層のみを用いて分類性能を実現するLan Classical-Quantum Hybrid Neural Network (LCQHNN)を提案する。
LCQHNNを公開データセット上の画像分類タスクに適用し,99.02%の分類精度を実現する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:38:22 GMT)
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use [12.2] 精神医学薬の副作用薬物反応(英: Adverse Drug Reactions, ADRs)は、精神疾患患者の入院の主要な原因である。
ADRに関連する問題を解決するための制限に直面している医療システムでは、LLM(Large Language Models)がこのギャップを埋める可能性がある。
我々の研究は、リスクの高いドメイン内の戦略駆動タスクにおけるLCMを評価するための総合的なベンチマークと評価フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:30:35 GMT)
SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration [12.1] SAGED(bias)はこれらの問題に対処する最初の総合的なベンチマークパイプラインである。
私たちは、Gemma2、Llama3.1、Mistral、Qwen2など、人気のある8bレベルのモデルでG20諸国でSAGEDを使用しています。
感情分析により、MistralとQwen2はGemma2やLlama3.1よりも最大差とバイアス濃度が低いが、すべてのモデルがロシアや(Qwen2を除く)中国に偏っていることが判明した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:26:44 GMT)
Sensorformer: Cross-patch attention with global-patch compression is effective for high-dimensional multivariate time series forecasting [12.1] 本稿では,まずグローバルパッチ情報を圧縮し,同時に圧縮された表現からクロス変数およびクロスタイム依存関係を抽出する新しい変換器であるSensorformerを提案する。
センサフォーマは、変数間の動的因果ラグが存在する場合でも、適切な変数間の相関関係と因果関係を効果的に捉えることができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:14:47 GMT)
Communication Bounds for the Distributed Experts Problem [12.1] 複数のサーバにまたがって専門家のコストを集約する必要がある分散環境での専門家の問題を調査する。
本稿では,これらの設定において,ほぼ最適に後悔する通信効率の高いプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:50:35 GMT)
Software Engineering and Foundation Models: Insights from Industry Blogs Using a Jury of Foundation Models [12.0] 我々は大手テクノロジー企業から155 FM4SEと997 SE4FMのブログ記事を分析した。
我々は、コード生成が最も顕著なFM4SEタスクであるのに対して、FMは他の多くのSEアクティビティに活用されていることを観察した。
クラウドのデプロイに重点を置いているが、FMを圧縮し、小さなデバイスにデプロイすることへの関心が高まっている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:49:13 GMT)
Cavity quantum electrodynamics of photonic temporal crystals [12.0] フォトニック時間結晶は、波の増幅や混合からエキゾチックなバンド構造まで、様々な興味深い現象を伴っている。
我々は,古典画像と量子画像との深い関係を明らかにする,PTCの量子電磁力学モデルを導入する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:13:03 GMT)
LEDiff: Latent Exposure Diffusion for HDR Generation [11.7] LEDiffは、遅延空間露光融合技術により、HDRコンテンツを生成する生成モデルを実現する方法である。
また、LDR-to-fusionコンバータとしても機能し、既存の低ダイナミックレンジ画像のダイナミックレンジを拡張する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:41:59 GMT)
Pathway to Secure and Trustworthy ZSM for LLMs: Attacks, Defense, and Opportunities [11.5] 本稿では,ZSMネットワークにおける大規模言語モデル(LLM)の微調整に伴うセキュリティ脆弱性について検討する。
LLMをサービスとして使用する場合の個人データ漏洩につながる可能性のあるダウンストリームタスクに対して,メンバシップ推論攻撃が有効であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:09:06 GMT)
Large Language Models for Video Surveillance Applications [11.3] 本稿では,ジェネレーティブ・人工知能(GenAI)を用いた視覚言語モデルによる概念実証について述べる。
本ツールでは,ユーザ定義クエリに基づいて,カスタマイズしたテキスト要約を生成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:57:44 GMT)
An Infrastructure Software Perspective Toward Computation Offloading between Executable Specifications and Foundation Models [11.0] ファンデーションモデル(FM)は、パターン認識や非構造化データ処理といった計算処理に優れ、現代のソフトウェアシステムにおいて不可欠なコンポーネントとなっている。
それらの能力は、記号プログラムのような実行可能な仕様の精度、検証可能性、決定論的性質によって補完される。
本稿では,それぞれの強みに基づいて,FMと実行可能な仕様との間で,計算タスクを戦略的に分散するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:02:28 GMT)
Exact Matching in Correlated Networks with Node Attributes for Improved Community Recovery [10.7] ノードとエッジが相互に相関する複数のネットワークにおけるコミュニティ検出について検討する。
本稿では,グラフ間の構造的および属性的相関を組み込んだCSBMについて紹介する。
この結果から,グラフマッチングとコミュニティリカバリの相互作用によって,パフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:57:44 GMT)
Lindblad estimation with fast and precise quantum control [10.4] 弱い波形を推定することは基礎物理学実験の中核的な課題である。
我々は、波形推定、量子ビットを用いた分光法、リンドブラッド推定を含む幅広い応用のためのプロトコルを開発する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:05:42 GMT)
InpDiffusion: Image Inpainting Localization via Conditional Diffusion Models [10.2] 現在のIIL法は2つの大きな課題に直面している。
拡散モデルを用いた条件付きマスク生成タスクとしてIILを扱う新しいパラダイムを提案する。
我々の手法であるInpDiffusionは、画像意味条件の統合によって強化された復調過程を利用して、予測を段階的に洗練する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:32:12 GMT)
Probing Stress and Magnetism at High Pressures with Two-Dimensional Quantum Sensors [10.1] 高圧力室に直接2次元(2次元)材料の薄い層中に光スピン欠陥を集積する。
ダイヤモンドアンビルに埋め込まれた窒素空洞センターと比較して、我々の2Dセンサーは局所的なストレスに対して約3倍強い反応を示します。
我々の研究は、高圧実験のための統合量子センシング装置を実証し、圧力誘起現象の予測への応用の可能性を示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:00:01 GMT)
DarkFarseer: Inductive Spatio-temporal Kriging via Hidden Style Enhancement and Sparsity-Noise Mitigation [10.0] センサーネットワークを構築するための高コストは、その規模とカバレッジを制限し、きめ細かいデプロイメントを困難にしている。
Inductctive Spatio-Temporal Kriging (ISK)は仮想センサを導入してこの問題に対処する。
3つのキーコンポーネントを持つ新しいISKフレームワークであるDarkFarseerを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:11:34 GMT)
Mobile Augmented Reality Framework with Fusional Localization and Pose Estimation [9.7] GPSベースのモバイルARシステムは、通常、屋内環境における不正確な位置決めのため、性能が良くない。
本稿ではまず,モバイルプラットフォーム上での最先端ARとローカライゼーションシステムについて包括的に研究する。
そこで本研究では,効果的な屋内移動型ARフレームワークを提案する。
本フレームワークでは,統合的ローカライズ法と新しいポーズ推定法を開発し,全体のマッチング率を高め,AR表示精度を向上させる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:02:39 GMT)
Maximal steady-state entanglement in autonomous quantum thermal machines [9.7] 我々は、3つの対の相互作用量子ビットからなる自律量子熱機械を考案し、そのうち2つは局所的に熱貯水池に結合する。
機械は、タイムコヒーレントな制御、外部駆動、量子バス工学を必要としないため、自律的に動作し、代わりに化学的潜在的なバイアスによって推進される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:26:28 GMT)
Learning DAGs and Root Causes from Time-Series Data [9.5] DAG-TFRCは,根本原因の少ない時系列から有向非巡回グラフ(DAG)を学習するための新しい手法である。
根本原因がほとんどない合成データの場合、DAG-TFRCは前処理よりも精度と実行時のパフォーマンスが優れており、数千ノードまでスケールアップできる。
S&P 500のデータでは、DAG-TFRCはセクターごとに株をクラスタリングし、主要な株価の動きを根本原因として発見することに成功した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:48:30 GMT)
DLCRec: A Novel Approach for Managing Diversity in LLM-Based Recommender Systems [9.4] LLMに基づくレコメンデーションにおいて,多様性のきめ細かい制御を可能にする新しいフレームワークを提案する。
従来の方法とは異なり、DLCRecはきめ細かいタスク分解戦略を採用し、推奨プロセスを3つのサブタスクに分割する。
本稿では,ノイズやアウト・オブ・ディストリビューションデータに対するモデルの堅牢性を高める2つのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:48:27 GMT)
Decoupling Knowledge and Reasoning in Transformers: A Modular Architecture with Generalized Cross-Attention [9.4] 本稿では,知識と推論を明確に分離するモジュール型トランスフォーマーアーキテクチャを提案する。
本稿では,標準トランスフォーマーのフィードフォワードネットワーク(FFN)が特殊ケースであることを示す厳密な数学的導出を提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:26:41 GMT)
Stable excitations and holographic transportation in tensor networks of critical spin chains [9.4] ホログロンは動的進化の過程で不安定である。
魅力的な相互作用を持つ安定なバルク励起を探索すると、境界CFT内の局所一次作用素によって構築できることが分かる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:27:19 GMT)
A Novel Automatic Real-time Motion Tracking Method for Magnetic Resonance Imaging-guided Radiotherapy: Leveraging the Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation [9.3] MRI誘導放射線療法(MRIgRT)における正確な運動追跡は効果的な治療デリバリーに不可欠である。
本研究は,MRIgRTにおける運動追跡精度をリアルタイムマーカーレス自動追跡法により向上することを目的とした。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:40:59 GMT)
The 2nd Place Solution from the 3D Semantic Segmentation Track in the 2024 Waymo Open Dataset Challenge [9.3] MixSeg3Dは、強力なポイントクラウドセグメンテーションモデルと高度な3Dデータミキシング戦略を組み合わせた高度な組み合わせである。
我々は,MixSeg3Dがベースラインや先行技術よりも優れていることを示す。
私たちのチームは、2024年のオープンデータセットチャレンジの3Dセマンティックセグメンテーショントラックで2位を獲得しました。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:34:00 GMT)
An Operational Framework for Nonclassicality in Quantum Communication Networks [9.3] 絡み合いと量子通信は、分散情報処理において大きな利点をもたらす。
資源制約付き量子ネットワークにおけるこれらの拡張を実現するための運用フレームワークを開発する。
いずれの場合も、絡み合い支援通信(古典的および量子的)は非古典性をもたらす。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:40:49 GMT)
TARDiS : Text Augmentation for Refining Diversity and Separability [9.3] テキスト拡張はテキスト分類にとって重要なテクニックであり、特に数ショット設定ではそうである。
本稿では, 2段階TA法の生成とアライメントに固有の課題に対処する, LLM を用いた新しいTA法 TARDiS を提案する。
TARDiSの有効性を実証する実験結果が得られた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:17:35 GMT)
Reviewing Intelligent Cinematography: AI research for camera-based video production [9.2] 本稿では,エンターテイメント目的のリアルカメラコンテンツ取得の文脈において,人工知能(AI)研究の総合的なレビューを行う。
我々は、生成AI、オブジェクト検出、自動カメラキャリブレーション、および3Dコンテンツ取得に関する技術的背景を提供する。
最終章では、IC研究の幅広い範囲について論じ、創造産業に影響を及ぼすためのこの分野の有意義な可能性について要約する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:41:22 GMT)
QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture [8.7] QuArchは、言語モデルによるコンピュータアーキテクチャの理解を評価し、強化するために設計された1500の人間検証された質問対のデータセットである。
最高のクローズドソースモデルは84%の精度を実現し、上位の小さなオープンソースモデルは72%に達しています。
QuArchによる微調整により、モデル精度が最大8%向上し、AI駆動型コンピュータアーキテクチャ研究の基盤を確立する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:48:05 GMT)
Tightening the entropic uncertainty relations with quantum memory in a multipartite scenario [8.6] 3部量子メモリ支援エントロピー不確実性関係を導入する。
我々は,マルチパーティイトシステム内で実施される複数の測定を包含する関係を拡大する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:09:34 GMT)
FoundPAD: Foundation Models Reloaded for Face Presentation Attack Detection [8.6] プレゼンテーションアタック検出(PAD)アルゴリズムは、目に見えない領域に一般化する必要がある。
ファンデーションモデル(FM)は、広範囲なデータセットで事前訓練され、目に見えない領域に一般化する際、顕著な結果が得られる。
FoundPADの実装はhttps://github.com/gurayozgur/FoundPADで公開しています。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:14:52 GMT)
Learn A Flexible Exploration Model for Parameterized Action Markov Decision Processes [8.6] モデルベース(MBRL)アルゴリズムであるFLEXploreを提案し,エージェントの学習効率と性能を向上させる。
FLEXploreは他のベースラインと比較して学習効率と性能が優れていることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:33:09 GMT)
FedEP: Tailoring Attention to Heterogeneous Data Distribution with Entropy Pooling for Decentralized Federated Learning [8.6] フェデレートラーニング(FL)における非独立分散(非IID)データは、クライアントの問題を引き起こす。
既存のアプローチでは、この問題を中央サーバを使ってFLで緩和するが、Decentralized FL (DFL) は未調査のままである。
本研究は,DFLにおける非IID課題を軽減するためのフェデレートエントロピープーリング(FedEP)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:19:50 GMT)
Probabilistic Strategy Logic with Degrees of Observability [8.4] 情報透明性特性の推論は、セキュリティ、プライバシ、意思決定を含む多くの領域で有用である。
エージェントによる時間的特性の観測可能性の度合いを計測する新しい可観測性演算子を用いて確率論的戦略論理を拡張した。
結果の論理に対するモデルチェックの問題が決定可能であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:35:50 GMT)
TC-KANRecon: High-Quality and Accelerated MRI Reconstruction via Adaptive KAN Mechanisms and Intelligent Feature Scaling [8.3] 本研究は,TC-KANReconと命名された,革新的な条件付き拡散モデルを提案する。
Multi-Free U-KAN (MF-UKAN) モジュールと動的クリッピング戦略が組み込まれている。
実験により,提案手法は定性評価と定量的評価の両方において,他のMRI再建法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:11:37 GMT)
Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders [8.2] AMTは通常、ピアノロール出力を持つフレームレベルのシステムや、ノートレベルの予測を持つ言語モデル(LM)ベースのシステムを使用する。
両手法の強みを利用するために,事前学習したロールベースエンコーダとLMデコーダを組み合わせたハイブリッド方式を提案する。
本手法は,従来のピアノロール出力0.01,0.022をオンセットオフセット速度F1スコアで上回る。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:26:00 GMT)
Word Definitions from Large Language Models [8.2] 3つの辞書の定義をChatGPTの変種から生成されたものと比較する。
i) 従来の辞書からの定義は, モデルによる定義よりも表面形状が類似していること, (ii) 従来の辞書に匹敵する高い精度のChatGPT定義が, (iii) チャtGPTに基づく埋め込み定義は低頻度語でも精度を保っていること, を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:37:29 GMT)
Randomly Sampled Language Reasoning Problems Reveal Limits of LLMs [8.1] 我々は,データセットリコールのリスクを回避しつつ,モデルの言語理解能力の測定を試みる。
決定論的有限オートマトン(DFA)により認識される言語タスクの多種族をパラメータ化する。
3 状態 DFA の驚くほど単純な設定であっても、LLM は言語認識と合成の両タスクにおいてパラメータ化されていない ngram モデルより劣ることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:57:51 GMT)
Orthogonal greedy algorithm for linear operator learning with shallow neural network [7.9] 我々は、線形演算子学習のタスクにグリージーアルゴリズムの適用を拡大する。
新しいセミインナー製品におけるカーネル推定のために,新しいグレディアルゴリズムを開発した。
我々は、近似率をさらに向上させるために、ポイントワイズカーネル推定のためのOGAを導入する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:18:38 GMT)
A Bio-Inspired Research Paradigm of Collision Perception Neurons Enabling Neuro-Robotic Integration: The LGMD Case [7.9] 昆虫の視覚系は、数万のニューロンに頼っているにもかかわらず、迅速かつ正確な衝突検出に優れる。
緑内障巨大運動検出器(LGMD)という,視神経の衝突選択的ニューロンを同定した。
LGMDニューロンの深い理解により、LGMDベースのモデルは、移動ロボットにおける衝突のないナビゲーションを大幅に改善した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:44:48 GMT)
PiLaMIM: Toward Richer Visual Representations by Integrating Pixel and Latent Masked Image Modeling [7.6] 本稿では,Pixel MIMとLatent MIMを組み合わせた統合フレームワークPiLaMIMを提案する。
本手法では,1つのエンコーダと2つの異なるデコーダを用いる。1つは画素値の予測であり,もう1つは潜在表現であり,高レベルおよび低レベルの両方の視覚的特徴のキャプチャを保証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:30:16 GMT)
AnyDressing: Customizable Multi-Garment Virtual Dressing via Latent Diffusion Models [7.5] 衣服とパーソナライズされたテキストプロンプトの組み合わせで条件付き文字をカスタマイズする新しいAnyDressing法を提案する。
AnyDressingはGarmentsNetとDressingNetという2つの主要なネットワークで構成されており、それぞれが詳細な衣料品の特徴を抽出することを目的としている。
衣服のきめ細かいテクスチャの詳細を改善するため,ガーメント強化テクスチャ学習戦略を導入する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:56:03 GMT)
Beyond $\mathcal{O}(\sqrt{T})$ Regret: Decoupling Learning and Decision-making in Online Linear Programming [7.5] 本稿では,LP双対問題が一定の誤差境界条件を示す場合に,$mathcalO ( sqrtT )$の結果を改善するための一般的な枠組みを確立する。
連続的なサポート設定において,1次学習アルゴリズムが$o(sqrtT )$後悔し,非退化仮定以外の有限サポート設定において$mathcalO (log T)$後悔することを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:57:44 GMT)
MHNet: Multi-view High-order Network for Diagnosing Neurodevelopmental Disorders Using Resting-state fMRI [7.5] NDD予測のためのマルチビューBFNから階層的・高次的特徴をキャプチャするマルチビュー高次ネットワーク(MHNet)を導入する。
MHNetには、ユークリッド空間特徴抽出(ESFE)モジュールと非ユークリッド空間特徴抽出(Non-ESFE)モジュールの2つのブランチがある。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:02:36 GMT)
Human Gaze Boosts Object-Centered Representation Learning [7.5] 近年の自己教師型学習モデルでは、人間に比べて画像認識のタスクにおいて、人間のような自我中心の視覚入力が著しく劣っている。
本稿では,中心的な視覚情報に焦点を合わせることで,自己中心型視覚学習が促進されるかどうかを検討する。
我々の実験は、中心的なビジョンに焦点を合わせることで、オブジェクト中心の表現がより良くなることを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:21:40 GMT)
Seeing the Whole in the Parts in Self-Supervised Representation Learning [7.3] 局所表現をグローバルな画像表現と整列させることにより空間的共起をモデル化する新しい手法を提案する。
インスタンス識別手法のファミリーであるCO-SSLを提示し、いくつかのデータセットで過去の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:08:59 GMT)
COph100: A comprehensive fundus image registration dataset from infants constituting the "RIDIRP" database [7.3] COph100は100個の目で構成され、それぞれ2から9回の検査セッションがあり、合計で491枚の画像対である。
我々は、最先端のアルゴリズムを用いて、画像の品質と登録結果の観点から、COph100を評価した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:37:01 GMT)
From Models to Network Topologies: A Topology Inference Attack in Decentralized Federated Learning [7.2] 本研究では,モデル行動のみに基づく分散学習(DFL)システムのオーバーレイトポロジを推定できる可能性について検討する。
トポロジ推論攻撃の分類法が提案され、攻撃者の能力と知識によって分類される。
実験により、個々のノードの公開モデルのみを分析することで、DFLトポロジを正確に推測できることが示されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:27:53 GMT)
A Self-supervised Diffusion Bridge for MRI Reconstruction [7.1] 拡散ブリッジ(DB)は、2対のイメージ分布を補間することでより高速なサンプリングを可能にする。
我々は、利用可能な雑音測定に基づいてDBを直接訓練する新しい自己教師手法として、SelfDBを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:23:24 GMT)
The Z-Gromov-Wasserstein Distance [7.1] グロモフ・ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は測度空間を比較する強力なツールである。
本稿では,GW距離の一般化を定義することによって,$Z$-networksを比較する手法を提案する。
この構成は多くの既知のメトリクスを仮定し、共有プロパティを理解するための統一的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:39:40 GMT)
First-place Solution for Streetscape Shop Sign Recognition Competition [7.0] ストリートビューの画像には、複雑なデザインと多様なテキストスタイルの看板が含まれており、テキスト認識プロセスが複雑であることが多い。
我々は,マルチモーダルな特徴融合,広範囲な自己教師付きトレーニング,トランスフォーマーに基づく大規模モデルを統合する,新しいマルチステージアプローチを開発した。
強化学習に依存するBoxDQNやテキスト修正手法といった革新的な技術が採用され、目覚ましい結果をもたらした。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:20:36 GMT)
SALT: Sales Autocompletion Linked Business Tables Dataset [7.0] エンタープライズリソースプランニング(ERP)システムから得られたキュレートされたデータセットを導入し、広範囲にリンクされたテーブルを特徴とする。
私たちのゴールは、現実世界のビジネスコンテキストにおけるモデルの有効性と適用性を高めることです。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:20:02 GMT)
Robust Mølmer-Sørensen Gate Against Symmetric and Asymmetric Errors [6.6] 閉じ込められたイオン系におけるMolmer-So rensenゲートについて考察する。
我々は、対称的または非対称的な誤りとして現れるノイズ源の族を抑えるための一般的なアプローチを開発する。
本研究は,イオントラップ量子コンピューティングにおけるゲートの忠実性とノイズに対する頑健性を高める。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:53:07 GMT)
Proteomic Learning of Gamma-Aminobutyric Acid (GABA) Receptor-Mediated Anesthesia [6.4] 24種類のGABA受容体サブタイプに基づくGABA受容体を介する麻酔のプロテオミクス学習を導入する。
PPIネットワーク内の980のターゲットのプールから136のターゲットからなるデータセットをキュレートした。
GABRA5受容体を標的とした180,000以上の薬剤候補の副作用と再投与の可能性について検討した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:55:39 GMT)
The Robustness of Spiking Neural Networks in Federated Learning with Compression Against Non-omniscient Byzantine Attacks [6.4] FL装置にTop-Kappaスペーシフィケーションを簡易に統合することで,SNNモデルの利点を活用できることを示す。
中でも注目すべきは、致命的なMinMax攻撃下でのFL-SNNトレーニングにおいて、およそ40%の精度向上があったことです。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:09:55 GMT)
RW-Net: Enhancing Few-Shot Point Cloud Classification with a Wavelet Transform Projection-based Network [6.3] RW-Netは、RDE(Rate-Distortion Explanation)とウェーブレット変換を統合することで、上記の課題に対処するために設計された新しいフレームワークである。
入力データの低周波成分を強調することにより、ウェーブレット変換は3次元オブジェクトの基本的な幾何学的および構造的特性をキャプチャする。
その結果,本手法は最先端の性能を達成し,数ショットの学習シナリオにおいて,より優れた一般化とロバスト性を示すことが示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:55:59 GMT)
Proof-of-Data: A Consensus Protocol for Collaborative Intelligence [6.1] 本稿では,新しいProof-of-Data(PoD)コンセンサスプロトコルに基づくブロックチェーンベースのByzantineフォールトトレラントなフェデレーション学習フレームワークを提案する。
PoDは、社会規模のPoWスタイルの学習から学習効率とシステムの活力の恩恵を受けることができる。
ビザンチン攻撃によるデータ偽造による偽報酬請求を軽減するために、プライバシ対応のデータ検証とコントリビューションベースの報酬配分機構がフレームワークの完成のために設計されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:27:59 GMT)
Knowledge Distillation with Adapted Weight [6.1] 大規模モデルは、計算とエネルギーの制約により、リアルタイムシステムにデプロイするのは難しい。
Teacher-Student アーキテクチャによる知識蒸留は、大きなモデルの知識を圧縮するための持続可能な経路を提供する。
学習データに重みを割り当てるために影響関数を利用するtextbfKnowledge Distillation with Adaptive Influence Weight (KD-AIF) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:16:07 GMT)
IIMedGPT: Promoting Large Language Model Capabilities of Medical Tasks by Efficient Human Preference Alignment [6.0] 実際の医療課題から派生した6つの医療指導を含む医療指導データセットCMedINSを紹介した。
次に、効率的な選好アライメント手法を用いて、医用モデルIIMedGPTをローンチする。
その結果,本研究の最終モデルは医療対話における既存の医療モデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:22:36 GMT)
Information Design with Unknown Prior [5.9] 本稿では,情報デザイナーが事前に把握していない繰り返しの説得問題について検討する。
インフォメーションデザイナは、レシーバとの繰り返しのインタラクションからシグナリングスキームの設計を学ぶ。
情報デザイナが後悔する$O(sqrtmathrmrReg(T) T)$, $mathrmrReg(T)=o(T)$はレシーバの学習後悔の上限であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:15:25 GMT)
Co-Activation Graph Analysis of Safety-Verified and Explainable Deep Reinforcement Learning Policies [5.9] 深層強化学習(RL)ポリシーは、安全でない振る舞いを示し、解釈するのが困難である。
我々は、RLポリシーモデルチェックとコアクティベーショングラフ分析を組み合わせる。
この組み合わせにより、安全な意思決定のために、RLポリシーの内部動作を解釈することができます。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:07:44 GMT)
PARF-Net: integrating pixel-wise adaptive receptive fields into hybrid Transformer-CNN network for medical image segmentation [5.9] 医用画像分割のためのハイブリッドネットワークに,Pixel-wise Adaptive Receptive Fields (Conv-PARF) の畳み込みを統合する新しい手法を開発した。
提案手法は,データセット上のDiceの平均値が84.27%に達し,既存の手法をはるかに上回っている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:48:35 GMT)
Group Shapley with Robust Significance Testing and Its Application to Bond Recovery Rate Prediction [5.9] Group Shapleyは、機能グループの重要性を評価するために、古典的な個別レベルのShapleyバリューフレームワークを拡張するメトリクスである。
本研究では,3つの累積カイ二乗近似に基づく有意な試験手法を開発し,その特性を検証した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:27:44 GMT)
Feature-Driven End-To-End Test Generation [5.7] AutoE2Eは、セマンティックに意味のある機能駆動型E2EテストケースをWebアプリケーション向けに自動生成する新しいアプローチである。
E2EBenchは、E2Eテストスイートの機能カバレッジを自動的に評価する新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:23:09 GMT)
Compression of 3D Gaussian Splatting with Optimized Feature Planes and Standard Video Codecs [5.6] 3D Splattingは3Dシーン表現の認識手法であり、高いレンダリング品質とスピードで知られている。
本稿では,コンパクト表現を用いてストレージオーバーヘッドを大幅に削減する効率的な圧縮手法を提案する。
実験により,本手法は,高レンダリング品質を維持しつつ,データ圧縮性において既存の手法よりも優れることを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:37:30 GMT)
Advanced Machine Learning Techniques for Social Support Detection on Social Media [5.6] 本研究は、ソーシャルメディア上のソーシャルサポートコンテンツのバイナリおよびマルチクラス分類を含む、オンラインソーシャルサポートに焦点を当てたデータセットを使用する。
最初のタスクは、サポート型と非サポート型を区別することに焦点を当てている。
第2のタスクは、サポートが個人またはグループに向けられているかどうかを特定することを目的としている。
第3のタスクは、特定のタイプの社会支援を分類し、国民、LGBTQ、黒人、女性、宗教などに分類される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:14:09 GMT)
The Power of Negative Zero: Datatype Customization for Quantized Large Language Models [5.5] 学習後の量子化は、大規模言語モデル(LLM)のメモリと計算要求を緩和する最もハードウェア効率の良い方法の1つである。
本稿では,基本FPデータ型を拡張して冗長ゼロリマッピング(RaZeR)を行う。
RaZeRは、負のゼロFPエンコーディングを、FP量子化エンコーディングを最大限活用し、数値分布をよりよく適合させるために、予め定義された特別な値のセットに再マップする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:40:40 GMT)
LVMark: Robust Watermark for latent video diffusion models [5.3] 本稿では,ビデオ拡散モデルに透かしを埋め込むLVMarkという新しい透かし手法を提案する。
LVMarkの重要なコンポーネントは、ビデオ拡散モデルにウォーターマークメッセージを効率的に埋め込む選択的な重み変調戦略である。
本手法は,ビデオ生成モデルにおけるオーナシップ保護の有効性を高めるための貴重なツールとして,ビデオ生成モデル透かしの可能性を強調した最初の試みである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:21:08 GMT)
Probably Correct Optimal Stable Matching for Two-Sided Markets Under Uncertainty [5.3] 市場左側の好ましくない条件下での安定婚姻モデルの学習課題について考察する。
我々の目的は、左サイド最適である安定したマッチングを素早く識別することであり、バンドイットフィードバックによる純粋な探索問題である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:59:57 GMT)
Unsupervised Tomato Split Anomaly Detection using Hyperspectral Imaging and Variational Autoencoders [5.3] トマトに共通する異常は分裂であり、トマトの皮膚に亀裂が生じるのが特徴である。
我々は、このタイプの異常を検出するために、ハイパースペクトル入力を備えた調整された変分オートエンコーダ(VAE)を用いる。
その結果,530nmから550nmの範囲はトマト乾燥分画の同定に適していることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:02:52 GMT)
Sequence Complementor: Complementing Transformers For Time Series Forecasting with Learnable Sequences [5.2] シーケンス表現の表現能力は、時間予測においてTransformerのパフォーマンスに影響を与える重要な要因であることがわかった。
本稿では,シークエンス・コンプリメンタを用いた新しいアテンション機構を提案し,情報理論の観点から実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:08:39 GMT)
Enhancing Dynamic Range of Sub-Quantum-Limit Measurements via Quantum Deamplification [5.1] 動的範囲を最小限の感度で拡張する新しい量子デアンプリフィケーション機構を導入する。
我々のプロトコルは、最先端の原子分子-光学プラットフォームの範囲内にあります。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:01:08 GMT)
VicSim: Enhancing Victim Simulation with Emotional and Linguistic Fidelity [5.1] VicSimはユーザシミュレーションの3つの重要な側面(情報忠実性、感情力学、言語スタイル)に対処する新しいモデルである。
我々の敵対的訓練アプローチは、識別者に対して、文法と感情の手がかりを、合成内容の信頼性のある指標として認識するように教える。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:01:45 GMT)
Learning Stochastic Nonlinear Dynamics with Embedded Latent Transfer Operators [5.1] 非線形力学系の演算子に基づく潜在マルコフ表現を考える。
埋め込みは、例えばフィードフォワードニューラルネットワークで構築された再生カーネルを使って同時に学習することができる。
また、非線形系における逐次状態推定の一般化や、演算子に基づくダイナミクスの固有モード分解についても論じる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:25:48 GMT)
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities [5.0] ForecastBenchは、機械学習システムの精度を評価するためのベンチマークである。
ForecastBenchは、提出時に既知の回答がない将来のイベントに関する質問のみで構成されている。
私たちはwww.forecastbench.orgの公開リーダーボードにシステムと人間のスコアを表示します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:33:58 GMT)
EndoOmni: Zero-Shot Cross-Dataset Depth Estimation in Endoscopy by Robust Self-Learning from Noisy Labels [5.0] 単一画像深度推定は、局所化、再構成、拡張現実といった内視鏡的タスクに不可欠である。
既存の手術シーンのほとんどの方法は、領域内深さの推定に焦点を合わせ、実際の応用性を制限する。
内視鏡のためのゼロショットクロスドメイン深度推定のための最初の基礎モデルであるEndo Omniを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:59:27 GMT)
Macroeconomic Forecasting with Large Language Models [5.0] 本稿では,従来のマクロ時系列予測手法と比較して,Large Language Models(LLM)の精度を評価する。
本研究は, LLMの長所と短所について, 実世界のシナリオにおける適用性に光を当てながら, マクロ経済時系列の予測における長所と短所について, 貴重な知見を提供するものである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:27:48 GMT)
On Computational Complexity of 3D Ising Spin Glass: Lessons from D-Wave Annealer [5.0] 3次元イジングスピンガラスの正確な基底状態を見つけることはNPハード問題であることが証明されている。
D-Wave 3DアニールをNleq 5627$で広範囲に実験した結果を報告する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:23:36 GMT)
Generating Counterfactual Trajectories with Latent Diffusion Models for Concept Discovery [4.9] 本研究では,潜伏拡散に基づく対物軌道(CDCT)による概念発見を提案する。
CDCTは拡散モデルの優れた画像合成機能を活用した概念発見のための新しい3段階のフレームワークである。
CDCTを最大の皮膚病変データセットに応用したところ、いくつかのバイアスだけでなく、有意義なバイオマーカーの存在が判明した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:47:53 GMT)
Artificial Intelligence in Creative Industries: Advances Prior to 2025 [4.7] 人工知能(AI)の急速な進歩は、クリエイティブ産業に大きな影響を与えた。
本稿は、これらの開発が創造的機会と効率をどのように拡大したかを考察する。
これらの革新にもかかわらず、クリエイティブコンテンツからの通信トラフィックが要求されるため、特にメディア業界には課題が残っている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:46:33 GMT)
Leveraging Large Language Models to Detect npm Malicious Packages [4.5] 本研究では,Large Language Models (LLMs) の有効性を実証的に検討した。
我々は、悪意のあるコードを検出する悪意のあるコードレビューワークフローであるSocketAIを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:29:32 GMT)
Fairness Through Matching [4.4] グループフェアネスは、与えられたセンシティブな属性によって特徴づけられる異なる保護されたグループが全体として同じ結果を得る必要がある。
本研究では,既存のグループフェアネス尺度の暗黙的特性を明らかにし,グループフェアモデルがどのように振る舞うかを考察する。
我々は、グループフェアモデルを学ぶために、この暗黙的特性に基づく新しいグループフェア制約を開発する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:27:38 GMT)
Skillful High-Resolution Ensemble Precipitation Forecasting with an Integrated Deep Learning Framework [4.3] 高解像度降水予測は、正確な天気予報を提供し、極端な気象イベントに対する効果的な対応をサポートするために不可欠である。
本研究では,高分解能アンサンブル降水予測のための物理に着想を得たディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:29:38 GMT)
FTA-FTL: A Fine-Tuned Aggregation Federated Transfer Learning Scheme for Lithology Microscopic Image Classification [4.2] この研究には2つのフェーズがあり、第1に、転送学習を用いて小さなデータセット上でLithology microscopic image classificationを行う。
第2フェーズでは、フェデレート・トランスファーラーニング・スキームに分類タスクを定式化し、フェデレート・ラーニングのためのファインチューニング・アグリゲーション・ストラテジー(FTA-FTL)を提案した。
その結果,提案手法の効率性は良好であり,FTA-FTLアルゴリズムがLithology microscopic image classification taskの集中的実装により得られたほぼ同じ結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:32:14 GMT)
Slim multi-scale convolutional autoencoder-based reduced-order models for interpretable features of a complex dynamical system [4.2] 本研究では,高次元流動データに対する新しい解釈可能な畳み込みオートエンコーダ(CAE)手法を提案する。
提案手法は,従来のCAEの復元品質を維持し,特徴解釈を可能にする。
提案手法は軽量で訓練が容易であり,64モードのPODに対して最大6.4%の相対再構成性能向上を実現している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:06:07 GMT)
License Plate Images Generation with Diffusion Models [4.2] 本稿では,映像生成にインスパイアされた拡散モデルを用いて,現実的なライセンスプレート(LP)を合成することを提案する。
我々は1万枚のLP画像からなる合成データセットを作成し、https://zenodo.org/doi/10.528/zenodo.13342102で公開しました。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:22:18 GMT)
NeuroPMD: Neural Fields for Density Estimation on Product Manifolds [4.1] 提案手法では,ネットワークが未知密度関数を直接パラメータ化し,ペナル化最大可能性フレームワークを用いて学習する。
ネットワークアーキテクチャと推定アルゴリズムは、高次元積多様体領域の課題に対処するために慎重に設計されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:13:13 GMT)
Synthetic Fungi Datasets: A Time-Aligned Approach [4.0] このデータセットは、胞の大きさの縮小、分岐ダイナミクス、複雑な菌糸体ネットワークの出現などの現象を捉えている。
データセットはディープラーニング(DL)アプリケーションに最適化されている。
農業、医学、産業の菌学にまたがる応用により、この資源は菌類分析を自動化するための堅牢な基盤を提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:00:17 GMT)
Coarsened confounding for causal effects: a large-sample framework [3.9] We consider coarsened exact matching, developed in Iacus et al。
この手法は,2つの新しいアルゴリズムを提案する粗大化共起(coarsened confounding)に一般化される。
バイアス補正手法を提案し, 提案手法を2つのよく知られた観測スタディのデータに適用する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:47:24 GMT)
Region of Interest based Medical Image Compression [3.9] 本稿では、圧縮率と画質のバランスに対処するため、関心領域(ROI)の符号化について検討する。
Brats 2020データセット上でUNETセグメンテーションを利用することで、診断に重要な腫瘍領域を正確に同定する。
これらの領域は、圧縮のための高効率ビデオ符号化(HEVC)の対象となり、必要不可欠な診断情報を保持しながら圧縮速度を向上する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:16:22 GMT)
Conditional Mutual Information Based Diffusion Posterior Sampling for Solving Inverse Problems [3.9] コンピュータビジョンでは、インペイント、デブロアリング、超解像といったタスクは逆問題として一般的に定式化される。
近年, 拡散モデル (DM) が, 雑音の線形逆問題に対処するための有望なアプローチとして出現している。
本稿では,逆問題の解法におけるDMの有効性を改善するための情報理論的手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:45:26 GMT)
Ensemble learning for predictive uncertainty estimation with application to the correction of satellite precipitation products [3.9] そこで本研究では,9つの定量的アンサンブル学習者を紹介し,これらの学習者の大規模な降水データセットへの最初の応用について述べる。
我々は新しい特徴工学戦略を採用し、位置高度と合わせて、距離重み付け衛星降水量予測器を関連箇所に導入した。
QRとQRNNのアンサンブル学習は0.025から0.975までの量子レベルで最高の結果となり、基準法を3.91%から8.95%に上回った。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:20:27 GMT)
Combinations of distributional regression algorithms with application in uncertainty estimation of corrected satellite precipitation products [3.9] 降水データセット作成における分布回帰の概念を導入する。
新たなアンサンブル学習法は,空間予測だけでなく,他の予測問題にも有用である。
スタック化は, 量子化損失関数を用いて評価した場合, 最大量子化レベルにおいて, 個々の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:03:06 GMT)
Bridging Today and the Future of Humanity: AI Safety in 2024 and Beyond [3.8] 本稿では,先進的人間社会の青写真について述べる。
あらゆる物のインターネットが現実になる未来を概説している。
進歩の各段階において、この論文は人類が直面する可能性のあるAIの安全性の問題を予測する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:04:05 GMT)
Analyzing Bias in Swiss Federal Supreme Court Judgments Using Facebook's Holistic Bias Dataset: Implications for Language Model Training [3.7] トレーニングデータのバイアスは、特に法的判断の予測において不公平をもたらす可能性がある。
本研究は,スイスの判断予測データセットにおけるバイアスの分析に焦点をあてる。
我々は,非参照記述子がモデル予測に与える影響を探索するために,注目の可視化を含む高度なNLP技術を採用している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:00:09 GMT)
Efficient Density Control for 3D Gaussian Splatting [3.6] 3D Gaussian Splatting (3DGS)は、新しいビュー合成に優れ、高度なレンダリング品質とリアルタイムパフォーマンスのバランスをとる。
訓練されたシーンでは、不透明度が低い多くのガウス人がレンダリングコストを著しく高めている。
より効率的な長軸分割演算を導入することにより、3DGSの適応密度制御を改善する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:27:30 GMT)
MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators [3.6] フルグラフ上でのグラフ畳み込みネットワーク(GCN)のトレーニングは難しい。
機能テンソルは簡単にメモリを爆発させ、現代のアクセラレーターの通信帯域をブロックすることができる。
トレーニングのワークフロー GCNはスパース演算と密度行列演算を交互に行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:46:07 GMT)
Are GNNs Effective for Multimodal Fault Diagnosis in Microservice Systems? [3.5] 本稿では, 断層診断フレームワークにおけるGNNの代替として, 単純なトポロジーに依存しないベースラインであるDiagMLPを提案する。
その結果,DiagMLPは故障診断タスクにおいて,GNNベースの手法と競合し,さらに優れることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:18:13 GMT)
Multi-Agent Path Finding under Limited Communication Range Constraint via Dynamic Leading [3.5] 本稿では,限られた通信範囲制約下でのマルチエージェントパス探索問題に対処する新しい枠組みを提案する。
我々は,進行が進行しない場合に,経路計画中にリードエージェントを動的に再選択できる動的リード型マルチエージェントパス探索を開発する。
実験の結果、最大25のエージェントを5つの環境タイプで90%以上の成功率で処理できるフレームワークの有効性が示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:21:18 GMT)
GLiREL -- Generalist Model for Zero-Shot Relation Extraction [3.4] ゼロショット関係分類のための効率的なアーキテクチャとトレーニングパラダイムであるGLiRELを紹介する。
FewRel と WikiZSL のベンチマークを用いた実験により,本手法が最先端の結果を得ることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:42:29 GMT)
Label-free Concept Based Multiple Instance Learning for Gigapixel Histopathology [3.3] MIL(Multiple Instance Learning)メソッドは、スライドレベルのアノテーションだけで、ギガピクセルのWSI(Whole-Slide Image)解析を可能にする。
本稿では,人間の理解可能な病理概念を用いて説明を生成するWSI分類手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:03:04 GMT)
Large Language Models for Market Research: A Data-augmentation Approach [3.3] 大規模言語モデル(LLM)は、複雑な自然言語処理タスクに優れ、人工知能を変革した。
近年の研究では、LLMが生成するデータと人間のデータの間に大きなギャップが見られ、両者を置換する際にバイアスが発生している。
コンジョイント解析において,LLM生成データと実データとを効率的に統合する新しい統計データ拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:33:20 GMT)
GaitGuard: Towards Private Gait in Mixed Reality [3.2] GaitGuardは、Augmented/Mixed Reality環境内の歩行プライバシーを保護するリアルタイムシステムである。
本研究は、MRデバイスでビデオフィードが捉えた歩行情報露出のリスクを評価するために、20人の参加者によるユーザ分析を含む。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:22:09 GMT)
Quantum Communication Complexity of Classical Auctions [3.2] 量子通信が従来の通信よりも効率的かどうかを問う。
まず,ほぼ最適なオークションの通信複雑性について検討する。
そして、非常に単純な設定で、正確に最適なオークションの最悪の通信複雑性について研究する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:40:58 GMT)
Persistence of Backdoor-based Watermarks for Neural Networks: A Comprehensive Evaluation [3.2] バックドアベースの透かしは近年、プロプライエタリな権利を守るために活発に開発されている。
本稿では,ニューラルネットワークにおける最近のバックドアベース透かしの持続性について,微調整のシナリオで評価する。
トリガセットを露出することなく微調整後に透かしを復元する新しいデータ駆動型アイデアを提案・開発する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:15:35 GMT)
RTLSquad: Multi-Agent Based Interpretable RTL Design [3.2] LLM(Large Language Models)は、RTLコードの自動生成と最適化のための新しいアプローチを提供する。
そこで我々は,RTLSquadを提案する。RTLSquadは,RTLコード生成を解釈可能な新しいLLMベースマルチエージェントシステムである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:57:54 GMT)
Towards Optimal Convergence Rates for the Quantum Central Limit Theorem [3.1] この量子中心極限定理の最適収束率を求める問題に寄与する。
量子状態に対するポインカーの不等式の概念を導入し、もし$rho$がこのポインカーの不等式を満たすなら、$D(rhoboxplus n| rho_G) = Mathcal O(n-1)$であることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:02:00 GMT)
LOHA: Direct Graph Spectral Contrastive Learning Between Low-pass and High-pass Views [3.1] スペクトルグラフニューラルネットワークは,低域フィルタマイニング特性のスムーズさと高域フィルタキャプチャ特性の相違により,相同レベルのグラフを効果的に処理する。
異なるフィルタが自然に自己教師付き学習の2つの反対の視点を形成する場合、同一ノードの共通性は未探索のままである。
本稿では、このギャップに対処するために、単純で効果的な自己監督型コントラストフレームワークLOHAを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:25:02 GMT)
BoundingDocs: a Unified Dataset for Document Question Answering with Spatial Annotations [3.0] 文書質問回答(QA)のための統合データセットを提案する。
情報抽出(IE)などの既存の文書AIタスクを質問応答タスクに再構成する。
一方、全文書のOCRを公開し、文書画像中の回答の正確な位置をバウンディングボックスとして含む。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:46:22 GMT)
From Prejudice to Parity: A New Approach to Debiasing Large Language Model Word Embeddings [2.9] DeepSoftDebiasは、ニューラルネットワークを使って'ソフトデバイアス'を実行するアルゴリズム
我々は、このアルゴリズムを様々なSOTAデータセット、精度メトリクス、難解なNLPタスクで徹底的に評価する。
DeepSoftDebiasは、性別、人種、宗教の偏見を減らし、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:08:10 GMT)
Knowledge Migration Framework for Smart Contract Vulnerability Detection [2.9] 本稿では,効率的な知識マイグレーションを取り入れたスマートコントラクト脆弱性検出フレームワークを提案する。
AF-STipは教師ネットワークをメインモデルとし、スマートコントラクトによって処理された知識を学生モデルに移行する。
このアプローチは、計算オーバーヘッドを同時に削減しつつ、特徴抽出とクラス間の適応のためのモデルの能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:15:47 GMT)
Dense Video Captioning Using Unsupervised Semantic Information [2.9] 本稿では,複雑な事象をより単純な事象に分解できるという前提に基づいて,教師なしの視覚情報を学習する手法を提案する。
我々は、コードブックエントリの共起確率行列を符号化することで、密度の高い表現を学習する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:21:22 GMT)
Self-directed online information search can affect policy attitudes: a randomized encouragement design with digital behavioral data [2.6] 本研究では,自然主義的な環境下での自己指示型オンライン検索が政策問題に対する態度をどう形作るかを検討する。
参加者にオンライン情報を求めるように促すことで,生態学的妥当性が向上する。
いくつかの知見は、政策トピックの特異性と粒度が、オンライン情報が政治的見解をどう形成するかに影響を及ぼす可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:55:31 GMT)
Pointmap-Conditioned Diffusion for Consistent Novel View Synthesis [2.6] 単一画像の新規ビュー合成のための新しいフレームワークであるPointmapDiffusionを提案する。
本手法は,参照画像に先立って点マップを条件付き信号として利用し,拡散過程を導出する手法である。
多様な実世界のデータセットの実験により、PointmapDiffusionは高品質でマルチビューの一貫性のある結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:48:31 GMT)
Controllable superradiance scaling in photonic waveguide [2.6] フォトニック導波路に結合した2レベルターゲット原子(TA)の超放射能について検討した。
制御原子(CA)のアンサンブルにより,超放射強度のスケーリングが要求に応じて制御可能であることを示す。
我々は, TAのキラル超放射能を観測し, 小型ではなく巨大CAsによりキラル度を向上できることを示した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:52:23 GMT)
Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function [2.5] 計算オーバーヘッドを最小限に抑えたトポロジ対応ニューラルネットワークセグメンテーション法を提案する。
マウス脳の3次元光顕微鏡画像の公開データセット上で,その効果を実証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:05:46 GMT)
Deep learning-based identification of patients at increased risk of cancer using routine laboratory markers [2.5] がんスクリーニングは、スクリーニング方法と頻度を決定するために、最初のリスク階層化ステップを含む。
ほとんどのスクリーニングプログラムでは、年齢や家族歴などの臨床リスク要因は、最初のリスク階層化アルゴリズムの一部である。
本研究は, 大腸癌, 肝癌, 肺癌のリスクのある患者を鑑別するために, 血液計数や完全代謝パネルなどの簡便な血液検査を併用できることを実証した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:17:10 GMT)
Enhancing Robot Route Optimization in Smart Logistics with Transformer and GNN Integration [2.5] この研究は、トランスフォーマーアーキテクチャ、グラフニューラルネットワーク(GNN)、GAN(Generative Adversarial Networks)の融合を活用して、スマートロジスティクスにおけるロボットの高度な経路最適化を実現する。
提案手法は,旅行距離の15%削減,時間効率の20%向上,エネルギー消費の10%削減など,顕著な改善を実現している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:53:02 GMT)
Design and implementation of tools to build an ontology of Security Requirements for Internet of Medical Things [2.4] インターネット・オブ・メディカル・モノ(IoMT)の世界では、メーカーやサードパーティは、法律と仕様の両方で示されるセキュリティ要件を認識しなければならない。
関連する法則と仕様(欧州の文脈)を表わすオントロジーは非常に有用である。
検討された仕様文書の量とサイズが非常に多いため,自然文からオントロジーへの移行を簡単にするための方法論とツールが導入された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:04:45 GMT)
A Decision-Based Heterogenous Graph Attention Network for Multi-Class Fake News Detection [2.3] 本稿では,半教師付き環境での偽ニュース検出のためのDHGAT(Decision-based Heterogeneous Graph Attention Network)という新しいモデルを提案する。
DHGATは、各層における各ノードの近傍タイプを動的に最適化し、選択することで、従来のGNNの制限に効果的に対処する。
6つのクラスに分類されるニュース項目を含む多クラス偽ニュース検出のための大規模かつ困難なデータセットであるLIARデータセット上でDHGATを評価する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:18:31 GMT)
GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation [2.3] 医用画像セマンティックセグメンテーション(MISS)において、視覚変換器(ViT)は長距離相関を捉えることで、将来性を示す。
Gabor and Laplacian of Gaussian Convolutional Swin Network (GLoG-CSUnet) を紹介する。
GLoG-CSUnetは、学習可能な放射能機能を組み込んだトランスフォーマーモデルを強化する新しいアーキテクチャである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:07:40 GMT)
Survival Analysis Revisited: Understanding and Unifying Poisson, Exponential, and Cox Models in Fall Risk Analysis [2.3] 本稿では,ロジスティック回帰,ポアソン回帰,指数回帰,Cox Proportional Hazardsモデルなど,重要な時間的確率分布と統計手法を再検討する。
これらのモデル間の関係の段階的導出と明確化は、生存モデルの単純さと解釈可能性を強化する。
転倒検出の文脈では、これらのモデルが転倒リスクを同時に予測し、寄与要因を分析し、結果の時間と結果を推定する方法が示される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:48:30 GMT)
Tunable absorption spectrum splitting in a pulse-driven three-level system [2.2] 2レベルの系が強い入射場によって共鳴によって駆動されると、その放射スペクトルはよく知られたモロー三重項によって特徴づけられる。
2レベル系が周期的なパルス列によって駆動される場合、発光スペクトルはモロー三重項と類似していることが示されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:04:29 GMT)
Improved Approximation Algorithms for Low-Rank Problems Using Semidefinite Optimization [2.1] 低ランク最適化問題に対する類似の緩和型サンプル戦略を構築した。
ほぼ最適解が得られる半定緩和とランダムな丸めスキームを導出する。
我々は、緩和とサンプリング方式の有効性とスケーラビリティを数値的に説明する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:31:41 GMT)
Dynamic Hypergraph-Enhanced Prediction of Sequential Medical Visits [2.1] 本研究では,電子カルテから将来の診断を精度良く予測する動的ハイパーグラフネットワーク(DHCE)モデルを提案する。
DHCEモデルは、患者の訪問履歴の中で急性および慢性疾患を識別・識別し、疾患間の複雑な高次相互作用をキャプチャする動的なハイパーグラフを構築することで、革新する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:51:39 GMT)
Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.1] 本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:43:30 GMT)
A graph-state based synthesis framework for Clifford isometries [2.0] 我々はクリフォードアイソメトリを実行可能な量子回路に合成する問題に取り組む。
クリフォード群の基本的な性質とシンプレクティック群の1つの方程式を利用する単純な合成フレームワークを提案する。
また、クリフォード作用素、グラフ状態、パウリ回転の共対化に着目したクリフォード等長写像の実用的な合成アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:14:39 GMT)
RAHN: A Reputation Based Hourglass Network for Web Service QoS Prediction [2.0] QoS(Quality of Service)をより効率的に正確に予測する方法は、サービスの推奨にとって重要な課題になります。
本稿では,Reputation Compute Module (RCM), Latent Feature extract Module (LFEM), Prediction Hourglass Network (QPHN)を含む評価・ディープラーニングに基づく予測ネットワークRAHNを提案する。
RCMはクラスタリングアルゴリズムとロジットモデルを用いてユーザ評価とサービス評価を取得する。LFEMは既知の情報から潜時特徴を抽出し、初期潜時特徴を形成する。QPHNはアテンションメカニズムを用いて異なるスケールで潜時特徴ベクトルを集約する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:43:05 GMT)
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI [2.0] 生成モデルは画像分布を学習し、アンサンプされたk空間データから高品質な画像の再構成に使用できる。
画像系列に対する自己回帰画像拡散(AID)モデルを提案し,それを後部MRI再構成のサンプリングに用いた。
その結果,AIDモデルは逐次コヒーレントな画像列を確実に生成できることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:50:35 GMT)
Method of data forward generation with partial differential equations for machine learning modeling in fluid mechanics [2.0] 本研究では偏微分方程式(PDE)を用いた高効率データフォワード生成法を提案する。
射影法に埋め込まれたPoisson Neural Network (Poisson-NN) と、圧縮不能なNavier-Stokes方程式を解くためのマルチグリッド数値シミュレーションに埋め込まれたウェーブレット変換畳み込みニューラルネットワーク (WTCNN) をそれぞれ提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:17:13 GMT)
Quantum Feature-Empowered Deep Classification for Fast Mangrove Mapping [1.9] マングローブマッピング(MM)アルゴリズムは環境モニタリングに不可欠な分類ツールである。
我々は、量子特徴がCNNの分類結果をさらに改善するために、根本的に新しい情報を提供することを示した。
提案する量子駆動型ディープネットワーク(QEDNet)は非常に軽量であるため,CNNとQNNの連携による改善が期待できる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:59:14 GMT)
LASSE: Learning Active Sampling for Storm Tide Extremes in Non-Stationary Climate Regimes [1.8] 我々は、サロゲートモデルが精度、リコール、精度の観点から有望であることを示す。
本稿では,高潮発生サイクロンを迅速に探索するオンライン学習手法を提案する。
ダウンスケールTCの広範囲なカタログでは、希少な破壊嵐を回収する精度が100%であることが示されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:46:25 GMT)
The Two-Hop Curse: LLMs trained on A$\rightarrow$B, B$\rightarrow$C fail to learn A$\rightarrow$C [1.8] 本稿では,LLMにおける2ホップ推論の制御設定について紹介する。
トレーニング中やプロンプト中に事実が一緒に現れる場合、モデルは遅延推論を行うことができる。
この完全な失敗を、Two-Hop Curseを別々に学習した事実を構成することと呼ぶ。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:37:54 GMT)
The Dead Internet Theory: A Survey on Artificial Interactions and the Future of Social Media [1.8] デッド・インターネット理論 (Dead Internet Theory, DIT) は、今日のインターネットの多くは非人間活動、AI生成コンテンツ、企業アジェンダに支配されていることを示唆している。
本研究は,ソーシャルメディアプラットフォームにおけるDITの起源,コアクレーム,およびDITの意義を考察し,その関連性を強調した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:18:05 GMT)
Determinants of Human Development Index (HDI): A Regression Analysis of Economic and Social Indicators [1.8] 1人当たりのGDP、健康費、教育費、幼児死亡率、学業平均年数など5つの変数が分析された。
その結果, 一人当たりGDP, 幼児死亡率, 学年平均がHDIの有意な予測因子であることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:55:32 GMT)
Recommendations for Comprehensive and Independent Evaluation of Machine Learning-Based Earth System Models [1.8] 機械学習(ML)は天気予報において最も目に見えるもので、現代の物理学ベースのモデルに匹敵する予測を生成する。
地球系モデル(ESM)の予測モデル開発に向けた取り組みが現在進行中である。
本稿では,信頼性を高め,幅広い利用を促進するための5つの勧告を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:31:26 GMT)
CERN for AI: A Theoretical Framework for Autonomous Simulation-Based Artificial Intelligence Testing and Alignment [1.8] 本研究では,現実世界の環境を再現するバーチャルリアリティー・フレームワークにおける,革新的なシミュレーションに基づくマルチエージェントシステムについて検討する。
このフレームワークは、複雑な社会構造と相互作用をシミュレートしてAIを調べ、最適化する自動化された「デジタル市民」によって人口が占められている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:32:09 GMT)
Privacy-Preserving Smart Contracts for Permissioned Blockchains: A zk-SNARK-Based Recipe Part-1 [1.7] この研究は、zk-SNARKを使用してスマートコントラクトとブロックチェーンのプライバシを提供するソリューションを提案する。
この提案にはデリゲートトランザクションと呼ばれる新しいタイプのトランザクションが含まれており、Delivery vs Payment(DvP)のようなユースケースを可能にする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:16:33 GMT)
BaiJia: A Large-Scale Role-Playing Agent Corpus of Chinese Historical Characters [1.7] 各種の歴史的文字からなる大規模ロールプレイングエージェント「BaiJia」を包括的に紹介する。
BaiJiaは、大規模な言語モデル(LLM)でAI駆動の歴史的ロールプレイングエージェントに関わることのできる、低リソースデータのパイオニアとして注目に値する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:34:16 GMT)
Sustainable Digitalization of Business with Multi-Agent RAG and LLM [1.6] 本研究では,Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)の統合について検討する。
既存のLCMを用いて,多様なデータセットに対応可能な持続可能なビジネスソリューションを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:14:23 GMT)
Political Events using RAG with LLMs [1.6] 生成人工知能(GenAI)による大言語モデル(LLM)
Retrieval-Augmented Generation (RAG)フレームワーク。
政治EEシステムは、特にニュース記事から政治イベント情報を抽出するように設計されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:16:24 GMT)
Quantum Error Correction Without Encoding via the Circulant Structure of Pauli Noise and the Fast Fourier Transform [1.6] 本研究では,量子コンピュータの出力分布を補正する手法を紹介する。
より物理的な量子ビットへの論理量子ビットの符号化は不要である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:55:10 GMT)
Enhancing Sample Efficiency and Exploration in Reinforcement Learning through the Integration of Diffusion Models and Proximal Policy Optimization [1.6] オフラインデータセットのための高品質な仮想トラジェクトリを生成するために拡散モデルを導入し,PPOアルゴリズムを強化するフレームワークを提案する。
RLにおける拡散モデルの可能性、特にオフラインデータセットについて検討し、オンラインRLをオフライン環境に拡張し、拡散モデルによるPPOの性能改善を実験的に検証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:30:06 GMT)
CNMBert: A Model for Hanyu Pinyin Abbreviation to Character Conversion Task [1.6] 本稿では,zh-CN Pinyin Multi-mask Bert Model の略である CNMBert を提案する。
CNMBert は GPT モデルと ChatGPT-4o を 61.53 MRR スコアと 51.86 の精度で 10,373 サンプルテストデータセットで上回っている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:52:41 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:55:23 GMT)
Improved Data Encoding for Emerging Computing Paradigms: From Stochastic to Hyperdimensional Computing [1.5] 本研究は、ハードウェアフレンドリーな低分散性(LD)シークエンスを利用する高度な符号化戦略を提案する。
提案手法は,ランダム性に関わる課題に対処することにより,SCとHDCシステムの精度と効率を大幅に向上させる。
我々のソリューションは、リソース制約のある環境でSCとHDCを統合するための堅牢なフレームワークを提供し、効率的でスケーラブルなAI実装の道を開いた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:07:49 GMT)
MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement [1.5] マルチビュー認識知識強化トランス(MvKeTR)
複数の解剖学的視点から診断情報を効果的に合成する。
Cross-Modal Knowledge Enhancer (CMKE) はクエリボリュームに基づいて最もよく似たレポートを検索する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:34:37 GMT)
QuIM-RAG: Advancing Retrieval-Augmented Generation with Inverted Question Matching for Enhanced QA Performance [1.4] 本研究では,RAG(Retrieval-Augmented Generation)システム構築のための新しいアーキテクチャを提案する。
RAGアーキテクチャは、ターゲット文書から応答を生成するために構築される。
本稿では,本システムにおける検索機構の新しいアプローチQuIM-RAGを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:07:59 GMT)
Orbital Angular Momentum Experimental Bound on the Maximum Predictive Power of Physical Theories in Multi-Dimensional Systems [1.4] 任意の次元系に対する量子力学の予測力を向上できる理論は存在しないことを示す。
我々は、任意の代替理論によって達成可能な最大ポテンシャル予測パワーと実験的に観測可能な相関を結合する。
我々の発見は量子力学の基礎的理解を深め、高次元量子暗号の有意義な可能性を秘めている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:17:47 GMT)
Crypto-nonlocality in arbitrarily dimensional systems [1.4] ベルの定理は、局所変数に基づく任意のモデルは特定の量子相関を再現できないことを述べる。
任意の次元に対して実験的に検証可能なLeggett型不等式を構築するためのフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:31:25 GMT)
Anomaly Detection in Large-Scale Cloud Systems: An Industry Case and Dataset [1.3] 我々は、IBM Cloud Consoleから4.5ヶ月以上にわたって収集された、IBM Cloudからの新しい高次元データセットを紹介します。
このデータセットは39,365行と117,448列のテレメトリデータからなる。
本稿では、異常検出のための機械学習モデルの応用を実演し、このプロセスで直面する重要な課題について論じる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:15:50 GMT)
Sim-to-Real Transfer for Mobile Robots with Reinforcement Learning: from NVIDIA Isaac Sim to Gazebo and Real ROS 2 Robots [1.3] この記事では、イザックの地域計画と障害物回避への応用を実証することに焦点を当てる。
ロボット・オペレーティング・システム(ROS)のナビゲーション・スタックであるNav2でエンドツーエンドのポリシーをベンチマークする。
また、Isaacシミュレータで訓練されたポリシーを実世界のロボットにゼロショット転送可能であることを示すことで、sim-to-realトランスファープロセスをカバーしている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:26:16 GMT)
Training Gradient Boosted Decision Trees on Tabular Data Containing Label Noise for Classification Tasks [1.3] 本研究は,ラベルノイズが勾配ブースト決定木(GBDT)に及ぼす影響について検討する。
GBDTを用いた深層学習から2つのノイズ検出手法を適用し,Gradientsと呼ばれる新しい検出手法を導入する。
ノイズ検出手法は,全てのノイズレベルにわたるアダルトデータセットにおいて,99%以上のノイズ検出精度で,最先端のノイズ検出を実現する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:05:14 GMT)
Leveraging Explainable AI for LLM Text Attribution: Differentiating Human-Written and Multiple LLMs-Generated Text [1.1] 本研究では,生成型AI大言語モデルを用いて生成されたテキストコンテンツの検出と識別を支援することを目的とする。
我々はランダムフォレスト(RF)やリカレントニューラルネットワーク(RNN)などの機械学習アルゴリズムを利用して、属性の重要な特徴を理解する。
本手法は,1) 人文とAIテキストを区別するバイナリ分類と,2) 人文と5種類のLDMツールで生成するテキストを区別するマルチ分類に分けられる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:46:53 GMT)
Detecting AI-Generated Text in Educational Content: Leveraging Machine Learning and Explainable AI for Academic Integrity [1.1] 本研究は、学生労働におけるAI生成コンテンツを検出するツールを提供することにより、学術的整合性を高めることを目的とする。
我々は,CyberHumanAIデータセットを用いて,機械学習(ML)およびディープラーニング(DL)アルゴリズムの評価を行った。
GPTZeroは、Pure AI、Pure Human、Mixed Classの分類を行う場合、48.5%の精度で約77.5%の精度を達成した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:34:20 GMT)
TEE-based Key-Value Stores: a Survey [1.1] キーバリューストア(KVS)は、データをキーバリューペアとして格納し、そのシンプルさ、スケーラビリティ、高速検索機能によって人気を博している。
KVSに機密データを格納するには、データ漏洩や不正な改ざんを防ぐために、強力なセキュリティ特性が必要である。
本稿では、TEEをベースとした機密KVSにおける技術の現状を考察し、TEEセキュリティ機能を活用するためにKVSで使用される共通設計戦略を強調した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:26:44 GMT)
Data integrity vs. inference accuracy in large AIS datasets [1.0] 本稿では,大規模AISデータセットにおけるデータの完全性が分類精度に与える影響を解析する。
また、AISシステムの信頼性を向上させるためのer-ror検出・補正方法とデータ検証手法も提示する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:58:00 GMT)
Disentangling Popularity and Quality: An Edge Classification Approach for Fair Recommendation [1.0] グラフニューラルネットワーク(GNN)は,レコメンダシステムの性能向上に有効なツールであることが証明されている。
本稿では,この問題に対処するために,人気度と品質を両立させるGNNベースのレコメンデーションモデルを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:31:52 GMT)
CM3T: Framework for Efficient Multimodal Learning for Inhomogeneous Interaction Datasets [1.0] 本稿では,CM3Tと呼ばれるクロスラーニングのための新しいモデルに依存しないプラグインアーキテクチャを提案する。
本稿では,トランスファー学習用マルチヘッド・ビジョン・アダプタとマルチモーダル学習用クロスアテンション・アダプタの2つのアダプタ・ブロックを紹介する。
ビデオ入力を処理するバックボーンと比較してトレーニング可能なパラメータは12.8%に過ぎず、最先端よりも同等で、さらに優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:01:10 GMT)
Complexity Classification of Product State Problems for Local Hamiltonians [0.9] 我々は、許容される2-量子相互作用の任意の固定集合によって定義されるハミルトン多様体の最小エネルギー積状態を見つける複雑さを分類する。
積状態の最小エネルギーを推定することは、全ての許容相互作用が 1-局所であり、NP-完全でない場合に限る。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:38:18 GMT)
A Bayesian Approach for Discovering Time- Delayed Differential Equation from Data [0.9] 時間遅れ微分方程式(TDDEs)は、将来の状態が遅延を伴う過去の状態に依存する複雑な力学系をモデル化するために広く用いられている。
観測されたデータから基礎となるTDDEを推測することは、現実世界のシステムに固有の非線形性、不確実性、ノイズのために依然として難しい問題である。
BayTiDeは、入力されたデータの解像度と直接比例する精度に、時間遅延の任意に大きな値を特定することができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:20:00 GMT)
Inverse Design of Optimal Stern Shape with Convolutional Neural Network-based Pressure Distribution [0.9] 本稿では,深層学習を用いて船尾形状を推定する逆設計アルゴリズムを提案する。
畳み込みニューラルネットワークを用いて、輪郭として表現された圧力分布の特徴を抽出した。
マルチタスク学習モデルを用いて、船尾形状の様々なセクションを推定した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:37:06 GMT)
Improved entanglement entropy estimates from filtered bitstring probabilities [0.9] ニューマン量子絡み合いエントロピー$SvN_A$。
多くの場合、これらの下限は、ある値$p_min$よりも低い確率でビットストリングを除去し、残りの確率を正規化することで改善できることを示す。
本研究は,数千ビットストリングのサンプルを用いて得られたフィルタリング相互情報から,SvN_A$の近似推定値が得られることを示唆する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:05:45 GMT)
Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment [0.7] ビデオ会議は、しばしば対人会話の流動性と楽しみを欠いている。
本研究では、マルチモーダル機械学習を利用して、ビデオ会議におけるネガティブな経験の瞬間を予測する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:05:35 GMT)
Combining quantum processors with real-time classical communication [0.7] 量子コンピュータは、量子力学の法則で情報を処理している。
現在の量子ハードウェアはノイズが多く、短時間しか情報を保存できず、量子ビット(qubits)と呼ばれる数ビットに制限されている。
ここでは、これらの制限を、最大142量子ビットの周期接続を必要とする量子状態を生成するために、エラー軽減された動的回路と回路切断で克服する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:34:25 GMT)
Fibonacci-Modulation-Induced Multiple Topological Anderson Insulators [0.6] フィボナッチ変調による1次元スピン軌道結合SOC鎖におけるトポロジカルアンダーソン絶縁体(TAI)の出現について検討した。
SOCの振幅が減少すると、TAI相の数は増加し、フィボナッチ変調によって誘導されるエネルギースペクトルのフラクタル構造に複雑な関係が生じる。
今回,エキゾチック障害によるトポロジカルな位相と複雑なマルチフラクタルな性質を探求するための新たな道を開いた。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:52:55 GMT)
A Trust-Guided Approach to MR Image Reconstruction with Side Information [0.6] 多くの加速法は、取得した$textitk$-space データの限られたセットから診断品質の高い画像を再構成するように設計されている。
このタスクは線形逆問題 (LIP) として表すことができ、アンダーサンプリングの結果、フォワード演算子はランク不足となるか、小さな特異値を示すことができる。
我々は、サイド情報をLIPに効果的に統合する新しいエンドツーエンドディープラーニングフレームワークTGVNを提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:05:19 GMT)
Tree-based RAG-Agent Recommendation System: A Case Study in Medical Test Data [0.6] HiRMedは、Retrieval-Augmented Generation(RAG)を利用して、インテリジェントな医療検査レコメンデーションを行う、新しい木構造レコメンデーションシステムである。
本システムは,RAGプロセスを通じて,各ツリーノードの医療的推論を行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:50:51 GMT)
Low-Rank Variational Quantum Algorithm for the Dynamics of Open Quantum Systems [0.5] 変動量子アルゴリズムは、リンドブラッドマスター方程式によって支配される密度行列のリアルタイム進化をシミュレートするために開発された。
このアルゴリズムは、統計混合物の各純状態をパラメタライズド量子回路として符号化する。
2つの変分アンサーゼが提案され、その有効性は2次元散逸横場イジングモデルの力学シミュレーションにおいて評価される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:37:52 GMT)
Exact projected entangled pair ground states with topological Euler invariant [0.5] 本報告では,非自明なオイラートポロジーを持つギャップ付き凸凸対状態(PEPS)のクラスについて報告する。
非相互作用極限において、これらの系は量子幾何学的境界の飽和に関する最適条件を持つ。
結晶対称性によって保護されたこれらの状態は、PEPSで10方向の位相的特徴を捕捉する制限を回避する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:52:46 GMT)
Found in Translation: semantic approaches for enhancing AI interpretability in face verification [0.4] 本研究は,XAIフレームワークに意味概念を統合することで,モデル出力と人間の理解の包括的ギャップを埋めることにより,これまでの研究を拡張した。
ユーザが選択した顔のランドマークによって定義された意味的特徴を用いて,グローバルな説明とローカルな説明を組み合わせた新しいアプローチを提案する。
結果は、セマンティックベースのアプローチ、特に最も詳細なセットは、従来の手法よりも、モデル決定をよりきめ細やかな理解を提供することを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:34:53 GMT)
Frequency-Masked Embedding Inference: A Non-Contrastive Approach for Time Series Representation Learning [0.4] 本稿では,非コントラスト法である周波数行列埋め込み推論(FEI)を導入し,正および負のサンプルの必要性を完全に排除する。
FEIは、一般化の観点から、既存のコントラストベースの手法を著しく上回っている。
本研究は時系列の自己教師型表現学習に関する新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:17:43 GMT)
MBTSAD: Mitigating Backdoors in Language Models Based on Token Splitting and Attention Distillation [0.3] MBTSADは、クリーンなデータの小さなサブセットだけを利用することで、言語モデルのバックドアを緩和することができる。
MBTSADは事前訓練された重量に依存しておらず、事前訓練された重量が到達不能なシナリオにおいてその実用性を高めている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:07:44 GMT)
Photon pair generation via down-conversion in III-V semiconductor microrings: modal dispersion and quasi-phase matching [0.3] III-V半導体マイクロリング共振器は、自発的なパラメトリックダウン変換により、光子対と圧縮された真空状態を生成することができる。
本稿では、弱いポンプパルスによって生成される光子対の双光子波関数の解析式を示し、より強いポンプ条件下で生じる圧縮状態の特徴付けを行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:27:22 GMT)
A Novel Structure-Agnostic Multi-Objective Approach for Weight-Sharing Compression in Deep Neural Networks [0.2] 本稿では、ニューラルネットワークアーキテクチャ、次元、タスク、データセットに依存しない多目的進化的アルゴリズム(MOEA)に基づく圧縮フレームワークを提案する。
ネットワークの重みを1つのコードブックに量子化し、効率的な重み表現を行う。
実験結果は、CIFAR-10で13.72 sim14.98倍、CIFAR-100で11.61 sim 12.99倍、ImageNetで7.44 sim 8.58倍のニューラルネットワークメモリを削減できることを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:51:29 GMT)
Spiking monocular event based 6D pose estimation for space application [0.2] 本稿では,宇宙船のイベントベースポーズ推定を改善するための,完全なイベントベースソリューションの実現可能性について検討する。
本稿では,テストベッド上のイベントベースカメラによってキャプチャされた実イベントフレームを用いた,最初のイベントベースデータセットであるSEENICについて述べる。
本稿では,21cm以上の位置誤差と14度回転誤差に対して,我々の小さなスパイク終端ネットワーク(S2E2)ソリューションが興味深い結果をもたらす,このユースケースにおける最初のイベントベースソリューションの方法と結果を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:53:59 GMT)
Explaining Humour Style Classifications: An XAI Approach to Understanding Computational Humour Analysis [0.2] 本稿では、ユーモアスタイルの分類を理解するための説明可能なAIフレームワークを提案する。
我々は、言語的、感情的、意味的な特徴がユーモアスタイルの分類決定にどのように貢献するかを分析するために、総合的なXAI手法を適用した。
本研究は,算術的ユーモア分析の理論的理解と,メンタルヘルス,コンテンツモデレーション,デジタル人文科学研究の実践的応用に寄与する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:08:56 GMT)
Early Perspectives on the Digital Europe Programme [0.2] この論文は、DEP(Digital Europe Programme)を通じて資金提供されたプロジェクトについて、実証的な調査を行っている。
これらのプロジェクトは、サイバーセキュリティ、人工知能、高性能コンピューティング、イノベーションハブ、中小企業、教育に重点を置くDEPの戦略とよく一致している。
プロジェクトの大半は、同額の国内およびEUからの資金提供を受けている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:56:54 GMT)
ChronoSense: Exploring Temporal Understanding in Large Language Models with Time Intervals of Events [0.2] 我々はChronoSenseについて紹介する。ChronoSenseは大規模言語モデルの時間的理解を評価するための新しいベンチマークである。
このベンチマークを用いて7つのLLMの性能評価を行い, モデルがアレン関係, 対称関係であっても, 全く異なる扱いをすることを示した。
全体として、モデルの性能の低さは、LLMにおける時間的理解の改善の必要性を強調している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:27:41 GMT)
Interpretable Recognition of Fused Magnesium Furnace Working Conditions with Deep Convolutional Stochastic Configuration Networks [0.2] 本稿では、深層畳み込み構成ネットワーク(DCSCN)に基づく解釈可能な作業条件認識手法を提案する。
物理的に意味のある差動畳み込みカーネルを生成するために、教師付き学習機構が使用される。
認識精度、解釈可能な信頼性評価指標、モデルパラメータ量に基づいて共同報酬関数を構築する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:17:41 GMT)
A Novel Vision Transformer for Camera-LiDAR Fusion based Traffic Object Segmentation [0.2] トラヒックオブジェクトセグメンテーションのためのCamera-LiDAR Fusion Transformerモデルは、ビジョントランスを用いたカメラとLiDARデータの融合を利用する。
セグメンテーション機能を拡張して、さまざまな気象条件で、サイクリスト、交通標識、歩行者を含むさまざまな種類のオブジェクトに分類オプションを追加します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:06:29 GMT)
Comprehensive Pathological Image Segmentation via Teacher Aggregation for Tumor Microenvironment Analysis [0.2] PAGET (Pathological image segmentation via AGgrEgated Teachers) は,複数のセグメンテーションモデルを統合する新しい知識蒸留手法である。
PAGETが様々な組織タイプや医療機関に対して,迅速かつ包括的なTMEセグメンテーションを行う能力を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:33:14 GMT)
MEMSDuino: An Arduino-Based MEMS Switch Controller [0.1] この機器は、低温MEMSスイッチネットワーク用の19インチラックマウントコントローラである。
これは、人間のオペレーターが明らかにマークされたインジケータライトの列を通してスイッチの状態を見ることを可能にする。
この設計は、大きな電圧またはスイッチする電流を必要とする他のスイッチを制御するために変更することもできる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:07:34 GMT)
DAMAGE: Detecting Adversarially Modified AI Generated Text [0.1] 既存のAI検出器の多くが、人間化されたテキストを検出できないことを示す。
偽陽性率を低く保ちながら、人間化されたAIテキストを検出する頑健なモデルを実証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:43:49 GMT)
Shots and variance on noisy quantum circuits [0.1] 本稿では,量子回路における所望のばらつきに要求されるショット数を推定する手法を提案する。
偏差を2.5%の範囲内で正確に推定できることを示します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:12:39 GMT)
Enhanced Rooftop Solar Panel Detection by Efficiently Aggregating Local Features [0.1] 衛星画像を用いた屋上太陽光発電パネル検出手法を改良したCNN(Convolutional Neural Network)を提案する。
本稿では,屋根面の局所的な畳み込み特徴を抽出するために,事前学習したCNNモデルを提案する。
これらのローカル機能は、屋上レベルのグローバルな特徴を得るために、Vectors of Locally Aggregated Descriptors (VLAD)技術を使って結合される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:36:44 GMT)
On the Adversarial Robustness of Benjamini Hochberg [0.1] Benjamini-Hochberg (BH) 法は、複数のテストにおいて偽検出率(FDR)を制御するために広く用いられている。
この制御は、重要な安全・安全の文脈で頼りにできるので、敵の堅牢性について検討する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:41:53 GMT)
WhACC: Whisker Automatic Contact Classifier with Expert Human-Level Performance [0.0] 頭部固定歯列の高速ビデオから触覚周期を識別するピソンパッケージを提案する。
熟練した3人のキュレーターに対して100万フレーム以上の性能を評価する。
私たちは、1億フレームのデータセットを333時間から6時間にキュレートするために必要な人間の時間を削減します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:09:37 GMT)
W-class states-identification and quantification of Bell-CHSH inequalities' violation [0.0] 本研究では,2量子サブシステムに関連する2モード混合状態に対する絡み合い対策と非局所性パラメータの関係を解析する。
我々は、量子ビット混合状態に対する共起と負性によってパラメータ化される混合度測定値の範囲を導出し、ベル-CHSH不等式の不等式に対する違反と非違反を保証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:21:41 GMT)
Visualizing quantum entanglement in Bose-Einstein condensates without state vectors [0.0] リングポリマー自己整合場理論は理想ボース気体の臨界温度と熱容量を計算するために用いられる。
ボース・アインシュタイン凝縮の遷移指標は期待通り観察される。
ボース・アインシュタイン凝縮、ボソン交換、絡み合い、文脈性などの量子現象は、熱空間におけるリングポリマースレッドの融合と分離の観点で可視化できることが示されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:27:46 GMT)
Turn-based Multi-Agent Reinforcement Learning Model Checking [0.0] マルチプレイヤーゲームにおけるターンベースマルチエージェント強化学習(TMARL)エージェントの適合性を検証する新しい手法を提案する。
提案手法は,TMARLの緊密な統合とモデルチェックと呼ばれる検証手法に依存している。
実験の結果,本手法はTMARLエージェントの検証に適しており,モノリシックなモデル検査よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:04:20 GMT)
Tractable $\textit{a}$ $\textit{priori}$ Dimensionality Reduction for Quantum Dynamics [0.0] 一般化固有値分解に対する小用量ヤコビダビッドソンアルゴリズムの次元化における強力な応用について述べる。
この手法は任意の量子状態の力学の計算を$mathcalO(n)$ timeで行うことができ、$n$は元のヒルベルト空間の大きさである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:02:50 GMT)
The trace distance between density matrices, a nifty tool in new-physics searches [0.0] 量子状態(トレース距離と忠実度)を比較するために日常的に使用されるツールを紹介します。
我々は、前者は文献で考慮された他の量子情報観測可能量より優れていることを発見した。
我々は、LHCにおけるトップクォーク対生成とチャーモニウム崩壊を分析して、衝突器データにおけるマジックの最初の決定を行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:00:00 GMT)
The Eigenstate Thermalization Hypothesis in a Quantum Point Contact Geometry [0.0] 自由フェルミオン系に現れる長距離量子絡み合いは、小さなサブ系を「熱化」するのに十分であることが知られている。
少数の量子点接触によって接続されたサブシステムの絡み合いエントロピーは、サブシステムの線形サイズとして、サブエクステンシブであることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:19:17 GMT)
Targeted Nakamoto: A Bitcoin Protocol to Balance Network Security and Energy Consumption [0.0] ターゲットナカモト(Targeted Nakamoto)は、ターゲットのハッシュレート間隔で鉱山労働者を誘引するProof-of-Workプロトコル拡張である。
ハッシュレートが目標以上の場合、天井は、採掘者が受け取ることができるブロック報酬の上に置かれる。
ハッシュレートが目標より下にある場合、床は採掘者のブロック報酬の下に置かれる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 03:07:03 GMT)
Superposition in Transformers: A Novel Way of Building Mixture of Experts [0.0] 破滅的な忘れは、大きな言語モデルを新しいタスクやドメインに適用する際の大きな課題である。
ベースモデルの隠れ表現を重畳するためにオートエンコーダを利用する新しいアーキテクチャである Superposition in Transformers を導入する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 23:02:42 GMT)
Sub-micron Circuit Fabrication on Diamond Anvils for Mesoscopic High-Pressure Experiments [0.0] ダイヤモンドアンビル上に高品質なリフトオフ構造を創出する新規な製造法を提案する。
2層レジストスタックと電子ビームリソグラフィーを用いることで、500nmまでの特性サイズが達成される。
この研究は、ダイヤモンドアンビル細胞やその他の面状結晶のサンプルの中で、複雑で高精度な製造と測定の道を開く。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:00:01 GMT)
Stability of Data-Dependent Ridge-Regularization for Inverse Problems [0.0] 本稿では,データ依存的かつ空間的に変化する正規化強度を持つ画素ベースリッジ正規化器の学習を提案する。
本研究は,再建が最大ポステリオリアプローチを形成することを証明している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:23:47 GMT)
Squeezed states of light after high-harmonic generation in excited atomic systems [0.0] 高調波発生(HHG)は、最近、光の古典的でない状態を生成するための有望な方法として登場した。
本研究では,原子系におけるHHGプロセスによる光の励起状態の生成について理論的に検討する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:45:10 GMT)
Soft symmetries of topological orders [0.0] (2+1)D 位相順序は、群 $textAut(mathcalC)$ によって与えられる創発的対称性を持つ。
本稿では、textAut(mathcalC)$ が、いかなる対称性の分数化にも関係しないが、それでも非自明な要素を持つ場合について論じる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:00:00 GMT)
Single-qubit loss-tolerant quantum position verification protocol secure against entangled attackers [0.0] 本稿では,BB84状態に基づくQPVプロトコルの損失耐性について検討する。
これらの結果が,古典的情報の$n$ビットと単一キュービットを組み合わせた変分プロトコルにどのように変換されるかを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:55:18 GMT)
Self-Attention as a Parametric Endofunctor: A Categorical Framework for Transformer Architectures [0.0] 自己認識機構はディープラーニングアーキテクチャに革命をもたらしたが、数学的基礎はいまだに完全には理解されていない。
これらの機構は分類代数学によって定式化でき、自己注意の線形成分に焦点をあてる枠組みを提示する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:14:18 GMT)
Segment Anything Model for Zero-shot Single Particle Tracking in Liquid Phase Transmission Electron Microscopy [0.0] 液相透過電子顕微鏡はナノスケールでの単一粒子追跡に有望なツールである。
ノイズの多いLPTEMビデオにおけるナノ粒子の同定と追跡のための標準化された枠組みが欠如していることは、この分野の進歩を妨げている。
本稿では,素早い映像分割と粒子追跡,統計解析を統合した包括的フレームワークSAM4EMを紹介する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:19:27 GMT)
Resonance fluorescence spectra of a driven Kerr nonlinear resonator [0.0] 我々は、Kerr非線形共振器の蛍光スペクトルの特徴を導出する。
超伝導カー非線形共振器の共鳴蛍光スペクトルを実験的に測定した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:52:23 GMT)
Reply to Structural Vulnerability in Y00 Protocols [0.0] 今福健太郎は分析で、Y00プロトコルで測定結果から秘密情報を漏洩させる構造的脆弱性が明らかになったと述べている。
また、より単純なモデルであるが、同じ元の原則に基づいていて、元のY00プロトコルよりも効率的であることも述べられている。
この回答は、(1)その脆弱性は、今福による一つの結果の誤解釈によるものであり、(2)彼の提案した単純なモデルは、元のY00よりも脆弱であることを示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:48:44 GMT)
Reducing Circuit Depth in Quantum State Preparation for Quantum Simulation Using Measurements and Feedforward [0.0] 中間回路の測定とフィードフォワードは、量子回路の深さを著しく減少させることが示されている。
本稿では,幅の増大を犠牲にして,量子回路の深さを低減する並列化手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:08:55 GMT)
Quantum and classical correlations in four-wave mixing from cold ensembles of two-level atoms [0.0] コールド2レベル原子のアンサンブルからの4波混合における量子相関は、背景光をフィルターすることなく優位に立つ可能性がある。
量子相関の崩壊速度は試料中の原子の数とともに変化し、その超放射能のような性質を示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:17:25 GMT)
Quantum Zeno Monte Carlo for computing observables [0.0] 本稿では,デバイスノイズとトロッター誤差に対するレジリエンスを示す古典量子ハイブリッドアルゴリズムであるQuantum Zeno Monte Carlo (QZMC)を紹介する。
QZMCは、初期状態オーバーラップや変動パラメータを必要とせず、静的および動的特性を計算し、量子回路の深さを減少させる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:35:03 GMT)
Quantum Zeno Engines and Heat Pumps [0.0] 量子アディバティック変換を量子ゼノストロークに置き換えた量子エンジンと量子ヒートポンプの実装について検討する。
ショートカット・トゥ・アディバティティティ手法よりも高速に最適性能を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:30:27 GMT)
Putnam's Critical and Explanatory Tendencies Interpreted from a Machine Learning Perspective [0.0] 自然科学と超越科学における理論選択の感覚は、科学哲学の中心である。
機械学習モデルの出現は、現在の議論のギアのレンチとして機能する可能性がある。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:09:35 GMT)
Producing entangled photon pairs and quantum squeezed states in plasmas [0.0] 2つの偏光ポンプは、ミリ長の均一プラズマを介して偏光に絡み合った光子対を生成することができる。
ラマン散乱によるノイズは、ポンプの脱調が2倍のプラズマ周波数と異なる場合を避けることができる。
顕著なことに、ラマン散乱による増幅ノイズは相関しており、出力の2乗の1つで抑制することができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:11:31 GMT)
Predicting band gap from chemical composition: A simple learned model for a material property with atypical statistics [0.0] 結晶材料の化学組成のみを用いてバンドギャップを予測する機械学習モデルを提案する。
この分析により,混合確率変数をモデル化する作業として,フレームバンドギャップの予測が可能となる。
このモデルは、バンドギャップと個々の化学元素の関係を直感的に捉えることで化学的解釈性を提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:16:15 GMT)
Predicting Electromagnetically Induced Transparency based Cold Atomic Engines using Deep Learning [0.0] 我々は、電磁誘導透過の実験的枠組みの中で動作する量子熱エンジンを予測するための人工ニューラルネットワークモデルを開発した。
高性能エンジンは, 実測値, 放射温度, 作業量, エルゴトロピーの3つの指標に基づいて予測, 解析を行う。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:51:24 GMT)
Polyp-DDPM: Diffusion-Based Semantic Polyp Synthesis for Enhanced Segmentation [0.0] Polyp-DDPMは,マスク上に条件付きポリプのリアルな画像を生成する拡散法である。
我々のアプローチは、医療画像に関連するデータ制限、高アノテーションコスト、プライバシー問題といった課題に対処する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:39:49 GMT)
Plant Leaf Disease Detection and Classification Using Deep Learning: A Review and A Proposed System on Bangladesh's Perspective [0.0] 植物病はバングラデシュの農業生産において深刻な障害となっている。
本稿では主に葉の病原体検出のためのより良いモデルを提案する。
提案したCNNモデルは効率よく動作し,検査対象の疾患の検出と分類に成功している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:43:59 GMT)
Photon Transport in a Gas of Two-Level Atoms: Unveiling Quantum Light Creation [0.0] Heisenberg-Langevin 方程式法を用いて,2層原子の気体中におけるほぼ単色光伝搬の理論解析を行った。
我々の焦点は光子作用素の進化と2階相関関数への影響である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:40:01 GMT)
Phonon-induced modification of polaritonic Rabi oscillations in the presence of the dark excitonic condensate [0.0] 暗黒励起凝縮物の検出法を提案する。
励起子とフォノンの間の相互作用は、明るい励起子と暗い励起子の間の相互変換に関係している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 15:18:07 GMT)
Overcoming Quantum Metrology Singularity through Sequential Measurements [0.0] 複数の未知パラメータの同時推定は、量子センシングにおいて最も一般的なシナリオである。
ここでは、逐次測定戦略に基づく単純なメカニズムにより、量子センシングにおける特異性問題に対処する。
これは、連続的な局所測定のステップとプローブの進化を含むシーケンシャルな測定が本質的に、シーケンシャルな測定の回数と指数関数的に増加する相関的な測定データを生成するためである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:00:38 GMT)
Operating semiconductor qubits without individual barrier gates [0.0] 本研究では,個々のバリアゲートにパルスを印加することなく2ビット間相互作用を可変させる手法を提案する。
これによりバリアゲート電圧を変更することなく2量子演算を行うことができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:21:53 GMT)
Non-classicality induces recombination in high-harmonic generation with circularly polarized fields [0.0] 高調波発生(英: high-harmonic generation、HHG)は、強い駆動場が物質と相互作用する過程であり、それによってドライバーの高次高調波への周波数アップコンバージョンが生じる。
古典的でない構造光を用いることで、非古典的な構成のHHGが実現可能であることを実証する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:34:21 GMT)
Non-Hermitian Topology in Hermitian Topological Matter [0.0] エルミートトポロジカル絶縁体における異常境界状態は非エルミートトポロジを示す。
我々の研究は、エルミート位相と非エルミート位相の間の隠れた関係を明らかにし、量子物質における非エルミート位相を同定するためのアプローチを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 08:05:24 GMT)
Machine Learning-Based Security Policy Analysis [0.0] Security-Enhanced Linux (SE Linux) は、必須アクセス制御(MAC)を強制する堅牢なセキュリティメカニズムである。
本研究では、グラフベースの手法と機械学習手法を組み合わせたSE Linuxポリシー解析の自動化によるポリシー異常の検出について検討する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:42:41 GMT)
METFORD -- Mutation tEsTing Framework fOR anDroid [0.0] この研究は、Androidの突然変異検査コストの削減に寄与することを目的としている。
突然変異テスト演算子を変異スキーマに従って実装する。
追加の突然変異演算子はJavaScriptで実装でき、フレームワークに簡単に統合できる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:36:57 GMT)
Low-Order Flow Reconstruction and Uncertainty Quantification in Disturbed Aerodynamics Using Sparse Pressure Measurements [0.0] 本稿では,低次グステンカウンタ流場と昇降係数をスパース・ノイズ表面圧力測定から再構成する新しい機械学習フレームワークを提案する。
本研究では,センサのガス-空気相互作用に対する応答の時間変化を徹底的に検討し,センサ配置に関する貴重な知見を明らかにする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 22:02:06 GMT)
Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches [0.0] MLLM(Multimodal large language model)は、多種多様なデータソースから学習する。
この驚くべき偉業にもかかわらず、大規模なデータセットで訓練された最先端のLLMの認知能力は、まだ表面的で不安定だ。
本稿では, エンボディメント, シンボル接地, 因果性, 記憶の原理を, 有機的手法で人工知能(AGI)の達成に活用する方法について論じる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:18:47 GMT)
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases [0.0] LangFairは、LLM実践者に特定のユースケースに関連するバイアスと公平性リスクを評価するためのツールを提供することを目的としている。
このパッケージは、ユースケース固有のプロンプトに対するLLM応答で構成される評価データセットを簡単に生成する機能を提供する。
メトリクスの選択をガイドするために、LangFairは実行可能な決定フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:20:44 GMT)
Is completeness necessary? Estimation in nonidentified linear models [0.0] 我々は高次元リッジ正規化、勾配降下、主成分分析(PCA)などの手法を含む正規化推定器の理論を開発する。
結果は高次元および非パラメトリックな機器変数回帰に対して説明され、シミュレーション実験によって支持される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:09:35 GMT)
Integrated Learning and Optimization for Congestion Management and Profit Maximization in Real-Time Electricity Market [0.0] 我々は,経済派遣(ED)と直流最適潮流(DCOPF)問題を解決するため,新たな統合学習・最適化手法を開発した。
提案手法は、負荷とPTDF予測を経済的な操作よりも正確に訓練する逐次学習と最適化(SLO)と比較する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:46:18 GMT)
Implications of Artificial Intelligence on Health Data Privacy and Confidentiality [0.0] 医療における人工知能の急速な統合は、医療診断、パーソナライズされた医療、運用効率に革命をもたらしている。
しかし、患者のデータのプライバシ、倫理的考慮、規制遵守に関する重大な問題が発生する。
本稿では、医療におけるAIの二重効果について検討し、その変革の可能性と、敏感な健康情報を保護するための重要な必要性を強調した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:52:32 GMT)
Image-charge detection of electrons on helium in an on-chip trapping device [0.0] オンチップマイクロチャネルデバイスにおける超流動ヘリウム上のRydberg遷移の検出について報告する。
この感度は、単一の電子のリドベルク転移を検出する可能性を示し、非破壊的なスピン状態の読み出しのための新しい経路を開くことができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:49:56 GMT)
Hybrid deep convolution model for lung cancer detection with transfer learning [0.0] 肺がんは、世界中でがん関連死亡の原因の1つとなっている。
我々は,MSNN(Maximum Sensitivity Neural Network)と呼ばれる伝達学習を利用したハイブリッド深層畳み込みモデルを提案する。
MSNNは、感度と特異性を改善することにより、肺がん検出の精度を向上させるように設計されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 06:01:01 GMT)
High-Order Tensor Regression in Sparse Convolutional Neural Networks [0.0] 本稿では、現在の機械学習文献における従来の方法論とは大きく異なる、畳み込みに対する一般的なアプローチを示す。
スパース畳み込みニューラルネットワークの一般的な見方の枠組みとして、ニューラルネットワークにおける回帰の合理的理論が開発されている。
直接的な結果として、古典的バックプロパゲーションアルゴリズムは、この有理テンソルベースのアプローチと整合するように再定義され、最も単純で、最も一般的な形式で表される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 01:56:56 GMT)
Gravitational Wave and Quantum Graviton Interferometer Arm Detection of Gravitons [0.0] 本稿ではLIGOのような干渉計における重力波検出の量子的および古典的記述について考察する。
従来の重力波法と量子重力エネルギー法も正しい結果の予測に成功しているのに対し、重力散乱と量子光学モデルは観察された腕の変位を説明することに成功していることを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:38:32 GMT)
Geometry Restoration and Dewarping of Camera-Captured Document Images [0.0] 本研究では,カメラが捉えた紙文書のデジタル画像のトポロジを復元する手法の開発に焦点をあてる。
本手法では,文書アウトライン検出に深層学習(DL)を用い,次いでコンピュータビジョン(CV)を用いてトポロジカル2Dグリッドを作成する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 17:12:19 GMT)
Frequency conversion in a hydrogen-filled hollow-core fiber: power scaling, background, and bandwidth [0.0] 光ファイバーに基づく大規模量子ネットワークは、近赤外波長の光子を最小限の損失で移動させる。
量子周波数変換は、その量子状態を維持しながら単一の光子の波長を変更する方法である。
最も一般的には、この変換過程に非線形結晶が用いられ、高忠実度での準ユニティ変換効率が実証されている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:09:29 GMT)
Finite temperature detection of quantum critical points via internal quantum teleportation [0.0] 本研究では, 有限温度データを用いた量子臨界点の検出に, テレポーテーションプロトコルが有効であることを示す。
以前の提案とは対照的に、外部キュービットを入力状態として使用する必要はなく、システム内のキュービットの1つにテレポートする。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:56:07 GMT)
Existential Crisis: A Social Robot's Reason for Being [0.0] 本研究は,ロボットのユーザ認知が個性表示にどのように影響するかを検討することを目的とする。
LLMと音声によるテキスト技術を用いて,2つの条件を比較した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 20:30:15 GMT)
Exhaustive Characterization of Quantum Many-Body Scars using Commutant Algebras [0.0] 可換代数の言語における量子多体スカー (QMBS) について検討する。
QMBS は局所ハミルトン群の対称性代数である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:03:01 GMT)
Estimating the Increase in Emissions caused by AI-augmented Search [0.0] 我々の推計では、エネルギー需要は60~70倍増加する。
これは、従来の探索におけるエネルギー消費の最新の推定に基づいている。
BLOOMモデル, 176Bパラメータモデル, および OpenAI の GPT-3 に対するクエリのエネルギー需要に関する最近の研究は, 同様に複雑である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:06:36 GMT)
Enumerative Methods in Quantum Electrodynamics [0.0] 我々は,QED型理論における可観測物は,コードダイアグラム(chord diagrams)と呼ばれる構造を用いて実現可能であることを示す。
これはまた、湯川理論におけるファインマン図形の数と焼成QEDにおける図形の数との説明できない相関関係を明らかにしている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:10:22 GMT)
Energy additivity as a requirement for universal quantum thermodynamical frameworks [0.0] 内部エネルギーは、宇宙の閉系エネルギーとの整合性を維持するために環境を考慮に入れなければならない。
内部エネルギーは添加物ではなく、非物理的特徴をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:58:36 GMT)
Encrypted Qubits can be Cloned [0.0] 未知の量子状態の暗号化クローニングが可能であることを示す。
暗号化クローニングの可能なアプリケーションは、暗号化された量子マルチクラウドストレージを可能にすることである。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 04:38:59 GMT)
Echomix: a Strong Anonymity System with Messaging [0.0] Echomixは実践的なミックスネットワークフレームワークであり、関連するプロトコルのスイートである。
グローバルな敵による交通分析に対する抵抗によって、他の匿名システムと区別される。
レイテンシと帯域幅のオーバーヘッドが比較的低い。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:18:03 GMT)
Dynamic Data Defense: Unveiling the Database in motion Chaos Encryption (DaChE) Algorithm -- A Breakthrough in Chaos Theory for Enhanced Database Security [0.0] 新しい理論フレームワークはカオス理論とトポロジーのネクサスで登場し、動きのデータベース カオス暗号化(DaChE)アルゴリズムである。
このパラダイムシフトアプローチは、データストレージの静的な性質に挑戦し、データベースのセキュリティを強化するために動的データの動きを推奨する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 13:46:56 GMT)
Diff-Lung: Diffusion-Based Texture Synthesis for Enhanced Pathological Tissue Segmentation in Lung CT Scans [0.0] セグメンテーションは、健康組織と病理組織の間に有意な階級不均衡があるため、難しい。
本稿では,AIモデルのトレーニング中に適用されたデータ拡張に拡散モデルを活用することにより,この問題に対処する。
本研究は, 本態様の特徴を保ちながら, それぞれの組織タイプに特異的な複雑な詳細を保存しながら, 合成病理組織パッチを作製する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 09:19:23 GMT)
Developing an Artificial Intelligence Tool for Personalized Breast Cancer Treatment Plans based on the NCCN Guidelines [0.0] がん治療には、患者の臨床状態、医療履歴、エビデンスに基づくガイドラインに基づくパーソナライズされたアプローチが必要である。
National Comprehensive Cancer Network (NCCN) は頻繁に更新され、フローチャートや図のようなビジュアルを通して複雑なガイドラインを提供する。
我々はエージェントRAG(Retrieval-Augmented Generation)とグラフRAG(Graph-RAG)の2つのAI駆動手法を提案した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 02:16:20 GMT)
Determining probability density functions with adiabatic quantum computing [0.0] 本稿では,1次元の確率分布を,アナログとゲートベースの計算を併用する方法の実践例として挙げる。
特に, 厳密な単調関数の整合性を考慮したアディベート進化モデルにおいて, データを符号化する手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:35:03 GMT)
Designing Majorana Quasiparticles in InAsP Quantum Dots in InP Nanowires with Variational Quantum Eigenvalue Solver [0.0] 本研究は、InAsP量子ドット(QD)におけるマヨラナゼロモード(MZM)の設計に向けたステップを示す。
単一粒子スペクトルは、正確な対角化(ED)法とハイブリッド変分量子固有解法(VQE)法を用いて、QNANOおよび多電子スペクトルを用いた100万の原子論的計算から得られる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:53:05 GMT)
DDRM-PR: Fourier Phase Retrieval using Denoising Diffusion Restoration Models [0.0] 本稿では,デノナイジング拡散回復モデルの効率的かつ教師なしの後方サンプリングフレームワークを利用する。
この手法は、モデルベースの交互射影法とDDRMを組み合わせて、事前訓練された無条件拡散前処理を位相検索に利用する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:18:23 GMT)
Curvature of Quantum Evolutions for Qubits in Time-Dependent Magnetic Fields [0.0] 時間依存磁場に浸漬された2レベル量子系に対する量子進化の曲率の正確な解析式を提示する。
曲率係数の物理的意義をよりよく把握するために、量子曲線が非幾何学的であることを示すために、曲率係数の時間的挙動をヒルベルト空間における系の速度と加速度の時間的挙動と比較する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:46:09 GMT)
Compact superconducting vacuum-gap capacitors with low microwave loss and high mechanical coherence for scalable quantum circuits [0.0] 拡張性真空ギャップコンデンサの詳細な製造法を提案する。
これらのコンデンサは超高コヒーレンス機械運動をサポートし、マイクロ波損失が低く、フットプリントも小さい。
これらの真空ギャップコンデンサは、超伝導量子ビットと機械システムとの結合に期待できる候補である。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:45:46 GMT)
Comment on "The unphysicality of Hilbert spaces" (arXiv:2308.06669v3) [0.0] この文は誤りであり、誤りの原因が指摘される。
ヒルベルト空間が「ポテンシャル無限遠点を実際の無限遠点に変える」という主張は、証明されていない。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 10:55:32 GMT)
Certification of unbounded randomness with arbitrary noise [0.0] 量子非局所性はランダム性を証明できる資源として特定されている。
本稿では,Leggett-Gargの不等式の最大値違反に基づいて,デバイスに依存しない半非有界ランダム性を認証する手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 11:06:33 GMT)
CLIX: Cross-Lingual Explanations of Idiomatic Expressions [0.0] 本稿では,eXaticpressionsの言語横断的説明課題であるCLIXを提案する。
この課題に対する現在のNLPモデルの能力について検討し、課題はあるものの、大きな言語モデルは有望であることを示す。
私たちは、これらのシステムを教育ツールに確実に組み込む前に、対処すべき重要な課題を強調するために、詳細なエラー分析を行います。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:06:37 GMT)
Bidirectional controlled quantum state preparation in high-dimensional quantum system [0.0] 高次元量子システムは、量子情報処理タスクにおいて、量子ビットシステムに対してユニークな利点を示す。
本稿では,双方向決定論的制御型遠隔量子状態生成プログラムを提案する。
評価の結果, quNitが単一光子の空間モードで符号化された場合, 線形光学素子のみで本手法を実現できることがわかった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:54:02 GMT)
Bi-Band ECoGNet for ECoG Decoding on Classification Task [0.0] 本稿では,ディープラーニングに基づくバイバンドECoGNetモデルを提案する。
Bi-BCWT ニューラルネットワークモジュールは、時間列法 MST を置き換えるように設計されている。
ECoGは2次元電極アレイを用いて取得され、新たに設計された2次元空間時間特徴エンコーダは2次元空間特徴をよりよく抽出することができる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 05:32:03 GMT)
Bell and Mermin inequalities in Quantum Field Theory from vacuum projectors and Weyl operators [0.0] 我々はミンコフスキー時空における相対論的量子場論におけるエルミート双コトミック作用素の集合を構築する。
ベルとメルミンの不等式は数値的な設定によって研究される。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:04:09 GMT)
Assessing the impact of external factors on the occurrence of emergencies [0.0] 本研究では, 気象, 道路交通条件, 空気質, 時間など19の外部要因が緊急事態発生に及ぼす影響について検討した。
その結果,1日の時間と相関パラメータが,緊急事態発生に重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 16:19:59 GMT)
Analysis of exciton-polariton condensation under different pumping schemes for 1D and 2D microcavities including the effect of strong correlation between polaritons [0.0] 有限差分法と4次ルンゲ・クッタ法によるエキシトン・ポラリトン凝縮をシミュレートする。
これはコヒーレント、近共振ポンピング、同質、非コヒーレント、非共鳴ポンピングのために行われる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:05:01 GMT)
Analogue Forecast System for Daily Precipitation Prediction Using Autoencoder Feature Extraction: Application in Hong Kong [0.0] 深層学習方式のオートエンコーダを用いて拡張AFSを開発した。
ECMWFリアナリシス(ERA5)の第5世代のデータセットが利用される。
強化されたAFSは、既存のAFSよりも一貫性があり、優れた性能を示している。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:26:01 GMT)
An Open-source Sim2Real Approach for Sensor-independent Robot Navigation in a Grid [0.0] シミュレーション環境で訓練されたエージェントと、同様の環境でロボットをナビゲートする実際の実装とのギャップを橋渡しする。
具体的には、Gymnasium Frozen Lakeにインスパイアされた現実世界のグリッドのような環境で四足歩行ロボットをナビゲートすることに焦点を当てる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 18:21:47 GMT)
Aligning Graphical and Functional Causal Abstractions [0.0] 因果抽象化により、異なるレベルの粒度の因果モデルを関連付けることができる。
モデルが原因と効果に一致するように、因果的抽象化のフレームワークは一貫性の概念を定義します。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:07:18 GMT)
Advancing the Biological Plausibility and Efficacy of Hebbian Convolutional Neural Networks [0.0] 本稿では,画像処理のための畳み込みニューラルネットワーク(CNN)へのヘビアン学習の統合について述べる。
ヘビアン学習は、局所的な教師なしの神経情報に基づいて特徴表現を形成する。
その結果, より複雑で抽象的な受容領域を通じて, まばらな階層的学習の兆候が明らかとなった。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:29:37 GMT)
Active Inference for Self-Organizing Multi-LLM Systems: A Bayesian Thermodynamic Approach to Adaptation [0.0] 本稿では,大規模言語モデル(LLM)とアクティブ推論を統合し,適応型言語エージェントを作成するための新しいアプローチを提案する。
本フレームワークは,3つの状態要因(確率,探索,情報状態)を用いて環境をモデル化する。
実験により、エージェントが環境力学の正確なモデルを開発することにより、このアプローチの有効性が示された。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 21:24:40 GMT)
Ab initio calculations of erbium crystal field splittings in oxide hosts [0.0] エルビウム (Er3+) イオンの結晶場係数を計算するための有効なab initio法を提案する。
次に、これらのEr3+イオンの結晶界分裂を基底状態および励起状態に対して評価する。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:30:08 GMT)
Ab initio calculations of erbium crystal field splittings in oxide hosts: role of the 4f radial wave function [0.0] 絶縁ホストにおける希土類原子の結晶場係数(CFC)を簡易かつ効果的に計算する方法を開発した。
本稿では, MgO, TiO$$, CaWO$_4$, PbWO$_4$の広帯域ギャップ酸化物ホストにおけるErに着目した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 19:36:31 GMT)
A new solution and concrete implementation steps for Artificial General Intelligence [0.0] 本稿では,自己認識型汎用人工知能の構築に向けた新しいアプローチを提案する。
本稿では,真の汎用人工知能を段階的に構築する方法について述べる。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 14:31:39 GMT)
A Stable Measure for Conditional Periodicity of Time Series using Persistent Homology [0.0] 一対の時系列を与えられた場合、一方の周期性が他方の周期性にどのように影響するかを研究する。
我々は、別のf2が与えられた1つの時系列 f1 の周期性を定量化する条件付き周期スコア(f1|f2)を提案する。
我々は、我々の類似度尺度を、最も類似の統計測度であるクロスレカレンスと実験的に比較した。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 07:32:16 GMT)
A Bound on the Maximal Marginal Degrees of Freedom [0.0] 本稿では,カーネルリッジ回帰に対する低階近似とサロゲートについて述べる。
我々は,最も一般的な低ランク手法であるNystr"om法(英語版)の計算コストが,サンプルサイズにおいてほぼ線形であることを実証した。
この結果は、関連する積分作用素の範囲の要素による基本核関数の近似の徹底的な理論的解析に基づいている。
論文参考訳(メタデータ) (Mon, 06 Jan 2025 12:33:24 GMT)