MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct [148.4] 我々は,新しいマルチモーダル命令データ進化フレームワークであるMMEvolを提案する。
MMEvolは、きめ細かい知覚、認知的推論、相互作用の進化の洗練された組み合わせによって、データ品質を反復的に改善する。
提案手法は,9つのタスクにおいて,最先端モデルに比べて有意に少ない精度でSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:46:47 GMT)
InceptionNeXt: When Inception Meets ConvNeXt [147.5] IncepitonNeXtと呼ばれる一連のネットワークを構築し、高いスループットを享受するだけでなく、競争性能も維持しています。
InceptionNeXtはConvNeXt-Tよりも1.6倍高いトレーニングスループットを実現し、ImageNet-1Kでは0.2%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:37:02 GMT)
OVGaussian: Generalizable 3D Gaussian Segmentation with Open Vocabularies [112.8] textbfOVGaussianは3D textbfGaussian表現に基づいた、一般化可能なtextbfOpen-textbfVocabulary 3Dセマンティックセマンティックセグメンテーションフレームワークである。
まず,3DGSをベースとした大規模3Dシーンデータセット(textbfSegGaussian)を構築し,ガウス点とマルチビュー画像の両方に対して詳細なセマンティックおよびインスタンスアノテーションを提供する。
シーン間のセマンティック・一般化を促進するために,ジェネリック・セマンティック・ラスタライゼーション(GSR)を導入する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:55:35 GMT)
Physically Compatible 3D Object Modeling from a Single Image [110.0] 単一画像を3次元物理オブジェクトに変換するフレームワークを提案する。
我々のフレームワークは、リコンストラクションプロセスに物理的な互換性を組み込む。
既存の手法よりも3Dモデルの物理的リアリズムを一貫して強化する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:32:55 GMT)
PanoSLAM: Panoptic 3D Scene Reconstruction via Gaussian SLAM [105.0] PanoSLAMは、幾何学的再構成、3Dセマンティックセマンティックセマンティクス、3Dインスタンスセマンティクスを統合フレームワークに統合する最初のSLAMシステムである。
初めて、RGB-Dビデオから直接、オープンワールド環境のパノプティカル3D再構成を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:58:10 GMT)
Enhancing LLM Reasoning with Reward-guided Tree Search [95.1] o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:38:12 GMT)
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks [89.2] VisionLLM v2は、エンドツーエンドの汎用マルチモーダル大モデル(MLLM)である。
単一のフレームワーク内で視覚的知覚、理解、生成を統一する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:35:05 GMT)
Retrieval-Augmented Generation with Graphs (GraphRAG) [84.3] Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:59:35 GMT)
MLLM-as-a-Judge for Image Safety without Human Labeling [81.2] AIGCの時代には、多くの画像生成モデルは有害なコンテンツを生成できる。
確立された安全ルールに基づいて、このような安全でない画像を特定することが不可欠である。
既存のアプローチでは、人間のラベル付きデータセットを使った微調整MLLMが一般的である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:06:04 GMT)
VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM [81.2] ビデオ大言語モデル (Video Large Language Models, ビデオLLM) は近年, 一般的なビデオ理解において顕著な能力を示した。
しかし、それらは主に全体論的理解に焦点を当て、きめ細かい空間的・時間的詳細を捉えるのに苦労している。
我々は,高精細度空間時間映像理解のためのビデオLLMを実現するために,VideoRefer Suiteを導入した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:56:46 GMT)
Mulberry: Empowering MLLM with o1-like Reasoning and Reflection via Collective Monte Carlo Tree Search [74.5] 効率的な推論パス探索と学習のための集合モンテカルロ木探索(CoMCTS)を提案する。
我々はMulberry-260kを構築する。Mulberry-260kはマルチモーダルなデータセットで、各質問に対してリッチで明示的で明確に定義された推論ノードのツリーを持つ。
我々は、o1のようなステップバイステップ推論とリフレクション機能を備えたMLLMの一連のモデルであるMulberryを訓練するために、集合SFTを実行する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:41:30 GMT)
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning [72.6] テキスト認識のための大規模バイリンガルテキスト中心ベンチマークであるOCRBench v2を紹介する。
その結果,22 LMM中20 LMMは50点未満(合計100点)で,5種類の制限があることがわかった。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:32:35 GMT)
Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.1] 低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる新しいMambaスキャニング機構を提案する。
また,Retinex の先行したRetinex Decomposition Module (RDM) も提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:53:38 GMT)
Exposing Limitations of Language Model Agents in Sequential-Task Compositions on the Web [69.7] 言語モデルエージェント(LMA)は、ミューティステップ決定タスクにおける有望なパラダイムとして登場した。
約束にもかかわらず、現実世界のアプリケーションでの彼らのパフォーマンスはまだ過小評価されている。
既存のLMAはベースタスクで平均94.0%の成功率を達成したが、その性能は構成タスクで平均24.9%に低下した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:24:16 GMT)
Re-evaluating Automatic LLM System Ranking for Alignment with Human Preference [63.0] 自動評価フレームワークは、人間の嗜好との整合性に基づいてLLMをランク付けすることを目的としている。
自動LLMベンチラは、入力セット、評価モデル、評価タイプ、集約方法の4つのコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:46:51 GMT)
GFlow: Recovering 4D World from Monocular Video [58.6] GFlowは、空間と時間の3Dガウスのフローとして、4Dシーンにビデオを持ち上げるフレームワークである。
GFlowはビデオを静止部分と可動部分に分割し、最適化されたカメラポーズと3Dガウス点のダイナミックスを交互に切り替える。
GFlowは、フレームごとにカメラのポーズを推定し、カメラのポーズを変更することによって、新しいビューの合成を可能にする。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:05:28 GMT)
AI Flow at the Network Edge [58.3] AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:52:47 GMT)
Understanding and Mitigating Bottlenecks of State Space Models through the Lens of Recency and Over-smoothing [56.7] 構造化状態空間モデル (Structured State Space Models, SSMs) は, 強い相対バイアスによって本質的に制限されていることを示す。
このバイアスにより、モデルが遠方の情報を思い出す能力が損なわれ、堅牢性の問題がもたらされる。
本研究では, 状態遷移行列の2つのチャネルをSSMで分極し, それぞれ0と1に設定し, 電流バイアスと過平滑化に同時に対処することを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:06:39 GMT)
Zero-Shot Strategies for Length-Controllable Summarization [56.2] 大規模言語モデル(LLM)は、特にゼロショット設定において、正確な長さ制御に苦しむ。
本研究では, LLMの長さ制御能力を複数の尺度で評価し, 制御性向上のための実用的手法を提案する。
LLaMA 3 を用いて行った実験では,測定値間の長さの密着性の違いが明らかになり,モデル固有のバイアスが強調された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:53:27 GMT)
DreamDrive: Generative 4D Scene Modeling from Street View Images [55.5] 生成と再構成の利点を組み合わせた4次元時空間シーン生成手法であるDreamDriveを提案する。
具体的には,映像拡散モデルの生成力を利用して,映像参照のシーケンスを合成する。
次に、ガウシアンスプラッティングで3D一貫性のあるドライビングビデオをレンダリングします。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:59:57 GMT)
Can Large Audio-Language Models Truly Hear? Tackling Hallucinations with Multi-Task Assessment and Stepwise Audio Reasoning [55.2] 大規模な音声言語モデル (LALM) は、音声および音声情報の理解と推論に優れた能力を示している。
これらのモデルは、既存の音のイベントを幻覚させ、音のイベントの順序を誤認し、誤って音源を帰属させるなど、依然として課題に直面している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:35:31 GMT)
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion [55.0] 投機的復号化は,大規模言語モデル推論を高速化する手法として広く採用されている。
本稿では,離散拡散モデルを用いてドラフトシーケンスを生成する投機的復号法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:10:29 GMT)
Cognitive Kernel: An Open-source Agent System towards Generalist Autopilots [54.6] 我々は,ジェネラリストオートパイロットの目標に向けて,オープンソースのエージェントシステムであるCognitive Kernelを紹介する。
主にユーザーに依存して必要な状態情報を提供する自動操縦システムとは異なり、自動操縦システムは独立してタスクを完了しなければならない。
これを実現するために、自動操縦システムでは、ユーザの意図を理解し、様々な現実世界の情報源から必要な情報を積極的に収集し、賢明な判断をする必要がある。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:02:33 GMT)
New keypoint-based approach for recognising British Sign Language (BSL) from sequences [53.4] 本稿では,イギリス手話(BSL)単語を連続署名シーケンス内で認識するキーポイントに基づく新しい分類モデルを提案する。
我々のモデルの性能はBOBSLデータセットを用いて評価され、キーポイントベースのアプローチが計算効率とメモリ使用量においてRGBベースのアプローチを上回ることが判明した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:58:09 GMT)
Grade Inflation in Generative Models [53.2] その結果,合成データの2次元分布と地絡データの2次元分布を比較することで,より優れた結果が得られることがわかった。
我々は、すべてのデータポイントを等しく評価するスコアも、これらと同様に、グレードインフレーションを示すことを提案する。
等密度スコアと負の次数R'enyiエントロピーの関連を同定する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:34:54 GMT)
String commitment from unstructured noisy channels [53.0] ノイズの多いチャネルは暗号にとって貴重なリソースであり、ビットコミットメントや暗黙の転送のようなプリミティブを可能にする。
本稿では,完全かつ隠れ,結合可能なチャネルに対する文字列コミットメントプロトコルを提案し,その達成可能なコミットメント率を導出する。
コミットメント率は、逆チャネルが正直な場合と同じ二進対称チャネルである場合の以前の結果と一致する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:28:05 GMT)
Extract Information from Hybrid Long Documents Leveraging LLMs: A Framework and Dataset [52.3] 大規模言語モデル(LLM)は、テキストと表のデータを含むハイブリッドテキストを理解し解析することができる。
本研究では,LLMがHLD(Hybrid Long Document)を処理できるようにするための自動情報抽出フレームワーク(AIE)を提案し,HLDからの情報抽出の4つの重要な側面を分析する実験を行った。
HLDにおけるデータセット不足の問題に対処し、今後の作業を支援するために、金融レポート数値抽出(FINE)データセットを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:11:03 GMT)
RealCustom++: Representing Images as Real-Word for Real-Time Customization [52.0] テキスト・ツー・イメージのカスタマイズは、テキストのセマンティクスと主題の外観の両方に合わせた新しいイメージを合成することを目的としている。
既存の作品は擬単語のパラダイムに従っており、特定の主題を擬単語として表現する。
そこで我々はRealCustom++と呼ばれる新しいリアルワードパラダイムを提案し,その代わりに課題を非コンフリクトなリアルワードとして表現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:44:42 GMT)
Probing Visual Language Priors in VLMs [51.0] このベンチマークでは、各質問に3つの潜在的な答えと3つの対応するイメージをペアリングする。
画像生成モデルを活用することで、テクスチャ、形状、概念の組み合わせ、幻覚要素、および証明に基づく文脈において、大きな変化が保証される。
モデルが新たなVQAペアと画像を生成し、ピクセルレベルとセマンティックな汚職を適用して、自己学習のための「良いバッド」イメージペアを生成する自己改善フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:54:29 GMT)
Knowledge-aware equation discovery with automated background knowledge extraction [50.8] 本稿では,未知の方程式を自動的あるいは手動で抽出した背景知識を用いて発見するアルゴリズムについて述べる。
このようにして、任意の方程式形式を得る可能性を維持しながら、専門的に選択された用語を模倣する。
本稿では,知識の抽出と利用により,探索安定性とロバスト性の観点からSINDyアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:51:31 GMT)
Analogue black string in a quantum harmonic oscillator [49.2] 我々は、電荷のない静的黒弦の背景にクライン=ゴルドン方程式の正確な解を記述する。
固有値問題は粒子に複雑なエネルギー値を与え、これは準正規モードの存在を示す可能性がある。
我々は、黒弦の背景にある粒子を模倣できる単純な量子系を示し、その解は、双畳み関数の応用でもある。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:03:57 GMT)
A Novel Convolution and Attention Mechanism-based Model for 6D Object Pose Estimation [49.2] RGB画像から6Dオブジェクトのポーズを推定することは、深度情報の欠如が2次元投影から3次元構造を推定する必要があるため困難である。
従来の手法はグリッドベースのデータ構造によるディープラーニングに頼っていることが多いが、抽出された機能間の複雑な依存関係を捉えるのに苦労している。
本稿では,各画素の時間的特徴がノードとして機能し,それらの関係はノード接続や空間的相互作用を通じて定義される,画像から直接のグラフベース表現を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:47:54 GMT)
Differentiable Prompt Learning for Vision Language Models [49.1] 本稿では,DPL(di differentiable prompt learning)という,識別可能なプロンプト学習手法を提案する。
DPLは最適化問題として定式化され、各層に追加するプロンプトの最適コンテキスト長を自動的に決定する。
DPL法は,限られたデータのみを用いることで,信頼性の高い深い連続的なプロンプト構成を実現できることを実証的に見出した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:13:28 GMT)
STORM: Spatio-Temporal Reconstruction Model for Large-Scale Outdoor Scenes [47.5] STORMは、スパース観測から動的屋外シーンを再構成するために設計された時間的再構成モデルである。
本稿では,STORMが最先端のシーンごとの最適化手法を超越して,正確な動的シーン再構成を実現することを示す。
また、より広いダイナミックなシーン理解のための自己教師あり学習の可能性を示す4つのモデル応用についても紹介する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:59:58 GMT)
Passive Non-Line-of-Sight Imaging with Light Transport Modulation [46.0] 一つのネットワークで複数の光輸送条件を効果的に処理する新しい受動NLOSイメージング法であるNLOS-LTMを提案する。
我々は、投影画像から潜在光輸送表現を推測し、この表現を用いて、投影画像から隠されたイメージを再構成するネットワークを変調する。
大規模受動的NLOSデータセットの実験により,提案手法の優位性を実証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:12:26 GMT)
Training Neural Networks on Data Sources with Unknown Reliability [45.9] 教師あり学習では、ソースの推定信頼性に比例した多くのステップで、各データソース上でニューラルネットワークをトレーニングすることを目指している。
このようにして、ウォームアップ中のすべてのソースでのトレーニングを可能にし、最終トレーニング段階で信頼性の低いソースでの学習を削減します。
信頼性のあるデータソースと信頼性の低いデータソースを混在させることで,モデル性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:19:55 GMT)
CancerKG.ORG A Web-scale, Interactive, Verifiable Knowledge Graph-LLM Hybrid for Assisting with Optimal Cancer Treatment and Care [45.8] 最初のWebスケールハイブリッド知識グラフ(KG)-大規模言語モデル(LLM)について述べる。
CancerKGは、大腸癌に関する最新の査読された医療知識に富んでいる。
私たちのハイブリッドは、LCM、KG、サーチエンジンを単独で使用することよりも、ユーザのニーズに応えているため、目覚ましいものです。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:19:16 GMT)
Fairness in Reinforcement Learning with Bisimulation Metrics [45.7] 公平さを考慮せずに報酬を最大化することにより、AIエージェントはグループや個人の扱いに格差を導入することができる。
そこで本研究では,バイシミュレーションのメトリクスを利用して報酬関数と観測ダイナミクスを学習する手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:55:25 GMT)
Temporal Information Reconstruction and Non-Aligned Residual in Spiking Neural Networks for Speech Classification [45.3] スパイキングニューラルネットワーク(SNN)に基づくほとんどのモデルは、音声分類問題に対処するために、同じレベルの時間分解のみを使用する。
本稿では,人間の脳の階層的処理プロセスを参照して,時間的再構成(TR)と呼ばれる新しい手法を提案する。
また, 音声データを解析し, 残差接続を異なる時間長の2つの音声データに利用できるようにするNon-Aligned Residual (NAR)法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:52:40 GMT)
Have We Designed Generalizable Structural Knowledge Promptings? Systematic Evaluation and Rethinking [44.7] 本稿では,SKPパラダイムの一般化能力について,グラニュラリティ,トランスファービリティ,スケーラビリティ,普遍性という4つの視点から評価・再考することを目的とする。
我々は、粒度と難易度が異なる9つのタスクからなる、SUBARUと呼ばれる新しいマルチグラニュラー・マルチレベルベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:20:22 GMT)
LLM-Rubric: A Multidimensional, Calibrated Approach to Automated Evaluation of Natural Language Texts [44.4] 本稿では,自然言語テキストの自動評価のためのフレームワークを提案する。
大規模言語モデル (LLM) は各ルーブリックな質問によって促され、潜在的な応答に対する分布を生成する。
LLMの予測は、人間の判断とうまく一致しないことが多い。
LLM-Rubricは、判断特化パラメータと判断非依存パラメータの両方を含む小さなフィードフォワードニューラルネットワークをトレーニングすることで、これを達成している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:57:01 GMT)
Towards Precise Scaling Laws for Video Diffusion Transformers [43.7] ビデオ拡散変換器のスケーリング法則を解析し,任意のモデルサイズと計算予算に対して新しいスケーリング法則を提案する。
これらの最適設定の下では、従来のスケーリング手法と比較して、同等のパフォーマンスを実現し、推論コストを40.1%削減する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:25:39 GMT)
Federated Dropout: Convergence Analysis and Resource Allocation [43.5] Federated Dropoutは、フェデレートされた学習をネットワークエッジにデプロイする際のコミュニケーションとボトルネックの両方を克服する効率的なテクニックである。
フェデレート・ドロップアウトの理論収束分析はまだ文献に欠けている。
全てのラウンドにおける損失関数を最小化するために、ドロップアウト率と帯域幅割り当てを協調的に最適化する低複雑さアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:24:15 GMT)
VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling [43.5] 本稿では,高忠実度表現のための階層型ビジュアルトークン圧縮(HiCo)手法を提案する。
HiCoは、長いビデオにおける視覚情報の冗長性を利用して、クリップレベルからビデオレベルまで、長いビデオコンテキストを圧縮する。
VideoChat-Flashは、7Bモデルスケールで、メインストリームとショートビデオベンチマークの両方で主要なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:01:23 GMT)
Proactive Conversational Agents with Inner Thoughts [42.3] 会話型AIにおける長年の願望の1つは、会話において自律的にイニシアティブ、すなわち積極的に行動できるようにすることである。
以前のNLP研究は、主に前の会話のような文脈から次の話者を予測することに焦点を当てていた。
我々は、人間と同じように、単にターンテイクの手がかりに反応するのではなく、プロアクティブなAIが会話中に自身の内的思考を定式化し、貢献する適切な瞬間を求めることを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:41:56 GMT)
Low-Rank Adaptation for Foundation Models: A Comprehensive Review [42.2] Low-Rank Adaptation (LoRA)は、これらの課題を緩和するための非常に有望なアプローチとして登場した。
この調査は、大規模な言語モデルから一般的な基礎モデルまで、LoRAテクニックの包括的なレビューを初めて提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:38:55 GMT)
Self-Supervised Likelihood Estimation with Energy Guidance for Anomaly Segmentation in Urban Scenes [40.6] 我々は、異常セグメンテーションのためのエネルギー誘導型自己教師型フレームワークを設計する。
我々は、セグメンテーションタスクの強い文脈依存の性質を利用する。
提案手法に基づいて,適応型自己教師型トレーニングフレームワークを考案した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:03:02 GMT)
Heterogeneous Multi-agent Zero-Shot Coordination by Coevolution [39.5] 異種ゼロショットコーディネート(ZSC)問題を初めて検討した。
本稿では,3つのサブプロセス(ペアリング,更新,選択)を通じてエージェントとパートナーの2つの集団を共進化させる,共進化に基づく一般的な手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:52:01 GMT)
ICONS: Influence Consensus for Vision-Language Data Selection [39.5] 我々は、視覚言語データ選択のための勾配駆動型インフルエンス・コンセンサス・アプローチであるICONSを紹介する。
クロスタスク・インフルエンス・コンセンサス(英語版)は、複数のタスクで一貫して価値のあるサンプルを特定するために使用される。
実験により、選択したデータに基づいてトレーニングされたモデル(LLaVA-665Kの20%)が、完全なデータセットを使用して得られた相対的なパフォーマンスの98.6%を達成することが示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:33:38 GMT)
Lemur: Log Parsing with Entropy Sampling and Chain-of-Thought Merging [38.8] textbfEntropy サンプリングと Chain-of-Thought textbfMerging (Lemur) を用いた最先端 textbfLog 解析フレームワークを提案する。
本稿では,典型的なログを効率的にクラスタリングする情報エントロピーにインスパイアされた新しいサンプリング手法を提案する。
Lemurは最先端のパフォーマンスと素晴らしい効率を実現している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:14:51 GMT)
Mixture of Link Predictors on Graphs [38.4] リンク予測は、グラフ内の見えない接続を予測することを目的としている。
様々なペアの測度を利用するヒューリスティック手法は、しばしばバニラグラフニューラルネットワーク(GNN)の性能に匹敵する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:57:58 GMT)
Implicit Steganography Beyond the Constraints of Modality [38.2] クロスモーダルステガノグラフィーは、あるモダリティの秘密情報を他のモダリティに隠蔽する。
Inlicit Neural Representations (INR) に基づく革新的なクロスモーダルステガノグラフィーフレームワーク INRSteg を提案する。
本稿では,複数のデータを隠蔽し,画像,オーディオ,ビデオ,3次元形状を横断的に共有することのできる,マスク付きパラメータ更新による新しいネットワーク割当フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:18:37 GMT)
Calibrating Bayesian Learning via Regularization, Confidence Minimization, and Selective Inference [37.8] 適切に校正されたAIモデルは、その精度を分布内入力(ID)に正しく報告し、また、分布外入力(OOD)の検出を可能にする必要がある。
本稿では、キャリブレーション正則化を統合した変分推論(VI)に基づくベイズ学習の拡張を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:02:54 GMT)
Token Pruning for Caching Better: 9 Times Acceleration on Stable Diffusion for Free [36.9] 本稿では,機能キャッシングの限界に対処する動的トークンプルーニング(DaTo)アプローチを提案する。
DaToは、フィーチャーキャッシングとトークンプルーニングをトレーニング不要な方法で組み合わせて、時間的およびトークン的な情報の再利用を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:56:40 GMT)
DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning [36.5] DIPPER: 原始許容階層型強化学習の高速化のための直接選好最適化について紹介する。
直接選好最適化を利用する効率的な階層的アプローチであり、より高度な政策を学ぶために、そして低レベルの政策を学ぶために強化学習を行う。
標準的な嗜好に基づくアプローチではなく、直接選好最適化を使用することで、計算効率の向上を享受している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:08:58 GMT)
SlerpFace: Face Template Protection via Spherical Linear Interpolation [35.7] 本稿では,事前保護の無効化が可能な拡散モデルを用いて,新たなプライバシ攻撃形態を特定する。
この攻撃は、テンプレートから高品質でアイデンティティを保存する顔画像を合成し、人の外観を明らかにする。
提案手法は,新しい顔テンプレート保護技術であるSlerpFaceとして実装されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:13:42 GMT)
Active Learning of General Halfspaces: Label Queries vs Membership Queries [35.4] アクティブな学習者は、$tildeOmega(d/(log(m)epsilon)$というラベルの複雑さを必要とする。
クエリ複雑性が$tildeO(min1/p, 1/epsilon + dcdot polylog (1/epsilon))$$O(opt)+epsilon$のエラー保証を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:40:48 GMT)
SynH2R: Synthesizing Hand-Object Motions for Learning Human-to-Robot Handovers [35.4] 視覚に基づく人間とロボットのハンドオーバは、人間とロボットのインタラクションにおいて重要かつ困難なタスクである。
本稿では,ロボットの訓練に適した人間のつかみ動作を生成するためのフレームワークを提案する。
これにより、以前の作業よりも100倍多くのオブジェクトで、総合的なトレーニングとテストデータを生成することができます。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:58:42 GMT)
Discovery of ST2 centers in natural and CVD diamond [34.8] ST2中心は、ダイヤモンドの光学的に対応可能な点欠陥である。
我々は、その基本的な光学特性をマップアウトし、電子レベル構造を明らかにし、本質的な遷移速度を定量化する。
この発見は、ST2中心がナノスケール量子センシングの候補として非常に有望であることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:54:29 GMT)
CNC: Cross-modal Normality Constraint for Unsupervised Multi-class Anomaly Detection [34.7] 本稿では,クラスに依存しない学習可能なプロンプトを利用して,デコードされた特徴を正規のテキスト表現へ導く手法を提案する。
本手法は,MVTec AD と VisA のデータセット上での競合性能を実現し,その性能を実証する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:43:44 GMT)
Paid with Models: Optimal Contract Design for Collaborative Machine Learning [33.1] コラボレーション機械学習(CML)は、参加者間のコスト共有を可能にすることによって、高度なテクノロジを民主化するための有望なパラダイムを提供する。
契約理論は、参加者が貢献に基づいて様々な精度のモデルに報酬を与えることで、実行可能な解決策を示す。
報酬とは違い、報酬としてモデルを使用することは、特に報酬の性質のために、ユニークな課題をもたらす。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:00:09 GMT)
Dual Diffusion for Unified Image Generation and Understanding [32.8] マルチモーダル理解と生成のための大規模かつ完全なエンドツーエンド拡散モデルを提案する。
我々は、画像とテキストの条件付き確率を同時にトレーニングするクロスモーダル最大推定フレームワークを活用する。
我々のモデルは、最近の統合画像理解・生成モデルと比較して、競争性能が向上した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:49:00 GMT)
SSL Framework for Causal Inconsistency between Structures and Representations [31.9] 因果発見と深層学習の相互補間は、ますます広範囲にわたる相互作用を引き起こしている。
不確定データは、因果構造によって表現される因果関係と、深層学習モデルによって生成される因果表現との間に矛盾がある。
因果不整合を軽減するために,介入に基づく自己教師型学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:55:29 GMT)
TinyHelen's First Curriculum: Training and Evaluating Tiny Language Models in a Simpler Language Environment [30.9] トレーニング言語モデル(LM)とそのアプリケーションエージェントは、大規模なデータセットとモデルのために、ますますコストがかかる。
ノイズを排除し、語彙を最小化し、ジャンル固有のパターンを維持することで、テキストデータを洗練するためのパイプラインを提案する。
実験により,ランダー事前学習がLM学習効率を向上させることが示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:08:15 GMT)
GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution [30.2] リモートセンシング画像(RSI)にRWKV(Receptance Weighted Key Value)を導入する。
本稿では,RWKVと畳み込み操作を並列化してSR再構成を行うGDSRを提案する。
さらに,画像中の高頻度の詳細情報を効果的にキャプチャし,特にディテール再構成におけるSRの視覚的品質を向上させる損失関数であるWavelet Lossを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:43:19 GMT)
Towards Unraveling and Improving Generalization in World Models [29.5] この研究は、世界モデルの堅牢性と一般化能力を深く理解することを目的としている。
遅延表現誤差がロバスト性および一般化に与える影響を特徴付ける。
非ゼロドリフトの複合的誤り伝播効果を軽減するためのヤコビ正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:15:43 GMT)
Improving Text-based Person Search via Part-level Cross-modal Correspondence [29.3] 粗大な埋め込みベクトルを抽出する効率的なエンコーダデコーダモデルを提案する。
また、個人IDのみを監督として、きめ細かい情報を捉えることを学ぶという課題もある。
本稿では,各部位の共通度を定量化する,共通性に基づく新たなランキング損失を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:29:50 GMT)
Generalizing Trust: Weak-to-Strong Trustworthiness in Language Models [29.1] より弱いモデルの出力を微調整した場合に、より強いモデルが信頼性特性を継承できるかどうかを検討する。
我々の研究は、弱強一般化の可能性と限界に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:40:02 GMT)
HumanEval Pro and MBPP Pro: Evaluating Large Language Models on Self-invoking Code Generation [28.3] LLMの進行的推論と問題解決能力を評価するための新しいタスクである自己呼び出しコード生成を導入する。
ほとんどのLLMは、HumanEvalやMBPPといった従来のコード生成ベンチマークで優れているが、自己呼び出しタスクのパフォーマンスは低下している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:20:42 GMT)
Fast Gradient Computation for RoPE Attention in Almost Linear Time [27.3] 我々は,RoPEに基づく有界エントリ下での逆方向の計算のための,最初のニアリニア時間アルゴリズムを開発した。
我々のアプローチは、高速なRoPEアテンション計算の最近の進歩に基づいている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:53:40 GMT)
SepsisCalc: Integrating Clinical Calculators into Early Sepsis Prediction via Dynamic Temporal Graph Construction [27.0] セプシス(Sepsis)は、感染症に対する免疫反応の低下によって引き起こされる臓器機能障害である。
臨床電卓は臨床医のワークフローにおける敗血症の同定において重要な役割を担っている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:02:07 GMT)
Echoes in AI: Quantifying Lack of Plot Diversity in LLM Outputs [26.7] 物語生成における2つの最先端の大規模言語モデル (LLM) について検討する。
LLM生成したストーリーは、しばしば数世代にわたって反響するプロット要素で構成されている。
これはプロット要素が代替ストーリーラインに現れる確率を推定するものである。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:54:48 GMT)
Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents [26.6] マルチパス推論(Multi-Path Reasoning:RR-MP)フレームワークを用いたリアクティブおよびリフレクションエージェントを提案する。
提案手法は,マルチパス推論機構を用いて科学的推論精度を向上させる。
道徳的シナリオ,大学レベルの物理,数学に関わる課題について,ゼロショットと少数ショットの評価を行った。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:11:20 GMT)
Rethinking Layer Removal: Preserving Critical Components with Task-Aware Singular Value Decomposition [26.5] Taco-SVDはタスククリティカルな特異値方向を保持するタスク認識フレームワークである。
勾配に基づく帰属法を利用して、Taco-SVDは特異値を下流タスクの目的と整合させる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:22:21 GMT)
Exploring the Implicit Semantic Ability of Multimodal Large Language Models: A Pilot Study on Entity Set Expansion [26.5] マルチモーダル大言語モデル(MLLM)を用いて,エンティティレベルの粒度の暗黙的な意味情報を理解する。
ローカルスコアをグローバルランキングにマッピングするリストワイズランキング手法であるLUSARを導入する。
我々のLUSARは、MESEタスクにおけるMLLMの性能を大幅に向上させ、ESEタスクに生成MLLMを初めて使用し、リストワイドランキングの適用性を高めた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:03:48 GMT)
LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing [26.3] 非整合知識のための学習インタラクション手法(リンク)を提案する。
リンクは、イベント予測中に入力を動的に調整することで、異なるモダリティのコントリビューションを均衡させる。
疑似ラベルの意味情報を事前知識として活用し、他のモーダルからノイズを緩和する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:39:42 GMT)
RAG-Instruct: Boosting LLMs with Diverse Retrieval-Augmented Instructions [26.0] RAG-Instructは、任意のソースコーパスに基づいて、多種多様な高品質なRAG命令データを合成する一般的な方法である。
我々はウィキペディアから40Kの命令データセットを構築し、多様なRAGシナリオとタスクを包括的にカバーする。
実験により、RAG-InstructはLLMのRAG能力を効果的に向上し、強力なゼロショット性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:00:51 GMT)
Efficient Relational Context Perception for Knowledge Graph Completion [25.9] 知識グラフ(KG)は知識の構造化された表現を提供するが、しばしば不完全性の課題に悩まされる。
従来の知識グラフ埋め込みモデルは、表現力のある特徴を捉える能力に制限がある。
逐次情報をモデル化し,動的文脈の学習を可能にする三重受容アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 11:25:58 GMT)
Efficient Large-Scale Traffic Forecasting with Transformers: A Spatial Data Management Perspective [25.5] 本稿では,大規模トラフィック予測のための空間依存性をモデル化するPatchSTGという新しいトランスフォーマーフレームワークを提案する。
具体的には,トランスフォーマーの動的計算に関わる点数を削減するために,新しい不規則な空間パッチを設計する。
4つの実世界の大規模トラフィックデータセットによる実験結果から、当社のPatchSTGは、最先端のパフォーマンスで、列車の速度とメモリ使用率の改善を最大10倍と4倍に向上することが示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:52:09 GMT)
Is Segment Anything Model 2 All You Need for Surgery Video Segmentation? A Systematic Evaluation [25.5] 本稿では,ゼロショット手術映像分割作業におけるSAM2モデルの性能を体系的に評価する。
我々は、異なるプロンプト戦略やロバスト性など、異なる構成で実験を行った。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:20:05 GMT)
Deeply Learned Robust Matrix Completion for Large-scale Low-rank Data Recovery [25.3] ロバストフィードクラウド補完(RMC)は、広く使われている機械学習ツールである。
同時に、低ランクデータ分析における2つの重要な問題に対処する。
本稿では,大規模RCC問題に対するロバスト行列学習(LRMC)を提案する。
LRMCの優れた経験的性能は、合成データセットと実際の応用に関する最先端技術に対する実験によって検証される。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:22:12 GMT)
Fine-grained Video-Text Retrieval: A New Benchmark and Method [25.3] FIBERは,FineActionデータセットから生成した1,000本のビデオを含むビデオ検索に,テキスト用の微細なbenchmarkである。
FIBERベンチマークでは,ビデオ毎の詳細な空間アノテーションと時間アノテーションが提供されている。
実験の結果,従来のベンチマークにおいて,ビデオ大言語(VLLE)はCLIPベースのモデルと相容れない性能を示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:53:50 GMT)
HUNYUANPROVER: A Scalable Data Synthesis Framework and Guided Tree Search for Automated Theorem Proving [25.2] Hunyuan Proverは、LEAN4で証明された対話型自動定理のためにHunyuan 7Bから微調整された言語モデルである。
これは、現在のSOTA結果である65.9%と比較して、ミニF2Fテストで68.4%のパスを達成している。
私たちは30kの合成インスタンスのデータセットをオープンソースとして公開します。各インスタンスには、自然言語における元の質問、自動形式化による変換されたステートメント、HunyuanProverによる証明が含まれています。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:48:14 GMT)
Chunk-Distilled Language Modeling [25.2] Chunk-Distilled Language Modeling (CD-LM)は、現在の大規模言語モデル(LLM)における2つの課題に対処するテキスト生成のアプローチである。
提案手法は,ディープネットワークベースのLCMと簡単な検索モジュールを組み合わせることで,単一のデコードステップでマルチトークンテキストチャンクを生成する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:32:15 GMT)
MADE: Graph Backdoor Defense with Masked Unlearning [25.0] グラフニューラルネットワーク(GNN)は、グラフ関連タスクの処理能力に優れていたため、研究者から大きな注目を集めている。
最近の研究では、GNNはトレーニングデータセットにトリガを注入することで実装されたバックドア攻撃に対して脆弱であることが示されている。
この脆弱性は、薬物発見のようなセンシティブなドメインにおけるGNNの応用に重大なセキュリティリスクをもたらす。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:11:04 GMT)
RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval [24.5] RetrievalAttentionは、注意計算を高速化し、GPUメモリ消費を減らすためのトレーニング不要のアプローチである。
RetrievalAttentionは1-3%のデータのみを必要としながら、ほぼ全注意精度を達成できることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:11:00 GMT)
Fast and Interpretable Mixed-Integer Linear Program Solving by Learning Model Reduction [24.3] 本稿では,MILPの縮小モデルと等価モデルを中間段階として学習することを目的とする。
縮小モデルはしばしば解釈可能な操作に対応しており、既存の商用解法よりもはるかに高速に大規模MILP問題を解くことができる。
本稿では,モデル縮小学習タスクの性能向上に寄与する嗜好情報を捕捉し,表現するための注意機構を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:50:42 GMT)
Unbiased GNN Learning via Fairness-Aware Subgraph Diffusion [23.6] 本稿では,非バイアスGNN学習のための新しい生成型ニューラルフェアネス・アウェア・サブグラフ(FASD)手法を提案する。
FASDは,デバイアス付きサブグラフ上で標準GNN学習を行うことにより,入力グラフ上で公正なノード予測を誘導することを示す。
実験により,提案手法は最先端のFair GNNベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:48:30 GMT)
SecBench: A Comprehensive Multi-Dimensional Benchmarking Dataset for LLMs in Cybersecurity [23.3] SecBenchは、サイバーセキュリティドメインの大規模言語モデル(LLM)を評価するために設計されたベンチマークデータセットである。
このデータセットは、オープンソースから高品質なデータを収集し、サイバーセキュリティ質問設計コンテストを組織することで構築された。
13個のSOTA LLMのベンチマーク結果はSecBenchのユーザビリティを示している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:43:12 GMT)
S-Diff: An Anisotropic Diffusion Model for Collaborative Filtering in Spectral Domain [23.2] グラフに基づく協調フィルタリングにインスパイアされたS-Diffを提案する。
S-Diffは、ユーザの相互作用ベクトルをスペクトル領域にマッピングし、拡散ノイズをパラメータ化してグラフ周波数に合わせる。
この異方性拡散は重要な低周波成分を保持し、高い信号対雑音比を保持する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:54:41 GMT)
MCP-Solver: Integrating Language Models with Constraint Programming Systems [23.2] MCP-r は Model Context Protocol のプロトタイプ実装である。
これは、大規模言語モデルと制約システムの間の体系的な統合の可能性を示している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:49:27 GMT)
FovealNet: Advancing AI-Driven Gaze Tracking Solutions for Optimized Foveated Rendering System Performance in Virtual Reality [23.2] 本稿では,システム性能の最適化を目的とした高度なAI駆動型視線追跡フレームワークである textitFovealNet を紹介する。
FovealNetは、以前の方法に比べて少なくとも$1.42タイムのスピードアップを実現し、ファーベイドアウトプットの知覚品質は13%向上した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:43:37 GMT)
UIBDiffusion: Universal Imperceptible Backdoor Attack for Diffusion Models [23.1] 拡散モデル(DM)はバックドア攻撃に対して脆弱である。
DMに対する汎用的非受容バックドアアタックであるUIBDiffusionを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:07:06 GMT)
Geometry Matters: Benchmarking Scientific ML Approaches for Flow Prediction around Complex Geometries [23.1] 複雑な地形周辺の流体力学の迅速かつ正確なシミュレーションは、様々な工学的・科学的応用において重要である。
科学機械学習(SciML)は将来性を示しているが、ほとんどの研究は単純な測地に制約されている。
本研究では,複雑な地形上の流動予測のための多様なSciMLモデルをベンチマークすることで,このギャップを解消する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:23:15 GMT)
Dual Degradation-Inspired Deep Unfolding Network for Low-Light Image Enhancement [23.0] 低照度画像強調のためのDual degrAdation-inSpired Deep Unfolding Network(DASUNet)を提案する。
輝度空間と色空間の間の劣化特異性を考慮することによって、2つの異なる画像先行性を学ぶ。
2つの空間における異なる特異性に基づいて、異なる先行をモデル化する2つのカスタマイズされたトランスフォーマーブロックを設計する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:16:56 GMT)
Online Video Understanding: A Comprehensive Benchmark and Memory-Augmented Method [22.8] マルチモーダル大言語モデルはオフラインビデオ理解において大きな進歩を見せている。
これらのモデルを自律運転や人間とコンピュータのインタラクションといった現実のシナリオに適用することは、ユニークな課題を提示します。
本稿では,評価ベンチマーク,モデルアーキテクチャ,トレーニング戦略の3つの観点から,体系的な取り組みについて述べる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:17:05 GMT)
Loss-Aware Curriculum Learning for Chinese Grammatical Error Correction [21.8] 中国語の文法的誤り訂正(CGEC)は、入力された中国語文の誤りを検出し、訂正することを目的としている。
現在のアプローチでは、修正の難しさはインスタンスによって異なり、これらのサンプルを等しく扱うことは無視されている。
この問題に対処する多粒度カリキュラム学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:11:49 GMT)
Embodied VideoAgent: Persistent Memory from Egocentric Videos and Embodied Sensors Enables Dynamic Scene Understanding [21.6] Embodied VideoAgentは、エゴセントリックビデオとエンボディインプットの両方からシーンメモリを構築する。
我々は,ロボット操作において,具体的相互作用の生成や知覚など,様々なAIタスクにおいてその可能性を実証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:22:38 GMT)
Analogue of collectively induced transparency in metamaterials [21.4] 集合的に誘導される透明性(CIT)は、キャビティ量子電気力学システムで既に提案されている。
本稿では,明るいモードと暗黒モードの干渉の結合を利用して,テラヘルツ(THz)メタマテリアルデバイスにおけるCITを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:30:13 GMT)
Outlier-Robust Training of Machine Learning Models [21.4] 本稿では,外部学習を用いた機械学習モデルの学習のための適応交替アルゴリズムを提案する。
アルゴリズムは、各重みを更新しながら、非ロバスト損失の重み付きバージョンを使用してモデルを反復的に訓練する。
任意の外接点(すなわち、外接点に分布的な仮定がない)を考えると、ロバストな損失核のシグマの使用は収束の領域を増大させる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:19:53 GMT)
SG-Splatting: Accelerating 3D Gaussian Splatting with Spherical Gaussians [21.0] 3Dガウススプラッティングは、新しい視点合成における最先端技術として登場しつつある。
しかし、色表現のための3次球面高調波への依存は、大きなストレージ要求と計算オーバーヘッドをもたらす。
SG-Splatting with Spherical Gaussian based color representation, a novel approach to enhance rendering speed and quality。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:31:52 GMT)
RuleExplorer: A Scalable Matrix Visualization for Understanding Tree Ensemble Classifiers [20.4] 本稿では,数万のルールを含む木アンサンブル分類法を説明するために,拡張性のある視覚解析手法を提案する。
我々は,これらのルールを階層レベルで優先順位付けするための,異常バイアスモデル削減手法を開発した。
本手法は,共通ルールと異常ルールの両方を深く理解し,包括性を犠牲にすることなく解釈性を向上させる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:51:59 GMT)
Titans: Learning to Memorize at Test Time [20.1] 歴史的文脈を記憶するために学習するニューラルな長期記憶モジュールを提案する。
このニューラルメモリは高速な推論を維持しつつ、高速な並列化可能なトレーニングの利点があることが示される。
我々は、Titansと呼ばれる新しいアーキテクチャのファミリーを紹介し、このアーキテクチャにメモリを効果的に組み込む方法に対処する3つのバリエーションを提示します。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:32:03 GMT)
DiC: Rethinking Conv3x3 Designs in Diffusion Models [19.9] 拡散モデルは視覚生成タスクにおいて例外的な性能を示した。
近年のモデルは、従来のU字型CNN-Attentionハイブリッド構造から、完全にトランスフォーマーベースの等方的アーキテクチャへと移行している。
3x3畳み込みを用いたスケールアップ純粋畳み込み拡散モデルを構築した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:00:01 GMT)
Local Flow Matching Generative Models [19.9] 局所フローマッチング(Local Flow Matching)は、フローベース生成モデルに基づく密度推定のための計算フレームワークである。
$textttLFM$はシミュレーション不要のスキームを採用し、フローマッチングサブモデルのシーケンスを漸進的に学習する。
FMと比較して, $textttLFM$ のトレーニング効率と競争的生成性能の改善を実証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:50:58 GMT)
Gaussian Building Mesh (GBM): Extract a Building's 3D Mesh with Google Earth and Gaussian Splatting [19.4] 最近リリースされたオープンソースの基礎画像セグメンテーションとオブジェクト検出モデル(SAM2+GroundingDINO)
私たちは、その名前、アドレス、地理的座標に基づいて、任意の建物の3Dメッシュを抽出するパイプラインを作成しました。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:53:27 GMT)
CJST: CTC Compressor based Joint Speech and Text Training for Decoder-Only ASR [19.4] CTC圧縮機は、オーディオエンコーダをデコーダのみのモデルに統合するための効果的なアプローチである。
本稿では,デコーダのみのASRのための新しいCTC圧縮器とテキスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:11:07 GMT)
LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models [18.7] 大規模言語モデル (LLM) は、医学的質問応答において重大な課題に直面している。
マルチエージェント医療質問応答システムに類似の事例生成を取り入れた新しい手法を提案する。
本手法は, モデル固有の医療知識と推論能力を活用し, 追加のトレーニングデータの必要性を解消する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:55:45 GMT)
Global Tensor Motion Planning [18.7] グローバルモーションプランニング(GTMP)は、テンソル操作のみを含むサンプリングベースのモーションプランニングアルゴリズムである。
ランダム多部グラフとして表現された新しい離散化構造を導入し,効率的なベクトル化サンプリングを実現する。
ライダースキャンされた占有マップとMotionBenchMarkerデータセットの実験は、バッチ計画におけるGTMPの計算効率を実証している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:05:58 GMT)
Towards Pattern-aware Data Augmentation for Temporal Knowledge Graph Completion [18.5] 本稿では、時間的知識グラフのための最初のデータ拡張戦略であるBoosterを紹介する。
本稿では,TKG内の三進的閉包に基づく階層的スコアリングアルゴリズムを提案する。
また、モデルが好むパターンから逸脱するサンプルを特定するための2段階のトレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:47:19 GMT)
Securing Cloud-Based Internet of Things: Challenges and Mitigations [18.4] IoT(Internet of Things)は近年顕著な進歩を遂げており、デジタルランドスケープのパラダイムシフトにつながっている。
IoTデバイスは本質的にインターネットに接続されており、様々なタイプの攻撃を受けやすい。
IoTサービスは、悪意のあるアクターや不正なサービスプロバイダによって悪用される可能性のある、機密性の高いユーザデータを扱うことが多い。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:24:50 GMT)
SoundBrush: Sound as a Brush for Visual Scene Editing [18.3] SoundBrushは、視覚シーンの編集と操作にサウンドをブラシとして使用するモデルである。
我々のフレームワークは3Dシーンを編集できるように拡張することができ、音駆動の3Dシーン操作を容易にする。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:53:45 GMT)
DecoratingFusion: A LiDAR-Camera Fusion Network with the Combination of Point-level and Feature-level Fusion [17.6] ライダーとカメラは自動運転において重要な役割を担い、3D検出のための補完的な情報を提供する。
最先端の融合法は機能レベルでそれらを統合するが、それらは主に点雲と画像の間の学習されたソフトな関連に依存している。
本稿では,キャリブレーション行列によって確立されたハードアソシエーションを用いて,特徴レベル融合と点レベル融合を結合する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:13:06 GMT)
Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.2] 学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:23:28 GMT)
On Parallel External-Memory Bidirectional Search [16.9] 本稿では,一方向および双方向のベストファースト検索アルゴリズムを統合するフレームワークを提案する。
次に、最先端双方向探索(BiHS)アルゴリズムBAE*(PEM-BAE*)のPEM版を開発する。
PEM-BAE* は A* の PEM 変種と MM アルゴリズム,および IDA* の並列変種より優れていることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:00:57 GMT)
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement [16.5] 本稿では,自動BLASオフロードのための新しいツールであるSCILIB-Accelを紹介する。
このツールはCPUバイナリから直接BLASシンボルをインターセプトし、コード修正や再コンパイルは不要である。
SCILIB-Accelは、最大数百のGPUノード上の複数の量子物理学符号を用いて評価され、有望なスピードアップをもたらす。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:24:30 GMT)
A Hybrid Quantum-Classical Autoencoder Framework for End-to-End Communication Systems [16.3] 我々は、パラメータ化量子回路と古典的ディープニューラルネットワーク(DNN)を組み合わせた、新しいハイブリッド量子古典型オートエンコーダアーキテクチャを導入する。
提案手法の有効性を実証し,従来のDNNおよび従来のチャネル符号化方式と同等のブロック誤り率(BLER)を達成できることを明らかにする。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:08:42 GMT)
Stochastic Extragradient with Flip-Flop Shuffling & Anchoring: Provable Improvements [16.3] ミニマックス最適化では、凸凹(C-C)問題において降下昇降法よりも優れているため、Extragradient (EG)法が広く研究されている。
しかし、EG(SEG)はC-C問題、特に非拘束症例で成功している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:49:25 GMT)
Verbosity-Aware Rationale Reduction: Effective Reduction of Redundant Rationale via Principled Criteria [16.2] 大規模言語モデル(LLM)は、最終回答の品質を高めるために、広範囲な中間推論単位(トークン、文など)を生成することに依存する。
本稿では,冗長な推論文を識別・除去するために,確率に基づく基準,冗長性を活用した文レベルの合理的化学習フレームワークを提案する。
これはLLMの元々の推論能力を保持し、様々なモデルやタスクに対して平均17.15%のコスト削減を実現している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:06:15 GMT)
Attributed Graph Clustering in Collaborative Settings [15.7] 属性グラフのための協調グラフクラスタリングフレームワークを提案する。
本手法は,異なる参加者が同一データの異なる特徴を持つ垂直分割データ上での属性グラフクラスタリングをサポートする。
本手法は,集中型属性グラフクラスタリング法と同等の精度を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:29:10 GMT)
Improve Myocardial Strain Estimation based on Deformable Groupwise Registration with a Locally Low-Rank Dissimilarity Metric [15.7] 提案手法であるGroupwise-LLRは,全心相にわたる変位場を反復的に更新することで特徴追跡を行う。
Groupwise-LLRはドリフト効果を低減し、より正確な心筋追跡とひずみ推定を提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:47:21 GMT)
An Accelerated Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness [15.7] 本稿では,上層関数が非非有界な滑らかさであり,下層関数が強く凸であるような二層最適化問題のクラスについて検討する。
これらの問題は、ニューラルネットワークを用いたテキスト分類など、データ学習に大きな応用がある。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:21:13 GMT)
KnowRA: Knowledge Retrieval Augmented Method for Document-level Relation Extraction with Comprehensive Reasoning Abilities [15.6] 文書レベルの関係抽出(Doc-RE)は、複数の文にわたるエンティティ間の関係を抽出することを目的としている。
既存のDoc-REメソッドの多くは、単一の推論能力を最適化することに重点を置いているが、長いドキュメントの包括的な推論に外部知識を利用する能力は欠如している。
KnowRAはDocREを支援するために外部知識を受け入れるかどうかを自律的に決定する包括的な推論で提案されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:58:36 GMT)
Why Are Positional Encodings Nonessential for Deep Autoregressive Transformers? Revisiting a Petroglyph [15.6] 自動回帰変換言語モデルは、明示的なPEを必要とせずに、置換トークンでシーケンスを区別することができる。
この結果はよく散布されなかったようで、最近になって再発見された。
ここでは,多層自己回帰変換器において明示的なPEが重要でない理由について,長年にわたる説明をレビューする。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:12:45 GMT)
Time-Varying Graph Learning for Data with Heavy-Tailed Distribution [15.6] グラフモデルは、ネットワーク上で定義されたデータ構造をキャプチャする効率的なツールを提供する。
このようなモデルを学ぶための現在の方法論は、データ内の外れ値に対する堅牢性に欠けることが多い。
本稿では,重み付きデータを効率的に表現できる時間変化グラフモデルの学習問題に対処する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:09:57 GMT)
Flash-Split: 2D Reflection Removal with Flash Cues and Latent Diffusion Separation [15.5] Flash-Splitは、送信された光と反射した光を分離するためのフレームワークである。
Flash-Splitを実世界の挑戦的なシーンで検証することにより、最先端のリフレクション分離性能を示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:27:23 GMT)
Responsible AI Governance: A Response to UN Interim Report on Governing AI for Humanity [15.4] このレポートは、持続可能な開発目標を達成するためのAIの変革の可能性を強調している。
それは、関連するリスクを軽減するための堅牢なガバナンスの必要性を認めている。
報告書は、責任あるAIガバナンスを促進するための実行可能な原則で締めくくっている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:52:58 GMT)
Dual Active Learning for Reinforcement Learning from Human Feedback [13.7] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の好みを合わせるために広く応用されている。
人間のフィードバックは高価で時間を要するため、人間の教師がラベルを付けるための高品質な会話データを集めることが不可欠である。
本稿では、オフライン強化学習(RL)を用いてアライメント問題を定式化する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:36:40 GMT)
Double-Flow GAN model for the reconstruction of perceived faces from brain activities [13.7] そこで我々はDouble-Flow GANと呼ばれる新しい再構築フレームワークを提案する。
また,画像から抽出した特徴を条件として,fMRIから条件付き再構成モデルを事前学習するための事前学習プロセスも設計した。
その結果, 提案手法は, 複数の顔特性を正確に再構成し, 過去の再現モデルより優れ, 最先端の復元能力を示すことがわかった。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:33:22 GMT)
Who Gets Recommended? Investigating Gender, Race, and Country Disparities in Paper Recommendations from Large Language Models [13.4] 本稿では,文献推薦業務における代表的大規模モデルの性能について検討する。
その結果、LLMの全体的な推奨精度は限られているだけでなく、引用回数、後の出版日、より大きな著者チームを含む文献を推薦する傾向が示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:42:53 GMT)
Goal Recognition using Actor-Critic Optimization [12.8] DRACO(Deep Recognition using Actor-Critic Optimization)は、深層強化学習に基づく新しいアプローチである。
DRACOは、構造化されていないデータからポリシーネットワークの集合を学習し、それらを推論に使用する最初のゴール認識アルゴリズムである。
既存のアプローチで使用されている構造化入力を使わずに、個別設定でゴール認識のための最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:44:20 GMT)
Temporal Dynamics Decoupling with Inverse Processing for Enhancing Human Motion Prediction [12.8] textbf$TD2IP$は、モーションパターンのより深い理解を促進する。
textbf$TD2IP$は、モーションパターンのより深い理解を促進する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:18:50 GMT)
Spatio-Temporal Multi-Subgraph GCN for 3D Human Motion Prediction [12.8] グラフ畳み込みネットワーク(GCN)は、人間の動作における関節間の関係を捉える能力において、この分野において広く注目を集めている。
複雑な動きを捉えるための時空間多時間ネットワーク(STMS-GCN)を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:22:39 GMT)
Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2 [12.5] 我々は、Variants of Concern(VOC)へのゲノム配列を予測できるCNN分類モデルを訓練した。
比較のために,従来のゲノムワイド・アソシエーション研究(GWAS)を行い,VOCに関連する変異を同定した。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:02:54 GMT)
High-accuracy sampling from constrained spaces with the Metropolis-adjusted Preconditioned Langevin Algorithm [12.4] 本稿では,$mathbbRd$の適切な凸部分集合である対象分布から近似サンプリングを行う1次サンプリング法を提案する。
提案手法は,事前条件付きLangevinアルゴリズムの単一ステップで生成したマルコフ連鎖にメトロポリス・ハスティングスフィルタを適用した結果である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:05:59 GMT)
Online Joint Assortment-Inventory Optimization under MNL Choices [11.7] 本稿では,MNL(Multinomial Logit)選択モデルに従えば,各顧客の選択行動が従うと仮定する,オンラインジョイント・アソート・インベントリ最適化問題について考察する。
本稿では,オンラインでの品揃えと在庫のオンライン意思決定において,探索と利用を効果的にバランスさせる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:16:54 GMT)
MaLei at the PLABA Track of TAC-2024: RoBERTa for Task 1 -- LLaMA3.1 and GPT-4o for Task 2 [11.4] 本報告では, バイオメディカル・抽象化 (PLABA) 2024 の共有タスクにおける MaLei チーム (Manchester と Leiden) のシステム記述について述べる。
課題1では,微調整されたReBERTa-Baseモデルを用いて,バイオメディカル抽象化における難解な用語,用語,頭字語を識別・分類し,F1スコアを報告した。
第2タスクでは,Llamma3.1-70B-Instruct と GPT-4o を用いて抽象的な適応を完了し,BLEU,SARI,BERTScore,LENS,SALSAでスコアを報告した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:22:06 GMT)
Generative Emergent Communication: Large Language Model is a Collective World Model [11.2] 創発的創発的コミュニケーション(ジェネレーティブ・エムコム)は創発的コミュニケーション、世界モデル、および大言語モデル(LLM)を橋渡しする
提案フレームワークは,複数のエージェントにまたがる分散ベイズ推論により,言語とシンボルシステムの出現を定式化する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:23:10 GMT)
CPT: Competence-progressive Training Strategy for Few-shot Node Classification [11.2] グラフニューラルネットワーク(GNN)はノード分類に大きな進歩を遂げているが、その成功はトレーニングデータ内のクラス毎の十分なラベル付きノードに依存している。
伝統的なエピソディックなメタラーニングアプローチはこの領域で有望であるが、固有の制限に直面している。
メタラーナーのプログレッシブ・コンピテンスにタスクの難易度を合わせる2段階のカリキュラム学習手法であるCPTを紹介する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:45:50 GMT)
ALEN: A Dual-Approach for Uniform and Non-Uniform Low-Light Image Enhancement [11.0] 不適切な照明は、情報損失や画質の低下を招き、監視などの様々な応用に影響を及ぼす可能性がある。
現在のエンハンスメント技術は、しばしば特定のデータセットを使用して低照度画像を強化するが、様々な現実世界の条件に適応する際の課題は残る。
アダプティブ・ライト・エンハンスメント・ネットワーク (ALEN) を導入し、その主なアプローチは、ローカル照明とグローバル照明の強化が必要であるかどうかを決定するための分類機構を使用することである。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:53:57 GMT)
B2Net: Camouflaged Object Detection via Boundary Aware and Boundary Fusion [10.9] 得られた境界の精度を高めるために,B2Netという新しいネットワークを提案する。
我々は、より差別的な特徴表現を統合することを目的として、Residual Feature Enhanced Module (RFEM)を提案する。
その後、境界認識モジュール(BAM)を導入し、エッジキューを2回探索する。
最後に,さまざまなスケールの情報をトップダウンで統合するCBFMを設計する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:06:06 GMT)
M2I2: Learning Efficient Multi-Agent Communication via Masked State Modeling and Intention Inference [10.7] M2I2は、受信した情報を効果的に同化して活用するエージェントの能力を高めるために設計された新しいフレームワークである。
M2I2は、マスク状態モデリングと共同動作予測のための高度な能力を持つエージェントを装備する。
各種マルチエージェントタスクにおけるM2I2の評価を行い,その性能,効率,能力について検討した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:07:28 GMT)
PRD: Peer Rank and Discussion Improve Large Language Model based Evaluations [10.7] 現代の大規模言語モデル(LLM)は、自動評価と比較が難しい。
本稿では,全ての解答対に対するLLMのペアワイズ選好を考慮に入れたピアランク(PR)アルゴリズムを提案する。
我々のアプローチは高い精度を実現し、人間の判断とよく一致していることがわかりました。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:54:19 GMT)
Debunking the CUDA Myth Towards GPU-based AI Systems [10.7] 我々は、Intel Gaudi-2とNVIDIA A100を比較し、プリミティブAI計算、メモリ、通信操作を行う。
Gaudi-2はA100に匹敵するエネルギー効率を達成するが、ソフトウェア成熟度の観点からは注目すべき分野がある。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:24:52 GMT)
Debiased Nonparametric Regression for Statistical Inference and Distributionally Robustness [10.5] 我々は、任意の非パラメトリック回帰手法から導かれる滑らかな非パラメトリック推定器に対するモデルフリーデバイアス法を提案する。
点方向の正規性と一様収束性を証明した偏バイアス推定器を得る。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:10:30 GMT)
From Sands to Mansions: Simulating Full Attack Chain with LLM-Organized Knowledge [10.1] マルチステージ攻撃シミュレーションはシステム評価効率を高めるための有望なアプローチを提供する。
完全なアタックチェーンをシミュレートするのは複雑で、セキュリティ専門家からはかなりの時間と専門知識が必要です。
我々は、外部攻撃ツールと脅威情報レポートに基づいて、完全な攻撃チェーンを自律的にシミュレートするシステムであるAuroraを紹介する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:29:28 GMT)
AugGS: Self-augmented Gaussians with Structural Masks for Sparse-view 3D Reconstruction [10.0] スパースビュー3D再構成はコンピュータビジョンにおける大きな課題である。
本研究では,スパース・ビュー3D再構成のための構造マスクを付加した自己拡張型2段ガウス・スプレイティング・フレームワークを提案する。
提案手法は,認識品質における最先端性能と,スパース入力との多視点整合性を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:54:55 GMT)
SOEDiff: Efficient Distillation for Small Object Editing [9.9] スモールオブジェクト編集(SOE)と呼ばれる新しいタスクは、制約のある小さな領域におけるテキストベースの画像の描画に焦点を当てている。
小型オブジェクトの編集におけるStableDiffusionのようなベースラインモデルの性能向上を目的とした,新たなトレーニングベースアプローチであるSOEDiffを導入する。
提案手法は,MSCOCOとOpenImageから収集したテストデータセットに大きな改善をもたらす。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:33:28 GMT)
Automatically Planning Optimal Parallel Strategy for Large Language Models [9.8] 本稿では,並列戦略を最大スループットで自動計画する並列アルゴリズムを提案する。
トレーニング時間を計算,通信,重複に分離することにより,トレーニング期間シミュレーションモデルを構築した。
マルチノード実験の結果、アルゴリズムは平均96%の精度でリアルタイムに並列トレーニング期間を推定できることが示されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:51:14 GMT)
Make Domain Shift a Catastrophic Forgetting Alleviator in Class-Incremental Learning [9.7] クラス増分学習タスクに対処するため,DisCo というシンプルな手法を提案する。
DisCoは、既存の最先端のクラス増分学習手法に簡単に統合できる。
実験結果から,本手法を各種CIL法に組み込むことにより,大幅な性能向上が得られた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:02:20 GMT)
From Reading to Compressing: Exploring the Multi-document Reader for Prompt Compression [9.6] 大規模言語モデル(LLM)は、高度なプロンプト技術を用いて、大幅な性能向上を実現している。
プロンプト圧縮はこれらの問題を緩和するために提案されているが、グローバルコンテキストを捕捉し、圧縮機を効果的に訓練する際の課題に直面している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:04:56 GMT)
Polynomial time sampling from log-smooth distributions in fixed dimension under semi-log-concavity of the forward diffusion with application to strongly dissipative distributions [9.5] 固定次元の複雑なサンプリングアルゴリズムを提案する。
提案アルゴリズムは,$O(d7Ld+2epsilon-2(d+3) (L+beta)2d2(d+1))$ timeにおいて,$textKL$発散で期待される$epsilon$エラーを実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:51:39 GMT)
Matrix factorization and prediction for high dimensional co-occurrence count data via shared parameter alternating zero inflated Gamma model [9.1] 電子商取引における共起数とアイテムとイテムのペアは、高次元データを生成する。
本稿では,アイテムやユーザを未知の高密度ベクトルで表現できると仮定する。
このモデルは、ゼロ膨らんだガンマ確率変数から生じる共起数を扱い、未知ベクトル間のコサイン類似性を利用してアイテム・イテム関係を要約する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:59:32 GMT)
Global dense vector representations for words or items using shared parameter alternating Tweedie model [9.1] 本稿では,オンラインショッピングプラットフォームにおけるユーザ・イテムやアイテム・イテムといった実践分野から得られた共起数データを分析するモデルを提案する。
データには、レコメンデーターシステムを開発するための重要な情報や、数字以外の情報源からの項目や単語の関連性を研究するための重要な情報が含まれている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:49:32 GMT)
Graph Triple Attention Network: A Decoupled Perspective [9.0] グラフトランスフォーマーは、マルチビューカオスとローカルグローバルカオスの2つの主要な課題に直面している。
我々は、GTの高レベルな分離された視点を提案し、それらを3つのコンポーネントと2つの相互作用レベルに分解する。
DeGTAというグラフトリプルアテンションネットワークを設計し、多視点アテンションを別々に計算し、多視点ローカルおよびグローバル情報を適応的に統合する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:35:26 GMT)
Achieving Carbon Neutrality for I/O Devices [8.4] キーボード、マウス、ディスプレイ、プリンターは温室効果ガスの排出に大きく貢献する。
本稿では、I/Oデバイスにおける炭素中立性を実現するための持続可能な戦略について検討する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:54:31 GMT)
UPC Sentinel: An Accurate Approach for Detecting Upgradeability Proxy Contracts in Ethereum [8.3] ブロックチェーンプラットフォーム上で動作するソフトウェアアプリケーションは、DAppsとして知られている。DAppsはスマートコントラクトを使用して構築されており、デプロイ後に不変である。
UPC Sentinelは,スマートコントラクトバイトコードの静的および動的解析を用いて,アクティブなUPCを正確に検出する新しい3層アルゴリズムである。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:09:06 GMT)
Towards Expressive Video Dubbing with Multiscale Multimodal Context Interaction [8.3] 自動ビデオダビング(AVD)は、スクリプトから唇の動きや顔の感情に合わせた音声を生成する。
最近の研究は、韻律表現性を高めるためのマルチモーダルコンテキストのモデリングに焦点を当てている。
AVDのためのマルチスケールマルチモーダルコンテキストインタラクションスキームであるM2CI-Dubberを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:27:26 GMT)
Optimizing Speech-Input Length for Speaker-Independent Depression Classification [8.0] 1400時間以上の音声のコーパスを用いた話者非依存型抑うつ分類の結果を,ヒト・機械健康スクリーニングアプリケーションを用いて分析した。
総合的な性能が異なる2つのNLPシステムの応答入力長関数としての性能について検討する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:12:15 GMT)
Monty Hall and Optimized Conformal Prediction to Improve Decision-Making with LLMs [7.8] Con conformal prediction (CP) は分布のない不確実性定量化のためのモデルに依存しないフレームワークである。
CP-OPTは、カバー範囲を維持しながら、設定サイズを最小化するスコアを学習するための最適化フレームワークである。
また,可能な選択肢を予測セットに限定することで,問題を修正するために,Emphconformal revision of question (CROQ)を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:33:12 GMT)
Toward Corpus Size Requirements for Training and Evaluating Depression Risk Models Using Spoken Language [7.6] 本研究は,テストセットおよび列車セットの変動が制御された研究における性能に与える影響について述べる。
その結果,1Kサンプル以下のテストサイズでは,より大きなトレーニングセットサイズであってもノイズのある結果が得られた。
安定した結果を得るためには、少なくとも2Kのトレーニングセットサイズが必要だった。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:32:25 GMT)
Taming Feed-forward Reconstruction Models as Latent Encoders for 3D Generative Models [7.5] 最近のAIベースの3Dコンテンツ作成は、フィードフォワード画像から3Dへの再構成アプローチと、2Dまたは3D監視でトレーニングされた3D生成モデルという、2つの経路に沿って大きく進化している。
本稿では,既存のフィードフォワード再構成手法が3次元生成モデルのトレーニングに有効な潜伏エンコーダとして有効であることを示し,これら2つのパラダイムをブリッジする。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:23:08 GMT)
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models [7.4] 地理空間的推論を用いて,多種多様かつ複雑なマップベースのユーザクエリを評価するためのベンチマークであるMapEvalを紹介する。
MapEvalは、180の都市と54の国にまたがる場所に関する700の独特な複数の質問で構成されている。
我々の詳細な分析は、現在のモデルの長所と短所に関する洞察を提供するが、すべてのモデルは、平均して20%以上の人的性能に欠ける。
このギャップは、地理的空間的理解を強くした汎用基盤モデルの推進におけるMapEvalの重要な役割を強調している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:20:32 GMT)
A Study on Context Length and Efficient Transformers for Biomedical Image Analysis [7.3] 生体画像解析における文脈長の影響について検討する。
最近提案した長文モデルの性能評価を行った。
この研究は、バイオメディカルイメージングにおける長期コンテキストモデルの可能性と課題を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:38:38 GMT)
Text2midi: Generating Symbolic Music from Captions [7.1] 本稿では,テキスト記述からMIDIファイルを生成するエンド・ツー・エンド・エンド・モデルであるtext2midiを紹介する。
プレトレーニングされたLLMエンコーダを使用してキャプションを処理し、自動回帰変換器デコーダを条件にMIDIシーケンスを生成する。
我々は,MIDIファイルを高品質に生成するための総合的な実験評価を行い,自動化された研究と人為的な研究の両方を取り入れた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:56:59 GMT)
METANOIA: A Lifelong Intrusion Detection and Investigation System for Mitigating Concept Drift [7.0] 本稿では,概念漂流による偽陽性を緩和する最初の終生検出システムであるMetanoiaについて述べる。
最先端ベンチマークを用いて,MeTANOIAはウィンドウレベル,グラフレベル,ノードレベルの精度をそれぞれ30%,54%,29%向上することを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:44:27 GMT)
Fotheidil: an Automatic Transcription System for the Irish Language [6.9] Fotheidilはアイルランド語で最初のウェブベースの転写システムである。
ABAIRイニシアチブの一部として、音声関連AI技術を使用している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:44:30 GMT)
Adapting to Unknown Low-Dimensional Structures in Score-Based Diffusion Models [6.8] 周囲の次元が$d$である場合、各デノイングステップ内で発生する誤差の依存性は、一般的には避けられない。
これはDDPMサンプリング器がターゲット分布の未知の低次元構造に適応できるという最初の理論実証である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:15:25 GMT)
diffIRM: A Diffusion-Augmented Invariant Risk Minimization Framework for Spatiotemporal Prediction over Graphs [6.7] 実世界のデータは、アウト・オブ・ディストリビューション(OOD)問題に悩まされるため、グラフ(GSTP)に対する時間的予測は困難である。
本研究では,これらの2つの原則を組み合わせた拡散増強型不変リスク最小化(diffIRM)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:45:47 GMT)
SPDZCoder: Teaching LLMs to Synthesize Privacy Computing Code without Massive Training Data [6.7] 本稿では,ルールベースのフレームワークであるSPDZCoderを提案する。
具体的には、SPDZCoderは翻訳段階と生成段階を分離し、異なるレベルで意味表現の違いを軽減することができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:29:38 GMT)
Reinforcing Thinking through Reasoning-Enhanced Reward Models [6.6] 大規模言語モデル(LLM)は、推論時思考による複雑な多段階推論において大きな可能性を秘めている。
LLMは、知識境界に対する自己認識が限られているため、いつ思考をやめるかを決めるのに苦労する。
この研究は、LLM自身の推論プロセスを合成行動データに蒸留することで、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:50:15 GMT)
Adventures in Demand Analysis Using AI [6.6] 本稿では、人工知能(AI)から派生した多モード製品表現を統合することで、経験的需要分析を推し進める。
われわれは、Amazon.comのテキスト上でおもちゃ車の詳細なデータセットを使用して、トランスフォーマーベースの埋め込みモデルを使用して各製品を表現する。
得られた埋め込みにより,販売ランクと価格の予測精度が大幅に向上し,価格弾力性の信頼性の高い因果推定が導かれることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:33:10 GMT)
Connecting NTK and NNGP: A Unified Theoretical Framework for Wide Neural Network Learning Dynamics [6.3] 我々は、ディープ・ワイド・ニューラルネットワークの学習プロセスのための包括的なフレームワークを提供する。
拡散相を特徴づけることで、私たちの研究は脳内の表現的ドリフトに光を当てます。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:50:05 GMT)
Activity-aware Human Mobility Prediction with Hierarchical Graph Attention Recurrent Network [6.1] 本稿では,HGARN(Hierarchical Graph Attention Recurrent Network)を用いて人体移動予測を行う。
具体的には、過去の移動記録に基づいて階層グラフを構築し、複雑な時間-活動-位置の依存関係をキャプチャするために階層グラフ注意モジュールを使用する。
モデル評価において,HGARNの既存手法に対して,既存手法(例えば,以前に訪れた場所に戻る)と爆発的手法(すなわち,新しい場所を訪れる)の両方で,HGARNの性能を検証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:46:02 GMT)
A Systematic Review of Machine Learning Methods for Multimodal EEG Data in Clinical Application [6.0] 機械学習(ML)と深層学習(DL)技術は脳波(EEG)信号の解析や脳-コンピュータインターフェース(BCI)に広く応用されている。
マルチモーダルデータの統合により,MLモデルとDLモデルの精度が向上することが示されている。
本稿では,MLモデルとDLモデルにおけるマルチモーダル脳波データを用いた臨床応用について検討する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:20:56 GMT)
Autonomous Alignment with Human Value on Altruism through Considerate Self-imagination and Theory of Mind [6.0] 人間社会におけるアルトゥル的行動は、心の理論(ToM)として知られる他者を共感する人間の能力に由来する。
我々は、自己想像とToM能力を考慮に入れたエージェントを、暗黙の本質的なモチベーションを通じて、人間の利他主義的価値観と自律的に一致させることを約束している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:31:46 GMT)
Improved Belief Propagation Decoding Algorithms for Surface Codes [5.9] BP(Belief propagation)は、ほぼ線形時間の複雑さと安定化符号の適用性で有名である。
本稿では,表面符号のGF(4)よりもBPの復号精度を向上させることに焦点を当てる。
提案するEWAInit-BPは,初期確率を適応的に更新し,従来のBPよりも1~3桁の精度向上を実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:26:56 GMT)
SAT-LDM: Provably Generalizable Image Watermarking for Latent Diffusion Models with Self-Augmented Training [5.8] 自己拡張訓練(SAT-LDM)を用いた潜時拡散モデルのための実証可能な一般化可能な画像透かし手法を提案する。
SAT-LDMは,様々なプロンプトにまたがる透かし画像の品質を著しく向上させながら,堅牢な透かしを実現する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:22:53 GMT)
DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence Generation [5.8] 本稿では,効率の良いプロファイランスグラフストレージシステムであるDehydratorを提案する。
監査フレームワークによって生成されたログに対して、Dehydratorはフィールドマッピングエンコーディングを使用してフィールドレベルの冗長性をフィルタリングし、階層的なエンコーディングによって構造レベルの冗長性をフィルタし、最終的にバッチクエリをサポートするディープニューラルネットワークを学習する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:54:44 GMT)
ReZero: Boosting MCTS-based Algorithms by Backward-view and Entire-buffer Reanalyze [5.7] 本稿では,モンテカルロ木探索 (MCTS) アルゴリズムにおける木探索の高速化を目的としたReZeroという手法を提案する。
具体的には、特定の子ノードの値推定を用いて、対応するサブツリー探索時間を節約する逆ビュー再利用手法を用いて、トレーニングサンプルを再解析する。
Atari環境、DMControlスイート、ボードゲームで行った実験では、ReZeroは高いサンプル効率を維持しながらトレーニング速度を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:30:03 GMT)
First-principles Spin and Optical Properties of Vacancy Clusters in Lithium Fluoride [5.5] フッ化リチウムにおける原子価クラスターの色中心は1世紀以上にわたって詳細に研究されてきた。
これらの色中心は量子情報科学の応用のための魅力的な候補プラットフォームである。
我々はフッ化リチウムの共通空孔欠陥のハイブリッド関数計算を行った。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:19:23 GMT)
Electrically pumped h-BN single-photon emission in van der Waals heterostructure [5.2] 量子光を発生させるための単一欠陥の全ての電気ポンプは、いくつかのプラットフォームで実現されている。
ここでは、ファンデルワールス積層構造を用いて、電気的に励起された単光子放射を構成する装置の概念を実現する。
収集された発光光子エネルギーは1.4から2.9eVの範囲で、様々な原子欠陥の電気的励起を示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:18:42 GMT)
STARFormer: A Novel Spatio-Temporal Aggregation Reorganization Transformer of FMRI for Brain Disorder Diagnosis [5.2] 本稿では,BOLD信号の空間的特徴と時間的特徴を効果的に捉えた時空間集約型ランズフォーマSTAR(Former)を提案する。
提案したSTARFormerは、自閉症スペクトラム障害(ASD)と注意欠陥高活動障害(ADHD)の分類のための2つの公開データセットで厳格に評価されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:20:15 GMT)
Rapid Learning in Constrained Minimax Games with Negative Momentum [5.1] 本稿では,非拘束条件から制約条件まで負の運動量の発見を拡大する,運動量バッファ更新のための新しいフレームワークを提案する。
正規形式ゲーム (NFGs) と拡張形式ゲーム (EFGs) の両方の実験結果から、我々の運動量技術はアルゴリズムの性能を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:32:51 GMT)
Deep Transfer Learning: Model Framework and Error Analysis [4.9] 本稿では,単ドメインダウンストリームタスクに対して,サンプル$n$を多用したディープトランスファー学習のためのフレームワークを提案する。
本稿では,下流教師ありタスクにおけるリプシッツ関数の学習における収束率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:39:49 GMT)
ArguMentor: Augmenting User Experiences with Counter-Perspectives [4.8] ArguMentorは、意見書のクレームをハイライトする人間とAIのコラボレーションシステムである。
LLMを使用してそれらに対する反論を識別し、現在のイベントに基づいたコンテキストベースの要約を生成する。
さらに、Q&AボットやDebateMeなどの追加機能を通じて、ユーザ理解をさらに強化する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:03:22 GMT)
Analysis of a mathematical model for malaria using data-driven approach [4.8] マラリアは世界で最も致命的な病気の1つで、毎年何百万人もの人がこの病気の犠牲者となり、多くの人が命を失う。
医療専門家や政府は、病気のダイナミクスが明確に理解されている場合に限って、国民を守るための正確な措置を講じる可能性がある。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:58:13 GMT)
OV-HHIR: Open Vocabulary Human Interaction Recognition Using Cross-modal Integration of Large Language Models [4.8] オープンな語彙と人間-人間の相互作用認識フレームワークを提案する。
我々は、オープンワールド設定において、目視と目視の両方の人間のインタラクションについて、オープンエンドのテキスト記述を生成する。
本手法は,ビデオ理解のための従来の固定語彙分類システムや既存のクロスモーダル言語モデルよりも優れている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:22:00 GMT)
Exploring Physics-Informed Neural Networks for Crop Yield Loss Forecasting [4.7] 気候変動への対応として、極度の気候条件下での作物の生産性の評価は、食料の安全性を高めるために不可欠である。
本研究では,水利用量と水不足に対する農作物の感受性を画素レベルで推定することにより,両アプローチの強度を両立させる手法を提案する。
我々のモデルは高い精度を示し、RNNやTransformersのような最先端のモデルに適合または超える最大0.77のR2を達成する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:21:50 GMT)
Optimizing Global Quantum Communication via Satellite Constellations [4.7] 我々は、モルニヤ軌道における量子中継衛星を用いた新しいアプローチを導入し、通信効率とカバレッジを向上させる。
我々の研究は、堅牢で効率的なグローバルな量子通信ネットワークを実現するために、量子衛星と中継システムをデプロイするための戦略的枠組みを提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:26:38 GMT)
AnglE-optimized Text Embeddings [4.5] 本稿では,AnglEと呼ばれる新しい角度最適化テキスト埋め込みモデルを提案する。
AnglE の中核となる考え方は、複素空間に角度最適化を導入することである。
短文STS、長文STS、ドメイン固有のSTSタスクなど、さまざまなタスクで大規模な実験が行われた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:56:13 GMT)
Cross-Layer Cache Aggregation for Token Reduction in Ultra-Fine-Grained Image Recognition [4.5] 超微細粒画像認識(UFGIR)は、マクロカテゴリ内の画像の分類を伴う課題である。
そこで我々は,新しいクロス層集約分類ヘッドとクロス層キャッシュ機構を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:19:38 GMT)
Investigating Pure State Uniqueness in Tomography via Optimization [4.4] 量子状態(QST)は、測定データを通して量子システムの理解と特徴付けに不可欠である。
従来のQST手法は拡張性の問題に直面しており、一般化された状態に対して$mathcalO(d2)の測定を必要とする。
本稿では,これらの問題に対処するための拡張ラグランジアン法(ALM)に基づく統一フレームワークを開発する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:57:03 GMT)
Enhancing Deployment-Time Predictive Model Robustness for Code Analysis and Optimization [4.4] 本稿では,予測モデルの堅牢性と性能を高めるオープンソースライブラリであるPromを紹介する。
Promは、統計的アセスメントを使用して、誤った予測をしがちなテストサンプルを識別する。
評価の結果,Promは平均96%(最大100%)の誤予測を識別できることがわかった。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:17:03 GMT)
A Novel Shape Guided Transformer Network for Instance Segmentation in Remote Sensing Images [4.1] 本稿では,SGTN(Shape Guided Transformer Network)を提案する。
自己アテンション機構のグローバルなコンテキストモデリング能力に着想を得て,LSwinと呼ばれる効率的なトランスフォーマーエンコーダを提案する。
我々のSGTNは、2つの単一クラス公開データセット上での最高平均精度(AP)スコアを達成する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:25:41 GMT)
Speeding Up Path Planning via Reinforcement Learning in MCTS for Automated Parking [3.8] 本稿では,モンテカルロ木探索を用いた強化学習パイプラインを提案する。
状態の価値を反復的に学習することにより、与えられた状態に対する値推定器とポリシー生成器をモデル化することができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:53:26 GMT)
GAI: Generative Agents for Innovation [3.2] 本研究は, 創造的エージェント間の集団的推論が, イノベーションにつながる新規で一貫性のある思考を促進するかどうかを考察する。
マルチジェネレーションエージェント間のリフレクションと相互作用を目的とした,新たなLDMを利用したフレームワークであるGAIを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:00:33 GMT)
"Dialogue" vs "Dialog" in NLP and AI research: Statistics from a Confused Discourse [3.2] 我々は何千もの研究論文を分析して、この「ダイアログ・デバクル」を理解する
タイトルまたは抽象語で"dialog(ue)"を使用するトップ会場の出版物のうち、72%が"dialogue"を使用し、24%が"dialog"を使用し、5%が同じタイトルと抽象語の両方を使用している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:56:33 GMT)
Towards Sustainable Large Language Model Serving [3.1] 我々は, LLMを炭素排出量の観点から検討し, 運転と実施の両方の排出に対処する。
2つのNvidia GPUタイプを用いて,LLaMAの性能とエネルギーを1B,3B,7Bパラメータで特徴付ける。
我々は,3つのグリッド領域からのエネルギー消費と炭素強度に基づいて,運転中の炭素排出量を解析的にモデル化した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:18:10 GMT)
A New Dataset and Methodology for Malicious URL Classification [2.8] 悪意のあるURL(Uniform Resource Locator)分類はサイバーセキュリティの重要な側面であり、Webベースの脅威に対する防御を提供する。
この分野でのディープラーニングの約束にもかかわらず、その進歩は、包括的なオープンソースデータセットの不足と、既存のモデルの制限という、2つの大きな課題によって妨げられている。
悪意のあるURL分類のための新しいマルチクラスデータセットを導入し、良性、フィッシング、悪意のあるURLを区別する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:10:38 GMT)
Different thresholding methods on Nearest Shrunken Centroid algorithm [2.8] PAMアルゴリズムを2つのしきい値法、ハード・アンド・オーダーしきい値法、ディープ・サーチ・アルゴリズムで拡張し、より優れたしきい値パラメータ推定を実現する。
修正アルゴリズムは、実データとモンテカルロの研究に基づく元のアルゴリズムと比較して、広範囲にテストされている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:13:43 GMT)
Innovative Silicosis and Pneumonia Classification: Leveraging Graph Transformer Post-hoc Modeling and Ensemble Techniques [2.8] 本研究はシリケーシス関連肺炎症の分類と検出に関する包括的研究である。
我々は, 異なる薬剤による肺炎症のニュアンスに合わせて, SVBCXと命名された新しい胸部X線画像データセットを作成した。
本稿では,従来のディープニューラルネットワークモジュールとグラフトランスフォーマーネットワークを統合した新しいディープラーニングアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:03:43 GMT)
KAE: Kolmogorov-Arnold Auto-Encoder for Representation Learning [2.7] Kolmogorov-Arnold Network (KAN)は、最近、従来の多層パーセプトロン(MLP)の代替として注目されている。
本稿では,KAE(Kolmogorov-Arnold AutoEncoder)について紹介する。
ベンチマークデータセットの実験では、KAEは遅延表現の品質を改善し、再構成エラーを低減し、下流タスクで優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:49:03 GMT)
Q3DE: A fault-tolerant quantum computer architecture for multi-bit burst errors by cosmic rays [2.5] 本稿では、宇宙線によるマルチビットバーストエラー(MBBE)に対する耐性を適度な変化とオーバーヘッドで向上するFTQCアーキテクチャを提案する。
Q3DEは, MBBEの期間を1000倍に短縮し, 面積を半減することを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:04:58 GMT)
Alternating minimization for square root principal component pursuit [2.4] 平方根主成分探索(SRPCP)問題を解くための効率的なアルゴリズムを開発した。
具体的には、各反復が閉形式最適解を楽しむサブプロブレムを含む、チューニング不要な交互最小化(AltMin)アルゴリズムを提案する。
我々は,AltMin法をさらに加速するために,核ノルムの変分定式化とブラー・モンティロ分解に基づく手法を導入する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:43:50 GMT)
Green AI: Which Programming Language Consumes the Most? [2.4] 本研究の目的は,プログラミング言語がAI環境の持続可能性に与える影響を理解することである。
我々は5つのプログラミング言語(C++、Java、Python、R)と7つのAIアルゴリズム(KNN、SVC、AdaBoost、決定木、ロジスティック回帰、ナイーブ、ランダムフォレスト)を考える。
収集した結果は,プログラミング言語がAI環境の持続可能性にかなりの影響を与えていることを示している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:53:57 GMT)
Coherence revival under the Unruh effect and its metrological advantage [2.4] 非古典的相関としての量子コヒーレンスは、検出器系のマルコフ進化によって生成される。
我々は、量子フィッシャー情報(QFI)の強化に対して、その気象学的優位性を検査することで、このようなコヒーレンス回復を検証する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:20:28 GMT)
Generation of quantum entanglement in superposed diamond spacetime [2.4] 本稿では、重畳因果ダイヤモンド時空の枠組みを提案し、時空重畳の影響を受ける量子エンタングルメントの挙動を解析する。
この結果から,時空重畳の特性は,量子情報処理タスクを行う上で貴重な資源となることが示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:32:40 GMT)
Kernel methods for long term dose response curves [2.3] 因果推論における中核的な課題は、短期的な実験データから、おそらく連続的な行動の長期的な効果をどう外挿するかである。
カーネルリッジ回帰に基づく単純な非パラメトリック推定器を提案する。
我々はその結果を長期の反事実分布にまで拡張し、弱い収束を証明した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:49:52 GMT)
Augmenting NER Datasets with LLMs: Towards Automated and Refined Annotation [2.2] 本研究では,Large Language Models(LLMs)の能力と人間の努力を相乗化する,新しいハイブリッドアノテーション手法を提案する。
ラベルミキシング戦略を用いることで、LCMベースのアノテーションで遭遇するクラス不均衡の問題に対処する。
本研究は,LLMを活用してデータセットの品質を向上する可能性を照らし,クラス不均衡を緩和する新しい手法を導入し,高性能なNERを低コストで実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:17:24 GMT)
Variational Pseudo Marginal Methods for Jet Reconstruction in Particle Physics [2.2] ジェット潜伏構造を推定するためのコンビニアル・シークエンシャルモンテカルロ法を提案する。
第2の貢献として、パラメータ学習のための変分推論アルゴリズムを開発するために、得られた推定値を利用する。
本研究では,コライダー物理生成モデルを用いて生成したデータを用いて実験を行い,本手法の有効性について述べる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:56:19 GMT)
Note on the local calculation of decoherence of quantum superpositions in de Sitter spacetime [2.2] 宇宙論的な地平線の存在によるデ・ジッター時空における量子重ね合わせのデコヒーレンス効果について検討した。
我々は、スカラー場、電磁場、重力場シナリオにおける絡み合う粒子数を計算する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:30:04 GMT)
ReducedLUT: Table Decomposition with "Don't Care" Conditions [2.2] 本稿では,圧縮プロセスに不注意を注入することにより,LUTのフットプリントを削減する新しい方法であるReduceedLUTを紹介する。
ニューラルネットワークモデルのトレーニングデータ内の未観測パターンを気にせずに置き換えることで、モデルの精度を最小限に抑えることで、より大きな圧縮を可能にします。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:01:54 GMT)
CRRG-CLIP: Automatic Generation of Chest Radiology Reports and Classification of Chest Radiographs [2.2] CRRG-CLIPモデル(CRRG-CLIP Model)は、自動レポート生成とラジオグラフ分類のためのエンドツーエンドモデルである。
生成モジュールは、Radiograph内の解剖学的領域を識別するためにFaster R-CNN、キー領域を選択するバイナリ分類器、セマンティックコヒーレントレポートを生成するためにGPT-2を使用する。
分類モジュールは教師なしのContrastive Language Image Pretraining (CLIP)モデルを使用し、高価なラベル付きデータセットの課題に対処する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:07:27 GMT)
EQUATOR: A Deterministic Framework for Evaluating LLM Reasoning with Open-Ended Questions. # v1.0.0-beta [2.1] 本研究では,決定論的スコアと実測精度とロバストな推論評価に着目したEQUATOR評価器を提案する。
ベクトルデータベースを使用して、EQUATORは人間の評価された回答とオープンエンドの質問をペアリングし、より正確でスケーラブルな評価を可能にする。
この枠組みは,高精度な基準を維持しつつ,従来のマルチ選択評価を著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:56:17 GMT)
Relative entropy formulation of thermalization process in a Schwarzschild spacetime [2.1] シュワルツシルトブラックホールの外にあるウンルー・デウィット検出器のエントロピー定式化における熱化過程の問題を再考する。
オープン量子系の文脈における検出器の遅延時間ダイナミクスを導出する。
我々は,QREのエキゾチックな位置依存性の挙動が,ブラックホール空孔の異なる選択に対応して現れることを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:34:44 GMT)
Per Subject Complexity in Eye Movement Prediction [2.1] 視線移動予測は、仮想現実デバイスにおける視線追跡システムによって引き起こされる遅延を補うための、有望な研究分野である。
本研究では,被験者の眼球運動予測課題の複雑さを包括的に分析する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:54:07 GMT)
Outlier-Robust Linear System Identification Under Heavy-tailed Noise [2.1] 線形時間不変系の状態遷移行列を推定する問題を考察する。
我々は、複数の弱集中型推定器の構築に依存する、新しいロバストなシステム同定アルゴリズムを開発した。
提案手法は, 敵が収集したトラジェクトリデータのごく一部を任意に破壊できるシナリオを考慮し, 容易に拡張可能であることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:53:02 GMT)
Revisiting Point Cloud Completion: Are We Ready For The Real-World? [2.0] 現在のベンチマークでは、現実的な環境で捉えた点雲の重要な構成要素である、リッチなトポロジ的特徴が欠如していることが示されている。
私たちは、ポイントクラウド補完のための最初の実世界の産業用ポイントクラウドデータセットであるRealPCにコントリビュートしています。
3次元骨格の形で完全な形状のグローバルな位相を抽出する0次元$mathcalPH$predsは、トポロジ的に一貫性のある完全形状を生成するモデルを支援することができることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:31:49 GMT)
Fuzzy Model Identification and Self Learning with Smooth Compositions [2.0] 本稿では,動的システムのためのスムーズなモデル同定と自己学習戦略を開発する。
我々は,モデルが連続的かつ滑らかな表面上のシステムの変化と変化に従うように,この問題を解決しようと試みてきた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:19:02 GMT)
Finding Missed Code Size Optimizations in Compilers using LLMs [1.9] 我々は,大規模言語モデルと一連の差分テスト戦略を組み合わせた新しいテスト手法を開発した。
当社のアプローチでは,実装に150行未満のコードが必要です。
現在までに、本番コンパイラの24のバグが報告されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:47:46 GMT)
Quantum many-body dynamics for fermionic t-J model simulated with atom arrays [1.9] 本稿では,プログラム可能なRydberg-dressed tweezer配列におけるフェルミオンt-Jモデルを実現するための新しいスキームを提案する。
特に、従来の光学格子や銅酸化物をはるかに超えた、大きなJ/t限界における量子多体力学を探求する。
我々の予測は、ツイーザーアレイにおけるt-Jモデルによるエキゾチックな量子多体ダイナミクスの探索において、新たな地平を開く。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:28:40 GMT)
Sidewalk Hazard Detection Using Variational Autoencoder and One-Class SVM [1.7] 本稿では,ハイブリッドアプローチを用いた歩道安全ナビゲーションシステムを提案する。
このシステムは歩道の異常を検知し、歩行障害を引き起こす可能性がある。
提案されたVAEモデルは高い性能を示し、AUC(Area Under the Curve)は0.94である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:18:05 GMT)
EdgeRAG: Online-Indexed RAG for Edge Devices [1.7] 本稿では,クラスタ内に埋め込みをプルーニングし,検索時にオンデマンドに埋め込みを生成することでメモリ制約に対処するEdgeRAGを提案する。
BEIRスイートの結果は、EdgeRAGがベースラインIVFインデックスよりも大幅に遅延を低減していることを示している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:40:43 GMT)
A Pseudo-random Number Generator for Multi-Sequence Generation with Programmable Statistics [1.7] 本稿では,特定のアプリケーションのニーズに合わせてプログラム可能な統計量を用いて,複数の非相関配列を同時に生成できるハードウェアPRNGを提案する。
PRNGの面積は約 0.0013mm2 であり、エネルギー消費量は 0.57pJ/bit である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:06:09 GMT)
The phase diagram of quantum chromodynamics in one dimension on a quantum computer [1.7] 我々は、トラップイオン量子コンピュータ上での有限密度でのSU(2)およびSU(3)ゲージ理論の熱状態を実験的にシミュレートした。
この研究は、QCDを2色と3色の有限密度で量子シミュレーションした最初の格子ゲージ理論である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:11:29 GMT)
Dementia Detection using Multi-modal Methods on Audio Data [1.6] 本稿では,患者の音声記録を用いて認知症の発症を予測するために開発されたモデルについて述べる。
音声ファイルからWhisperモデルを用いて書き起こしを生成し,RoBERTa回帰モデルを用いてMMSEスコアを生成するASRベースのモデルを開発した。
RMSEスコアは2.6911で、ベースラインよりも約10%低い。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:26:54 GMT)
Estimation of 3T MR images from 1.5T images regularized with Physics based Constraint [1.4] 既存のポストプロセッシング手法では, 3T 画像を改良して 7T ライクな画像を生成することが可能である。
低視野(LF, =1.5T)画像の改善には,画質の低下による新たな課題が伴うことが観察されている。
本稿では、1.5T画像の品質向上のための教師なしのフレームワークを取り上げ、サンプル画像の高価な要求を回避する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:45:49 GMT)
Solving Partial Differential Equations with Random Feature Models [1.4] PDEを効率的に解くためのランダムな特徴ベースのフレームワークを提案する。
多数のコロケーションポイントを持つ問題に直面する最先端の解法とは対照的に,提案手法は計算複雑性を低減させる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:48:31 GMT)
Algorithms for ridge estimation with convergence guarantees [1.3] 我々は、点雲からフィラメント構造を抽出することを検討する。
フィラメントは、下層の密度の隆起線または隆起線としてモデル化される。
本稿では,2つの新しいアルゴリズムを提案し,それらの収束を理論的に保証する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:11:43 GMT)
Whisper Turns Stronger: Augmenting Wav2Vec 2.0 for Superior ASR in Low-Resource Languages [1.3] 本稿では,データ拡張技術を用いて,Wav2Vec2上で微調整されたASRシステムを強化するエンドツーエンドフレームワークを提案する。
提案手法は,事前学習したWav2Vec2とよく知られたWhisper ASRモデルの2つのベースラインモデルより優れている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:03:20 GMT)
Sinhala Transliteration: A Comparative Analysis Between Rule-based and Seq2Seq Approaches [1.2] 本研究では,Sinhalaのローマ字訳に焦点をあてる。
この問題に対処する2つの方法を提案する。
後者については,Transformer ベースの Encode-Decoder ソリューションを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:27:47 GMT)
Data-Driven Fairness Generalization for Deepfake Detection [1.2] ディープフェイク検出のためのトレーニングデータのバイアスは、異なるグループ間で異なるレベルのパフォーマンスをもたらす可能性がある。
本稿では,合成データセットとモデル最適化を利用して,深度検出における公平性一般化問題に対処するためのデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:15:01 GMT)
Measuring Error Alignment for Decision-Making Systems [1.1] 本稿では,2つの行動アライメント指標の誤分類契約を提案する。
私たちのメトリクスはRAメトリクスとよく相関しており、補完的な情報を他のBAメトリクスに提供しています。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:11:31 GMT)
Adaptive Tabu Dropout for Regularization of Deep Neural Network [1.1] ドロップアウトはディープニューラルネットワークの正規化に有効な戦略である。
本稿では,深層ニューラルネットワークのトレーニングのためのタブドロップアウト機構を改良する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:48:42 GMT)
Finding the Underlying Viscoelastic Constitutive Equation via Universal Differential Equations and Differentiable Physics [1.0] 本研究は、微分物理学と粘弾性流体を併用した普遍微分方程式(UDE)を用いる。
本研究は, 上対流マックスウェル (UCM) , ジョンソン・セガルマン (Johnson-Segalman) , ギーゼクス (Giesekus) および指数パン・テン・タンナー (Exponential Phan-Thien-Tanner, ePTT) の4つの粘弾性モデルの解析に焦点をあてる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:34:29 GMT)
Benchmarking the Performance of Pre-trained LLMs across Urdu NLP Tasks [1.0] 本研究では、22のデータセットと13.8時間の発話をゼロショット環境で使用し、17のタスクにまたがる7つの顕著なLarge Language Model (LLM)を詳細に検討し、その性能を最先端(SOTA)モデルと比較した。
この結果から,Llama 3.1-8Bのようなより少ないパラメータを持つモデルでは,GPT-3.5のような言語多様性の低いモデルよりも,よりリッチな言語特化データの方が優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:13:06 GMT)
Exploring Variability in Fine-Tuned Models for Text Classification with DistilBERT [0.9] 本研究では, DistilBERT モデルを用いたテキスト分類のための微調整手法の評価を行った。
学習率,バッチサイズ,エポックといったハイパーパラメータが,精度,F1スコア,損失に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:16:15 GMT)
Constant Degree Networks for Almost-Everywhere Reliable Transmission [0.8] 本稿では, 対向断層の一定割合を許容できる, 効率的なプロトコルによる定度ネットワークの構築について述べる。
本研究の主な貢献は,グラフ製品に基づく通信ネットワークの合成技術である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:18:28 GMT)
Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments [0.7] ソフト成長ロボットは、散らかったり危険な環境下でのナビゲーションのための植物のような成長を模倣する新しいデバイスである。
本研究は,ソフト成長ロボットの設計最適化のためのアプローチを提案する。
これは、特定のタスクを解くためのロボットの最適なサイズを示唆している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:44:18 GMT)
Fast mixing of weakly interacting fermionic systems at any temperature [0.7] 任意の温度において、パリティオブザーバブルのリンドブラディアンスペクトルギャップは、システムサイズに依存しない定数によって下界であることが示される。
これにより、システムサイズにおいて最も線形な混合時間推定が導かれ、対応するギブス状態が量子コンピュータ上で効率的に作成可能であることが示される。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:51:13 GMT)
Variability-Aware Machine Learning Model Selection: Feature Modeling, Instantiation, and Experimental Case Study [0.7] 本稿では,モデル選択プロセスの共通点とバリエーションを考慮した可変性を考慮したMLアルゴリズム選択手法を提案する。
提案されたアプローチは、モデル選択のためのより明示的で適応的で透明で、解釈可能で、自動化されたベースを提供するためのステップであると見なすことができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:29:37 GMT)
GPT-4 on Clinic Depression Assessment: An LLM-Based Pilot Study [0.7] 転写解析に基づく臨床うつ病評価におけるGPT-4の使用について検討した。
本稿では,患者インタビューを2つのカテゴリーに分類するモデルの能力について検討する。
その結果, GPT-4の精度およびF1スコアは, 構成によって大きく変動することが示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:32:43 GMT)
Learning interacting fermionic Hamiltonians at the Heisenberg limit [0.7] ハイゼンベルク極限でフェルミオンハバードハミルトニアン類を学ぶアルゴリズムを提供する。
このプロトコルは一定量の状態準備と測定誤差に対して堅牢である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:24:57 GMT)
AraSTEM: A Native Arabic Multiple Choice Question Benchmark for Evaluating LLMs Knowledge In STEM Subjects [0.7] 我々は、STEM科目におけるLarge Language Models (LLMs) の知識を評価することを目的とした、アラビア語多目的質問データセットであるAraSTEMを紹介する。
このデータセットはさまざまなレベルのトピックにまたがっており、高い精度を達成するためには、科学的アラビアの深い理解をモデルに示さなければならない。
以上の結果から, 様々なサイズの公開モデルがこのデータセットに苦慮し, より局所的な言語モデルの必要性を浮き彫りにしていることがわかった。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:45:12 GMT)
Deep clustering using adversarial net based clustering loss [0.7] 我々は、従来の閉形式 KL の発散に対して、対角ネットとして深層クラスタリングを再構成する。
提案手法の性能をいくつかのよく引用されたデータセットで実証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:21:35 GMT)
Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems [0.6] 本稿では,現代のAIシステムに適用可能な,新たなアクティブラーニングフレームワークを提案する。
従来のアクティブな学習手法とは違い、どのデータポイントにラベルを付けるべきかを判断することのみに重点を置いているのに対し、我々のフレームワークは異なるクエリスキームを組み込むという革新的な視点も導入しています。
提案する能動学習フレームワークは,他の手法と比較して精度が高く,損失も少ない。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:12:51 GMT)
Disagree and Commit: Degrees of Argumentation-based Agreements [0.6] 我々は、人工自律エージェントがそのような合意に達することを可能にする合意シナリオの概念を導入する。
我々は、満足度と(最小、平均、中央値の)合意の度合いの概念を導入するとともに、価値に基づく議論フレームワークにおける価値がこれらの概念に与える影響を測る尺度も導入する。
我々は、動的シナリオにおける部分的な合意の信頼性に光を当てるため、合意シナリオが新たな情報で拡張されたときに、合意の度合いがどのように影響を受けるかを分析する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:49:58 GMT)
OMG-RL:Offline Model-based Guided Reward Learning for Heparin Treatment [0.5] オフライン逆RL(IRL)を実行するオフラインモデルに基づくガイド・リワード学習(OMG-RL)を導入する。
我々は,OMG-RLポリシーが学習報酬ネットワークだけでなく,活性化部分トロンボプラスチン時間(aPTT)においても肯定的に強化されていることを示した。
このアプローチはヘパリン服用問題だけでなく、一般のRLベースの薬物服用タスクにも広く利用することができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:27:22 GMT)
Clifford circuits Augmented Matrix Product States for fermion systems [0.5] 我々は、Jordan-Wigner変換を利用して、CAMPSを一般化してフェルミオン系を研究する。
実験の結果,特に相互作用が強い場合,MPSよりもCAMPSの精度が有意に向上した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:31:22 GMT)
ReFormer: Generating Radio Fakes for Data Augmentation [0.5] ReFormerは、合成無線周波数(RF)データを効率的に生成できる生成AI(GAI)モデルである。
異なるトランスフォーマーアーキテクチャと他の設計選択が生成したRFフェイクの品質にどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:28:35 GMT)
Loschmidt Echo for edge of chaos and chaotic sea in Standard Map: Cases Study [0.5] 本研究では混合型位相空間に対する量子ロシミットエコー(LE)崩壊則について検討する。
LE崩壊過程の複雑なダイナミクスを特徴付ける普遍的崩壊法則を提案し、数値的に検証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:47:27 GMT)
Context-Aware Detection of Mixed Critical Events using Video Classification [0.4] 混在したクリティカルイベントは、適切な応答を起こすためにコンテキストを解釈できる適応可能なシステムを要求する。
本稿では,スマートシティアプリケーションのための多目的検知システムを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:01:57 GMT)
Tech Report: Divide and Conquer 3D Real-Time Reconstruction for Improved IGS [0.4] パイプラインはフレーム選択、深さ推定、および3D再構成コンポーネントを統合する。
深度推定のための深度Anything V2とEndoDACの統合を含む最近の進歩について詳述する。
Hamlynデータセットで行った実験は、統合された手法の有効性を実証している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:43:27 GMT)
Exploiting Boundary Loss for the Hierarchical Panoptic Segmentation of Plants and Leaves [0.4] 本稿では,葉数と雑草の位置を同時に決定する階層的パノプティックセグメンテーション法を提案する。
この結果,標準学習セットでのPQ+81.89を達成できるだけでなく,本手法により葉数精度を向上できることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:23:58 GMT)
Optimal Control in Nearly-Adiabatic Two-Level Quantum Systems via Time-Dependent Resonance [0.3] ほぼ断熱的な2レベル量子系における「時間依存共振に基づくプロトコル」が断熱制御に準ずる性質を示すことを示す。
我々の研究は量子最適制御理論の新しい視点を提供し、量子ビット制御と量子情報処理の潜在的な応用を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:06:21 GMT)
An Empirical Evaluation of Large Language Models on Consumer Health Questions [0.3] 本研究は,MedRedQAにおけるいくつかの大規模言語モデル(LLM)の性能評価である。
GPT-4o miniは5つのモデルの審査員のうち4人に応じて専門家の反応に最も適しており、Mistral-7Bは5つのモデルの審査員のうち3人から最も低いスコアを得た。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:08:15 GMT)
Setting Standards in Turkish NLP: TR-MMLU for Large Language Model Evaluation [0.3] トルコ語MMLU(TR-MMLU)ベンチマークは、トルコ語における大規模言語モデル(LLM)の言語的および概念的能力を評価するために設計された。
TR-MMLUは、62のセクションにまたがる6200の多重選択質問からなるデータセットから構築され、67の分野にまたがる280000の質問と、トルコの教育システム内の800以上のトピックからなるプールから選択される。
この結果から,トークン化や微調整戦略の影響などの重要な課題が明らかとなり,モデル設計改善の領域が強調された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:43:49 GMT)
Enabling New HDLs with Agents [0.2] LLM(Large Language Models)ベースのエージェントは、プログラミング言語のランドスケープを変革している。
本稿では,ハードウェア記述言語(HDL)におけるLLMの実現に向けた課題と解決策について検討する。
さまざまなHDLに関する限られた知識を持つLLM向けに最適化されたAIエージェントであるHDLAgentが導入されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:37:20 GMT)
Toward Information Theoretic Active Inverse Reinforcement Learning [0.2] 逆強化学習(IRL)は、実証から未知の報酬を推測するための有望なアプローチを提供する。
Active IRLはこの課題に対処し、人間のデモンストレーションにおいて最も有益なシナリオを戦略的に選択する。
本稿では,情報理論の獲得関数を提案し,効率的な近似手法を提案し,グリッドワールド実験を通じてその性能を示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:32:24 GMT)
Entanglement engineering of optomechanical systems by reinforcement learning [0.2] エンタングルメント工学におけるモデルフリーな深層強化学習手法を開発した。
我々は、線形または非線形光子-フォノン相互作用を持つ量子光学系を用いて、プロトコルの動作を実証する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:11:23 GMT)
Unified Deep Learning Model for Global Prediction of Aboveground Biomass, Canopy Height and Cover from High-Resolution, Multi-Sensor Satellite Imagery [0.2] 地表面バイオマス密度 (AGBD) , キャノピー高さ (CH) , キャノピー被覆 (CC) の予測を統一する深層学習モデルと10mのマルチセンサ・マルチスペクトル画像を用いた新しい手法を提案する。
GEDI-L2/L4を世界数百万のサンプルで測定し、2023年と2016年から2023年までの期間に全世界に展開することで、モデルの有効性を検証した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 10:43:36 GMT)
Dynamic Prompt Adjustment for Multi-Label Class-Incremental Learning [0.1] CLIPのようなビジュアル言語モデルは、分類タスクにおいて良い結果を得た。
我々は、改良されたデータ再生機構を統合し、知識の忘れを抑えるために損失を早める。
提案手法は,複数のベンチマークデータセットにまたがるMLCILタスクの性能を大幅に改善した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:23:45 GMT)
Electronic Noise Considerations for Designing Integrated Solid-State Quantum Memories [0.1] ダイヤモンド中の窒素空孔(NV)中心に基づくケーススタディを提案する。
制御系における位相雑音とタイミングジッタの影響をモデル化し,実験的に検証する。
その結果、固体スピン量子ビット用集積量子制御信号発生器の設計要件を規定する手法が示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:52:01 GMT)
Quantum One-Time Protection of any Randomized Algorithm [0.0] 量子ワンタイムトークン(quantum one-time token)は、あるプログラムを正確に1度評価できる量子状態である。
生成AIモデルを含む任意のランダム化された古典的プログラムに対して量子ワンタイムトークンを構築する手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:28:23 GMT)
VoxVietnam: a Large-Scale Multi-Genre Dataset for Vietnamese Speaker Recognition [0.0] 本稿では,ベトナム語話者認識のための最初のマルチジャンルデータセットであるVoxVietnamについて紹介する。
本研究では,話者認識におけるマルチジャンル現象の課題と,提案したデータセットを用いたマルチジャンル学習における性能向上について検討した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:57:29 GMT)
Violation of the Thermodynamic Uncertainty Relation in Quantum Collisional Models [0.0] 量子衝突モデルにおける熱力学的不確実性関係について検討する。
マルコフ力学では、非平衡定常状態状態における古典的および量子的TUR境界について検討する。
2つの非マルコフ的アプローチに対して、有限時間 TUR 境界の違反は非マルコフ性の種類に大きく依存していることが分かる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:58:54 GMT)
Using pretrained graph neural networks with token mixers as geometric featurizers for conformational dynamics [0.0] 我々はGeom2vecを導入し、トレーニング済みグラフニューラルネットワーク(GNN)を普遍的な幾何演算器として利用する。
学習したGNN表現は,表現型トークンミキサーと組み合わせることで,構造単位(トークン)間の解釈可能な関係を捉えることができることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 03:33:47 GMT)
Unraveling the switching dynamics in a quantum double-well potential [0.0] 二重井戸ポテンシャルの井戸間における量子粒子の自発スイッチングについて検討する。
スイッチングレートは「階段」と呼ばれるステップライクな低下を示す
さらに, 湿地および中温・低温では, 高励起状態がカスケードおよび直接加熱によって主に占められていることが確認された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 01:12:22 GMT)
Two Cases of Deduction with Non-referring Descriptions [0.0] この論文は、自由論理と逐次計算に代わるものを提供する。
部分的な型理論と自然な推論をシークエントなスタイルで組み込んでいます。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:11:47 GMT)
Transmon qubit modeling and characterization for Dark Matter search [0.0] 本研究では,超伝導トランスモン量子ビット回路の試作機の設計,シミュレーション,実験的評価を行う。
本稿では,2つの非干渉トランスモン量子ビット,1つは固定周波数,もう1つは可変フラックスを特徴とする平面回路設計について述べる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:53:04 GMT)
Trajectories of Change: Approaches for Tracking Knowledge Evolution [0.0] SEN(Socsocial-epistemic Network)の枠組みを通じて,知識システムの局所的・グローバル的進化を探求する。
まず,相対エントロピーに基づく情報理論を用いてセマンティックシフトを検出し,その意義を評価し,鍵となる駆動特徴を同定する。
第二に、文書の埋め込みのバリエーションは意味的近傍の変化を明らかにし、類似文書の濃度がどのように上昇するか、安定したまま、あるいは分散し続けるかを追跡する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 11:09:37 GMT)
Towards Real-Time 2D Mapping: Harnessing Drones, AI, and Computer Vision for Advanced Insights [0.0] 本稿では、ドローン画像と機械学習とコンピュータビジョンを組み合わせることで、様々な地形における速度、精度、適応性の課題を克服する高度マッピングシステムを提案する。
このシステムは、最小レイテンシでシームレスで高解像度の地図を生成し、防衛作戦において戦略的優位性を提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:09:14 GMT)
Thermodynamic limitations on fault-tolerant quantum computing [0.0] 冷凍機に弱結合した量子ビット配列の発熱と散逸を特徴付けるモデルを提案する。
現在の実験パラメータは、システムを境界エラーフェーズに配置する。
この熱力学的制約は, 現在のハードウェア能力がシステムスケールとして維持されている場合, スケーラブルなフォールトトレランスを制限すべきではない。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 21:34:05 GMT)
The Potential of LLMs in Automating Software Testing: From Generation to Reporting [0.0] 手動テストは効果的だが、時間とコストがかかり、自動化メソッドの需要が増大する。
大規模言語モデル(LLM)の最近の進歩は、ソフトウェア工学に大きな影響を与えている。
本稿では,人間の介入を減らし,テスト効率を向上させるため,LSMを用いた自動ソフトウェアテストに対するエージェント指向アプローチについて検討する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:06:46 GMT)
The Physics of Quantum 2.0: Challenges in understanding Quantum Matter [0.0] 量子物質の様々な創発的な形態の現象論を理解することの難しさに直面することが不可欠である。
我々は、理論の発展を導くための組織原則を探求し、特定する必要性を含む、いくつかの際立った課題を概説し、議論する。
これらの取り組みにより、次世代技術の創出を促進する性質を持つ新しい量子物質の予測が可能となる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:57:05 GMT)
Supersinglets can be self-tested with perfect quantum strategies [0.0] スーパーシングレットは、$d ge 3$粒子のスピンゼロの状態であり、$d$レベルである。
スーパーシングレットは、ユニークな$d$-partite、$d$-dimensional非局所シグネチャを生成することができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 12:11:13 GMT)
Superposition in Transformers: A Novel Way of Building Mixture of Experts [0.0] 破滅的な忘れは、大きな言語モデルを新しいタスクやドメインに適用する際の大きな課題である。
ベースモデルの隠れ表現を重畳するためにオートエンコーダを利用する新しいアーキテクチャである Superposition in Transformers を導入する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:28:23 GMT)
String breaking dynamics in Ising chain with local vibrations [0.0] 我々は、各スピンが音速モードとコヒーレントに相互作用する1次元量子イジングモデルの力学を考察する。
弱い結合の場合、弦の破れは孤立したイジング弦の力学と比較して遅くなる。
強い結合は、多くの結合状態の間に励起の領域壁特性が溶解する複雑なダイナミクスをもたらす。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:00:06 GMT)
Single-Particle Universality of the Many-Body Spectral Form Factor [0.0] 我々は、非相互作用ユニタリ回路と相関するオンサイトポテンシャルによって進化したフェルミオンの系を考える。
これらのポテンシャルが円ランダム行列アンサンブルの固有値分布から引き出されるとき、単一粒子セクターはカオス力学を示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:02:24 GMT)
Research on vehicle detection based on improved YOLOv8 network [0.0] 本稿では,改良型YOLOv8車両検出手法を提案する。
改良されたモデルは98.3%、89.1%、そして88.4%の精度で車、人、オートバイを検出できる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 06:19:26 GMT)
Quantum tunneling and its absence in deep wells and strong magnetic fields [0.0] 低エネルギー固有値分割がなくなる例を含む二重井戸ポテンシャルの族を構築する。
この族内で変形することにより、磁気基底状態は対称状態から反対称状態へ遷移させることができる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:55:21 GMT)
Quantum speed limit and nonclassicality in open quantum system models using the Wigner function [0.0] オープンシステムモデルの量子速度限界とウィグナー関数について検討する。
量子ビットの位置へのカップリングの依存は、集合状態における力学の研究を可能にする。
量子相関の存在は進化を加速させる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:28:18 GMT)
PyMilo: A Python Library for ML I/O [0.0] PyMiloは、透過的な非実行可能なフォーマットでMLモデルをシリアライズし、簡単で安全なモデル交換を可能にする。
このパッケージは、トレーニング済みのMLモデルのエクスポートとインポートのためのシームレスでエンドツーエンドのソリューションを提供することを目的としている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:27:46 GMT)
Proof Recommendation System for the HOL4 Theorem Prover [0.0] 本稿では,HOL4定理証明器の証明推薦システムを提案する。
本ツールは,HOL4の証明支援に特化して設計されたトランスフォーマーベースモデル上に構築されている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:13:59 GMT)
Predicting Barge Presence and Quantity on Inland Waterways using Vessel Tracking Data: A Machine Learning Approach [0.0] 本研究では,内陸水路における船舶輸送量を予測するための機械学習手法を提案する。
AISはタグと曳航船の位置を追跡しているが、これらの船によって輸送される船舶の存在や数を監視していない。
この知見は、水路の管理やインフラ運営が目標の干ばつ活動のような地域に影響を与えることにも有用である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:28:21 GMT)
On the application of the Rayleigh-Ritz method to a projected Hamiltonian [0.0] 我々は、RRM固有値が、下から投影されたハミルトニアンの値へのアプローチを示す。
また、エネルギーシフトの影響とアイデンティティ演算子の投影についても論じる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:57:10 GMT)
Momentum-based minimization of the Ginzburg-Landau functional on Euclidean spaces and graphs [0.0] ユークリッド空間およびグラフ上での拡散周波関数の運動量に基づく最小化と、機械学習における半教師付き分類タスクへの応用について検討する。
時間ステップのサイズが大きすぎるが大きすぎるわけではない場合、運動量によってより高速な収束がもたらされることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 11:05:49 GMT)
Leaf diseases detection using deep learning methods [0.0] 本稿では,効率的なネットワークアーキテクチャの同定と記述とともに,作物の葉の病原体検出のための新しい手法を提案する。
プレトレーニングモデルを用いた研究に加えて,植物葉病の同定と検出に有効なCNNに基づく新しいモデルを提案した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 22:56:19 GMT)
Intuitive Analysis of the Quantization-based Optimization: From Stochastic and Quantum Mechanical Perspective [0.0] 目的関数の量子化は効果的な最適化手法である。
目的関数の量子化に基づく手法を直感的に解析する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:38:30 GMT)
Inflationary Flows: Calibrated Bayesian Inference with Diffusion-Based Models [0.0] 本稿では,拡散モデルを用いてベイズ推定を行う方法を示す。
本稿では,新しいノイズスケジュールを用いて,標準的なDBMトレーニングを通じてそのようなマップを学習する方法を示す。
その結果は、低次元の潜在空間上で一意に定義される非常に表現性の高い生成モデルのクラスである。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:39:16 GMT)
Hybrid Firefly-Genetic Algorithm for Single and Multi-dimensional 0-1 Knapsack Problems [0.0] 本稿では,ファイアフライアルゴリズム (FA) や遺伝的アルゴリズム (GA) などのアルゴリズムが直面する課題に対処する。
ハイブリットアルゴリズムは、制約のないベンチマーク関数と制約付き最適化問題を解くことによって検証される。
提案アルゴリズムは,従来の最適化アルゴリズムに比べて解の精度と計算効率が向上した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:03:15 GMT)
H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters [0.0] 視覚ベースのディープラーニングモデルは、触覚と視覚の両方をセンサレスで提供することができる。
カテーテルを2つの異なる角度から同時にセグメント化できる包括的アーキテクチャが欠如している。
本研究は,軽量なマルチインプット・マルチアウトプット・エンコーダ・デコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:55:13 GMT)
Group Invariant Quantum Latin Squares [0.0] 量子ラテン正方形 (quantum Latin square) は単位ベクトルの$n 倍 n$ の配列であり、各行と列は固定された複素ベクトル空間の正則基底を形成する。
ここでは、$(G, G')$-不変量子ラテン正方形が存在することと、既約表現の次数の多重集合が$G$と$G'$に対して等しいことを示せる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:16:01 GMT)
Graph Pruning Based Spatial and Temporal Graph Convolutional Network with Transfer Learning for Traffic Prediction [0.0] 本研究では,グラフプルーニングと転送学習の枠組みに基づく新しい時空間畳み込みネットワーク(TL-GPSTGN)を提案する。
その結果、単一のデータセット上でのTL-GPSTGNの異常な予測精度と、異なるデータセット間の堅牢なマイグレーション性能が示された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:45:26 GMT)
GAN-TAT: A Novel Framework Using Protein Interaction Networks in Druggable Gene Identification [0.0] 本研究は,GAN-TAT (GAN-TAT) を創薬性遺伝子推論のために直接PINを統合するための高度なグラフ埋め込み技術であるImGNGA (ImGNGA) を利用したフレームワークを提案する。
GAN-TATは3つのファロスデータセットでテストされ、Tclinで最高0.951のAUC-ROCスコアを達成した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 07:37:34 GMT)
Fitted Q-Iteration via Max-Plus-Linear Approximation [0.0] 特に、これらの近似器を組み込んで、証明可能な収束性を持つ新しい適合Q-iteration(FQI)アルゴリズムを提案する。
提案したFQIアルゴリズムの各イテレーションにおける最大余剰線形回帰は、単純な最大余剰行列ベクトル乗算に還元されることを示す。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 15:40:00 GMT)
Extracting effective solutions hidden in large language models via generated comprehensive specialists: case studies in developing electronic devices [0.0] 現実世界の研究と開発は、しばしば複雑な学際的な課題を解決する必要がある。
大規模な言語モデル(LLM)の膨大な包括的知識を活用して、ブレークスルーソリューションを生成することが望ましい。
本稿では、LLMと構造化ガイダンスを利用したフレームワークであるSELLM(Solutionion via comprehensive List and LLM)を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 02:20:56 GMT)
Extending XReason: Formal Explanations for Adversarial Detection [0.0] XReasonツールを拡張して、LightGBMモデルとクラスレベルの説明をサポートします。
また,XReasonにおける逆例の生成と検出を行う機構を実装した。
また,CICIDS-2017データセット上でのアプローチの有効性と精度を評価した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:45:03 GMT)
Exploiting Parallelism for Fast Feynman Diagrammatics [0.0] 最近導入された要約(CoS)フレームワークの中で、特殊化されたハードウェアアーキテクチャを使用します。
本稿では,並列処理の大規模化と計算能力の活用により,時間的に大幅に改善されることを示す。
これは強い相関関係の新たな現象の探索をより容易にするためのプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:18:59 GMT)
Exact spectral form factors of non-interacting fermions with Dyson statistics [0.0] スペクトル形成因子(SFF)は、量子多体系におけるランダム行列の振る舞いの強力な診断である。
SFFをテキストテクスチャ的に計算できるランダム回路アンサンブルのファミリーを導入する。
我々は、回路アンサンブルの整合回路表現を開発し、量子シミュレータにおける実験的な実現を可能にした。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 19:08:44 GMT)
Enhancing Wireless Sensor Network Security through Integration with the ServiceNow Cloud Platform [0.0] 本研究は、セキュリティリスクに対処するために、WSNとクラウドプラットフォームとの統合に焦点を当てている。
現在WSNは、災害管理、国土安全保障、戦場監視、農業、医療産業など、さまざまな低電力アプリケーションにデプロイされている。
WSNの網羅的な要件には、収集されたデータの高速な処理、低コストなインストールとメンテナンス、ネットワーク操作の低レイテンシが含まれる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:17:17 GMT)
Enhanced Histopathology Image Feature Extraction using EfficientNet with Dual Attention Mechanisms and CLAHE Preprocessing [0.0] 本研究では,ハイブリット・エフィシエント・ネットモデルと高度な注意機構を統合した新しいアプローチを提案する。
我々は、EfficientNetV2-XLとCBによる最先端性能を実現し、精度98.96%、F1スコア98.31%を400Xで達成した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:32:26 GMT)
Efficient support ticket resolution using Knowledge Graphs [0.0] 16万件以上の顧客のケースのレビューでは、簡単なソリューションが存在しないチケットのサブセットの約10%を解決するために、製品のサポートによって約90%の時間が費やされていることが示されています。
これらの困難なケースの多くは、"swarm"内で一緒に働く数人のエンジニアのサポートを必要とします。
本稿では,複数のデータソースからの知識グラフの埋め込みをモデル化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:21:05 GMT)
Efficient Standardization of Clinical Notes using Large Language Models [0.0] 不整合は、電子健康記録から有意義なデータを抽出することを妨げる。
臨床ノート1,618のコーパスを標準化するための大規模言語モデルを提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:52:40 GMT)
Do Students with Different Personality Traits Demonstrate Different Physiological Signals in Video-based Learning? [0.0] 提案手法は, 生理的信号に頼って評価を行う。
ビデオによる学習では,生徒の性格特性と生理的信号の変化との間に相関が認められた。
具体的には,心拍数,GSR値のばらつき,発声周波数のゆがみと,参加者の外転度,同意度,良心度,経験への開放度が相関していることが判明した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:00:32 GMT)
DiSHA: Dimension-Sharding Adaptation with Fast Convergence and Fast Computation [0.0] Low-Rank Adaptation (LoRA) は,Large Language Models (LLMs) における低内在的ウェイトアップのランクを利用する
本稿では, PEFT設計空間を拡張し, 内在ランクを低くし, コンバージェンスをデフォルトで高速化する Dimension-Sharding Adaptation (DiSHA) を提案する。
提案するBlock Affine Adaptation (Bone)は,高い性能と効率性を実現する計算効率の高い構造である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:08:20 GMT)
Deterministic role of chemical bonding in the formation of altermagnetism: Reflection from correlated electron system NiS [0.0] 強磁性と反強磁性の両方の特徴を持つ新しい強磁性状態であるオルテルマグネティズムは、ここ数年で大きな注目を集めている。
結晶の化学結合が磁気変化を誘発する役割について検討する。
ASS分割が最大となるNiAs型六角形結晶において,12個のアンチノダル領域を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:08:28 GMT)
Detection and Prevention of Smishing Attacks [0.0] 本研究は,コンテンツに基づく分析手法を用いてスマイシング検出モデルを提案する。
テキスト通信におけるスラング、略語、短い形式によって引き起こされる課題に対処するため、モデルはこれらを標準形式に標準化する。
実験結果はモデルの有効性を示し、分類精度は97.14%、スマイッシングは96.12%、ハムメッセージは96.12%である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:07:12 GMT)
Decoherence dynamics in a polaron system with collective dephasing [0.0] 本研究は, 2つの格子間のスピンレスフェルミオンホッピングで表される, 擬似キュービットのデコヒーレンスダイナミクスに展開する。
強い結合の下での計算を単純化するために、Lang-Firsov変換を採用する。
我々は、コヒーレンスが小さな$s$の値で持続するが、より大きな値では減少することを示した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 09:10:30 GMT)
Cool, But What About Oracles? An Oracle-Based Perspective on Blockchain Integration in the Accounting Field [0.0] 本研究の目的は、会計におけるブロックチェーン統合に関する論文が、オラクルが引き起こす制限を考慮し、対処するかどうかを検討することである。
その結果,本研究は多数の論文を数えているものの,オラクルの限界を考慮した実際の研究は欠落している,という見解が得られた。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 13:36:16 GMT)
Controlled Causal Hallucinations Can Estimate Phantom Nodes in Multiexpert Mixtures of Fuzzy Cognitive Maps [0.0] フィードバック因果モデルの適応的マルチエキスパート混合は、大規模因果モデルにおいて欠落ノードや幻ノードを近似することができる。
混合モデルは、その主極限サイクル平衡を近似することでサンプリングされた力学系を近似する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 23:01:32 GMT)
Conceptual Modeling and Classification of Events [0.0] 本論文は,デキシングマシン (TM) と呼ばれるダイアグラム手法に関する研究プロジェクトの続編である。
論文の第1部では、不在イベントなど、既存の構造化イベントに関連するいくつかのTM面の強化について論じている。
論文の第2部では、イベントの分類方法と、イベント間で認識できる関係の種類に焦点を当てている。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 05:11:19 GMT)
Collaborative Approaches to Enhancing Smart Vehicle Cybersecurity by AI-Driven Threat Detection [0.0] 自動車産業はコネクテッド・アンド・オートマチック・カー(CAV)をますます採用している
新しい脆弱性とセキュリティ要件の出現により、高度な技術の統合は、CAVサイバーセキュリティを強化するための有望な道を示す。
自動運転車におけるサイバーセキュリティのロードマップは、効率的な侵入検知システムとAIベースの技術の重要性を強調している。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:08:42 GMT)
Analysis of memory effects in the dynamic evolution of the spin-boson model [0.0] 強い摂動における単一モードスピン-ボソンモデルにおける非マルコフ力学について検討する。
スピンボソンモデルにおける非マルコフ効果を解析するために、l1-ノルムで定義されたコヒーレンスを用いる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:56:15 GMT)
An Overview and Discussion on Using Large Language Models for Implementation Generation of Solutions to Open-Ended Problems [0.0] 大規模言語モデルは、オープンな問題に対する問題解決活動をサポートする新しいメソッドの作成をサポートすることができる。
本報告では、モデルプロンプト、強化学習、検索型生成を含む、大規模言語モデルに関する現在の研究を要約する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 17:48:33 GMT)
Advanced Lung Nodule Segmentation and Classification for Early Detection of Lung Cancer using SAM and Transfer Learning [0.0] 本研究は,Segment Anything Model(SAM)と転写学習技術を組み合わせた肺結節セグメンテーションの革新的アプローチを提案する。
提案手法はバウンディングボックスプロンプトとビジョントランスフォーマーモデルを利用してセグメンテーション性能を向上し,高精度なDice similarity Coefficient (DSC) とIntersection over Union (IoU) のメトリクスを実現する。
以上の結果から,CT検査から肺結節を正確に抽出するモデルの有効性が示唆され,早期発見の進展と肺癌診断における患者のケア結果の改善が示唆された。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 18:21:57 GMT)
Advanced Displacement Magnitude Prediction in Multi-Material Architected Lattice Structure Beams Using Physics Informed Neural Network Architecture [0.0] 本稿では, 構造物の変形予測に革新的な手法を提案する。
物理情報ニューラルネットワーク(PINN)と有限要素解析を組み合わせる。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 00:15:58 GMT)
Addressing Challenges in Data Quality and Model Generalization for Malaria Detection [0.0] マラリアは、特に時間的かつ正確な診断が効果的な治療と管理に重要である資源に制限された地域において、重要な世界的な健康上の負担を被っている。
Deep Learning (DL)は、マラリア検出を自動化するための変換ツールとして登場し、高い精度とスケーラビリティを提供する。
しかし、これらのモデルの有効性は、データ品質とモデル一般化の課題によって制約されている。
本稿では、これらの課題とそのマラリア検出性能への影響を包括的に分析する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:25:55 GMT)
A review of faithfulness metrics for hallucination assessment in Large Language Models [0.0] 本稿では, オープンエンド要約, 質問応答, 機械翻訳作業において, 忠実度を評価する方法を検討する。
LLMを忠実度評価器として用いることは、一般的に人間の判断と最も強く相関する指標である。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 04:41:13 GMT)
A Tale of Two Imperatives: Privacy and Explainability [0.0] 科学分野におけるディープラーニングの優位性は、高い意思決定を形作っている。
本稿では,RTP(Right-to-Privacy)とRTE(Right-to-Explanation)を組み合わせる複雑さについて検討する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:13:54 GMT)
A Method for Enhancing the Safety of Large Model Generation Based on Multi-dimensional Attack and Defense [0.0] 現在、大規模なモデルは、複雑な攻撃命令に直面した場合に有害なコンテンツを生成する傾向にある。
本稿では,大規模モデルの生成的安全性を高めるため,多次元攻撃防御に対応するデータ構築手法を提案する。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 16:01:25 GMT)
A Hybrid Deep Learning and Model-Checking Framework for Accurate Brain Tumor Detection and Validation [0.0] 本稿では,脳腫瘍検出と画像診断のためのモデルチェックとディープラーニングを統合した新しいハイブリッドフレームワークを提案する。
実験結果はフレームワークの有効性を強調し、98%の精度、96.15%の精度、100%のリコールを達成した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 08:09:08 GMT)
A Complex Hilbert Space for Classical Electromagnetic Potentials [0.0] 我々は、最小限の数学と従来の量子力学でよく知られた計算列を用いて、電磁磁性の基本的な表現を導出する。
さらに、ファインマンによるマクスウェル方程式の証明の完全相対論的なバージョンが初めて引用される。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 20:52:35 GMT)
A Classifier-Based Approach to Multi-Class Anomaly Detection for Astronomical Transients [0.0] 希少な過渡性の同定に必須なリアルタイム異常検出
現代のサーベイ望遠鏡は毎晩何万もの警報を発生させる。
ヴェラ・C・ルービン天文台のような将来の望遠鏡はこの数を劇的に増やすことを計画した。
論文参考訳(メタデータ) (Tue, 31 Dec 2024 14:27:41 GMT)