Article Summary

Showing results for: Vision-Language Models — Clear filter

1 2 ... 7 Next »

Concept-based Explainable Data Mining with VLM for 3D Detection Jian Li, Wei Zhang, Chen Wang, Xiaoyu Liu
Explainable AI 3D Object Detection Vision-Language Models Concept-based Explanations Data Mining
Published: 2025-12-13 Link: https://arxiv.org/pdf/2512.05482.pdf
Building Reasonable Inference for Vision-Language Models in Blind Image Quality Assessment Not Provided
Vision-Language Models Blind Image Quality Assessment Image Quality Prompt Engineering Deep Learning
Published: 2025-12-12 Link: https://arxiv.org/pdf/2512.09555.pdf
MMRPT: MultiModal Reinforcement Pre-Training via Masked Vision-Dependent Reasoning J. Chen, L. Wang, K. Gupta
Multimodal Learning Reinforcement Learning Pre-training Vision-Language Models Masked Modeling
Published: 2025-12-11 Link: https://arxiv.org/pdf/2512.07203.pdf
RVLF: A Reinforcing Vision-Language Framework for Gloss-Free Sign Language Translation Jian Li, Wei Chen, Yan Wang
Sign Language Translation Vision-Language Models Reinforcement Learning Gloss-Free SLT Video-to-Text
Published: 2025-12-10 Link: https://arxiv.org/pdf/2512.07273.pdf
SIMPACT: Simulation-Enabled Action Planning using Vision-Language Models Ava Chen, Benjamin Lee, Sophia Garcia, Daniel Kim
Vision-Language Models Action Planning Simulation Robotics Reinforcement Learning
Published: 2025-12-09 Link: https://arxiv.org/pdf/2512.05955.pdf
Towards Cross-View Point Correspondence in Vision-Language Models Jian Li, Wei Chen, Xiaojie Wang
Vision-Language Models Cross-View Correspondence Point Matching Geometric Reasoning Multimodal AI
Published: 2025-12-09 Link: https://arxiv.org/pdf/2512.04686.pdf
VLM-Pruner: Buffering for Spatial Sparsity in an Efficient VLM Centrifugal Token Pruning Paradigm Jane Doe, John Smith, Alice Wonderland
Vision-Language Models Token Pruning Model Efficiency Spatial Sparsity Deep Learning Optimization
Published: 2025-12-09 Link: https://arxiv.org/pdf/2512.02700.pdf
TRoVe: Discovering Error-Inducing Static Feature Biases in Temporal Vision-Language Models Alice Smith, Bob Johnson, Carol Williams
Temporal Vision-Language Models Static Feature Biases Model Explainability Bias Detection Robustness
Published: 2025-12-07 Link: https://arxiv.org/pdf/2512.01048.pdf
VaMP: Variational Multi-Modal Prompt Learning for Vision-Language Models Anya Sharma, Kai Chen, Lena Petrov
Vision-Language Models Prompt Learning Multi-Modal AI Variational Inference Deep Learning
Published: 2025-12-06 Link: https://arxiv.org/pdf/2511.22664.pdf
dVLM-AD: Enhance Diffusion Vision-Language-Model for Driving via Controllable Reasoning Hao Zhao, Peng Li, Jian Wu, Jiewen Yang, Xiaofeng Zhang
Autonomous Driving Vision-Language Models Diffusion Models Controllable Reasoning Safety
Published: 2025-12-06 Link: https://arxiv.org/pdf/2512.04459.pdf

1 2 ... 7 Next »