Luo

24

Papers

697

Total Citations

Papers (24)

MobileNetV4: Universal Models for the Mobile Ecosystem

Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-training

FlexPrefill: A Context-Aware Sparse Attention Mechanism for Efficient Long-Sequence Inference

Preserving Diversity in Supervised Fine-Tuning of Large Language Models

Unlocking Multimodal Mathematical Reasoning via Process Reward Model

NeurIPS 2025arXiv

Multi-Agent Collaboration via Evolving Orchestration

NeurIPS 2025arXiv

FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities

NeurIPS 2025arXiv

Uncertainty-aware sign language video retrieval with probability distribution modeling

REVISION: Rendering Tools Enable Spatial Fidelity in Vision-Language Models

Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games

Latent Chain-of-Thought for Visual Reasoning

NeurIPS 2025arXiv

Simultaneous Swap Regret Minimization via KL-Calibration

NeurIPS 2025arXiv

Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts

WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception

NeurIPS 2025arXiv

FlashSloth : Lightning Multimodal Large Language Models via Embedded Visual Compression

Attention! Your Vision Language Model Could Be Maliciously Manipulated

NeurIPS 2025arXiv

WeakMCN: Multi-task Collaborative Network for Weakly Supervised Referring Expression Comprehension and Segmentation

Geometry-Aware Approaches for Balancing Performance and Theoretical Guarantees in Linear Bandits

When GNNs meet symmetry in ILPs: an orbit-based feature augmentation approach

DViN: Dynamic Visual Routing Network for Weakly Supervised Referring Expression Comprehension

Geometric Algorithms for Neural Combinatorial Optimization with Constraints

NeurIPS 2025arXiv

CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving

NeurIPS 2025arXiv

Don’t Forget the Enjoin: FocalLoRA for Instruction Hierarchical Alignment in Large Language Models

DSAS: A Universal Plug-and-Play Framework for Attention Optimization in Multi-Document Question Answering

NeurIPS 2025arXiv