Bo Zhang

23

Papers

723

Total Citations

2

Affiliations

Affiliations

Xiaomi;MeituanShanghai AI Laboratory

Papers (23)

R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization

MLVU: Benchmarking Multi-task Long Video Understanding

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Lumina-Image 2.0: A Unified and Efficient Image Generative Framework

OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text

LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection

OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations

LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object Detection

Language-Driven Anchors for Zero-Shot Adversarial Robustness

Shadow Generation for Composite Image Using Diffusion Model

Image Over Text: Transforming Formula Recognition Evaluation with Character Detection Matching

DiffCalib: Reformulating Monocular Camera Calibration as Diffusion-Based Dense Incident Map Generation

Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer Compression

ComFusion: Enhancing Personalized Generation by Instance-Scene Compositing and Fusion

JiSAM: Alleviate Labeling Burden and Corner Case Problems in Autonomous Driving via Minimal Real-World Data

On the Emergence of Cross-Task Linearity in Pretraining-Finetuning Paradigm

Chimera: Improving Generalist Model with Domain-Specific Experts

Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation

DriveX: Omni Scene Modeling for Learning Generalizable World Knowledge in Autonomous Driving

LiON: Learning Point-Wise Abstaining Penalty for LiDAR Outlier DetectioN Using Diverse Synthetic Data

What Is a Good Question? Assessing Question Quality via Meta-Fact Checking

Norm Tweaking: High-Performance Low-Bit Quantization of Large Language Models

A Semantic Knowledge Complementarity based Decoupling Framework for Semi-supervised Class-imbalanced Medical Image Segmentation