Wanli Ouyang

38

Papers

1,429

Total Citations

1

Affiliations

Affiliations

The University of Sydney

Papers (38)

WorldSimBench: Towards Video Generation Models as World Simulators

DiffBIR: Toward Blind Image Restoration with Generative Diffusion Prior

Improving Video Generation with Human Feedback

Point Cloud Pre-training with Diffusion Models

HiSplat: Hierarchical 3D Gaussian Splatting for Generalizable Sparse-View Reconstruction

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning

ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems

TASeg: Temporal Aggregation Network for LiDAR Semantic Segmentation

WeatherGFM: Learning a Weather Generalist Foundation Model via In-context Learning

PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines

Semi-supervised 3D Object Detection with PatchTeacher and PillarMix

ShotBench: Expert-Level Cinematic Understanding in Vision-Language Models

PostCast: Generalizable Postprocessing for Precipitation Nowcasting via Unsupervised Blurriness Modeling

Boosting Residual Networks with Group Knowledge

MOOSE-Chem2: Exploring LLM Limits in Fine-Grained Scientific Hypothesis Discovery via Hierarchical Search

SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning

NeurIPS 2025arXiv

Multi-Modal Latent Variables for Cross-Individual Primary Visual Cortex Modeling and Analysis

LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents

NeurIPS 2025arXiv

CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation

scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration

GigaGS: 3D Gaussian Based Planar Representation for Large-Scene Surface Reconstruction

Instruct-ReID: A Multi-purpose Person Re-identification Task with Instructions

Taming Stable Diffusion for Text to 360 Panorama Image Generation

Satellite Observations Guided Diffusion Model for Accurate Meteorological States at Arbitrary Resolution

Neuro-3D: Towards 3D Visual Decoding from EEG Signals

CasCast: Skillful High-resolution Precipitation Nowcasting via Cascaded Modelling

FiT: Flexible Vision Transformer for Diffusion Model

Towards a Self-contained Data-driven Global Weather Forecasting Framework

SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling

ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area

Frozen CLIP Transformer Is an Efficient Point Cloud Encoder

EgoAgent: A Joint Predictive Agent Model in Egocentric Worlds

ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide Sequencing

TAR3D: Creating High-Quality 3D Assets via Next-Part Prediction

UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines

UniPAD: A Universal Pre-training Paradigm for Autonomous Driving

Point Transformer V3: Simpler Faster Stronger