Sun

48

Papers

924

Total Citations

Papers (48)

Advancing LLM Reasoning Generalists with Preference Trees

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

NeurIPS 2025arXiv

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens

Physics-Informed Diffusion Models

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes

Vamos: Versatile Action Models for Video Understanding

Preserving Diversity in Supervised Fine-Tuning of Large Language Models

Multi-Agent Collaboration via Evolving Orchestration

NeurIPS 2025arXiv

Prioritized Semantic Learning for Zero-shot Instance Navigation

EditShield: Protecting Unauthorized Image Editing by Instruction-guided Diffusion Models

Intervening Anchor Token: Decoding Strategy in Alleviating Hallucinations for MLLMs

VITA-Audio: Fast Interleaved Audio-Text Token Generation for Efficient Large Speech-Language Model

NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation

Adversarial Locomotion and Motion Imitation for Humanoid Policy Learning

NeurIPS 2025arXiv

How new data permeates LLM knowledge and how to dilute it

Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency

NeurIPS 2025arXiv

HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location

NeurIPS 2025arXiv

Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts

Long-range Turbulence Mitigation: A Large-scale Dataset and A Coarse-to-fine Framework

COME: Adding Scene-Centric Forecasting Control to Occupancy World Model

NeurIPS 2025arXiv

Exploring Reliable Matching with Phase Enhancement for Night-time Semantic Segmentation

IGL-Bench: Establishing the Comprehensive Benchmark for Imbalanced Graph Learning

Transformer brain encoders explain human high-level visual responses

NeurIPS 2025arXiv

Triplets Better Than Pairs: Towards Stable and Effective Self-Play Fine-Tuning for LLMs

NeurIPS 2025arXiv

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

NeurIPS 2025arXiv

The Overthinker's DIET: Cutting Token Calories with DIfficulty-AwarE Training

NeurIPS 2025arXiv

Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models

NeurIPS 2025arXiv

Lagrangian Hashing for Compressed Neural Field Representations

Avoiding exp(R) scaling in RLHF through Preference-based Exploration

GRAVER: Generative Graph Vocabularies for Robust Graph Foundation Models Fine-tuning

NeurIPS 2025arXiv

Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information

CPSample: Classifier Protected Sampling for Guarding Training Data During Diffusion

Teaching Language Models to Reason with Tools

NeurIPS 2025arXiv

PINP: Physics-Informed Neural Predictor with latent estimation of fluid flows

Multimodal Label Relevance Ranking via Reinforcement Learning

EA3D: Online Open-World 3D Object Extraction from Streaming Videos

NeurIPS 2025arXiv

CLDyB: Towards Dynamic Benchmarking for Continual Learning with Pre-trained Models

PCA++: How Uniformity Induces Robustness to Background Noise in Contrastive Learning

NeurIPS 2025arXiv

Toward a Unified Geometry Understanding : Riemannian Diffusion Framework for Graph Generation and Prediction

NeurIPS 2025arXiv

FRBNet: Revisiting Low-Light Vision through Frequency-Domain Radial Basis Network

NeurIPS 2025arXiv

UnCLe: Towards Scalable Dynamic Causal Discovery in Non-linear Temporal Systems

NeurIPS 2025arXiv

TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning

NeurIPS 2025arXiv

Enhancing Training Data Attribution with Representational Optimization

NeurIPS 2025arXiv

Conservative classifiers do consistently well with improving agents: characterizing statistical and online learning

NeurIPS 2025arXiv

Conditional Representation Learning for Customized Tasks

NeurIPS 2025arXiv

MeCeFO: Enhancing LLM Training Robustness via Fault-Tolerant Optimization

NeurIPS 2025arXiv

ProteinConformers: Benchmark Dataset for Simulating Protein Conformational Landscape Diversity and Plausibility