Hongfa Wang

5

Papers

360

Total Citations

Papers (5)

LanguageBind: Extending Video-Language Pretraining to N-modality by Language-based Semantic Alignment

InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models

CoHD: A Counting-Aware Hierarchical Decoding Framework for Generalized Referring Expression Segmentation

Infinite-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation

Follow-Your-Click: Open-domain Regional Image Animation via Motion Prompts