Dahun Kim

3

Papers

31

Total Citations

Papers (3)

Mirasol3B: A Multimodal Autoregressive Model for Time-Aligned and Contextual Modalities

Region-centric Image-Language Pretraining for Open-Vocabulary Detection

VideoComp: Advancing Fine-Grained Compositional and Temporal Alignment in Video-Text Models