Hilde Kuehne

8

Papers

134

Total Citations

2

Affiliations

Affiliations

Goethe University FrankfurtMIT-IBM Watson AI Lab

Papers (8)

Grounding Everything: Emerging Localization Properties in Vision-Language Transformers

HowToCaption: Prompting LLMs to Transform Video Annotations at Scale

LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity

CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment

Teaching VLMs to Localize Specific Objects from In-context Examples

Unbiasing through Textual Descriptions: Mitigating Representation Bias in Video Benchmarks

VideoGEM: Training-free Action Grounding in Videos

What When and Where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions