Javier Rando

4

Papers

185

Total Citations

1

Affiliations

Affiliations

ETH Zurich

Papers (4)

Universal Jailbreak Backdoors from Poisoned Human Feedback

Adversarial Perturbations Cannot Reliably Protect Artists From Generative AI

Persistent Pre-training Poisoning of LLMs

AutoAdvExBench: Benchmarking Autonomous Exploitation of Adversarial Example Defenses