Sayash Kapoor

5

Papers

19

Total Citations

Papers (5)

Establishing Best Practices in Building Rigorous Agentic Benchmarks

Position: Build Agent Advocates, Not Platform Agents

Position: In-House Evaluation Is Not Enough. Towards Robust Third-Party Evaluation and Flaw Disclosure for General-Purpose AI

Position: A Safe Harbor for AI Evaluation and Red Teaming

Position: On the Societal Impact of Open Foundation Models