Taesu Kim

3

Papers

101

Total Citations

Papers (3)

OWQ: Outlier-Aware Weight Quantization for Efficient Fine-Tuning and Inference of Large Language Models

GraLoRA: Granular Low-Rank Adaptation for Parameter-Efficient Fine-Tuning

NeurIPS 2025arXiv

SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks