让大模型估基数:赢在精度,输在每次都估
基数估计是优化器的心脏。北大和字节团队拿 Llama-3 8B 微调后做 CardEst,在 IMDB、STATS 等负载上 Q-error 99 分位最高比最佳 baseline(PRICE)降 74.1%——精度是真赢了。但端到端一测就翻车:在 JOB-light、ErgastF1 上,LLM 更准的计划反被它自己的推理延迟拖累,总时间比最强 baseline PRICE 还长。真正的工程贡献不是模型,是那个用优化器成本模型当看门人的门控:只对高成本子查询调 LLM,其余交给老办法。