<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Cost-Model on Kent Yao</title>
    <link>https://yaooqinn.github.io/zh/tags/cost-model/</link>
    <description>Recent content in Cost-Model on Kent Yao</description>
    <generator>Hugo -- 0.157.0</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sun, 31 May 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://yaooqinn.github.io/zh/tags/cost-model/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>让大模型估基数:赢在精度,输在每次都估</title>
      <link>https://yaooqinn.github.io/zh/posts/query-engines/llm-cardinality-estimator/</link>
      <pubDate>Sun, 31 May 2026 00:00:00 +0000</pubDate>
      <guid>https://yaooqinn.github.io/zh/posts/query-engines/llm-cardinality-estimator/</guid>
      <description>基数估计是优化器的心脏。北大和字节团队拿 Llama-3 8B 微调后做 CardEst,在 IMDB、STATS 等负载上 Q-error 99 分位最高比最佳 baseline(PRICE)降 74.1%——精度是真赢了。但端到端一测就翻车:在 JOB-light、ErgastF1 上,LLM 更准的计划反被它自己的推理延迟拖累,总时间比最强 baseline PRICE 还长。真正的工程贡献不是模型,是那个用优化器成本模型当看门人的门控:只对高成本子查询调 LLM,其余交给老办法。</description>
    </item>
    <item>
      <title>当索引调优器的成本模型说谎时:LLM 在 DTA 看不见的地方</title>
      <link>https://yaooqinn.github.io/zh/posts/query-engines/llm-index-tuning-vs-dta/</link>
      <pubDate>Sat, 30 May 2026 00:00:00 +0000</pubDate>
      <guid>https://yaooqinn.github.io/zh/posts/query-engines/llm-index-tuning-vs-dta/</guid>
      <description>微软团队拿真实企业客户负载评测 LLM 索引调优:在 Real-R 的 query 22 上,SOTA 商用调优器 DTA 推荐的索引导致近 10× 退化,同一条 query,GPT-5 把执行时间从 10 秒压到 4 秒。LLM 赢的地方,恰恰是 what-if 成本模型估错的地方。但这份直觉高方差、缝不进现有架构、也无法廉价验证——它现在不是 DTA 的替代品,是它视野之外的候选索引的来源。</description>
    </item>
  </channel>
</rss>
