Cover

Written By
技能练习生
技能练习生

快速上手

假设你刚加入一家电商公司,数据仓库用的是 BigQuery,里面有几百个表。你想让 AI 帮你写查询,但它完全不了解你们的业务——哪个表是订单、哪个表是用户、"GMV"怎么算。别急,用 Data Context Extractor 半小时就能搞定。

准备工作

确保你能够访问数据仓库 (有权限查询 schema),这个技能需要连接数据库来探索表结构。

第一次尝试

直接用自然语言告诉 AI 你的需求:

"我刚加入这家公司,想为我们的 BigQuery 数据仓库创建一个数据分析技能。主要关注电商的核心表,比如订单、用户、商品这些。"

会发生什么

AI 会先连接你的 BigQuery,列出所有可用的数据集和表。然后它会问你这几个关键问题:

  1. "最重要的 3-5 个表是哪些?" —— 你告诉它:orders、users、products、events
  2. "当你们说'用户',具体指什么?有不同类型吗?" —— 你解释:我们有注册用户和访客,注册用户又分普通用户和 VIP,用 user_id 关联
  3. "最常问的 2-3 个指标是什么?怎么算的?" —— 你说:GMV(订单总金额,不含退款)、转化率 (下单用户/访客数)、复购率
  4. "查询时一定要过滤掉什么?" —— 你提醒:测试订单 (is_test=true)、内部用户 (company_email 后缀)
  5. "新人最容易犯什么错?" —— 你分享:orders 表有多个状态,要用 status='completed' 过滤,别把取消的订单也算进去

整个过程就像在跟一位经验丰富的同事聊天,他把关键知识点都记录下来。

你会得到什么

大约 20-30 分钟后,AI 会生成一个完整的技能包,包含:

  • SKILL.md: 技能的"使用手册",说明如何用这个技能进行数据分析
  • references/entities.md: 核心实体的定义 (用户、订单、商品是什么关系)
  • references/metrics.md: 关键指标的计算公式和注意事项
  • references/tables/: 每个核心表的详细说明 (字段含义、更新频率、关联关系)
  • references/queries.md: 常用查询模板和最佳实践

把这个技能包安装到 Claude Code,之后你让 AI "帮我看下这个月的 GMV 趋势",它就能精准地写出符合你们业务逻辑的 SQL,不会再把测试订单算进去了。

小贴士

如果后续你想加入新领域的知识 (比如营销数据的投放表),不用从头再来。直接说 "给这个技能加上营销数据的表和指标",AI 会加载现有技能,针对性地补充新内容。