
Written By

技能练习生
快速上手
假设你刚加入一家电商公司,数据仓库用的是 BigQuery,里面有几百个表。你想让 AI 帮你写查询,但它完全不了解你们的业务——哪个表是订单、哪个表是用户、"GMV"怎么算。别急,用 Data Context Extractor 半小时就能搞定。
准备工作
确保你能够访问数据仓库 (有权限查询 schema),这个技能需要连接数据库来探索表结构。
第一次尝试
直接用自然语言告诉 AI 你的需求:
"我刚加入这家公司,想为我们的 BigQuery 数据仓库创建一个数据分析技能。主要关注电商的核心表,比如订单、用户、商品这些。"会发生什么
AI 会先连接你的 BigQuery,列出所有可用的数据集和表。然后它会问你这几个关键问题:
- "最重要的 3-5 个表是哪些?" —— 你告诉它:orders、users、products、events
- "当你们说'用户',具体指什么?有不同类型吗?" —— 你解释:我们有注册用户和访客,注册用户又分普通用户和 VIP,用 user_id 关联
- "最常问的 2-3 个指标是什么?怎么算的?" —— 你说:GMV(订单总金额,不含退款)、转化率 (下单用户/访客数)、复购率
- "查询时一定要过滤掉什么?" —— 你提醒:测试订单 (is_test=true)、内部用户 (company_email 后缀)
- "新人最容易犯什么错?" —— 你分享:orders 表有多个状态,要用 status='completed' 过滤,别把取消的订单也算进去
整个过程就像在跟一位经验丰富的同事聊天,他把关键知识点都记录下来。
你会得到什么
大约 20-30 分钟后,AI 会生成一个完整的技能包,包含:
- SKILL.md: 技能的"使用手册",说明如何用这个技能进行数据分析
- references/entities.md: 核心实体的定义 (用户、订单、商品是什么关系)
- references/metrics.md: 关键指标的计算公式和注意事项
- references/tables/: 每个核心表的详细说明 (字段含义、更新频率、关联关系)
- references/queries.md: 常用查询模板和最佳实践
把这个技能包安装到 Claude Code,之后你让 AI "帮我看下这个月的 GMV 趋势",它就能精准地写出符合你们业务逻辑的 SQL,不会再把测试订单算进去了。
小贴士
如果后续你想加入新领域的知识 (比如营销数据的投放表),不用从头再来。直接说 "给这个技能加上营销数据的表和指标",AI 会加载现有技能,针对性地补充新内容。