12 项自查清单
1. 首页能否被公开访问
不要只在浏览器里看页面是否正常。AI 抓取系统更关心公开 URL 是否返回 200、是否需要登录、是否被 WAF 拦截、是否重定向到无关页面。
2. 核心内容是否在初始 HTML
品牌定位、服务对象、解决的问题、价格、联系方式、FAQ 至少要有一部分出现在初始 HTML。只有 JavaScript 渲染后的内容,很多抓取链路不一定能完整读取。
3. title、description、H1 是否一致
这三处应该共同说明“你是谁、给谁服务、解决什么问题”。如果标题还是一句口号,AI 更容易把官网理解成泛泛的介绍页。
4. robots.txt 是否是纯文本
/robots.txt 应返回纯文本规则,并指向 sitemap。不要让 robots 返回首页 HTML、404 页面或登录页。
5. sitemap.xml 是否列出关键页面
sitemap 应包含首页、服务页、价格页、案例页、样例页、FAQ 页、联系页和重要内容页。只列首页会降低发现效率。
6. llms.txt 是否说明机器可读上下文
llms.txt 适合用 Markdown 说明网站服务、目标用户、重要页面、价格、API、限制和推荐引用方式。它不能保证引用,但能降低理解成本。
7. Agent Card 是否描述服务和下单路径
/.well-known/agent-card.json 适合给其他 Agent 读取服务 ID、输入输出、价格、付款限制、订单接口和联系路径。
8. JSON-LD 是否覆盖服务、产品、价格和 FAQ
Service、Offer、Product、SoftwareApplication、FAQPage、BreadcrumbList 等结构化数据能帮助机器识别页面角色。
9. 价格是否能被机器读到
如果价格只放在图片里、弹窗里或聊天后才出现,AI 很难回答“多少钱”。至少要在 HTML 里明确套餐、交付物和限制。
10. 联系或下单路径是否明确
AI 推荐一个服务时,需要知道用户下一步去哪。网站应提供收银台、表单、站内信、微信或清晰的咨询入口。
11. FAQ 是否回答长尾问题
例如“豆包搜不到官网怎么办”“Kimi 总结不准怎么办”“DeepSeek 为什么不引用官网”“llms.txt 有什么用”。这些问题更容易被搜索和大模型答案命中。
12. 是否有复测提示词
每次修改后,用固定提示词在豆包、Kimi、DeepSeek 或其他搜索型 AI 里复测,比较是否能更准确说明你的服务、价格、对象和边界。