---
name: ai-search-content-visibility
description: "当用户需要使用咕咕数据公开 API 完成AI 搜索可见性、业务数据组合、参数传递、接口选型或结果校验时使用；不适用于绕过接口详情页、购买规则或人工复核要求的场景。"
---

# AI 搜索与内容可见性 Skill

面向 AI 搜索可见性、AEO/GEO 巡检、品牌提及监控和内容增长复盘的公开 API 组合。

## 业务场景

用于 AI 搜索可见性、AEO/GEO 巡检、品牌提及监控、内容增长复盘和竞品内容分析。适合把搜索可见性、页面质量、正文抽取、实体识别、关键词、摘要、情感、润色和翻译组合成内容诊断链路。

- 数据范围：覆盖搜索可见性观测、页面性能、URL 到 Markdown、正文抽取、页面链接、网站快照、文章结构化、关键词、实体、摘要、情感、文章润色和多语言翻译。
- 关键数据维度：品牌维度：品牌名、别名、产品词、竞品名和目标市场。；页面维度：URL、标题、正文、链接、截图、性能和可读性。；内容维度：关键词、实体、摘要、情感倾向、语种和可引用段落。

## 何时使用

- 判断品牌、产品或专题页在 AI 搜索和传统搜索入口中的可见性。
- 分析页面正文、实体、关键词、链接和性能是否支撑回答型搜索引用。
- 对竞品内容、改版前后页面和多语言页面做结构化复盘。

## 不适用场景

- 用户只需要查看某一个接口的完整参数、响应字段、价格或购买入口时，直接打开接口详情页。
- 用户希望绕过接口开通、鉴权、配额或人工复核要求时，不应使用 Skill 作为替代。
- 任务需要法律、医疗、金融投资或升学录取的最终决策时，Skill 只能提供数据辅助和复核线索。

## 用户需要提供的信息

- 品牌名、核心产品词、目标 URL、竞品 URL、目标市场、目标语言和观察周期。
- 需要检查的可见性问题：AI 搜索提及、页面质量、内容结构、实体覆盖、情感倾向或多语言版本。
- 调用接口所需的 AppKey、开通状态和接口详情页限制。

## 推荐工作流

1. 先用品牌名、关键词和目标 URL 建立搜索可见性观测。
2. 再用页面性能、正文抽取、链接提取和快照接口补齐页面证据。
3. 最后用关键词、实体、摘要、情感、润色和翻译接口生成内容优化建议。

## 参数传递关系

- 先用品牌名、关键词和 URL 创建搜索可见性任务，保留每次观测的查询词、URL、品牌提及和竞品提及。
- 目标 URL 继续传给页面性能、URL 转 Markdown、正文抽取、链接提取和快照接口，形成页面质量证据。
- 抽取出的正文继续传给关键词、实体、摘要和情感接口，用来判断内容是否覆盖用户问题、品牌实体和产品卖点。
- 需要改写时把原文、关键词和目标语言传给文章润色或多语言翻译接口，输出改版建议而不是直接覆盖原文。

## 典型任务模板

- AI 搜索巡检：输入品牌、产品词、目标 URL 和竞品 URL；输出提及情况、页面质量证据、缺失实体和内容改进清单。
- 内容改版复核：输入改版前后 URL；输出可见性、正文结构、关键词和情感变化。
- 多语言可见性：输入中文页面和目标语言；输出翻译建议、实体一致性和本地化风险。

## 接口与关键参数

统一鉴权：调用接口前需要准备咕咕数据 AppKey。推荐在服务端通过 Header 传递 AppKey；历史 Query 参数 `appkey` 仍以接口详情页说明为准。

### 搜索可见性 SERP 数据接口

- 业务角色：搜索可见性
- 调用阶段：可见性观测
- 接口地址：`POST https://api.gugudata.com/v1/searchVisibilityReports`
- 产出用途：用于观察品牌、关键词和页面在搜索入口中的可见性。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性；地区参数来自用户输入、行政区划查询结果或定位结果
- 可参考的相关能力：获取搜索可见性报告、搜索可见性报告列表、创建搜索可见性观测任务、搜索可见性观测任务列表、获取搜索可见性观测任务
- 接口资料：详情页 https://www.gugudata.com/api/details/search-visibility；接口 Markdown https://www.gugudata.com/api/details/search-visibility/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `domain` | 是 | `string` | - | 需要观测的主域名，长度 1-255。可传 gugudata.com 或 https://www.gugudata.com，系统会按主域名规范化。 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `brand` | 是 | `string` | - | 品牌或产品名称，长度 1-120。用于匹配标题、摘要和结果链接中的品牌信号。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `queries` | 是 | `array` | - | 需要观测的搜索关键词列表，1-50 个。创建报告会自动创建首个观测任务，按关键词数量计入 credits 计算。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `sources` | 是 | `array` | - | 搜索来源，1-3 个；支持 google_web、bing_web、baidu_web。Google/Bing 在 maxRank=10/20/50 时分别消耗 1/2/5 credits；Baidu 同等排名深度消耗 10/20/50 credits。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `displayName` | 否 | `string` | - | 报告显示名称，便于在列表中识别，不传时可由业务侧使用 brand/domain 展示。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `aliases` | 否 | `array` | - | 品牌别名列表，最多 20 个；用于补充匹配英文名、简称、产品名等品牌信号。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `competitors` | 否 | `array` | - | 竞品域名定义列表，最多 10 个；每项支持 domain、name、aliases，用于计算竞品排名和差距。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `locale` | 否 | `string` | - | 语言区域提示，如 zh-CN、en-US。不同搜索来源会尽量按该提示观测。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `region` | 否 | `string` | - | 地域提示，如 CN、US、HK。不同地域的排名可能不同。 | 地区参数来自用户输入、行政区划查询结果或定位结果 |
| `maxRank` | 否 | `integer` | 20 | 观测排名深度，仅支持 10、20、50，默认 20。Google/Bing 分别消耗 1/2/5 credits，Baidu 分别消耗 10/20/50 credits。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

完整请求参数、响应字段和调用示例以接口 Markdown 为准：https://www.gugudata.com/api/details/search-visibility/llm.md

### 网页性能与 SEO 评分

- 业务角色：页面性能评分
- 调用阶段：页面质量
- 接口地址：`GET https://api.gugudata.com/websitetools/pagespeed-score`
- 产出用途：用于判断页面性能和基础质量。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口资料：详情页 https://www.gugudata.com/api/details/pagespeed-score；接口 Markdown https://www.gugudata.com/api/details/pagespeed-score/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | - | 需要检测评分的网页 URL，必须是有效的 HTTP 或 HTTPS 链接，例如：https://www.baidu.com。 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `strategy` | 否 | `string` | mobile | 检测策略，可选 mobile 或 desktop，默认 mobile。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `locale` | 否 | `string` | zh-CN | 返回语言区域，默认 zh-CN。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `categories` | 否 | `string` | - | 评分类别，可选 performance、accessibility、best-practices、seo；多个值用英文逗号分隔，不传时返回全部类别。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `forceRefresh` | 否 | `boolean` | false | 是否重新检测并刷新结果，默认 false；false 时可优先返回近期已有检测结果。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 网页 URL 转 Markdown

- 业务角色：网页转 Markdown
- 调用阶段：内容抽取
- 接口地址：`GET https://api.gugudata.com/websitetools/url2markdown`
- 产出用途：用于把目标页面转换成可分析文本。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口资料：详情页 https://www.gugudata.com/api/details/url2markdown；接口 Markdown https://www.gugudata.com/api/details/url2markdown/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | https://www.example.com | 需要转换的网页 URL 地址，必须是有效的 HTTP 或 HTTPS 链接 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |

### 网页可读内容抽取

- 业务角色：正文抽取
- 调用阶段：内容抽取
- 接口地址：`POST https://api.gugudata.com/websitetools/readability`
- 产出用途：用于抽取网页可读正文。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口资料：详情页 https://www.gugudata.com/api/details/readability；接口 Markdown https://www.gugudata.com/api/details/readability/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 否 | `string` | https://www.gugudata.com | 待抽取的网页 URL；url 与 html 至少传入一个。 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `html` | 否 | `string` | - | 待抽取的 HTML 原文；url 与 html 至少传入一个。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 网页 URL 链接提取

- 业务角色：链接提取
- 调用阶段：内容抽取
- 接口地址：`GET https://api.gugudata.com/websitetools/url2links`
- 产出用途：用于分析页面内外链结构。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口资料：详情页 https://www.gugudata.com/api/details/url2links；接口 Markdown https://www.gugudata.com/api/details/url2links/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | https://www.gugudata.com | 需要提取链接的网页 URL，需包含 http 或 https 协议。 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |

### 网站截图与 HTML 快照

- 业务角色：网站快照
- 调用阶段：页面证据
- 接口地址：`POST https://api.gugudata.com/websitetools/url2snapshot`
- 产出用途：用于保留页面截图和 HTML 快照。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性；号码来自用户输入、表单线索或上一轮内容抽取结果
- 接口资料：详情页 https://www.gugudata.com/api/details/url2snapshot；接口 Markdown https://www.gugudata.com/api/details/url2snapshot/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | https://www.example.com | 需要截图的网页 URL 地址，必须是有效的 HTTP 或 HTTPS 链接 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `responseFormat` | 否 | `string` | base64 | 返回格式，可选值：base64（返回 base64 编码的图片数据）、url（返回图片 URL 链接） | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `fullPage` | 否 | `boolean` | true | 是否截取完整页面，true 为全页面截图，false 为可视区域截图 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `width` | 否 | `integer` | 1920 | 截图宽度，单位像素，范围：320-3840 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `height` | 否 | `integer` | 1080 | 截图高度，单位像素，范围：240-2160 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `deviceScaleFactor` | 否 | `number` | 1 | 设备像素比，影响截图清晰度，范围：1-3 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `userAgent` | 否 | `string` | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 | 用户代理字符串，用于模拟不同的浏览器 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `isMobile` | 否 | `boolean` | false | 是否模拟移动设备，true 为移动设备模式，false 为桌面模式 | 号码来自用户输入、表单线索或上一轮内容抽取结果 |

### 文章抽取信息化 JSON

- 业务角色：文章结构化
- 调用阶段：文本理解
- 接口地址：`POST https://api.gugudata.com/ai/v1/articles/extract`
- 产出用途：用于提取文章标题、正文和结构化信息。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口资料：详情页 https://www.gugudata.com/api/details/article-extract；接口 Markdown https://www.gugudata.com/api/details/article-extract/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | N/A | 需要提取文章内容的网页 URL 地址 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |

### 多语言长文本 AI 关键字提取

- 业务角色：关键词提取
- 调用阶段：文本理解
- 接口地址：`POST https://api.gugudata.com/ai/keyword-extraction`
- 产出用途：用于识别页面核心词和主题覆盖。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果；关键词来自用户关注的品牌词、产品词、竞品词或页面主题
- 接口资料：详情页 https://www.gugudata.com/api/details/keyword-extraction；接口 Markdown https://www.gugudata.com/api/details/keyword-extraction/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `textContent` | 是 | `string` | N/A | 需要提取关键词的文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `keywordMaxLength` | 否 | `integer` | 5 | 单个关键字长度限制，不传递默认长度为 5 个字符 | 关键词来自用户关注的品牌词、产品词、竞品词或页面主题 |
| `streaming` | 否 | `boolean` | false | 是否流式响应，如果为 true，那么接口会流式输出纯文本，在最后一个消息输出完整结果的 JSON。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 文本多语言 AI 摘要

- 业务角色：文本摘要
- 调用阶段：文本理解
- 接口地址：`POST https://api.gugudata.com/ai/text-summarize`
- 产出用途：用于压缩页面内容和竞品内容。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口资料：详情页 https://www.gugudata.com/api/details/summarize-text；接口 Markdown https://www.gugudata.com/api/details/summarize-text/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `textContent` | 是 | `string` | N/A | 需要生成摘要的文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `streaming` | 否 | `boolean` | false | 是否流式响应，如果为 true，那么接口会流式输出纯文本，在最后一个消息输出完整结果的 JSON。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### NLP 命名实体识别

- 业务角色：实体识别
- 调用阶段：文本理解
- 接口地址：`POST https://api.gugudata.com/text/entityrecognition`
- 产出用途：用于识别品牌、产品、机构和地点实体。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口资料：详情页 https://www.gugudata.com/api/details/nlpentityrecognition；接口 Markdown https://www.gugudata.com/api/details/nlpentityrecognition/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `content` | 是 | `string` | YOUR_VALUE | 文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |

### 多语言文本 AI 情感分析

- 业务角色：情感分析
- 调用阶段：文本理解
- 接口地址：`POST https://api.gugudata.com/ai/sentiment-analysis`
- 产出用途：用于判断品牌或内容情绪倾向。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口资料：详情页 https://www.gugudata.com/api/details/sentiment-analysis；接口 Markdown https://www.gugudata.com/api/details/sentiment-analysis/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `textContent` | 是 | `string` | N/A | 需要进行情感分析的文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `streaming` | 否 | `boolean` | false | 是否流式响应，如果为 true，那么接口会流式输出纯文本，在最后一个消息输出完整结果的 JSON。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 文章自然润色

- 业务角色：文章润色
- 调用阶段：内容优化
- 接口地址：`POST https://api.gugudata.com/ai/article-polishing`
- 产出用途：用于生成面向用户和 AI 引用的内容改写建议。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口资料：详情页 https://www.gugudata.com/api/details/article-polishing；接口 Markdown https://www.gugudata.com/api/details/article-polishing/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `content` | 是 | `string` | - | 需要润色的文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `streaming` | 否 | `boolean` | false | 是否流式响应，如果为 true，那么接口会流式输出纯文本，在最后一个消息输出完整结果的 JSON。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 多语言 AI 翻译

- 业务角色：多语言翻译
- 调用阶段：内容优化
- 接口地址：`POST https://api.gugudata.com/ai/multilingual-translation`
- 产出用途：用于多语言内容可见性扩展。
- 参数来源：语言参数来自目标市场或页面原始语言；文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口资料：详情页 https://www.gugudata.com/api/details/multilingual-translation；接口 Markdown https://www.gugudata.com/api/details/multilingual-translation/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `language` | 是 | `string` | - | 目标语言，目标语言支持自然语言或者 ISO 639 language code，如日语、日文、jp、japanese | 语言参数来自目标市场或页面原始语言 |
| `content` | 是 | `string` | - | 需要翻译的文本内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `streaming` | 否 | `boolean` | false | 是否流式响应，如果为 true，那么接口会流式输出纯文本，在最后一个消息输出完整结果的 JSON。 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

## 数据校验与使用边界

- AI 搜索结果波动较大，输出时必须记录观测时间、关键词和页面 URL。
- 内容优化建议不能伪造事实、资质、评价或第三方引用。
- 搜索可见性需要和真实搜索控制台、日志和转化数据结合复核。

## 输出建议

- 输出可见性诊断时按品牌提及、页面质量、实体覆盖和内容建议分段。
- 对每个建议保留对应 URL、正文片段和可复核接口链接。
- 多语言内容建议应区分翻译、事实核对和本地化表达。

## 常见问题

- 问：什么情况下应该使用这个 Skill？ 答：当用户提出的目标需要多个咕咕数据公开 API 组合完成，而不是只查询一个接口时，优先阅读这个 Skill。
- 问：这个 Skill 是否需要单独购买？ 答：不需要。Skill 文档只负责业务流程和接口选型，具体接口购买、价格和账号权益仍以接口详情页为准。
- 问：Agent 应该怎样使用这个 Skill？ 答：Agent 应先阅读 SKILL.md，确认业务场景和推荐工作流，再进入接口详情页核对参数、响应字段、价格和调用示例。
- 问：调用接口前需要先核对什么？ 答：需要核对业务对象、地区、时间范围、输入格式、必填参数、返回字段、购买状态和接口详情页中的限制说明。
- 问：AI 搜索与内容可见性 Skill 会替代接口文档吗？ 答：不会。Skill 负责说明业务组合和调用顺序，接口参数、响应结构、计费和购买入口仍以接口详情页为准。

