---
name: news-content-general-tools
description: "当用户需要使用咕咕数据公开 API 完成内容聚合、业务数据组合、参数传递、接口选型或结果校验时使用；不适用于绕过接口详情页、购买规则或人工复核要求的场景。"
---

# 资讯内容与通用数据工具 Skill

面向文章正文、公众号封面、内容图片、笑话、ISBN、号码归属和通用工具的公开 API 组合。

## 业务场景

用于资讯内容整理、文章正文抽取、公众号封面、笑话内容、ISBN、号码归属地、国际号码和轻量通用工具。适合运营后台、内容聚合、资料整理和客服辅助查询。

- 数据范围：覆盖新闻资讯、文章正文、公众号封面、笑话、ISBN、手机归属地、国际号码、二维码和排版整理等通用数据。
- 关键数据维度：内容维度：标题、正文、来源 URL、封面、发布时间和可读文本。；资料维度：ISBN、号码、归属地、国家地区和校验结果。；工具维度：二维码、格式化、轻量查询和运营辅助。

## 何时使用

- 从 URL 或公众号文章中提取正文、封面和可整理内容。
- 查询 ISBN、手机归属地、国际号码和轻量资料信息。
- 为运营工具、内容库、客服系统和日常查询提供辅助能力。

## 不适用场景

- 用户只需要查看某一个接口的完整参数、响应字段、价格或购买入口时，直接打开接口详情页。
- 用户希望绕过接口开通、鉴权、配额或人工复核要求时，不应使用 Skill 作为替代。
- 任务需要法律、医疗、金融投资或升学录取的最终决策时，Skill 只能提供数据辅助和复核线索。

## 用户需要提供的信息

- 文章 URL、公众号链接、ISBN、号码、文本或轻量查询对象。
- 输出目标：正文抽取、封面获取、归属地查询、内容整理或运营辅助。
- 调用接口所需的 AppKey、开通状态和接口详情页限制。

## 推荐工作流

1. 先按来源 URL 抽取正文、图片或封面。
2. 再用文本、ISBN、号码等工具补充结构化信息。
3. 需要发布或分享时，结合二维码、截图和文本处理接口。

## 参数传递关系

- 文章 URL 先用于正文、封面或内容抽取，再把正文传给摘要、关键词或排版整理。
- 号码、ISBN 和国际号码查询使用用户输入作为主键，结果只作为辅助资料。
- 内容抽取结果需要保留来源 URL，避免把第三方内容当作版权授权。

## 典型任务模板

- 文章抽取：输入 URL；输出标题、正文、封面、摘要和来源。
- 号码查询：输入手机号或国际号码；输出归属地、国家地区和使用边界。
- 资料查询：输入 ISBN 或轻量查询对象；输出结构化资料和复核提示。

## 接口与关键参数

统一鉴权：调用接口前需要准备咕咕数据 AppKey。推荐在服务端通过 Header 传递 AppKey；历史 Query 参数 `appkey` 仍以接口详情页说明为准。

### 获取任意链接文章正文

- 业务角色：文章正文
- 调用阶段：内容抽取
- 接口地址：`POST https://api.gugudata.com/news/fetchcontent`
- 产出用途：用于获取任意链接文章正文。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性；文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口详情页：https://www.gugudata.com/api/details/fetchcontent
- 接口 Markdown：https://www.gugudata.com/api/details/fetchcontent/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | YOUR_VALUE | 需要抓取正文的文章链接 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `contentwithhtml` | 否 | `boolean` | false | 返回的文章是否包含 HTML 标签 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `htmlsourcecontent` | 否 | `boolean` | false | 是否返回文章页面原始 HTML 内容，供您二次解析或分析正文失败时使用，需要注意接口的性能问题 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |

### 获取任意链接正文图片

- 业务角色：正文图片
- 调用阶段：内容抽取
- 接口地址：`POST https://api.gugudata.com/news/fetchcontentimages`
- 产出用途：用于获取任意链接正文图片。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性；文件或图片来自用户上传、公开 URL 或上一轮转换结果；文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口详情页：https://www.gugudata.com/api/details/fetchcontentimages
- 接口 Markdown：https://www.gugudata.com/api/details/fetchcontentimages/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | YOUR_VALUE | 需要抓取正文的文章链接 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |
| `limittype` | 否 | `string` | YOUR_VALUE | 对图片大小进行筛选条件类型，参数值为 size 或 ratio。size：按照图片大小 (KB) 进行筛选，ratio：按照图片分辨率 [宽,高] 进行筛选 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `limitvalue` | 否 | `float / [int,int]` | YOUR_VALUE | 对图片大小进行筛选条件值，如果类型为 size，参数值格式为 float 类型的图片最小限制值（单位为 KB），如果类型为 ratio，参数值格式为 int 数组 [宽,高]，分别限制最小宽与高（单位为像素） | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `imagewithtag` | 否 | `boolean` | false | 是否返回获取到的图片原始 img HTML 标签 | 文件或图片来自用户上传、公开 URL 或上一轮转换结果 |
| `htmlsourcecontent` | 否 | `boolean` | false | 是否返回文章页面原始 HTML 内容，供您二次解析或分析正文图片列表失败时使用，需要注意接口的性能问题 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |

### 获取公众号文章封面

- 业务角色：公众号封面
- 调用阶段：内容抽取
- 接口地址：`GET https://api.gugudata.com/news/wxarticlecover`
- 产出用途：用于获取公众号文章封面。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口详情页：https://www.gugudata.com/api/details/wxarticlecover
- 接口 Markdown：https://www.gugudata.com/api/details/wxarticlecover/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | https://mp.weixin.qq.com/s/xxxx | 微信公众号文章 URL，需要传入完整链接。 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |

### 幽默笑话大全

- 业务角色：笑话内容
- 调用阶段：内容数据
- 接口地址：`GET https://api.gugudata.com/news/joke`
- 产出用途：用于查询幽默笑话大全。
- 参数来源：分页参数由调用方控制，用于分批读取结果
- 接口详情页：https://www.gugudata.com/api/details/joke
- 接口 Markdown：https://www.gugudata.com/api/details/joke/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `type` | 是 | `string` | YOUR_VALUE | 笑话分类，支持类型：'所有','经典','名著暴笑','爆笑男女','哈哈趣闻','原创','恐怖','爱情','校园','幽默','儿童','爆笑','综合','动物','顺口溜','搞笑歌词','恋爱必读','英语','短信','求爱秘籍','极品','数学','一句话','短笑话','小笑话','内涵','冷笑话','重口味','整人','各地方言','短篇','搞笑','简短','超级','数码' | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `pageindex` | 否 | `integer` | 1 | 页码 | 分页参数由调用方控制，用于分批读取结果 |
| `pagesize` | 否 | `integer` | 10 | 每页数据量，参数最大值为 100 | 分页参数由调用方控制，用于分批读取结果 |

### 国际标准书号 ISBN

- 业务角色：ISBN 查询
- 调用阶段：资料查询
- 接口地址：`GET https://api.gugudata.com/text/isbn`
- 产出用途：用于国际标准书号 ISBN 查询。
- 参数来源：关键词由用户输入或从上一轮内容抽取结果中生成；分页参数由调用方控制，用于分批读取结果
- 接口详情页：https://www.gugudata.com/api/details/isbn
- 接口 Markdown：https://www.gugudata.com/api/details/isbn/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `keywords` | 否 | `string` | YOUR_VALUE | 图书标题搜索关键字；与 isbn 参数至少传递一个 | 关键词由用户输入或从上一轮内容抽取结果中生成 |
| `pageindex` | 否 | `integer` | 1 | 搜索结果分页参数，第几页 | 分页参数由调用方控制，用于分批读取结果 |
| `pagesize` | 否 | `integer` | 10 | 搜索结果分页参数，每页条数，最大值为 10 | 分页参数由调用方控制，用于分批读取结果 |
| `isbn` | 否 | `string` | YOUR_VALUE | 图书 ISBN；与 keywords 参数至少传递一个，如 9787020002320 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 手机归属地查询

- 业务角色：手机归属地
- 调用阶段：号码工具
- 接口地址：`GET https://api.gugudata.com/sms/mobileattribution`
- 产出用途：用于手机归属地查询。
- 参数来源：由用户输入、业务筛选条件或上一轮接口结果确定
- 接口详情页：https://www.gugudata.com/api/details/mobileattribution
- 接口 Markdown：https://www.gugudata.com/api/details/mobileattribution/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `mobile` | 是 | `string` | YOUR_VALUE | 查询的手机号码 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 国际手机号码检查纠正

- 业务角色：国际号码
- 调用阶段：号码工具
- 接口地址：`GET https://api.gugudata.com/sms/internationalphone`
- 产出用途：用于国际手机号码检查纠正。
- 参数来源：由用户输入、业务筛选条件或上一轮接口结果确定
- 接口详情页：https://www.gugudata.com/api/details/internationalphone
- 接口 Markdown：https://www.gugudata.com/api/details/internationalphone/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `phone` | 是 | `string` | PHONE | 查询的手机号码，如 +1(817) 569-8900 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |
| `countrycode` | 否 | `string` | COUNTRY_CODE | ISO-3166 标准的两位或三位国家代码，用于校验号码在提供的归属国家是否为有效号码，如 US, USA，不传递则智能纠错 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 通用二维码生成

- 业务角色：二维码生成
- 调用阶段：分享工具
- 接口地址：`GET https://api.gugudata.com/barcode/qrcode`
- 产出用途：用于内容分享二维码生成。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口详情页：https://www.gugudata.com/api/details/qrcode
- 接口 Markdown：https://www.gugudata.com/api/details/qrcode/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `content` | 是 | `string` | YOUR_VALUE | 二维码内容，网址类型智能识别 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |
| `size` | 否 | `integer` | 500 | 正整数，二维码尺寸像素，默认为 500 像素 | 由用户输入、业务筛选条件或上一轮接口结果确定。 |

### 网页 URL 转 Markdown

- 业务角色：网页转 Markdown
- 调用阶段：内容整理
- 接口地址：`GET https://api.gugudata.com/websitetools/url2markdown`
- 产出用途：用于网页 URL 转 Markdown。
- 参数来源：URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性
- 接口详情页：https://www.gugudata.com/api/details/url2markdown
- 接口 Markdown：https://www.gugudata.com/api/details/url2markdown/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `url` | 是 | `string` | https://www.example.com | 需要转换的网页 URL 地址，必须是有效的 HTTP 或 HTTPS 链接 | URL 或域名由用户提供，调用前需要确认协议、跳转和可访问性 |

### NLP 中英文排版规范化

- 业务角色：排版规范化
- 调用阶段：内容整理
- 接口地址：`POST https://api.gugudata.com/text/formatarticle`
- 产出用途：用于中英文排版规范化。
- 参数来源：文本内容来自用户输入、网页正文抽取或文档识别结果
- 接口详情页：https://www.gugudata.com/api/details/formatarticle
- 接口 Markdown：https://www.gugudata.com/api/details/formatarticle/llm.md

关键请求参数：

| 参数 | 必填 | 类型 | 默认值 | 说明 | 来源与传递 |
| --- | --- | --- | --- | --- | --- |
| `content` | 是 | `string` | YOUR_VALUE | 需要格式化、规范化的内容 | 文本内容来自用户输入、网页正文抽取或文档识别结果 |

## 数据校验与使用边界

- 内容抽取结果受原站结构、反爬、版权和页面变更影响。
- 号码、ISBN 等轻量查询应作为辅助信息，关键业务要复核。
- 不要把第三方内容抽取结果当作版权授权。

## 输出建议

- 输出内容类结果时保留来源 URL、标题、摘要和封面信息。
- 输出号码或 ISBN 查询时说明查询字段和归属结果。
- 运营工具场景建议返回可直接展示的短文本和复核提示。

## 常见问题

- 问：什么情况下应该使用这个 Skill？ 答：当用户提出的目标需要多个咕咕数据公开 API 组合完成，而不是只查询一个接口时，优先阅读这个 Skill。
- 问：这个 Skill 是否需要单独购买？ 答：不需要。Skill 文档只负责业务流程和接口选型，具体接口购买、价格和账号权益仍以接口详情页为准。
- 问：Agent 应该怎样使用这个 Skill？ 答：Agent 应先阅读 SKILL.md，确认业务场景和推荐工作流，再进入接口详情页核对参数、响应字段、价格和调用示例。
- 问：调用接口前需要先核对什么？ 答：需要核对业务对象、地区、时间范围、输入格式、必填参数、返回字段、购买状态和接口详情页中的限制说明。
- 问：资讯内容与通用数据工具 Skill 会替代接口文档吗？ 答：不会。Skill 负责说明业务组合和调用顺序，接口参数、响应结构、计费和购买入口仍以接口详情页为准。

