• 产品功能
    • 根据提供的文章链接智能分析出文章正文;
    • 返回正文提供了纯文本和包含 HTML 标签两个模式;
    • 接口可同时返回原始 HTML 内容,供您二次解析使用;
    • 数据抓取与文章标签处理基于机器学习;
    • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
    • 全面兼容 Apple ATS;
    • 全国多节点 CDN 部署;
    • 接口极速响应,多台服务器构建 API 接口负载均衡;
    • 接口调用与状态监控
  • API 文档

    接口地址: https://api.gugudata.com/news/fetchcontent

    返回格式: application/json; charset=utf-8

    请求方式: POST

    请求协议: HTTPS

    请求示例: https://api.gugudata.com/news/fetchcontent

    数据预览: https://www.gugudata.com/preview/fetchcontent

    接口测试: https://api.gugudata.com/news/fetchcontent/demo

    请求参数(POST 请求参数以 application/x-www-form-urlencoded 格式传递,具体可参见下方示例代码)

    参数名 参数类型 是否必须 默认值 备注
    appkey string YOUR_APPKEY 付费后获取的 APPKEY
    url string YOUR_VALUE 需要抓取正文的文章链接
    contentwithhtml bool false 返回的文章是否包含 HTML 标签
    htmlsourcecontent bool false 是否返回文章页面原始 HTML 内容,供您二次解析或分析正文失败时使用,需要注意接口的性能问题

    返回参数

    参数名 参数类型 备注
    DataStatus.StatusCode int 接口返回状态码
    DataStatus.StatusDescription string 接口返回状态说明
    DataStatus.ResponseDateTime string 接口数据返回时间
    DataStatus.DataTotalCount int 此条件下的总数据量,此接口返回 1
    Data.Url string 文章 Url
    Data.Title string 文章标题
    Data.Conte