首页 > 其他分享 >95_api_intro_websitetools_readability

95_api_intro_websitetools_readability

时间:2024-11-07 15:45:31浏览次数:1  
标签:string api 接口 intro 文章 websitetools Data readability

网页可读内容抽取 API 数据接口

智能提取文章关键元素信息,智能抽取,多种元素信息。

gugudata_api_cover

1. 产品功能

  • 智能提取网页可阅读内容;
  • 提供网页可阅读内容的 HTML 代码;
  • 支持传递网页 HTML 或网页 URL 参数;
  • 支持多种元素信息抽取,包括文章标题、作者、文字方向、语言、内容、内容(不包含 HTML 标签,按段落分割)、文章长度、文章摘要、网站名称、文章发布时间;
  • 秒级解析性能,支持高并发;
  • 数据持续更新与维护;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;
  • 接口调用状态与状态监控

2. API 文档

接口详情: https://www.gugudata.com/api/details/readability

接口地址: https://api.gugudata.com/websitetools/readability

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/websitetools/readability

数据预览: https://www.gugudata.com/preview/readability

接口测试: https://api.gugudata.com/websitetools/readability/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
appkey string YOUR_APPKEY 付费后获取的 APPKEY
html string YOUR_VALUE 需要抽取的网页 HTML 内容,与参数 url 二选一
url string YOUR_VALUE 需要抽取的网页 URL 地址,与参数 html 二选一。(我们不处理因源站反爬而不能正常请求网页内容进行后续处理的问题)

4. 返回参数

参数名 参数类型 备注
DataStatus.RequestParameter string 接口请求参数
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data.Title string 文章标题
Data.Byline string 文章作者
Data.Dir string 文章文字方向
Data.Lang string 文章语言
Data.Content string 文章内容
Data.TextContent string 文章内容(不包含 HTML 标签,按段落分割)
Data.Length int 文章长度
Data.Excerpt string 文章摘要
Data.SiteName string 网站名称
Data.PublishedTime string[] 文章发布时间

标签:string,api,接口,intro,文章,websitetools,Data,readability
From: https://www.cnblogs.com/parry/p/18532426

相关文章

  • 94_api_intro_stock_stockbidask
    A股买卖盘口数据API数据接口不同价格级别买卖数量和报价,股票交易数据,盘口分析。1.产品功能实时更新股票盘口数据;支持A股所有股票;支持按股票代码查询;高效、稳定的数据获取体验;毫秒级查询性能;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全......
  • 93_api_intro_finance_optionsrealtime
    期权实时行情数据最新价格、交易量、交易额等信息,期权行情实时数据,市场交易数据。1.产品功能实时更新期权市场数据;覆盖主要期权合约;支持多种数据参数,包括价格、交易量、持仓量等;提供详细的市场分析和数据解读;高效、稳定的数据获取体验;秒级查询性能;数据持续更新与维护;......
  • 92_api_intro_stock_stockcncashflow
    A股个股资金流API数据接口全量股票资金流数据,全量A股数据,最长30日历史数据1.产品功能支持所有A股资金流数据查询;每日定时更新数据;支持多达30日历史数据查询;超高的查询效率,数据秒级返回;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容......
  • 91_api_intro_stock_stockcncashflowrank
    A股个股资金流排行API数据接口全量股票资金流排名,多时间区间,全量A股数据。1.产品功能支持所有A股资金流数据查询;每日定时更新数据;支持多时间段查询;超高的查询效率,数据秒级返回;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容AppleATS;......
  • 90_api_intro_stock_currencyexchange
    国际货币汇率API数据接口支持多种货币对,每日精准汇率,多币种支持。1.产品功能支持多种货币汇率查询;支持部分加密货币汇率查询;数据为每日更新汇率数据;可一次查询源货币代码对应所有目标货币汇率;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面......
  • 89_api_intro_websitetools_whois
    域名Whois查询API数据接口多类型域名支持,精准Whois数据,实时数据。1.产品功能支持国际、国内域名Whois查询;每小时定时更新基础数据库;提供精准、高效的Whois查询;返回可查询最详细的域名相关信息;秒级查询性能,支持高并发;数据持续更新与维护;全接口支持HTTPS(TLS......
  • 88_api_intro_location_internationaliplocation
    国际IP地址定位API数据接口兼容IPv4与IPv6兼容,IPv4/IPv6,全球IP地址定位。![gugudata_api_cover](/Users/Parry/Library/MobileDocuments/iCloudcomgl9~markdowns/Documents/GuGuData/API/api_cover_location_internationaliplocation.png)1.产品功能支持全球IP......
  • kubectl命令强制删除一直terminating的namespace(通过API直接修改Namespace的Finalizer
    要强制删除处于“Terminating”状态的ingress-nginx命名空间,您可以按照以下步骤操作:获取命名空间的JSON描述并保存到文件:kubectlgetnamespaceingress-nginx-ojson>ingress-nginx.json编辑保存的JSON文件:打开ingress-nginx.json文件,找到metadata.fina......
  • 80_api_intro_weather_sunriseandsunset
    日出与日落时间API数据接口多个天文指标,全国多个城市,支持历史数据。1.产品功能支持全国多个城市精准查询;多个天文曙暮光指标;包含白日时长以及相对变化值;返回每日正午时间点以及日地距离;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容Ap......
  • 79_api_intro_weather_lunarcalendar
    农历与二十四节气API数据接口任意日期查询,农历日期返回,全年节气。1.产品功能支持任意日期的农历与二十四节气查询;节气包含当日、下一个以及全年节气与日期;同时返回农历中文;数据持续更新与维护;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容AppleATS;全国......