功能描述
文档信息提取接口为综合接口可以实现PDF提取图片、PDF提取表格,文档页数提取、OFD文档语义数提取、OFD元数据提取,处理完成后保留原始文档的版面样式和内容信息。
支持的文档格式有: .pdf .ofd
调用方法
1、请求URL
http://conv.hidocview.cn/xconvert?type=type参数值
2、请求方法
HTTP POST
3、请求参数
参数名 | 参数值 | 类型 | 必填 | 传参方式 | 参数说明 |
type | 2041 | string | 是 | query | Word、Excel、PDF提取图片 |
2042 | PDF提取表格 | ||||
2043 | 文档提取页数 | ||||
2044 | 提取OFD文档语树 | ||||
2045 | 提取OFD文档元数据 | ||||
2046 | 提取word和pdf文档内的文字导出成为txt文件 | ||||
file | file | 是 | form | 上传本地文件,不支持上传多个文件 | |
page_no | int | 是 | form | 设置需要提取第几页的内容,此参数只适用于2041、2042 | |
appid | string | 是 | form | 应用ID | |
appkey | string | 是 | form | 应用key |
4、响应信息
详情请参考:通用API > API调用返回响应信息
注意:
appid和appkey的获取请参考:API概览 > 文档服务接入步骤
在客户端/浏览器端储存appid 和appkey 是一件风险极大的事情极易造成appid 和appkey的泄露可能会导致资源包的盗用。
添加客服微信为您提供1对1的专业解答