HiDocs - 文档服务API

API概览

文档格式转换

文档内容处理

通用API

Hidocs > 文档内容处理 > 详情

文档信息提取

功能描述

文档信息提取接口为综合接口可以实现PDF提取图片、PDF提取表格,文档页数提取、OFD文档语义数提取、OFD元数据提取,处理完成后保留原始文档的版面样式和内容信息。

支持的文档格式有: .pdf .ofd

调用方法

1、请求URL

http://conv.hidocview.cn/xconvert?type=type参数值

2、请求方法

HTTP POST

3、请求参数

参数名

参数值

类型

必填

传参方式

参数说明

type

2041

string

query

Word、Excel、PDF提取图片

2042

PDF提取表格

2043

文档提取页数

2044

提取OFD文档语树

2045

提取OFD文档元数据

2046

提取word和pdf文档内的文字导出成为txt文件

file


file

form

上传本地文件,不支持上传多个文件

page_no


int

form

设置需要提取第几页的内容,此参数只适用于2041、2042

appid


string

form

应用ID

appkey


string

form

应用key

4、响应信息

详情请参考:通用API > API调用返回响应信息

注意

appid和appkey的获取请参考:API概览 > 文档服务接入步骤

在客户端/浏览器端储存appid 和appkey 是一件风险极大的事情极易造成appid 和appkey的泄露可能会导致资源包的盗用。