Logo
核心能力/智能抽取

智能文档抽取

EasyDoc 支持从合同、表单、报表、简历等任意文档图像中进行 开放式、封闭式或自定义指令驱动 的信息抽取。 无需预定义模板,适应多样布局,输出扁平化结构数据,赋能智能 Agent 与知识库构建。

接口概览

属性说明
接口名称EasyDoc-智能抽取(异步)
请求方法POST
请求地址https://api.easylink-ai.com/v1/easydoc/extract
内容类型multipart/form-data(支持多文件上传)
响应格式application/json
调用模式异步处理,返回任务 ID,结果通过轮询获取

请求头(Headers)

Header 名称类型必填说明
api-keystring认证密钥,由平台分配。例如:api-key: your_apikey_here

请求参数(Form-Data)

使用 multipart/form-data 格式上传文件及参数。

参数名类型必填默认值说明
filesfile 或 file[]-待分析的文档图像或多页 PDF。支持 JPG、PNG、BMP、TIFF、PDF。支持多个文件(最多 1 张)。
json_schemaobject (JSON){}若提供有效 schema,则执行 封闭式抽取模式。注意easydoc-extract-flash 不支持json_schema为空,仅提供封闭式抽取模式
prompt_cusstring[空字符串]自定义抽取指令。
modeenum(string)-当前支持:easydoc-extract,easydoc-extract-flash

抽取模式说明(easydoc-extract)

条件执行模式行为描述
json_schema 有效且非空封闭式抽取仅提取 schema 指定字段
json_schema 无效 + prompt_cus 非空自定义 Prompt 抽取按用户指令抽取
json_schema 无效 + prompt_cus 为空开放式抽取自动识别所有键值对

抽取模式说明(easydoc-extract-flash)

条件执行模式行为描述
json_schema 有效且非空封闭式抽取仅提取 schema 指定字段

json_schema 参数示例(封闭式抽取场景)

{
  "type": "object",
  "properties": {
    "甲方名称": { "type": "string" },
    "乙方名称": { "type": "string" },
    "合同金额": { "type": "string" },
    "签署日期": { "type": "string" }
  }
}

说明:系统将仅对上述字段进行抽取处理。

结构化抽取任务示例

curl -X POST "https://api.easylink-ai.com/v1/easydoc/extract" \\
-H "api-key: your_apikey_here" \\
-F "files=@contract_page1.jpg" \\
-F "files=@contract_page2.jpg" \\
-F 'json_schema={
  "type": "object",
  "properties": {
    "项目名称": {"type": "string"},
    "总金额": {"type": "string"}
  }
}' \\
-F "mode=easydoc-extract"

响应结构(异步)

初始响应(任务提交成功)

{
  "success": true,
  "data": {
    "task_id": "b_extract_84755514039123",
    "status": "PROCESSING"
  }
}

轮询获取结果

curl -X GET "https://api.easylink-ai.com/v1/easydoc/extract/{task_id}" \
  -H "api-key: your_apikey_here"

说明:将 {task_id} 替换为实际任务 ID。

抽取完成响应(成功) easydoc-extract 模式

{
  "success": true,
  "data": {
    "task_id": "b_extract_84755514039123",
    "status": "SUCCESS",
    "object": "create.extracted_result",
    "results": [
      {
        "key_index": [
          "甲方名称",
          "乙方名称",
          "合同金额",
          "签署日期"
        ],
        "extracted_fields": {
          "甲方名称": "北京科技有限公司",
          "乙方名称": "上海信息技术公司",
          "合同金额": "¥500,000.00",
          "签署日期": "2025-04-01"
        }
      }
    ]
  }
}

抽取完成响应(成功) easydoc-extract-flash 模式

{
  "success": true,
  "data": {
    "task_id": "b_extract_xxx",
    "status": "SUCCESS",
    "results": [
      {
        "名称": [
          {
            "bbox": [339, 1064, 750, 1103],         // [x1, y1, x2, y2] 坐标(左上→右下)
            "value": "名称 某某市某某塑料有限公司",  // 原始识别文本(含前缀"名称")
            "category": "Text",                      // 元素类型(Text / Table / Figure 等)
            "source_page": 1,                        // 来自第1页
            "layout_width": 1700,                    // 文档逻辑宽度(用于缩放计算)
            "layout_height": 2200                    // 文档逻辑高度
          }
        ]
      }
    ]
  }
}

失败响应

{
  "success": false,
  "err_code": "INVALID_PARAMETER",
  "err_message": "参数错误:json_schema 格式不合法"
}

错误码说明

err_code说明
EMPTY_TASK非法的任务请求
ILLEGALITY_TASK_TYPE非法的任务类型
API_UNAUTHORIZEDAPI 服务未授权
INVALID_PARAMETER无效参数
INVALID_DOCUMENT文档损坏或不支持
INSUFFICIENT_BALANCE余额不足