Logo

常见问题

EasyLink Platform 的所有功能模块均支持以下主流文档格式:

  • Word 类:.doc, .docx, .dot, .dotx, .docm, .dotm
  • Excel 类:.xls, .xlsx, .xlt, .xltx, .xlsm, .xltm
  • PPT 类:.ppt, .pptx, .pot, .potx, .pptm, .potm, .pps
  • 文本与网页:.txt, .html
  • 图像类:.jpg, .jpeg, .png, .bmp, .tif, .tiff
  • PDF:标准 PDF 文档(含扫描件)

说明:
EasyDoc-智能解析、EasyDoc-智能抽取、执照抽取、机构代码证抽取、病历抽取、病历脱敏等模块均可直接处理上述格式。各模块为独立能力单元,具备完整的端到端处理能力,无需依赖其他模块即可完成任务。


平台各模块默认输出结构化的 JSON 格式,专为 AI 应用和程序化处理设计。其中:

  • EasyDoc-智能解析 和 EasyDoc-智能抽取 模块提供标准 JSON 结构。
  • EasyDoc-智能解析模块 在 easydoc-parse-premium 及以上模式支持 Markdown 输出,便于内容展示与二次编辑。

是否支持 Markdown 格式输出?

是的,EasyDoc-智能解析模块在 easydoc-parse-flash/easydoc-parse-premium/paper-parse 模式下支持 Markdown 格式输出,结合语义分块与层级结构信息,适用于 RAG 知识库构建或内容迁移场景。


如何识别文档的逻辑结构(如标题、列表等)?

EasyDoc-智能解析模块在 easydoc-parse-premium 模式下可识别文档的语义层次结构,输出包含 parent_id、层级类型(heading、paragraph、list 等)的 JSON 数据,帮助开发者准确重建原始文档结构。


如何处理复杂表格?

EasyDoc-智能解析模块(easydoc-parse-premium 模式)支持深度表格解析,具备以下能力:

  • 自动识别表头与数据区域
  • 处理跨页、合并单元格等复杂布局
  • 提取表格标题、注释及上下文关系
  • 输出结构化 JSON,便于导入数据库或分析系统

是否支持图表和图片的语义理解?

是的,在 easydoc-parse-premium 模式下,EasyDoc-智能解析模块可:

  • 识别图像位置与尺寸
  • 判断图表类型(柱状图、饼图等)
  • 解读图注与上下文语义
  • 输出带坐标与描述信息的结构化数据,支持后续 AI 分析使用

EasyLink Platform 提供简洁的 REST API,开发者可通过指定模式上传文档,获取结构化 JSON 结果。我们提供了详细的 API 文档和示例代码,供快速集成参考。


输出如何优化 RAG 系统?

EasyDoc-智能解析模块 的输出专为 RAG 场景优化,显著提升检索质量:

  • 语义分块:基于段落、表格、图表及其标题自动划分逻辑完整的内容单元,避免按字符硬切导致语义断裂。
  • 上下文增强:每个块附带层级路径(如“第一章 > 第二节 > 表格3”),保留全局结构信息,提高召回准确率。
  • 精准溯源:提供页码、视觉坐标(x, y, width, height),支持 LLM 回溯原始位置,增强可信度。

注意:上述能力由EasyDoc-智能解析模块提供,其他模块(如抽取、脱敏)侧重内容提取或安全处理,不保证保留完整上下文与位置信息。


如何保障数据安全?

EasyLink Platform 严格遵守数据安全规范:

  • 传输加密:所有 API 请求均通过 HTTPS 加密传输。
  • 非存储设计:用户上传的原始文档在处理完成后立即删除,不长期留存。
  • 结果归属清晰:解析结果仅通过授权 Token 返回给调用方。
  • 权限控制:内部访问实行最小权限原则,符合数据保护相关要求。

对于高敏感行业客户,如有特殊安全需求,欢迎联系 EasyLink AI 公司 探讨定制化服务方案。


如何反馈问题或建议?

如果您在使用过程中遇到问题或有功能建议,欢迎通过以下方式联系我们,我们将及时响应:

方式二维码
微信社群
企微客服