LogoEasyDoc 开发者文档

常见问题

EasyDoc 支持哪些文档格式?

EasyDoc 支持多种主流文档格式,包括 .dotm.docm.doc.dotx.docx.txt.html.dot.xltm.xlsm.xlsx.xls.xlt.pptx.potm.pptx.ppt.pot.pps.tif.png.jpg.bmp。其设计能够高效解析复杂文档结构,满足多样化业务场景的需求。


EasyDoc 的输出格式是什么?

EasyDoc 输出结构化的 JSON 格式,专为 AI 应用和程序化处理设计。Premium 模式额外支持 Markdown 格式,提供更灵活的数据组织与展示方式。


EasyDoc 是否支持 Markdown 输出?

是的,Premium 模式支持 Markdown 格式输出,结合 JSON 格式,提供灵活的数据组织选项。


EasyDoc 如何识别文档的逻辑结构(如标题、列表等)?

Pro 和 Premium 模式可识别文档的逻辑层次结构,输出 JSON 包含层级关系(如 parent_id),便于开发者重建文档结构,包括标题、段落、列表等。


EasyDoc 如何处理复杂表格?

Premium 模式支持深度表格解析,不仅提取单元格文本,还能理解表头与表值语义关系、处理跨页/跨格场景,并生成完整的结构化 JSON 输出,便于后续处理。


EasyDoc 是否支持图表和图片处理?

是的,Premium 模式可解析图表类型(如饼图、柱状图),解读图片的语义,并识别图片在文档中的位置及上下文,输出结构化 JSON 数据。


如何集成 EasyDoc 的 API?

EasyDoc 提供简洁的 REST API,开发者可通过指定模式(Lite、Pro、Premium)上传文档,获取结构化 JSON 结果。我们提供了详细的 API 文档和示例代码,供快速集成参考。


EasyDoc 的输出如何优化 RAG 系统?

EasyDoc 的输出专为 RAG 系统优化:

  • 语义分块:相比于业界采用字数、标点、页等规则化分块,Easydoc基于语义识别分块(如段落、表格、图表及其标题、注释),合并跨页/跨栏内容,形成逻辑完整的语义单元。
  • 上下文增强:通过层级结构为每个语义单元提供文档路径上下文,保留全局关联性,提升检索的召回率与准确性。
  • 精准溯源:提供页码和视觉坐标信息,支持 LLM 高效定位信息源。

EasyDoc 如何保障数据安全?

EasyDoc 严格保护用户数据:

  • 传输安全:使用 HTTPS 加密传输文档和 API 数据。
  • 非存储设计:不存储用户提交文档,解析完成后提供一定周期内结果预览后即删除。
  • 结果控制:解析结果通过安全 API 交付,仅归用户所有。
  • 访问限制:内部权限严格控制,遵守数据保护法规。 如需处理高敏感数据,请参考我们的隐私政策或联系 EasyLink AI 公司 探讨企业级部署方案。

如何反馈问题或建议?

如果您在使用中遇到问题或有功能建议,可以通过微信客服或者用户社群来联系我们,我们会及时响应并处理。

方式二维码
微信社群
企微客服