常见问题
EasyDoc 支持哪些文档格式?
EasyDoc 支持多种主流文档格式,包括 .dotm
、.docm
、.doc
、.dotx
、.docx
、.txt
、.html
、.dot
、.xltm
、.xlsm
、.xlsx
、.xls
、.xlt
、 .pptx
、.potm
、.pptx
、.ppt
、.pot
、.pps
、.tif
、.png
、.jpg
、.bmp
。其设计能够高效解析复杂文档结构,满足多样化业务场景的需求。
EasyDoc 的输出格式是什么?
EasyDoc 输出结构化的 JSON 格式,专为 AI 应用和程序化处理设计。Premium 模式额外支持 Markdown 格式,提供更灵活的数据组织与展示方式。
EasyDoc 是否支持 Markdown 输出?
是的,Premium 模式支持 Markdown 格式输出,结合 JSON 格式,提供灵活的数据组织选项。
EasyDoc 如何识别文档的逻辑结构(如标题、列表等)?
Pro 和 Premium 模式可识别文档的逻辑层次结构,输出 JSON 包含层级关系(如 parent_id
),便于开发者重建文档结构,包括标题、段落、列表等。
EasyDoc 如何处理复杂表格?
Premium 模式支持深度表格解析,不仅提取单元格文本,还能理解表头与表值语义关系、处理跨页/跨格场景,并生成完整的结构化 JSON 输出,便于后续处理。
EasyDoc 是否支持图表和图片处理?
是的,Premium 模式可解析图表类型(如饼图、柱状图),解读图片的语义,并识别图片在文档中的位置及上下文,输出结构化 JSON 数据。
如何集成 EasyDoc 的 API?
EasyDoc 提供简洁的 REST API,开发者可通过指定模式(Lite、Pro、Premium)上传文档,获取结构化 JSON 结果。我们提供了详细的 API 文档和示例代码,供快速集成参考。
EasyDoc 的输出如何优化 RAG 系统?
EasyDoc 的输出专为 RAG 系统优化:
- 语义分块:相比于业界采用字数、标点、页等规则化分块,Easydoc基于语义识别分块(如段落、表格、图表及其标题、注释),合并跨页/跨栏内容,形成逻辑完整的语义单元。
- 上下文增强:通过层级结构为每个语义单元提供文档路径上下文,保留全局关联性,提升检索的召回率与准确性。
- 精准溯源:提供页码和视觉坐标信息,支持 LLM 高效定位信息源。
EasyDoc 如何保障数据安全?
EasyDoc 严格保护用户数据:
- 传输安全:使用 HTTPS 加密传输文档和 API 数据。
- 非存储设计:不存储用户提交文档,解析完成后提供一定周期内结果预览后即删除。
- 结果控制:解析结果通过安全 API 交付,仅归用户所有。
- 访问限制:内部权限严格控制,遵守数据保护法规。 如需处理高敏感数据,请参考我们的隐私政策或联系 EasyLink AI 公司 探讨企业级部署方案。
如何反馈问题或建议?
如果您在使用中遇到问题或有功能建议,可以通过微信客服或者用户社群来联系我们,我们会及时响应并处理。
- 联系邮箱: cooperate@easylink-ai.com
- 微信公众号: EasyLink容易链科技
方式 | 二维码 |
---|---|
微信社群 | ![]() |
企微客服 | ![]() |