常见问题

EasyLink Platform 平台支持哪些文档格式？

EasyLink Platform 的所有功能模块均支持以下主流文档格式：

Word 类：.doc, .docx, .dot, .dotx, .docm, .dotm
Excel 类：.xls, .xlsx, .xlt, .xltx, .xlsm, .xltm
PPT 类：.ppt, .pptx, .pot, .potx, .pptm, .potm, .pps
文本与网页：.txt, .html
图像类：.jpg, .jpeg, .png, .bmp, .tif, .tiff
PDF：标准 PDF 文档（含扫描件）

说明：
EasyDoc-智能解析、EasyDoc-智能抽取、执照抽取、机构代码证抽取、病历抽取、病历脱敏等模块均可直接处理上述格式。各模块为独立能力单元，具备完整的端到端处理能力，无需依赖其他模块即可完成任务。

EasyLink Platform 的输出格式是什么？

平台各模块默认输出结构化的 JSON 格式，专为 AI 应用和程序化处理设计。其中：

EasyDoc-智能解析和 EasyDoc-智能抽取模块提供标准 JSON 结构。
EasyDoc-智能解析模块在 easydoc-parse-premium 及以上模式支持 Markdown 输出，便于内容展示与二次编辑。

是否支持 Markdown 格式输出？

是的，EasyDoc-智能解析模块在 easydoc-parse-flash/easydoc-parse-premium/paper-parse 模式下支持 Markdown 格式输出，结合语义分块与层级结构信息，适用于 RAG 知识库构建或内容迁移场景。

如何识别文档的逻辑结构（如标题、列表等）？

EasyDoc-智能解析模块在 easydoc-parse-premium 模式下可识别文档的语义层次结构，输出包含 parent_id、层级类型（heading、paragraph、list 等）的 JSON 数据，帮助开发者准确重建原始文档结构。

如何处理复杂表格？

EasyDoc-智能解析模块（easydoc-parse-premium 模式）支持深度表格解析，具备以下能力：

自动识别表头与数据区域
处理跨页、合并单元格等复杂布局
提取表格标题、注释及上下文关系
输出结构化 JSON，便于导入数据库或分析系统

是否支持图表和图片的语义理解？

是的，在 easydoc-parse-premium 模式下，EasyDoc-智能解析模块可：

识别图像位置与尺寸
判断图表类型（柱状图、饼图等）
解读图注与上下文语义
输出带坐标与描述信息的结构化数据，支持后续 AI 分析使用

如何集成 EasyLink Platform 的 API？

EasyLink Platform 提供简洁的 REST API，开发者可通过指定模式上传文档，获取结构化 JSON 结果。我们提供了详细的 API 文档和示例代码，供快速集成参考。

Dify 接入 EasyDoc 解析时报错 Invalid file URL / Request URL is missing http/https

该类问题通常是 Dify 系统配置导致，以下仅提供参考配置示例，请结合实际部署方式调整。

报错示例：

Run failed: Failed to transform tool message: PluginInvokeError: {"args":{},"error_type":"ValueError","message":"Invalid file URL '/files/...': Request URL is missing an 'http://' or 'https://' protocol. Ensure the FILES_URL environment variable is set in your .env file"}

处理方式（示例）：

找到 Dify 部署目录，打开 .env 文件。
修改 FILES_URL 配置项：
- Docker Compose 部署：FILES_URL='http://api:5001'
- 其他部署方式：FILES_URL='http://Dify宿主机IP:5001' （如 http://192.168.1.100:5001，IP 通常是运行 Dify 的机器地址，5001 为 Dify API 默认端口）
确认 Dify API 服务 5001 端口已对外暴露（可检查 docker-compose.yaml 端口映射）。
保存 .env 文件并重启 Dify 服务使配置生效。

输出如何优化 RAG 系统？

EasyDoc-智能解析模块 的输出专为 RAG 场景优化，显著提升检索质量：

语义分块：基于段落、表格、图表及其标题自动划分逻辑完整的内容单元，避免按字符硬切导致语义断裂。
上下文增强：每个块附带层级路径（如“第一章 > 第二节 > 表格3”），保留全局结构信息，提高召回准确率。
精准溯源：提供页码、视觉坐标（x, y, width, height），支持 LLM 回溯原始位置，增强可信度。

注意：上述能力由EasyDoc-智能解析模块提供，其他模块（如抽取、脱敏）侧重内容提取或安全处理，不保证保留完整上下文与位置信息。

如何保障数据安全？

EasyLink Platform 严格遵守数据安全规范：

传输加密：所有 API 请求均通过 HTTPS 加密传输。
非存储设计：用户上传的原始文档在处理完成后立即删除，不长期留存。
结果归属清晰：解析结果仅通过授权 Token 返回给调用方。
权限控制：内部访问实行最小权限原则，符合数据保护相关要求。

对于高敏感行业客户，如有特殊安全需求，欢迎联系 EasyLink AI 公司探讨定制化服务方案。

如何反馈问题或建议？

如果您在使用过程中遇到问题或有功能建议，欢迎通过以下方式联系我们，我们将及时响应：

联系邮箱: cooperate@easylink-ai.com
微信公众号: EasyLink容易链科技

方式	二维码
微信社群
企微客服

常见问题

On this page