技术优势
EasyLink Platform 是基于 EasyLink AI 自主研发的视觉语义大模型打造的智能文档处理平台。平台提供多种独立且可组合的智能能力,涵盖EasyDoc-智能解析、EasyDoc-智能抽取、金融投研问答、执照识别、病历结构化提取与脱敏等核心功能,全面支撑 RAG、AI Agent 及自动化业务系统的高效构建与落地。
各模块技术优势
1. EasyDoc-智能解析
提供高保真的文档结构还原能力,适用于合同、报告、政策文件等复杂格式文档:
- 视觉语义融合:联合分析文本内容与版面布局,精准识别跨页表格、嵌套图表、多栏排版等复杂结构。
- 智能分块(Semantic Chunking):以段落、标题、图注为单位自动划分逻辑完整的内容块,优于字符长度切分。
- 上下文保留:输出带层级路径(如
section > subsection > table)的 JSON 结构,增强 RAG 检索准确性。 - 精准溯源:每条结果附带原始页码与视觉坐标(x, y, w, h),支持 LLM 快速定位信息源。
- 多格式兼容:原生支持
.docx,.pdf,.pptx,.xlsx及图像类文档(.jpg,.png,.tif)。
适用于需要完整还原文档结构的场景,如知识库构建、内容迁移等。
2. EasyDoc-智能抽取
从任意非结构化文档中自动提取常见关键字段,无需预设模板或人工干预:
- 零样本识别:可识别姓名、身份证号、手机号、金额、日期、地址等字段,适应多种文档样式。
- 上下文感知抽取:结合前后文判断字段语义(例如区分“出生日期”与“签约日期”)。
- 模糊匹配增强:在手写体、低清扫描件中仍能有效捕获弱信号字段。
- 输出标准化:自动归一化日期格式、金额单位、证件号码校验位等,便于下游系统直接使用。
适用于表单录入、报销单处理、客户资料提取等通用自动化场景。
3. 金融投研问答
基于 A/H 股公告及资讯的知识增强,提供可信、可靠、可溯源的投研问答服务:
- 公告原生理解:精准解析年报、招股书、监管函等公告中的专业内容,包括财报附注、风险提示、关联交易等关键段落;
- 知识增强推理:融合 XBRL 结构化数据、产业链关系与历史公告,支持跨文档复杂查询(例如“该公司近三年研发费用资本化率变化趋势”);
- 三重可溯源机制:答案自动关联原始公告页码与位置、标注数据来源表项、支持推理路径展开,确保结果可验证;
- 合规性保障:自动识别信息时效范围,对预测性陈述附加风险提示,符合金融信息披露规范要求。
适用于买方研究员尽调、卖方报告撰写、合规复核等专业场景。
4. 专用证照抽取
针对高频证照设计专用识别模型,在复杂背景和低质量图像下保持高准确率。
执照抽取
- 高精度定位企业名称、统一社会信用代码、法定代表人、注册资本、注册地址等核心字段。
- 支持新版电子营业执照与旧版纸质执照双模式识别。
- 自动校验统一信用代码合法性,降低人工复核成本。
机构代码证抽取
- 准确提取组织机构名称、代码、有效期、发证机关等关键信息。
- 兼容历史版本与现行标准,支持批量资质审核。
广泛应用于银行开户、企业尽调、政务审批等合规审查场景。
5. 病历抽取
专为电子病历设计的结构化提取能力,支持临床数据自动化采集:
- 字段精准识别:自动提取诊断结果、用药记录、检查项目与指标(如血糖、血压)、治疗方案、就诊时间等医学信息。
- 格式兼容性强:支持非标准书写(如“T2DM”、“二型糖尿病”)的归一化处理。
- 输出结构化 JSON:便于导入科研数据库、构建临床决策支持系统或用于患者随访管理。
适用于医院信息化升级、慢病管理、真实世界研究等医疗智能化场景。
6. 病历脱敏
满足医疗数据合规要求的安全处理模块,支持隐私保护前提下的数据流转:
- 敏感信息识别:自动检测患者姓名、患者性别、联系方式、入院时间、出院时间、年龄等敏感信息。
- 多粒度脱敏策略:
- 掩码(如
张***) - 替换(如
[姓名]) - 删除(不可见字段)
- 掩码(如
- 上下文保留机制:在匿名化处理的同时保留医学语义完整性,便于后续科研或模型训练使用。
- 审计日志支持:记录脱敏操作轨迹,满足合规审查需求。
适用于医疗数据共享、AI 模型训练、多中心研究等高敏感场景。
7. 论文解析
针对学术论文的复杂结构进行深度语义理解与结构化解析,支持 .pdf、.docx 等主流格式,完整还原文档内容与逻辑层次:
- 结构化信息提取:精准识别标题、作者、单位、摘要、关键词、章节(如引言、方法、实验、结论)、参考文献等核心组成部分。
- 复杂元素保留:完整提取公式、表格、图表及其标题和引用关系,保持原始排版语义。
- 位置与层级分析:保留段落层级、章节编号、页码位置等上下文信息,便于后续导航与知识组织。
- 输出标准化:生成结构清晰的 JSON 格式结果,支持快速对接知识图谱、RAG 系统或学术数据库。
适用于科研辅助、文献综述自动化、AI 学术引擎构建等场景,助力高效知识挖掘与学术创新。
平台优势对比
相较于传统文档处理方案,EasyLink Platform 实现了从“看得见”到“看得懂”的跃迁:
| 能力维度 | 传统平台方案 | EasyLink Platform |
|---|---|---|
| 解析能力 | 仅提取文本 | 还原文档结构、层级、语义关系 |
| 抽取灵活性 | 依赖固定模板 | 通用抽取 + 专用模型,支持零样本适配 |
| 场景覆盖 | 单一功能为主 | 一套平台覆盖解析、抽取、脱敏全链路 |
| 安全合规 | 无内置脱敏 | 内建病历脱敏、权限控制、非存储设计 |
| 扩展性 | 新场景需重开发 | 模块化接口,通过配置快速接入新业务 |
作为面向AI应用的可信数据预处理中枢,EasyLink Platform 不仅实现非结构化文档的高效理解与结构化转化,更在安全合规的前提下,确保数据可追溯、过程可审计、结果可信赖,真正让企业释放高价值数据潜能。