Logo
产品介绍

技术优势

EasyLink Platform 是基于 EasyLink AI 自主研发的视觉语义大模型打造的智能文档处理平台。平台提供多种独立且可组合的智能能力,涵盖EasyDoc-智能解析、EasyDoc-智能抽取、金融投研问答、执照识别、病历结构化提取与脱敏等核心功能,全面支撑 RAG、AI Agent 及自动化业务系统的高效构建与落地。

各模块技术优势

1. EasyDoc-智能解析

提供高保真的文档结构还原能力,适用于合同、报告、政策文件等复杂格式文档:

  • 视觉语义融合:联合分析文本内容与版面布局,精准识别跨页表格、嵌套图表、多栏排版等复杂结构。
  • 智能分块(Semantic Chunking):以段落、标题、图注为单位自动划分逻辑完整的内容块,优于字符长度切分。
  • 上下文保留:输出带层级路径(如 section > subsection > table)的 JSON 结构,增强 RAG 检索准确性。
  • 精准溯源:每条结果附带原始页码与视觉坐标(x, y, w, h),支持 LLM 快速定位信息源。
  • 多格式兼容:原生支持 .docx, .pdf, .pptx, .xlsx 及图像类文档(.jpg, .png, .tif)。

适用于需要完整还原文档结构的场景,如知识库构建、内容迁移等。


2. EasyDoc-智能抽取

从任意非结构化文档中自动提取常见关键字段,无需预设模板或人工干预:

  • 零样本识别:可识别姓名、身份证号、手机号、金额、日期、地址等字段,适应多种文档样式。
  • 上下文感知抽取:结合前后文判断字段语义(例如区分“出生日期”与“签约日期”)。
  • 模糊匹配增强:在手写体、低清扫描件中仍能有效捕获弱信号字段。
  • 输出标准化:自动归一化日期格式、金额单位、证件号码校验位等,便于下游系统直接使用。

适用于表单录入、报销单处理、客户资料提取等通用自动化场景。


3. 金融投研问答

基于 A/H 股公告及资讯的知识增强,提供可信、可靠、可溯源的投研问答服务:

  • 公告原生理解:精准解析年报、招股书、监管函等公告中的专业内容,包括财报附注、风险提示、关联交易等关键段落;
  • 知识增强推理:融合 XBRL 结构化数据、产业链关系与历史公告,支持跨文档复杂查询(例如“该公司近三年研发费用资本化率变化趋势”);
  • 三重可溯源机制:答案自动关联原始公告页码与位置、标注数据来源表项、支持推理路径展开,确保结果可验证;
  • 合规性保障:自动识别信息时效范围,对预测性陈述附加风险提示,符合金融信息披露规范要求。

适用于买方研究员尽调、卖方报告撰写、合规复核等专业场景。


4. 专用证照抽取

针对高频证照设计专用识别模型,在复杂背景和低质量图像下保持高准确率。

执照抽取

  • 高精度定位企业名称、统一社会信用代码、法定代表人、注册资本、注册地址等核心字段。
  • 支持新版电子营业执照与旧版纸质执照双模式识别。
  • 自动校验统一信用代码合法性,降低人工复核成本。

机构代码证抽取

  • 准确提取组织机构名称、代码、有效期、发证机关等关键信息。
  • 兼容历史版本与现行标准,支持批量资质审核。

广泛应用于银行开户、企业尽调、政务审批等合规审查场景。


5. 病历抽取

专为电子病历设计的结构化提取能力,支持临床数据自动化采集:

  • 字段精准识别:自动提取诊断结果、用药记录、检查项目与指标(如血糖、血压)、治疗方案、就诊时间等医学信息。
  • 格式兼容性强:支持非标准书写(如“T2DM”、“二型糖尿病”)的归一化处理。
  • 输出结构化 JSON:便于导入科研数据库、构建临床决策支持系统或用于患者随访管理。

适用于医院信息化升级、慢病管理、真实世界研究等医疗智能化场景。


6. 病历脱敏

满足医疗数据合规要求的安全处理模块,支持隐私保护前提下的数据流转:

  • 敏感信息识别:自动检测患者姓名、患者性别、联系方式、入院时间、出院时间、年龄等敏感信息。
  • 多粒度脱敏策略:
    • 掩码(如 张***
    • 替换(如 [姓名]
    • 删除(不可见字段)
  • 上下文保留机制:在匿名化处理的同时保留医学语义完整性,便于后续科研或模型训练使用。
  • 审计日志支持:记录脱敏操作轨迹,满足合规审查需求。

适用于医疗数据共享、AI 模型训练、多中心研究等高敏感场景。


7. 论文解析

针对学术论文的复杂结构进行深度语义理解与结构化解析,支持 .pdf、.docx 等主流格式,完整还原文档内容与逻辑层次:

  • 结构化信息提取:精准识别标题、作者、单位、摘要、关键词、章节(如引言、方法、实验、结论)、参考文献等核心组成部分。
  • 复杂元素保留:完整提取公式、表格、图表及其标题和引用关系,保持原始排版语义。
  • 位置与层级分析:保留段落层级、章节编号、页码位置等上下文信息,便于后续导航与知识组织。
  • 输出标准化:生成结构清晰的 JSON 格式结果,支持快速对接知识图谱、RAG 系统或学术数据库。

适用于科研辅助、文献综述自动化、AI 学术引擎构建等场景,助力高效知识挖掘与学术创新。

平台优势对比

相较于传统文档处理方案,EasyLink Platform 实现了从“看得见”到“看得懂”的跃迁:

能力维度传统平台方案EasyLink Platform
解析能力仅提取文本还原文档结构、层级、语义关系
抽取灵活性依赖固定模板通用抽取 + 专用模型,支持零样本适配
场景覆盖单一功能为主一套平台覆盖解析、抽取、脱敏全链路
安全合规无内置脱敏内建病历脱敏、权限控制、非存储设计
扩展性新场景需重开发模块化接口,通过配置快速接入新业务

作为面向AI应用的可信数据预处理中枢,EasyLink Platform 不仅实现非结构化文档的高效理解与结构化转化,更在安全合规的前提下,确保数据可追溯、过程可审计、结果可信赖,真正让企业释放高价值数据潜能。

On this page