
sito

sito

sito

sito

sito
一是构建智能标注系统,破解中医古籍文献标注难题。针对中医古籍数字化标注效率低、专业性强的问题,研发中医古籍文献机器标注系统,基于大模型实现古籍文本的自动分词、实体识别和语义关联,并结合专家审核形成闭环。智能标注系统支持996册古籍的自动化标注,标注准确率达92%,效率较人工提升60%,为中医辨证模型训练提供高质量底层数据。
二是采用联邦计算技术保障数据安全与合规共享。为解决医疗机构数据孤岛和隐私保护难题,采用分布式联邦计算架构,在不共享原始数据的前提下,实现医疗机构数据的联合标注与模型训练。通过公钥加密和中间结果交换,完成731TB临床数据的跨机构治理,模型训练精度提升25%,数据使用合规率达100%。
三是通过多模态数据融合提升标注标准化水平。针对中医诊疗中图文影像、生物信息等多源异构数据标注标准不统一的问题,开发跨尺度数据治理工具链,集成机器标注、三级审核和溯源机制。完成了633个器官多维图像、15.4万张胸部CT、1000名老中医临床证候数据的结构化标注,构建中西医结合的标准化标签体系,标注错误率降至5%以下。
信息来源:国家数据局
