简介:气象科学数据是国家重要的基础性、公益性科学数据资源,是我国历史资料年代长、保存完整的地球信息资源之一。通过收集、整合、集成、标准化和归一化处理的气象数据是气象信息系统中最核心和最基本的组成部分,也是气象信息系统建设和提供气象服务的最重要的内容。根据“中国气象科学数据共享服务网”的总体设计思路和要求,内蒙古气象信息中心,组织科技业务人员,重点围绕数据标准规范、数据集建设和共享平台研制等方面加强全区气象信息共享平台(网站的设计制作、全区气象数据的收集、存储、整编,历史资料、实时资料元数据的编写和共享等工作)的建设。目前,全区气象数据集系统建设已初具规模。
简介:在软件行业中,五年就像是一个地质时代。五年前,Microsoft宣布了自己的Micorsoft.NETFramework计划。从那以后,DataSet(数据集)才开始作为关键对象出现在基于.NET的应用程序中,执行多种数据相关的任务。也是五年前,DataSet被誉为ADO记录集(Recordset)的威力增强版。那么在.NETFramework出现之前,您是如何设计数据访问层(DAL,DataAccessLayer)的呢?我想您一定是以ADO和它全能的Recordset对象——断开的、且可进行XML序列化的——为中心构建数据访问层。
简介:摘 要:藏文古籍字丁数据集是用机器学习技术进行藏文古籍字符识别的数据基础。传统的藏文古籍字丁数据集采用人工标注方式构建,其中画标注框任务与输入类别名任务因串行进行而耗时较长,并且输入的类别名为藏文字丁,这导致人工标注的方法存在标注时间长和标注门槛高的问题。对此,本文提出了一种半自动标注方法:将画标注框和输入类别名两项串行任务并行化,其中由具备藏文输入能力的标注者完成输入类别名任务,其余标注者完成画标注框任务;通过标注框的中心点坐标信息对标注框进行行间排序和行内排序,分割、整合倾斜古籍图像对标注框进行行纠正,排序好的标注框赋予对应的目标类别名,从而整合得到完整的目标标注信息。该方法不仅可为藏文古籍字丁数据集标注缩短时间和降低门槛,而且可为其他文种的古籍文字数据集标注提供有益参考。
简介:摘要目的建立IgA肾病(IgA nephropathy,IgAN)标准数据集是实现IgAN临床信息结构化和标准化的前提,将有利于不同医疗机构间临床信息的整合利用。为此,上海IgAN专家协作组编写了这部《IgA肾病标准数据集》。方法参考国内信息标准,结合相关领域内的指南、数据规范及专家共识,以电子病史档案为基础,将患者身份标识号作为系统主键进行信息收集。通过对数据集中各个数据元进行规范,确保管理系统在数据与信息交换、数据协同与共享上的标准化,并制定相应的质量控制体系。结果本标准数据集共包括607个数据元,8个模块,分为患者信息、病史信息、体格检查、实验室检查、辅助检查、肾脏病理、药物治疗、随访。各模块又由子模块名称、数据元名称、英文名称、定义、值域、参考标准等组成。同时,质量控制体系被制定,从完整性、规范性、准确性、及时性及安全性等多维度对数据质量进行评估,确保数据的高质量与安全。结论本研究建立了IgAN标准数据集,将有助于国内IgAN临床信息的结构化和标准化。