国家知识产权局专利局专利审查协作湖北中心
摘 要:大数据领域下的专利申请文件通常撰写过于抽象,权利要求难以理解。本文从一个实际案例出发,探讨了检索该类案件的一般思路。
关键词:大数据 权利要求 抽象 检索
在实质审查工作中,检索是非常重要的一环,而涉及大数据领域的案件经常是权利要求撰写抽象,难以检索。本文从一个实际案例出发,来探讨如何检索此类较为抽象的权利要求。
该案权利要求为:“1.一种关系型数据库的数据处理方法,其特征在于,包括:当需对目标字段对应的多个数量固定的数据进行存储时,获取目标字段与预设数字的对应策略,所述预设数字根据所述多个数据间关系得到,根据所述目标字段与预设数字的对应策略确定出与所述多个数据对应的目标字段中的目标位置,所述目标字段具有多个存储位置的存储空间;在关系型数据库中所述目标字段的对应位置处存储存在关系的多个数据。 ”
本案权利要求1撰写很抽象,从文字记载的内容难以理解其技术方案,用“关系、数据库、数字、字段、属性、位置、存储”等关键词尝试检索,获得的均是毫不相关的文献。
通过进一步阅读说明书,本案是为了解决现有技术中存储数量固定的数据时,其存储方式非常浪费存储空间,例如“在酒店的关系型数据库中,假设酒店标识S1对应的淡季月份为1月、2月和 3月这3个固定的月份。在关系型数据库的淡季月份的字段中存储1、2和3时,系统需 要为酒店标识S1对应的淡季月份和淡季月份的分隔符分配5个存储空间。系统利用第一个存储空间来存储数字“1”,利用第二个存储空间来存储分隔符“、”,利用第三个存储空间来存储数字“2”,利用第四个存储空间来存储分隔符“和”,利用第五个存储空间来存储数字“3”。
而在本申请的说明书中,给出了这样的实施例:假设目标字段为半价日,终端为半价日申请一个整型变量int,整型变量int为8个二进制位,每个二进制位可以存储一个数据,半价日对应的所有数据指的是周一至周日这7个数据,半价日对应的存在关系的多个数据指的是周一和周三这2个数据,假设终端预先建立好周一至周日这7个数据与8个二进制位中的7个二进制位的对应关系,将二进制数的数码1作为存在的星期数,将二进制数的数码0作为不存在的星期数,参见表2所示,终端将周一和周三转换成00000101。因此,终端最终存储一个8位二进制数 “00000101”来代替“周一和周三”这5个汉字,从而节省了终端的存储空间。
半价日 | 周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 | 空 |
二进制位 | 第一位 | 第二位 | 第三位 | 第四位 | 第五位 | 第六位 | 第七位 | 第八位 |
二进制数 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
表2
由此可知,本申请的权利要求1虽然撰写抽象复杂,但是由说明书实施例可知,本申请的技术方案实质上是采用二进制来存储数据,以此来节省存储空间,并且存储日期类数据更可能是其常见的应用场景,于是在CNTXT数据库中检索如下: ((((日期 or 星期 or 周 or 月) s 二进制) and (存储 s 数据)) and ((节约 or 节省 or 减少) s 存储 s 空间)) and (pd〈20150723),最后获得能单篇评述本申请创造性的X类文献:CN102663581A。
该文献中记载了如下内容:“本发明的实施方式提出一种用于存储事件排期的方法和装置,能够降低用于存储事件排期日期所需的数据量,节约存储空间。在步骤S101中,确定第一时间单元,其中事件以第一时间单元为单位发生,该第一时间单元可以是自然时间单元,小时、日、周、月等,也可以是在特定应用场景下指定的时间单元;在步骤S102中,选择第二时间单元,其中将以第二时间单元为单位存储事件的发生,该第二时间单元包括多个第一时间单元,例如,对于以日为单位发生的广告排期和医生的出诊,第二时间单元可以选择为“月”,其中第二时间单元“月”包括30或31个第一时间单元“日”;又如,对于以小时为单位发生的广播电台的节目,第二时间单元可以选择为“日”,其中第二时间单元“日”包括24个第一时间单元“小时”;对于以周为单位发生的剧场演出的节目,第二时间单元可以选择为“季度”,其中第二时间单元“季度”包括12个第一时间单元“周”。在步骤S103中,控制存储对应于第二时间单元的二进制位串作为事件排期条目,其中以二进制位串中的位一一对应于第二时间单元中包括的多个第一时间单元的每一个,并且以二进制位串中位的值指示对应的第一时间单元中有无事件的发生。以下基于上述广告排期的示例来具体说明该步骤。广告排期事件以第一时间单元“日”为单位发生,如果选择“月”作为用于存储事件发生的第二时间单元,则该第二时间单元包括30或31个第一时间单元“日”,每个第二时间单元可以利用32位二进制串来表示,某广告的投放作为时间可能在2010年2月的1、2、3、6日,4月2、3、4、8、9日发生;对于2月的第二时间单元利用32位二进制串来表示;从低位到高位对应于一个月中从第1日到第31日;如果在某日投放该广告,则将该日对应的位设置为1,如果某日没有投放该广告,则将该日对应的位设置为0,第32位无对应的日,设置为0。由此,对应于2月的排期条目的二进制位串为: ,对应于4月的排期条目的二进制位串为: ”。
可见,对比文件中记载的内容虽然从字面上与本申请权利要求中记载的特征完全不同,但是其已经公开了与本申请相同的发明构思,该案最终驳回失效。
大数据领域的专利申请经常撰写非常抽象,尤其是涉及数据库的案件,更是复杂难以理解,本文从一个实际案例出发,探讨了针对此类案件的一般处理方法,当从权利要求字面上难以理解技术方案时,通常需要仔细阅读说明书实施例,把握发明构思,准确理解发明,从说明书实施例出发,找准核心关键词,进而获得对比文件。