简介:摘要从20世纪60年代起步的电力行业信息化,经过四十多年的发展,形成了一定的规模。但由于各省市电力企业独立规划和运作,始终没有形成统一的信息化标准规范。加之复杂的专业应用使得同一企业各职能部门只根据自身的需求单独立项,开发功能单一、开放性较差的专用系统,往往使一个电力公司内同时运行着成百上千的计算机系统。这些不同的系统功能不同,开发工具不同,结构也存在很大差异,而最大的问题就是数据的不可兼容,最终形成了数量众多的“信息孤岛”。这种情况给企业领导的经营和决策造成了很大的混乱。因此我们需要一个能够运行在现有系统上的或者未来的其他系统上的功能插件,支持网页上已有数据的抓取、模板的管理、信息的自动生成和填报。本文将对网络爬虫技术的一些探讨性的研究。