药检云计算平台构建及大数据挖掘

摘要:药检系统的信息化建设越来越受到人们的重视,其存在的资源不能合理利用、缺乏统一有效的管理平台、能源消耗大等问题也亟待解决,而云计算正好为药检信息化的发展带来了新的思路。对药检云的体系结构与构造进行了描述,提出了对药检云平台进行大数据挖掘的思路及步骤,并阐述了该技术对药检系统的重大意义。

关键词:云计算;大数据;药检系统;药检平台

中图分类号:TP391 文献标识码:A 文章编号:16727800(2013)009012803

基金项目:中国食品药品检定研究院科学检验精神研究项目(2012X1-029)

作者简介:庞璋帆(1982-),男,湖北省食品药品监督检验研究院科员,研究方向为药品检验;罗震钧(1985-),男,武汉理工大学计算机学院博士研究生,湖北省食品药品监督检验研究院科员,研究方向为云计算、智能计算;涂婕(1983-),女,湖北省食品药品监督检验研究院科员,研究方向为图书情报学。

0引言

随着网络与信息技术的快速发展,新的计算机概念与名词不断涌现,如:物联网、云计算、大数据等。在这种情况下,药检信息化系统面临着机遇与挑战,如何面对这种机遇与挑战是药检信息化管理员面临的巨大考验。2012年6月中检院李云龙院长提出“创新”是科学检验精神的灵魂,这种以“科研提升水平”为支撑,按照掌握核心技术、突破关键技术、研究前沿技术的理念为药检信息化建设提供了新的思路与方向[1]

近年来,药检系统的信息化建设越来越受到重视,例如:国家食品药品监督管理局发布的《国家食品药品监督管理局关于进一步加强食品药品监管信息化建设的指导意见》(国食药监办[2013]32号)通知、湖北省食品药品监督管理局发布的《湖北省食品药品监督管理局系统信息化与电子监管建设规划》(鄂食药监办文[2012]37号)文件、中国食品药品检定研究院的《关于征集科学检验精神课题的通知》(中检办[2012]126号)等都为药检信息化的发展提供了有力保证。但是,药检信息化的发展还存在一些问题,例如:资金投入不够、资源不能合理利用、缺乏统一有效的管理平台、区域发展不平衡等[2],这些问题的存在都成为了制约药检信息化发展的瓶颈。

根据以上情况,本文从药检系统的实际需要出发,采用计算机最新技术,以仿真验证为基础,设计一个能满足药检信息化科技发展要求的药检云计算平台。以该平台为条件,构建药检大数据挖掘模型,以解决食品、药品、化妆品等方面的安全问题,并对可能发生的食品药品应急事件进行预测。

1药检云计算平台构建

药检系统不同于一般企业的办公系统,它不仅具有一般OA系统的特点,还具有一定的特色用于满足药检系统的检测检验要求。因此,药检云计算平台的设计一定要符合药检系统的需要。

1.1云计算简介

2006年,谷歌工程师首次提出云计算概念,后经IBM、微软、亚马逊、DELL、卡内基梅隆大学、麻省理工学院、斯坦福大学等不断进行推广,逐渐发展成为今天的热门技术,成为各种行业的先头兵。但人们经常把云计算的概念与其它概念混淆,如分布计算、网格计算、效用计算、自主计算等。关于云计算的定义有很多种,维基百科对云计算的定义是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其它设备[3]。美国国家标准和技术研究院对云计算的定义符合以下几条特征:随需自助服务;随时随地通过任何网络设备访问;多人共享资源池;快速重新部署灵活度;可被监控与量测的服务等。百度百科对云计算的定义是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源[4]

自云计算引入我国后,联想、浪潮、华为、华山、中兴等公司不断扩展该技术的应用领域并积极加以创新。另外,一些专家与学者也对此技术进行了研究,例如:康莉[5]研究了云计算在电子商务上的应用及安全对策问题,认为云计算使电子商务更灵活、方便。李卫等人[6]剖析了云计算在全球电信运营商的云业务发展模式及案例,提出电信运营商未来云业务的发展建议。曲悦[7]对云计算技术应用于图书馆建设进行了研究,分析了云计算在数字图书馆建设中的价值,以及云计算在图书馆建设中所遇到的问题。马锡坤等人[8]提出了在医院系统中使用云计算技术,并建立相应的计算池、网络池、资源池等用以保证医院体系的高可用性。从上述研究中可以看出,不同的行业需要不同的云计算技术,根据不同的需求服务建立相应的云计算平台。云计算技术应用在药检行业中,也需要建立相应的云计算平台——药检云,该平台对药检系统运行效率、优化资源、节约能耗、缩减对药检信息化扩展投资都有着重要意义。另外,药检云对数据安全防护、用户的存取访问、存储系统的优化等也具有革命性影响。因此,药检云是未来药检系统信息化发展的必然趋势。

1.2药检云计算基本结构

云计算可以用一种比较形象的生态云循环表示,有4种物质在该生态云循环系统中,水库(各种各样的云计算中心,可以为公用、也可以是私有)、云滴(用户所需的各种服务)、云(各种服务的集合,为公用)、降水(用户的按需服务)。在这4种物质中,水库的水通过蒸发变成云滴,云滴汇聚成云,云通过降雨让用户按需取得。云的类别可以分为私有云、公有云、混合云,根据美国国家标准和技术研究院的分类,则还有一种叫社区云。根据药检系统的实际需要,一方面药检系统的一些数据需要保密,需要存放在私有云上,另一方面药检系统还要联网,需要从互联网上获取资源,这需要用到公有云。因此,药检系统的药检云计算应该是两者兼顾,也就是混合云,药检云的构造如图1所示。

从图1可以看出,药检云分为两部分,一部分为私有云,另一部分为公有云。私有云主要用于收集实验室全部的检验检测数据、检验人员个人的数据、国家局专网的数据、中检院基本药物平台的数据等。这些数据有一定的保密性,不能对外公开,通过内网的高速通道存放在私有云上进行存储。公有云从Internet上获取一些与药检系统相关的数据。另外公有云上可以存放一些可以让公众了解的药品常识、食品安全知识等。公有云具备让一般用户访问的功能,药检系统的外出员工对于公有云平台可以直接访问,而私有云则通过VPN隧道建立连接后访问,通过访问私有云可以远程监控检验检测数据、进行报告书流程、查看国家局专网信息等。通过药检云技术,不仅把所有的数据集中到一个平台上,构建了一个数据中心,而且方便了一般用户与外出员工的存储访问。

1.3药检云计算平台体系构建

药检云是一个强大的资源共享网络,其物理层也就是底层,是用虚拟化技术连接的所有硬件资源,通过该技术让实际上有差别的资源转换为虚拟无差别的统一平台,该层次也叫做基础设施层;中间层是平台层,该层提供操作系统集合、数据库集合、应用服务集合等;最上面是应用层,应用层提供各种应用软件。药检云的服务模式主要是:软件作为服务(Software as a service,Saas)、平台作为服务(Platform as a service,Paas)和基础设施作为服务(Infrastructure as a service,Iaas),具体体系结构如图2所示。

在图2所示的药检云平台体系结构中,基础设施层主要集合云药检系统的各种服务器设备、存储设备、磁盘阵列、网络资源的交换机、路由器、网卡等,构建一个以硬件为主的基础设施层,通过虚拟化技术让这些有差别的物理设备转换为无差别的虚拟资源。在平台层中,主要为药检系统提供相应的软件运行所必需的资源。操作系统集为基本药物平台所需的LINUX操作系统、批签发系统需要的Windows 2003操作系统等,数据库集为Oracle数据库的安装补丁、Lotus的插件等,应用服务集为IIS、tomcat、jdk等。软件层是药检系统的常用软件,如:批签发系统、食品药品检验管理系统、财务系统、外网网站、内网存储平台等。

构建该药检云平台对硬件资源是一种极大的节约,不仅可以扩展各种资源,还可以对一些淘汰的资源进行合理地整合利用。另外,所应用的软件和存储平台都可以根据需要进行按需分配,把所需要的资源分配给客户后,剩余的资源则可以进入休眠或停机状态,这样不仅可以节约能源消耗还能提高资源的利用率。

2大数据概念简介

大数据(Big Data)是一种巨量数据,为了更经济更有效地从高频率、大容量、不同结构和类型的数据中获取有价值信息而设计的新一代架构和技术,用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新,是随着移动互联网的发展而快速发展起来的。根据资料统计,1998年全球网民平均每月使用流量是1MB,2003年是100MB,2008年是1GB,2014将达到10GB。百度公司目前数据总量接近1 000PB(1PB = 1 024TB = 1 048 576GB),存储网页达到1万亿页,淘宝网站每天有超过数千万笔交易,单日产生的数据量超过了50TB(1TB = 1 024GB)[9]。面对如此海量的数据如果对其进行挖掘则得到的价值可能会更大,创造出的效益将会更惊人。而且原来被认为是一些废弃的数据或旧数据,在大数据时代也变得有意义。大数据具有4V特点:数量巨大(Volume)、种类繁多(Variety)、价值高(Value)、处理速度快(Velocity)。

各种行业开始对大数据的发展产生了浓厚的兴趣,越来越多的专家学者开始注意大数据的应用。赵金明[10]提到了大数据对高清视频监控存储的影响,基于云计算和大数据技术的解决方案能够更好地满足用户的实际需求,极大地丰富和提升安防监控系统的社会效益和经济效益。姚尧[11]认为大数据时代为建设中国智能化物流生态系统提供了保障。王天泥[12]讲述了大数据在我国图书馆界的研究进展,从大数据的产生对科学研究、社会创新的影响角度入手,分析了大数据视角下图书馆的定位,进而提出了拓展数据分析与处理业务、重视用户隐私保护等图书馆的发展策略。宋亚奇等人[13]提出智能电网需要全景的状态数据,电网运行、检修和管理过程中会产生海量异构、多态的数据,也即大数据,如何对它们进行高效、可靠、低廉地存储,并快速访问和分析,是智能电网亟待解决的问题。由此可以看出,大数据受到的重视是显而易见的。对于药检系统,数据量明显增加,如湖北药检院进入2011年后每年检品突破1万批,再加上其它附带的企业信息、药品流通信息、销量信息、市场反应信息及其关联的信息等,数据量也呈大幅度递增的趋势。另外,湖北省院积累有30多年的检验检测数据,对这样的数据进行挖掘意义较大。

3药检云平台下的大数据挖掘

药检云平台将存储海量数据,对这些数据需要深入挖掘才会获得最大效益。药检私有云不断获得实验室的检验检测数据,同时药检公有云也从互联网获得与药品食品等相关的数据,这些数据的集合构成了药检云数据中心,对这些数据进行挖掘能创造巨大的经济与社会效益。数据挖掘是一种比较繁琐、复杂的工程,需要应用多种智能算法进行运算,还要对挖掘出来的数据进行评价和反复迭代才能得到最优的数据。药检云平台下的大数据挖掘步骤如图3所示。

对于一般的药检系统,第一步先确定药检挖掘主题,其包含的内容是确定本次挖掘是涉及食品、药品还是其它方面,确定其挖掘目的是安全性的、预测性的,还是关联性的等;第二步是药检数据处理,该步骤需要一些商业公司的挖掘工具帮助处理,例如:IBM的Intelligent Miner、MS的Clementine、SAS的Enterprise Miner、Oracle的Darwin

等;第三步是药检模型的建立,该步骤中,先通过数据抽样对部分数据进行选取,然后对数据趋势、分布质量等进行分析、统计、判断,甚至还对一些数据进行修改,例如:适当加入新数据、修改变量参数等;最后通过智能算法建立相应的药检数据挖掘模型,这些算法主要有:决策树、粒子群、文化算法、蚁群算法等;第四步是药检模型的评价,当一个模型建立后,要通过实践对模型进行评价,当模型与实际结果有出入则需要回到第三步进行模型修改,另外,通过一些算法可以对模型进行评价,如:马尔科夫链等。通过这样的挖掘过程可以提取到药检大数据的重要信息,这对药检系统的检验检测有重要意义。

4结语

本文主要分析了云计算在一些行业中的应用,提出了药检云的概念,构建了药检云的体系结构与构造示意图,并阐述了大数据的概念以及大数据挖掘在药检系统中的意义。在今后的研究中,药检云的虚拟化技术、药检云的存储结构、药检云的隐私保护、药检大数据模型建立等还有待进一步研究。

参考文献:

[1]李云龙.积极践行科学检验精神[J].求是杂志,2012(6):3031.

[2]陈淦.初探基于云计算的药品检验信息管理系统[J].中国药事,2012(26):936938.

[3]维基百科.云计算的定义[EB/OL].http://zh.wikipedia.org/.

[4]百度百科.云计算的定义[EB/OL].http://baike.baidu.com/view/1316082.htm.

[5]康莉.“云计算”环境下电子商务安全问题及对策研究[J].信息技术,2012(8):283284.

[6]李卫,李济汉,张云勇,等.电信运营商云业务发展现状分析与建议[J].互联网天地, 2013(3):715.

[7]曲悦.浅谈云计算在图书馆建设中的价值及问题[J].价值工程,2012(9):203204.

[8]马锡坤,于京杰.医院数据中心存在的问题及对策[J].中国医学教育技术,2013,4(27):215217.

[9]邬贺铨.大数据时代的机遇与挑战[J].信息化参考,2013(2):16.

[10]赵金明.大数据时代的高清视频监控存储[J].中国铁路,2013(4):8182.

[11]姚尧.大数据时代的智能物流[J].中国经济信息,2013(7):7071.

[12]王天泥.大数据视角下图书馆的发展对策[J].图书馆学刊,2013(3):4244.

责任编辑(责任编辑:孙娟)

推荐访问:药检 构建 数据挖掘 计算 平台