哈尔滨烟叶公司汤原分公司黑龙江省佳木斯市154700
摘要:当前,“大数据”时代已经到来,成为我国经济社会发展“新常态”重要组成部分,信息数据从“资源”向“资产”迅速转变1。信息时代下数据信息已经渗透到烟叶生产经营的各个方面,日益成为最重要的发展资源,烟叶大数据应用平台的研究应运而生。
关键词:大数据;应用;烟叶种植;合同管理;分析
引言:GPRS无线网络取代有线网络。传统的远程监测需要铺设网线,投入成本高、后期维护复杂;当育苗大棚温湿度超标时,系统自动启动风机进行降温除湿,同时自动发短信报警。为了实现这一目标,需要设计控制箱,通过数据线和控制线和现有控制柜兼容,同时不影响现有操作。在数据中心对烟草育苗大棚的环境参数进行大数据分析,实现反向追溯、痕迹化操作、扁平化管理等目的。以往的育苗管理工作以点检为主,人工劳动强度大,效率较低,采用了本系统后,管理人员可以直接通过手机查看和控制任何一座育苗大棚的设施;同时在更深层次上,可以通过系统自动统计和运算,为管理工作提供科学依据和技术支持。
1.烟叶生产问题分析
1.1因势利导自然因素,解决靠天吃饭问题
在烟叶生产的过程中,土壤、水文、光照、气温、降雨、病虫害等自然因素影响至关重要,借助大数据提供的海量资源进行时机判断,预测烟叶生产中发生的各种风险因素,制定与之相对的措施,降低自然因素对烟叶生产的不利影响,充分发挥自然因素的有利作用,解决烟叶生产“靠天吃饭”的问题,实现烟叶生产的效益最大化目标。
1.2巩固浓香品牌优势,解决产业发展问题
努力提升烟草行业社会效益,不断增加烟农收益,践行“国家利益至上、消费者利益至上”行业共同价值观,切实将烟叶结构优化措施落实到位,努力挖掘“浓香品牌”内在特质,进一步发挥并巩固浓香特色品牌优势,树立优质品牌,提升品牌价值。
1.3优化行业资源配置,解决资源复用问题
合理利用烟用机械、育苗工场、烘烤工场等设备设施,合理分配肥料、烟种、烟苗、电力等农用物资,强化生产过程控制,实现精良技术与精准作业的结合,推进烟叶生产由传统生产向集约经营、粗放管理向精细管理转变。
2.烟叶大数据平台总体规划
2.1开发面向烟叶生产的大数据应用
建立面向烟农服务的大数据应用,针对烟叶种植合同的管理这个大难题,围绕烟叶种植合同的真实性这个“源头”问题,提供基于大数据的合同管理、烟农画像、烟农标签等应用服务,抓住难点问题,发挥重点效果,快速提升企业的管理水平和服务能力,为烟叶生产计划、补贴的制定提供准确依据。
2.2建设大数据应用平台
基于Spark架构,搭建通用的大数据应用平台,为大数据的分析处理提供通用的分布式计算环境,为海量异构数据提供存储、整合、操作和管理的资源和工具,从而支撑大数据应用的运行。
2.3定义面向烟叶生产的大数据资源体系
指导烟叶技术员深入基层开展送技术、送服务到田间地头,在烟草选种、育苗、采摘、烘烤等工艺环节进行探索,形成具有郴州特色的浓香型特色优质烟叶生产工艺标准;在烟叶管理、施肥、病虫害防治等技术环节进行探索,确保技术落实到位。同时,为工业企业客户开展产品满意度调查和产品追溯管理,进一步提升浓香型烟叶品质。
2.4采集烟叶生产大数据资源
在现有的烟叶生产大数据基础上,围绕业务需求逐步收集、完善烟叶生产过程中的数据内容,并形成高效易用的烟叶大数据采集、管理和操作工具和机制。
3.烟叶大数据平台架构
3.1总体架构
总体架构构建包括烟叶种植生产数据、烟农管理数据、生产资源管理数据以及外部数据的大数据资源。
3.2应用架构
在大数据应用平台的基础上,构建大数据示范分析应用,主要面向烟农和烟叶收购提供管理服务,具体包括烟叶种植合同分析和烟农画像等应用。在应用的构建过程中,应用大数据分析建模的相关工具,设计烟叶大数据应用的数据模型和业务模型,支撑烟叶大数据的分析和应用。
4.烟叶大数据平台具体设计
4.1大数据应用平台
基于先进的Spark大数据计算框架,构建数据计算引擎,提供面向大数据处理和分析的计算平台,向下兼容Hadoop架构,支持批量处理、流计算以及图计算等多种计算范式2。在数据计算引擎之上,实现可面向海量、异构数据进行并行分析、处理和展现的计算模型库和可视化组件,包含主流的机器学习和统计算法,以及面向事件分布、统计分析、趋势预测等业务场景的可视化模型等3。
4.2面向烟叶生产的大数据示范应用
4.2.1烟叶种植合同分析
(1)以烟农为单位,建立烟农合同异常状态数据模型,从合同中的烟农基础信息(包括性别、年龄、学历、种植经验等)、土地流转信息(包括土地流转协议、种植面积以及组成情况等),土地地理位置信息、补贴发放情况、烟农日常生产活动信息、烟叶品种、合同种植株数与实际单产信息、以及从烟叶收购信息系统中提取烟叶合同特征数据,形成烟叶种植合同分析的数据样本集。(2)基于数据样本集进行综合分析,利用聚类分析算法,对样本数据集的特征进行无监督机器学习,形成分类样本空间,将分类样本空间的合同样本与原始合同数据进行比对,分析各类别合同的特性和状态,按照类别标记合同状态标签。(3)根据烟叶种植合同的状态标签,对于出现异常的合同进行核查和验证,发现异常合同,并发布预警提示。
4.2.2烟农画像
对烟农基本信息、烟叶收购信息、外部因素(如自然灾害、特殊事件等)进行综合分析,按照烟农的特点建立烟农的标签体系,如“抗灾能力强”、“xx等级烟叶产量高”、“产量稳定”、“诚信度高”等,以此对烟农进行分类,基于分类结果进行聚类分析,挖掘特定的烟农群体,以此作为烟叶种植情况分析判断的依据,以发现特定群体烟农在某方面的经验和特点,便于进行推广。
4.3烟叶大数据资源规划设计
平台构建烟叶大数据资源与应用体系,涵盖育苗、大田管理、烘烤、收购、调拨仓储以及销售等环节的数据,以及相关联的天气、地理信息、人口分布等外部关联数据。经过与业务关联,将烟叶大数据资源应用体系划分为烟农烟叶大数据、烟叶种植生产大数据以及烟叶生产资源管理大数据三个方面。
4.4烟叶生产大数据资源采集管理
平台建设按照分步实施原则,对现有的烟农烟叶大数据展开数据资源的采集管理,并融合外部数据,如气象、地理信息、政策等相关信息,形成完整的烟农烟叶大数据资源。
总结:烟草农业大数据的研究,大力实施郴州绿色生态浓香型烟叶发展战略。通过烟叶大数据平台的科学数据支撑,紧抓住“大数据”时代的机遇,以提升烟叶种植合同的真实性为目标,探索浓香型特色烟叶内在特质、生产规律并巩固其优势,解决烟叶生产中靠天吃饭、品质提升、产业布局、资源复用、产业发展五大问题,大力推进“智慧郴烟”的发展建设。
参考文献:
[1]苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015,41(06):4-12.
[2]于志刚,李源粒.大数据时代数据犯罪的制裁思路[J].中国社会科学,2014(10):100-120+207.
[3]程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(09):1889-1908.
[4]李广建,化柏林.大数据分析与情报分析关系辨析[J].中国图书馆学报,2014,40(05):14-22.