【新三板行业研究】从概念到落地 大数据细分领域群雄争霸专栏号
近年来,人人都在说大数据。到底什么是大数据?什么样的数据才能称为大数据呢?
麦肯锡(McKinsey & Company)认为大数据(Big Data)就是规模大小超过了典型数据库软件的采集、存储、管理和分析等能力的数据集合。
简而言之,大数据就是全数据集合,具有数据量大、类型繁多、价值密度低、时效性高的特点,是需要重新处理才能产生价值的信息资产。
大数据产业链条逐渐完善,市场潜力有待挖掘
大数据不只是大,产业链条逐渐完善
大数据区别于传统数据的的最大之处就在于大数据是在线产生的、时效性很强。
简单说来,传统数据可以总结为是静态数据,是过去一段时间内的数据,那大数据就是动态数据,是实时产生的数据。很多人认为数据量大就是大数据,却忽略了大数据的在线特性。数据只有在与用户产生连接时才有意义。
从产业链关系来看,大数据产业链是围绕着大数据技术和服务而展开的,包括一切与大数据的产生与集聚(数据源)、组织与管理(存储)、分析与发现(技术)、交易、应用与衍生产业相关的所有活动。经过近些年的发展,大数据产业链条逐渐完善,具体可以分为大数据获取层(以政府、企业和机构为主的数据源提供商)、硬件支持层(以采集、传输、存储数据为主的硬件制造商)、大数据技术层(以挖掘、分析、存储大数据和数据可视化为主的技术提供商)、大数据交易层(以数据评估、定价和撮合为主的交易服务提供商)、大数据应用层(以政府、零售、金融大数据为主的应用服务提供商)和大数据衍生层(以供应链金融、机器学习和人工智能为主的衍生服务提供商)。
但是,在日常应用中,大数据采集企业往往会提供大数据交易服务,因而大数据交易层通常会被归为大数据采集层,而大数据衍生层也常常被归为大数据应用层级。故接下来的叙述就将大数据产业链进行简化,分为大数据采集层、大数据硬件支持层、大数据存储处理层和大数据应用层。
大数据产业图谱
多方环境利好,市场潜力有待挖掘
近年来,我国大数据产业的宏观政策环境不断改善。2012年以来,工信部、发改委等部门支持了一批大数据产业相关项目,推进了技术研发并取得了积极效果。2014年,《政府工作报告》明确指出,要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。2015年,国务院发布了《国务院关于印发促进大数据发展行动纲要的通知》,纲要表示,中国将在2018年建成国家政府数据统一开放平台,实现数据统一共享平台的全覆盖,将在2020年底前,向社会开放民生相关领域的政府数据。随后,各地区也纷纷发布关于大数据方面的政策利好信息。
根据中国工业和信息化部发布的《大数据产业发展规划(2016-2020年)》,截至2016年年末,我国网民数量超过7亿,移动电话用户规模突破13亿,月度户均移动互联网接入流量达835M。政府部门、互联网企业、大型集团企业积累沉淀了大量的数据资源。
再来看看大数据产业的“蛋糕”有多大。根据IDC(国际数据公司, International Data Corporation)的预测,到2018年,全球大数据技术和服务市场的复合年增长率将达到26.4%,规模达到415亿美元,会是整个IT市场增幅的6倍左右。同时,大数据在国内的市场规模同样巨大,根据中国信息通信研究院发布的《大数据白皮书(2016)》数据显示,2015年我国大数据核心产业的市场规模达到了115.9亿元,增速达38.0%。同时预计了大数据核心产业在2017-2018年还将维持40%左右的高速增长。可以这么说,不论是国内市场还是国际市场,大数据市场的潜力很大,还有待挖掘。
注:2011年、2012年国内大数据产业较少,未形成一定规模
来源:WIND数据库
大数据从概念走向落地,应用场景不断丰富
34家上市企业市值超3500亿元
据不完全统计,2014年,国内的大数据企业不足100家,到了2015年,大数据行业企业数量已经增加到了500家以上,而到了2017年,大数据企业已经超过5000家。
根据WIND数据库信息显示,截至2017年6月末,A股市场有大数据概念企业34家。最新市值合计为3530.70亿元,最近三年的年均复合增长率达27.9%。其中,主板上市企业9家,市值合计984.83亿元;中小板上市企业10家,市值合计1613.56亿元;创业板上市企业15家,市值合计932.31亿元。
来源:WIND数据库(市值数据采用2017年7月13日收盘价)
资本助力市场,中小企业也有春天
经过几年的发展,我国大数据市场初步形成“三角形”的竞争结构,一方是以BAT为代表的互联网企业,一方是以华为、联想、用友等为代表的传统IT企业,另一方是以九次方、拓尔思为代表的新起大数据企业。
国内大数据市场竞争格局
那么现有的大数据企业都是如何赚钱的呢?现在的大数据企业在客户群体上分类的话,大概可以分为三类:
第一类就是TO B方向。这一类企业主要是做工具和外包服务,可以为企业提供解决方案、数据可视化和商务智能等服务,代表企业有甲骨文公司(Oracle)、IBM等。
第二类就是TO C方向。这一类企业主要是辅助用户做决策,可以为用户提供高考志愿填报、个人健康管理、选餐订餐等服务,代表企业有有道词典、饿了么等。
第三类就是TO B+TO C方向。这一类企业主要是既有企业客户又有个人客户的规模相对较大的企业,既可以收集用户数据,分析出报告,然后给到相应的企业,又能根据自己的数据反馈,更好的服务用户,代表企业有阿里巴巴、腾讯、百度等。
大数据企业类型
当然,大数据企业的第一步就是获取数据,像BAT、华为这样的企业,背靠着海量数据资源,做起大数据就有很多“先天优势”。那中小大数据企业的出路在哪呢?
答案就是细分市场。在现有的竞争格局下,再想做出一家百度或者是阿里巴巴这样规模的企业,或许已经是不可能的事情了。但是,按照消费者的具体需求,定制相关细分领域的大数据服务,或许大有可为。
大数据细分产业的火爆,吸引了大批资金入场。据新芽NewSeed数据显示,自2015年以来,近百家大数据企业完成融资,总融资金额超百亿。其中,2015年就有26家大数据公司完成融资,总融资金额超过30亿元人民币(部分企业未披露融资金额);2016年有53家大数据企业完成融资,总融资金额超过50亿元人民币(部分企业未披露融资金额);到了2017年,随着大数据产品的逐渐落地,融资市场略有降温,2017年上半年有18家大数据企业完成融资,融资金额超过20亿元,天使轮到A轮的企业居多。
注:融资金额仅统计了已披露融资金额,部分企业未披露,则未计入统计
数据来源:新芽NewSeed
从营销到网络安全,应用场景不断升级
对于大数据的应用场景,往往是按照用户需求,在传统行业里植入大数据元素,从而提升用户体验、节约企业成本。
从农牧大数据的调配生产到交通大数据的顺畅出行,从零售大数据的精准营销到社交大数据的舆情监控,从医疗大数据的健康管理到金融大数据的产品配比,可以说,大数据已经深入到我们生活的方方面面了,并且随着企业的不断创新,应用场景也正在实现优化升级。
大数据应用层级列举
专注垂直领域,营收增速平稳
新三板大数据企业专注细分领域,整体研发投入较高
从前文分析的产业链关系来看,大数据产业简单可以可以概括为大数据设备制造、大数据采集、存储与处理和大数据应用。根据这一标准进行筛选,新三板上的主营大数据业务的企业有64家,按照其主营业务可以分为设备制造、数据采集、数据存储与处理以及数据应用,其中,数据应用企业最多,有37家,占比57.8%,而数据应用类企业也是深耕各细分行业,可分为医疗大数据企业、电信大数据企业和精准营销类大数据企业等方面。
新三板大数据企业类型
注:括号中数字表示企业数量,最小层级企业未标记企业数量。
经过查阅发现,上述64家大数据企业主要分布在北上广深这样的一线城市,其中,坐落在北京的企业最多,有26家,占比40.6%;上海、深圳各有7家企业,均占比10.9%;广州紧追其后,有6家企业,占比9.4%。
如此鲜明的地域分布,究其原因,不外乎以下三点原因:
首先,大数据的新兴概念属性。一线城市相对来说更具包容性和创新精神,更能接收到比较前沿的信息。
其次,大数据的“烧钱”属性。同许多互联网企业一样,大数据企业在前期融资需求十分强烈,而一线城市的投资机构资源十分丰富,抱着“近水楼台先得月”的想法,或许在一线城市能获得更多的投资。
最后,一线城市对于高新技术企业的扶持力度也是不容忽视的一大原因。以北京中关村科技园区为例,高新技术企业会享受到相应的税收、人才等各方面的优惠政策。
作为新兴概念行业,大数据也是一个前期研发投入较高的行业。数据显示,2016年新三板大数据行业整体研发投入8.06亿元,平均每家企业研发投入1259万元。其中,研发投入超过行业平均值的企业有23家,占比35.9%。而研发投入最多的企业是凯立德,2016年研发投入1.15亿元。
经过统计发现,研发投入位于1000万元以下的企业最多,共计37家,占比57.8%。
注:小值包含,大值不包含;如1000-3000万元,包含1000万元,不包含3000万元
数据来源:2016年年报
从细分行业来看,2016年平均研发投入最多的是大数据应用行业,共计投入4.97亿元,平均每家企业投入1342万元;其次是数据存储与处理行业,投入2.39亿元,平均每家企业投入1087万元。
数据来源:2016年年报
当然,评价一家企业的研发水平,不能仅从研发投入这个绝对值来看,接下来,我们从研发强度(研发强度=研发投入/营业收入*100%)入手,看一下大数据企业的研发能力如何。
以欧盟统计标准,5%以上属于高研发强度,此类企业一般被认为具备充分的研发竞争力优势;2%以下属于中低强度,不足1%则属于低强度。数据表明,大数据行业的整体研发强度达到11.5%,是当之无愧的高研发投入行业。有31家企业研发强度高于行业平均值,占比48.4%,其中,研发强度最高的企业是艾漫数据,达到141.4%。
经过统计发现,研发强度在5.0%-10.0%之间的企业最多,有24家,占比36.9%。
注:小值包含,大值不包含;如30%-50%,包含30%,不包含50%
从细分行业来看,2016年研发强度最高的行业是数据存储与处理行业,达到13.9%;其次是数据采集行业,研发强度达13.6%,反观数据应用行业和设备制造行业,研发强度相对较低,分别为11.2%和5.9%。
企业保持高速营收增长
数据显示,2016年新三板65家大数据企业中有49家企业营收过5000万,占比达到76.6%。其中,营收在5000万-1亿元之间的企业数量最多,有24家;其次是营收在1-2亿元之间的企业有15家;营收在2亿元以上的企业数量较少,有10家。
注:小值包含,大值不包含;如3000-5000万元,包含3000万元,不包含5000万元
数据来源:2016年年报
从细分行业来看,能源大数据应用企业营收均值位于首位,达5.89亿元;其次是金属大数据应用企业,营收4.62亿元。比较下来,各细分行业营收差距较大,究其原因,可能是由于大数据+传统强势行业的影响冲击,大宗商品市场本身的流通体量就相对较大,通过大数据技术方面的业务创新,企业在细分领域的影响就会相应地加强。
尽管新三板大数据行业的营收规模并不大,但是,部分企业的成长性良好。从营收增长率来看(为考察企业成长的连续性,此处采用2015-2016年的平均营收增长率进行分析),有57家企业实现了年均营收正增长,占比89.1%,其中,16家企业年均营收增长在50.0%-100.0%之间;年均营收增长在100.0%以上的有14家企业。唐宋数据以2161.3%的年增长率排在首位,九鼎瑞信以670.0%排在第二位。可见,这两家企业的年均营收的规模增长都在5倍以上,也可以从侧面说明,细分大数据领域的企业成长能力之强。
据易观智库《中国行业大数据应用市场专题研究报告2015(简版)》数据表明,2014年中国大数据市场行业营收结构中,金融、通信、零售为前三大行业,营收占比分别为16.0%、 15.6%和13.9%。政府、医疗、旅游营收比例分别为12.7%、 9.0%和4.1%。六大行业累计占比71.3%。其他行业包括教育、制造、能源、媒体、互联网等,累计占比28.7%。而像酒店管理、地理信息、天气信息等其他细分大数据市场还是一片蓝海的状态,未来这些细分领域的发展或可期。
盈利状况两极分化,数据存储类企业赚钱更稳妥
盈利企业数量多、数额较小
前文已经提到,大数据行业市场早已进入“千舸争流”的状态,企业大规模的投入资金去争取数据源、做数据分析,但是,不可否认的是,现在还有一大部分的企业不知如何数据变现——既要花费大量资金在数据存储方面,又要投入大量的人力物力去寻求数据变现。这使得大数据行业内的许多企业盈利状况不佳。
新三板上大数据企业的盈利状况则是盈利企业数量多,但数额相对小,以2015-2016年两年的数据容量来看,46家企业持续盈利,8家企业持续亏损,4家扭亏为盈,还有6家企业由盈利变为亏损。其中,2016年盈利的企业中,有22家企业净利润在1000万元以内;15家企业净利润在1000-2000万元之间;净利润超过2000万元的有13家企业,最高净利润为5596万元。而在2016年亏损的企业当中,最高亏损额达到1.04亿元。
从细分行业来看,46家连续盈利的企业中有8家为大数据存储类型企业,占比17.4%;8家连续亏损的企业则仅有1家为大数据存储类型企业,还有1家是数据可视化类型企业,其余7家则是专注于不同细分领域的大数据应用层级企业,如精准营销、地理行业应用等,这几个细分市场出现时间相对较短,目前尚处于互联网行业生命周期的前期,即业务拓展期,公司数据产品落地与推广、后台的维护与运营都需要大量的人力物力投入。
毛利率普遍较高
数据统计发现,新三板大数据行业整体的毛利率水平在35.2%。其中,有43家企业毛利率高于行业的平均水平,行业最高毛利率达到了92.6%。此外,从新三板大数据行业的细分层级方面分析,大数据存储与处理层级毛利率最高,达45.7%;其次是数据采集层级,毛利率为44.8%;大数据应用层级排在第三位,毛利率为31.7%;设备制造层级的企业毛利率相差较大,为25.8%。
由上图可以看出,在细分行业,金融大数据应用行业的毛利率最高,达84.1%,而金属大数据应用行业的毛利率最低,仅为2.4%。在不同的细分领域,其毛利率的差异也是较大的。这与该企业本身的行业属性有很大的关系。但是,行业的毛利率高,从侧面也反映了一个行业的进入壁垒较高,金融大数据应用行业的壁垒主要就是经营许可牌照、信息安全技术水平和客户集群。
数据显示,毛利率最高的3家企业分别是开眼数据(834671.OC)92.6%、雅捷信息(835468.OC)84.1%和众荟信息(837265.OC)78.6%。
其中,开眼数据是一家专注于互联网广告数据的挖掘与分析的企业,是搜索引擎(SEM)、智能化互联网广告服务提供商。进过查阅其2016年年报发现,其主要业务是QA问答营销,2016年产生营收848万元,营收占比48.7%。
雅捷信息致力于金融大数据产品和银行信息化系统及智能服务,一直以来立足于国内外金融机构及企业。 公司现拥有银行集中作业系统、DataTurbines大数据云平台、信贷业务系统等系列产品,是IBM银行领域的主要战略合作伙伴。
众荟信息是国内首个酒店业全数据平台。以“大数据+渠道+PMS”的创新模式,融合酒店行业大数据以及云计算技术,打通酒店行业数据链,建立良性生态圈。现阶段的主要客户有碧桂园凤凰国际、锦江酒店等。
大数据行业未来发展趋势
细分应用层级爆发出机遇
大数据并不在“大”,而在于“用”。对于很多行业而言,如何有效应用这些大规模数据、挖掘出更大的价值是成为赢得竞争的关键。因此,大数据的细分应用或成为未来十年产业发展的核心趋势,大数据产业链条的细分应用层级也或成为发展机会最大的投资领域。
大数据时代的核心应用方向主要包括智慧城市、旅游、医疗健康、教育、电子商务以及游戏、社交媒体等,移动互联网是未来10年IT产业的下一个金矿。
目前,国内一些领先的互联网企业,包括新浪、腾讯、阿里巴巴等,早已开始了实质性的探索。比如,阿里、新浪“联姻”之后,新浪微博和淘宝之间的数据互动更为紧密,或将打造出一个横跨社交领域和电商领域的生活平台。
数据蕴藏价值,但是数据的价值需要用IT技术去发现、去探索,数据的积累并不能够代表其价值的多少。随着产业应用层级的快速发展,如何发现数据中的价值已经成为市场及企业用户密切关注的方向,因此大数据分析领域也将获得快速的发展。
而随着大数据行业IT基础设施的不断完善,大数据分析技术将迎来快速发展,不同的挖掘技术,挖掘方法将是人们未来比较重视的领域,因为,这个领域直接关系到数据价值的最终体现方式。
大数据与云计算的关系愈加密切
如果再找一个可以跟大数据并驾齐驱的IT热词,云计算无疑是跟大数据关系非常大的一个词语。很多人在提到大数据的时候总会想到云计算,二者还是有很多不同的,一句话来解释二者:云计算是硬件资源的虚拟化,大数据则是海量数据的高效处理。
大数据的特点对存储、传输和处理都提出了巨大的挑战,这个问题就需要新的技术来解决,云计算是大数据的处理器的最佳平台,未来,这种趋势的发展将越来越让二者的关系更紧密。例如,亚马逊利用云数据BI的托管服务,谷歌BigQuery中的数据分析服务,IBM的Bluemix云平台等等,这些都是基于云的大数据分析平台。
随着大数据行业的发展,尤其是数据量的爆炸式增长,分布式存储技术将作为未来解决大数据存储的重要技术,并实现从纵向扩张(Scale-up)向横向扩张(Scale-out)的转移。
分布式存储系统将数据分散存储在多台独立的设备上,这就解决了传统存储方式的存储性能瓶颈问题。随着大数据量的逐渐增大,可以通过分布式的处理方式把应用复杂分散到分布式系统的各个节点上,分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
安全和隐私问题越来越受到重视
数据价值对于企业来说是非常重要的,但是同样也有阻碍着大数据发展的一些因素,在这些因素中,隐私问题无疑是困扰大数据发展的一个非常重要的要素。
一些我们之前看似并不重要的数据信息,在大数据中心,许多这样的信息就很可能轻松了解一个人的近期情况,从而造成了个人隐私问题。而且如今随着大数据的发展,个人隐私越来越难以保护。有可能出现利用数据犯罪的情况,当然关于大数据隐私方面的法律法规并不全,还需要有专门的法规来为大数据的发展扫除障碍。
随着数据价值的越来越重要,大数据的安全稳定也将会逐渐被重视,大数据不断增长,无论对数据存储的物理安全还是对数据的管理方式都要求越来越高,从而对数据的多副本与容灾机制提出更高的要求。
对于大数据来说,未来,可能将不同的行业更加细分,针对不同的行业有着不同的分析技术。但是同样对于大数据来说,数据的多少虽然不意味着价值更高,但是更多的数据无疑更有助于一个行业的分析价值的发现。例如,对于医疗行业,如果每一个医院对自己的数据进行分析,相信也能够获得相应的价值,但是如果想获得更多的更大的价值,那么就需要全国,甚至全世界的医疗信息共享,这样才能够通过平台进行分析,获取更大的价值。所以,为了数据可能会呈现一种共享的趋势,数据联盟的出现势在必行。
1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。