本篇文章3552字,读完约9分钟
在移动计算、云计算、物联网等多种技术和APP的推动下,人类世界的数据量正在以惊人的速度增长。 在这种情况下,微软如何帮助客户应对大数据的挑战? 如何发掘大数据中蕴含的商机? 为此,比特网记者独家采访了微软企业亚太研发集团服务器和开发工具中国研发中心商务战术总监殷皓,明确了微软的大数据战术。 也就是说,帮助顾客整合结构数据和非结构数据,作为数据服务满足应用诉求。
q问:在大数据环境中,企业客户对大量异构数据的捕获、存储、集成、管理和分解有很大的诉求。 你认为中国公司级客户现在最迫切的诉求是什么?
(/s2 ) )殷皓(/s2 ) )大数据应用是一个分步的过程。 首先是保存数据,然后是数据内在、解释,从数据中挖掘价值。 如果将探索、事件、信号全部转换为数据进行保存,数据量将会非常惊人。 事实上,如何以有组织的方式有效存储结构化和非结构化数据,为未来的APP做好准备,是中国大数据APP诉求客户目前的亮点。 另一方面是云计算和数据服务的整合。 结构化和非结构化数据必须有机集成,并作为数据服务层提供给公司客户或政府客户。 数据存储就绪后,接下来是分解优化和应用。 就我个人而言,我认为在最近的一两年内,对大数据的应用、分解、解决将会得到非常迅速的发展。
微软企业亚太研发集团服务器和开发工具中国研发中心商务战术总监殷皓
q问:正如您所说,国内已经有一些大型企业关注大数据APP。 那么,这些顾客在使用大数据观察解决工具时,会遇到什么困难?
(/s2/)殷皓(/s2/)大数据APP中,重点是非结构化数据是难点。 目前,顾客的结构化数据最大为数十tb,在这个范围内比较容易操作,应用不是什么大问题。 真正的挑战是有点新的场景,特别是影像数据流或传感器流,数据的生成非常频繁。 这些新的数据通道可能需要我们的技术进行适当的调整。 我认为挑战分为四个方面。
第一,数据量的急剧增长给it设备带来的挑战。 以物联网的应用为例,物联网普及后,非常多的传感器开始传播地理、空之间、时间等新闻,对运算和记忆造成巨大的冲击。 二是数据量激增带来的管理难题。 一家公司可能精通管理1tb的数据,但由于增加了新的数据源和新的技术力量,数据量激增到了20tb,因此这种爆炸式的增长对公司来说是一个挑战。 第三,应用于数据。 如何根据这些数据进行比较有效的分解,在分解的基础上进行比较有效的预测,挖掘商业价值也是一大挑战。 第四,随着新数据源的增加,特别是其中有许多非结构化数据源。 这改变了我们对以前传来的数据的认识,如何将新元素融合到以前传来的数据模型中,迅速将大量数据进行新的分解也是一个新的挑战。
q :正如您所说,数据的分解和应用很难。 那么,微软是否有合适的工具帮助客户从大数据中挖掘合适的商业价值?
殷皓: 这可以在SQL服务器上实现。 从sql server 2008开始,微软将其定位为数据服务,而不仅仅是数据库。 在今后数据爆炸的时代,大数据也只是数据服务中的一个要素。 我们不仅要保存数据,还必须采用数据。 在sql server中,微软推出了一系列有意义的hadoop组件。 首先,微软在sql server公共云服务中有一个叫做isotope的hadoop服务。 接下来,微软将发布另一个服务版本。 本版本的重点是在公司内部构建isotope群集。 与以前流传的hadoop群集相比,该群集有三个优点。 第一,前者与微软的窗口服务器非常集成,在此操作系统中优化了性能。 其次,isotope集群可以与公司的安全系统、认证系统很好地集成。 第三,要能与微软以前流传的业务分解( bi )工具很好地集成。
在数据爆炸和大数据的时代,微软目前只是迈出了最初的一步,这一步的目的是让客户拥有手段和能力,采用结构性数据和非结构性数据。 特别是微软现在发现,基于非结构化数据,或者说nosql数据,每个数据可以分解的工具几乎都是空白色的。 今后,这样的分解工具将会得到很大的发展吧空。 微软在这方面投入了大量的研发资源,未来微软将打破结构化和非结构化的壁垒,提供扩展的数据服务。
微软计划未来的数据库产品时,今后也会将越来越多的资源投入到数据库集群、数据库服务、横向扩展服务行业,其中大部分将投入到云服务中。 重要的目的是要承受这样巨大的数据可扩展的累积压力。 另外,如何将结构数据和非结构数据作为数据服务提供给顾客也是重要的一环。
q问:但是,要进行更有效的分解,需要可靠、更有效的数据模型。 那么,微软如何才能使自己的大数据观察工具符合相应领域的诉求呢? 微软自己是否建立了域模型?
(/S2 ) )殷皓(/S2 ) )这是个有趣的问题。 这个问题与微软在领域的投资有关。 微软是核心技术平台企业。 因此,一般来说,微软在特定领域的积累比领域合作伙伴要深。 但是,正如我前面指出的,大数据拆解往往需要对领域有非常深刻的认识,数据模型一般代表着对这个领域、运维数据的理解、对业务的理解。 因此,微软的战略是继续在核心技术上进行非常多的投资,并与合作伙伴合作推出域模型。
微软在核心技术上的投资,以sql server为例,其中的power view被认为是微软朝着拆解方向迈出的一小步。 他可以非常迅速地对客户进行现有的数据模型的更改,也可以构建新的数据模型进行数据观察。 也可以对很多what if进行数据观察,建立拆解模型,与其他顾客和部门共享。 这就是微软对核心技术的投资。 微软发布的数据模型不仅是多维模型,也包括对整个数据模型的理解,是通用的数据模型、分解模型。 但是,在此基础上,微软有合作伙伴,希望利用微软的工具综合他们对领域的认识和积累,提出处理方案。
在中国,微软也积极看到与合作伙伴的合作机会,如智能城市、物联网新APP等。 微软在中国的研发,最近也在实时事态解决、物联网、智慧城市的一点支撑核心技术上投入了相当大的部分。 在这些周边领域的处理方案,如何与合作伙伴进行整合,也是微软近期的一大工作重点。
q问:正如我前面所说,随着新数据源的增加,特别是非结构化数据源的增加,数据的识别方法也会发生变化。 那么,对于微软SQL服务器来说,使用这些方法有效地部署了非结构化数据源吗?
(/S2 ) )殷皓(/S2 ) )这牵涉到几个非常有趣的技术方面,我们先来谈谈技术。 sql server有一个叫做“流insight”(一个多而复杂的解决引擎)的组件。 这也是比尔吗? 这是盖茨启动的项目。 streaminsight前端是内存解决方案引擎,触摸传感器、传感器流水型数据、甚至图像等各种事件源通过适配器将事件转换为标准事件模式,然后导入到内存解决方案引擎中 streaminsight的后端有一个导出适配器,用于解决引擎和解决事件,然后在符合解决规则的情况下通过导出适配器推送事件。 例如,推送到实时更新的silverlight前端站点,推送到数据库,推送到警报设备和邮件入口。 的核心引擎规则的解决是用标准语言连接的。
微软为什么要做这种东西? 因为,现在有标准的visual studio开发工具,客户非常迅速地在前端开发不同的适配器,在后端开发不同的适配器,中间的规则在标准的链接上一致。 这样,客户就可以非常迅速地编写许多他特有的规则。 那么,这台发动机的性能怎么样? 根据微软的测试,一秒钟可以解决约20万的事态、事情。 而且,这个引擎将成为微软在许多智能城市、物联网甚至远程信息技术的核心技术的一环。
q :至今仍有大数据解决是有钱人的游戏的说法。 微软的大数据解决方法贵吗?
(/S2 ) )殷皓(/S2 ) )技术普及的一大障碍是价格。 许多技术可以用非常高端的产品来处理,许多业务问题也可以用非常高端的技术来处理,但结果是价格非常高。 微软的目的是让更多的人享受技术,降低技术价格。 例如,如果一种技术只能满足某些人特定场景的诉求,那么它的价格一定会很高。 因为特定的人需要承担整个处理方案的价格。 但是,在很多人能够共享这个处理方案的情况下,可以降低其价格。
因此,微软的出发点是想制造出很多人都能使用的产品。 那样的话,可以降低那个价格。 例如,对于我们刚才提到的许多复杂的事态解决引擎,中国的研发部门进行了一些项目,将其变成了一个通用行业,可以公开采用,可以适用于非常广泛的服务。 目前,我们看到顾客打算应用于实时公文解决。 例如,实时检查清算文件是否合规,供应链、智能电网的实时环境检查、有害气体检查等。 所有这些应用场景的基础核心是许多复杂的事态解决引擎提供的服务。 因此,我们可以在目前国内大力推广的应用场景中,尽量重新采用这项服务,从而减少客户的投资。
标题:“殷皓:微软怎么面对大数据挑战”
地址:http://www.sdsxywx.com/sdss/4245.html