IBM为Apache Spark推出业界首个开发环境-在云中交付以快速采用
IBM(纽约证券交易所:IBM)今天宣布了首个基于云的开发环境,用于近实时,高性能分析,使数据科学家能够访问和提取数据并向开发人员提供洞察驱动的模型。数据科学体验可在IBM Cloud Bluemix平台上使用,提供250种精选数据集,开源工具和协作式工作区,以帮助数据科学家发现并与开发人员共享有意义的见解,从而使快速开发注入智能的应用程序变得更加容易。
IBM斥资3亿美元开发Apache Spark,将其作为一种“分析操作系统”,从而创造了数据科学体验,通过对SparkR的新贡献,将Spark的速度和敏捷性扩展到R社区的200万以上成员, SparkSQL和Apache SparkML。结果,从事R工作的数据科学家将可以更快地访问更多数据,进而可以从IBM Cloud获得更多见解。
Data Science Experience的开放式协作环境允许数据科学家通过将来自IBM和其他公司(包括H2O,RStudio,Jupyter Notebooks)的内容,数据,模型和开源资源整合到Apache Spark上来加速和简化数据摄取,管理和分析。单一的安全性较高的托管环境。
IBM Analytics高级副总裁Bob Picciano说:“借助Apache Spark,我们看到了通过提供对策展数据集,开放源代码工具和协作平台的访问来显着改变数据科学家角色的机会,以加速创新。”“ IBM的Digital Science Experience是Apache Spark的杀手级企业应用程序,它为数据科学家提供了向开发人员提供洞察驱动模型的新机会,并为来自开源社区的空前创新打开了大门。”
IBM已经在帮助各行各业的组织使用基于Apache Spark构建的数据科学应用程序来获得新的业务见解,推动增长并提高效率。一些示例包括:
Bernhardt家具:Bernhardt IT团队使用IBM Spark,IBM Bluemix和移动技术,为iPad设备设计了一个虚拟陈列室应用程序,使销售团队可以立即访问最新的产品信息。实时分析流量模式和产品趋势,使Bernhardt现在可以快速调整产品放置,价格和供货状态。新的面向平板电脑的销售订购流程使Bernhardt Furniture既成为时尚潮流又是技术领先的公司。美国自行车女子团体追逐队正在使用IBM Spark,Watson IoT,移动和云来获取即时见解,从而改变游戏规则的训练策略和赛车战术。现在,车队可以对骑手数据进行高级分析,计算动态比赛位置,并确定赛道上的骑手分组。IBM,NASA和SETI研究所正在合作分析超过6 TB的复杂深空无线电信号,以寻找可能识别出智能外星生命的模式。借助Apache Spark上的IBM Analytics,SETI能够开展新的“恒星对窃听”活动,该活动使组织能够寻找可能在双星系统中运行的行星之间的潜在通信。实际上,所有恒星中有一半以上是这些类型的行星。通过从数百万个观测值中提取新特征,研究人员能够使用机器学习技术对信号进行分类,并集中精力进行异常或异常信号簇的后续深入分析。IBM继续与领先的数据科学组织(包括Galvanize,H2O.ai,LightBend和RStudio)合作,以促进集成和统一的数据科学生态系统。此外,IBM正在加入R联盟,以帮助加快数据科学对企业的准备。
IBM在不断发展的Analytics(分析)生态系统中处于领先地位,已为相关项目做出了贡献,其中包括Apache Toree,EclairJS,Apache Quarks,Apache Mesos,Apache Tachyon(现称为Alluxio),以及对Apache Spark子项目SparkSQL,SparkR,MLLIb和PySpark的重大贡献去年共有超过3,000笔捐款。
此外,IBM已将Spark内置到其平台的核心中,包括Watson,Commerce,Analytics,Systems,Cloud以及30多种产品,包括IBM BigInsights for Apache Hadoop,基于Apache Spark的IBM Analytics,带有Power Systems的Spark,Watson Analytics ,SPSS Modeler和IBM Stream Computing。IBM还开源了其突破性的SystemML机器学习技术,以在2015年提升Spark的机器学习能力。
就像IBM在计算机科学的发展中发挥了关键作用一样,我们今天可以看到许多相似之处。随着PC的推出,计算机科学已成为主流。 Picciano说。“使用数据科学,主要障碍是可以访问大型数据集并能够处理大量数据。通过今天的公告,客户可以同时拥有两者。”
有关IBM数据科学家经验和IBM Spark解决方案的更多信息,请参阅datadata.ibm.com。