评论(0)

有了这些应用 还担心无法从数据中获得收益?

2016-12-25 00:15 zhangxiaomeng A+

  Storm

  Storm是自由的开源软件,一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据。Storm很简单,支持许多种编程语言,使用起来非常有趣。Storm由Twitter开源而来,其它知名的应用企业包括Groupon、淘宝、支付宝、阿里巴巴、乐元素、 Admaster等等。

1

  Storm有许多应用领域:实时分析、在线机器学习、不停顿的计算、分布式RPC(远过程调用协议,一种通过网络从远程计算机程序上请求服务)、 ETL(Extraction-Transformation-Loading的缩写,即数据抽取、转换和加载)等等。Storm的处理速度惊人:经测试,每个节点每秒钟可以处理100万个数据元组。Storm是可扩展、容错,很容易设置和操作。

  Apache Drill

  为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会近日发起了一项名为“Drill”的开源项目。Apache Drill 实现了Google's Dremel。

1

  该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。

1

  “Drill”项目其实也是从谷歌的Dremel项目中获得灵感:该项目帮助谷歌实现海量数据集的分析处理,包括分析抓取Web文档、跟踪安装在Android Market上的应用程序数据、分析垃圾邮件、分析谷歌分布式构建系统上的测试结果等等。

  Pentaho BI

  Pentaho BI平台不同于传统的BI 产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的独立产品如Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决方案。

1

  Pentaho BI平台,Pentaho Open BI套件的核心架构和基础,是以流程为中心的,因为其中枢控制器是一个工作流引擎。工作流引擎使用流程定义来定义在BI平台上执行的商业智能流程。流程可以很容易的被定制,也可以添加新的流程。BI平台包含组件和报表,用以分析这些流程的性能。目前,Pentaho的主要组成元素包括报表生成、分析、数据挖掘和工作流管理等等。这些组件通过J2EE、WebService、SOAP、HTTP、Java、JavaScript、Portals等技术集成到Pentaho平台中来。 Pentaho的发行,主要以Pentaho SDK的形式进行。[返回频道首页]

本文导航 Storm、Apache Drill

打开客户端,无广告困扰,阅读更专注

相关推荐

热门新闻

MacOS勒索病毒现身 从此世上再无最安全系统

MacOS勒索病毒现身 从此世上再无最安全系统

网络信息安全 14

套餐还是套路?运营商“不限流量”遭用户吐槽

套餐还是套路?运营商“不限流量”遭用户吐槽

网络设备业界动态 27

不能不开心!全民嗨购入手攻略你准备好了么?

不能不开心!全民嗨购入手攻略你准备好了么?

网络设备采购指南 9

华为专利案败诉获法院“禁售令” 需赔偿2500万

华为专利案败诉获法院“禁售令” 需赔偿2500万

新闻眼 11

技术不断创新 盘点热门的云计算开源软件

技术不断创新 盘点热门的云计算开源软件

云计算技术 1

最新报告 2017年全球物联网投资将超8000亿美元

最新报告 2017年全球物联网投资将超8000亿美元

网络设备业界动态 0

锐捷无线NEW办公解决方案 实力派打造最牛办公环境

锐捷无线NEW办公解决方案 实力派打造最牛办公环境

网络设备厂商稿 0

笔记本电脑连WiFi时显示受限怎么办?

笔记本电脑连WiFi时显示受限怎么办?

网络设备厂商稿 0

精彩大战蓄势待发 华硕路由京东大促开启

精彩大战蓄势待发 华硕路由京东大促开启

网络设备采购指南 0

戴尔发布新款存储产品SC5020 壮大企业级实力

戴尔发布新款存储产品SC5020 壮大企业级实力

服务器今日焦点 0

推荐内容