找回密码
 用户注册

QQ登录

只需一步,快速开始

查看: 3936|回复: 0

Hadoop生态图谱

[复制链接]
发表于 2012-2-19 22:41:20 | 显示全部楼层 |阅读模式

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

  • 这一切,都起源自Web数据爆炸时代的来临
  • 数据抓取系统 - Nutch
  • 海量数据怎么存,当然是用分布式文件系统 - HDFS
  • 数据怎么用呢,分析,处理
  • MapReduce框架,让你编写代码来实现对大数据的分析工作
  • 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe
  • 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop
  • MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
  • 让你的数据可见 - drilldown, Intellicus
  • 用高级语言管理你的任务流 – oozie, Cascading
  • Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
  • 数据序列化处理与任务调度 – Avro, Zookeeper
  • 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce
  • OLTP存储系统 – Hbase



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?用户注册

×
您需要登录后才可以回帖 登录 | 用户注册

本版积分规则

Archiver|手机版|小黑屋|ACE Developer ( 京ICP备06055248号 )

GMT+8, 2024-3-28 18:40 , Processed in 0.017963 second(s), 7 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表