`

Hadoop生态图谱

 
阅读更多

http://blog.nosqlfan.com/html/3675.html

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

  1. 这一切,都起源自Web数据爆炸时代的来临
  2. 数据抓取系统 -  Nutch
  3. 海量数据怎么存,当然是用分布式文件系统 -  HDFS
  4. 数据怎么用呢,分析,处理
  5. MapReduce框架,让你编写代码来实现对大数据的分析工作
  6. 非结构化数据(日志)收集处理 -  fuse ,webdav ,  chukwa ,  flume ,  Scribe
  7. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 -  Hiho ,  sqoop
  8. MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 –  Pig ,  Hive ,  Jaql
  9. 让你的数据可见 - drilldown,  Intellicus
  10. 用高级语言管理你的任务流 –  oozie ,  Cascading
  11. Hadoop当然也有自己的监控管理工具 –  Hue ,  karmasphere ,  eclipse plugin ,  cacti ,  ganglia
  12. 数据序列化处理与任务调度 –  Avro ,  Zookeeper
  13. 更多构建在Hadoop上层的服务 – Mahout ,  Elastic map Reduce
  14. OLTP存储系统 –  Hbase

  • 大小: 655 KB
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics