maven常见问题问答(超全面)

博客分类：

maven

http://www.oschina.net/question/158170_29368

2012-04-27 17:58
浏览 687
评论(0)
分类:开源软件

HDFS简介 http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html HDFS读写过程解析 http://www.cnblogs.com/forfuture1978/archive/2010/11/10/1874222.html Map-Reduce入门 http://www.cnblogs.com/forfuture1978/archive/2010/11/14/1877086.html

2012-04-17 14:13
浏览 746
评论(0)
分类:开源软件

hadoop 官方文档

博客分类：

hadoop

hadoop: http://wiki.apache.org/hadoop/PerformanceTuning (调优) wiki:http://wiki.apache.org/hadoop/ http://wiki.apache.org/hadoop/Hbase?action=show&redirect=HBase book:http://hbase.apache.org/book.html https://cwiki.apache.org/confluence/display/Hive/Home https://cwiki.apache.org/conf ...

2012-04-17 10:40
浏览 714
评论(0)
分类:开源软件

hadoop mapreduce 输出不带行号（用于预处理）

博客分类：

hadoop

You can suppress the key or the value (or both, making this output format equivalent to NullOutputFormat, which emits nothing) from the output using a NullWritable type. This also causes no separator to be written, which makes the output suitable for reading in using TextInputFormat.

2012-04-16 18:19
浏览 1009
评论(0)
分类:开源软件

hadoop mapreduce查看System.out的数据

博客分类：

hadoop

Actually stdout only shows the System.out.println() of the non map reduce classes. The System.out.println() for map and reduce phases can be seen in the logs. Easy way to access the logs is http://localhost:50030/jobtracker.jsp- >click on the completed job->click on map or reduce task-> ...

2012-04-16 18:18
浏览 863
评论(0)
分类:开源软件

Stringtokenizer和split

博客分类：

java

建议：（1）如果要用正则表达式作为分隔符来拆分字符串，则必须使用String.split(String regExp)来处理；

2012-04-16 13:27
浏览 902
评论(0)
分类:编程语言

外部表分区添加数据方式代码示例

博客分类：

分布式

tips 1. create external table ext_user(id int, mail String, count int) partitioned by (ds string) row format delimited fields terminated by '\t' stored as textfile location '/dsap/rawdata/user'; hdfs location 路径需为文件夹，或不存在（执行后会自动创建文件夹），另 date� ...

2012-04-13 18:24
浏览 1076
评论(0)
分类:开源软件

Hadoop生态图谱

博客分类：

hadoop

http://blog.nosqlfan.com/html/3675.html 当下Hadoop已经成长为一个庞大的体系，貌似只要和海量数据相关的，没有哪个领域缺少Hadoop的身影，下面是一个Hadoop生态系统的图谱，详细的列举了在Hadoop这个生态系统中出现的各种数据工具。这一切，都起源自Web数据爆炸时代的来临数据抓取系统－ Nutch 海量数据怎么存，当然是用分布式文件系统－ HDFS 数据怎么用呢，分析，处理

2012-04-13 14:09
浏览 704
评论(0)
分类:开源软件

wiki hive doc

博客分类：

bak

https://cwiki.apache.org/confluence/display/Hive/Home

2012-04-13 11:03
浏览 734
评论(0)
分类:开源软件

Hive用MySQL做元数据保存的数据库时，mySQL设置

博客分类：

分布式

BODY { FONT-FAMILY:Tahoma; FONT-SIZE:10pt } P { FONT-FAMILY:Tahoma; FONT-SIZE:10pt } DIV { FONT-FAMILY:Tahoma; FONT-SIZE:10pt } TD { FONT-FAMILY:Tahoma; FONT-SIZE:10pt } 安装MySQL： # tar -zxvf mysql-5.1.37.tar.gz -C /usr/local # cd /usr/local/mysql-5.1.37/ # ./configure --prefix=/usr/loc ...

2012-04-13 10:59
浏览 848
评论(0)
分类:开源软件

HBase技术介绍

博客分类：

hbase

http://www.searchtb.com/2011/01/understanding-hbase.html http://www.open-open.com/lib/view/open1328755780186.html HBase简介 HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文 ...

2012-04-13 10:16
浏览 674
评论(0)
分类:开源软件

hbase zookeeper 问题备忘

博客分类：

hbase

Apache Zookeeper入门1 http://www.javabloger.com/article/apache-zookeeper-hadoop.html Apache ZooKeeper入门2 http://www.javabloger.com/article/zookeeper-hapood-apache.html Apache ZooKeeper入门3 http://www.javabloger.com/article/apache-zookeeper-hbase-hadoop-3.html ZK session客户端过期(Exp ...

2012-03-31 15:02
浏览 903
评论(0)
分类:开源软件

hbase基本概念和hbase shell常用命令用法

博客分类：

hbase

1. 简介 HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。 2. HBase的表结构 HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族/列簇(column family)。

2012-03-30 09:55
浏览 806
评论(0)
分类:开源软件

HBase中的Client如何路由到正确的RegionServer

博客分类：

hbase

在HBase中，大部分的操作都是在RegionServer完成的，Client端想要插入，删除，查询数据都需要先找到相应的RegionServer。什么叫相应的RegionServer？就是管理你要操作的那个Region的RegionServer。Client本身并不知道哪个RegionServer管理哪个Region，那么它是如何找到相应的RegionServer的？本文就是在研究源码的基础上揭秘这个过程。在前面的文章“HBase存储架构”中我们已经讨论了HBase基本的存储架构。在此基础上我们引入两个特殊的概念：-ROOT-和.META.。这是什么？它们是HBase的两张内置表，从 ...

2012-03-29 17:55
浏览 761
评论(0)
分类:开源软件

linux 重定向技巧

博客分类：

linux

linux 环境中支持输入输出重定向，用符号<和>来表示。 0、1和2分别表示标准输入、标准输出和标准错误信息输出，可以用来指定需要重定向的标准输入或输出，比如 2>a.txt 表示将错误信息输出到文件a.txt中。同时，还可以在这三个标准输入输出之间实现重定向，比如将错误信息重定向到标准输出，可以用 2>&1来实现。 Linux下还有一个特殊的文件/dev/null，它就像一个无底洞，所有重定向到它的信息都会消失得无影无踪。这一点非常有用，当我们不需要回显程序的所有信息时，就可以将输出重定向到/dev/null。如果想要正 ...

2012-03-27 10:01
浏览 677
评论(0)
分类:操作系统

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

maven常见问题问答(超全面)

hadoop学习总结

hadoop 官方文档

hadoop mapreduce 输出不带行号（用于预处理）

hadoop mapreduce查看System.out的数据

Stringtokenizer和split

外部表分区添加数据方式代码示例

Hadoop生态图谱

wiki hive doc

Hive用MySQL做元数据保存的数据库时，mySQL设置

HBase技术介绍

hbase zookeeper 问题备忘

hbase基本概念和hbase shell常用命令用法

HBase中的Client如何路由到正确的RegionServer

linux 重定向技巧

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>