会员
商店
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
往事如风
会当临绝顶,一览众山小
随笔- 89 文章- 4 评论- 194 阅读-
19万
首页
新文章
联系
管理
订阅
2014年8月17日
抓取之近似网页过滤
摘要: 抓取的网页内容中,有大部分会是相似的,抓取时就要过滤掉,开始考虑用VSM算法,后来发现不对,要比较太多东西了,然后就发现了simHash算法,这个算法的解释我就懒得copy了,simhash算法对于短数据的支持不好,但是,我本来就是很长的数据,用上! 源码实现网上也有不少,但是貌似都是同样的,...
阅读全文
posted @ 2014-08-17 22:35 往事如风
阅读(510)
评论(0)
推荐(0)
编辑
2014年8月7日
基情四射的两个css样式
摘要: 自定义blog样式时,代码段的line-height继承样式post的line-height,间隔太大了,决定再减小点,css都玩了几年了,感觉中这是很容易的事情。然后,就悲剧了好久,原先自定义样式表为.headermaintitle { font-family:"华文行楷",Verdan...
阅读全文
posted @ 2014-08-07 23:41 往事如风
阅读(383)
评论(0)
推荐(0)
编辑
2014年8月5日
Hadoop 2.4.1 登录认证配置小结
摘要: 1.简单模式 这种模式,配置简单,使用简单。 core-site.xml添加 hadoop.security.authorization true hadoop.security.authentication s...
阅读全文
posted @ 2014-08-05 19:59 往事如风
阅读(9487)
评论(0)
推荐(0)
编辑
2014年8月4日
Window中调试HBase问题小结
摘要: 1.好久没用log4j了,转到logback好多年了,hbase程序运行时,报缺少log4j配置,那么,就转去logback吧(以下的XXX表示版本号)。 原先lib包里面有log4j-XXX.jar、slf4j-api-XXX.jar、slf4j-log4j12-XXX.jar,干掉log4...
阅读全文
posted @ 2014-08-04 23:20 往事如风
阅读(16227)
评论(0)
推荐(0)
编辑
2014年8月2日
改了改博客界面
摘要: css和js,是咱的强项,花了几十分钟,调了下博客页面的css,重写了原先js中的一个方法,加了点东西,嗯。。就是右侧的块分类名居然有几个是英文的,不可饶恕! 内页的广告啥的隐掉,调了调样式,看着好多了。 中间有7年的东西没写上来,唉,慢慢加了,能记到多少写多少了。 右侧高度在内页中,还有...
阅读全文
posted @ 2014-08-02 10:10 往事如风
阅读(279)
评论(0)
推荐(0)
编辑
2014年8月1日
Hbase0.98.4/Hadoop2.4.1整合小结【原创】
摘要: 设定hbase的数据目录,修改conf/hbase-site.xml hbase.cluster.distributed true The mode the clusterwill be in. Possible values are ...
阅读全文
posted @ 2014-08-01 15:41 往事如风
阅读(1553)
评论(0)
推荐(0)
编辑
Hadoop 2.4.1 Map/Reduce小结【原创】
摘要: 看了下MapReduce的例子。再看了下Mapper和Reducer源码,理清了参数的意义,就o了。public class Mapperpublic class Reducer Map是打散过程,把输入的数据,拆分成若干的键值对。Reduce是重组的,根据前面的键值对,重组数据。 自己写M...
阅读全文
posted @ 2014-08-01 13:38 往事如风
阅读(358)
评论(0)
推荐(0)
编辑
hadoop的dfs工具类一个【原创】
摘要: 开始没搞定插件问题,就弄了个dsf操作类,后面搞定了插件问题,这玩意也就聊胜于无了,还是丢这里算了。 首先是一个配置,ztool.hadoop.propertieshadoop.home.dir=G:/hadoop/hadoop-2.4.1hadoop.user.name=hadoophado...
阅读全文
posted @ 2014-08-01 13:24 往事如风
阅读(3117)
评论(0)
推荐(0)
编辑
简化 Hadoop 2.4.1 Eclpse 插件编译【原创】
摘要: 昨天折腾hadoop2X的eclipse插件,从https://github.com/winghc/hadoop2x-eclipse-plugin把源码搞下来后,很快搞定出来一个,但是。。。New Hadoop Location时,窗口出不来,汗死,原因后面会说明的。源码难下,最后我会附上源码包...
阅读全文
posted @ 2014-08-01 03:58 往事如风
阅读(2434)
评论(2)
推荐(0)
编辑
2014年7月31日
Hadoop 2.4.1 设置问题小结【原创】
摘要: 先丢点问题小结到这里,免得忘记,有空再弄个详细教程玩,网上的教程要不就是旧版的,要不就是没说到点子上,随便搞搞也能碰上结果是对的时候,但是知其然而不知其所以然,没意思啊。解决问题的方法有很多种,总得找到比较合适的方法才行的。1.服务器禁用ipV6配置.2.Could not locate execu...
阅读全文
posted @ 2014-07-31 18:21 往事如风
阅读(4640)
评论(0)
推荐(1)
编辑
下一页
最新随笔
1.抓取之近似网页过滤
2.基情四射的两个css样式
3.Hadoop 2.4.1 登录认证配置小结
4.Window中调试HBase问题小结
5.改了改博客界面
6.Hbase0.98.4/Hadoop2.4.1整合小结【原创】
7.Hadoop 2.4.1 Map/Reduce小结【原创】
8.hadoop的dfs工具类一个【原创】
9.简化 Hadoop 2.4.1 Eclpse 插件编译【原创】
10.Hadoop 2.4.1 设置问题小结【原创】
随笔分类
AJAX(11)
Asp&Asp.net (9)
C#(4)
css(1)
Hadoop(7)
Java(39)
javascript (29)
PHP(5)
struts(6)
VC++(2)
webwork(2)
XML(3)
工作流(1)
文章分类
个人日记(4)
点击右上角即可分享