程序员的世界, 为程序员服务

2016-06-29
LeetCode-Add Two Numbers

##题目 ####Add Two Numbers You are given two linked lists representing two non-negative numbers. The digits are stored in reverse order and each of their nodes contain a single digit. Add the two numbers and return it as a linked list. Input: (2 -> 4 -> 3) + (5 -> 6 -> 4)Output: 7 -> 0

Read More

2016-06-29
CentOS6.5 安装git

##引言Git是目前世界上最先进的分布式版本控制系统,它能够对你的代码进行版本管理与控制,使你不再需要担心代码版本过多而造成发布时版本的混乱。 本文是在CentOS6.5上安装git,使得在linux上也可以使用git进行代码的版本控制。

Read More

2016-06-29
如何在博客中插入虾米播放器

在博客中插入虾米播放器简单的方法主要分为以下三步:1.搜索要插入的音乐2.获取音乐播放器的flash代码3.插入到指定的html文件中

Read More

2016-06-29
LeetCode-Word Search

##题目 ####Word Search Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where “adjacent” cells are those horizontally or vertically neighboring. The same letter cell may not be used more than once. For example,Gi

Read More

2016-06-29
IntelliJ IDEA 常用快捷键

该文主要对IntelliJ IDEA 常用快捷键进行概括。

Read More

2016-06-29
Hive 简介

主要介绍 Hive 的相关知识,将会涉及以下内容: Hive 的定义 Hive 的体系结构 Hive 与关系数据库的区别 Hive 的应用场景 Hive 的存储

Read More

2016-06-29
Hive 安装配置

主要对Hive 安装配置进行介绍。

Read More

2016-06-29
Hive QL 介绍

主要对hive ql进行介绍。

Read More

2016-06-29
Hadoop2.6.0伪分布模式配置部署

二、Hadoop伪分布式模式配置1. 配置core-site.xml, hdfs-site.xml,mapred-site.xml及yarn-site.xml1).修改core-site.xml:$ sudo gvim /usr/local/hadoop/etc/hadoop/core-site.xml > <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-

Read More

2016-06-29
Hadoop1.2.1本地伪分布式安装

##引言由于最近需要大数据的处理,所以需要用到hadoop.因此在这里记录本地伪分布式的安装过程。

Read More

2016-06-29
Hadoop介绍

###1. Hadoop是什么?Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据Google公司发表的MapReduce和Google档案系统的论文自行实作而成。 Hadoop框架透明地为应用提供可靠性和数据移动。它实现了名为MapReduce的编程范式:应用程序被分割成许多小部分,而每个部分都能在集群中的任意节点上执行或重新执行。此外,Hadoop还提供了分布式文件系统,用以存储所有计算节点的数据,这为整个集群带来了非常高的带宽。MapReduce和分布式文件系统的设

Read More

2016-06-29
Hadoop2.6.0单机版模式安装

##一、Hadoop启动模式 Hadoop集群有三种启动模式: 单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境 伪分布模式:在单个机器上模拟成分布式多节点环境,每一个Hadoop守护进程都作为一个独立的Java进程运行 完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境

Read More

2014-06-24
贝叶斯网络中的依赖关系

贝叶斯网络(Bayesian Network,简称 BN)是机器学习中最重要的工具之一,它以贝叶斯规则(Bayesian Rule)为基础,并为马尔可夫模型奠定了基础。 简单来说,贝叶斯网络就是一个有向无环图。节点 node 表示变量,弧 arc 表示依赖关系。比如下图: 「Sprinkler」是洒水器的意思。这三个变量代表三种事件。下雨和洒水器都能影响草地湿度,而下雨又可以影响洒水器是否洒水。三个变量的依赖关系如图所示。 在 BN 中,有些 node 是可以观察到的observable,有些是无法观察到的 hidden。比如下雨和草地湿可以观察到,洒水器是否洒水了是无法观测得到的。对于一个

Read More

2014-06-10
聊聊 Google 被封锁这件事

老实说,Google 这次被封锁对我的影响不是特别大,它在中国的服务本来就已经被 ZF「政府,下同」 搞的支离破碎,早已不稳定,像我等 Google 重度用户几乎都常备科学上网工具的。不过区别还是挺明显的,之前的时候常常不必打开那些工具,直接使用 Google 即可,方便;现在却一点都不能用了。科学上网的工具由于其机制问题,对于某些服务如谷歌图片、谷歌学术,常常会有网址重定向的问题,很麻烦,这时候多么幻想 free Internet. ####Google 为何被封? Google 的原则是几乎不对用户搜索的结果进行过滤,这是为保障网络信息自由。而我国由于特殊原因,有大量的信息是敏感的,ZF不

Read More

2014-05-26
Chrome Extensions I Use

Chrome 最强大的一个地方就是丰富的扩展插件了,在它的商店里寻找,只有你想不到的,很难有找不到的。Chrome 也是我的默认浏览器,一边使用一边优化体验,现在来说说我都用了哪些插件吧。 首先介绍我平时一直在使用的: AdBlock。 还有一个叫 AdBlock Plus 也不错,但最近 Plus 这个插件导致我的 pdf 无法在浏览器打开,于是换成 AdBlock 了,没差。装上这个插件之后,浏览器里的整个世界都清爽了,那些恼人的 Flash 广告一一自动清除了。 Copy as Markdown。用 Markdown 写作时经常需要一些图片或文字的链接,这个小插件使得 Markdown

Read More

2014-05-15
Vim Tips 2

此前写过一篇VIM常用命令。Vim 学习曲线还是比较陡峭的,很多教程都是直接给出一个Vim 命令或快捷键的参考列表,求全,这反而把有心学习的潜在用户吓跑了。我在学习使用 Vim 的时候尽量先总结最常用的,并按照操作类型归类,符合自己的认知结构。由此总结出该文中所记述的笔记。写作该文时比较急促,直接把 Evernote 中的 notes 拿过来,没有调整格式,也没有写注解。 有了基础,并能基本使用 vim 编程,以后就是问题驱动型的学习了,aka,coding 中遇到什么不方便的地方,就 google 一下有没有对应的命令、快捷键、插件之类。不久后写了一篇vim使用中的几个问题。 时间已经过去很

Read More

2014-05-08
阿里数据挖掘

前段时间阿里巴巴组织了一个大数据的竞赛,全国高校积极响应,报名者、参与者、提交者众多,最好成绩也一直在刷新当中。初赛选出 Top500 进入复赛,其他人就炮灰了。 虽然是搞图像的,但念在未来图像不太好就业,而大数据是现在及未来的热门,正巧在修习一门《数据挖掘》课程,就把阿里这个题目作为大作业的题目了。 ###题目介绍 题目大意是这样的: 给定 4.15-7.15 这四个月的用户数据作为训练数据,大概18万条。然后预测下一个月哪些用户会购买哪些品牌。数据提交到阿里的竞赛平台,阿里会给出准确率、召回率和 F1值。 数据的说明如图: 准确率、召回率就不解释了,大多数预测性的实验都以此作为评价指

Read More

2014-04-21
理解 javascript 回调函数

最近在看 express,满眼看去,到处是以函数作为参数的回调函数的使用。如果这个概念理解不了,nodejs、express 的代码就会看得一塌糊涂。比如: 12345app.use(function(req, res, next) { var err = new Error('Not Found'); err.status = 404; next(err);}); app是对象,use是方法,方法的参数是一个带参的匿名函数,函数体直接在后面给出了。这段代码怎么理解呢?我们先来了解回调函数这个概念。 首先要了解,在 js 中,函数也是对象,可以赋值给变量,

Read More

2014-04-13
wiz to evernote

Evernote 刚刚诞生不久我就成为了它的用户,后来中国有趋势成为用户第二多的国家,于是印象笔记诞生,同步的速度快了不知道多少倍。由于对它的依赖,我的笔记数量迅速增加。当时用的是 windows,印象笔记的优化可能还没做好,随着笔记量增大,笔记经常会卡顿到无法忍受。开始考虑其他的笔记应用。 印象笔记当初让我很难忍受的另外两个原因: 流量限额,只有60M,几乎没办法保存图片和附件。 没有格式刷功能,非常不便。关于这个问题我咨询过印象笔记的官方微博,回应说,印象笔记是基于 html 的,技术上做格式刷的难度太大。于是我就不抱期望了。 经过各种寻找、尝试、推荐,最后确定用国内的「为知笔记」。由

Read More

2014-04-01
An Intuition to Locality Sensitive Hashing

在 Stackoverflow 的「Machine Learning」标签下随便看,看到一个How to understand Locality Sensitive Hashing?的问题,刚好看视频跟踪时看到有一个 Coherency Sensitive Hashing,莫非两者有不可告人的联系。。索性就学习一下。 先用例子直观地说明一下,请看下图: 上图是一个平面,其中有一个红点和一个黄点,都是二维向量。我们的目的是通过 LSH 方法近似求得这两个点的余弦相似度。 余弦相似度是求向量相似度的一种方法,在图像匹配中很常用。 怎么求呢? 现在,在这个平面上,随记产生 n 条过坐标零点的线,这

Read More