加州初体验

前言 之前就很想到外企工作,很幸运在研究生毕业之前可以到Tubi TV北京办公室 实习,这段时间刚好遇到北京办公室职员整体去旧金山总部出差的日子。 作为实习生,受邀请同正式员工一同到旧金山公司总部出差3周,不得不说这实习生很值。
Read more

PCA没有想象地那么厉害

前言 主成分分析(Principal component analysis, PCA)的目的是帮助 最终的分类效果,提高分类器性能,其可以包括准确率、 运算速度等,这里仅从准确率方面进行考量。从之前的文章《理解主成分分析》 当中可以看出,计算得出可以将n维向量降维到k维的nxk大小的矩阵,在理论 上并不能支撑其可以提高分类器准确率的观点,只是从我们自身的一些天然的 想法出发,利用PCA应该可以去除冗余信息,帮助提高分类准确率。 本文的目的就是用实验来检测一下PCA是否可以提高分类准确率,以及是否 可以对这n $\times$ k的矩阵进一步优化,使其可以进一步提高分类准确率。
Read more

北航那三年(下)

在研究生顺利毕业之际,即将参加社会工作之时,以此来记录多彩的研究生生涯。 这是下半部分,包括论文被IJCB 2017接收,单人前往美国丹佛参加IJCB 2017, 拿到心仪的Offer,在Tubi TV实习。 丰富的实习经历带来的蝴蝶效应,当然和之后各位大佬的帮助,和自己的努力也 关系紧密。
Read more

北航那三年(上)

在研究生顺利毕业之际,即将参加社会工作之时,以此来记录多彩的研究生生涯。 这是上半部分,包括到北航读研究生的原由,在学校上课以及实验室科学研究 的经历,还有两段分别在美团和今日头条的实习。
Read more

理解主成分分析

前言 在图像相关的任务当中,比如说图像分类,在卷积神经网络没有流行之前, 都是需要先对其进行利用主成分分析法进行降维处理。主成分分析 (Principal component analysis, PCA)是一种重要的无监督降维 方法。比如说对于房子房价的预测, 房子的特征当中,有以平方英尺为单位的面积,和以平方分米为单位的面积, 那么其中一种特征就是冗余信息,因为其可以通过另外一个特征线性推导而 出。以数字图像识别为例子,数字图像当中四周的一些位置的像素点的 基本都是背景的颜色,几乎所有的图像都是这样,既然他们的数值都 相等,那么这些位置之间当然就可以相互之间用线性表示。所以这些位置的信息就 是冗余信息,这是简单的冗余信息的例子。
Read more

美国宪法,中华民国宪法和中国宪法

美国宪法 美国制定宪法的一些背景 15世纪之前,北美大陆,还只有当地土著,在大航海时代,15世纪到17世纪,(当时中国处于明朝时期,【明朝1368年―1644年】),欧洲的航海家主要因为巨大利益驱动不断地探索新的海域,希望发现新的陆地,新的陆地上面可能会有巨大的自然资源,大航海时代之前,人类到过的陆地面积只有总面积的2/5,大航海时代之后达到了9/101。 欧洲到印度之间的陆地交通,被一些国家扼制,需要收取他们高额的过路费,使得他们想从印度进口的一些香料什么的非常昂贵,为了发现一条从海上直接到达印度的路线,哥伦布开始了海上的征程,结果发现了美洲大陆,之后欧洲各国,很多热爱自由,极富冒险精神的英国人,渡船来到这里,英国航海家在现在的美国东海岸移民较多,还有其它的国家到了现在的加拿大地区,还有到了南美洲的地区2。
Read more

ALS Method for CF 笔记

前言 现在,推荐系统虽然在计算机学术界热度不高,现在计算机学术界比较火的 是计算机视觉一类的内容,但是在工业界的需求从来都没有减弱,哪里的信息出现过载,哪里就需要推荐 系统,把用户提前甄选出用户感兴趣的内容,减少用户寻找感兴趣内容的时间,帮助用户找到更多感兴 趣的内容,随着用户在平台上面停留时间加上,不出意外公司收入也会随之增长,可以带来双赢的推荐 系统不得不好好深入理解一番。这里基于通过搜索引擎和我甄选出来的一篇英文博客, Alternating Least Squares Method for Collaborative Filtering, 通过记录一些中文的笔记来理解推荐系统。
Read more

Naive Bayes Classifier

前言 最近有同事对机器学习感兴趣,提到他最近在看的贝叶斯分类器或者说bayes classifier,我们一般提到的bayes classifier都很可能说的是naive bayes classifier,naive bayes classifier是一个在理论上面非常 优雅的分类器,其背后是一系列的bayes理论作为支持,现在几乎所有的分类 器,比如说LR, SVM, 都可以找到一个bayes的表达,当时我没有给同事讲得 清楚,这个topic又是极其重要以及优雅,于是我决定结合之前,因为自 己兴趣做的一个通过名字来判断这个名字是男是女的分类器,细致地理清楚 naive bayes classifier背后的秘密。
Read more

how I do research without ml and cv background

基础知识的学习 机器学习基础,如果你没有机器学习的基本,强烈推荐,cousera上面Andrew Ng 的机器学习的课程,上面的作业设计得非常好。
Read more

机器学习工程师的工具jupyter

Read more