最近由于工作需要,要将线下的数据挖掘搬到线上来,这样就需要在线上实现各种数据挖掘算法,好在java开源的强大,有个开源的weka数据挖掘套件,里面实现了很多种DM算法,之前的pmml决策树算法已经可以用起来了(等weka搞完了分享下),最近在搞bayes算法的应用,发现遇到一些问题,故go之,才发现其实很多童鞋已经使用并分析了这个东西,在此将找到的一些资料汇总下,为后来人学习使用吧。
weka: naive bayes (大概分析了下类结构)
http://blog.csdn.net/aalbertini/archive/2011/04/01/6295092.aspx
Weka学习笔记 (对于使用GUI界面的童鞋可以有个很好的介绍,不过里面的图链接不存在了),截至转载时,链接已打不开
http://www.chiefsailor.net/blog/2010/02/weka-research-report/
Koala++’s blog
(Lucene Nutch Weka Larbin Sed)(对源码分析的很不错), 截至转载时,得翻到第15页才有,所以如果博主有更新博文的话,得再往后翻几页。
http://quweiprotoss.blog.163.com/
基于weka实现贝叶斯Multi-variate Bernoulli文本分类模型 (研究机器学习,自然语言处理的),截至转载时,链接已打不开
http://isip.buaa.edu.cn/lichen/?p=51
WEKA入门教程
Weka 中文站
http://www.codeclip.com/category/weka-china
Use WEKA in your Java code
http://weka.wikispaces.com/Use+WEKA+in+your+Java+code
Programmatic Use
http://weka.wikispaces.com/Programmatic+Use
FAQ
http://weka.wikispaces.com/Frequently+Asked+Questions