引读:百度作为全球最大的中文搜索引擎公司,提供基于搜索引擎的各种产品,几乎覆盖了中文网络世界中所有的搜索需求,因此,百度对海量数据处理的要求是比较高的, 要在线下对数据进行分析,还要在规定的时间内处理完并反馈到平台上。百度在互联网领域的平台需求要通过性能较好的云平台进行处理了,Hadoop就是很好 的选择。 继续阅读“解密百度大数据:百度是如何使用hadoop的,并且做了哪些改进? | 人人都是产品经理”
分类: 大数据、数据挖掘、云计算、机器学习
Home | Hypertable – Big Data. Big Performance
centos6升级到centos7 升级过程-missing-cn-ChinaUnix博客
参考 http://wiki.centos.org/TipsAndTricks/CentOSUpgradeTool
1、安装升级仓库
# 编辑保存仓库文件 继续阅读“centos6升级到centos7 升级过程-missing-cn-ChinaUnix博客”
百度基础架构部马如悦:我的Hadoop… – nuoline的专栏 – 博客频道 – CSDN.NET
马如悦:大家下午好,我是来自百度基础架构部高级工程师。我先自我介绍一下,我是咱们中国第一批用Hadoop,后来转向开源,从开始到现在一直用Hadoop,在这里说一下自己的体会可能会对大家有用。 继续阅读“百度基础架构部马如悦:我的Hadoop… – nuoline的专栏 – 博客频道 – CSDN.NET”
腾讯公司数据平台高级架构师 郭玮:TDW在Hadoop上的实践分享-CSDN.NET
腾讯大规模Hadoop集群实践-CSDN.NET
Hadoop实战心得——专访360系统部总监唐会军 – IT经理网
在前不久的Hadoop in China 2011大会上,360系统部总监唐会军接受了InfoQ的专访,谈到360公司内部对Hadoop的使用,并对Hadoop项目和HBase面临的挑战提出了自己的看法。以下是采访实录。 继续阅读“Hadoop实战心得——专访360系统部总监唐会军 – IT经理网”
Mahout与Weka的对比
随着机器学习热度的不断提高,与其相关的软件和工具也慢慢进入大家的视野,而Weka和Mahout无疑是这些工具中较为流行的两个。作为一款知名的老牌机器学习软件,Weka支持经典的数据挖掘任务,同时还有大量的扩展包,可以支持文本挖掘、可视化和网格计算等功能。Mahout则是 Apache软件基金会旗下的一个开源项目,它提供了一些机器学习领域中的经典算法实现,支持Apache Hadoop,能够高效地运行在云计算环境中。 继续阅读“Mahout与Weka的对比”
HIVE随手记——Hive命令(?$HIVE_HOME/bin/hive)-呆呆笨笨的鱼-ITPUB博客
HIVE版本:0.14.0
$HIVE_HOME/bin/hive 这个shell 命令是通向包括命令行界面(CLI)等Hive服务的通道。 继续阅读“HIVE随手记——Hive命令(?$HIVE_HOME/bin/hive)-呆呆笨笨的鱼-ITPUB博客”
HIVE配置启动Hwi方法,版本0.14.0-呆呆笨笨的鱼-ITPUB博客
hive数据仓库摘录和总结 – 智慧的老鸟 – 博客园
Hive的图形化工具HWI – aaa1117a8w5s6d的专栏 – 博客频道 – CSDN.NET
今天想使用一下Hive的图形化工具HWI,我的Hive是0.12.0版本。 继续阅读“Hive的图形化工具HWI – aaa1117a8w5s6d的专栏 – 博客频道 – CSDN.NET”
简单之美 | Hive-0.12.0的Web接口HWI安装、配置、改造及使用
使用Hive的HWI接口,可以通过在Web页面上提交HQL查询操作,并浏览查询结果数据。默认情况下,HWI只支持浏览结果数据,不能够下载查询结果文件(当然,HWI可能也是考虑通过Web下载大量的结果数据,对服务器造成压力,或者处于安全方面的考虑)。我们对HWI进行了简单的改造,改造内容主要是增加了一个内置的文件服务器,可以通过页面进行查询,然后下载结果文件。 继续阅读“简单之美 | Hive-0.12.0的Web接口HWI安装、配置、改造及使用”
使用Hive的web界面:HWI – 逖靖寒 – 博客园
HWI是Hive Web Interface的简称,是hive cli的一个web替换方案。
关于如何搭建Hive平台,可以参考:搭建Hive平台
但是目前这个功能做的比较简陋,这篇文章我们一起来看看如何使用hive-0.4.1中自带的hwi来进行操作。 继续阅读“使用Hive的web界面:HWI – 逖靖寒 – 博客园”
hive web interface – yfk的专栏 – 博客频道 – CSDN.NET
hwi(hive web interface)是hive命令行接口的一个补充,主要功能包括 继续阅读“hive web interface – yfk的专栏 – 博客频道 – CSDN.NET”
Oracle Exadata一体机介绍_图文_百度文库
请教个非技术问题,最新的Exadata X4-2满配报价多少? – Oracle数据库管理-ITPUB论坛-it168旗下专业技术社区
使用一台全机架系统(full-rack)Exdata V2所需的费用列表:
$1,150,000 硬件价格
$1,680,000 存储服务器的软件价格
$369,600 存储服务器软件支持和维护费用(以22%计)
$1,520,000 Oracle企业版软件价格($47.5k*8 servers*8 cores*0.5 Intel core factor)
$736,000 Oracle RAC软件价格($23k*8 servers*8 cores*0.5 Intel core factor)
$368,000 Oracle分区特性价格 ($11.5k*8 servers*8 cores*0.5 Intel core factor)
$368,000 Oracle高级压缩(Advanced Compression) ($11.5k*8 servers*8 cores*0.5 Intel core factor)
$160,000 Oracle企业管理器诊断包(推荐安装)
$160,000 Oracle企业管理器调优包(推荐安装)
$728,640 以上除去存储服务器软件的第一年软件维护支持价格(以22%计)
以上总费用大约达到了$7,240,240.虽然这里的硬件成本之后有过变动(15% reduce),但是是以缩减服务为代价的.
使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(一) – 哥本哈士奇(aspnetx) – 博客园
假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能。 继续阅读“使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(一) – 哥本哈士奇(aspnetx) – 博客园”
成功部署OpenStack的十大要点 – 51CTO.COM
OpenStack为用户带来了多个好处,所以不难理解用免费的开源工具自行构建云这个概念为何吸引众多公司企业。然而,谁要是想启动OpenStack项目,就应切合实际。我们Mirantis公司在构建并部署OpenStack云环境方面有着多年的经验,见过许多痴心妄想――这会导致不切实际的期望。下面这十个步骤将确保你往正确的方向迈进。 继续阅读“成功部署OpenStack的十大要点 – 51CTO.COM”
Storm集群安装部署步骤【详细版】 – 大圆那些事 – 博客园
本文以Twitter Storm官方Wiki为基础,详细描述如何快速搭建一个Storm集群,其中,项目实践中遇到的问题及经验总结,在相应章节以“注意事项”的形式给出。 继续阅读“Storm集群安装部署步骤【详细版】 – 大圆那些事 – 博客园”