咨询QQ:2083503238、1684129674、480934277(请勿重复咨询) 咨询微信:qiangfans
大数据测试之hadoop单机环境搭建(超级详细版) 置顶
点击链接加入QQ群:https://jq.qq.com/?_wv=1027&k=5C08ATe友情提示:本文超级长,请备好瓜子
Hadoop的运行模式
单机模式是Hadoop的默认模式,在该模式下无需任何守护进程,所有程序都在单个JVM上运行,该模式主要用于开发和调试mapreduce的应用逻辑;
伪分布式模式下,Hadoop守护进程运行在一台机器上,模拟一个小规模的集群。该模式在单机模式...
2018/02/09
大管家
3649
基于python的大数据分析实战学习笔记-pandas之DataFrame
点击链接加入QQ群229390571(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa
接着上篇我们继续进行pandas中的DataFrame,话不多说,直接撸代码,里面有注释
#dataframe的操作不外乎 增删改查
from pandas import Series
from pandas import DataFram...
2019/06/10
测试帮日记
1393
基于python的大数据分析实战学习笔记-pandas(数据分析包)
点击链接加入QQ群229390571(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa
pandas中常见的数据结构有三种,Series(一维数组,也叫序列),DataFrame(二维表格,类似excel多行多列),Panel(三维数组)
那什么是数据结构呢?就是相互之间存在的一种或多种特定关系的数据类型的集合。
好了,...
2019/06/03
测试帮日记
1406
基于python的大数据分析实战学习笔记-Anaconda
点击链接加入QQ群229390571(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa
Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。还有很多官方介绍,总而言之就是强大强大很强大。。。在我看来
TA主要面向科学计算,其实就是数据分析的一个标准环境。
下...
2019/06/02
测试帮日记
1392
基于python的大数据分析实战学习笔记-开篇
点击链接加入QQ群229390571(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa
今天开始将把学习大数据分析的内容以笔记形式发布出来,希望能督促自己学习也分享给大家。
大数据的分析是基于python语言。经常有人问我是学习java还是python好,我一般都会回答,如果你以前有java基础那就学习java吧,毕竟学起来快。如...
2019/05/31
测试帮日记
1272
世界杯来了!谁能夺冠?让我们用数据说话
点击链接加入QQ群 522720170(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5C08ATe
2018年,火热的世界杯即将拉开序幕。在比赛开始之前,我们不妨用 Python 来对参赛队伍的实力情况进行分析,并大胆的预测下本届世界杯的夺冠热门球队。
通过数据分析,可以发现很多有趣的结果,比如:
找出哪些队伍是首次进入世界杯的黑...
2018/06/27
测试帮日记
2069
python云计算2
点击链接加入QQ群 522720170(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5C08ATe
⼀个段⼦理解openstack
1.故事设定
主⻆是⼀个想赚钱的管理员。 他的⼿⾥有着⼤量的物理计算资源,⽆限多的服务器啊,⽆限多的电⼒什么的,⽆限多的硬盘空间,⽆限⼤的带宽啊什么的(勿吐槽,反正⼀切是脑洞⼤开,不如让他⽆限⼤,⽂章的不严谨之处...
2018/06/14
测试帮日记
1551
python云计算1
点击链接加入QQ群 522720170(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5C08ATe
云计算介绍
云计算(Cloud Computing)是由分布式计算(Distributed Computing)、并⾏处理(Parallel Computing)、⽹格计算(Grid Computing)发展来的 ,是⼀种新兴的商业计算模型。⽬前...
2018/06/13
测试帮日记
1653
ETL工具之Informatica
点击链接加入QQ群 522720170(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5C08ATe
Informatica是最常用的ETL工具之一,与之类似的工具还有DataStage和kettle;
由于个人只用过Informatica,所以只讨论Informatica。...
2018/04/25
测试帮日记
3395
使用Web Scraper 插件,不需要编程,也能爬网
使用Web Scraper 插件,不需要编程,也能爬网,使用Web Scraper插件,能够创建一个网站地图,并能遍历网站,抓取我们感兴趣的数据,比如,我们登陆淘宝,京东等商务网站,我们可以通过 Web Scraper,抓取某一类商品的规格说明,价格,厂家等信息,我们通过Web Scraper可以抓取我们进入头条上的最热门的文章,也可以抓取我们自己的所有文章列表,发布时间,阅读和浏览量等信息,当然...
2018/02/19
大管家
1699
大数据告诉你?
现在,主动单身和恐婚人群越来越多,在一些人看来,谈恋爱似乎是很麻烦的事。
很多在爱情中比较迷糊的人,常常踩到雷区,免不了一番争吵。
今天的大数据将告诉你:男女交往哪些行为是低智商的表现;恋爱时,男生女生在想什么?情侣该怎样科学地相处?
· 01 ·
恋爱中,女生容易踩什么雷区?
▌为别人的爱,从来都不是应该的
恋爱里,男生最讨厌女生把自己的付出视作理所当然,恋爱中没有谁理应当付出更多,彼此都要有...
2018/02/19
xiaoqiang
1724