自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 收藏
  • 关注

原创 cuda与tensorflow的版本对应关系

https://tensorflow.google.cn/install/source#linux

2021-12-05 14:48:17 2414

原创 GitHub的使用

建立仓库点击首页右上角的加号,出现下面的小列表,之后点击小列表里的New repository在下面页面点击create repositories,仓库创建便完成了。删除仓库首先在首页就可以看见仓库数,如果没有找到大家也可以把上面的链接(https://github.com/SmallSun666?tab=repositories),我的用户名SmallSun666改成自己的用户名就可以到这个页面。点某个仓库的名称进去之后会出现这个页面,点击setting,之后下拉到最后可以看到删除按钮,点

2021-05-29 17:17:03 480

原创 想要查看某函数具体说明,结果出现 NameError: name ‘Bilinear‘ is not defined

今天在做动手学深度学习3.3的练习题查阅MXNet文档,看看gluon.loss和init模块里提供了哪些损失函数和初始化方法。想要看初始化方法有哪些,成功的看到了有哪些方法,如下所示但在想看其中某一个函数的使用时,却出现了这样子的结果,name 'Bilinear' is not defined后来在经过一番尝试之后,发现使用help(init.Bilinear)前面加上模块名就可以了。dang dang dang dang原因:虽然已经导入了init模块,但是.

2021-05-28 20:56:50 319

原创 图像颜色变换------灰度化

彩色图片可以转为灰度图片,虽然在转换的过程中会丢失颜色信息,但是确保留了图片的纹理、线条、轮廓等特征,这些特征往往比颜色更重要。将彩色图片转换为灰度图片后,存储的数据量自然而然会减少,这样对图片进行处理时的计算量会减少很多。下面是将彩色图片转为灰度图片的代码。import numpy as npimport cv2img = cv2.imread(r"E:\flower.jpg")img.shape #(867, 1024, 3)#使用cv2.cvtColor()方法将彩色图片转换...

2021-04-21 15:42:35 1167

原创 ModuleNotFoundError: No module named ‘cv2‘ 和module ‘cv2‘ has no attribute ‘imread‘

啊终于搞好了。昨天晚上import cv2显示ModuleNotFoundError: No module named 'cv2',之后就从网上搜索,方法是用命令下载opencv-python,并指定了版本,但下载完成之后,还是不行。嗯,然后,我就放弃了,结果今天再运行import cv2命令,居然可以了!!!孩子甭提有多开心了,但是运行到接下来的命令cv2.imread(),就提示module ‘cv2‘ has no attribute ‘imread‘,晴天霹雳。后来我又开始继续的搜,网上有人说是

2021-04-21 14:58:12 2722 1

原创 PCA降维

numpy求矩阵的特征值与特征向量(np.linalg.eig函数详解):https://blog.csdn.net/weixin_43977640/article/details/109921765numpy中argsort函数用法https://blog.csdn.net/maoersong/article/details/21875705?utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7EBlogCommen

2021-04-13 22:12:04 84

原创 L1-008 求整数段和

给定两个整数A和B,输出从A到B的所有整数以及这些数的和。输入格式:输入在一行中给出2个整数A和B,其中−100≤A≤B≤100,其间以空格分隔。输出格式:首先顺序输出从A到B的所有整数,每5个数字占一行,每个数字占5个字符宽度,向右对齐。最后在一行中按Sum = X的格式输出全部数字的和X。输入样例:-3 8输出样例: -3 -2 -1 0 1 2 3 4 5 6 7 8Sum = 30代码s = input() lis

2021-04-08 20:02:35 91

原创 感知机PLA------机器学习基石

1.PLA算法简介今天在b站上学习了林轩田老师讲解的PLA算法,故写此博客,以加深理解。PLA算法,总称为(Perception Learning Algorithm),适用于二维及高维的线性划分问题,问题的答案只有相反的两个回答,如同意和不同意,及格和不及格等,即PLA算法可用于某些二分类问题,最终求得一条可以很好分开两类数据的直线。PLA算法的实现采用逐点修正的方法,在算法开始时,随机选择...

2020-04-13 23:42:45 180

转载 python字符串的索引与切片

索引indexpython字符串是不可以改变的序列,所有的序列都可以通过索引来获取其中的数据元素索引语法:字符串[整数表达式]说明1.序列的正向索引是从0开始的,第二个索引为1,最后一个索引为 len(s)-12.序列的反向索引是从-1开始的,-1代表最后一个,-2代表倒数第二个,以此类推,第一个是 -len(s)示例:s = ‘abcde’>>&g...

2020-03-19 15:29:51 991

原创 pandas----收藏

pandas练习五十道题https://www.kesci.com/home/project/5ddc974ef41512002cec1dca

2020-02-28 14:36:54 125

原创 数据预处理-----数据清洗

数据清洗主要处理三类值:重复值、缺失值以及异常值。重复值:重复值的处理主要用到了drop_duplicates()函数,该函数适用DataFrame格式的数据,去除特定列下面的重复行。返回DataFrame格式的数据。函数:df.drop_duplicates(subset=None, keep=‘first’, inplace=False)...

2020-02-27 21:16:59 1104

原创 L1-007 念数字

输入一个整数,输出每个数字对应的拼音。当整数为负数时,先输出fu字。十个数字对应的拼音如下:0: ling1: yi2: er3: san4: si5: wu6: liu7: qi8: ba9: jiu输入格式:输入在一行中给出一个整数,如:1234。提示:整数包括负数、零和正数。输出格式:在一行中输出这个整数对应的拼音,每个数字的拼音之间用空格分开,行末没有最后的空...

2020-02-26 20:00:42 135

原创 L1-006 连续因子

一个正整数 N 的因子中可能存在若干连续的数字。例如 630 可以分解为 3×5×6×7,其中 5、6、7 就是 3 个连续的数字。给定任一正整数 N,要求编写程序求出最长连续因子的个数,并输出最小的连续因子序列。输入格式:输入在一行中给出一个正整数 N(1<N<2​31​​)。输出格式:首先在第 1 行输出最长连续因子的个数;然后在第 2 行中按 因子1因子2……*因子k 的...

2020-02-25 21:05:37 198

转载 Numpy产生随机数

numpy中的random模块包含了很多方法可以用来产生随机数,这篇文章将对random中的一些常用方法做一个总结。1、numpy.random.rand(d0, d1, …, dn)作用:产生一个给定形状的数组(其实应该是ndarray对象或者是一个单值),数组中的值服从[0, 1)之间的均匀分布。参数:d0, d, …, dn : int,可选。如果没有参数则返回一个float型的随机数...

2020-02-25 14:28:38 772

原创 现场赛-----可视化

第四部分:可视化(15分)数据:有泰坦尼克号 公开数据集合数据:共有891行、12列。这代表本训练集共有891条数据,每条数据有12类信息。包括:• PassengerId => 乘客ID• Survived => 获救情况(1为获救,0为未获救)• Pclass => 乘客等级(1/2/3等舱位)• Name => 乘客姓名• Sex => 性别• ...

2020-02-21 13:12:39 616 2

原创 网络赛----可视化

第四部分:可视化(15分)近些年空气污染在我国很多地区非常严重,其中PM2.5作为衡量空气质量的一个重要指标,当前数据为2018年12月份1号-10号全国大部分城市的站点检测数据。接下来我们将这些数据进行可视化来看下PM2.5的分布情况。数据:链接:https://pan.baidu.com/s/1AzgRiCxpCZ8-we8sfRMAFw提取码:0j571、 利用Bar图输出城市(c...

2020-02-20 14:19:39 705

原创 matplotlib---饼图

作用饼图:用于表示不同分类的占比情况,通过弧度大小来对比各种分类。特点:分类数据的占比情况(占比)函数plt.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None, radius=None, ...

2020-02-02 16:21:39 1682

原创 L1-005 考试座位号

每个 PAT 考生在参加考试时都会被分配两个座位号,一个是试机座位,一个是考试座位。正常情况下,考生在入场时先得到试机座位号码,入座进入试机状态后,系统会显示该考生的考试座位号码,考试时考生需要换到考试座位就座。但有些考生迟到了,试机已经结束,他们只能拿着领到的试机座位号码求助于你,从后台查出他们的考试座位号码。输入格式:输入第一行给出一个正整数 N(≤1000),随后 N 行,每行给出一个考...

2020-02-01 16:34:42 98

原创 matplotlib---散点图

作用散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)函数plt.scatter(x, y, s=None, c=None, marker=None,cmap=None, norm=None, vmin=None, vmax=None, alpha=None,linewid...

2020-01-31 18:44:00 450

原创 matplotlib---直方图

作用直方图是一种统计报告图,形式上也是一个个的长条形,但是,在通常情况下,直方图用长条形的面积表示频数,所以长条形的高度表示频数组距,宽度表示组距,其长度和宽度均有意义。当宽度相同时,一般就用长条形长度表示频数。直方图一般用来描述等距数据,柱状图一般用来描述名称(类别)数据或顺序数据。直观上,直方图各个长条形是衔接在一起的,表示数据间的数学关系;条形图各长条形之间留有空隙,区分不同的类...

2020-01-31 17:37:36 503

原创 matplotlib---柱状图

使用jupyter notebook作用柱状图:排列在工作表的列或行中的数据可以绘制到柱状图中。特点:绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计/对比),适合小数据集。函数函数原型:matplotlib.pyplot.bar(left, height, width=0.8, bottom=None, hold=None, **kwargs)参数解释:le...

2020-01-31 13:55:59 443

原创 L1-003 个位数统计

给定一个 k 位整数 N=d​k−1​​10​k−1​​+⋯+d​1​​10​1​​+d​0​​ (0≤d​i​​≤9, i=0,⋯,k−1, d​k−1​​>0),请编写程序统计每种不同的个位数字出现的次数。例如:给定 N=100311,则有 2 个 0,3 个 1,和 1 个 3。输入格式:每个输入包含 1 个测试用例,即一个不超过 1000 位的正整数 N。输出格式:对 N 中...

2020-01-30 19:55:23 109

原创 matplotlib---折线图

1.作用折线图:以折线的上升或下降来表示统计数量的增减变化的统计图特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)2.函数Signature: plt.plot(*args, **kwargs)Docstring:Plot y versus x as lines and/or markers.3.引入模块import matplotlib.pyplot as pltim...

2020-01-30 16:25:36 288

原创 L1-002 打印沙漏

本题要求你写个程序把给定的符号打印成沙漏的形状。例如给定17个“*”,要求按下列格式打印 ***** *** * *** *****所谓“沙漏形状”,是指每行输出奇数个符号;各行符号中心对齐;相邻两行符号数差2;符号数先从大到小顺序递减到1,再从小到大顺序递增;首尾符号数相等。给定任意N个符号,不一定能正好组成一个沙漏。要求打印出的沙漏能用掉尽可能多的符号。输入格式:输...

2020-01-29 21:54:04 71

原创 绘制澳大利亚2011-2017人口数增长速度前五的城市并绘制折线图

数据:数据代码:import csvimport matplotlib.pyplot as plt#设置显示中文字体plt.rcParams['font.sans-serif']='SimHei' #设置显示正常符号plt.rcParams['axes.unicode_minus'] = Falsetwo = {}with open("D:\\BDA\\AUS_state.c...

2019-12-24 20:57:46 278

原创 绘制澳大利亚人数最多的五个城市的2011年与2017年的人数对比柱形图

数据:数据代码:import csvimport matplotlib.pyplot as pltimport localelocale.setlocale( locale.LC_ALL, 'en_US.UTF-8' ) #设置显示中文字体# plt.rcParams['font.sans-serif']='SimHei' #设置显示正常符号plt.rcParams['axe...

2019-12-24 16:47:05 143

原创 python显示错误FileNotFoundError:No such file or directory:'flag'

在完成老师布置的作业时,运行代码一直报错FileNotFoundError,明明就是照着书敲的。。在经过修改文件名,修改Jupyter Notebook的工作空间,在打开的文件路径前加"r",百度后还是提示错误,后来运行了同学成功的代码,并且修改成了自己的路径后,结果还是报下图错误。后来又进行了百度知道原来是资源文件的后缀名都被隐藏起来了。在Windows里的文件名为flag.将代码中所打开...

2019-12-16 20:36:34 2435

原创 python------统计词频(中文)

在这里统计作家玛格丽特·米切尔创作的<<飘>>第一部主要人物的出现次数。在这里使用到了中文分词词库jieba代码:import jiebatxt=open("E:/飘","rb").read();#构建排除词库excludes = {"他们","没有","一个","自己","什么","这样","知道","可是","我们","因为"}#jieba精确模式进行分词...

2019-11-08 23:00:57 1652

原创 mapreduce------shuffle过程解析

Mapreduce程序分为五个阶段:inputmapshufflereduceoutput其中shuffle是Mapreduce的核心,它的主要职责是把map的输出结果有效的·传送到reduce端。其过程分为map端和reduce端的操作。对shuffle过程的理解尤为重要,mapreduce的优化通常是对shuffle过程进行优化,shuffle过程在面试中也会经常问到。对shuf...

2019-11-07 21:28:52 486

转载 数据公开资源

做数据分析,数据很重要,下面是我整理的几个数据来源。1. 中国银行保险监督管理委员会http://www.cbirc.gov.cn/cn/archive/9106.html该网站的主要数据包括保险业的经营情况,银行业的贷款情况等2.中国证券监督管理委员会http://www.csrc.gov.cn/pub/newsite/sjtj/3.国家统计局http://data.stats...

2019-11-03 16:24:31 558

原创 Python包安装---------分词包jieba

在Anaconda Prompt或者是cmd中输入pip install python安装过程如下图但是在第一次安装过程中提示有如下错误:Read timed out表示已经连接成功(即三次握手已经完成),但是服务器没有及时返回数据(没有在设定的时间内返回数据),导致读超时。该种情况一般是由于网络较差导致,再次输入命令重新尝试即可。...

2019-10-27 21:27:22 158

原创 hadoop学习笔记(一)

HDFS概述HDFS简介HDFS其实是Hadoop分布式文件系统,是谷歌公司GFS分布式文件系统的开源实现,同时也是Aapche Hadoop项目的一个子项目 。 HDFS通过构建一个能跨越计算机系统或网络系统的单一的文件命名空间(即统一的文件目录结构,在NameNode节点上),实现大数据文件(如PB级)的分布式存储。用户可以...

2019-10-17 21:52:01 164

原创 参加大数据比赛的想法

准备了3个多月的大数据比赛,今天比完了,内心有一些想法,在听了老师的建议之后决定还是写个博客纪念一下,也是一段回忆。同时,这样也可以记录自己现在有哪些不足的地方,更好的学习。比赛的前一天:1.mapreduce原本以为mapreduce学习的差不多了,但在看一个自己写的案例代码和笔记的时候还是不知道排序和分区的执行顺序,虽然之前也看了博客和相关的书籍,但是对mapreduce的执行原理理解的...

2019-10-13 23:01:41 1002 3

原创 mapreduce------学生成绩(六)

知识准备reducer类的操作对象是分区,一个分区初始化一次reducer类。reduce()函数的操作对象是组,一个分区中有几个分组就调用几次reduce()函数。分组默认采用通过比较键的方式来实现。当自定义组合键时,往往需要根据组合键中的某一个属性进行分组统计,此时就用到自定义分组类。通过重写其中的compare()方法定义分组规则。分组前先对合并后的分区文件中的记录进行排序,排序后再...

2019-10-09 16:35:50 435 2

原创 mapreduce------学生成绩(五)

数据computer,huangxiaoming,85,86,41,75,93,42,85computer,xuzheng,54,52,86,91,42computer,huangbo,85,42,96,38english,zhaobenshan,54,52,86,91,42,85,75english,liuyifei,85,41,75,21,85,96,14algorithm,liu...

2019-10-05 22:11:22 384

原创 mapreduce------学生成绩(四)

知识准备在进行mapreduce编程时key键往往用于分组或排序,当我们在进行这些操作时Hadoop内置的key键数据类型不能满足需求时,或针对用例优化自定义数据类型可能执行的更好。因此可以通过实现org.apache.hadoop.io.WritableComparable接口,自定义一个WritableComparable类型,并使其作为mapreduce计算的key类型。2.自定义H...

2019-10-05 20:46:08 1114

转载 DecimalFormat 保留小数格式化

DecimalFormat format 方法大家在format()一个小数是,总是对格式中的’0’和’#'有些不解吧!eg:1:new DecimalFormat(“00.000”).format(pi) //结果:03.1422:new DecimalFormat("##.###").format(pi) //结果:3.142都是对pi进行格式化,但第一个的结果是03.142,第二个...

2019-10-05 20:30:11 395

原创 过滤,替换

数据36.63.116.201|sdk.conf.igexin.com|20170207161935|61.147.218.24;222.186.20.109;222.186.20.123|036.63.123.215|cm052.getui.igexin.com|20170207161935|183.131.1.82|036.63.132.38|mmbiz.qpic.cn|20170207...

2019-10-03 14:42:11 1292

原创 2018年安徽省大数据网络赛数据分析(三)

数据36.63.116.201|sdk.conf.igexin.com|20170207161935|61.147.218.24;222.186.20.109;222.186.20.123|036.63.123.215|cm052.getui.igexin.com|20170207161935|183.131.1.82|036.63.132.38|mmbiz.qpic.cn|20170207...

2019-10-03 14:23:26 1819

原创 利用mapreduce中某些基本类的内置比较方法实现倒序排序

在mapreudce的类如IntWritable,LongWritable,Text等都有一个内置的比较函数,而我们可以对其进行修改实现简单的倒序排序。默认都是正序的从小到大。//如果是LongWritable类型的直接写成LongWritable.Comparaor即可,以此类推public static class MyNumberComparator extends IntWritabl...

2019-10-03 10:43:30 231

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除