加入收藏 | 设为首页 | 会员中心 | 我要投稿 阜新站长网 (https://www.0418zz.com.cn/)- 管理运维、AI硬件、数据集成、云备份、负载均衡!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

教AI做件简单的事

发布时间:2021-01-31 17:19:38 所属栏目:外闻 来源:互联网
导读:pandas,与matplotlib同享数分三剑客的美誉,而且更有瑞士军刀名号的pandas,实际上也是一个非常便捷的绘图库。更准确地说,这是一个面向dataframe对象的绘图接口,通过调用plot()接口或者plot属性,从而可以完成主流matplotlib中图表的绘制,且几乎继承了ma
  • pandas,与matplotlib同享数分三剑客的美誉,而且更有瑞士军刀名号的pandas,实际上也是一个非常便捷的绘图库。更准确地说,这是一个面向dataframe对象的绘图接口,通过调用plot()接口或者plot属性,从而可以完成主流matplotlib中图表的绘制,且几乎继承了matplotlib中相应图表的所有参数设置,包括设置多子图绘制等,简直不能更丝滑。近期,随着版本的升级,pandas绘图后端更是可以指定其他绘图底层接口,使用起来极为方便。想象一下:你在操作着dataframe的各种处理和转换,突然想看看当前处理的数据什么样,那么就一言不合就来个图表。简单的pandas绘图方法可查看pandas教程中的最后一部分。
  • geopandas,geopandas是一个继承自pandas的地理信息数据处理库,其核心数据接口geodataframe本质上就是在pandas的dataframe数据结构上增加一列geometry,体现空间信息。除了继承了pandas的各种数据处理接口外,geopandas还增强了画图功能,在一个具有geometry列信息的geodataframe中,直接调用.plot()接口,即可快速查看当前地理信息情况。下图是混用matplotlib和geopandas.plot()的直接绘图结果,仅需额外设置用于标识数值大小的一列,即可绘制五颜六色的炫丽图片。(当前选用颜色风格为rainbow,可明显看出颜色从深到浅依次为红橙黄绿青蓝紫)

xcel支持的图表类型也极为丰富,除了常规的条形图、折线图、饼图和散点图之外,像雷达图、旭日图、箱线图等视觉效果更好的图表也是支持的。同时更是支持了丰富的设置效果,而且都是极为简便易懂的,几乎不需要教程即可摸索掌握。

02 Python可视化库

作为一名数据分析师,Python几乎是必须掌握的;而在Python数据分析相关的众多第三方包中,可视化库又非常强大。在这其中,个人尤为常用的有5个相关库:

  • matplotlib,该库与numpy和pandas号称Python数分三剑客,也是当初配合numpy和scipy替代Matlab的重要一环,几乎是Python数据分析过程中必须熟练掌握的绘图库。不过需要承认的是,matplotlib功能强大,但其实相对更加偏向底层,提供了大量的参数和接口来设置图表各种细节,对于初学者来说并不那么友好。但实话说,在彻底掌握其核心思想之后,其实还是比较符合正常思维的。这里,附个人总结的matplotlib完整入门教程:python数据科学系列:matplotlib入门详细教程

01 Excel

网传数据分析师必备基础套餐是ESP,即Excel+SQL+Python,这种说法不见得完全正确,但也确有一定道理,其中Excel更是几乎每名数据分析师乃至每名职场人士必备的办公工具。个人也习惯于应用Excel,更具体说主要是应用Excel的三类功能:图表制作、内置函数以及数据透视表。一般而言,当数据量较小(100以内)时,个人非常倾向于用Excel完成图表插入,不仅简洁方便,而且内置的多种样式、丰富的设置选项以及所见即所得的制图体验,都无疑是小数据量作图的首选。
 

存储管理者需要推进他们的存储战略,以对疫情带来的不利影响有所准备。但是,并非所有组织都面临相同的挑战。Reder表示,根据他对客户群的了解,疫情对管理员的影响因业务部门而异。例如,一些行业(例如依赖选择性程序的航空公司和医疗系统)必须找出解决现金流问题的方法。

Reder说:“对于存储管理员来说,这意味着推迟投资,并寻找其他解决业务增长或生命周期事件的方法。”他表示,文件和NAS存储的数据归档是创建容量空间的一种方法,可以使用主存储系统中的原生功能,也可以使用专门构建的文件分析和归档解决方案。这反过来又引起了人们对将低成本对象存储作为归档目标的兴趣,尤其是主要的云计算PaaS产品。

展望未来,许多IT团队和存储管理员将利用他们在2020年面临的数据存储管理挑战,作为实施更快响应变化的系统的出发点。

尽管各行业之间存在差异,但大多数IT团队不得不在应对疫情带来的挑战与投资面向未来的技术之间取得平衡。同时,他们必须认识到世界是如何以变化的方式前进,同时认识到敏捷性与高性能系统相结合的必要性。

例如,Coughlin指出Gen-Z和Compute Express Link标准已对未来的内存架构产生重大影响做好准备。他说:“它们被制造用于处理异构存储设备,并将为新兴存储技术提供更大规模、更有效的功能。这样的技术可以使组织能够推进其业务战略,同时帮助优化数据和存储环境。”

然而,对于IT团队来说,获取和部署新技术可能是一个挑战,即使在最好的情况下也是如此。随着疫情的持续蔓延,现在比以往任何时候都困难。例如,工作人员由于疫情封锁难以在现场部署新设备,甚至购买存储设备的过程也发生了变化,因为与供应商销售人员的会议大多都是虚拟的。

展望未来,许多IT团队和存储管理员将把他们在2020年数据存储管理中面临的挑战作为实施对变化做出更快响应,同时更大程度地减少开销和简化运营的系统的起点。如果他们选择的技术不支持这些目标,则他们可能会陷入无法满足未来业务需求的困境。


(编辑:阜新站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读