Aidan075 Aidan075
4年前
爬取6271家死亡公司数据,看十年创业公司消亡史
↑关注置顶 有趣的不像个技术号昨天在【凹凸数读】发了一篇关于创业公司的文章,原文链接如下:今天我来写一写它的python版本。前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司。意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com/deathCompany),统计了20
Stella981 Stella981
3年前
Nginx反爬虫: 禁止某些User Agent抓取网站
一、概述网站反爬虫的原因不遵守规范的爬虫会影响网站的正常使用网站上的数据是公司的重要资产爬虫对网站的爬取会造成网站统计数据的污染常见反爬虫手段1\.根据IP访问频率封禁IP2\.设置账号登陆时长,账号访问过多封禁设置账号的登录限制,只有登录才能展现内容
Wesley13 Wesley13
3年前
2135亿!!!支付宝这次玩真的! 双11核心技术100%全面开放!
小蚂蚁说:天猫“双11”,你贡献了多少?据统计,截止11月11日24点,2018天猫双11全球狂欢节成交额超2135亿元!每一次记录的突破,都离不开双11核心技术的全面开放。!(https://oscimg.oschina.net/oscnet/daf6994d3f3c6a64d5ccaeb042964acab75.jpg)疯狂的天猫
可莉 可莉
3年前
10.6 监控io性能 10.7 free命令 10.8 ps命令 10.9 查看网络状态 10.10 linux下抓包 linux下抓包
10.6监控io性能iostat命令\iostat命令被用于监视系统输入输出设备和CPU的使用情况。它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况。同vmstat一样,iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。iostatxroot@
Stella981 Stella981
3年前
Linux查看是否被入侵
一.检查系统日志lastb命令检查系统错误登陆日志,统计IP重试次数二.检查系统用户1、cat/etc/passwd查看是否有异常的系统用户2、grep“0”/etc/passwd查看是否产生了新用户,UID和GID为0的用户3、lsl/etc/passwd查看passwd的修改时间,判断是否在不知的情况下添加用户4、查看
Wesley13 Wesley13
3年前
3.20 二维数组练习2求和
/公司年销售额求和某公司按照季度和月份统计的数据如下:单位(万元)第一季度:22,66,44第二季度:77,33,88第三季度:25,45,65第四季度:11,66,99分析:A:把题目的数据用二维数组来表示int arr  {{22
Trie树简介及应用
Trie树在单词搜索、统计、排序等领域有大量的应用。文章从基础概念到具体的脏话过滤的应用、Redis的RAX和Linux内核的RadixTree对Trie树做了介绍。数据结构和算法是程序高性能的基础,本文抛砖引玉,希望大家对Trie树有所了解,并在未来开发过程实践和应用Trie树解决中类似情景的问题。
浅谈HPC中的Lustre
Lustre体系结构是一个为集群设计的存储体系结构。其核心组件是运行在Linux操作系统上、支持标准的POSIXUNIX文件系统接口、并遵循GPL2.0许可的Lustre文件系统。据IDC的统计,Lustre是在HPC领域应用最广的文件系统,世界上最快的50个超算网站有60%都使用Lustre。
小万哥 小万哥
1年前
NumPy 随机数据分布与 Seaborn 可视化详解
随机数据分布什么是数据分布?数据分布是指数据集中所有可能值出现的频率,并用概率来表示。它描述了数据取值的可能性。在统计学和数据科学中,数据分布是分析数据的重要基础。NumPy中的随机分布NumPy的random模块提供了多种方法来生成服从不同分布的随机数。
小白学大数据 小白学大数据
7个月前
Python与空气质量数据:时间序列分析技术
引言随着环境问题的日益严峻,空气质量数据的监控和分析变得至关重要。时间序列分析作为一种统计技术,能够帮助我们理解空气质量数据随时间的变化趋势和模式。Python,作为一种广泛使用的编程语言,提供了多种强大的库来处理和分析时间序列数据,本文将详细介绍如何使用