Stella981 Stella981
2年前
Python爬虫:现学现用xpath爬取豆瓣音乐
爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。!(https://oscimg.oschina.net/oscnet/2daa493a02eeb49299b1ab6db462cb42124.png)这样一比较我我选择了Lx
Wesley13 Wesley13
2年前
2020年这些正则表达式应该被收藏
推荐一下作者的正则大全,收录在GitHub上,目前有VSCode的插件可以使用,相当方便:anyrule正则大全火车车次/^GCDZTSPKXLY19\d{1,4}$/复制代码手机机身码(IMEI)/^\d{15,17}$/复制代码必须带端口
Stella981 Stella981
2年前
Ruby 里的 %Q, %q, %W, %w, %x, %r, %s, %i (译)
%Q用于替代双引号的字符串.当你需要在字符串里放入很多引号时候,可以直接用下面方法而不需要在引号前逐个添加反斜杠(\\") %Q(Joe said: "Frank said: "{what_frank_said}"") "Joe said: "Frank said: "Hello!"""(...)
Stella981 Stella981
2年前
Hadoop兮,杀鸡别用牛刀,python+shell实现一般日志文件的查询、统计
简单的日志统计是不需要使用重量级的Hadoop,我用python实现了日志的统计。原理是用fabric登录到远程linux,组合使用grep、uniq、sort、awk对日志进行操作,可以根据正则表达式指定规则抽取符合规则的日志,做查询,计数,分类统计。注意:要安装fabric(https://www.oschina.net/action/GoToL
Stella981 Stella981
2年前
PHP写deamon合适吗
国内用php做deamon的多起来了,有名的如swoole,而wokerman则把小广告贴得到处都是。反观国外,高手扎堆的ReactPHP却不温不火。PHP适合写deamon吗?有人会说,写GTK界面都行,写个deamon算啥。PHP的“执行后释放所有资源”的方式在主流语言里是独一无二的,这让它开发web时,没有Java和Ruby里内存泄漏(假释放)的问
Stella981 Stella981
2年前
C# 使用JPath查询节点(正则表达式)
publicclassRouteManager{privateJObjectjsonObjectnewJObject();publicvoidAddRoute(stringwebPath,stringresourcePath)
Wesley13 Wesley13
2年前
5.48 正则表达式的概述和基本使用
import java.util.Scanner;public class RegexDemo {public static void main(String args) {// 创建键盘录入对象Scanner sc  new Scanner(System.in);Sys
Stella981 Stella981
2年前
CentOS 7 安装gogs git代码服务器
1,关于Gogs开源的代码服务器最牛的是github,有一个开源的实现是gitlab。但是gitlab是用ruby写的,某些时候性能有问题。有的时候使用的时候超级慢。代码存的多了就会出现的问题。不知道gogs会不会有这个问题。于是尝试下。官方网站是:https://gogs.io/(https://www.
鹏
2年前
在 Ubuntu 上安装 Anaconda
Anaconda介绍Anaconda是一个科学开发套件,主要用于数据科学领域,支持的编程语言有Python和Ruby。Anaconda的特点是有一个名为Conda的环境管理工具,这让环境管理变得极为方便。:::tip官网地址::::下载1.进入上面的官网,可以看到中间的下载按钮。我需要的是Linux版,所以点击下面的小企鹅。2.
codigger codigger
1个月前
Ruby、Python、Java 开发者必备:Codigger之软件项目体检,码住
在编程的广阔天地里,Ruby、Python和Java开发者们各自凭借着独特的语言特性,构建着精彩纷呈的应用世界。然而,无论使用哪种语言,确保项目的高质量始终是至关重要的目标。而Codigger项目体检则成为了实现这一目标的得力助手,它能巧妙地适应不同语言的开发特点和需求。