Stella981 Stella981
4年前
Python爬虫:现学现用xpath爬取豆瓣音乐
爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。!(https://oscimg.oschina.net/oscnet/2daa493a02eeb49299b1ab6db462cb42124.png)这样一比较我我选择了Lx
Wesley13 Wesley13
4年前
2020年这些正则表达式应该被收藏
推荐一下作者的正则大全,收录在GitHub上,目前有VSCode的插件可以使用,相当方便:anyrule正则大全火车车次/^GCDZTSPKXLY19\d{1,4}$/复制代码手机机身码(IMEI)/^\d{15,17}$/复制代码必须带端口
Stella981 Stella981
4年前
Linux Shell 脚本
知道脚本的存在,也会偷懒写一点用,但是真的不熟,最近想偷懒用脚本log的方式跑训练程序,所以边查边写,凑合着写了一个能用的。1、基本使用  新建一个文件(run.sh),写上  !/bin/bashthmain.lua  第一行一定要有,不然不能运行。  修改权限:chmodxrun.sh     
Stella981 Stella981
4年前
Hadoop兮,杀鸡别用牛刀,python+shell实现一般日志文件的查询、统计
简单的日志统计是不需要使用重量级的Hadoop,我用python实现了日志的统计。原理是用fabric登录到远程linux,组合使用grep、uniq、sort、awk对日志进行操作,可以根据正则表达式指定规则抽取符合规则的日志,做查询,计数,分类统计。注意:要安装fabric(https://www.oschina.net/action/GoToL
Stella981 Stella981
4年前
C# 使用JPath查询节点(正则表达式)
publicclassRouteManager{privateJObjectjsonObjectnewJObject();publicvoidAddRoute(stringwebPath,stringresourcePath)
Wesley13 Wesley13
4年前
C++ 删除字符串的两种实现方式
C实现删除给定字符串的给定字符串思路主要有这么几种实现方式:1.KMP算法2.用STL的string的find,然后用erase3.用C的strstr找到字串位置,然后用strncpy写到新串中4.用boost库,用正则表达式测试过的完整代码:第一种方法:123456789101
Wesley13 Wesley13
4年前
5.48 正则表达式的概述和基本使用
import java.util.Scanner;public class RegexDemo {public static void main(String args) {// 创建键盘录入对象Scanner sc  new Scanner(System.in);Sys
Python进阶者 Python进阶者
2年前
我让gpt写了一段正则表达式代码,可是运行报错,可以帮忙看看哪里出了问题?
大家好,我是皮皮。一、前言前几天在Python最强王者群【HZL】问了一个Python正则表达式的问题,这里拿出来给大家分享下。截图如下图所示:单独跑的这一行,跑出了下图这个。这个报错是你提取了4列,应该赋值给4列,而不应该是1列。二、实现过程这里【大锤子
京东APP百亿级商品与车关系数据检索实践
作者:京东零售张强导读本文主要讲解了京东百亿级商品车型适配数据存储结构设计以及怎样实现适配接口的高性能查询。通过京东百亿级数据缓存架构设计实践案例,简单剖析了jimdb的位图(bitmap)函数和lua脚本应用在高性能场景。希望通过本文,读者可以对缓存的内
位流程风 位流程风
6个月前
【WAF 技术革命】当正则匹配遇见语义黑洞:雷池waf如何用「语言思维」重构网络防御?
传统WAF的弊端传统WAF通常使用正则表达式的形式,以关键字定义攻击特征,拿知名的modsecurity引擎来看,这个世界上80%的WAF都是由它来驱动的,但是它通常有一些什么规则,让我们来剖析一下●union,用\x61代替了字母a,破坏了关键字特征,因