Wesley13 Wesley13
3年前
Java + golang 爬取B站up主粉丝数
自从学习了爬虫,就想在B站爬取点什么数据,最近看到一些个up主涨粉很快,于是对up主的粉丝数量产生了好奇,所以就有了标题~首先,我天真的以为通过up主个人空间的地址就能爬到https://space.bilibili.com/137952!(https://oscimg.oschina.net/oscnet/3c122e04dbe1050ad
Wesley13 Wesley13
3年前
KDD 2020阿里巴巴论文一分钟秒读
!(https://oscimg.oschina.net/oscnet/24a7d407dbff48f69edba20ddb069fd1.png)作为科研人员,阅读文献已经成为日常,而快速阅读掌握文章要旨、研究的背景,动机、方法和结论是必备的技能。而随着论文数量的爆炸式增长,每日阅读大量的英文文献已然成为了一件枯燥耗时的工作。
Stella981 Stella981
3年前
SonarQube 数据清理,从100G 到9G
背景描述SonarQube自去年使用开始,已运行一年有余它上面的Project数量已超过1000因为每个应用的每个git分支的每次push事件都会触发Sonar分析任务这样会有很多的数据都存储下来,从而导致数据量很大目前Mysql数据库占用磁盘空间达到100G并且随着时间推移会继续增加
Stella981 Stella981
3年前
Kafka 异步消息也会阻塞?记一次 Dubbo 频繁超时排查过程
线上某服务A调用服务B接口完成一次交易,一次晚上的生产变更之后,系统监控发现服务B接口频繁超时,后续甚至返回线程池耗尽错误ThreadpoolisEXHAUSTED。因为服务B依赖外部接口,刚开始误以为外部接口延时导致,所以临时增加服务Bdubbo线程池线程数量。配置变更之后,重启服务,服务恢复正常。一段时间之后,服务B
Stella981 Stella981
3年前
Jenkins CLI 命令行 v0.0.33
!(https://oscimg.oschina.net/oscnet/1298b1ff1d3e417899e24791c04ec3cb.png)在某些场景下,我们可能需要增加或者删除流水线参数。如果有相当数量的流水线需要手动处理的话,将会是一件非常无聊、工作量大的事情。现在,你可以通过这个命令来添加参数了:jclijobparami
Stella981 Stella981
3年前
Docker发布开发团队2021年三个首选方向;工信部印发《工业互联网创新发展行动计划(2021
\_开发者社区技术周刊\_又和大家见面了,快来看看这周有哪些值得我们开发者关注的重要新闻吧。!(https://static001.geekbang.org/infoq/0e/0ef0749d6a02848951b542a9d8828656.webp)智源研究院发布超大规模新型预训练模型“文汇”参数量级达113亿
Stella981 Stella981
3年前
Python序列拆分操作符与映射拆分操作符实例
使用序列拆分操作符(\)来提供位置参数。例如函数heron的参数存放于一个列表sides中,可以:heron(sides\0\,sides\1\,sides\2\)也可以进行拆分:heron(\sides)。如果列表包含比函数参数更多的项数,就可以使用分片提取出合适的参数。1.在使用可变数量的位置参数的函数时,可使用
Nginx接收Http协议请求转发使用Https协议
缘起公司使用阿里的apigateway,规定不太友好,同是SIT环境,A系统的SIT1环境居然不能调用B系统的SIT2环境的接口。因为各个系统之间部署的SIT环境数量不同A系统可能只有1套,B系统可能有8套,这样的话,可能会随时切换调用B系统的环境,管理员
CDP技术系列(一):使用bitmap存储数十亿用户ID的标签或群体
一、背景介绍CDP系统中目前存在大量由用户ID集合组成的标签和群体,截止当前已有几千标签,群体2W。大量的标签都是亿级别数据量以上,例如性别、职业、学历等均,甚至有群体中的ID数量达到了数十亿。并且随着用户ID池的不断增加,标签和群体本身包含的ID数