Irene181 Irene181
3年前
详解4种类型的爬虫技术
导读:网络爬虫是一种很好的自动采集数据的通用手段。本文将会对爬虫的类型进行介绍。作者:赵国生王健来源:大数据DT(ID:hzdashuju)聚焦网络爬虫是“面向特定主题需求”的一种爬虫程序,而通用网络爬虫则是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分,主要目的是将互联网上的网页下载到本地,形成一个互联网内
Karen110 Karen110
3年前
轻松识别文字,这款Python OCR库支持超过80种语言
OCR是什么?有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。OCR的全称叫作“OpticalCharacterRecognition”,即光学字符识别。这算是生活里最常见、最有用的AI应用技术之一。细心观察便可发现,身边到处都是O
Easter79 Easter79
3年前
swift不用声明类型那些事
这事本来如果王垠在专家角度来说会比较好看一点。不过e神既然提到了swift的这个特性和PHP等动态语言进行类比,那就随便说一下。毕竟@我两次了,但是我觉得篇幅太长一直没回。首先,我对swift的信息来源,并非来自于实践,官方文档好像要注册apple帐号啥的才能下,随便找到了这篇文档(https://www.oschina.net/action/GoT
Stella981 Stella981
3年前
PostgreSQL物理坏块和文件损坏案例分享
作者简介王睿操,平安好医数据库架构岗,多年postgresql数据库运维开发工作。曾就职于中国民航信息,迪卡侬。对其他数据库产品也有一定的涉猎。背景笔者最近发现很多朋友经常遇到PostgreSQL坏块或者数据混乱的情况,网上中文资料比较少,于是整理了一下笔者遇到各种各样的报错以及解决方案案例一:物理坏块
Stella981 Stella981
3年前
DevOps不是什么
本文为普元软件产品部总经理王葱权原创翻译DevOps技术文章系列,独家授权EAII企业架构创新研究院(微信号:eaworld)发布,转载请注明出处,违者必究。对于接受和拥护DevOps多年的人来说,DevOps的逐渐流行就如同大学出来找到第一份工作一样让人兴奋。好吧,或许并没有这么兴奋,但还是非常酷的:)越来越多不同规模的
Stella981 Stella981
3年前
Android UI:机智的远程动态更新策略
腾讯Bugly特约作者:王金波问题描述做过Android开发的人都遇到过这样的问题:随着需求的变化,某些入口界面通常会出现UI的增加、减少、内容变化、以及跳转界面发生变化等问题。每次发生变化都要手动修改代码,而入口界面通常具有未读信息提醒这样的“小红点”逻辑;一旦UI变化,“小红点”逻辑也要重新计算。如果不同的RD来维护
Stella981 Stella981
3年前
Google 的 Git v2 带来颠覆性性能提升?恐怕未必
作者简介王振威,CODING创始团队成员之一,多年系统软件开发经验,擅长Linux,Golang,Java,Ruby,Docker等技术领域,近两年来一直在CODING从事系统架构和运维工作前言最近Google发布了一篇文章,描述了对Git的一个传输协议的更新,引起了国内技术圈的不小规模的轰动(相关文章请自行百度“Gitv2
面向缓解机制评估的自动化信息泄露方法
源自:软件学报作者:杨松涛陈凯翔王准张超摘要自动生成漏洞利用样本(AEG)已成为评估漏洞的最重要的方式之一,但现有方案在目标系统部署有漏洞缓解机制时受到很大阻碍.当前主流的操作系统默认部署多种漏洞缓解机制,包括数据执行保护(DEP)和地址空间布局随机化(ASLR)等,而现有AEG方案仍无法面对所有漏洞缓解情形.提出了一种自动化方案EoLe
云计算搭上“双碳”,天翼云在绿色算力赛道加速跑
3月6日,中国电信青海公司2023年DICT生态合作伙伴大会在西宁成功召开。中国电信青海公司党委书记、总经理苏小明出席大会并致辞,中国通信研究院主任工程师/高级工程师赵丽作主旨报告。青海省通信管理局副局长王艳芳,青海省工业和信息化厅数字经济发展局局长杨守文
京东云开发者 京东云开发者
3星期前
时间复杂度为 O(n^2) 的排序算法
作者:京东保险王奕龙对于小规模数据,我们可以选用时间复杂度为O(n2)的排序算法。因为时间复杂度并不代表实际代码的执行时间,它省去了低阶、系数和常数,仅代表的增长趋势,所以在小规模数据情况下,O(n2)的排序算法可能会比O(nlogn)的排序算法执行效率高