推荐
专栏
教程
课程
飞鹅
本次共找到657条
字面量
相关的信息
小白学大数据
•
2年前
python如何通过分布式爬虫爬取舆情数据
作为爬虫,有时候会经历过需要爬取站点多吗,数据量大的网站,我们身边接触最频繁、同时也是最大的爬虫莫过于几大搜索引擎。今天我们来聊一个同样是站点多数据量的爬取方向,那就是舆情方向的爬虫。舆情简单来说就是舆论情况,要掌握舆情,那么就必须掌握足够多的内容资讯。除
Ben611
•
4年前
16个 HTML5 框架、模板以及生成工具
网页设计通常需要预先考虑很多因素,而用户给你的时间又特别稀缺,如何提高效率其实是一个比较烦人的问题。一个可行方式就是使用预先准备好的框架和模板,HTML5框架、模板以及生成器是一个万灵丹似的解决方案,可以大大简化很多工作量。这里介绍一些比较实用的工具,
京东云开发者
•
2年前
玩转服务器之Docker篇:10分钟学会搭建 Docker 环境
数字化转型浪潮下,云原生技术领域的建设投入、集群规模持续走高,云原生技术已是大势所趋。在用户生产环境中,容器技术的采纳率已接近70%,docker使应用部署更加轻量,可移植,可扩展,更好的环境隔离也更大程度地避免了生产环境与测试环境不一致的巨大尴尬,本文为大家详细讲解如何手动搭建Docker环境。
Wesley13
•
3年前
MySQL 8.0 hash join有重大缺陷?
我并不这么看。友情提醒:本文建议在PC端阅读。徐春阳老师发文爆MySQL8.0hashjoin有重大缺陷。文章核心观点如下:多表(比如3个个表)join时,只会简单的把表数据量小的放在前面作为驱动表,大表放在最后面,从而导致可能产生极大结果集的笛卡尔积,甚至耗尽CPU和磁盘空间。就此现象,我也做了个测试。1\.
Easter79
•
3年前
SSO单点登录基于CAS架构封装 Memcached 实例
SSO认证中心是CAS整个应用架构的一个极其重要的关键点,必须满足如下两点要求:1.高可用,不允许程序发生故障。如果认证中心发生故障,整个应用群将无法登录,导致所有服务瘫痪。2.高并发,因为所有用户的登录请求都需要经过它处理,其承担的处理量往往是相当巨大的。其中memcached的CAS源码MemCacheTicketRegistry.java类
Wesley13
•
3年前
MQ之对比
activeMQ:高效、可扩展、稳定安全企业级消息通信rabbitMQ:分布式系统可靠、可扩展、功能丰富,内存式堆积,某些条件下触发换页动作将内存中消息换页到磁盘;支持多租户 不支持重试队列,二次封装延迟队列实现呢 拉模式,不回溯,支持消息追踪 多租户kafka:高吞吐量分布式发布订阅消息系统,可水平扩展,磁盘式堆积,冗余功能
小白学大数据
•
2年前
python如何分布式和高并发爬取电商数据
随着互联网的发展和数据量的不断增加,网络爬虫已经成为了一项非常重要的工作。爬虫技术可以帮助人们自动地从互联网上获取大量数据,并且这些数据可以应用于各种领域,如搜索引擎、数据分析和预测等。然而,在实际应用中,我们面临的一大难题就是如何高效地爬取大量数据。分布
小白学大数据
•
1年前
高并发海量数据爬取,哪种语言更适合?
今天我要和大家聊一聊一个让程序员们头疼不已的话题——高并发海量数据爬取。在这个信息爆炸的时代,我们需要从互联网上抓取大量的数据,便于进行分析、挖掘和应用。但是面对庞大的数据量和复杂的网络环境,我们应该选择哪种编程语言来完成这项任务呢?让我们一起来探讨一下吧
京东云开发者
•
1年前
Vitess全局唯一ID生成的实现方案 | 京东云技术团队
为了标识一段数据,通常我们会为其指定一个唯一id,比如利用MySQL数据库中的自增主键。但是当数据量非常大时,仅靠数据库的自增主键是远远不够的,并且对于分布式数据库只依赖MySQL的自增id无法满足全局唯一的需求。因此,产生了多种解决方案,如UUID,Sn
京东云开发者
•
1年前
测试用例设计方法六脉神剑——第三剑:倚天屠龙,正交试验冲锋 | 京东物流技术团队
1引言上篇讲了因果图和判定表法,而这两种方法在变量值很多、排列组合数量极大的场景下,会生成非常庞大且冗余的测试用例,此时我们很难对所有组合场景进行全量测试用例覆盖,基于此短板,正交试验法应运而生。2概念及原理2.1定义正交试验法是研究多因素、多水平的一种试
1
•••
45
46
47
•••
66