冴羽 冴羽
2年前
搭建 VuePress 站点必做的 10 个优化
前言在中,我们使用VuePress搭建了一个博客,最终的效果查看:。在搭建这样一个博客后,其实还有很多的优化工作需要做,本篇我们来盘点一下那些完成基础搭建后必做的10个优化。1.开启HTTPS开启HTTPS有很多好处,比如可以实现数据加密传输等,SEO也会更容易收录:Google会优先选择HTTPS网页(而非等效的HTTP网
捉虫大师 捉虫大师
3年前
nacos配置中心模块详解
本文已收录https://github.com/lkxiaolou/lkxiaolou欢迎star。配置中心业务上的配置,功能开关,服务治理上对弱依赖的降级,甚至数据库的密码等,都可能用到动态配置中心。在没有专门的配置中心组件时,我们使用硬编码、或配置文件、或数据库、缓存等方式来解决问题。硬编码修改配置时需要重新编译打包,配置文件需要重启应用,数据库受
python如何通过分布式爬虫爬取舆情数据
作为爬虫,有时候会经历过需要爬取站点多吗,数据量大的网站,我们身边接触最频繁、同时也是最大的爬虫莫过于几大搜索引擎。今天我们来聊一个同样是站点多数据量的爬取方向,那就是舆情方向的爬虫。舆情简单来说就是舆论情况,要掌握舆情,那么就必须掌握足够多的内容资讯。除
捉虫大师 捉虫大师
3年前
Cobar提出的一种在分库场景下对Order By / Limit 的优化
搜索关注微信公众号"捉虫大师",后端技术分享,架构设计、性能优化、源码阅读、问题排查、踩坑实践。本文已收录https://github.com/lkxiaolou/lkxiaolou欢迎star。Cobar虽然是一款“古老”的数据库中间件,但目前不少公司仍然在用它,且它包含了不少有意思的算法和实现,今天就来分享Cobar提出的一种在分库场景下对
Aidan075 Aidan075
3年前
教你用Python制作炫酷的词云
相信大家也都通过各种渠道了解了老干妈与鹅厂的爱恨纠缠,当然其中还混入了迷惑行为的“骗子”、吃瓜吃得飞起的“阿里系”以及连称此事与我无关的“某搜索引擎”。不过这是一篇技术文,所以无心管他到底是谁的老千妈,一心只想给大家介绍这个惊艳的好东西。(https://imghelloworld.osscnbeijing.aliyuncs.com/4
可莉 可莉
3年前
11款插件让你的Chrome成为全世界最好用的浏览器|Chrome插件推荐
文章来源:知乎收录于:风云社区(SCOEE)【提供mac软件下载】更多专题,可关注小编【磨人的小妖精】,查看我的文章,也可上【风云社区SCOEE】,查找和下载相关软件资源。(一)综合类:新买苹果电脑,mac系统中小白应该了解哪些东西?Mac新手必看教程—让你离熟练操作mac只差十分钟推荐几个Mac插件帮你提升工作效率Mac操作技
Wesley13 Wesley13
3年前
Java对IPv6的支持详解:支持情况、相关API、演示代码等
本文由朱益盛、杨晖、傅啸分享,来自IBMDeveloper社区,原题“使用Java开发兼容IPv6的网络应用程序”,本次收录时有改动。1、引言前几天,有个群友跟我讨论用MobileIMSDK 写的IM服务端想支持IPv6的问题。因为众所周之的原因,IPv4早就不够用,现在国内从国家层面都在大力推广IPv6的普及,所以包括事业单位
yandex robots txt
是一个包含网站索引参数的文本文件,供搜索引擎的机器人使用。Yandex支持具有高级功能的RobotsExclusion协议。当抓取一个网站时,Yandex机器人会加载robots.txt文件。如果对该文件的最新请求显示某个网站页面或部分被禁止,机器人就不会索引它们。Yandexrobots.txt文件的要求Yandex机器人可以正确处
python如何分布式和高并发爬取电商数据
随着互联网的发展和数据量的不断增加,网络爬虫已经成为了一项非常重要的工作。爬虫技术可以帮助人们自动地从互联网上获取大量数据,并且这些数据可以应用于各种领域,如搜索引擎、数据分析和预测等。然而,在实际应用中,我们面临的一大难题就是如何高效地爬取大量数据。分布
Json根据关键词搜索淘宝京东1688商品列表数据
随着电商的迅速发展,越来越多的人开始选择在网上购物,而搜索引擎则是大家用来寻找想买商品的主要手段之一。不同的电商平台有不同的搜索接口,其中比较常用的包括京东,天猫和1688。本文将详细介绍这三个平台的关键词搜索接口。一、京东搜索接口京东是中国领先的线上零售