onlyloveyd onlyloveyd
3年前
协变和逆变
本文同步发表于我的微信公众号,在微信搜索OpenCVorAndroid即可关注。协变、逆变概念许多程序设计语言的类型系统支持子类型。例如,如果Cat是Animal的子类型,那么Cat类型的表达式可用于任何出现Animal类型表达式的地方。所谓的变型(variance)是指如何根据组成类型之间的子类型关系,来确定更复杂的类型之间(例如C
python如何通过分布式爬虫爬取舆情数据
作为爬虫,有时候会经历过需要爬取站点多吗,数据量大的网站,我们身边接触最频繁、同时也是最大的爬虫莫过于几大搜索引擎。今天我们来聊一个同样是站点多数据量的爬取方向,那就是舆情方向的爬虫。舆情简单来说就是舆论情况,要掌握舆情,那么就必须掌握足够多的内容资讯。除
捉虫大师 捉虫大师
3年前
Cobar提出的一种在分库场景下对Order By / Limit 的优化
搜索关注微信公众号"捉虫大师",后端技术分享,架构设计、性能优化、源码阅读、问题排查、踩坑实践。本文已收录https://github.com/lkxiaolou/lkxiaolou欢迎star。Cobar虽然是一款“古老”的数据库中间件,但目前不少公司仍然在用它,且它包含了不少有意思的算法和实现,今天就来分享Cobar提出的一种在分库场景下对
Aidan075 Aidan075
3年前
教你用Python制作炫酷的词云
相信大家也都通过各种渠道了解了老干妈与鹅厂的爱恨纠缠,当然其中还混入了迷惑行为的“骗子”、吃瓜吃得飞起的“阿里系”以及连称此事与我无关的“某搜索引擎”。不过这是一篇技术文,所以无心管他到底是谁的老千妈,一心只想给大家介绍这个惊艳的好东西。(https://imghelloworld.osscnbeijing.aliyuncs.com/4
Wesley13 Wesley13
3年前
MySQL如何实时同步数据到ES?试试这款阿里开源的神器
摘要mall项目中的商品搜索功能,一直都没有做实时数据同步。最近发现阿里巴巴开源的canal可以把MySQL中的数据实时同步到Elasticsearch中,能很好地解决数据同步问题。今天我们来讲讲canal的使用,希望对大家有所帮助!canal简介canal主要用途是对MySQL数据库增量日志进行解析,提供增量数据的订阅和消
Stella981 Stella981
3年前
Google Map 开发(二):根据方向传感器对 Marker 进行旋转
这是最近做的一个小功能,虽然很简单,网上却很少有相关例子,关于怎么使用地磁和加速度传感器的例子是有了,怎么旋转GoogleMapMarker也能Google到一些,但是结合起来就基本没看到,也可能是我搜索方式不对,所以还是自己来实现了。首先找找GoogleMapMarker相关的文档,如何使用可以参见这个:https://dev
Stella981 Stella981
3年前
Coreseek 4.1 win32设置
mysql自带有fulltext索引,但是只限于英文字符,如果我们要对含有中文的大文本进行全文模糊索引,自带的concat()like。。是满足不了我们的速度需求的,特别是当我们拥有大量数据,同时需要进行全文模糊索引的时候,如果只是使用like,10W条的数据搜索时间就有15S!这是绝对不能容忍的,所以这个时侯就可以考虑使用coreseek,Cor
Stella981 Stella981
3年前
Elasticsearch Mapping parameters(主要参数一览)
Elasticsearch在创建类型映射时可以指定映射参数,下面将一一进行介绍。analyzer指定分词器。elasticsearch是一款支持全文检索的分布式存储系统,对于text类型的字段,首先会使用分词器进行分词,然后将分词后的词根一个一个存储在倒排索引中,后续查询主要是针对词根的搜索。analyzer该参数可以在查询、字段、索引级
Stella981 Stella981
3年前
Gson简要使用笔记
最近在做一个javawebservice项目,需要用到jason,本人对java不是特别精通,于是开始搜索一些java平台的json类库。发现了google的gson,因为之前对于protocolbuf有一些了解,带着一些好奇心,我开始使用了gson。经过比较,gson和其他现有javajson类库最大的不同时gson需要序列化得实体类不需要使
yandex robots txt
是一个包含网站索引参数的文本文件,供搜索引擎的机器人使用。Yandex支持具有高级功能的RobotsExclusion协议。当抓取一个网站时,Yandex机器人会加载robots.txt文件。如果对该文件的最新请求显示某个网站页面或部分被禁止,机器人就不会索引它们。Yandexrobots.txt文件的要求Yandex机器人可以正确处