Aidan075 Aidan075
3年前
教你用Python制作炫酷的词云
相信大家也都通过各种渠道了解了老干妈与鹅厂的爱恨纠缠,当然其中还混入了迷惑行为的“骗子”、吃瓜吃得飞起的“阿里系”以及连称此事与我无关的“某搜索引擎”。不过这是一篇技术文,所以无心管他到底是谁的老千妈,一心只想给大家介绍这个惊艳的好东西。(https://imghelloworld.osscnbeijing.aliyuncs.com/4
Wesley13 Wesley13
3年前
SQL 性能起飞了!
这篇文章总结了52条SQL性能优化技巧,用简洁明了的语言介绍给大家,不废话全是干货,需要的可以收藏,退出。不不不,收藏,看完再退出。1\.对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引。2\.应尽量避免在where子句中对字段进行null值判断,创建表时NULL是默认值,但大
Stella981 Stella981
3年前
Elasticsearch学习总结一 基本用法及概念
一.Elasticsearch是一个基于Lucene的实时的分布式搜索和分析引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。基于RESTful接口二.ES中的核心概念集群(Cluster):ES是一个分布式的搜索引擎,一般由多台物理机组成。这些物理机,通过配置一个相同的clustername,互相发现,把自己
Wesley13 Wesley13
3年前
1. 初识 Lucene
在学习Lucene之前呢,我们当然首先要了解下什么是Lucene.0x01 什么是Lucene?Lucene是一套用于全文检索和搜索的开放源代码程序库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口,能够做全文索引和搜索,在Java开发环境里Lucene是一个成熟
Wesley13 Wesley13
3年前
Mysql Innodb 引擎优化 参数(innodb_buffer_pool_size)
版权声明:本文为博主原创文章,未经博主允许不得转载。在mysql的学习过程中,要是不把一些基本概率弄的很清楚,难免显得过于不专业。作用:这个参数主要作用是缓存innodb表的索引,数据,插入数据时的缓冲默认值:128M专用mysql服务器设置的大小:操作系统内存的70%80%最佳。设置方法:my.cnf文件innodb\_
Stella981 Stella981
3年前
PHP用Swoole实现爬虫(一)
基本概念网络爬虫网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。swoolePHP的异步、并行、高性能网络通信引擎,使用纯C语言编写,提供了PHP语
Stella981 Stella981
3年前
HBase & MongoDB
1.Mongodbbson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。2.Mongodb主键是“\_id”,主键上面可以不建索引,记录插入的顺序和存放的顺序一样,hbase的主键就是rowkey,可以是任意字符串(最大长度是64KB,实际应用中长度一般为1010
Wesley13 Wesley13
3年前
mysql实践:sql优化
\恢复内容开始设计表的时候1\.不同的表涉及同一个公共意义字段不要使用不同的数据类型(可能导致索引不可用,查询结果有偏差)2\.不要一张表放太多的数据  主表20~30个字段  其他表最好不超过20个3\.最好不要有为Null的列,原因:https://mp.weixin.qq.com/s/U4
M3E/OpenAi+vearch内容查重实践 | 京东云技术团队
一、实践背景介绍1、业务背景京东健康内容中台H2有一个目标就是需要替换两家CP内容(总体内容体量百万级),我们现在的逻辑是想按照PV热度优先高热去新生产和替换。替换后可以极大的节省cp内容引入的成本。第一步:这么多内容,我们的生产逻辑需要按照学科和索引归类
小白学大数据 小白学大数据
2个月前
图像自动化保存工具:Python脚本开发指南
引言在数字化时代,图像已成为信息传递的重要媒介。无论是社交媒体、新闻网站还是电子商务平台,图像的自动化处理和保存都是提升用户体验和工作效率的关键。本文将深入探讨如何使用Python脚本实现从百度图片等搜索引擎批量下载并保存图像文件的高级应用。技术背景百度图