添砖java的啾 添砖java的啾
3年前
distinct效率更高还是group by效率更高?
目录00结论01distinct的使用02groupby的使用03distinct和groupby原理04推荐groupby的原因00结论先说大致的结论(完整结论在文末):在语义相同,有索引的情况下groupby和distinct都能使用索引,效率相同。在语义相同,无索引的情况下:distinct效率高于groupby。原因是di
Wesley13 Wesley13
3年前
Java搜索使用引擎
1、Java全文搜索引擎框架Lucene毫无疑问,Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene为开发人员提供了相当完整的工具包,可以非常方便地实现强大的全文检索功能。下面有几款搜索引擎框架也是基于Lucene实现的。官方网站:http:
Wesley13 Wesley13
3年前
Java多线程实现同步——wait()和notify()实现
要求:子线程循环5次,接着主线程循环10次,接着又回到子线程。如此循环50次。实现以上要求的时候,除了直白的面向过程的实现,可以考虑面向对象的写法。根据高内聚的原装,将子线程和主线程的操作都封装一起。通过wait()和notify()进行同步。class Business {private boolean should
Stella981 Stella981
3年前
Elasticsearch索引监控之Indices Segments API与Indices Shard Stores
本文将继续介绍elasticsearch索引监控之Indicessegments与IndicesShardstoresapi。IndicesSegments提供Lucene索引(分片级别)使用的segments(段信息)。其对应的示例代码如下:1public static final void test_Indic
Wesley13 Wesley13
3年前
KNN分类算法原理分析及代码实现
1、分类与聚类的概念与区别分类:是从一组已知的训练样本中发现分类模型,并且使用这个分类模型来预测待分类样本。目前常用的分类算法主要有:朴素贝叶斯分类算法(NaïveBayes)、支持向量机分类算法(SupportVectorMachines)、KNN最近邻算法(kNearestNeighbors)、神经网络算法(NNet)以及决策树(De
Wesley13 Wesley13
3年前
KgE金刚企业网站管理系统是广州聚龙软件为国内中小企业开发的一款企业网站管理系统,KgE采用可
!(http://static.oschina.net/uploads/img/201407/23235637_VT1r.jpg"点击查看原始大小图片")KgE金刚企业网站管理系统是广州聚龙软件为国内中小企业开发的一款企业网站管理系统,KgE采用可视化的标签模型,可在Dreamvear等网页编辑下可视化编辑,KgE使用javaeemsyqlyuij
Wesley13 Wesley13
3年前
sql 优化建议
1、查询语句,尽量避免查询全部,避免写select\fromtable,查哪个写哪个,提高效率; 更新语句,能update具体字段的,不要update所有字段,提升效率。 要尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引 2、一张表中添加索引太少不行,索引的添加可以让查询
3A网络 3A网络
2年前
查看Windows磁盘分区块大小的若干种办法
查看Windows磁盘分区块大小的若干种办法背景:在3A云服务器上扩容磁盘,随着业务增加不断扩容磁盘,后来发现扩容超过16T就报错,报的错莫名其妙。我在想,我是单机,不是群集啊,咋回事?我切换到英文界面看到原话,原来微软中文版是把clusters当"群集"翻译了,实际上clusters还有"簇"的意思,在磁盘方面,clustersize其实就是units
ElasticSearch集群灾难:别放弃,也许能再抢救一下 | 京东云技术团队
1前言Elasticsearch作为一个分布式搜索引擎,自身是高可用的;但也架不住一些特殊情况的发生,如:集群超过半数的master节点丢失,ES的节点无法形成一个集群,进而导致集群不可用;索引shard的文件损坏,分片无法被正常恢复,进而导致索引无法正常