Wesley13 Wesley13
3年前
java B2B2C多用户商城系统
需求分析:在javashop电商系统中,商品数据是存在elasticsearch中,使用ik分词器分词,ik分词器的词库内置了2万多个。但在实际运维过程中,因为商品的个性化,词库不一定可以满足,为了搜索引擎分词(关键词)更加准确,要求可对分词词库进行手工维护。思路:IK自定义词库是支持远程热加载的。先看下官方的说明:
CuterCorley CuterCorley
3年前
Django+Vue开发生鲜电商平台之2.开发环境搭建
一、PyCharm的安装和简单使用由于开发的主要后端语言是Python,因此选择PyCharm作为主要的开发工具。PyCharm可以直接在搜索引擎中直接搜索官网下载,在每种平台均有社区版和专业版两种。社区版免费但功能有限,适合初学者;专业版功能齐全,适合专业开发者。开发者可以根据需要自行选择。Windows下安装PyCharm与安装普通软件类似。
AIGC的隐私安全问题及隐私保护技术
微软成为ChatGPT母公司OpenAI的合作伙伴,并确认投资百亿美元。同时,微软正计划将OpenAI的技术整合到其产品中,包括Bing搜索引擎和其他软件,以增强它们的能力。然而,据Insider报道,微软却警告其员工不要与人工智能(AI)聊天机器人(ChatGPT)共享敏感数据:“请不要将敏感数据发送到OpenAI端点,因为他们可能会用它来训练未来的模型”。
Stella981 Stella981
3年前
Clickhouse替代ES后,日志查询速度提升了38倍!
​作者介绍GavinZhu,携程软件技术专家,负责监控系统运维开发、ES系统运维及Clickhouse技术应用推广及运维工作。ElasticSearch是一种基于Lucene的分布式全文搜索引擎,携程用ES处理日志,目前服务器规模500,日均日志接入量大约200TB。随着日志量不断增加,一些问题逐渐暴露出来:一方面ES服务器越来越多,投入
Wesley13 Wesley13
3年前
Oracle 分析及动态采样
 之前在说OracleOptimizer中的CBO时讲到,当表没有做分析的时候,Oracle会使用动态采样来收集统计信息。获取准确的段对象(表,表分区,索引等)的分析数据,是CBO存在的基石,CBO的机制就是收集尽可能多的对象信息和系统信息,通过对这些信息进行计算,分析,评估,最终得出一个成本最低的执行计划。所以对于CBO,数据段的分析就非常重要
Stella981 Stella981
3年前
Google软件测试之道 pdf下载
引领一代风骚的明星企业google,推出过很多成功优秀的产品,搜索引擎不用说,譬如Gmail,Chrome,GoogleDoc,G等等等等,也推出过很多短命的产品,譬如GoogleWave等等。作为一个时常需要推出新产品,但又要根据用户反馈而做进一步选择继续还是放弃的企业,作为一个需要让产品稳定健壮以保持客户满意度的明星企业,该如何
Stella981 Stella981
3年前
Google IP库地址
Google地址库Google提供了大量基于互联网的产品与服务,为全世界访问量最高的站点,Google搜索集成了全球范围的信息,是互联网上规模最大、使用率最高、影响最广泛的搜索引擎,使人人皆可访问并从中受益。但是,2014年6月起,Google在中国大陆突然无法正常访问,下面是Google在全球主要国家的IP地址列表,总一个可以打开。
Stella981 Stella981
3年前
List、Map、Set三个接口存取元素时,各有什么特点
List接口以特定索引来存取元素,可以有重复元素Set接口不可以存放重复元素(使用equals方法区分是否重复)Map接口保存的是键值对(keyvaluepair)映射,映射关系可以是一对一或者多对一(key唯一)Set和Map容器都有基于哈希存储和排序树的两种实现版本。基于哈希存储的版本的实现理论存取时间复杂度是O(1),而基于排序树版本的
Wesley13 Wesley13
3年前
InnoDB数据页什么时候合并
1\.为什么要合并数据页2\.什么时候合并数据页2.1准备测试环境2.2找到两个相邻页2.3试探性逐步删除数据,接近阈值2.4再次只删除一条记录,验证是否合并3\.其他补充说明3.1除了表级可以设置外,单个索引也可以设置合并阈值3.2页合并状态监控3.3如何适当调整阈值设置延伸阅读当低于设定的阈值时就进行合并在本文开始
Stella981 Stella981
3年前
Elasticsearch – 二次打分处理方案
有时ES默认的评分规则并不能满足需求,时长会有在old\_source的基础上根据某字段的值需要重新打分的需求场景,比如在相关度相差不大的情况下时间越进越靠前,或者评论数越多越靠前等等。此时需要重新打分。对此可以通过两种方式法来处理:<!more1、在创建索引的时候提高文档的权重,根据因素字段值来给文档设置boost.这种方式在lucene