捉虫大师 捉虫大师
4年前
Cobar提出的一种在分库场景下对Order By / Limit 的优化
搜索关注微信公众号"捉虫大师",后端技术分享,架构设计、性能优化、源码阅读、问题排查、踩坑实践。本文已收录https://github.com/lkxiaolou/lkxiaolou欢迎star。Cobar虽然是一款“古老”的数据库中间件,但目前不少公司仍然在用它,且它包含了不少有意思的算法和实现,今天就来分享Cobar提出的一种在分库场景下对
Wesley13 Wesley13
4年前
ML
011001Machinelearninginfographic图片解读机器学习的基本概念、五大流派与九种常见算法EN:http://usblogs.pwc.com/emergingtechnology/machinelearning101/
Stella981 Stella981
4年前
PointNet:深度学习在3D点云分类与分割上的应用
大家好!我是【AI菌】,一枚爱弹吉他的程序员。我热爱AI、热爱分享、热爱开源!这博客是我对学习的一点总结与思考。如果您也对深度学习、机器视觉、数据结构与算法、编程等感兴趣,可以关注我的动态,我们一起学习,一起进步~我的博客地址为:【AI菌】的博客(https://www.oschina.net/action/GoToLin
Stella981 Stella981
4年前
SparkSql学习1 —— 借助SQlite数据库分析2000万数据
总所周知,Spark在内存计算领域非常强势,是未来计算的方向。Spark支持类Sql的语法,方便我们对DataFrame的数据进行统计操作。但是,作为初学者,我们今天暂且不讨论Spark的用法。我给自己提出了一个有意思的思维游戏:Java里面的随机数算法真的是随机的吗?好,思路如下:1\.取样,利用Java代码随机生成2000万条01
Stella981 Stella981
4年前
Leetcode Lect4 二叉树中的分治法与遍历法
在这一章节的学习中,我们将要学习一个数据结构——二叉树(BinaryTree),和基于二叉树上的搜索算法。在二叉树的搜索中,我们主要使用了分治法(DivideConquer)来解决大部分的问题。之所以大部分二叉树的问题可以使用分治法,是因为二叉树这种数据结构,是一个天然就帮你做好了分治法中“分”这个步骤的结构。本章节的先修内容有:
Wesley13 Wesley13
4年前
2、初探 ZooKeeper 技术内幕
分布式一致性“分布式”是大型系统实现高性能、高可用所常用的架构手段,本章节将概述“分布式一致性”的基本内容,以作为ZAB算法阐述的基础。分布式一致性的基本概念数据库系统的基础理论中,“事务”必须符合ACID,即为:Atomicity原子性、Consistency一致性、Isolation隔离性、Durabilit
搭建平台吧 搭建平台吧
3年前
哈希竞猜搭建部署方案
首先,什么是哈希?哈希是将任意长的输入编程加密的固定长度输出的过程。哈希并不等同于加密方法,因为无法解密哈希值来获取原始数据。事实上哈希是一种单向加密函数。有了哈希函数,就可以将互联网上的数据以固定长度字符串的形式来保存。其中一种方法就是SHA256(安全哈希算法256位),SHA256是SHA1的后继者,SHA1的输出是160位的。哈希游戏的亮点:100%
流浪剑客 流浪剑客
2年前
Mac磁盘检测工具:DriveDx 「Mac」
是一款先进的驱动器运行状况诊断和监测工具,可以保护用户免于数据丢失和停机。该工具可以启动和控制SSD/HDD的诊断自检,主要目标是快速确定驱动器是否有故障。它能够追踪到更多即将发生故障的迹象,在评估各种驱动器的状态时,使用不同的启发式算法,取决于驱动器上的
大模型时代下的新一代广告系统
京东零售广告部承担着京东全站流量变现及营销效果提升的重要职责,广告研发部是京东最核心的技术部门,也是京东最主要的盈利来源之一。作为京东广告部的核心方向,我们基于京东海量的用户和商家数据,探索最前沿的深度学习等算法技术,创新并应用到业务实践中,赋能千万商家和
「零售数据通道」数据炼金术:千亿级流量资产湖仓架构转型
作者:京东零售陈美航0前言在流量领域的转化分析、搜索推广算法及AI等数据分析应用场景中,流量资产的质量直接影响到业务的监测和运营。作为流量资产的基石,流量数仓在应对快速变化和多样化的业务需求时,如何在提高效率、优化用户体验和控制成本方面做到最佳?本文将方案