Aidan075 Aidan075
4年前
我用python算出了同事的身份证号码!
为了一杯奶茶。事情的经过是这样的:我的同事李大伟最近出差去了。昨晚睡觉前翻了翻朋友圈,就跟他愉快地互怼交流了起来。估计是他想起了我朱小五从不打无把握之赌,后面就怂了。一杯奶茶嘛,也可以接受,像杰伦一样快乐就好啦。开工。先看看李大伟的朋友圈中发的图片。(该火车票来自其他平行世界,扫描可能发生奇怪现象)车票中暴
Chase620 Chase620
4年前
数据治理十步法
以下文章来源于谈数据,作者石秀峰1、找症状,明确目标任何企业实施数据治理都不是为了治理数据而治理数据,其背后都是管理和业务目标的驱动。企业中普遍存在的数据质量问题有:数据不一致、数据重复、数据不准确、数据不完整、数据关系混乱、数据不及时等。(https://imghelloworld.osscnbeijing.aliyuncs.c
Stella981 Stella981
3年前
Nebula Graph 在大规模数据量级下的实践和定制化开发
!图数据库在微信的应用(https://wwwcdn.nebulagraph.com.cn/nebulablog/图数据库在微信的应用.png)本文作者系微信技术专家李本利首发于NebulaGraph官方博客:https://nebulagraph.com.cn/posts/nebulagraphforsocial
Stella981 Stella981
3年前
Go Dumpling! 让导出数据更稳定
作者:李淳竹(lichunzhu),TiDB研发工程师。MigrateSIGCommunity,主要涵盖TiDB数据处理工具,包含TiDB数据备份/导入导出,TiDB数据变更捕获,其他数据库数据迁移至TiDB等。前言Dumpling(https://www.oschina.net/action/GoTo
Stella981 Stella981
3年前
K8s 1.14 发布了,Release Note 该怎么读?
本文由张磊、心贵、临石、徙远、衷源、浔鸣等同学联合撰写。Kubernetes1.14.0Release已经于3月25日正式发布。相信你也已经注意到,相比于1.13和1.12版本,这次发布包含的重要变非常多,其对应的 ReleaseNote 的篇幅长度也创下了“新高”。面对这样一份“海量信息”的ReleaseNote,我们该如何从这份
基于运营商数据的用户关系模型建立示例
本文分享自天翼云开发者社区《》,作者:石泽涛从社交的角度来看,一种典型的用户关系网络即交往圈。一个用户的交往圈定义为“与用户在一段时间内存在双向联系的所有个体”。根据不同社会群体性质,交往圈又可以分为家庭圈、工作圈、密友圈等。基于运营商数据,可识别的用户之
ElasticSearch必知必会-进阶篇
京东物流:康睿姚再毅李振刘斌王北永说明:以下全部均基于elasticsearch8.1版本一.跨集群检索\ccr官网文档地址:https://www.elastic.co/guide/en/elasticsearch/reference/8.1/modul
京东云开发者 京东云开发者
9个月前
文盘rust--使用 Rust 构建RAG
作者:京东科技贾世闻RAG(RetrievalAugmentedGeneration)技术在AI生态系统中扮演着至关重要的角色,特别是在提升大型语言模型(LLMs)的准确性和应用范围方面。RAG通过结合检索技术与LLM提示,从各种数据源检索相关信息,并将其
京东云开发者 京东云开发者
6个月前
Hive引擎底层初探
作者:京东物流沈世莹1、什么是HiveHive是一个基于Hadoop的数据仓库工具,用于处理和分析大规模结构化数据。Hive提供了类似SQL的查询语言(HiveQL),使得熟悉SQL的用户能够查询数据。Hive将SQL查询转换为MapReduce任务,以在
商场商圈潜客挖掘模型
本文分享自天翼云开发者社区《》,作者:石泽涛超速数据清洗算法:1)针对同一用户,顺次选取两条记录(第n条、第n1条),根据第n条记录的停留时间TSn(两停留点时间差),以及与第n1条记录的距离Dn(两记录点经纬度距离),计算第n条记录的穿越速度(Dn/