黎明之道 黎明之道
4年前
Pandas统计分析基础(基础篇,新手必看)
Pandas统计分析基础Pandas(PythonDataAnalysisLibrary)是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具,可以说Pandas是使得Pyth
Stella981 Stella981
3年前
GreenPlum tidb 性能比较
主要的需求  针对大体量表的OLAP统计查询,需要找到一个稳定,高性能的大数据数据库,具体使用  数据可以实时的写入和查询,并发的tps不是很高建立数据仓库,模式上主要采用星星模型、雪花模型,或者宽表前端展示分为3类 saiku、granafa、c代码开发数据体量:事实表在35亿、维度表大的在500
Stella981 Stella981
3年前
MapReduce统计单词
一、HDFS个人理解      HDFS是个文件系统,只不过加了个分布式作为文件系统的前缀而已,大概的结构就像LINUX系统。文件大的一个电脑存储不下,怎办?那就想办法存储到不同的机子上呗,于是HDFS就应用而生了。众所周知,文件在硬盘上是以文件块的形式存储。什么句柄啊,真心不懂,只能感知,没人能明白0和1,当然也没必要。二、Map个人理解
Wesley13 Wesley13
3年前
mysql统计
时间转任意格式DATE_FORMATselectDATE_FORMAT(NOW(),'%m%d%Y');unix_timestamp时间转时间戳selectunix_timestamp(now());from_unixtime时间戳转时间
Wesley13 Wesley13
3年前
AI金融知识自学偏量化方向
前提:统计学习(统计分析)和机器学习之间的区别金融公司采用机器学习技术及招募相关人才要求第一个问题:  机器学习和统计学都是数据科学的一部分。机器学习中的学习一词表示算法依赖于一些数据(被用作训练集),来调整模型或算法的参数。这包含了许多的技术,比如回归、朴素贝叶斯或监督聚类。但不是所有的技术都适合机器学习。例如有一种统计和数
Wesley13 Wesley13
3年前
Uber 业务预测系统实践
Forecastingisubiquitous如何利用预测来构建更好的产品和服务定量预测方法可分为:基于模型(modelbased)或因果关系,统计方法(statisticalmethods)和机器学习方法(machinelearningapproaches)Forecasti
Wesley13 Wesley13
3年前
Java大数统计
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid1316(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Facm.hdu.edu.cn%2Fshowproblem.php%3Fpid%3D1316)题目描述:!(https://o
专注IP定位 专注IP定位
1年前
新闻网站封锁AI爬虫 AI与新闻媒体博弈继续
随着ChatGPT等新兴AI模型的兴起,它们所依赖的网络爬虫正面临来自全球主流新闻网站的大规模封锁。RichardFletcher博士团队对十个国家主流新闻网站的统计发现,到2023年底,48%的网站屏蔽了OpenAI的爬虫,24%屏蔽了Google的爬虫
yu yu
53分钟前
API聚合与协作新升级,ModelGate新版本重点功能实践
最近在对接AI服务API时,发现ModelGate平台上线了新版,其聚合模型入口和用量统计的能力愈发完善。对于有多大模型需求、API频繁切换、团队灵活分工的场景,这次更新感受比较深,整理如下