推荐
专栏
教程
课程
飞鹅
本次共找到8770条
数据字典
相关的信息
小白学大数据
•
2年前
python使用aiohttp通过设置代理爬取基金数据
说到python爬虫,我们就会想到它那强大的库,很多新手小白在选择框架的时候都会想到使用Scrapy,但是仅仅停留在会使用的阶段。在实际爬虫过程中遇到反爬机制是再常见不过的,今天为了增加对爬虫机制的理解,我们就通过手动实现多线程的爬虫过程,同时引入IP代理
Python进阶者
•
2年前
盘点一个Pandas数据处理的问题
大家好,我是皮皮。一、前言前几天在Python白银群【王者级混子】问了一个Pandas处理的问题,这里拿出来给大家分享下。大佬们,我有两个问题:问题1:当我使用红框里代码想将999的数字全部赋值np.nan之后,结果发现行内所有数据没有发生变化,但是用黄框
javalover123
•
2年前
开源数据集成平台SeaTunnel:MySQL实时同步到es
免费支持MySQL实时同步到ElasticSearch的工具很少,ApacheSeaTunnel是一个高性能开源大数据集成工具,提供灵活易用、易扩展并支持千亿级数据集成的解决方案,已经在B站、腾讯云、字节等数百家公司使用。
小白学大数据
•
2年前
高并发海量数据爬取,哪种语言更适合?
今天我要和大家聊一聊一个让程序员们头疼不已的话题——高并发海量数据爬取。在这个信息爆炸的时代,我们需要从互联网上抓取大量的数据,便于进行分析、挖掘和应用。但是面对庞大的数据量和复杂的网络环境,我们应该选择哪种编程语言来完成这项任务呢?让我们一起来探讨一下吧
流浪剑客
•
1年前
Macos文件夹数据同步工具:Sync Folders Pro
是一款功能强大的文件夹同步工具,旨在帮助用户在Mac计算机和移动设备之间创建双向同步。这款软件支持各种文件系统和设备,如iPhone,iPad,iPod,Android等。通过这款软件,用户可以轻松地在不同设备之间传输文件,保持数据的一致性。SyncFol
数据堂
•
1年前
大模型数据集:探索新维度,引领AI变革
一、引言在人工智能(AI)的快速发展中,大型预训练模型如GPT、BERT等已经取得了令人瞩目的成果。这些大模型的背后,离不开规模庞大、质量优良的数据集的支撑。本文将从不同的角度来探讨大模型数据集的新维度,以及它们如何引领AI的变革。二、大模型数据集的新维度
京东云开发者
•
1年前
大数据平台Bug Bash大扫除最佳实践
一、背景随着越来越多的"新人"在日常工作以及大促备战中担当大任,我们发现仅了解自身系统业务已不能满足日常系统开发运维需求。为此,大数据平台部门组织了一次BugBash活动,既能提升自己对兄弟产品的理解和使用,又能促使自家产品功能日趋完善。今天来给大家分享一
京东云开发者
•
2年前
Elasticsearch与Clickhouse数据存储对比 | 京东云技术团队
京喜达技术部在社区团购场景下采用JDQFlinkElasticsearch架构来打造实时数据报表。随着业务的发展Elasticsearch开始暴露出一些弊端,不适合大批量的数据查询,高频次分页导出导致宕机、存储成本较高。
京东云开发者
•
1年前
千万级数据深分页查询SQL性能优化实践
一、系统介绍和问题描述如何在Mysql中实现上亿数据的遍历查询?先来介绍一下系统主角:关注系统,主要是维护京东用户和业务对象之前的关注关系;并对外提供各种关系查询,比如查询用户的关注商品或店铺列表,查询用户是否关注了某个商品或店铺等。但是最近接到了一个新需
小万哥
•
2年前
Redis数据结构:高频面试题及解析
概述Redis是速度非常快的非关系型(NoSQL)内存键值数据库,可以存储键和五种不同类型的值之间的映射。键的类型只能为字符串,值支持五种数据类型:字符串、列表、集合、散列表、有序集合。Redis支持很多特性,例如将内存中的数据持久化到硬盘中,使用复制来扩
1
•••
239
240
241
•••
877