Wesley13 Wesley13
3年前
java抓取豆瓣电影数据,分析电影评分,生成统计图表
    最近花时间学习了一下使用Java获取网站数据的方法,自己也亲自动手实践一下;共获取3000数据,去除重复的数据剩余2000,使用JFreeChart根据电影评分做出几张简单的统计图。电影评分统计图:JFreeChart生成图片!(https://static.
Stella981 Stella981
3年前
ElasticSearch 使用不同表结构存储时间序列数据的查询效率分析
这里我们使用和之前完全相同的测试数据,来测试elasticsearch存储时间序列的表结构选择问题。一个点一个doc的表结构同样我们以最简单的表结构开始。在elasticsearch中,先要创建index,然后index下有mapping。所谓的mapping就是表结构的概念。建表的配置如下:settings
Stella981 Stella981
3年前
ElasticSearch入坑指南之概述及安装
<p恢复内容开始</pElasticSearch入坑指南之概述及安装了解ElasticSearchElasticSearch(简称ES)基于Lucene的分布式全文检索引擎。使用ES可以实现近实时的存储、检索及海量数据的分析。ES可以应用于以下场景
Stella981 Stella981
3年前
Pyhon数据分析20——matplotlib可视化(二)之柱状图
atplotlib绘制柱状图柱状图(barchart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。准备importnumpyasnpimport
Stella981 Stella981
3年前
Mybatis数据源结构解析之连接池
对于ORM框架而言,数据源的组织是一个非常重要的一部分,这直接影响到框架的性能问题。本文将通过对MyBatis框架的数据源结构进行详尽的分析,找出什么时候创建Connection,并且深入解析MyBatis的连接池。本章的组织结构:零、什么是连接池和线程池一、MyBatis数据源DataSo
Wesley13 Wesley13
3年前
AI研习丨针对长尾数据分布的深度视觉识别
  !(http://dingyue.ws.126.net/2020/0812/714a3e94j00qey3su000xd000q100dup.jpg)  摘要  本文介绍了目前国内外关于长尾数据分布下深度视觉识别的研究进展,主要从常用数据集及应用、经典机器学习解决方案和深度学习解决方案三个维度进行梳理和分析,并针对长尾数据分布的
Wesley13 Wesley13
3年前
Java虚拟机(六):JVM调优工具
工具做为图形化界面来展示更能直观的发现问题,另一方面一些耗费性能的分析(dump文件分析)一般也不会在生产直接分析,往往dump下来的文件达1G左右,人工分析效率较低,因此利用工具来分析jvm相关问题,长长可以到达事半功倍的效果来。jvm监控分析工具一般分为两类,一种是jdk自带的工具,一种是第三方的分析工具。jdk自带工具一般在jdkbin目录下面,
Stella981 Stella981
3年前
LVS+Keepalived负载均衡实践与心得补遗
一.实践背景,分析:公司研发的业务系统某个功能频繁出现数据库Mysql性能问题,导致系统使用卡顿,响应慢,且数据库所在服务器CPU负载居高不下,影响其他项目系统的正常数据库访问和使用。除去研发人员优化sql工作外,作为运维人员可以尝试对当前服务架构改造,目前架构大致如下:!(https://static.oschina.net/uploads/i
Stella981 Stella981
3年前
CoolHash数据库的产品宣言(Fourinone4.0版)
Fourinone4.0版新特性:一个高性能的数据库引擎CoolHash(酷哈嘻)一、前言:如何写一个数据库如果将操作系统和业务应用之间的软件都统称中间件的话,那么最重要的软件无疑是数据库,它比web应用服务器市场更大,几乎所有的业务系统都需要数据库,所有的企业都会购买数据库。无论是早期的商业智能也好,数据分析挖掘也好,近年的分布式
从爬取到分析:Faraday爬取Amazon音频后的数据处理
什么是Faraday?Faraday是一个简单、灵活的高级爬虫框架,支持多种编程语言。它提供了一套丰富的API,允许开发者快速构建复杂的爬虫应用。Faraday的主要特点包括:●模块化设计:易于扩展和自定义。●多语言支持:支持Python、Ruby、Nod