Karen110 Karen110
4年前
数据挖掘建模过程全公开
「数仓宝贝库」,带你学数据!导读:本文以餐饮行业的数据挖掘应用为例,详细介绍数据挖掘的建模过程。数据挖掘的基本任务包括利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。对餐饮企业而言,数据挖掘的基本任务是从餐饮企业采集各类菜品销量、成本单价、会员消费、促销活动等内部数据,
其他专业领域的AWS认证有哪些?
除了云从业者、架构师、运维人员、开发人员四种身份外,还为其他专业领域的人提供认证考试。AWS认证的高级网络适合执行复杂网络任务的个人。主要从网络设计/规划的角度,考生使用AWS设计、开发和部署高可用的网络架构,使用执行工具自动执行AWS组网任务。其中很大一部分是在学习AWS直连、VPN、弹性负载均衡器、VPC、BGP路由协议等网络的知识。这次考试的难度仅次于
Wesley13 Wesley13
3年前
Java基于opencv实现图像数字识别(一)
Java基于opencv实现图像数字识别(一)最近分到了一个任务,要做数字识别,我分配到的任务是把数字一个个的分开;当时一脸懵逼,直接百度java如何分割图片中的数字,然后就百度到了用BufferedImage这个类进行操作;尝试着做了一下,做到灰度化,和二值化就做不下去了;然后几乎就没有啥java的资料了,最多的好像都是c,惹不起、惹不起.
Stella981 Stella981
3年前
Airflow笔记
1\.依赖MySqlOperator的数据库交互通过MySQLdb模块来实现,使用前需要安装相关依赖:pipinstallapacheairflowmysql2\.使用使用MySqlOperator执行sql任务的一个简单例子:fromairflowimp
Stella981 Stella981
3年前
Hive
解释:1、JVM重用是hadoop调优参数的内容,对hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或者task特别多的场景,这类场景大多数执行时间都很短。hadoop默认配置是使用派生JVM来执行map和reduce任务的,这是jvm的启动过程可能会造成相当大的开销,尤其是执行的job包含有成千上万个task任务的情况。JVM重用可
Stella981 Stella981
3年前
Spark如何进行动态资源分配
一、操作场景对于Spark应用来说,资源是影响Spark应用执行效率的一个重要因素。当一个长期运行的服务,若分配给它多个Executor,可是却没有任何任务分配给它,而此时有其他的应用却资源紧张,这就造成了很大的资源浪费和资源不合理的调度。动态资源调度就是为了解决这种场景,根据当前应用任务的负载情况,实时的增减Executor个数,从而
Stella981 Stella981
3年前
JavaScript自适应调整文字大小
JavaScript自适应调整文字大小今天有个任务,发现页面上的数字由于太长而与其他数字重叠了。这个数字还不能像文字那样只显示一部分,必须全部显示。想了一些办法都不行,最后把超过1000变成1K,大于K改成M,这样办法都行,还是长呀。注意:我这个任务不是在不同屏幕下文字大小调整,而是同一种屏幕下调整字体大小。
Stella981 Stella981
3年前
Netty工具类HashedWheelTimer源码走读(二)
接上一篇( http://my.oschina.net/haogrgr/blog/489320(http://my.oschina.net/haogrgr/blog/489320) )6\.HashedWheelTimeout源码走读.//任务的包装类, 链表结构, 负责保存deadline, 轮数, 等//继承M
Stella981 Stella981
3年前
Docker与自动化测试及其测试实践
<h2Docker与自动化测试</h2<p对于重复枯燥的手动测试任务,可以考虑将其进行自动化改造。自动化的成本在于自动化程序的编写和维护,而收益在于节省了手动执行用例的时间。简而言之,如果收益大于成本,测试任务就有价值自动化,否则受益的只是测试人员的自动化技能得到了提升。利用Docker的快速部署、环境共享等特性,可以大大减少自动化的成本,使很
什么是网络爬虫?
什么是网络爬虫网络爬虫是一种在Internet上运行自动化任务的软件应用程序。与人类互联网活动相比,网络爬虫运行的任务通常很简单,并且执行速度要快得多。有些机器人是合法的——例如,Googlebot是Google用来抓取互联网并将其编入索引以进行搜索的应用程序。其他机器人是恶意的——例如,用于自动扫描网站以查找软件漏洞并执行简单攻击模式的机器人。