Wesley13 Wesley13
3年前
java实现根据起点终点和日期查询去哪儿网的火车车次和火车站点信息
本文章为原创文章,转载请注明,欢迎评论和改正。一,分析  之前所用的直接通过HTML中的元素值来爬取一些网页上的数据,但是一些比较敏感的数据,很多正规网站都是通过json数据存储,这些数据通过HTML元素是爬取不到的,所以只能通过json数据的api接口来爬取数据。二,网站处理  1,打开去哪儿网的网站https://train.qu
序列数据和文本的深度学习
序列数据和文本的深度学习用于构建深度学习模型的不同文本数据表示法:理解递归神经网络及其不同实现,例如长短期记忆网络(LSTM)和门控循环单元(GatedRecurrentUnit,GRU),它们为大多数深度学习模型提供文本和序列化数据;为序列化数据使用一维卷积。可以使用RNN构建的一些应用程序如下所示。文档分类器:识别推文或评论的情感,对新闻文章
Aidan075 Aidan075
4年前
用python爬取3万多条评论,看韩国人如何评价韩国电影《寄生虫》?
↑关注星标  有趣的不像个技术号每晚九点,我们准时相约  大家好,我是朱小五今天给大家带来一个关于电影的数据分析文章。别走啊,这次不是豆瓣,也不是猫眼真的今天分析的电影是韩国电影《寄生虫》。它是由韩国导演奉俊昊自编自导的影片,一举拿下最佳影片、最佳导演、最佳原创剧本和最佳国际电影四座奥斯卡奖杯,创造历史成为奥斯卡史上首部
梦想橡皮擦 梦想橡皮擦
4年前
3. 无转折不编程,滚雪球学 Python
滚雪球学Python,目标就是让Python学起来之后,越滚越大。本系列文章将在2021年春节前完成,欢迎关注,点赞,评论梦想橡皮擦三、无转折不编程如果程序都是从上到下按照顺序执行,那程序会缺少很多的趣味与转折性,并且会导致程序的编写枯燥无味,针对这种情况,为了实现某些效果,需要代码实现转折,这种转折在程序中就是流程控制
Stella981 Stella981
3年前
Raft 算法在分布式存储系统 Curve 中的实践
作为网易数帆开源的高性能、高可用、高可靠的新一代分布式存储系统,Curve对于多副本数据同步、负载均衡、容灾恢复方面都有较高的要求。网易数帆存储团队选用Raft算法作为Curve底层一致性协议,并基于Raft的特性,实现了异常情况下的数据迁移和自动恢复。本文首先简要介绍一下Raft算法的一些基本概念和术语,再详细介绍其在Curve中的实践。Raft一致性
Stella981 Stella981
3年前
Android模拟器不能上网的解决方法
我原来一直不用Android的模拟器,因为这东西的多年前的印象真的是很糟糕——启动半个小时,不支持OpenGL。即使后来有了x86镜像,在HAXM的支持下快的飞起,也不想用,因为NDK还要编译x86的。那个时候我一直用网易的MuMu模拟器——只需要编译Armv7的就行了。再后来就是网易的全部MacApp不知道抽了什么风,疯狂写log,直到写满硬盘为止,我就
Wesley13 Wesley13
3年前
OLAP数仓入门:基础篇
文章作者:温正湖网易易数内容来源:数据库内核@知乎专栏导读:近七年在网易杭研一直从事数据库相关的开发工作,主要是MySQL和MongoDB这两种数据库,去年开始涉及图数据库Neo4J。上述几种,都可认为是OLTP类数据处理,由于工作需要,需要调研学习OLAP技术和相关系统,本文开始逐步进行第一轮总结,很多东西还只是片面理解,权当做个笔记。
Stella981 Stella981
3年前
Elasticsearch – 二次打分处理方案
有时ES默认的评分规则并不能满足需求,时长会有在old\_source的基础上根据某字段的值需要重新打分的需求场景,比如在相关度相差不大的情况下时间越进越靠前,或者评论数越多越靠前等等。此时需要重新打分。对此可以通过两种方式法来处理:<!more1、在创建索引的时候提高文档的权重,根据因素字段值来给文档设置boost.这种方式在lucene
机器学习入门指南
资料获取地址见文末或评论!一、预备知识微积分(偏导数、梯度等等)概率论与数理统计(例如极大似然估计、中央极限定理、大数法则等等)最优化方法(比如梯度下降、牛顿拉普什方法、变分法(欧拉拉格朗日方程)、凸优化等等)二、路线1(基于普通最小二乘法的)简单线性回归线性回归中的新进展(岭回归和LASSO回归)(此处可以插入Bagging和AdaBoost的内容