Stella981 Stella981
3年前
Hadoop综合大作业
一、用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。1.启动hadoop!(https://oscimg.oschina.net/oscnet/e6b2225f65c582affaeaf71dd10f801fb98.bmp)2.Hdfs上创建文件夹并查看 !(https://oscimg.oschi
Stella981 Stella981
3年前
Jieba分词Python简单实现
上一章分享了IKAnalyzer中文分词及词频统计基于Hadoop的MapReducer框架Java实现。这次将与大家分享Jieba中文分词Python简单实现,由于Jieba分词是基于词频最大切分组合,所以不用做词频统计,可以直接得到其关键字。1、安装jieba安装方式可以查看博主的中文分词工具(http://my.oschina.net/ea
Stella981 Stella981
3年前
C# 将html实体编码转换到正常字符 & #40;格式
获取到html实体编码字符后,通过正则获取其中的html实体编码,再统一强制转换到正常字符; 代码如下:stringstrformatitem.value7;//将html实体编码转换到正常字符stringregx"(?<(&)).?(
Wesley13 Wesley13
3年前
Java 多线程,线程池,
1\.创建线程池的方法之三://对于每个任务,如果有空闲的线程可用,立即让他执行任务,//没有空闲的线程则创建一个线程。ExecutorServicepoolExecutors.newCachedThreadPool();//固定大小的线程池,任务数空闲线程数,得不到服务的任务
Wesley13 Wesley13
3年前
MySQL 默认字符集
MySQL默认的字符集是latin1,通常跟我们的中文会打架,导致读写异常或乱码,而我们需要的字符集是utf8.MySQL字符集的查看mysqlshowvariableslike'%character%';
Stella981 Stella981
3年前
RedisTemplate操作命令
字符串操作redis储存的字符串都是以二进制的形式存在!字符串类型的内部编码有3种:int:8个字节的长整型。embstr:小于等于39个字节的字符串。raw:大于39个字节的字符串。Redis会根据当前值的类型和长度决定使用哪种内部编码实现。命令操作返回值set(K
Wesley13 Wesley13
3年前
JAVA
1.StringBufferStringBuffer是一个字符串容器,它允许字符串改变长度。它是线程安全的StringBuffersbnewStringBuffer();//1.字符串增改sb.append("panda").append("&").append("laoli");/
如何在服务端发送 SDK 提供的自定义消息
根据存储策略来设置对应的objectNameRC:IWNormalMsg:客户端存储,支持离线消息机制,且存入服务端历史消息,计入未读消息数RC:IWCmdMsg:客户端不存储,支持离线消息机制,不计入未读消息数RC:IWStatusMsg:客户端不存储,
绣鸾 绣鸾
1年前
IBM SPSS Statistics 27 Mac(统计分析软件)
是一款由IBM公司精心打造的专业统计分析软件,它能够提供统计分析、数据挖掘、预测建模产品及解决方案。主要被用于通信、医疗、银行、证券、保险、制造业、商业、市场研究、科研教育等多个领域和行业,用于推动企业走向认知商业。软件具有多种关键功能界面,可以让使用者灵
小万哥 小万哥
1年前
C# 字符串操作指南:长度、连接、插值、特殊字符和实用方法
字符串用于存储文本。一个字符串变量包含由双引号括起的字符集合示例:csharp//创建一个string类型的变量并赋予一个值stringgreeting"Hello";如果需要,一个字符串变量可以包含多个单词:示例:csharpstringgreeting