Ustinain Ustinain
3年前
字符编码-带你走出Unicode与UTF-8的误区
字符编码集合1.ASCIIASCII(AmericanStandardCodeforInformationInterchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统,它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO646。在计算机中,所有的数据在存储和运算时都要使用二进
可莉 可莉
3年前
带你入门前端工程:微前端
什么是微服务?先看看维基百科(https://zh.wikipedia.org/wiki/%E5%BE%AE%E6%9C%8D%E5%8B%99)的定义:微服务(英语:Microservices)是一种软件架构风格,它是以专注于单一责任与功能的小型功能区块(SmallBuildingBlocks)为基础,利用模块化的方式组合出复杂的大型应用
Wesley13 Wesley13
3年前
JDK源代码以及200多部软件著作中出现的以连字符构造的1011个合成词
JDK源代码以及200多部软件著作中出现的以连字符构造的1011个合成词,单词后面跟的是词频。superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fgi
Stella981 Stella981
3年前
Python Scrapy 实战
PythonScrapy什么是爬虫?网络爬虫(英语:webcrawler),也叫网络蜘蛛(spider),是一种用来自动浏览万维网的网络机器人。其目的一般为编纂网络索引。Python爬虫在爬虫领域,Python几乎是霸主地位,将网络一切数据作为资源,通过自动化程序进行有针对性
Wesley13 Wesley13
3年前
JAVA NIO 字符集编码问题
字符集是非英语国家人最头疼的事情,尤其是样样有国标的中国。所以本朝的码农比洋大人程序员学各种技能都要多会一个技能点——应付编码问题。NIO我们同样需要面对编码解码问题。六、字符集:CharSet编码:字符串字节数组解码:字节数组字符串有哪些编码呢?@Testp
Wesley13 Wesley13
3年前
NLP常用语料集合
常用语料资源下面提供一些网上能下载到的中文的好语料,供研究人员学习使用。(1).中科院自动化所的中英文新闻语料库http://www.datatang.com/data/13484中文新闻分类语料库从凤凰、新浪、网易、腾讯等版面搜集。英语新闻分类语料库为Reuters21578的ModApte版本。(2).搜狗的中文新
Stella981 Stella981
3年前
GRE必备神器superword
superword(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fgithub.com%2Fysc%2Fsuperword)是一个Java实现的英文单词分析和辅助阅读开源项目,主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律和辅助阅读等等。支持最权威的2部中文词典和9
Stella981 Stella981
3年前
Python的垃圾回收机制
垃圾回收机制「垃圾回收(GC)」大家应该多多少少都了解过,什么是垃圾回收呢?垃圾回收GC的全拼是GarbageCollection,在维基百科的定义是:在计算机科学中,垃圾回收(英语:GarbageCollection,缩写为GC)是一种自动的内存管理机制。当一个电脑上的动态内存不再需要时,就应该予以释放,以让出内存,这种内存资源
四儿 四儿
1年前
人工智能应用:自然语言处理的含义及发展趋势
自然语言,是指汉语、英语、法语等人们日常使用的语言,是人类发展过程中形成的一种信息交流的方式,也是人类学习生活的重要工具。在整个人类历史上,以语言文字形式记载和流传的知识占到知识总量的80%以上。而自然语言处理(NaturalLanguageProcess
京东云开发者 京东云开发者
5个月前
大模型助力国际术语专业化,前后联动实现所见即所得
一、现状问题国际系统当前的多语言是国际业务的普遍特点,仅仅仓储管理系统,当前系统语言种类已经达到了九种,并且随着业务的开展还在不断的扩展,现有的国际系统支持的语言有中文、英语、日语、韩语、葡萄牙语、西班牙语、法语、德语、越南语。其中每个语言包的词条都有上万