Wesley13 Wesley13
3年前
NLP好文章
最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。论文、博客1.       Google在研究博客中总结了他们2011年的精彩论文《ExcellentPap
Stella981 Stella981
3年前
HanLP分词工具中的ViterbiSegment分词流程
本篇文章将重点讲解HanLP的ViterbiSegment分词器类,而不涉及感知机和条件随机场分词器,也不涉及基于字的分词器。因为这些分词器都不是我们在实践中常用的,而且ViterbiSegment也是作者直接封装到HanLP类中的分词器,作者也推荐使用该分词器,同时文本分类包以及其他一些自然语言处理任务包中的分词器也都间接使用了ViterbiSegment
Wesley13 Wesley13
3年前
AAAI 2020「自然语言处理(NLP)」【哈尔滨工业大学】多任务自监督学习的文本顺滑
喜欢我们,点击上方AINLPer,关注一下,极品干货即刻送达!转载:哈工大SCIR各位小伙伴,最近全国各地陆续发现新型冠状病毒感染的肺炎疫情,又赶上春节,大家出门请注意戴口罩,做好防护~~引言现有的不流利检测方法大多严重依赖人工标注的数据,而在实践中获取这些数据的成本很高。为了解决训练数据的瓶颈,本文研究了
E小媛同学 E小媛同学
1年前
智能文本纠错API的崭露头角:革命性的写作辅助工具
智能文本纠错API是一种基于人工智能技术的工具,旨在自动检测和纠正文本中的拼写错误、语法错误和用词不当等问题。它利用自然语言处理(NLP)算法,能够理解上下文并提供高质量的建议,以改进文本的质量和流畅性。这些API可以集成到各种应用程序和平台中,为用户提供实时的文本纠错服务。
数据堂 数据堂
1年前
大模型数据集:突破边界,探索未来
一、引言随着人工智能技术的快速发展,大型预训练模型如GPT4、BERT等在自然语言处理领域取得了显著的成功。这些大模型背后的关键之一是庞大的数据集,为模型提供了丰富的知识和信息。本文将探讨大模型数据集的突破边界以及未来发展趋势。二、大模型数据集的突破边界数
胡赤儿 胡赤儿
1年前
AI主播:未来媒体的颠覆者
人工智能技术的迅猛发展正在为各行各业带来革命性的变革,其中包括传媒领域。AI主播作为传统主播的新兴形式,已经逐渐引起了人们的关注。它不仅能够准确地模仿人类主播的语音和表情,还能够借助深度学习和自然语言处理技术,自动生成新闻报道、解说比赛以及进行其他形式的节
北邮在校生 北邮在校生
11个月前
简单几步把ChatGPT搭建到自己的服务器,无需科学上网即可使用!
下面所有操作流程是本人亲自实践过的非常好用.这应该是全网第一份介绍的如此详细的教程,跟着步骤一步一步走百分百成功。下面我们开始。OpenAIAPI是OpenAI提供的一种云端服务,允许开发人员使用OpenAI的人工智能模型,以便执行自然语言处理和代码生成等
京东云开发者 京东云开发者
3个月前
【内部业务支撑&前瞻技术布局】One4All下一代生成式推荐系统
作者:京东零售申磊一、开篇自LLM在自然语言处理等领域取得了瞩目成就之后,学术界积极探索生成式模型对搜广推系统的增强或改进方式\。下面,我将介绍在此文章发布之后的近期工作进展。本文进一步梳理了业务需求,并以此总结出核心技术点,针对CPS广告的特点,对前链路
数据堂 数据堂
2年前
情感语音识别技术的挑战和未来发展
情感语音识别技术在实现过程中面临着一些挑战和问题。首先,情感语音识别技术需要处理自然语言理解和语音识别等复杂的问题,如何提高技术的准确率和效率是该技术需要解决的问题之一。其次,情感语音识别技术的鲁棒性还需要进一步提高,尤其是对于不同语种和不同口音的语音。此
数据堂 数据堂
1年前
如何构建高质量的大语言模型数据集
构建高质量的大语言模型数据集是训练强大自然语言处理模型的关键一步。以下是一些关键步骤和考虑因素,有助于创建具有多样性、准确性和时效性的数据集:数据收集:数据集的首要任务是收集大量文本数据。这可以包括从互联网上抓取文本、购买已有的数据集、与合作伙伴合作获取数