用 AI 解锁技术调研的新姿势

京东云开发者
• 阅读 272

1. 前言

在日常开发中,为了保证技术方案的质量,一般会在撰写前进行调研。如果先前没有相关领域的知识储备,笔者的调研方式一般是先通过搜索引擎进行关键字查询,然后再基于搜索的结果进行发散。这样调研的结果受关键字抽象程度和搜索引擎排名影响较大,可能会存在偏差导致调研不充分。刚好大模型风靡有一段时间了,就想如果AI能自动检索资料并进行内容总结,岂不美哉。避免重复造轮子,先在网上检索了一下,发现刚好有一个工具“STORM”满足诉求。

2. 什么是STORM?

STORM是一个由斯坦福大学开发的基于大型语言模型(LLM)的知识管理系统,它能够针对特定主题进行研究,并生成带有引用的完整报告。系统分为预写阶段和写作阶段,通过互联网研究收集参考资料并生成大纲,然后利用这些信息生成带引用的全文。STORM通过视角引导提问和模拟对话来提高生成内容的质量,支持自定义检索器和语言模型,以适应不同的使用场景。基本的执行流程如下图:

 用 AI 解锁技术调研的新姿势

3. 怎么使用STORM?

可以自己将仓库Clone到本地编译运行(需要设置openai_api_key)或者直接访问STORM试用,下面使用直接访问网页的方式进行说明。

① 设置内容主题并描述撰写的目的

主题设置为“代码可视化”,并将撰写目的设置为“介绍技术的核心概念和前沿应用”。

 用 AI 解锁技术调研的新姿势 

② 自动检索互联网相关资料



用 AI 解锁技术调研的新姿势

③ 使用LLM生成文章内容

 用 AI 解锁技术调研的新姿势

④ 通过模拟对话优化生成内容

 用 AI 解锁技术调研的新姿势

⑤ 展示生成内容

得到生成文章,可以下载为PDF格式。

 用 AI 解锁技术调研的新姿势 

4. 原理浅析

STORM通过两个主要阶段来生成带有引用的长篇文章:

预写阶段(Pre-writing stage) :这个阶段系统基于互联网收集参考资料,并生成一个文章大纲。这是文章写作的准备阶段,帮助确定文章的结构和将要包含的关键点;

写作阶段(Writing stage) :有了大纲和参考资料,系统会利用这些资料生成完整的文章,并在文章中加入适当的引用。

 用 AI 解锁技术调研的新姿势 

STORM的优势在于过程的自动化,特别是自动的提出好问题。但直接提示语言模型提出的问题效果并不理想,为了提高问题提问的深度和广度,STORM采用了两种策略:

视角引导的问题提问(Perspective-Guided Question Asking) :通过调查类似主题相关文章来发现不同的视角,并利用这些视角来控制提问的过程;

模拟对话(Simulated Conversation) :模拟了一个维基百科作者和一个互联网主题专家之间的对话,使语言模型能够更新对主题的理解并提出后续问题。

 用 AI 解锁技术调研的新姿势 

整个生成的执行流程如下,可以看到生成一篇文章会进行多趟的处理:



用 AI 解锁技术调研的新姿势

更多关于功能和原理的介绍可以阅读论文:Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models

5. 总结

使用STORM做技术调研相当的舒服,只需要拿到它生成的文章进行阅读并对内容进行甄别(大模型存在幻觉问题),这极大的提升了工作效率。在大模型时代如果有人说他不知道怎么学习和查找资料,那么估计99.9999999...% 的概率只是而已😁。

点赞
收藏
评论区
推荐文章
3A网络 3A网络
2年前
网站优化(一)—— 从何处着手开启网站优化?
网站优化(一)——从何处着手开启网站优化?网站优化是指使用工具、高级策略和实验来提高网站性能,从而推动流量增加转化率和增加收入的过程。搜索引擎优化(SEO)是常见的一种网站优化方式,它可以帮助网站的各个页面在特定关键字的SERP(搜索引擎结果页面)中排名靠前,让用户在百度、谷歌等搜索时先看到你的网站。如果想要进一步优化网站,让用户体验更好,那是一个很
Wesley13 Wesley13
3年前
2020低代码平台进展跟踪
前言去年已经做过一次低代码平台的分享和调研,当时看到OutSystems时感觉变革可能要来了,但到现在还是没有太大的变化。但最近看到低代码的平台又有不少新的报道和消息,作为重点跟踪的技术,今年有必要再进行一次进展跟踪。先总体的说一下,从泛用性和实用性上来讲,OutSystems仍然是一骑绝尘,而且还在持续的完善细节。国内的平台更多的面向一个领域来解
待兔 待兔
3年前
Golang指南:顶级Golang框架、IDE和工具列表
自推出以来,Google的Go编程语言(Golang)越来越受主流用户的欢迎。在2016年12月的一份调研中,3,595名受访者中有89%表明他们在工作中或工作以外用Go语言编程。此外,在编程语言中,Go语言在专业知识和偏好方面排名最高。2017年7月,在Tiobe的年度编程语言排名(https://www.tiobe.com/tiobeindex
vue的两种服务器端渲染方案
关于服务器端渲染方案,之前只接触了基于react的Next.js,最近业务开发vue用的比较多,所以调研了一下vue的服务器端渲染方案。
不才 不才
2年前
前端实现在浏览器中打印网页
前端数据报表打印方案背景项目:vueelementui需求:web端连接打印机打印报表功能关键词:浏览器端连接打印机打印报表调研首先,前端调用打印只有两种方式,使用window.print()和调用网络打印机。window.print这个是浏览器开放的api一般快捷键ctrlp或右键都也能调用。可以通过媒体查询的方案进行局部打印,也就是隐
Wesley13 Wesley13
3年前
go学习(一)变量、常量
emm,发觉自己没有系统的学习。都是有需求来临时调研技术,从今天起每天抽出时间系统化学习Go.类型Go是静态类型语言,运行期间不能改变类型定义1.可以使用var关键字2.可以使用:让系统推导类型example:varainta:0是一致的但是要注
你们的优雅停机真的优雅吗? | 京东云技术团队
什么是优雅停机呢?为什么现有的系统技术没有原生的优雅停机机制呢?通过调研整理文章如下。
微前端无界机制浅析 | 京东物流技术团队
简介随着项目的发展,前端SPA应用的规模不断加大、业务代码耦合、编译慢,导致日常的维护难度日益增加。同时前端技术的发展迅猛,导致功能扩展吃力,重构成本高,稳定性低。为了能够将前端模块解耦,通过相关技术调研,最终选择了无界微前端框架作为物流客服系统解耦支持。
小万哥 小万哥
10个月前
搜索引擎优化指南:SEO关键字、长尾关键字、短尾关键字以及反向链接
内容SEOSEO代表“搜索引擎优化”。它是一种数字营销策略,旨在提高网站或网页在搜索引擎未付费结果中的在线可见性。通常,网站在搜索结果页面中排名越高,或在搜索结果列表中显示的频率越高,它将从搜索引擎用户那里获得的访问者就越多。SEO策略可以针对各种类型的搜