试验大模型的图像识别能力

AGIC.TWang
• 阅读 599

摘要:大模型的多模态能力是研究热点,图像识别作为其中重要组成部分,应用价值日益凸显。本文选取国内几家具有代表性的大模型厂商,对其图像识别能力进行试验观察,旨在比较分析各厂商模型的性能差异,为用户选择合适的图像识别模型提供参考。

我们在大模型分发助手平台中进行试验,本次选择4家大模型厂商:智谱AI、商汤科技、零一万物、阶跃星辰。

物体识别

我们看下这些大模型,能不能精准的识别图中的所有物体。

提示词

你看到了什么?

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道❌️

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门✅ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户❌️ | 街道✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

感受氛围

试验下大模型能不能感受图片的氛围。

提示词

你感受到了什么

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

逻辑能力

我们看下这些多模态大模型的逻辑能力,能不能识别一些具有迷惑性的图片。

提示词

请描述这张图片

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

点赞
收藏
评论区
推荐文章
Stella981 Stella981
3年前
Kaggle新上比赛:Google AI发起地域包容性图像识别竞赛
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)昨天Kaggle新上了一个关于图像识别的比赛,GoogleAI发起了地域包容性图像识别竞赛(InclusiveImagesCompetition),旨在探索图像识别在数据采集地域分布不一致的情况下模型的包容性(Inclusive)。众所周知,正是由于类似ImageNet这样的大规模
四儿 四儿
11个月前
大模型数据集:力量的源泉,进步的阶梯
一、引言在人工智能的繁荣发展中,大模型数据集的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格来探讨大模型数据集的魅力和潜力。二、大模型数据集:宏大的舞台大模型数据集如广袤的舞台,为AI技术的展现提供了广阔的空间。
融云IM即时通讯 融云IM即时通讯
11个月前
融云五大场景化能力,全面赋能金融行业数智化转型
融云作为通信服务商,将在金融大模型进入实际业务场景时,提供底层的“对话”能力加持。融云IM支持对接多种大模型,可构建用户和大模型之间的业务桥梁,并将对话数据进行结构化保存,助力金融客户在对话框中实现对内的办公助手和对外的智能客服等能力。除此之外,以能力为主
京东云开发者 京东云开发者
11个月前
直播预告 | 大模型时代 “应用变了”:看大模型如何跑进零售电商应用
走进零售电商,大模型能做什么?今年11.11,应用大模型带来成效显著今天下午2:00,京东云视频号准时直播看京东零售如何破题新解法,大小模型协同大模型将走向多模态,走向具身智能
黄忠 黄忠
8个月前
Stable Diffusion 商业变现与绘画大模型多场景实战(网盘)
StableDiffusion商业变现与绘画大模型多场景实战download》https://www.sisuoit.com/4761.html随着人工智能技术的迅猛发展,其在各个领域的应用日益广泛。其中,绘画大模型作为人工智能与艺术创新的交汇点,引起了广
京东云开发者 京东云开发者
8个月前
大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用
一、前言2023年,大语言模型以前所未有的速度和能力改变我们对智能系统的认知,成为技术圈最被热议的话题。但“百模大战”终将走向“落地为王”,如何将大语言模型的强大能力融入实际业务、产生业务价值成为致胜关键。在零售场,大模型应用面临的核心挑战包括以下三点:(
京东云开发者 京东云开发者
5个月前
大模型技术及趋势总结
本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,因为水平有限,疏漏在所难免。请大家谅解。引言大模型将成为通用人工智能的重要途径。在这个由0和1编织的数字时代,人
AGIC.TWang AGIC.TWang
2个月前
谈谈Function Calling
FunctionCalling赋予大语言模型调用外部工具的能力,弥补其缺乏行动力、信息滞后等缺陷。它像“指挥家”般,理解用户意图,选择合适的工具执行操作,并将结果反馈给用户,从而连接虚拟与现实。这一机制让大语言模型如虎添翼,更好地服务于人类。
“模”力十足!天翼云息壤一体化智算服务平台训推服务能力重磅升级!
9月4日,“天翼云息壤——大模型训推一体化服务能力升级”线上发布会成功举办。会上,息壤平台训推服务能力重磅升级,新增闭源、多模态基座大模型以及数据集,支持万卡规模训练,训练稳定性再次提升,新增体验空间,为基础大模型训练、行业大模型训推提供一站式解决方案。
AGIC.TWang
AGIC.TWang
Lv1
AGIC布道者
文章
5
粉丝
0
获赞
0