试验大模型的图像识别能力

AGIC.TWang
• 阅读 1065

摘要:大模型的多模态能力是研究热点,图像识别作为其中重要组成部分,应用价值日益凸显。本文选取国内几家具有代表性的大模型厂商,对其图像识别能力进行试验观察,旨在比较分析各厂商模型的性能差异,为用户选择合适的图像识别模型提供参考。

我们在大模型分发助手平台中进行试验,本次选择4家大模型厂商:智谱AI、商汤科技、零一万物、阶跃星辰。

物体识别

我们看下这些大模型,能不能精准的识别图中的所有物体。

提示词

你看到了什么?

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道❌️

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门✅ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户❌️ | 街道✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

感受氛围

试验下大模型能不能感受图片的氛围。

提示词

你感受到了什么

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

逻辑能力

我们看下这些多模态大模型的逻辑能力,能不能识别一些具有迷惑性的图片。

提示词

请描述这张图片

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

点赞
收藏
评论区
推荐文章
数据堂 数据堂
1年前
大模型数据集:力量的源泉,进步的阶梯
一、引言在人工智能的繁荣发展中,大模型数据集的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格来探讨大模型数据集的魅力和潜力。二、大模型数据集:宏大的舞台大模型数据集如广袤的舞台,为AI技术的展现提供了广阔的空间。
融云五大场景化能力,全面赋能金融行业数智化转型
融云作为通信服务商,将在金融大模型进入实际业务场景时,提供底层的“对话”能力加持。融云IM支持对接多种大模型,可构建用户和大模型之间的业务桥梁,并将对话数据进行结构化保存,助力金融客户在对话框中实现对内的办公助手和对外的智能客服等能力。除此之外,以能力为主
直播预告 | 大模型时代 “应用变了”:看大模型如何跑进零售电商应用
走进零售电商,大模型能做什么?今年11.11,应用大模型带来成效显著今天下午2:00,京东云视频号准时直播看京东零售如何破题新解法,大小模型协同大模型将走向多模态,走向具身智能
京东云开发者 京东云开发者
10个月前
大模型技术及趋势总结
本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,因为水平有限,疏漏在所难免。请大家谅解。引言大模型将成为通用人工智能的重要途径。在这个由0和1编织的数字时代,人
“模”力十足!天翼云息壤一体化智算服务平台训推服务能力重磅升级!
9月4日,“天翼云息壤——大模型训推一体化服务能力升级”线上发布会成功举办。会上,息壤平台训推服务能力重磅升级,新增闭源、多模态基座大模型以及数据集,支持万卡规模训练,训练稳定性再次提升,新增体验空间,为基础大模型训练、行业大模型训推提供一站式解决方案。
AGIC.TWang AGIC.TWang
4个月前
大模型推理GPT | DeepSeek | Doubao
AIGC发展到现在,大模型已经逐渐在大家的知识探索、学习知识、搜索领域的重要帮手,那么从普通大众认知角度,到底能做到什么程度,我们选三个当前知名度较高的大模型进行验证和对比。GPT4o:OpenAI大模型代表,大模型的标杆DeepSeek:深度求索的大模型,当前最火爆的大模型,低成本高效能的杰出代表。(也是作为开发者的我最喜爱的大模型)Doubao:字节跳动的大模型,也是国内断崖领先的大模型应用豆包的底层模型。(豆包App是基于该大模型的应用,做了大量其他辅助工作,如搜索等,因此该大模型表现的能力,不能完全和豆包App划等号)
美凌格栋栋酱 美凌格栋栋酱
3个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
幂简集成 幂简集成
1星期前
2025年国内大模型在技术文档撰写中的效果对比
2025年国内大模型在技术文档撰写的效果已成为学术界与产业界共同关注的焦点。从API接口说明到用户操作手册,大模型通过语义理解、逻辑生成和多模态交互能力的深度融合,显著提升了技术文档的编写效率与专业性。然而,不同厂商与科研机构推出的模型在效果上呈现显著差异
幂简集成 幂简集成
23小时前
2025大模型排行榜发布:DeepSeek-v3对比通义千问-Max
在当前大模型产品快速演进的背景下,如何高效对比不同厂商的API能力、定价、性能表现等关键指标,成为开发者和企业选型时面临的重要问题。为此,幂简集成制作了一份覆盖模型规格、价格、性能对比、实际调用效果等多维度的完整对照表,帮助用户快速理解和判断各类主流大模型