试验大模型的图像识别能力

AGIC.TWang
• 阅读 1191

摘要:大模型的多模态能力是研究热点,图像识别作为其中重要组成部分,应用价值日益凸显。本文选取国内几家具有代表性的大模型厂商,对其图像识别能力进行试验观察,旨在比较分析各厂商模型的性能差异,为用户选择合适的图像识别模型提供参考。

我们在大模型分发助手平台中进行试验,本次选择4家大模型厂商:智谱AI、商汤科技、零一万物、阶跃星辰。

物体识别

我们看下这些大模型,能不能精准的识别图中的所有物体。

提示词

你看到了什么?

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道❌️

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门✅ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户❌️ | 街道✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

砌砖房子✅ | 红色的砖✅ | 白色的木门✅ | 双开木门❌️ | 自行车✅ | 白色桌子/椅子✅ | 两边绿植✅ | 上方花盆/植物✅ | 窗户✅ | 街道✅

感受氛围

试验下大模型能不能感受图片的氛围。

提示词

你感受到了什么

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨❌️ | 节日氛围✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

灯笼✅ | 喜庆✅ | 幸福/温馨✅ | 节日氛围✅

逻辑能力

我们看下这些多模态大模型的逻辑能力,能不能识别一些具有迷惑性的图片。

提示词

请描述这张图片

试验大模型的图像识别能力

识别分析

智谱AI

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

商汤科技

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

零一万物

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

阶跃星辰

识别结果

试验大模型的图像识别能力

结果分析

双曝光✅ | 女性✅ | 植物✅ | 天空✅

点赞
收藏
评论区
推荐文章
数据堂 数据堂
1年前
大模型数据集:力量的源泉,进步的阶梯
一、引言在人工智能的繁荣发展中,大模型数据集的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格来探讨大模型数据集的魅力和潜力。二、大模型数据集:宏大的舞台大模型数据集如广袤的舞台,为AI技术的展现提供了广阔的空间。
直播预告 | 大模型时代 “应用变了”:看大模型如何跑进零售电商应用
走进零售电商,大模型能做什么?今年11.11,应用大模型带来成效显著今天下午2:00,京东云视频号准时直播看京东零售如何破题新解法,大小模型协同大模型将走向多模态,走向具身智能
大模型技术及趋势总结
本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,因为水平有限,疏漏在所难免。请大家谅解。引言大模型将成为通用人工智能的重要途径。在这个由0和1编织的数字时代,人
幂简集成 幂简集成
2个月前
2025年国内大模型在技术文档撰写中的效果对比
2025年国内大模型在技术文档撰写的效果已成为学术界与产业界共同关注的焦点。从API接口说明到用户操作手册,大模型通过语义理解、逻辑生成和多模态交互能力的深度融合,显著提升了技术文档的编写效率与专业性。然而,不同厂商与科研机构推出的模型在效果上呈现显著差异
幂简集成 幂简集成
2个月前
2025大模型排行榜发布:DeepSeek-v3对比通义千问-Max
在当前大模型产品快速演进的背景下,如何高效对比不同厂商的API能力、定价、性能表现等关键指标,成为开发者和企业选型时面临的重要问题。为此,幂简集成制作了一份覆盖模型规格、价格、性能对比、实际调用效果等多维度的完整对照表,帮助用户快速理解和判断各类主流大模型
幂简集成 幂简集成
1个月前
2025主流AI大模型API终极对决:DeepSeek、通义千问、Kimi谁将问鼎?
2025年国内大模型在技术文档撰写领域的表现备受瞩目,其融合语义理解、逻辑生成和多模态交互能力,极大地提高了技术文档的编写效率与专业性,从API接口说明到用户操作手册都能高效应对。不过,不同厂商与科研机构推出的模型效果差异较大:部分头部模型已能高度结构化输
幂简集成 幂简集成
1个月前
2025主流AI大模型API终极对决:DeepSeek、通义千问、Kimi谁将问鼎?
2025年国内大模型在技术文档撰写领域的表现备受瞩目,其融合语义理解、逻辑生成和多模态交互能力,极大地提高了技术文档的编写效率与专业性,从API接口说明到用户操作手册都能高效应对。不过,不同厂商与科研机构推出的模型效果差异较大:部分头部模型已能高度结构化输
幂简集成 幂简集成
1个月前
2025大模型排行榜发布API比较:DeepSeek-v3对比通义千问-Max
在当前大模型产品快速演进的背景下,如何高效对比不同厂商的API能力、定价、性能表现等关键指标,成为开发者和企业选型时面临的重要问题。为此,幂简集成制作了一份覆盖模型规格、价格、性能对比、实际调用效果等多维度的完整对照表,帮助用户快速理解和判断各类主流大模型
数据堂 数据堂
1星期前
数据上新 | 全新高质量训练数据集重磅发布
数据堂全新发布多语种大模型预训练数据集、多模态大模型数据集、语音识别与计算机视觉训练数据集,全面助力企业打造更高精度、更强泛化能力的AI模型,轻松应对全球用户多样化的语言与应用场景需求,为智能升级提供坚实数据支撑。
AGIC.TWang
AGIC.TWang
Lv1
AGIC布道者
文章
7
粉丝
0
获赞
0