正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
资讯
妙投APP
虎嗅智库
登录 极速注册
取消
搜索历史
删除
完成
全部删除
热搜词
2024-04-13 16:15
马斯克发布Grok-1.5V,能干得过GPT-4和Claude么?

本文来自微信公众号: 智东西(ID:zhidxcom),作者:ZeR0,编辑:漠影原文标题:《马斯克发布Grok-1.5V!xAI首款多模态大模型,能看图写代码、算热量》,题图来自:视觉中国

文章摘要
马斯克的xAI推出了其首款多模态大模型Grok-1.5V,具备处理各种视觉信息和进行多学科推理的能力。

• 🚀 Grok-1.5V是xAI首款多模态大模型,能够处理文本和视觉信息。

• 💡 Grok-1.5V展示了7个示例,包括将手绘图表转换成Python代码、计算食品卡路里等。

• 🌟 在一些基准测试中,Grok-1.5V在真实世界空间理解能力方面优于同类模型。

4月13日消息,马斯克的大模型创企xAI推出了其首款多模态大模型Grok-1.5V。


这是OpenAI的大语言模型劲敌之一。如今,除了文本功能外,Grok现在还可以处理各种各样的视觉信息,包括文档、图表、屏幕截图、照片,并能进行多学科推理。


xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、为生活日常问题答疑解惑、解决代码问题。


至此,xAI正式加入前沿多模态大模型的竞赛。


与GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比,Grok-1.5V的表现不相上下,在一些基准测试中略胜一筹。



尤其是在RealWorld,在用于衡量真实世界空间理解能力的QA基准测试中,Grok明显优于同类模型。xAI团队对Grok理解物理世界的能力感到特别兴奋。对于上面的数据集,该团队在没有思维链提示的情况下在零样本设置中评估Grok。


xAI宣布向社区发布RealWorldQA基准测试,计划随着其多模态模型的改进而扩展它。RealWorldQA在CC BY-ND 4.0下发布,数据集大小为677MB。


初版RealWorldQA由700多张图片组成,每张图片都有一个问题和易于验证的答案。该数据集包括从汽车上拍摄的匿名图像,以及其他真实世界的图像。xAI放出了4个示例,其中有两张图都是由汽车前置摄像头拍摄的。‍‍


数据集地址:https://creativecommons.org/licenses/by-nd/4.0/?ref=chooser-v1


自2023年11月推出聊天机器人Grok以来,马斯克的xAI一直在追赶OpenAI的步伐。在刚刚过去的1个月内,xAI相继宣布将Grok-1开源、推出128k长文本Grok-1.5、推出Grok-1.5V多模态大模型三项重要进展。


Grok-1.5V将很快提供给其早期测试者和现有的Grok用户。


xAI展示了Grok-1.5V的7个示例:


一、看图表草图,写代码


用户拿出一张手绘的流程图,问Grok能否将其转换成Python代码。



Grok回复:


“当然!您提供的流程图描述了一个简单的猜谜游戏,其中计算机生成一个随机数,用户必须猜测它。下面是表示流程图中逻辑的Python代码:”



“这段代码将运行流程图中描述的猜谜游戏。用户将被提示输入他们的猜测,直到他们猜对了数字。”


二、计算卡路里


用户问:“5片这个有多少卡路里?”



Grok回复:


“如果一份是3片,含有60卡路里,那么5片就含有大约100卡路里。这是通过首先确定每片的卡路里来计算的:60卡路里/3片=每片20卡路里。然后,将每片的卡路里乘以片数:每片20卡路里*5片= 100卡路里。”


三、根据绘画讲一个睡前故事



根据上图,Grok讲出这样一个睡前故事:



“很久很久以前,在一片充满冒险和奇迹的土地上,有一个勇敢的小男孩,名叫蒂米。蒂米和他的家人住在一个舒适的小房子里,他最喜欢的就是探索周围的世界。


在一个阳光明媚的日子,蒂米决定去附近的森林探险。他带上了他最喜欢的零食、一个指南针,还有他那本可靠的笔记本,用来画下他将要看到的所有令人兴奋的事情。


当蒂米向森林深处冒险时,他发现了一条在阳光下闪闪发光的神奇河流。这条河是如此迷人,以至于蒂米决定造一艘小纸船,作为对森林精灵的特殊信息,顺流而下。


蒂米小心翼翼地折起他的纸船,在上面画了一个笑脸,给森林精灵带来欢乐。然后,他把船放在河上,看着它漂走,带着他的友谊和对自然的爱的信息。


当太阳开始下山时,蒂米知道是时候回家了。他很感激在森林里度过的神奇的一天,他知道他会永远把这次冒险的记忆记在心里。


回到家,蒂米把他的故事告诉了他的家人,他们很高兴听到他在森林里神奇的一天。他们都认为提米的勇敢和善良的精神是一个真正的鼓舞,他们知道他将继续有更多的奇妙的冒险在未来。


于是,带着一颗充满爱的心和一个充满梦想的头脑,蒂米慢慢地睡着了,渴望发现在他想象的世界里有什么新的冒险在等着他。”


四、解释一个梗图



给Grok上面这张梗图,它也能“秒懂”:



“这张图片是对初创公司和大公司的幽默比较。在左边标有‘初创公司’的地方,有一群人在一起挖洞。他们都在积极参与,这个洞已经相当深了。


在右边标有‘大公司’的地方,有一群人站在一个洞周围。然而,与创业方不同的是,实际上只有一个人在挖洞,而其他人则在观看或从事其他活动。


这幅图中的幽默来自于对初创公司和大公司之间差异的夸大。在创业公司,通常有一种紧迫感,每个人都被期望直接为手头的任务做出贡献。相比之下,大公司通常被描述为有更多的官僚主义,并且每个项目中所有团队成员的直接参与较少。”


五、将表格转换成csv


用户可以要求Grok将这张表格转换成csv。



Grok随即输出以纯文本格式显示的CSV:



六、帮忙清理甲板上的烂木头


Grok也能用于解决生活日常问题。当用户发送一张照片,询问:“这些洞出现在我甲板上的螺丝周围。它烂了吗?我应该换电路板吗?”



Grok回复说:


“看来你甲板上的木头已经开始腐烂了。螺丝周围有洞表明了这一点,这是木头腐烂的常见迹象。


为确保甲板的安全和使用寿命,建议更换受影响的甲板。这将有助于防止甲板进一步受损,并保持其结构完整性。


如果您不确定如何继续更换板,咨询专业的甲板建造商或承包商可能会有所帮助。他们将能够评估损坏的程度,并为您的甲板提供最佳行动方案的专家建议。”


七、解决代码问题



让Grok写Python代码解决上面的问题,Grok的输出如下:



xAI团队认为,推进多模态理解和生成能力是构建能够理解宇宙的有益AGI的重要步骤。在接下来的几个月里,xAI预计将在图像、音频、视频等各种模态上对这两种功能进行重大改进。


同时,xAI还贴出招聘链接,邀请更多设计师、工程师、产品、数据、Infra、AI导师加入。



值得一提的是,LLaVA一作、美国威斯康星大学麦迪逊分校博士柳昊天今日宣布加入xAI团队:“我很高兴和一个小而专注的团队一起工作,看看我们能有多快!这仅仅是个开始。”‍



LLaVA是第一个在图像理解和推理方面具有类似GPT-4V级别能力的开源大模型。结合AI Agent,柳昊天联合清华大学的刘世隆等人去年11月又提出了LLaVA-Plus,使用插件(视觉工具)提升多模态大语言模型的视觉能力。


LLaVA-Plus一作、清华大学计算机系博士生刘世隆将出席下周五(4月19日)在北京举行的2024中国生成式AI大会并分享观点。


本文来自微信公众号: 智东西(ID:zhidxcom),作者:ZeR0

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
拥抱“AI”
频道:
前沿科技

支持一下

赞赏

0人已赞赏

最新评论

  • 嗅友uysdX
    马斯克又在创新了,那Grok-1.5V的能力真是让人惊叹😮
    2024-04-13·江苏
    1

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: 
    支付

    4617作文网男娃起名测名家具公司怎样起名算命网四柱宝宝取名字网女宝宝起名民宿怎么起名字鼎字公司起名字周易研究会邵长文改命调运起名钟姓起什么名好起名周易科学女生金姓起名字八字算命书下载周易六十四卦精解周公解梦祭拜属相鼠的人起名宜用字如何给狗狗起名字大全周易免费取名评分标准草花头的男孩起名梦到拉屎周公解梦周易起名字大师谢咏吴亦凡周易预测算命配婚优宝宝起名给姓曹的少女起名服装厂起名参考大全餐饮店铺如何起名生辰八字算命生辰八字算命1988年起什么名字中国周易取名梦见吃瓜子周公解梦梦见买蒜是什么意思周公解梦淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男子给前妻转账 现任妻子起诉要回网友建议重庆地铁不准乘客携带菜筐月嫂回应掌掴婴儿是在赶虫子重庆警方辟谣“男子杀人焚尸”国产伟哥去年销售近13亿新的一天从800个哈欠开始男孩疑遭霸凌 家长讨说法被踢出群高中生被打伤下体休学 邯郸通报男子持台球杆殴打2名女店员被抓19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警两大学生合买彩票中奖一人不认账德国打算提及普京时仅用姓名山西省委原副书记商黎光被逮捕武汉大学樱花即将进入盛花期今日春分张家界的山上“长”满了韩国人?特朗普谈“凯特王妃P图照”王树国3次鞠躬告别西交大师生白宫:哈马斯三号人物被杀代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了房客欠租失踪 房东直发愁倪萍分享减重40斤方法“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火手机成瘾是影响睡眠质量重要因素考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼网友洛杉矶偶遇贾玲呼北高速交通事故已致14人死亡西双版纳热带植物园回应蜉蝣大爆发男孩8年未见母亲被告知被遗忘张立群任西安交通大学校长恒大被罚41.75亿到底怎么缴沈阳一轿车冲入人行道致3死2伤奥运男篮美国塞尔维亚同组周杰伦一审败诉网易国标起草人:淀粉肠是低配版火腿肠外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万杨倩无缘巴黎奥运男子被猫抓伤后确诊“猫抓病”春分“立蛋”成功率更高?记者:伊万改变了国足氛围奥巴马现身唐宁街 黑色着装引猜测

    4617作文网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化