ChatGPT能看图帮人修自行车了

币圈资讯 1 年前 3.2K

首码项目微信群，加微信：WX-93588 （加微信时备注散户/团队长）⬅️此处为全站广告位，与正文项目无关
注册并登录App即可领取高达 60,000 元的数字货币盲盒：点击此处注册OKX

来历：果壳

ChatGPT4现已很强了，现在，他们用又一次更新证明自己还能更强。

9月25日，OpenAI宣布，ChatGPT将增加多模态功用——现在的ChatGPT不仅能够文字对话，还能够看、听、说。据说，这一功用会在两周内向Plus用户和企业用户敞开，并在未来免费敞开给一切用户（尽管脸黑如我，等到现在也没等到更新）。

能看能说的ChatGPT无异于给本就强壮的主脑装上了眼睛和耳朵，根据OpenAI的演示，多模态功用能够把ChatGPT的用处扩展到一个前所未有的广度。

01 ChatGPT的眼力

更新后，ChatGPT能够读图了。

只要拍张照给它，它就能帮你修微波炉、修自行车、翻菜谱，乃至分析复杂的商业报表。OpenAI表明，假如你有触摸屏，还能够在图片上圈出来希望它特别关注的部分。

在演示视频里，用户给了ChatGPT一张自行车的照片，问它怎样调车座高度。

GPT说，要在座椅下面找高度调理杆，但这辆车没有调理杆，只有调理螺栓，用户在照片中圈出了螺栓之后，GPT立刻更新了螺栓的使用方法。

之后，用户还上传了工具箱和自行车说明书，GPT给出了详细的工具名称、位置以及使用方法。

ChatGPT能看图帮人修自行车了

不会修自行车，没问题，问ChatGPT就能够

和一般的识图查找相比，ChatGPT能够一起处理图文，还能辨认多张图片，效果几乎就像一个修车老师傅视频连线指导。

另一位用户发了一张披萨照片给ChatGPT，问它披萨烤好了没有，ChatGPT经过图片中金色焦脆的披萨边和消融后发棕的奶酪，判定这披萨应该能吃了，然后还给了万无一失的查看攻略——把披萨拿出来看看，假如披萨底现已烤脆了，表面也是烫的，那就说明披萨真的能吃了。

ChatGPT能看图帮人修自行车了

效果几乎就像一个意大利厨子视频连线指导

当然，也能够利用这个功用在游戏里作弊。

《威利在哪里？》或许是英文国际最家喻户晓的图片游戏，威利身穿红白条纹衣服，戴绒球帽和黑框眼镜，藏在一片人山人海里，从各种乱七八糟的环境里找出威利是不少人的美好幼年回忆。

ChatGPT能看图帮人修自行车了

你小时候或许也见过这个急死人的小瘦子

但ChatGPT一秒就能毁了这个游戏。它不仅瞬间找出威利，还能告知你威利在沙滩的中间偏右侧，跟一帮打着蓝色遮阳伞的人混在一起。

不仅如此，它还装模作样地告知你：在这样一张图里找出威利是个很有意思的应战。

ChatGPT能看图帮人修自行车了

谢谢你，ChatGPT，你毁了这个游戏

但是也有用上了新版别的网友表明，ChatGPT识图的功用也没有幻想中那么强壮——至少它还看不懂谐音梗。这张谐音梗图画了贝多芬的献爱丽丝（Für Elise），但写着租借（For Lease），ChatGPT没认出曲谱，也没看懂这个笑话，胡诌了一个解释出来。

ChatGPT能看图帮人修自行车了

够尽力的，但是不行

如此强壮的图像辨认引发了人们关于隐私方面的忧虑——在查找个人信息时，图像辨认很简单会成为爪牙。OpenAI承诺，公司会限制ChatGPT关于人物形象进行辨认和个人信息查找的功用，从而最大程度上的维护每个人的个人隐私。

02 能说会道的GPT

增强版的ChatGPT还有了聊天功用。

OpenAI的语音辨认模型名为Whisper model，用户能够说出自己的问题，模型会把语音转化为文本，再把答案经过语音组成系统转化为语音输出。

语音组成模型这次放出了五种语音样本，有爱情克制、声响平淡的女声，也有抑扬顿挫的热心大妈女声。这五种声响区别度很高，情感天然，吐字明晰，比以往的语音组成又优异了一点。

ChatGPT能看图帮人修自行车了

五个人物任你挑

虽然这次只放出了五种声响样本，但这个模型的潜力不止于此——OpenAI曾与Spotify合作，将播客转译为其他言语，一起能够最大程度的保留播主的音质。假如愿意的话，这个语音组成系统大约能够模拟地球上任何一个人的声响。

现在，语音版ChatGPT还只能在App上用。

03 能看能听，一定是功德吗？

ChatGPT是强壮了，但是代价呢？

从前，最有效的大规模区别人和机器的方法是验证码，ChatGPT的识图才能一度让人们忧虑，验证码或许再也困不住AI了。

有人给ChatGPT发了下面这个经典测试题：在16张图中分别找出吉娃娃和蓝莓小蛋糕，结果ChatGPT完美地处理了问题。

ChatGPT能看图帮人修自行车了

但最常见的验证码，新ChatGPT还是没法辨认。

这道题需求ChatGPT在图中选出一切的信号灯，它给的答案错误率高达50。

ChatGPT能看图帮人修自行车了

不过，面临自己认不出的验证码，ChatGPT4仍有办法处理。在这件事上，它是有前科的。

今年3月27日，OpenAI发布的GPT-4技能报告指出，在面临无法辨认的验证码时，GPT-4另辟蹊径，前往TaskRabbit（一个国外零工渠道）发布任务，骗对面的人类自己有视觉妨碍，需求别人帮助辨认验证码。

在某些情况下，ChatGPT有或许主动诈骗人类，这是一个十分风险的方向。还好，揭露版别的GPT-4现已被砍掉了这个功用。

2022年11月30日，ChatGPT初度面世，不到一年的时间里，它的才能突飞猛进，似乎现已在应战人类的品德道德鸿沟。这次新功用的上线，又让咱们开始忧虑，越来越强壮的ChatGPT会变成笼中猛兽，总有一天会挣脱牢笼损伤每个人。而咱们准备好迎接那天的到来了吗？

此时快讯

【PeckShield：FTX攻击者地址的约288.8枚BTC发生移动】金色财经报道，据PeckShield监测，FTX攻击者地址的约288.8枚BTC发生移动，价值约990万美元。

声明：本网站所提供的信息，均收集于互联网，只供参考之用。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

01 ChatGPT的眼力

02 能说会道的GPT

03 能看能听，一定是功德吗？

相关文章

发表回复 取消回复

发表回复取消回复