网民怎么玩 ChatGPT 多模态 GPT-4V

生成式 AI 应用的一大突破，是 ChatGPT 开始支援多模态 (multi-modal)，换句话说 ChatGPT 现在可以看、可以听，也可以说了。在社群上，大家会用 GPT-4V 来称呼可以读图片的 GPT (V 代表 Vision，也就是视觉的意思)。

举例来说，下面的截图是美国有个网友，分享他上传一个超复杂的停车告示牌照片，加上要停车的时间，ChatGPT 就直接帮忙判断现在能不能免费停车、可以免费停多久。

该网友评论“我从此不会再拿到违规停车罚单了”，只能说多模态真的开启非常多应用的可能性呀！

这边帮大家汇整网路上已经有的 GPT-4V 应用，只能说非常惊人：

文章版权归作者所有，严禁转载。

THE END