9. 多模态AI将成为新常态。苹果公司的Ferret和特斯拉的FSD正在引领潮流。但挑战也会随之而来。视觉、听觉,甚至是感觉?
如果要评选2023年的品牌黑马,活力28一定榜上有名。
首先是小冰克隆人,该产品允许创作者通过小冰框架技术克隆自己并向粉丝发布,已有超过 1000 名克隆人入驻,并有部分创作者实现个人 AI 年收入百万元。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。
31. 使用 ChatGPT 生成视频脚本:为视频内容编写引人入胜的脚本,例如广告或 YouTube 视频,节省时间和创意工作。