7月14日AI先锋日报|智源悟道3.0“Emu”模型开源;外媒:美国专家称AIGC是“鹦鹉学舌”

智源悟道3.0“Emu”模型开源

据智源研究院官方公众号,智源统一多模态预训练模型Emu正式开源。根据智源数据,Emu超越了此前DeepMind的多模态大模型Flamingo,刷新8项性能指标。模型能力覆盖图像与文本的生成及视频理解,更通用,能完成任意图生文以及文生图的多模态任务。
据悉,Emu建立了多模态统一学习框架,大量采用视频数据,最终得以实现对任意形式的多模态的上下文序列进行图文任意模态的补全,即对于任意模态进行下一步自回归预测。

MIT打造实验科学家的大模型助手

近日,麻省理工大学李巨教授团队推出了一个专为实验科学家设计的AI助手CRESt,研究人员即使不具备编码经验,只需与CRESt交谈,便可利用自动化实验平台帮助自己做实验。CRESt的操作系统由用户界面、ChatGPT后端、主动学习、端执行器四部分组成,从前端产生的文本信息会被传输到ChatGPT后端,这允许将谷歌样式文档字符串中记录的Python函数转换为ChatGPT可识别的JSON格式,当ChatGPT发现必要时可以调用该格式。

商汤绘画大模型击败Stable Diffusion XL

商汤大模型团队近日提出名为RAPHAEL文本条件图像扩散模型,该模型可以生成高度艺术化的图像,这些图像准确地描绘了包含多个名词、形容词和动词的文本提示,而且生成速度极快。综合实验表明,RAPHAEL在图像质量和审美吸引力方面均优于Stable Diffusion XL,DALL-E2、Deep Floyd等模型。

七部门联合公布AIGC管理办法

根据“网信中国”微信公众号,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局近日公布《生成式人工智能服务管理暂行办法》(简称《办法》),自2023年8月15日起施行。根据《办法》,国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管,明确了提供和使用生成式人工智能服务总体要求。

美国专家称AIGC是“鹦鹉学舌”

据外媒VentureBeat报道,在昨日的VentureBeat Transform2023的炉边会议上,东北大学体验式AI研究所执行董事Usama Fayyad称,虽然大型语言模型和生成式AI取得了进步,但它们仍然严重依赖人类的监督和干预。他说,生成式AI是鹦鹉,它们听不懂自己在说什么,只是重复以前听到过的内容。
搜索