“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
开源模型的组合将击败最好的私有模型。
1. Nvidia将更加努力成为云提供商,与亚马逊、微软和谷歌之间的关系愈发复杂。
- 在简要总结中,将代码块拆分为简单的摘要方面表现出色。当我从其他项目审查代码或需要迅速复习自己的工作时,这非常方便。
48. 通过 Chat GPT 在博物馆和画廊中人工智能生成的艺术描述:为艺术品提供引人入胜且信息丰富的描述,增强游客体验。