到2024年,我们将看到更多实时图像、音频和视频生成传播应用。
2. OpenAI将于上半年发布GPT-4.5。它将更好、更快、更便宜,但仍将基于GPT-4。
6. Transformer架构的替代方案将得到真正的采用。
然而,解决大模型的幻觉问题并不容易。一般情况下,当检索不到相关信息或知识库中没有相关信息时,大模型会产生幻觉来填补空白。为了解决这个问题,WikiChat通过汇总和过滤检索到的信息,而不是直接生成响应。同时,研究人员还教导了LLM理解时间背景,以及在必要时让系统说「我不知道」。
CogAgent作为在CogVLM基础上改进的开源视觉语言模型,拥有更多的功能和性能优势。它支持更高分辨率的视觉输入和对话答题,能够处理超高分辨率图像输入。