从LLM到AGI,AI时代我们该何去何从
去年七月我去体验了一下 NAACL,对于一个外行人来说,听听报告看看海报,只留下 few-shot 和 zero-shot 还挺热门这一印象,仿佛最新的 NLP 技术也不过如此。没想到这还没到一年,AI 新闻便从月更变成了日更,接二连三地轰炸着新闻头条(为2023年 AI Index 的作者捏一把汗)。而随着 GPT-4 联了网(POI 警告),还没有任何准备的我们就进入了 AI 时代。
我先盘点一下过去一年都发生了什么吧。(也许是因为我还没用上联网的 ChatGPT,GPT4 偷懒大法在此失败了)
- 2022-07-12: Midjourney 开始公测 🔗
- 2022-07-20: OpenAI DALL-E 开始公测 🔗
- 2022-08-10: Stability AI 以开源形式发布 Stable Diffusion 🔗
- 2022-11-24: Stability AI 以开源形式发布 Stable Diffusion 2.0 🔗
- 2022-11-30: OpenAI 发布以 GPT-3.5 为后端的 ChatGPT,开启指令引导的流畅文本生成范式 🔗
- 2023-02-06: 谷歌公布 Bard 以挑战 ChatGPT 🔗
- 2023-02-07: 微软发布 New Bing,重新定义搜索引擎 🔗
- 2023-02-22: 微软公布手机版 Bing 🔗
- 2023-02-24: Meta 发布 LLaMA 并开放代码,堪称 ChatGPT 平替 🔗
- 2023-03-01: OpenAI 开放 ChatGPT & Whisper API 🔗
- 2023-03-06: 谷歌发布通用语言识别模型 USM 🔗
- 2023-03-10: 谷歌发布 PaLM-E 🔗
- 2023-03-14: 谷歌开放 PaLM API 🔗
- 2023-03-14: OpenAI 发布 GPT-4,较 GPT3.5 实现飞跃式提升 🔗
- 2023-03-14: Anthropic 发布 Claude 🔗
- 2023-03-15: 百度发布文心一言 🔗
- 2023-03-15: Midjourney 发布 Midjourney v5 🔗
- 2023-03-16: 微软发布 Microsoft 365 Copilot ,登陆微软全家桶🔗
- 2023-03-17: Stability AI 发布 Stable Diffusion Reimagine 🔗
- 2023-03-21: 谷歌 Bard 开始公测 🔗
- 2023-03-21: 微软发布 Bing Image Creator,接入 DALL-E 生成图像 🔗
- 2023-03-21: Adobe 发布 Adobe Firefly 🔗
- 2023-03-21: NVIDIA 与谷歌,微软,甲骨文,Adobe 于 AI 领域展开深度合作
- 2023-03-23: Github 发布 Copilot X,接入 GPT4 🔗
- 2023-03-23: ChatGPT 联网,开放第三方插件 🔗
总结一下,过去一年,随着 ChatGPT 的发布与 Stable Diffusion 的开源, 文本生成与图片生成产品蓬勃发展。三月以来,AI 的曝光率猛增,这两周甚至是每天都有大新闻。说实话,如果我说我不焦虑,这是不可能的。我对于这一年的热门技术,都是只闻其名,不解其意。我虽然也有去凑热闹通过新闻或者试用去了解这些技术都是做什么的,却不知道这些技术是如何发展的,也不知道我该如何应用这些技术,未来我能做些什么才不会被时代淘汰。最近有两篇论文,就直接讨论了现有 AI 模型的通用性,其对人类工作的影响,与 AGI 时代的到来,更是加剧了我的焦虑情绪,于是我便先从这两篇论文谈起吧。