《浮世绘艺术》与《江户狂歌》对比

去年波士顿美术馆(MFA)的葛饰北斋巡展来到了西雅图,我去看了之后非常上头,便从淘宝又买了两本这几年新出的大部头画册(非众筹版)。这两本都是摩点众筹的话题之作,但是与其宣传时的声量相比,讨论并不多,只有一个宣传期的豆瓣帖子什么值得买上的现货对比。前几天这两本书终于远渡重洋(真的是远渡重洋,走的海运),来到我手上,我也可以边学习边做一个对比。

先放一个简单的结论:如果两本只能选一本,那一定选《浮世绘艺术》。如果资金充裕,那可以买别的书,《江户狂歌》不值得。

Orgmode 的优化

最近从 Prime Day 解放,我终于又有时间捣鼓我的 Orgmode 了。其实缘起是同事给我看了他直接用 vscode ssh 到 cloud desktop 上写码运行 debug 的流程,让我很是心动。但是作为一个 Emacs 资深病患,我的第一反应是能不能用 Emacs 实现这套流程。不过我一直没怎么搞明白如何不卡顿地使用 Tramp,Emacs 在运行 Jupyter Notebook 上也需要更多的设置,就此作罢。

不过既然起了这个钻研 Orgmode 的头,我不经又想起了几个让我很纠结的问题。

从LLM到AGI,AI时代我们该何去何从

去年七月我去体验了一下 NAACL,对于一个外行人来说,听听报告看看海报,只留下 few-shot 和 zero-shot 还挺热门这一印象,仿佛最新的 NLP 技术也不过如此。没想到这还没到一年,AI 新闻便从月更变成了日更,接二连三地轰炸着新闻头条(为2023年 AI Index 的作者捏一把汗)。而随着 GPT-4 联了网(POI 警告),还没有任何准备的我们就进入了 AI 时代。

我先盘点一下过去一年都发生了什么吧。(也许是因为我还没用上联网的 ChatGPT,GPT4 偷懒大法在此失败了)

  • 2022-07-12: Midjourney 开始公测 🔗
  • 2022-07-20: OpenAI DALL-E 开始公测 🔗
  • 2022-08-10: Stability AI 以开源形式发布 Stable Diffusion 🔗
  • 2022-11-24: Stability AI 以开源形式发布 Stable Diffusion 2.0 🔗
  • 2022-11-30: OpenAI 发布以 GPT-3.5 为后端的 ChatGPT,开启指令引导的流畅文本生成范式 🔗
  • 2023-02-06: 谷歌公布 Bard 以挑战 ChatGPT 🔗
  • 2023-02-07: 微软发布 New Bing,重新定义搜索引擎 🔗
  • 2023-02-22: 微软公布手机版 Bing 🔗
  • 2023-02-24: Meta 发布 LLaMA 并开放代码,堪称 ChatGPT 平替 🔗
  • 2023-03-01: OpenAI 开放 ChatGPT & Whisper API 🔗
  • 2023-03-06: 谷歌发布通用语言识别模型 USM 🔗
  • 2023-03-10: 谷歌发布 PaLM-E 🔗
  • 2023-03-14: 谷歌开放 PaLM API 🔗
  • 2023-03-14: OpenAI 发布 GPT-4,较 GPT3.5 实现飞跃式提升 🔗
  • 2023-03-14: Anthropic 发布 Claude 🔗
  • 2023-03-15: 百度发布文心一言 🔗
  • 2023-03-15: Midjourney 发布 Midjourney v5 🔗
  • 2023-03-16: 微软发布 Microsoft 365 Copilot ,登陆微软全家桶🔗
  • 2023-03-17: Stability AI 发布 Stable Diffusion Reimagine 🔗
  • 2023-03-21: 谷歌 Bard 开始公测 🔗
  • 2023-03-21: 微软发布 Bing Image Creator,接入 DALL-E 生成图像 🔗
  • 2023-03-21: Adobe 发布 Adobe Firefly 🔗
  • 2023-03-21: NVIDIA 与谷歌,微软,甲骨文,Adobe 于 AI 领域展开深度合作
  • 2023-03-23: Github 发布 Copilot X,接入 GPT4 🔗
  • 2023-03-23: ChatGPT 联网,开放第三方插件 🔗

总结一下,过去一年,随着 ChatGPT 的发布与 Stable Diffusion 的开源, 文本生成与图片生成产品蓬勃发展。三月以来,AI 的曝光率猛增,这两周甚至是每天都有大新闻。说实话,如果我说我不焦虑,这是不可能的。我对于这一年的热门技术,都是只闻其名,不解其意。我虽然也有去凑热闹通过新闻或者试用去了解这些技术都是做什么的,却不知道这些技术是如何发展的,也不知道我该如何应用这些技术,未来我能做些什么才不会被时代淘汰。最近有两篇论文,就直接讨论了现有 AI 模型的通用性,其对人类工作的影响,与 AGI 时代的到来,更是加剧了我的焦虑情绪,于是我便先从这两篇论文谈起吧。

Everdell 仙境幽谷的简介与牌组分析

Everdell是我们很喜欢的一款桌游,重开了不下十次,还花了三百刀巨款买了山一样大的完整版。上周五我们又开了一次Newleaf扩展,我做了一系列风骚操作,在有几次失误的情况下还是拿了140分,非常得意。晚上在奶茶的作用下有点失眠,就构思起了这篇文章,想介绍一下Everdell,并简单分析一下基础包的牌组。

Everdell中文名是仙境幽谷,是一款工人放置+手牌管理的德式桌游。如其名字一般,这款桌游主题可爱,画风精美。玩家作为小动物从冬至秋经历四季,捡木枝,树脂,石子和浆果,搭建自己的城市。每一回合中,玩家可以在放置工人,打出卡牌或者换季结算这三种行动中选择一种完成一个操作。放置工人可以获取资源或者发动技能,花费资源可以打出卡牌,换季结算则可以回收上一季使用的工人,得到新的工人,并收获(春秋)或得到草地卡牌(入夏)。游戏中有四种资源,获取的方式从易至难排序分别是木枝(Twig)>树脂(Resin)>浆果(Berry)~石子(Pebble)。除了每回合行为受限,手牌和城市也有数量限制,分别是8张和15张牌。游戏结束后,玩家会对城市内的卡牌及达成的事件成就结算,分数最高的玩家获得胜利。

Everdell在BGG的家庭游戏中排第四,总体排名31,对于我这种讲究桌游画风精美主题亲切的人来说,Everdell绝对能排到前三。Everdell的复杂度有2.8,算是策略性比较强的游戏。最佳人数是1-4人,虽然玩法基本一致,但是双人游戏和四人游戏还挺不一样的。双人玩的是运筹帷幄,打出风骚操作拿高分,而四人玩的则是临场应变,如何螺丝壳里做道场。而Everdell的几个扩展包,每个玩法都不一样,以后有时间的话我也打算讲一下这几个扩展包。

Everdell的基础版有48种卡牌,一共128张,分为需要通过木枝,树脂和石子打出的建筑牌以及可以通过建筑免费下或者花费浆果打出的动物牌。而卡牌从功能上又可以分成五种牌型,分别是绿色种子图案的收获牌(Production),红色爪印图案的造访牌(Destination),赭色行李图案的游历牌(Traveler),蓝色公文图案的市政牌(Governance)和紫色风车图案的繁荣牌(Prosperity)。收获牌有16种,其他牌型各有8种。这些卡牌每张都有特殊技能,或与资源相关,或与卡牌相关,有些牌甚至可以影响打出的卡牌。而我玩了这么多局后,也发现有些卡牌配合后,可以取得一些不错的效果,非常好用。这篇文章就来细讲一下基础包里手牌和一些我比较常用的配合策略。

注:由于我的Everdell是英文版的,这里的中文翻译不一定准确。

跟风AI炼图

Stable Diffusion 发布以来,逼真的画风就让大家感慨画师的饭碗是不是要被抢了。当时女票用 Stable Diffusion 重绘了几张狗子的照片,但我总觉得用别人的搭好的服务会有隐私隐患。最近 ControlNet 出来后,当时被大家吐槽的六指问题似乎得到了解决,于是我这两天就尝试着在 Colab 上搭了 Stable Diffusion 炼炼图玩。 – 为什么不用亚麻的Sagemaker?当然是因为 colab免费易用 要支持女票工作咯。