LongCut logo

Rum: 从前沿突破到牛马大军,人类挑战癌症的层层战场

By 蜉蝣天地 Meanders

Summary

Topics Covered

  • 细菌基因组记录亿年病毒战争
  • 癌症十年内可被有效控制
  • 免疫检查点被癌细胞伪装利用
  • 蛋白质三维结构决定所有功能
  • 单细胞空间组学发现新靶点

Full Transcript

本身你看生物或者看细菌的这个基因组 就像一个考古 它记录的是它的这个亿万年的进化 的一个结果 它这个进化中 就包括它捕获病毒的序列 然后插到它的体内 这个 Spacer 的这个序列 就是对应着一次古老的一个战争 对病毒和细菌的一次战争 就是考古的那种好奇心 对 是一样的

这是一个细菌对病毒的防御战 然后就是对一些有直觉的科学家 他们就是能够在没有证据的情况下 提前想到这是 一个免疫的机制 对 甚至是在这个基础之上 它又演变出无数种的变体 无数种的更复杂更 Fancy 的方法 今天我们邀请了一位非常有趣的朋友 Rum 他目前正在美国湾区的 一家行业领先的生物医药公司 担任 Principal Scientist

主要从事创新药的早期研发 Rum 的工作横跨单细胞和空间组学 到利用 AI 发现新靶点 推动药物管线 毫无疑问 他是当下生物医药领域 最前沿的科学家之一 而在这之前呢 他也有很多年扎实的癌症研究经验 对机器学习的各种方法也都非常熟悉 这次趁着他回国 我们邀请他一起聊一聊 科学前沿领域的很多新知 他个人的科研故事

以及对于制药产业 以及其中百万漕工的个体处境 的一些理解 Rum 最近也开始做自己的播客节目 叫做朗姆酒瓶 那档节目跟他的科研几乎毫无关系 现在的内容都在谈论建筑 也推荐你一并订阅 我记得咱们去年 6 月份第一次见面 在旧金山 对 你请我和小白免吃了个 Brunch 当时就是你 你跟我说的话 我一直到今天还在到处跟别人去讲 我说

硅谷有一个做生命科学的 一个科学家跟我说 他认为未来 10-15 年 癌症是一个可以不说完全被解决 但是能够被控制的一个展望 我就觉得这是一个特别狂野的说法 因为今天每时每刻 我们还在因为癌症而失去身边的人 除了心脑血管疾病以外 癌症应该是 就恶性肿瘤

应该是人类第二大的杀手吧 所以我就觉得这实在是太有意思了 就是在这个 前沿正在发生非常非常多的事 就以我来说吧 除了这几个名词 AlphaFold 和什么 CRISPR 以外 什么 Cas9 之外 包括这词是什么意思 我们都不知道 但是 我们已经往前走了这么远了 对啊 所以我就觉得这个特别有意思

所以这把就是借你回国的机会 咱们赶紧 来聊一次 可能这次会聊的比较弱智 因为我 我和汉洋都完全不是这个领域的人 我们会有很多很傻的问题 你就 Pardon us 不会 不会 Rum 你能简单说一下你的这个 求学和工作的经历吗 行 我是在国内的一个医学院 读的药学

专业的本科 然后完了以后 做了生物信息学的硕士 然后去了美国 在一个癌症研究中心做博士 主要在 PhD 期间做的是肝癌相关的 然后完了以后 到了博后 做的是乳腺癌相关的东西 然后在博士到博后的时候 我就开始接触到一个叫单细胞组学

和空间组学的东西 然后 也包括很多 AI 和 Machine Learning 的东西 我主要是偏计算的 计算生物学 然后主要在癌症这块的应用 然后在我结束了这个博后了以后 我就加入了一个 生物科技 生物医药公司 做 AI 和 Machine Learning 的科学家 对 那你刚才说的短短的 30 秒的话 里面已经有七八个 就是

根本就是我俩 不知道是什么意思的概念了 但是我估计今天咱们早晚都会 都会处理 就是今天发出的第一个挑战 你能尽你所能的用白话讲一遍 你的博士做的是什么课题吗 就是你研究的对象 和你做出来的结论是什么 行 因为我从硕士博士到博后

具体的疾病 或者是具体的那个工具上 稍微会有点变化 OK 但是我就以我现在为主的就是我博后 到我现在为主的这个 我用的是叫 单细胞测序加上空间组学 再加上 AI 去了解一个疾病 因为我现在不 仅做癌症 因为我们公司的话 它有各种各样的疾病 叫 Disease Area 你可能会做别的

但是我自己的 Expertise 在癌症上面 就比如说去理解这个癌症 它的一些机制 然后我们希望通过这个机制 去获得一些可能的 比如说新的靶点 或者是我们从临床实验中拉来的数据 我们去解析这个药物 它有没有在 Work 有没有按照我们想法在 Work 然后我们能不能够

对那些就是 Response 不好的病人 提供一些新的方法 提供一些新的靶点 对 那你怎么知道呢 你是就是这个人吃药之前 你先做一个类似于那个活检 切片或什么之类的 然后他吃上药之后 你再不断的去采样 对 拿出来看观察 对 一般会有一个叫 Baseline 然后有一个 Post 就是 Treatment Post Treatment 就有两个 甚至

Post Treatment 可以有多个时间点 OK 对吧 比方说你在 Baseline 的时候 对他进行一次 就是穿刺的那个采样 然后治疗 治疗完了以后 四周或者是几周以后再去穿一个 然后再去拿一份样本 然后我们有大量的这样的样本 然后呢 这些样本会进入到我们这个研究 研究的话就是比如说用单细胞

就是我们想去解析这个样本中 每一个细胞 它的基因表达的丰度差异 嗯 然后我们通过对比 治疗后治疗前或者是治疗后 有响应和没有响应的人 我们去找到他 有没有一种特别小的一个 比如细胞的亚型 它在这里 面发挥了一个重大的 Difference Make a Difference

但是它还不一定是 Causal 它不一定是原因 直接的原因 对 它可能是 Passenger 它 可能是因为某个原因产生的结果 贡献性 对 然后我们找到这些东西 我们再去找它 有没有一些特殊的基因 产生了变化 OK 然后我们会罗列出很多基因来 然后这些基因 我们认为是一个可能性的靶点 我们通过各种计算的方法 对这个基因进行排序

这个对基因进行排序的时候 我们就要结合一些其他的信息 去判断这个基因是不是 Causal 是不是这个 Driver 嗯 如果这个基因最后被证明是 Driver 的话 我们就可能要去和下游的实验室的人 去设计 就是我们把这个基因敲了以后 看这个细胞 是不是发生了我们预期的变化 OK 如果确实如此 那么就证明这个基因 可能是一个 Driver 就是一个好的靶点 嗯

我们就可以专门去设计对应的药物 去针对这个基因产生的蛋白 靶点其实是蛋白 但是基因是产生蛋白的嘛 对吧 OK 那我觉得 得跟观众们简单解释一下 癌症是啥 以及 就你们现在怎么在治这个癌症 我觉得后面很多事才能聊 对 必须得 咱这个必须得从头去理一遍 这个这个 这个事就是你先告诉我 相当于是我听你这么说 相当于你 你和病

你和患者一直是一步一步的 都有这个间接的交互的 你要不断的去看他的 那个病灶的变化 我们可能会有 但是个时间点 时间点 OK 但是你 你没有在 Treat 他 我们不 Treat 对 那我可不可以这么理解 就是那个医生有时候会说 这个东西要送检 过几周之后有结果 嗯 那个时候你是 那个是病理 那是关于他的 对 那个是医院里面的一个专门做病理的

但我们这是研究 哦 就是我们要去研究出新的东西 研究出它的背后的机制 对 所以你服务的 不是这个患者 他本身 对 而是就是服务一个漫长的药物研 研发的一个过程 对 那你大概在哪个位置呢 就是这个药物研发的 哪个环节 就是你会进入呢 如果在我刚刚说的就是靶点研发的话 新的靶点发现的话

我是在非常非常上游的 就是 我希望通过从疾病病灶拿到的数据 去找到新的靶点 或者找到可能性的一些新的治疗方案 对吧 这是非常非常上游的 但是我们也可能会接入到 在临床实验中 也就是正在进行的管线中的药物 它有没有响应 或者是我们对它进行一个理解

它是不是按照我们的预期在运作 对 然后我们的这个解释 这样的一个 Report 或者这样一个 整个一个 Mechanism 的 一个 就是机制上的 这个东西会回馈到 临床上的专家 他们可能会决定 这个药我要不要再做下去了 有可能我就不做了 嗯 对 那如果这个药已经做出来 就像你刚才说的你 就是你

你也会参与评估那个药的效果 对 那这个就是在临床实验的的中间了 对 在临床实验一期二期三期中间 对 在那个时间点 你有可能还会再改这个药吗 就是说你认为就是怎么 这个是不可以的 一旦进入的话 他的药物是不可以再去改的了 如果你要改一个新的 你要重新去做一遍临床实验

好 我们已经受不了了 那咱就从头来捋一遍 这个是怎么一个过程吧 就是 所以抗癌的药物 是关于 怎么有效的杀死这个癌细胞的 而且不是通过药物来杀死 是让免疫系统自己去杀死 我理解对吗 呃 确切的说是整个肿瘤治疗的历史的话 我们要把它拉开来看的话

从最开始化疗 对吧 他是没有任何靶向的 他是用一种非常有毒性的化学物质 进入到体内 让大家一起死 对 一起杀 其中因为肿瘤它增长的比较快 它分裂的比较旺盛 所以他可能死的比较多一点 对吧 这就是化疗的机制 是 然后从化疗到一个新的

就是我们试图去找到这个肿瘤细胞 它的表面有没有一些特殊的 我们称之为靶点的东西 我们希望制造一种化合物 通常靶向治疗 我们说的是一种叫单克隆抗体 它是一个大分子的蛋白质的药物 去专门针对性这个癌症细胞表面的 这个靶点 去抑制住它 然后这个癌细胞就不能再去增殖 不能再去分裂了

OK 然后呢 这之后又进入到这个免疫治疗的时代 免疫治疗 就是说 我们人体内本身有一个免疫系统 它会帮你去杀灭外来的那些细菌啊 那些东西 但是癌症 其实它在发生的过程中会产生突变 突变最后会变成一个很奇怪的蛋白 在癌细胞的表面 这个就被称为抗原

理论上免疫是可以识别这个抗原的 并且把癌细胞杀掉 所以这里有一个很有意思的 就是我不知道大家知不知道 就是一个人 正常人哈 没有得到 不是癌症病人 一个人的正常的一生 其实你会产生大量的癌细胞 你的身体里面 但是都被免疫清除掉了 就不成气候 对 不成气候 但是癌细胞如果激活了一些机制

它可以免疫逃逸 它就可以活下来 它在那个区域 然后慢慢慢慢的发展壮大 就地下组织 对 然后就起来了 然后最后到一个程度上就不能控制了 就变成了 这个就是肿瘤病人了 对 对 所以这个恶性肿瘤的苗头 是 From Time to Time 一直在我们身体里面发生着的 对 只不过是局面从来没有失控过 细胞只要分裂就有可能突变 只要突变

就有可能变成 这种类似于癌细胞的东西 OK 所以所谓的那个就是恶性肿瘤 这个癌细胞本身并不是 并不必然是恶的或者是 对 有很多良性的结节或者什么的 都没事 他没事 他不分裂 或者他不去往外扩张 就没有事 对 然后是什么机制 在让我们的身体 能够

压制住这个东西呢 不停的在闹腾 对 我们说的这个免疫 比如说这个肿瘤突变 然后它的表面产生了一个特殊的抗体 特殊的 说错了 抗原 然后这个免疫的 T 细胞 或者是这些细胞就会识别 然后把它杀灭 嗯 但是你想一下 就是 免疫如果过强了的话 人会产生叫自免反应 他会对自己也产生排异

甚至是 比如说孕妇 她怀孕的过程中 其实小孩对孕妇来说是一个异体 嗯 如果免疫过强的话 是会对胎儿进行攻击的 对 所以免疫必然有一种调控的 负反馈的调控机制 而这个调控机制就是通过一种 今年得了诺贝尔奖的那个 Regulatory T Cell 叫做调节性 T 细胞

这只是调控机制中一环啊 它有很多调控机制 这个调节性 T 细胞和杀伤性的 T 细胞 对话 说这个是胎儿 别攻击他是吧 你们回家睡觉 别攻击他 你们不要那么活跃 嗯 然后呢 这个杀伤性的 T 细胞就不去攻击了 那么这个胎儿就正常 但是癌症会模仿这样的免疫调节

然后用一些东西去触发 和这个杀伤性的 T 细胞进行对话 其中一个最有名的就是 PD-1 和 PD-L1 T 细胞的表面表达一种蛋白 叫 PD-1 然后癌细胞的表面表达一种蛋白 叫 PD-L1 它本来是一种免疫检查点 让 T 细胞进行抑制的 自体抑制的 对吧 在正常情况下 调节性的 T 细胞会通过这个机制

和杀伤性的 T 细胞对话 让他回家休息 T 细胞身上的 PD-1 扫描到了对象上的这个 PD-L1 的特征 他就会认为这是无害的 对 这是无害的 OK 所以这个机制本身是正常 因为我们身上的别的无害的细胞 也会表达这个玩意 就这个 PD-L1 的 这个就是通过调节性的 T 细胞 和其他的一些东西去表达这个

然后去控制你体内的免疫 不要过强 对 对 但是癌症也通过这个方式去跟它结合 对 我就说这 这个就有点像是密钥的匹配 钥匙和锁的 钥匙和锁 PD-1 和 PD-L1 的配对 一直在我们身体里面发生着 对 只不过是我们不希望 癌细胞掌握这个方法 是的 因为这样的话 它就不被识别为

它是一个正常的调节性的机制 但是 癌细胞利用了这样的调节性的机制 嗯 因此他跟杀伤性的 T 细胞对上话了 对了个暗号 杀伤性 T 细胞识别不了他了 OK 那么癌细胞接着长 那么这个治疗 免疫治疗 就是我设计一个抗体 嗯 这个抗体或者去抗 T 细胞上面的 PD-1 或者去抗癌细胞上的 PD-L1

就叫 Anti-PD-1 或者 Anti-PD-L1 等会 如果这个药让 PD-1 被抑制了的话 那 T 细胞岂不是变成一个很 盲目的杀手 见什么就杀什么 那怎么办 是的 但是这个时候 其实癌细胞是最主要的敌人吧 它依然是对癌细胞 它对癌细胞是更加 因为它更多 增殖更加多 但是你说的也是

不是有潜在的风险 导致一些自体的免疫反应 当然是有可能的 因为你抑制了他的这个免疫检查点 OK 对 PD-L1 的抑制 这完全是好理解的 因为他是肿瘤 这个是肿瘤 没有那个蒙混过关的 伪装了 他不就更容易被识别了 是这样的 是的 那这两个事怎么实现呢 关键是 这两个就是通过我们设计一个叫做

比如说单克隆抗体 它就是一个蛋白质 它这个蛋白质长的是一个 Y 的形状 嗯 然后这个 Y 的这两个手是有特异性的 识别 它会识别到 PD-L1 然后把它挡住 就把它加了一个盖子 或者是一个手挡住了 这个 T 细胞的 PD-1 它就是把它盖住了 然后它就没有办法通过这个对暗号了 就是很粗暴的就把它盖住就可以了 但是关键问题是特异性

就是一定要让它识别是对的东西 它不能识别到别的东西上 把你别的身体的功能给弄坏了 对 这个地方咱们可以岔开讨论一下 就我第一次见他的时候 他跟我说过一个 让我脑子特别颠覆的东西 就是咱们中学学 化学的时候学到那个 分子式是没有空 没有形状的信息的 就是化学键 把原子连接在一起吗

对 然后形成一个分子 它如果那个链条特别长的就比较大 对 那是大分子 对 对 对 但是这化学 这化学式里没有描述它们的形状 没有 但实际上蛋白质作为一个大分子 它是有各种各样的形状 是的 你读过那个苯环那个故事吗 没有 就是一哥们做梦梦见了这个形状 然后发现真是这个形状 他百思不得其解 不知道这个苯应该是什么形状 然后他突然有一天梦见了 然后研究了才发现 真的是这个形状

所以啥概念 是说一个蛋白质的这个大分子 它是有凹凸的吗 我大概解释一下啊 首先 我们知道人体内有 20 来种不同的氨基酸 对 氨基酸 它的那种 pH 啊 那种疏水性 和那种亲水性稍微有点不一样 嗯 对吧 这 20 种结构稍微不一样 然后当这个氨基酸排成一个序列 就叫做肽链

这个肽链 因为它每个氨基酸有不同的亲疏水性 然后不同的氨基酸之间会互相作用 在空间中 对吧 它就会折叠 折叠以后就形成了一个叫二级结构 从这开始就离开中学生物课本了 常见的一个二级结构叫 Alpha Helix 就是他们会折叠成 一个 Alpha Helix 螺旋 或者是叫 Beta Sheet 它就是这样子的 一个毯子一样的东西 这是一个显微镜能看见的东西吗

这个需要非常非常高精尖的东西 才可以看到 而且需要你去通过一些计算 去把它解析出来 就没有那么直接 不能直观的看 不是那么直观的 不是人肉眼能直接看 对 但是你在课本上看到的 那个 3D 的那个东西 给你画的特别清楚 但那个并不是真实的样子 OK 并不是真实 你直接看到的样子 咱们看到是重构出来

对 咱们看到是一个 3D 建模以后 重构出来的一个东西 然后这些 Alpha Helix Beta Sheet 和各种各样的结构 再在空间上再折叠一次 形成了所谓的叫三级结构 这就是一个蛋白质 我们一般认为的 它的这个三维构型 在体内的一个三维构型 其实呢 不同的蛋白质还可以互相结合 它就形成了一个四级结构 就是我们通常就是称之为

就是一二三四级结构 这就是它的空间中的 3D 形状 3D 的结构 然后它这个 3D 的形状 就是在它的表面上会形成各种凹凸的 这个起伏的口袋啊 或者是凸起 这些凸起和凹凸的东西 它就是发挥它功能的最重要的东西 举一个例子就是你知道酶就是蛋白 对 对吧 这个酶是怎么发挥作用呢 就这个地方正好有一个

有一个空间有个口袋 A B 两个化合物进来产生 CD 然后如果你把 A B 放在一个溶液里面的话 它发生这个反应可能需要花几个月 对 很漫长很漫长 Hours to Days 对吧 然后但是你提供了这个口袋 AB 就掉进去了 然后它的整个这个空间 对 它产生的这个构象 它就很容易催化它的反应

然后就产生 CD 所以它是发生在空间的概念 它是发生在空间上的 发生在蛋白质的一个空间上 的一个东西 然后呢还有蛋白质 就是这个蛋白质通过这个口袋 或者通过这个凸起 和下一个蛋白质结合 然后引发下一个蛋白质 发生一个形态的变化 再去和下一个蛋白质发生这个结合 这就是一个信号通路的过程 就这个信号通路 怎么从最上游

A B C D 一直推下去 就是在这样的过程中发生 所以所有的功能 都是集中在蛋白质的空间结构上的 你刚才说这个一二三四级结构是 就是我的意思是 我们通常说的 我们身体里面的那些有用的东西 就是酶也好 或者就是各种各样的蛋白质发挥作用 都是发挥在你说的这个 四级结构的这个层面上 3 级和 4 级往上 对对对

再往下一二级就太微观了 对他本身不会 一二级本身只是信息而已啊 嗯 他没有功能 那说到信息 我们都说 DNA 那 DNA 和这玩意儿的关系是啥呢 就是我这里会说一个生物学 高中应该是学过 这个叫生物学的中心法则 DNA 它是一个非常非常长的 一个蓝本 一个序列蓝本 它会转录成 RNA 它是一段一段的

基因的这个转录本对 这个 RNA 再被翻译成蛋白质 其实 RNA 每 3 个就对应一个氨基酸 然后按照这样的匹配 就产生一个蛋白质的 这个多肽的这个链 嗯 就是氨基酸的这个序列 然后这个序列最后折叠 折叠折叠 形成一个蛋白质 那这我有个问题 每三个 RNA 就会匹配成一个 3 个碱基对 对

就会成一个氨基酸 那么理论上来说 氨基酸就这么多种 对 80 多种 那人类应该已经穷尽了所有的东西 但是它的排列组合是无限多的 所以不能从氨基酸这层面去看 去看它的功能 明白了 它的排列就是我们单词就 9000 个 但是你可以写出无数本书 对不对 对哦 那其实更像是笔画 字母 单词 句子之间的关系 笔画

因为你笔画就这几种 然后笔画组合成 A B C D E 也就这么 24 个字母 但这 24 个字母 已经可以组合出无数单词了 无数单词又可以组合成无数的句子 我觉得可以粗糙的这么理解 但是它比笔画更复杂的是 它在那个 DNA 里面 它就已经决定了这个蛋白质的序列了 它在 DNA 的这个 4 个碱基的排列里面 他的信息都已经蕴藏在里面了啊 就是他定的是更严的 嗯嗯 对

他不单是一个笔画的本子 或者笔画的一个字典列表 对 他是一个有排序的有顺序的一个东西 就是这个笔画已经在这里面排好了 只要他通过层层的机制 最后就会产生那个字 就这个字已经被 Encoded 在他的 这个序列里了 嗯 明白 就笔画和笔画之间的关系 和笔画本身 已经在这序列里 是一起储存在里面 是的是的 所以 DNA 不是随机的

不能是笔画的一个随便的一个 一个 Bucket 对 它不是纯零件对 它是半零件半蓝图混在一起的 所以理论上来说 所有人类的 DNA 是一样的 理论上来说 你的体细胞里面的 DNA 是一样的 嗯 对 但是你和重轻的肯定是不一样的 它的 DNA 的序列上 肯定是或多或少有点差异的 嗯嗯 因为他的表型最后是不一样的

那我这个就小时候就有一问题 就当年我上学的时候 在测那个基因组嘛 就人类基因组 当时上生物课的时候 这特别大一事感觉 你小时候正是这个工程的 过程之中 我那时候 两千零几年 对啊 刚提出 21 世纪是生物的世纪 那时候还不是天坑专业呢 现在还在提呢 对 然后 但我听你聊完 觉得提这个是有道理的 就咱接着说这个事 那个时候 我当时脑中有一个巨大的疑问

这个人类基因组是哪个人的基因组 对吧 就是那他 这得是一样的 你测才有意义 如果咱俩都不一样 那你测它有什么意义呢 这个地方 我到时候我得可能要去查一下 据说是来自于某一个人的 但是我并不确定 我并不确定是不是只来自于他 我小时候那个想法 但我据说 好像我们现在用的这个叫参考基因组 是来自于一个人的 但我得要再去确认一下 因为这个事在我脑中 小时候像那个露西一样

你知道那人猿露西 就是那个人 那个人是我们 对 我们所有人的共同祖先 是那一个人吗 他不是共同祖先 他是一个参考 对 就我们就把他定为参考 或者就把这个基因组定为参考 模式标本嘛 是的 就跟那个 他本身当然是武断的 就是就跟那个华氏度的那个 的那个零度 是一个 是一个具体的人的体温一样 嗯 对对

华氏度的 100 度是人的体温 然后那 那姐们早上发烧 所以导致华氏度 100 度 有点高 他本身并没什么特别了不起的 但是你总是要有一个 Baseline 你一定要测一个东西 然后拿这个东西作为尺子 咱们上学的时候确实这方面 我觉得他那个描述是不准确的 嗯 就是他 他是个抽象的东西 嗯 但人们用特别具象的方式在形容他 对 而且你刚才说的我一直在考虑 就是我仿佛在听你说

这个生命的那个从最极简形态 到开始就产生复杂性 最终一层一层的那个 这复杂性爆炸 组合出咱们这种程度的生命体的 这个过程 这过程里面 我感觉那个 那个本质的东西还是蛋白质 而不是 DNA 但是它的序列信息是来自 DNA 储存在 DNA 对 它的信息都在 DNA 里面

就 DNA 给我一种感觉好像是生命 因为最低层次的生命 是没有 DNA 的嘛 RNA 生命 对 RNA 假说 所以就是 DNA 像是就是 有点复杂了 然后就说 不行不行 咱们得找一地把它记下来 是是是 你说的感觉是完全正确的 嗯 最早我们现在认为这个生命叫 RNA 生命假说 嗯 为什么是 RNA 呢 因为 RNA 它是一条单链

然后单链上面会有些 那个碱基对 有些碱基对可以匹配配对 然后它就可以折叠起来 嗯 折叠成各种各样子的 也是二级结构 嗯 折叠成了二级结构以后 它既可以像蛋白质一样催化一些反应 对 也可以记录信息 OK 所以它一个 RNA 可以承担 就是两个功能 对 所以我们认为最早的生命就是 RNA 就可以了

但是后来发现 RNA 太不稳定了 对 它太容易发生问题了 对 所以我们要一个更高保真的东西 把它给抄下来 就变成 DNA 了 就是好像有点像从热存储进冷存储了 就是差不多稳定了 就是那从这个角度来看 什么是生命呢 会催化和会记录信息的 就是生命吗 就是显然没有一个明确的定义 但只能说说我的理解哈 就是

我觉得可以自发的进行复制的信息 就可以算了 对 并且可以传播 可以复制 可以传播 然后他有一套 这个就是 Mechanism 就让他去 Sustain 嗯 让他去 这样子一直存在 其实你说 我感觉是 只要能这个东西作为一个个体 他在想方设法的制造蛋白质

我就觉得这肯定已经 但是他要能自复制 自复制这个点特别重要 自复制 对应编程里面就是有个叫递归 递归程序 它是要有一个自指性的 就是想要理解递归 你必须先理解递归 对 就是它 这个这段序列 绝对不是只变成一个蛋白质 OK 他一定要是这个序列要变成的东西 是要把他自己再 Copy 一遍 再 Copy 一遍 对 或者是他跟别人配合起来

再去把他们 Copy 就解释到一个程度 之后他只是在解释自己了 有点就表达自己 他这个 今天聊这事 让我有个这 完全题外话 但我觉得它又相关 就是我上学 因为我特别喜欢爬行动物 这个很多朋友知道 我上学的时候 一直觉得我大学想研究这东西 我要该学生物 所以我从小到大一直是生物课代表 直到我上高中的时候 突然意识到我想学的是动物 生物不研究这玩意 对

生物研究的是分子生物 对 但 但我现在如果让我回想这个事 那为什么我小时候会有一个误解 认为生物学的研究 我边上的鸟和猫 你说的没有错 生物经过了几次进化 生物最早甚至在达尔文 比如说在之前的话 它就是一个 收集和 Categorize 把它编成目录 编成一个一个物种的目录的过程 就是一个收集 一个博物学一样的专业

嗯 但是比如说在达尔文之后提出进化论 然后再在之后 我们有了一些关于这个 DNA 的 这个双链 因为最近 Watson 不是才去世嘛 对吧 他和 Crick 发现了 DNA 是存储信息的 然后提出了这个双链结构 我们认为 这是一个 Hallmark 从这之后 人类进入分子生物的时代 在这之后 我们开始研究 DNA 开始研究 RNA

开始研究蛋白质 而不是把生物非常粗糙地进行分类 整理变成一个目录 对 所以我可不可以 他们有共同基础了 可不可以理解 今天当一个人说 他学生物的时候 默认研究的都是分子生物 Watson 之后那个分子生物 对对对 所以这是我小时候最大的那个疑问 如果有人上来就告诉我这个事 说这玩意是俩东西 然后你们现在作为小孩 你们学的这个部分有点混杂 但你们越往后

它越分开 分得越清楚 我就没有这个误解了 是的 或者说是生物学 它永远不可能放弃自己 那个就是最本质的追求 就是 它想要有一种类似于大一统的解释 他希望理解 他想把所有的生命 都用一个范式解释出来 而喜欢爬行动物的人是不在乎这个 他就想研究爬行动物 对你需要把它分门别类 然后整理到你喜欢的那个词条底下

你刚才说的那个一级二级三级 四级的分类里边 是不是到一级这么微观的程度 人和别的动物已经开始有共性 你说的没有错 它在蛋白质 其实人很多蛋白质是有同源的 就是在别的物种中同源的蛋白 其实这也是 AlphaFold 能够成功的原因 就是同源的蛋白 你把它拆成一维的氨基酸序列 嗯 理论上和一只猫一只狗的同源蛋白 的氨基酸

序列应该非常相似 所以你可以做 我们叫一个 Alignment 互相比对 做一个比对分析 但是你会发现 中间有些氨基酸是被调换了的 被调换了的 它尤其是出现一对一对的 比如说这个地方和这个地方 是同时被调换成另外一个 就是 Across 非常非常多的物种 那么意味着 这两个东西可能在空间上是接近的 在三维空间上

因为这个换了 你那边不换的话 它的三维空间就没法维持了 你必须要换另外一个东西 它才能保持住它这个同样的构型 嗯 所以其实 AlphaFold 就是利用这个信息 再加上就是一代 加上一些 卷积神经网络 去学习通过这个同源的相似性 去学习出一个它可能在空间上 这些氨基酸

这些残基之间的接近程度 的一个图谱 然后通过这个图谱 反推出它的空间结构 哎 那当一个人在说 比如人和老鼠有 80% 基因是类似的 人和大猩猩应该是有 98% 还是 99% 的基因是类似的时候 他在说的是哪一个层面上的类似呢 他这个显然不是碱基层面上的类似 他可能说这些基因有同源性 然后这么多序列

它是有基因上的同源性 他认为它是类似的 就是你说这个 90% 多 其实它是一个概念性的问题 就是 就 Eventually 你也可以把你和比如说重轻的 对吧 测个序 它也存在大量的这个差别 如果在碱基上的水平的话 它也存在大量的差别 OK 因为这么说总让 人会感觉 人类就是一个程序 一段代码 只不过有一段代码被替换了 你就变得完全不一样了

比如说人和老鼠就替换了 20% 那人和猩猩就替换了 1% 2% 其实你想想他染色体的数目都不一样 他怎么可能只有百分之 就是对啊 90% 都是一样的 我就意识到你这么说完之后 我感觉很 就是这个比喻 是非常非常的不精确和不能被滥用的 对对 我觉得这可能是为了一个更好的 去让大家理解 一个非常粗糙的 我们都是同源

所以我们很早很早以前都是同源的嘛 所以我们有大量的共享的这个序列 或者共享的基因 但是你去看微观层面的话 他们差别其实还是蛮大的 但不管怎么说 这个生命的所有的功能 都是通过蛋白质来实现 是的 然后蛋白质是通过这个 RNA 就是制造出来 那个叫什么 核糖体是吧 RNA 然后核糖体去翻译 RNA

核糖体是一个 也是一个蛋白质 它去翻译这个 RNA 一段一段一段的翻译 然后变成了氨基酸序列 然后变成了蛋白质 对 然后在这过程中 RNA 本身也能复制吗 RNA 不能复制 但是 RNA 可以 RNA 相当于什么 就是你是一段 DNA 是一串 对 但是基因 A 基因 B 基因 C 基因 D 对吧 对 RNA 我只抄这么一段下来 基因 A 抄

但是我抄 100 份 A 10 份 B 两份 C 一份 D 在这个细胞里面 然后在另外一个细胞里面 我抄一份 A 100 份 B 是 Whatever 然后 C 和 D 嗯 最后它们被翻译成蛋白的量就不一样 嗯 翻译成蛋白的量不一样 它的形态 它的功能 它的结构就完全不一样 在细胞层面上 OK 对 最后就转到了细胞层面

所以这也是为什么引导到我们 我们要做单细胞测序 哪怕是同样的细胞类型 它在疾病的状态下 和在正常人的体内 它其实都存在的 这种 RNA 的这个丰度变化 嗯 那我们通过找到这种丰度变化的差异 有可能能确定这个疾病相关的 丰度是哪俩字 丰富的丰 对 丰度 对 丰度 它其实是个含量的概念

含量 对 那就是 所以我们还是不能看见它 就是咱们现在说了半天 大部分的东西都是一种 有点像统计结果一样 分子生物没有什么是直接看到的 所有东西都是通过各种各样的 Assays(化验) 去测量出来的一种结果 然后你把这个结果去解读成为一种 就这个事 真太诡异了 其实它不是一张照片 它不应该叫生物学

它应该叫统计学啊 这是啊 其实统计学就是来自于生物学 就是我们想象统计学可能来自于数学 来自于概率论 其实不是的 就是统计学的发展 最早是来自于 大家想要去测量一个田里面的 什么粮食的产量的变化 还是说什么啤酒的这个酵母 发酵的这个变化 嗯 就是由那个我忘了他的名字哈 Fisher 还是谁 一个非常早的统计学家 他设计了一整套方案

然后在这个基础上 就产生了整个统计学的这个领域啊 所以整半天我还是学生物去了 因为我数学系的嘛 你学的是统计学 我学的是统计啊 那整半天我还是跟生物有不解之缘 统计学是 是元科学吗 就是所有的科学 都建立在统计学基础上恨不得 但我的祖师爷确实是干生物的 以后就这么说 对 其实这个我觉得非常有意思的一点 就是

我们需要用到大量的统计学的东西 对吧 因为我们的数据量太大了 对 我们的信息量太大了 我们必须要用到统计学 但是我去跟我以前有个室友 是做那个 Mechanical Engineering 做那个机械工程的 我本来会把我的统计学的思维 带到它那个里面 我发现他们完全没有 就他们的论文里面 是没有这个东西的 我就突然就发现了 哦原来 什么领域你刚说 机械工程 机械工程 就在机械工程

或者是具体的一个物理的 一个什么的研究领域里面 它其实并没有把统计学纳入进去 因为它是一个比较清楚的 机械化的过程 但是当你这个层级越拉越高 越拉越高 这个噪音越来越多 就复杂度越来越高 你只能通过统计去把握它 你不能通过它还原成 ABC 这个具体的 其实这个事太有意思了

对 就是你 如果你稍微想一想 你会觉得说那个 Watson 他俩的那个双螺旋结构的诞生 是所有事的最 就像这本书的最后一句话 就是在这之前 所有事都被研究完了 就是从达尔文到孟德尔 就是基因这个东西 你是看不见的 对 但是关于基因 它所有的结果 所有它导致的特征 我们就是无数无数的人 用无数的方法

都已经就是这个东西 你在你摸不到它看不见它之前 你已经把它所有的特性 都恨不得它的表型 孟德尔做豌豆杂交 他不知道这背后到底是什么 对 但你就是看不见它 然后直到最后最后 是的 最后最后它才显露出来 是的就是 就相当于大部分的科学的前进 都是先用间接的方式

把这个事给摸透了 都盘出浆来 然后才能看见它 就很少有一个东西是先显露给你看 嗯 就先给你 先给你本质 你再研究它的因果关系 就跟现象 这个是自然的 因为你上来只能获得它的表象 嗯 然后它的表象很复杂 你只能通过 比如说孟德尔的这种杂交实验 通过统计学 去获得这个表象背后的一致性的 这种统计学的规律 嗯

但是你只是不知道 这规律背后到底是什么 对 我觉得都一样 比如你看那个结构工程 就结构 最开始也是很多工程师他不接受的 他们觉得这就是经验 它不是一个科学 它是花了很多很多年的时间 才让大家意识到结构本身是有科学的 里面有东西是能算的 对 所以就是一方面 那个比如说双螺旋结构 它是一个突破 它是一个那个 一个很多事的开头 但是它另外一方面 它是很多事的交代 最后就是

必须要解释 就这么回事 对 必须要解释 就是 Turns Out 它就水落石出了 是的 在这之后才有了分子生物学啊 说到双螺旋的结构的发现 就是那个 Watson 和那个 Crick 嘛 对吧 他们其实是受到一位女性科学家 Rosalind Franklin 她先拍了一张 X 光衍射的图片 嗯 那张照片 就是他们通过某种方式获得了 那张照片 嗯 就是在人家论文发表之前

他们获得了那个 然后和他们天天做的研究一下 结合起来 就 Figure Out 了这个结构 所以那个 女性科学家应该是叫 Rosalind Franklin 她也是一个奠基性的人物 就是她那张照片 只是她之前还缺了一点东西 没把它 Figure Out 那个 X 光衍射的照片 它看起来像一个叉一样的一个图 那个图你们可以看一下对 很有意思对

你能理解我们这些外行人的这种冲动 就当我老是没完没了的问你 这东西能不能看见 或者看起来是什么样的 因为我们人总是就 就跟他喜欢爬行动物 然后就发现 生物学对他的兴趣来说 不是那么友好一样 就是我们很不自在 当我们研究一个东西不能够实际的 就是接触它和观察它 但它是来自于活的 而只能研究它性质的时候 就很难受

是的是的 它不符合我们的一种就是最基本的 的直觉 因为我们对它的定义不是化学 如果是化学反应 我接受看不见它 但那东西是活的 他是我身上的东西但 但我看不见 摸不着的 就它所有的性质 你可以写成公式 化学反应就是 所以就是你的工作里面就是你 你要完全适应于不理睬自己心里的 我说的这种冲动 就是想弄个究竟

它就是究竟是什么样 而完全可以很安定的停留在 就研究它在统计上是什么样的 或者是在它的 我们观测的间接的结果是什么样 我觉得你说了一个非常重要的东西 但是我想要稍微反驳一下 就是我们不是直接看到它的形状 样子和颜色 对 但是我们通过各种检测手段 去获得它的部分信息

我们只要利用这个信息就可以 比如我们说观测到黑洞 对吧 我们说那个物理 他观测到的黑洞 不是那个画出来的那个黑洞的样子 对 他是观测到黑洞的那个图 你并不知道那个图到底是什么意思 它原始数据你根本看不见 那个射线的那个能量频谱里 对 那个一个 但是可以把那个东西最后还原 然后重构 然后给公众易于理解的方式

画成那个样子 外面那个黄黄的 中间是黑色的 对 而我刚刚说的 比如说 DNA 双螺旋的结构 他们看到的是一张 X 光衍射的图 那张 X 光衍射的图 放给一般人看 他们不可能知道 放给我看 我也不知道 这个背后就是双螺旋 对 但是他有一个他们的这种积累 他们知道什么样的结构 在 X 光底下会产生这样的衍射图谱 嗯 然后通过这个东西

反推出他的双螺旋结构 所以是 有产生这个认知突破的人 他就是他具备的是一种 就是几乎是一种手感 一种经验性的东西 对 就是纯经验嘛 就那种类似手感 直觉 因为他处理了大量的 X 光的东西 他处理了大量的什么 就是显微镜的都是他 然后在他这些非常虚无缥缈的

不容易总结成那个实在规律的 这个直觉里面 他就感受到了足够大的异常 然后他去实验验证的就找到了 是的是的 是这个 然后我们测单细胞的基因表达 嗯 其实我们用的是一种叫测序的方法 它并不是真正的 把所有的转录本的数给拿到的 我们也通过一种间接的

化学合成的方式 获得了与它对应的一种数据 这个数据并不意味着 我们说这个基因有 100 个 Count 并不意味着它在这个细胞体内 就是正好是 100 个 嗯 转录本的量 嗯 对 我们其实也是一个间接的 但是我们只要保证这个间接性 具有稳定的 可控的 我们得到的这个 Data 就可以拿来分析

可以去重新去推理他们在上面的过程 所以 你的那个就显示在那电脑屏幕上的 是个什么 就是测序 测出来的序是一张大表吗 就相当于多少个特征 然后在每一个细胞里面有 我觉得你这个理解非常好 这是我们在处理之后的数据 如果是原始数据的话 如果我们说测序的话 它的原始数据我们叫 FastQ 它是

它是一长串的 ATCG 或者什么的 然后等到拿到我们生物信息 或者是基因学习这里的时候 就已经变成了你说的 不管是行还是列 我们一般把行每个细胞 然后列是每个基因 它是一个叫 Count Matrix OK 它是一个 但是它 你这张表是一个计数记出来的 就是你 1 2 3 4 5 6

然后我就在这块写 6 对 那从原始数据转化到这个表里 丢信息吗 还是说这个是无损的 就是你得到的 也就只是一个计数而已 理论上它是不丢 但是要去噪 但去噪的过程中 你可能不可避免的会丢掉一些东西 OK 但理论上 你得到的这个东西还是它极大的还原 然后那个 这个表里边这一列就是一个细胞 所以这所谓单细胞 就是让那个细胞一个一个的

接受几百万个细胞 你们对那个细胞做了什么 你把它给碾碎了吗 还是怎么着 哎 这个问题问的非常好 就是在单细胞测序之前 我们叫 Bulk Sequencing 就是一坨 Bulk 就是 Bulk Bulk 一批一批的 对对 一批就是我们 比如说得到一个肿瘤病人的一个组织 我们把这玩意匀浆了 然后拉去测血 匀浆的意思是摇匀了吗

不是 匀浆就把它打碎了 就是通过摇 通过离心机和通过各种东西 把它打碎了 打碎了以后再去测序 所以 你得到的是这一个 Bulk 里面的平均 或者是加和状态 我问一下 那个被人深恶痛绝的 过柱子 是这一步吗 过柱子不是过柱子 我以前也做过 那是干嘛的 我听好多人抱怨过 叫色谱 叫色谱仪 比如过柱子

你需要我给你解释一下过柱子吗 因为我猜 很多听众会想到这个 令人深恶痛绝的词 我每次听人吐槽生物 我也听人说过 不知道是什么 过柱子叫色谱 解释一下色谱的话 比方说 我从一个植物里面提取出一个液 液体 提取出它的原液 嗯 我想知道这个原液里面的化学组分 然后呢 我就有一个 我们就想象一个柱子

柱子里面有沙子好了 嗯 然后你把这个原液倒进去 理论上它里面不同的化学组分 和这个沙子之间的穿透的速度 是不一样的 最后 你就可以得到它不同化学组分的分类 为什么学生这么讨厌这个事呢 因为大量的重复劳动 他被人过过了已经 是吧 就比如这东西 早就被人过过无数遍了 我还要再来过一遍 因为你可能要研究一个新的

就是比方说新的一个什么成分 就只是这个工序本身足够繁琐 非常繁琐 然后非常的人力 然后非常的浪费时间 哦 不能说浪费时间 不能说浪费 但现在也有更高效的 更高精尖的 我们叫高效液相色谱 或者是超高效液相色谱这样的东西 你继续 我们这个纯题外话 说回到这个单细胞测序啊 就是 就是 我要第 N 加一次 再问一遍这个问题

就是说 相当于你把这个细胞给它粉碎了 去研究里面的构成 里边的成分是 因为 Again 咱们没有办法直接看这个细胞里面 它具体长什么 我们可以拍一张照片 但是你不可能通过拍的照片 知道它里面每个基因的表达量 OK OK 你可以拍张照片 但是因为你把一个东西给它粉碎了 它就丢掉了很多的信息 但是没关系 但这已经都 你只要保证

你的输入和输出具有匹配性 就可以了 它里面一定有丢失 但你只要保证你的信号大于这个丢失 和大于它的噪音 你明白我意思 就是因为它这 5 个东西 它没打碎的时候 它是这么长在一起的 对 但是你打碎的时候 它只是 5 个分离的东西 因为我听起来 你特别像是那个建筑考古学家 他们拿那个遗迹来推测 这楼长什么样 是的 因为你把它打碎了嘛已经 对 只有地基了

嗯 这样 我们先回到刚才说的 Bulk Bulk 是匀浆 你就知道它里面比如说多少种细胞 不同的细胞的比例 你都不 Care 了 对 它就是一个平均的状态 就是一个加和平均的状态 这个时候有一个 就是我们 一个科学家叫 Stephen Quake 他是一个叫微流控的一个 Pioneer 先驱 他微流控是什么呢 他在这个芯片上

有一个特别特别小的一个管子 嗯 然后你把这个细胞先把它解离了 然后他在这个微流控里面就可以控速 让他细胞按照就是精准的速度 一个一个过 对 这个管子 就是你在管子底下再接一个管子 强迫他排成一队 对 排成一队 并且匀速通过 通过这个这条道路 然后这时候 你在这个道路底下再加一条道路 然后这个道路

我们往上发一个叫 Barcode 的 你想象成一个二维码 把这个二维码直接打到这个细胞 标记上了 对 标了 标了以后 这个二维码会进到细胞里面 和他所有的基因 理论上是所有的基因去结合 所以这个细胞的每一个基因 都有这个二维码 这细胞的宽门窄路差不多 然后这些细胞都出来以后 你再可以把它打碎了再去测 测了以后你每个基因都有二维码 你可以把它重构成

每一个细胞和每个基因的量 这样的话你就知道单细胞的 这是个机器过程还是个人工过程 那是它靠 等会儿 它机器加人工 你 Barcode 怎么长上去啊 是靠 就是 类似于病毒感染还是什么之类的吗 它有那个特殊的化学的 Reagent 这个 Barcode 其实也是一段 ATCG 就是跟 DNA 本身一样的 对 你只需要给它合适的酶 它就会长到那个长上去 对 续上去

对 我这个还是有点乱 就是咱们刚才聊到 你们做这个癌症治疗的时候 比如说要研究这个细胞对吧 那你们需要知道它特殊的结构啊 什么的 那如果你都不知道这个 特殊细胞的特殊结构 因为它就是一个新的东西 那你怎么能确保 这个酶是能附到上面的呢 还是说有些通用的东西 永远能附到所有上面 对 这个 细胞的这个背后的理化过程是确定的

但是每一种细胞你是不知道的 在你做单细胞之前 你对每一种细胞的状态你是不知道 对 但你可以通过一样的反应 所以让东西附到它上面 就是打标记是 100% 打标记 不一定 100% 可能 90% 多 这个东西也是一个技术的迭代 对 也没关系 这是个技术迭代 然后最后你就能够统计出来 就是细胞 1 号 2 号 3 号 4 号 它的每一个基因的表达 每一个基因的表达量 对 也就是丰度 OK 啊 然后在这个丰度里面

你在寻找的那个 Pattern 是什么呢 比方我们举一个例子 我们就说阿尔茨海默 这个老年痴呆 阿尔兹海默 如果我们获得很多 阿尔兹海默病人的 Post Mortem 事后解剖 就是死了之后的这个脑组织 比较新鲜一点的保存住的这个脑组织 对吧 我们对他进行刚才的那个操作 获得了 阿尔兹海默病人的大脑的单细胞 数据

同时呢我们也有些正常人 比如 一些意外事故死亡的这些正常人 他捐献了大脑 或者捐献了这个 你可以把他的大脑也拿过来 做同样的单细胞 这样你就每个病人有 比如 100 万个细胞 但是你有很多个病人这边有 很多个病人这边有很多 正常人 第一 你可以把这两个数据进行统计对比

你知道哪些细胞在病人的体内多了 还是少了 嗯 跟正常人做一个基线 嗯 第二 你可以知道这些细胞里面 哪些基因变了 嗯 第三 就是这些基因 的变化是不是跟这个疾病有关 是不是这个疾病的 Driver 嗯 这个基因 如果最后发现 它可能是这个疾病的 Driver 了 它就是一个靶点 我们是通过单细胞

可以去帮助发现靶点 而且是在一个更加 High Resolution 更加高分辨率的情况下 那这个 我还是就是 就我发现我还是这个 没法摆脱这个本质主义的这个 这个诱惑 就是他 他 DNA 里面的 这一部分被表达的过于多 那一部分被表达的过于少

但是怎么就是 How 就他是怎么产生的这个情况 这个中间过程你是完全不知道的 你也不检查的 你只是检查一个结果 就这个是我们已知的 DNA RNA 和蛋白质 他有这样的一个叫中心法则 Central Dogma 的这样一个 是 但就是那个 RNA 这个抄写员 他在抄 A 就是这个 这个碱基对他抄的多 然后这个碱基对 这一段序列 他

他抄的多 这一段他抄的少 这个过程 就为什么 RNA 会这么做 而不像一个普通人一样 一个健康的人一样 就是 A 和 B 抄 抄的差不多 哎 这就是我们最后要把得到的结果 回到一个已知的 或者是我们去重新构建一个整个的 就是一个机制网络 这个是最后一步 最后一步 我们找到了这些基因

我们最后再通过已有的知识 和一些可能的算法 去构建这样一个 就是 Mechanistic 的这种 关系网络 就是它 可能是因为这个基因调控了这个东西 然后导致了这个结果 我们会找那个 但是这个东西还是一种间接的 它并不是就说 你这个东西 就完完全全就是我说的这个机制 对 这个机制的获得还是基于经验

基于数据 基于 机器学习和各种算法 的一种反推 OK 但是如果这个反推成立 我们会到细胞上去验证 嗯 最后我们在细胞上把这个基因敲了 嗯 他这基因 这个细胞 确实变得更像阿尔兹海默病人了 嗯 或者是把这个基因增强 他变得更像了 那我们就知道了 他应该是一个 Cause 应该是一个 Driver 然后我们就可以去针对他的蛋白

去设计小分子 或者是设计一个抗体 去抗这个基因啊 抗这个基因的结果也就是蛋白 明白 获得我们想要的这个病人上的反应 明白 这个单细胞测序 这个技术发明多长时间了 单细胞测序 可能是应该是一几年的 十多年吧 十多年十多年 对 然后在单细胞之后 你想一下

我们把细胞解离了 但是细胞在人体内的原来的位置 它是有位置关系的 对 就这个细胞离那个细胞近 这个细胞离那个细胞远 这个位置关系很重要 是 所以在此基础之上又发明了空间组学 嗯 空间组学 我给你介绍一下空间组学吧 对 英文 你必须得介绍一下啊 Spatial 你可以叫 Spatial Omics

或者是叫 Spatial Transcriptomics 就是如果说基因表达的话 就是 Spatial Transcriptomics Omics 这词儿啥意思啊 Omics 叫组学 What 什么叫组学 组学的意思就是 我们传统的分子生物研究 比如说一次我研究一个基因 一次研究一个东西 现在我一次所有基因一起大规模 就叫组学 一组一组研究的学问就叫组学 不是

他是通过一个完全不一样的技术 实现的 就是那个测序仪 它是可以一次性完成所有基因的测序 所有基因的这个表达的测序 OK 对 来说说吧 空间组学咋研究 因为刚才这个我觉得是能理解的 对 就是大体上 因为你都已经把细胞排成一队 然后你把它们都粉碎了 然后它剩下来的那个质量 而且你要打二维码 这是很关键啊 对对对对

然后你就计数嘛 这个过程是 然后你用 Sequencing 就是测序的方法去重构它的数目 OK 对 那空间你怎么去捕捉这个信息 既然咱们刚才已经说了很清楚了 就是你不能直接拿显微镜看见 咋办 它是这样子的 我说的是其中一种 当然我就做一个 比较 General 的 Case 就是比如说 我在一个玻璃的一个芯片上 我们去排布 2000 乘 2000 个的网格 一个 Matrix

一个矩阵 这是个比喻 还是个真的 这是个真实的 对 然后这个大小可能是一厘米啊 或者是不到一厘米的样子 是非常小的 它是个非常非常高精度的一个事情 就一整块玻璃 不到一厘米 就是这个 2000 乘以 2000 它的长宽不到一厘米这样子啊 然后每一个位置都有一个二维码 就是我们刚说的 Barcode 它都不一样 然后我们切一块组织把它贴上去

贴上去以后 我们用一些化学的东西 去让它的基因渗透下去 它就和二维码就打上了 然后我们再去测序 完了以后 我们测到的那些基因 又可以重新通过它的二维码 知道它 XY 的位置 嗯 然后我们测 比如说测 2 万个基因 对吧 就是常用的 2 万个基因 那么我们就会得到 2000 乘以 2000 的位点

每个位点有 2 万个基因的表达量 也就是说 你可以把它理解成为一张 2 万个 Channel 的照片 然后它的 Pixel 就是 2000 乘 2000 对 像素不高 但是那个颜色 像素现在也可以不断的提高 也可以不断的提高 现在也提高了 非常非常高的 但是色深足够深 色深非常深 所以你没办法用我们 想象的方式去看这个东西 不是一个视觉 可以 Comprehend

对 它不是一个 RGB 它是一个 2000 个基因的 一个 Channel 的一个图 好 我们通过对这个肿瘤组织 它的 2000 乘以 2000 的像素 背后 2 万个 Channel 的这个分析 我们可以获得 比如话不同的细胞类型 它的空间排布 它的细胞的状态 以及它背后的基因 对不对 这样子话 它虽然是一个 Snapshot 它是一个快照 它只是一个切面 对不对 但是这种全景的

高空高分辨率的全景视角的话 我们可以看到这儿的肿瘤更活跃 它在快速的增殖 那儿的肿瘤在往外走 在侵袭 这儿的肿瘤正在跟 T 细胞激烈的交战 就通过理解这种东西 我打个比方的话 就是就像在城市的上空 拍一张高分辨率的全景图 但这个图不仅是卫星 它背后可能包括其他信息 什么犯罪信息 交通信息 所有的信息

你利用这个信息就可以很容易的知道 犯罪高发区 你很容易的知道食品的 这个叫食品荒漠 就这个地方没有便利店 然后呢 你要提高这块居民的整个的生活质量 你怎么办 你在犯罪高发区旁边设置一个警察局 哪个地方交通堵塞 对 哪个地方交通堵塞 你多修条路 对不对 我们就是用这个方式去看他一个全景 然后去获得我们需要去做什么事

去改变他最后的人的这个结果 那感觉 或者上面这个肿瘤 空间组学 是单细胞研究的必然发展路径 人想研究一个 就一定想研究一群 而且不是单细胞 其实也是一群 但是只是你丢失掉 他在空间上的关系 就他们之间的关系 对 他们之间的关系 但这个关系特别重要 尤其是在肿瘤 在肿瘤的话 我们就说一个肿瘤附近 如果有一种叫做 Tertiary Lymphoid Structure

叫三级淋巴结构 你就想象于一个犯罪窝点 旁边一个警察局 嗯 那你如果调度的话 这个警察局天天在巡逻的话 他犯罪窝点就没办法去很嚣张 对不对 对 但是 如果你这个犯罪窝点旁边啥都没有 嗯 对吧 那么这个犯罪窝点可能就很难消灭 这是一个观察到的规律 这是一个观察到的规律 就是如果肿瘤旁边有这个 TLS 嗯 他这个病人的生存

病人的愈后和免疫治疗效果都更好 这个结构是他自己生长成那样的 对 其实是肿瘤 因为本身 它会产生一些局部的炎症反应 对 这个炎症反应 就会吸引更多的这个免疫细胞过来 然后免疫细胞会自己形成一个结构 叫 3 级淋巴结构 嗯 这三级淋巴结构就相当于一个兵营 一个警察局 他就有警力了 但是肿瘤可以通过一些方式去逃逸他

对 所以我们用那个免疫治疗 免疫检查点 去把他这个逃逸的方式给阻断 这样的话他就可以治疗了 对 OK 你知道这 Funes 是一个做 3D 扫描的啊 的这么一个项目 就是你这个空间组学 如果是一个平面的话 它不就是一平面组学了吗 那咋办啊 你说的非常好 这个问题 这个问题 就是我们现在 也在努力的一个方向

就是第一个 就是你通过无数多个平面 总结出来规律还是有用的 对 适用的还有一种是切很多片 但这样成本就很高 所以你可以切几片 中间留点距离 用算法去把中间叫 Interpolation 做这个推演 对 然后可以补充出一个 3D 的结构 可以切多层 对 可以切一个 切一个 然后中间有一点距离

对 但是可以用算法去补充 明白 所以你说的这个 空间组学里能够观察到的 这些 Pattern 是 这已经是一个比较大的尺度了 是一个厘米尺度的 一个厘米尺度的 肉眼可见吗 肉眼可见 然后可以给它拍一张一般的 这种 RGB 的 我们叫 H&E 染色 病理学家也可以在上面看 他也能看到一些东西 但是他看的东西

不如我们 2 万个 Channel 的信息的密度 和信息的颗粒度这么高 病 病理学英文叫啥 Pathologist Pathology Pathology Histopathology 或者 Pathology 所以你会觉 所以你们会觉得 病理学家是更糟糕的人 因为他们只是看一些很粗 非常粗犷的形状 事实上 我们还是用病理学家的判断 作为金标准

OK 我们现在还是用他们的作为金标准 而且我现在的工作 是跟病理学家大量的对接 而且我们的这个实验步骤 是在一个研究病理的部门去完成的 所以他也在推这个 有一些比较走在前沿 的病理学家在推这个 对 这个 也是一个 我会想象 的一个事 是不是越细的越好

如果我们可以 微米层面看一个东西 那么毫米层面我们就不用再看了 事实上 我觉得细胞的尺度上是必要的 必要的 至少在细胞尺度上是必要的 而只有通过这种东西 才能看到细胞尺度 对 但你刚才说的这个 Pathologists 他们 他们也能看到细胞 但是他看到细胞只是一个染色的结果 他不知道这个细胞背后的 2 万个基因 对 我的意思是

随着更高精度的 信息获取成为可能 原来那些更低精度的观察 研究和推理的方式不会直接被淘汰掉 他们 比如说 Pathology 他在癌症的病灶 这块的研究还在往前走吗 只是他们是很经验性的 他们的东西 基本上是参考书上定下来的 他们学那个医学定下来的 然后他们基于他们的经验

读了非常多的片子 他们给的经验 去对这个数据进行标注 对 然后提供给我们继续学习 提供给我们 AI 所以 他们还在给你们的这个机器学习 提供这个 Input 对 提供一个非常重要的 专家级的 Input 但这就是一个生产原材料的事 就说他像是在吐丝

吐给你 你拿丝织成一个网 这个网一旦织成了 就可以不用他了 我们可不敢说这个事 我们不敢得罪他们 因为他们 第一个 他们是专业训练的这个东西 我们还是会非常尊重的 明白 第二个 他们的标准 我们始终把它认为是金标准 哪怕你要做一个 做出了一个模型 要评价这个模型的时候 我们还是会把他的东西作为一个标准 但是病理学

作为模型的输入 意味着他 你的机器学习不是那么纯 你懂我意思吗 因为引入了人 那个 Human Knowledge 对 是这样子 我们学的时候可以做一个叫 自监督或者是无监督的学习 但是在无监督的层面上 我们可以把中间的一个隐藏层拿出来 看一下它到底能够多好地预测病理 这样的话

我们的模型本身是没有病理信息的 这个模型本身学的是无数 这张图片上面的 一个 一个 Representation 一个更全面的表征 所以病理学也可以作为一个 一个 Reference 你们可以去对比 对 然后把中间一层拿出去 跟它做对比 OK 对 但是你们并没有摧毁这个学科 这是一个非常敏感的话题 因为所有的病理学家

首先我们很尊重他们 他们的知识储备 他们的专业 你绝对尊重他们 为什么要说这个 我听下来 被识破了 我想到几个字 百万漕工 衣食所系啊 我这么说 我觉得 未来病理学必须要拥抱这个新的技术 那必须的 对 这是必须要拥抱新的技术 但是电影里面那个 AI 公司大老板 那个反派都会对普通人说这个话 你们未来一定要拥抱这个技术 我很尊重你

但是你得拥抱这个技术 对 事实上我们整个空间组学 在我们公司里面 内部是由一些病理学家推动的 我感觉其实不是说谁取代谁 而是病理学家可能后来会 他会变成这个东西 对 这是他的下一代了 本来也没有什么 本质不就是去研究这个疾病吗 是 而且是 无非就是不同的技术 产生的数据的精细度不一样 对啊

只不过在你们这种高科技的 可以观测它 可以观察它 可以统计它的这个层面 相比较好 像传统的那个病理学 看着有点像 像老中医一样 有点像 望闻问切一样的那种 感觉 他们还有很多经验性的 而且如果以前说 如果你请不同的病理学家 看同一张片子 得到结果可能不一样 有一个这个 Concordance 的差异

但你拿 AI 问同一段话 给你的答案也不一样 那也有可能 对 他毕竟有一定的这个 Stochastic 对 是吧 Interesting 对 所以 所以这个是空间组学 这两个事儿是两套工序 单细胞测序 单细胞和空间现在 都是 Paired 了一般 都是同时一起往前 如果你对一个肿瘤测了单细胞 也测一个空间 然后你在两个事情上面 同时去做一些研究

因为空间上有些空间上的局限性 比如说 我说 你把基因渗透到底下的那个二维码上 它的基因会产生一些叫 Diffusion 会往外扩散 扩散了以后它就不纯了 所以每一个像素上的那个基因 可能是也来自于部分别的地方 来的扩散 所以它的数据是噪音更高的 所以你可能需要一个更干净的 这个单细胞的数据 作为一个参考

然后再去互相学习 互相比对 你们这样的研究会用到病人本身的 就像病例 就是 Profile 还是说你们研究的这个视角 是一个特别纯粹的 我就看这病灶本身 我们会用到 我们会用到病人的一些 比如肿瘤的分级 就是它是 Stage 1 2 3 对吧 然后这个地方

或者是这个病人有没有发生转移 它这个是转移灶还是原发灶 然后还有一些病人的 但是我们不会像做临床的人一样 观察那么多 比如说年龄 性别这些东西这么多 我们一般关注的会相对少一点 我们更关注跟这个东西有关的 一些比较具体的东西 如果这是原发灶和它是转移灶 肯定是不一样的 那对

那我们必须要知道 明白了 对 行 那我们这个走进科学这部分 是不是可以 差不多就到这 咱们开始往前去说这个怎么做 这个药吧 好的 那是走进另一个科学了 但是药物就是一个人可以注射 可以吃的东西了 这个就 离咱们的实际生活就稍微近一些了 咱们刚才说的这个 相当于这能分成三类吗

还是说它们本身也是一样 这个 PD-1 和 PD-L1 的抑制剂 这是一类 我们现在说的都是治疗癌症 对吧 对 治疗癌症 对 然后这个 CAR-T 咱们一会要 另外一类 这个 这俩是完全不一样 完全不一样 机制也都不一样 不一样 OK 然后 还有那些所谓的 那个大分子的靶向药 PD-1 和 PD-L1 也是大分子 这个 PD-1 和 PD-L1 和其他的靶向药

可以大体上算成一类是吗 它的机制不一样 因为 PD-1 PD-L1 是通过激活免疫 而其他的靶向药 比如它是通过直接抑制癌症 癌细胞 它的目标是不一样 所以这个靶向药 是直接跟癌细胞发挥作用的 对 而不是间接的通过免疫 通过 T 细胞来 对 所以现在也可以联合用药 那 那是不是可以大体分成两类 一类是靠免疫 一类是靠杀死癌细胞

是 我觉得这样是可以 这样看 对 可以 Generally 那如果这么来看的话 化疗属于后面这一类 就是杀癌细胞 对 它没有目标性的杀 明白了 那广义上来说 我们大部分人会认为 今天的进步是在免疫疗法上 但实际上 靶向也非常重要 也非常重要 对 但另外一方面 其实它也是在很 往前走 对 我可以大概 稍微说一下 比如说 肿瘤治疗的一个快速的历史

对吧 我们说从化疗到靶向治疗 2000 年左右 然后到免疫治疗的 2010 年左右开始 的这种 我们以一个晚期 叫非小细胞肺癌为例 晚期就是非常恶性了 已经非常糟糕了 看一下 5 年生存率 就是 5 年生存率的意思 就是说如果 5 年之后他还活着 他大概率就不会有事 就不会复发 并不是完全

所以 5 年生存率是一个标准 对 因为那个死亡的那个统计 那个曲线是这样 对 那个叫 Survival Curve 对 我觉得 所以那个 5 年往后就约等于横了 对 基本上就比较拉平了 所以我们看 5 年就可以预测一下 5 年生存率是一个重要的标准 我们说化疗时代 基本上对于晚期就是小于 5% 5 年生存率 5% 的 少于 5% 的病人 然后到了靶向药时代

有靶向的病人 他可以达到 15% 到 20% 基本上 5 年生存率就 OK 了 但是到了这个免疫治疗的时代 就直接是 50% 到 30% 了 达到 30% 这种情况下 还不需要单一的肿瘤的靶点 对不对 因为它是通过免疫 对 但是它可能需要免疫 稍微有一点 就是我说的 TLS 的那种结构 或者需要一点免疫的这种浸润

它就更好的效果 你可以看到这个 一步一步的往前推 从化疗 5% 不到 到百分之十几 在有靶向的时候到 15%-30% 这还是晚期的 所以它是完全不一样的 这过去 20 年的进步 过去 20 年 对 听起来不是那么厉害 但是对于癌症 考虑到 考虑到 20 到 30 那是 10% 的人命 还是很厉害 而且是晚期肺癌

我说的是一种晚期非常恶性的肺癌 如果你看大部分的癌症的话 它可能不是都是这么晚期的 对吧 那我们就是通过对于肿瘤这个 去用这个单细胞和这种东西 去找有没有一些新的 比如免疫治疗的新的方法 或者是一些新的 然后你刚刚说到这个 CAR-T CAR-T 和我们刚刚说的 PD-1 PD-L1 叫免疫检查点

抑制剂的作用机制不太一样 CAR-T 是说从病人身上把血抽出来 那 CAR-T 属于哪一类 属于免疫 属于免疫治疗 对 还是通过 T 细胞 CAR-T 肯定是 T 细胞 对吧 把血抽出来 抽出来以后对这些细胞进行改造 就是让这个细胞表面 它的那个受体上 长一个 可以专门识别肿瘤表面的一个东西 就是你可以通过基因编辑

或者其他方式对它进行改造 然后改造完了以后再打回病人体内 然后这些打回去的 T 细胞 对肿瘤的杀伤就特别猛 因为它被加了这个识别的这个装置 所以它会疯狂的攻击肿瘤 所以它往往 CAR-T 以后 这个效果很好 然后在短期内效果特别好 甚至是有时候太好了 引起了所谓的叫免疫风暴 就是身体产生 就是身体自己给自己化疗了

对 身体在自己 打仗完了以后 病人反而被拉垮了 这都是有可能 就是它的效果太好了 但是 CAR-T 的问题是 目前在血液的癌症中 效果会比在实体瘤的癌症中更好 因为想象实体瘤合理 包裹起来的它 很难进去 对 所以在实体瘤上 我们还在想更多的办法 听起来是个特别 Neat

特别干净利落的方法 主要 这个是我听到现在感觉最科幻的事 就是把人的血抽出来 给你改一些你的细胞 给你再塞回去 对 你能管这玩意叫药吗 这是 它叫细胞疗法 Cell Therapy 细胞疗法 但 这个和传统药 确实有一个很大的不一样 就是在于它是一个病人一个实验 就是它完全不能标准化 你听到这你可能意识到 它不能标准化

就意味着它成本压不下来 因为医药公司它需要大规模生产呀 但是你每个病人来了以后 你必须要经过这一整套流程 所以它特别特别贵 它是一种 Treatment 它不是一个药 但是我们也在想办法 看看能不能把它标准化 比如 我们从正常的人的体内抽出一些血 然后把 T 细胞拿出来 把它上面造成 可能造成免疫的东西敲掉 然后呢来了一个病人 给他测一个肿瘤上的序列 以后

直接在这个正常的那个 T 细胞上编辑 再把这个细胞打回去 这样我们就有个存储了 我们有一个这个存储 放在这儿的话 我们速度加速了 甚至我们可以用那个干细胞 万能干细胞去做这个事儿 然后就到了现在 最前沿的叫 In vivo CAR-T 我不抽出来了 我直接打 CRISPR 到体内 CRISPR 是什么 CRISPR 就是基因编辑 对 基因编辑

最火这玩意 对 你直接把 CRISPR 打到体内 它在你体内对 这个 T 细胞进行编辑 明白 然后这个 T 细胞直接去攻击 所以 CAR-T 是基因编辑的一个子集 它不一定完全只能通过基因编辑 这个方式实现 但基因编辑是比较容易实现的 一个方式 就是它只要把肿瘤上面的一些 特异性的东西 让这个 T 细胞 在 T 细胞那个抓手上看到就行 我觉得这些名都起的特好

我觉得 CAR-T 听着像一个车 像一个手推车 有一栏好东西给你 对 它就是一个载 对吧 Car 嘛 对 它就相当于是那 T 细胞是一拖拉机 然后你后面就是你后挂的 这个东西 是有针对性的 是的 你上面挂的那个东西 它是有一个智能识别的那种 那听到这我就开一脑洞 就是你想咱们所有的科幻片里面 以前就说这个

这个人改造人或者说变异人 他都是天生的 那如果有了这玩意之后 后天也可以 后天你能改造的 你不可能把全身的体细胞都改造啊 但也能改造一些 对 但是有些疾病现在已经有了 有些疾病 比如他 是你身体的某一个地方缺少一种蛋白 你直接把基因编辑的东西打进去 然后让这些在你的这个组织 在这个器官上

这些细胞能够产生这个蛋白 就可以让你的那个疾病 就是 就是他的表型就下来了 就可以治愈 现在这种基因治疗其实蛮多的 但是基因治疗现在问题是 你用什么东西把你 的 CRISPR 的那个东西 打到你 现在一般用的是一种病毒 但那个病毒本身有一点风险 肯定的 对 腺病毒(口误) 对 咱们先说这两种 PD-1 和 PD-L1 这是一类

然后那 CAR-T 是一类 对 这两类都是所有癌症都能用 还是先不管这个实体和血液的区别 是所有的肿瘤都能用吗 还是像靶向一样的 分很多的细分 理论上是可以比较 Generalize 的 但是你需要每一种肿瘤去做临床实验 不然的话 你不能把它直接拿来用的 那这玩意儿也是跟药一样 走完整的批准的过程 对

它是作为一种疗法 作为一种疗法 它也像药一样 它要走 FDA 但是我不是很确定 它里面是不是有些细节上的不一样 但 Generally 它和 FDA 是一样 一二三期 然后全部通过 最后验证成功 上市 一个药从准备做到做出来 要顺利的话 要多久 一般我们说叫双十定律 十年 从研发一直到后 后续的临床实验 最后上市

然后 10 个亿美金 然后 1/10 可能不到的概率能做出来 所以我们在 2025 年看到的新药 基本是 2015 年开始研发的 是的 这个周期没有缩短的迹象吗 现在希望用 AI 可以缩短它 是 但是我觉得现在 更大的一个 Bottleneck 其实是在临床实验上 我觉得 AI 去缩短那块的能力 比较有限

相对有限 你要让人吃这个药 或接受这个治疗 看他的结果 你得等这 不是一个 你得等 这不是一个技术可以缩短的事 是啊 但是在早研上 AI 是深度介入到我们的早期研发的 它是可以至少增加 加速早研 然后增加你找到的靶点 增加你这个分子的优化 你治疗的分子的优化

或者是抗体的优化 现在 很有意思 我们经常听人在抱怨 AI 及今天的这个发展 更多的用在一个人自我娱乐 和哄自己开心的事上 这很重要 这很重要 当然当然很重要 超级重要 那你说做节目在 B 站是干啥用的 就我们俩聊天是干啥 我们仨聊天对吧 但是就是 实际上

对人的这个福祉 有重大的影响 其实就是在药物的那个研发 的这个方面 我觉得这是毋庸置疑的 这是一个 无论如何 从价值层面上都是一个确立的 一个合理的一个事实 对但是 我现在看到的一个比较尴尬的事情是 大家会把生物医药的研发 做 AI 的人 会把生物医药的研发 作为一个他的幌子 比如话

我当时记得 Sam Altman 和那些 就是 川普 和他们在做那个公众演讲的时候 要搞一个那个 国家的那个什么星 星际之门计划的时候 他们就只拿医药做例子 但事实上他们做的东西不是医药 或者他们做医药的相关的在被人利用 他们会把医药作为一个非常 非常好的招牌 因为你举不出那么干净的 没有

那么 Neat 的例子 就是说这是一个对人类纯好 百利无一害的事 因为你让人就是更长寿 让人的预期寿命能延长 或者是治疗癌症 你任何的 你什么就是大模型 去做什么 关于人的那个娱乐和什么 其他东西都不 不如这个 他最有说服力 而且他是一个干净利落的 就不要跟我辩论 对对对 就我救死扶伤 你不能跟我辩论

我就是无敌的 但我认为这个里面有一个公司 就是那个 DeepMind 它确实是在这一块是真的 是实际的做出巨大的贡献 是我们一般把它那套 和大模型那套稍微区分一下 这个叫 AI for Science 这个叫 Large Language Model 大模型 大模型也在 AI for Science 里面可以有应用 但是你专门针对性的 比如话解决一个 Protein Folding 就是蛋白质折叠的问题 对

它是一个特别针对性的一个 AI 的模型 而不是一个你知道吗 General 的一个模型 对明白 所以 那个 AlphaFold 就是这个东西的 集大成的一个 就是这个 一个突破吧 巨大的突破 对明白 最后一类 就这靶向药 其实是你的工作接触的最多的一类 对 我们也做免疫治疗 也做靶向 OK 就是我们希望找到的靶点 既可以是免疫治疗的 也是跟靶向有关的

但靶向是在免疫治疗之前 如果你按照时间倒腾的话 它是在之前一点 特别是肿瘤 就我们说肿瘤 它有些突变 对突变的话 最后会变成一个特异性的蛋白 在他的表面 那我们就要把这个蛋白作为他的靶子 然后我们要设计一个抗体 这个蛋白往往就是 还不能是随便的一个蛋白 这个蛋白要对这个肿瘤的生存 至关重要 嗯 对吧

就是这个肿瘤生存 你得能实际伤害到它 然后你把它给挡住 做一个这个 Antibody 就是一个抗体 把它给挡住 Block 住或者是把一些东西激活也可以 然后它就可以让它发挥作用 这就是靶向药 让癌细胞活得难受 活得非常难受 把它嘴捂上之类的 但是这是我们可以认为 过去十几年前的靶向药 现在不一样 现在完全不一样了

现在是在这个抗体上面 接一个小小的 叫 Linker 后面再带一个化疗药 所以是一个微观的化疗 它就是一个化学分子 一个细胞毒素的 这种化学分子非常强的 但是这个抗体会只去找到肿瘤细胞 然后这个 Linker 断掉 这个化疗的药物被释放出来 所以都在肿瘤附近 这也太厉害了

这叫 ADC 对 这叫 这叫抗体偶联药物 现在中国做的非常好 我理解中 这就相当于原本的靶向药 指的是我到这个蛋白这 通过改变蛋白本身的结构 可结合性 来消灭它 现在是我不改你啥 我直接炸死你 我也挡住你 但同时我还挂一个药 挂一个炸弹在我后面 对 那这个炸弹本身的这个毒性 是针对他设计的 还是一个通用的 是一个通用的毒性

但是你只 要保证他在肿瘤病灶富集就可以了 通过这个 这玩意咋这么厉害呢 所以它不是一个放射性的物质 它就是一个会杀死这个细胞的一个 它就是 就是很多化学物质对细胞都有杀伤性 啊对 就是你说那个什么洗手液 或者是那个 对对对对 洗洁剂都可以 那我理解中 是因为找到能覆盖 覆到上面的这个靶点 比那个找到能改变蛋白结构的靶点 要容易 所以这样的话

那我做那个更容易 更快的其实是更好的 是吗 因为我理解中 它俩效果应该是一样的 你说什么和什么 就是老一代的靶向药 不是只改变蛋白结构吗 啊对 然后让这个癌细胞自己就死了 现在是我附到你癌细胞上 拿这个杀毒这个东西把你杀了 对那听起来感觉前面那个 之所以现在不是最主流 或者说不是研究方向 这个现在还是主流的 药物还是那些

就现在市面上茫茫多的药 但是 ADC 现在正在快速的迭代 对那我理解中为什么不全用 ADC 呢 因为以前没有啊 但它是个更容易被想出来的东西 但是从工程角度并不那么容易 比如说我说的那个 Linker 他的 Linker 有的时候会断掉 就之前出过一个案例 就是他直接在血里面 Linker 就断了 哎呦那坏了 对你可以想象到 对吧所以这个 Linker 的设计

包括怎么把这个化合物装到这个上面 然后验证这一整套 其实是需要很多时间的 就你得有先有第一步才 有第二步 就今天的那个前南斯拉夫 土地里面还埋着很多 几十年前要炸别人的地雷啊 是 差不多 那你就是在血液里面游走的 然后就是杀伤你的血细胞 正常的血细胞啊 然后全身循环

那人就不行了 明白 就像是一个全身的化疗了 所以这个事 大体上就是想要做出这样的药 大体上就是先把冰箱门打开 就是先找到这个靶点 靶子 嗯对 然后再考虑用 就构造一个什么样的化合物 什么样子的结构 对就是 Engineer 上的问题 怎么优化这个结构 OK 那你的工作呢

你的专长就是在找靶点和这个 和第二步的最开头吗 我的主要 我们希望能够找到新的靶点 但是我们说的只是在肿瘤这块 在别的领域可能是稍微不一样一点 我们除了肿瘤的话 可能是希望找到更好的靶点 更新的靶点 或者是两种靶点合在一起 能够覆盖更多的肿瘤 嗯就是 我们也可以 就是这个 Y 型的抗体 我们可以把一个变成双特异性的

这也是现在发展的特别火的 就是原来是个单特异性的抗体 现在可以变成双特异性抗体 这个结合这个靶点 这个结合另外一个靶点 所以靶向药的这个特别专的 这个问题以后也会改善 对因为现在已经专到 就是人家说你得了这个癌 这已经是一种比较具体的癌了 然后你还要去配型 配不上的话 你这个药还是用不了 你要测基因 然后就让人觉得特别 想死就是特别绝望 就是患者他会觉得说

我已经是一种很具体的癌症了 然后现有这么一种神药 然后我一配还就发现我用不了 如果你那个基因 不在你的那个癌细胞里面的话 他就没法用这个靶向药 天呐 但是这个靶向药 你可以想象 就是未来的靶子会越来越多 但是同样的问题 其实他这个涉及到另外一个方面 就是他的商业利益 就是你想要覆盖越少的

他的商业利益可能会越来越低 所以公司做的动力可能会下降 对 我们希望他 他适用性更广泛 但是事实上就是癌症因为是突变 是比较 他有一些通用的 但是还有很多人有一些特殊的 那你想覆盖这个越小的 越特殊的 他要花的研发成本越高 但最后可能治疗的人越少 但商业上就比较难 所以得要通过国家

和通过这个医保去提高 那你刚才说的这种靶向药 就是一种定点爆破的 就是带着炸弹找到这个癌细胞 然后并且杀死它的 这个事覆盖了 假设癌症所有的癌细胞有这么老多 它能覆盖了一点点吗 还是怎么着 这我不知道 你不知道 对这个我不确定 对我得要去看一下 但是很比较广泛的 这个我们现在说的这个就是 ADC

就是你说的这个定点爆破 很多还在临床实验 尤其是中国 就发展的特别快 他在临床实验中 就是 并不是说市面上已经有茫茫多了 他是在快速快速的迭代 我说的是一个方向性的一个事情 咱们可以这讨论一下 就是中国在这方面的优势 就这是不是一个优势 我们有更多的绝望的患者 我们有更多的临床病人 对这事

是不是一个 创新药研发的一个实在的优势 我觉得这是非常现实的问题 这是非常现实的一个理解 就是中国今天创新药能够做的这么好 尤其是肿瘤治疗 因为中国 那咱们先停一下 就观众们 他可能不会知道 哪个国家是做的最好的 能不能先说 中国在哪些方面做的是好的 然后再说他为什么好 现在中国在肿瘤治疗的创新药上

它的迭代速度 已经可以说是全世界第一了 我觉得就我们 不能说我们整体是第一 但我们速度是第一对吧 速度第一 然后进入管线也第一 也可以说是很高 我不知道是不是第一 但至少量很高 然后有一些药进入一期二期的 已经可以卖给海外的那些大药企业 就是叫 MNC 就是跨国集团 跨国集团就收购了 收购这个药 License Out 是这个东西吗 对 License Out

就是我把这个药物的使用 在哪里的使用 就都卖给你了 就是约定好的这个国家和地区 对的 这个所有的 就商业的 这个前景 后面就给你了 就打包卖给你了 对打包卖给你 但是 他们可能并没有完成所有的临床实验 对所以 License Out 不是一定要做完了 这个药 对 他可以在不同的阶段 可以做的 就做一半 就交给你 你去把后一半

是的是的 大的跨国药企在推临床实验上 要比这些小的 Biotech 要厉害的多 他们有资源 有钱然后可以在全球多中心布点 就是听起来特别 也不叫残忍吧 有点诡异 就是 这个患者是这个事里面的一种资源 是的就是是的 没有错就你理解一下 为什么中国现在在肿瘤新药

创新药上的迭代速度这么快 就是因为有很多临床实验在中国 中国有大量的患者的基数 嗯 允许 比如说同样的靶点 或者是类似的药物 可以有 10 种不同的临床实验在做 然后还有一个特别重要的 就是中国的病人 他的背景干净 我说的背景干净就是说 如果你在美国 想入组一个晚期肺癌的话

他基本上已经经历过一系列的治疗了 嗯他的前面的治疗 会对新的治疗产生影响 你就没有办法看到 你新的治疗产生的效果 但是中国很多 因为相对于而言 落后一点地区的那些人 他在看这个病之前 他是没有接受过什么正规治疗的 等他去看的时候 他是我们认为叫治疗背景很干净 治疗背景干净 你进临床实验

它的效果会更容易明显被凸显出来 就信噪比就高(口误) 对 但是确实很残忍的事 是那另外一方面就是 比如说中国的患者 一般来说 应该没有一些特殊药物的服用史 或者吸毒的也会非常非常少 这个也有影响是吗 我不是很确定 就是比如说芬太尼或者具体的毒品 对这个事有没有具体的影响 但我觉得我我 我个人感觉应该是有影响

因为他整个身体都产生了巨大的变化 但是往往我们入组的病人的时候 好像还是会有很严格的筛查 嗯就是对他的年龄 对他的各种背景的 这个要求还是比较严格的 但有意思的是 就是至少你所在的这个研究的环节 嗯 你是不是那么在乎那个全面的 Profile 那个病人的全面病 比如他平时吃啥 你根本不关心这个 你就关心这个病

我们关心一个东西 就是这个病人的 Genetics 他的遗传就是说他的 比如说他是哪里的病人 其实是不一样的 比如说中国人和欧美人 他的遗传背景不一样 我们希望看到这个遗传背景 不会对这个东西产生影响 就是他的 DNA 的序列是不一 不完全一样的 对他有一些位点可能使得某些人 某些癌症更高发

对或者他高发出来是某种亚型 我们对这个遗传上的背景 还是比较在意的 那会有某种对于白人好使的靶向药 但对于亚裔是不好使 有可能完全有可能 所以这个是一定要做多中心 多人群的这种 临床测试才能够获得一个药物 而且更何况癌症本身它就是一个分布 完全不一样 是的比如话 中国的两广地区有很多这个鼻咽癌的

这些 他和他们的生活方式 也和他们的基因可能有点关系 然后白人的话更容易得那个皮肤 那个就是黑色素瘤 因为晒太阳浴 有可能 也有可能是因为他就是比较白的话 他没有那个色素保护嘛对吧 嗯 行 那咱们就来说说这个 现在最火的这俩概念吧 所以 Turns Out 就是 CRISPR 和 AlphaFold 都不是你工作里面会

实际你亲手会用的东西 我用的比较少 我的合作的人会有用到很多 呃 CRISPR AlphaFold 的话是我们的下游 对 我是大概知道一些对 咱们刚才说的这个 PD-1 CAR-T 和靶向药 就是在这个药物研发的过程中 都涉及到那个应用 CRISPR 这个技术 对吧 不一定应用到 CRISPR 但是 AlphaFold 如果你设计蛋白药物的话

基本上都会用 嗯 AlphaFold 先去帮你去折叠一遍 预测一遍 去看一下 对 OK 咱们先说这个 CRISPR 吧 可以嗯 CRISPR 它就是最大白话说 他干了什么 他使我们能干什么 然后咱再说 他是怎么来的这个东西 好 那就简单说一下 CRISPR 的一个历史吧 对吧 CRISPR 这个技术目前在现在就是说 它可以对 DNA

对基因进行精准的单碱基编辑 以前比如说我们测序技术 允许我们去读取人类的 DNA 序列 但是有了 CRISPR 这个系统的话 我们可以去编写这个东西了 这样我们在电脑上 我有一个读写的权限了 这样的话是一个 Revolution 就是可以 Program 它 对 我们可以 Program 它 它不仅可以拿掉一部分 它还可以把拿掉一部分

我就删掉中间这字母 再把其他加回来 补回成另外一个字母 这样的话 就相当于 我只把中间这一个字母给删掉了 对 单碱基编辑就是这个意思 就是编辑器了 对对 这是编程吗 因为你刚才说的 那其实字母 它跟编程 01 是很像的 它是一种编程吗 它是你只要把你想要的东西 放在那个系统里面 它就可以完成你想要做的事 那它是基于化学的生成吗 基于化学

它是基于化学和那个对生物 哦对 但是它是一种可编程系统 就是 那你不会用 Vim 或者说 VS Code 去编它 那不是 离的太远 它的那个原理还是跟病毒 你听他说 是的 是的 那么好那我 刚刚介绍完了 这个 CRISPR 的大概功能 我们就说一下 CRISPR 的历史 我觉得特别有意思 我特别想要 Share 一下这段历史故事 就是 CRISPR

它的全称就特别特别的抽象 这是我听过的前沿科学概念里 最抽象的 就是如果你听这个名字 你完全没有办法 把它和基因编辑有任何联系 对 CRISPR 它全称就是 CRISPR 它是叫 成簇的有规律间隔的短回文重复序列 对 这就是它的全称

我就知道 C 是 Cluster Clustered 成簇的这个 这个中文有恐怖谷效应 每个字你都懂 但你合到一起 你觉得它不是中文 完全不知道是什么 但你记住啊 首先什么叫回文 我不知道你们知不知道 回文序列 就是上海自来水 来自海上的 哎 对了 Exactly 然后就以前看那个什么达芬奇密码 上面他们会用回文做什么 各种密码 就是说 ABCD DCBA

对 但是这个回文 因为我们 DNA 有两条链嘛 它的回文是发生在两条链上的 比如说这样 这个序列是 A B C D 这边序列从这个方向是 ABCD 对吧 然后我们说我就不用那个 ATCG 我们就 ABCD 去取代好了 好 你说 A 配的是 A’ 所以这底下是 A 撇 B 撇 C 撇 D 撇 对吧 这边过来是 A 撇 B 撇 D 撇 C 撇 这就是回文

你看到这个回文 结构本身就很奇怪了 因为在密码或者是在这个什么 它是一个来自 它是一个 DNA 没有理由存在的规律 对 你会觉得为什么会在 DNA 有这个 没有理由有这个 对 其实它会对应一个 非常优雅的一个生物学机制 就是当这个 DNA 一段被 转录成一个 RNA 的时候 这个 RNA 因为和 DNA 是基本上完全对应的嘛

它是单链 单链的时候因为 A B C D A 撇 B 撇 D 撇 C 撇 它这个就像一个拉链一样可以合上 它就变成了一个 我们称之为叫发卡结构 发卡 对 就是 Hairpin 发卡结构 它这个发卡结构 就是本来是个单链的东西 但是它这样合并了以后 形成了一个发卡 它在这个细胞里面就比较稳定了

然后其实我们说 RNA 就最开始我们提到了这个 RNA 生命就是 RNA 起到酶的催化 都是形成各种各样的发卡结构 才能够变成 就是 还是通过各种折叠形成一个空间结构 就可以形成一个催化作用 跟蛋白一样 这里边 最令人感到就是起鸡皮疙瘩的是 你想象这个事是一个省事的事

对 一个节省能量的事 你能感觉到那个进化的力量 他是怎么找到的 就是用最对付的方式 咱们先把这事办了的那感觉 是的是的 但他只要能够形成这个结构 他最后就能够进化出那个功能 OK 然后就进化出那个东西 这种回文结构本身就很让人奇怪 最开始一个日本的一个科学家发现的 得诺贝尔奖了吗 他没有得 对 就是在漫长的这个事

漫长的过程中 只有一些人 只有两个人 有一个环节里的两个人才得到 对对 是的是的 你接着说吧 然后当时科学家 科学界就对这个 为什么会有这样的一个 这种回文序列 就很好奇 就是说有人说这是细胞复制 有人说这是什么基因调控 但是没有人知道这是到底是在干嘛 对吧 你得先说他是在哪发现 他是在细菌 对

在细菌的那个 DNA 的基因组里面发现的 就是细菌会有一段 DNA 里面全部都是这种结构 然后你一看就是 如果你把它序列打出来 你不需要任何先验的知识 你就能看出来了 因为他那个短的 一片一片的 然后全是回文的 这种 是大概什么年代的事 这个是在 2000 年之前的 然后到 03 年的时候 一个西班牙的 是西班牙的还是哪里的一个科学家

叫 Mojica 他呢 就是说这个回文中间还有一段序列 我们叫 Spacer 就间隔序列 它干嘛呢 它把这个间隔序列 输入到一个叫 Blast 的软件里面 Blast 就是它可以去匹配 我们所有已知的这个 DNA 的库 嗯 他去看这个中间的 Spacer 跟这个库里面已知的物种 到底哪些东西能匹配上 他们就惊讶地发现

细菌的这个 Spacer 这个间隔的序列 居然和他的天敌噬菌体 或者一些病毒的某些序列有关 这太牛逼了 这简直了 对他得到这个结论 他 他也觉得这是怎么回事 就是找到了别的生命的 别的生命的一些签名档 相当于啊 对 为什么我 细菌需要去携带我天敌的一部分序列 在我的体内

这问题就 你可能能想到各种各样可能性 但是 你可以往一个我们刚刚聊的方向 想一下 免疫 我细菌就具有了对于这个病毒的免疫 因为在我这个里面 有了关于这个病毒的身份标签 就是我们人需要抵抗病毒 细菌也需要抵抗病毒 对 这也是一个他的生命过程里一直要 要做的就是他的一个任务嘛 是的是的

然后他就研究 他就发现 首先他是发现 是很多很多细菌都是有这样的结构的 对 然后他发现 只要携带了这样的 CRISPR 的这个对 对应的病毒确实是 有抗性的 然后呢 他就产生了这个假设 就是说这是细菌的一种叫获得性 习得性的免疫系统 你看他不是天生的 他肯定是怎么回事 跟病毒发生了这个关系 才把病毒的一部分插到他自己体内 插他自己的基因组里面的

所以他是个习得性的免疫 这样子呢 他记录了曾经的入侵者 他就可以保护自己 再受入侵 甚至是他可以被遗传 就这个细菌再次分裂了以后 他新的细菌还包括了这个序列 他就可以去保护他自己 然后说回到最开始的那个东西 就是为什么它是一个 像一个发夹一样的回文结构 也是因为病毒实在是太简单了 就是从序列的角度来看 病毒就是 DNA 或者 RNA 的一段 病毒入侵的时候就是

直接在那个细菌表面 就是噬菌体 在细菌表面打一个孔 然后把自己的 DNA 插进去 因为细菌为了免疫 就是抄写了他天敌的这个 对 他抄了一段 他抄过来是啥样就是啥样了 是的 然后当时这个 Mojica 就把这个假设 这个理论 去投给什么 Nature Science 这个顶级期刊 全部拒稿 从另外一个角度也证明了 Nature Science 虽然是顶级期刊

但是对于这种特别具有革命性的假设 和特别具有革命性的发现 可能他们会比较谨慎 就感觉是凭空来的 因为他会觉得你这是不是民科呢 你这是不是就是完全不靠谱呢 不是在当时的任何的 就是这个学术进程里面找出来的 加一的东西 是的是的 是的 所以呢 两年以后 他就把这个论文 终于发表在一个叫分子进化杂志 就相对而言 Nature Science 跟他们比的话

就是影响力就小很多了 但他发表了嘛 对吧 所以 他从 1993 年就开始研究这个东西啊 然后到 2005 年提出了 这是一个免疫功能 细菌的免疫 嗯 然后他研究的是这个不起眼的细菌 所以他后来拉不到钱 就是拉不到 Funding 又没有理由去研究细菌的免疫 花大钱和资源 去研究一个跟我们没关系的东西 对我为什么要研究细菌的免疫呢 我们是人呐 我们不是细菌啊

我们为什么要研究细菌的免疫 然后呢到了 2005 年 在另外一个地方 加州的伯克利 就是我们的这个主角 Jennifer Doudna 我们就称她为 她的名字里面有个 DNA 你发现了 所以我们可以称她为 DNA 姐 她的名字就很有意思 她的姓氏就是Doudna 那个后面有个 DNA 我们称她 DNA 姐 她和另外一个微生物学家 就正好坐在这个咖啡厅里面聊天

然后那个微生物学家就告诉她 我发现了这个极端环境底下 大量的微生物 都带了这个 CRISPR 的序列 然后 Doudna 当时就哦 这个很有意思啊 所以 CRISPR 它不是描述一个具体的序列 而是一大段都在这出现 而是具备了这个 这个 Cluster 的对 和这个什么就是回文的 回文的 就是具备这些特征的序列 它是个种类的名 对

然后它是在 DNA 里面一个区域类 反复出现的 大量出现的 当时这个 Doudna 特别好奇 就是说他们已经知道这是免疫了吗 对吧 是细菌的免疫 但是他光识别 他怎么去把病毒给杀死 我打断一下 刚才咖啡 喝咖啡时候跟他说这个事的人 不是发现这个事的人 不是发现 是另外一个微生物学家 但他读了这个人的论文 对 那个时候 就已经是一个学界的一些共识嘛 已经形成一定的这个学术基础了

就是一个你可以观察到的东西 对 而他在微生物里面观察到了很多 引起了他的注意 而且这个作为一个免疫假说 已经被流传开来了啊 所以他就知道 是必须要杀灭这个病毒的 就是 把病毒怎么消灭掉 所以问题就是 他到底怎么杀灭这个病毒 他必须要有一个武器 然后到 11 年的时候 她在一个 波多黎各的一个科学会议上 这个 DNA 姐

和另外一个法国的微生物学家 叫 Charpentier 我们就喊她 C 姐好了 她们俩一见如故 她们俩关系就变得很好 然后 Charpentier 就告诉她 这个呢还有一个蛋白 叫 Cas9 这个蛋白会跟这个 CRISPR 的翻译出来的 RNA 的这个结构结合到一起 然后这个 Cas9 就是叫分子剪刀 就它一旦去找到病毒的序列 咔嚓一刀把它剪断

病毒的血液就没法整合了 我就服这些名字 Cas9 也听着像是一个 9 号的一个工具 一个用来把一个东西给切开的 是的 就这些名 都听着特别 Appropriate 哎 我多插一句 你就尽量让他直观一点 对 她见的是一个法国的微生物学家 法国是不是在这个领域一直都是 还是比较前沿的 法国微生物就是很厉害 但我不确定这个 是不是有直接关联 但是法国确实微生物比较好 可能我们观众知道我们拍过鼠疫

那节目里面大量的登场角色是法国 对对对 有意思 100 年前了都 对 所以 Cas9 这个机制是什么样 对 所以这个机制慢慢的就变清晰了 就是说什么呢 就是首先在一开始 在这个记忆阶段 就是细菌通过某种方式 对吧 它被病毒入侵了 然后它捕获了这个病毒 中间的一些 DNA 的序列 插到自己的这个 CRISPR 这个区域里面 嗯

然后等到同样的病毒再次入侵的时候 注入这个东西的时候 它 CRISPR 就会转出来一个 RNA 然后那个 RNA 形成一个发卡 发卡就会跟那个 Cas9 结合起来 找到病毒注射的那个 DNA 剪断 这样 DNA 病毒的注射就对它无效了 就很多我没理解的事 就是第一 他最开始是怎么 他不应该被病毒杀死了吗 他怎么继承下来病毒的这个

他因为某一种进化上的原因 就是这个里面具体发生的什么 就是因为他是一个很漫长的进化 对 OK 所以他是某种原因 就你又想问那个 那个根本性的 你又想问那个实证问题了 就是一个不能直接完全理解 那那个 Cas9 那玩意 是一直在体内就有的嘛 它是个机制嘛 对 它 Cas9 就是体内一个基因 也就在 CRISPR 区域旁边 它可以翻译成蛋白

翻译成蛋白以后 就会和 CRISPR 那个 RNA 的那个序列结合起来 然后就去 生物识别 警局旁边有一军火库 哎 对 有一把枪 对 然后拿着枪就上了 是的 就 RNA 会转录出一个 实质上相当于剪刀的东西 把那个就糊在病毒身上 的那玩意儿给剪掉 对 是的 所以这就是我们说的 细菌的获得性的免疫系统 它可以学习

可以记忆 并且传递给后代 对吧 那么下一个问题来了 既然这中间的这个 Spacer 可以识别病毒的这个序列 我们是不是可以人工把这个 Spacer 替换掉 替换成我们任何想要修改的 DNA 或者基因序列 这问题就很清晰了呀 而且我修改了以后 我再提供一个叫模板的一个 DNA 然后人有一个修复系统嘛 就是

一般细胞是有个修复系统 它会按照你的模板去修复 你就把这个单碱基 就替换成 你想要的这个模板上的这个碱基了 嗯 这就是定点剪切 定点编辑 就替换了 然后你可以提供模板去编程它 那关键是这个中间 就还是 这个问题其实一点意义都没有 但是就是想象挺可怕的 就是在这个过程发生的时候的 那个基因会断一下 完再重新接 是的是的

人体内在发生大量的断裂和重组 所以 DNA 是经常会断完了又接 断完又接 其实就是 DNA 打开复制的时候 有的时候会经常发生这个断裂 甚至本身就是会断裂的 所以 本身就有一个断裂和修复的机制 哦 这个机制并不是新发现的 这个机制 是一直在 DNA 的复制中就有的 但是 如果咱们现在找到一个定向的方法 对 我可以愿意往里写啥就写啥 愿意删啥就删啥 但我理解中

这个技术和定向剪这事 还是两个独立出来的技术 对吧 是先发现人能改 DNA 然后发现有剪刀在 那个叫做同源重组技术 那个是在另外一个方向 但是你一旦知道你能剪了以后 你结合你的生物学的之前的知识 你知道我们有工具在这啊 那我这两个结合起来 不就是定向编辑了吗 就相当于咱们作为那细菌 咱们把咱不想要的细胞

AKA 癌细胞的那个特征那个给他 就做成那个所谓的病毒 就相当于让这个细菌对病毒免疫的 这个机制 在咱们身体里就也来发生 或者咱们细胞里也来发生是吗 抗癌的话比这个要复杂一点 OK 对 稍微复杂 但是可以这么类似 就是 CAR-T 就是 In vivo CAR-T 的时候 是有点类似这个意思 对 因为我刚刚才说这话 在癌症的时候我没理解 就是 CRISPR 这个技术

是这么读啊 对 CRISPR 对 这词太复杂了 CRISPR 这个技术 它是病毒 它是细菌对病毒干的事 是的 但癌细胞是细胞 没关系 只要是 DNA 就可以啊 它相当于是 DNA 对 DNA 干的事 归根结底是 DNA 啊 对 明白了 DNA 然后 CRISPR 转录成一个 RNA 带一个手枪 懂了 懂了懂了 对 所以只要是 那它也可以不止治癌症 可以治很多病 Exactly 它现在生物领域

是一个最基础的一个技术啊 就任何实验室都会用 CRISPR 做它的敲除 做基因敲除 什么时候发明的 这个我待会会说 然后到 12 年的时候 这个 DNA 姐和 C 姐两个人一起 就在 Science 上发表了 那一篇就是具有里程碑式的 那篇文章 中文叫 首次证明了 CRISPR Cas9 具有可编程性 哦 这个名字完全是人话 就是咱们刚才说了半天这个意思

所以你看这整个一个过程 她到这才发现了 哦 这个应用的一个可能性 到这才说了次人话 对 OK 然后我们刚刚说 测序我们可以读 CRISPR-Cas9 我们可以写 对 那么就拥有了读写权限了 对 拥有了读写权是不得了的 对吧 就是升级了 升级了以后这么有革命性的东西 那必然会引起 比如说申专利 甚至是有些纠纷 那么就发生了一个什么事呢

就是西海岸 以 DNA 姐和加州伯克利为主的 她们申了一个专利 然后东海岸就是 Harvard MIT 那边的张锋 就是华人科学家 张锋他呢 读了那篇文章 非常非常快地意识到这个文章的前景 就是作为治疗的未来的前景 他第一个想的是 就是我要把这个在哺乳动物 和在人的细胞上实现 而且我要把它工程化产量化 嗯 所以他们那边读了这个 Idea

然后把它变成一个可重复的 工程学的一个包 这个包可以卖给任何一个实验室 都可以去重复他的工作 所以这是张锋他们那边做的 这个包是一套做法 一套流程 就一套 Practice 每一个关键的这个 用的这个 这个试剂 用的这些东西都在他那 都从他那出 他都可以 他为什么比论文作者还快啊 做这玩意做的

因为他很敏感 而且他是 哦 这个时候 就是我觉得 中国人对于这个事情的这个敏感度 但是听起来 追赶性 很明显 他是一个从科学发现过渡到工程 是的 就是从科学到工程的过程 是的 但是你不说 就是在 DNA 姐那边肯定也在做工程化 但是工程化上就没有他们做的快 而且他们工程化的时候 可能还是在做各种各样的 Test 他这边直接在人的细胞上去变了

就做了 就做成了 做成了以后 那大家知道 那要往疾病治疗的话 肯定得要做人 可以弄到人体的这个细胞 或者 Cell Line 我听说我看那个公开信息说 这两边的那个专利的争议的 诉讼的法律费用 都过亿美元 对对 后来就引发了这个非常多的 这个专利的争议 然后背后的故事当 然也很精彩纷呈

这个在今天就不说了哈 今天就不说这个背后的这种 各种诉讼了 但是最后呢 就是在 2020 年的时候 这个诺贝尔奖就颁给了 DNA 姐 和那个 C 姐 她们俩合作 因为她们第一次证明了这个 可编程性嘛 然后但是现在实验室 生物学实验室目前用的 CRISPR 技术 大部分是张锋实验室出来的 对 对 所以是这么一回事儿 张锋团队也是非常非常厉害

非常厉害 然后 最近接受那个硅谷 101 的那个丛乐 就是从张锋团队出来的 对啊 然后我们之前也有 我们之前有一个 就是我在 MD 安德森 的时候的另外一个 隔壁的实验室 他是从 DNA 姐实验室出来的 所以 CRISPR 技术落地之后 就 Enable 了 很多很多 咱们刚才说的这些免疫 是的 各种各样的边界 甚至你在实验室里面

你想验证一个基因的功能 你都变得非常的简单 更关键是 你可以批量验证 哦 你就把它剪了就行 你不仅要剪 你只要把这些你想要的 这个叫 Guide RNA 就原来的那个 Spacer 我们现在改名叫 Guide RNA 了 就是引导 RNA 序列 你只要编程好这些 所有引导 RNA 序列长什么样 就批量化地生产 批量化的产生 CRISPR-Cas9 的技术

就可以批量化的编辑不同的基因 你可以玩转 DNA 对 你可以玩转这个细胞它的 DNA 是什么时候的事 大概这就是 2020 年 这个 2020 年之前吧 大概 这个时候差不多就已经成熟了 就是在张锋把这个系统做出来的时候 不是 这对我 冲击格外大 就是我 15 年开始创业的嘛 嗯 那相当于我创业那个时候 就我搁那吭哧瘪肚地

做图像识别的时候 在生物学领域 人们已经 那个时候开始能编辑 编辑 DNA RNA 那没用多少年 根本就 对 就是个非常非常近的事 非常快 对 但是就是咱们说的严谨点 就是在 CRISPR 以前 我们也不是完全不能编辑基因 只是非常费劲 我们是用一些比如说锌指蛋白 就编辑的效率极低 编辑的精度极差 同时可能只能编辑一些固定的区域

对 就很难 我这个问题存在吗 就是说它能不能比较一下 新的这个技术和老的那个比 它提升了多少倍这 这个多少倍我不知道 但是原来的技术 它不可能实现任何的高通量编辑 高通量编辑指的是高通量 就是说你在电脑里面设计好这个 Guide RNA 的这个序列 然后模板序列 然后一整套的这个试剂什么的

就可以打包产生出来 嗯 然后你就在细胞那个 比如说一个板上面有 比如说 384 孔板 每个板的孔里面有不同的细胞 你可以对他进行完全不一样的 基因编辑 我就感觉就是有点像 一步 从那个最原始的打孔的那个计算机 是的 变到了现在的这个 一下子变成了一个现在的 正常的计算机 对 他都不是中间一步步过过来的 他是一下子飞过来的 他是一种新的机制

而且原来你只能计算特例 只能计算什么 用 7 整除的数或者怎么样 是的 对 对 对 对 这点说的非常好 是的 Exactly 锌指蛋白就是有很多很多局限性啊 那这对这行业简直是个巨大的改变 对 然后我们 所以就你刚刚说的组学 其实还有这种叫干扰以后再做 Single 就是先用 CRISPR 编 编完以后再去做 单细胞测序

就可以得到它编完之后 这个细胞到底长什么样的 一个结果 叫 Perturb-seq 嗯 对 这太厉害了 这个简直是 不知道可以跟什么东西去类比了 这简直就是划时代的技术 是的 是的 他技术本身上就是 确实是给我们又提供了一次拓展 一次巨大的那个拓展 这仨人值得单独每个人立个碑啊 以后这绝对 但我觉得大家还忽略

就是那个 Mojica 嗯 最早把那个 Spacer 去做 Blast 发现那个噬菌体 是噬菌体里面的那个序列的那个 西班牙还是哪里的那个 对吧 诺贝尔奖没得到 只得到了一个故事 对 他得到了这个故事 人们讲故事的时候会从他开始讲 我觉得特别有意思 就是基础研究往往他是好奇心驱动 对 并不能看到他的商业前景 对 就是一开始啊 但另一端是技术应用 它马上就会被

整个领域一下子推起来 因为它开头是开在有一个人 觉得这个序列看着很有意思 对 这个有意思 和他为 20 年以后他能做的事 完全没有关系 没有任何关联 他还在研究细菌的免疫系统 还得不到 Funding 他现在还在研究吗 现在我不知道他在研究什么了 但至少他曾经的研究 也是一个奠基性的 对 但你发现所有行业

每个突破性工作都这么来的 对 就没有 你都想不到一个反例来说 有一个东西我就要突破 然后就突破了 没有 而且这东西看起来太 Long Shot 就都不叫 Long Shot 就是 你都不能用渺茫来形容 感觉像是一个无用的 或者是一个就是分散注意力的东西 你只是跟我说细菌里面有一些 对 那个基因序列看起来是回文

So What 是的 但事实上 我认为 其实很多科学都是起点都是这个 对 就你就发现某些不一样的东西 然后就 Why 他就是一个好奇心驱动 他不是在上来 我靠这个 我要造福人类 对 这个我要 Make the World a Better Place 我要攻克癌症 他上来就是 为什么看上去这么诡异呢 为什么看上去总是有点奇怪呢 就是这个 本身

你看生物或者看细菌的这个基因组 就像一个考古 嗯 你看到的 他记录的 是他的这个亿万年的进化 的一个结果 对 他这个进化中 就包括他捕获病毒的序列 然后插到他的体内 这个 Spacer 的这个序列 就是对应着一次古老的一个战争 对病毒和细菌的一次战争 就是考古的那种好奇心 对 是一样的 而且就是我

就我刚说那个 那东西对我来说也是 想想不寒而栗 就是他的生命的那个复杂性越低 它也体现在它的基因序列的复杂性越低 低到啥程度呢 它看起来像是一个人 肉眼就能看出来的 对 这是一个细菌对病毒的防御战 然后就是对一些有直觉的科学家

他们就是能够在没有证据的情况下 提前想到这是 一个免疫的机制 对 因为有这个东西 大家就会联想到这个免疫机制 是的 这真的太厉害了 所以这个是发生在你的工作的下游 就是当那个 我们开始想要做一个什么样的蛋白质 的时候 就可以用了 我们现在应该是全流程都有 都有用 全流程都有用

只要你想要去修改基因 想要去敲掉一个基因 或者是修改一个基因 你就可以用它 对 对 甚至是在这个基础之上 它又演变出无数种的变体 无数种的更复杂更 Fancy 的方法 对 明白 CRISPR 就基因编辑 就编辑这个词本身就是一个贼 听起来特别猛的一个事 编辑 就是增删改查 你可以随便做了 就是这种 差不多 差不多这个意思 然后 但是会引到一个问题

就是他编辑有一定的脱靶性 嗯 就他 不一定能保证每一次 百分百都是那一个东西 他可能有一定的脱靶性 所以如果要在人的胚胎上编辑的话 就是有这个可能性的 考虑风险 就是之前我们中国那个贺建奎 他做的这个事情 就是相对于比较冒进一点 对吧 他直接一步就到人类胚胎 他的那个操作算 CRISPR 吗 是 CRISPR 就是用 CRISPR 做的 OK

然后他编的目的是为了让他 因为他父母有艾滋病 对 他希望小孩有一个艾滋病抗 就是抗艾滋病的一个基因 对 但是问题是 其实就是解决这个问题的方法很多 不需要 CRISPR 而且你 CRISPR 你不知道你编的 是不是完完全全就能确保 100% 我觉得就是这个伦理讨论 可能有点复杂 但是我觉得 最起码我们可以理解一个概念

就是基因里面没有一段是管艾滋病的 它不是一个 Compartmentalized(分隔式) 对 就是一个 就这块就是关于艾滋病 它是一个复杂网络的一个结果 所以你就直接这么 Arbitrary 的 就是敲掉一个基因 它现在影响不可能仅限于艾滋病 它有一个基因 理论上那个基因是那个样子的话 他对艾滋病是有一定的抵抗的 对 但是呢 这个基因有没有其他的功能不知道

就是啊 对 There's No Way To Know 对 这不是咱们今天要讨论的话题 接着说 AlphaFold 吧 AlphaFold 感觉就不是这样的故事 AlphaFold 像是一个以力破巧的一个 一个计算机工程的一个成果 感觉是这样 是的 就原来你处理不了这么多的数据 现在你能了 就从不能到能 而且 AlphaFold 背后可能还代表了一种 就是 AI 的范式转化 对 其实我们一开始有提到一点 关于蛋白质的结构的问题

就是我们说蛋白质的结构 其实就是一个一维的氨基酸序列 对 然后这个序列本身决定了它的结构 而这个结构决定了它的功能 对 所以这个事反过来就是说 我知道这个序列 理论上我可以知道这个结构 对 也就可以知道它功能 所以它在生物学就很重要 因为我知道它的功能的话 我就知道怎么去干扰它 对 对吧 所以很容易理解 新药研发 我们需要去理解蛋白质的功能

如果一个靶点蛋白的话 但是呢 原来我们在从序列到结构这一块 我们用了非常复杂的这种计算方法 各种各样的这种 能量的这种模拟啊 或者是各种力场去计算 但是结果就非常一般 然后 AlphaFold 是直接用深度学习 就是它放弃了所有的 关于这个规则本身的这个理解 嗯 我只要有数据我就可以

他是一个黑箱学习嘛 深度学习 对 他不是试图去理解折叠是怎么发生的 这个还是大模型的上一代 AI 的上一代 是纯 Deep Learning 对 AlphaFold 是 AlphaZero AlphaGo AlphaZero AlphaFold 的 嗯 对吧 应该是这样的 就没有用到大模型 是的 没有用到 但是它的模型也很大 它的模型参数也很大 只是不是今天说的大模型 嗯 不是做这个 Attention 的这个大模型

对 他就是从数据中直接去学习怎么去 去这个折叠 然后我们刚刚说到一个 就是 我们其实本身有一个海量的 同源蛋白的数据 刚说就同源蛋白的意思就是 同样一个蛋白 但是在人在鼠在猫在狗身上 它这个蛋白展开成一维的序列 它总有些不一样的地方 对啊 就这些不一样的地方 有的时候会成对的出现 理论上 这些成对出现的不一样的地方

有可能在空间上就是比较接近的 嗯 就是可以通过这个 理论上是反推出的 空间的接近就是共同进化嘛 共同进化的过程中 如果这个蛋白啊 这个氨基酸换掉了 那个氨基酸没换的话 整个蛋白结构就不对了 对 就不平衡了 所以这边也得要对应换过来 把它掰扯过来 这样的话 这个蛋白还是同样的功能 或者近似的功能 所以基本上就是说

利用同源的这个大量的数据 和利用已知蛋白结构的数据 上深度学习 就可以学出一个预测的 每一个氨基酸在空间中折叠之后 靠近的那个图 就 这个氨基酸和这个氨基酸在空间中 这么近 这个氨基酸和这个氨基酸 空间中这么近 理论上 这个图

就可以复原出它折叠的真实样子 在你不能在 就是生物体里 实际找到它以前 对 你就先预测了它 对 先预判了 是的 是的 就是我估摸着这个 这个蛋白质长的应该是这样 有点像找元素周期表 就这肯定有一元素 有点这个意思 他总要有一些知识 但是这个知识 不是我要一条一条告诉这个模型的

而是让模型自己去学这个知识 OK 但这个知识背后对应的一些逻辑 我大概说一下 但肯定没有这么简单 对他背后肯定有更复杂的 这个逻辑 我觉得这个有点像什么 我觉得比较有意思的是 它像我们说深度学习 一开始什么学一个猫是什么 你并不需要去定义猫 对 就并不需要理解猫这个概念 具体它只要看足够多的猫的图像 它会形成一个直觉 对 对吧

我觉得深度学习就这种感觉 就他是形成一个对于这个数据的直觉 然后实现他的预测 如果你硬要去他的那个过程中去抠 那个可解释性 你也能抠出来一点 你能抠出一点 但是你不可能把这所有列出来 然后完了 用这些解释的逻辑 去重新实现每一个蛋白的 就这过程里没有一个像人一样的 那个线性的逻辑推理 对 对啊 就我先

或者是他的逻辑推理的过程巨复杂 你没有办法完成 他的复杂度 是是 那个就是极高 对 极高的 然后到 2018 年 这个 CASP 就是一个专门 预测蛋白质折叠计算上的一个比赛 嗯 就是我们现在有这么多 都要用 C 开头 嗯 对 我不知道这个 CASP 全称 我忘了这个 CASP全称 但它就是蛋白质折叠的一个非常高 高规格的一个比赛

就是最计算领域 做蛋白质折叠人都会去打这个比赛 OK 那打这个比赛的话就会有个评分 因为他们 hold out 一些人类目前还没有公开的 已知的蛋白结构 他就拿那个东西去 Test 每一个模型 到底预测出来怎么样 这是实际有的蛋白 对实际有 但是没有公开 不告诉你 互联网上的那个 Public 他们怎么有别人不知道呢 那 CASP 他做了这么多年

他都专门去跟一些课题组对接 去收集到这些信息 就我们可以获得蛋白质的 真实的结构 但是那个过程不是很昂贵吗 最开始不是说了 对 要用冷冻电镜 嗯 Cryo-EM 对对 那个是一个巨贵巨贵的器材 就是你钱花了 你能获得一个蛋白的结构 我们当时说一个博士生 5 年的时间获得一个蛋白质的结构吧 差不多

这是一个非常武断的说法 但是你大概理解一下它的难度 到了 2018 年 这个 CASP13 这个比赛的时候 AlphaFold 1 就亮相了 然后直接就是震惊全场 就直接甩了第二名 就这个题的题目 是一个残缺不全的蛋白质结构 对吧 他给你一部分 他给你 但是不全 对 他先给你这个 Data 先给你已知的蛋白序列 它的结构 这个叫 Data

叫 Training Set 然后给你一个 Test Set 已知它的序列 但不知道它的结构 好 大家你就在那个 序列是给你的 对已知的这个序列 Training 你 你不管你用什么方法去训练 但是最后 我就在这个 Test 上面去看这个结构 它的相似度 它有一个计算方法 计算这个相似度 OK 对 然后 AlphaFold 就震惊全场了嘛 对吧 就直接得了第一名 就是 2018 年的时候 CASP13 但当时得完以后

我在来的飞机上看了那个纪录片 叫 《The Thinking Game》 就是关于叫 Demis Hassabis 的那个纪录片 他就是 AlphaFold 背后的公司的创始人 也就是说他主导了这个事情嘛 他当时其实说那次比赛完了以后 他并不是很开心 因为大家觉得虽然得了第一名 但其实与他们的预期还差很多 就远没有达到他的预测 就可以在实验室中使用的结果

就他认为还是差 差的蛮远的 所以他后面就努力的去迭代 迭代他们的算法 然后又迭代他们的模型 等到 2020 年的时候 CASP14 的时候 AlphaFold 2 就基本上是断层式的领先了 然后就直接结构预测的那个精准度 就可以拉到我们 实验室使用的这个级别了 然后等到最新的 AlphaFold 3 还可以预测多个蛋白之间的相互作用

蛋白与 DNA 蛋白与 RNA 之间的相互作用 还有蛋白上的一些抗体的位点 然后你怎么去设计抗体 所以这就使得它成为结构生物学家 的一个日常 的一个工具了 对就这个日常工具 是怎么用这个东西 就是你直接去他的网站上 你现在可以直接去他的网站上 然后你把那个序列输给他 他给你折出一个蛋白结构 就是 就是一程序是吧

就是一个程序 它是一个网站 但你也可以下载它的这个 它甚至不是用命令行 插入可视化界面的 有可视化界面 也有这个 但是对于结构生物学家 他不需要去写编程 哎呦这人太 这超乎我想象的这个 你就是你刚才讲的整个 这故事你要是镜像着对比 这个 ImageNet 的故事 基本都能对上 但有一个事对不上 就是 ImageNet 导致的 这个深度学习

就是在 Computer Vision 世界里的革命 它完全没有被控 在这个 Hinton 的团队里 就他们用深度学习的方式 给大伙证明了这是一个比 那个专家系统的更好的路 之后就是变成全世界都在做了 但是 AlphaFold 不是 AlphaFold 还是要 大家还是要等着它做第二代和第三代 因为我个人感觉是这个问题本身

它不是那么 Generalize 它只有结构生物学家才感兴趣 这是第一 第二是 其实有一个团队就是也得了诺贝尔奖 就是华盛顿大学的 David Baker 嗯他 然后那个 Demis 和 Demis 的另外一个 同事叫 Jumper 他们三个人合得的那个诺贝尔化学奖 所以还是有 有赛跑的竞争的啊 这个赛跑竞争 甚至在每次新 AlphaFold 出来 他们实验室也会推出一个更强的版本

就他们实验室追赶的也非常厉害 他们的实验室 可以认为是学术领域 做蛋白折叠的最前沿 但是他们和 AlphaFold 之间有很多交互 就不是完全竞争关系啊 明白对 他们会互相迭代 互相增强 这个 David Baker 是华盛顿大学 他们还出了 出了新的模型 用这个图像产生的 Diffusion Model Diffusion Model 可以做这个 Generative 图像 对 Stable Diffusion Midjurney领域这些 那你是不是可以

Generate 一个蛋白结构 按照你想要的样子 按照你 Prompt 的样子 它就可以 Generate 一个完全从头合成的 一个世界上不存在的一个蛋白的结构 甚至是我可以针对某一些功能想象 就是 我们预期这个功能去产生一个蛋白 就不知道这 Prompt 写的是 你是一个极其优秀的蛋白质 对 蛋白质绘画家 你要给我画一个 他的 Prompt 肯定不是我们想象的 Large Language 的 Prompt

但真太胡来了 对就是 我觉得 AI 发展到今天就是跟巫术一样 就是你只要把数据给我凑齐了 你就等着吧 对 我觉得是这样 我不知道我们有没有时间 就是稍微聊一下 Demis 这个人 我觉得他特别有意思 因为我在来的路上 看了他的那个纪录片 他的发展的历程 以及他的思考 本身就对应了 AI 的一些

方法论的东西 就它关于每一个事情的思考 都对应到 AI 的一个方法论的一个突破 上面 能不能先简单介绍一个综合的他 然后再具体讲 行 首先这个 Demis Hassabis 现在就是那个 DeepMind 的老大 然后 DeepMind 就是 Google 被 Google 收购了 然后基本上就 Google 的 AI 团队 非常厉害的一支 他是个英国人 对吧 他是个英国人 他本身的背景 应该是有一部分华人血统

还有一部分哪里的血统 我忘了他们 他也是那种移民嘛 然后移民的后代 然后他小时候 首先我想推荐给大家 就是 《The Thinking Game》 比如说你喜欢玩游戏 或者你对生命科学 对蛋白折叠都感兴趣 或者对 AI 本身感兴趣 嗯你可以去看这个纪录片 我觉得这个纪录片还挺好的 然后他的成长 就是说

他那个小时候是一个国际象棋的神童 嗯大概 5 岁的时候 就已经达到什么全国什么排行第二 还是排行第几的那种 那种水平 可以和成年人直接对打的那种 非常牛逼 非常牛逼 8 岁的时候呢 据说他当时参加一个什么比赛 在一个什么大雪山的一个山顶上的 一个修道院里面 然后他们一帮人 聚在那个修道院的那个大厅里面

就开始进行这个 象棋比赛 然后他当时对阵了 一个非常厉害的一个棋手 当他打得非常焦灼 到最后的时候 他突然就放弃了 他就不跟他打了 他就认输了 因为他当时脑海 里面产生了一个怪异的念头 就是说这个房间里面这么多聪明的人 他们的智慧 他们所有的脑力 都放在这个小小的棋盘上了 他们可以去做别的事情

这就是智能是通用的 嗯 他们的大脑并不只能下棋 他们的智能是通用的 对 他就会想 为什么需要只做这一件事情 这是一个我需要去研究 不是这个棋本身 而是关于如何一个智能系统 去学习下棋 而这个智能系统也可以做别的事情 就是一个 General Intelligence 嗯 对吧 他当时在思考这个问题 然后他后来就被那个 Cambridge 录取了嘛 就剑桥录取了

然后在入学前的一年就 Gap Year 他就加入了 然后重轻肯定知道 牛蛙工作室 那不做游戏的嘛 这个太厉害了对吧 大家都知道 Molyneux 对 然后牛蛙工作室的话 他就参与了 就是 《Theme Park》 主题公园的开发 他在这个里面就开始想 游戏首先是一个完备的规则 它就是封闭的系统 Bullfrog 牛蛙工作室 是游戏 AI 的 先驱

Exactly 然后这个 Pioneer 的背后 那个 AI 是 就是那个 NPC 和就是这个世界运作 就是自我运作的逻辑 那个不是 AI 啊 就不是今天的 AI 对 它只是一套规则 自运行的规则 对 但这个规则背后其实有 Demis 在里面注入一些 他关于强化学习的概念 那个年代有强化学习了吗 有那 Q-Learning 是很早的 只是没有今天大规模的神经网络 那个时候我不知道

不确定它有没有用到神经网络 但是比如话 如果你所有的决策放在那 你可以用 Q-Learning 去学 用什么决策 它会变得越来越跟你更互相适应 然后他做了这个主题公园 然后等到他大学毕业以后 又加入了 Lionhead 就是狮头工作室 就不用说了 然后参加了这个 《Black & White》 《Black & White》 里面不是有一个神兽魔宠吗 他就把这个神兽魔宠注入了 这个强化学习

这样你玩的越多 这个魔宠跟你的 那个 个人感就越强 还有这个 因为我特别喜欢黑与白 关注一下 一和二我都玩了很久很久 你有感觉到它里面有一些东西 跟别的游戏的 对 有那种感觉 它的 NPC 聪明 对它的那个聪明 背后就是 Demis 在里面做这个强化学习 对 它是一个实时更新的强化学习系统 跟你互动 不断的学习 不断反馈 这故事听着跟童话一样 就是你感觉就是

都是胡编的 就是上帝 游戏这个类别就是嗯 大家在娱乐世界里面 最早就 Like get a feel of it 就是说一个智能的世界 一个世界自己在运行 一种类似的感觉 虽然它底层的技术是在 在今天来看是很幼稚的 是的 但是这是我们公众 最早可以感受一下 人工智能的雏形的东西

所以现在当大家讨论人工智能的时候 这最开始他是在游戏世界 被玩家所感知的 就像英伟达 在游戏世界做图像 人还得玩游戏 他变成了 对 因为游戏世界本身他是封闭的 有规则的 有目标明确的 一个反馈的 所以他可以做这个事 对 如果你放在现实中 他就变得巨复杂了 对 然后所以你看他的思路就是

做游戏可以强化学习 强化学习可以产生智能体 在这个智能体就在里面不断的交互 然后就进一步在未来产生通用智能 是 他后来就开始研究这个蛋白质折叠嘛 研究神经生物学 研究蛋白质折叠 然后呢他出了这个 AlphaFold 我们就说 他已经打败了现在所有的这个算法 对吧 然后和这个 David Baker 这边团队一起 在共同往前做 就是他的核心逻辑

就是我不去研究一个具体的 比如说会下棋会干嘛的程序 把它拆成一个步骤 嗯 拆成一个具体的东西 我是要做一个能学会 做这个事儿的系统 对 因为我觉得他早年的游戏经验 他就比那些 在这个领域内生根的科学家 有更多的这种认知 就是他不是在考虑这个事情本身

他是考虑事情本身之后的那个系统 怎么去学会这个事情 就是不断学习的系统 就是一个 他有一个 Meta 的这个 元层面的认知 嗯对吧 然后他同样就是人类的智能 显然是也 也是一个元层面的认知嘛 你可以下棋 你可以去打游戏 你可以去做科研 因为学习和 就是比如说上帝游戏里面那个运转 那个世界的 他不是学习

它只是一套规则它 是规则迭代 对对对它是规则迭代 是你把人应该怎么表现 人应该怎么行动先设计好了 然后再让它去运转 是的 但是学习可不是 对 学习是一种 Adaptive 的 适应的过程 这个其实你就很容易就想象到 就是 AI 发展的过程中 这个两条路径就是一个叫符号主义 一个叫连接主义

符号主义的意思就是说 我们要把世界把一个问题 拆成他的基本规则 对 拆成他的基本逻辑 然后在这个上面进行推理 他本身有很深厚的这个人类思想 哲学的这个背景 就是从柏拉图的那个洞影说 到亚里士多德 他们都是认为 存在着一个理型的世界 这个理型的世界就是清晰的规则

然后这个清晰规则运转产生了 这样我们只要发现了这个 现实世界所有问题就迎刃而解 所有具体的麦克风都是抽象 这个麦克风符号的一个特例 对 就这意思 我们只要知道那个玩意 现实世界就不是问题了 嗯 所以我们解决问题 就是 我们把这个领域内最聪明的专家 集在一起 让他们想出所有的问题和所有答案 然后把这个所有问题 所有答案变成一个决策树 对 就专家系统 然后事实上就是

就是某一种用聪明的人去约话 复杂的事情对 但连接主义就完全不一样 就是我用一个神经网络 你不知道这啥玩意儿 他直接来数据 然后不断不断的 Training 不断不断学习 然后通过 大量的数据和统计模型 去建立起这个 Input Output之间的这个关联性 但这个关联性本身 并不是一个显示的逻辑 嗯 对吧 然后曾经人人喊打这个神经 神经网络

对吧就是 Hinton 也是 就是当年比较比较惨 混的比较惨 对我就记得我当年刚做创业时候 融资有个投资人就跟我说 他说就你们做计算机的 用一个生物的词 这事一听就不靠谱 所以 他们当年好像发文章 都不能用 Artificial Neural Network 他们必须要把它替换成另外 因为这些词都被不断的科技泡沫 和学术世界的泡沫给玷污了 对对对 就被透支了 是的是的 没有学术信用 你怎么去申请经费

就是这个问题 但今天 他的这一套却成了一个完全的主流 完全的这个 AI 背后所有的范式 统一的范式 就是 其实我在想 我在想就是为什么现实的世界 你没办法用符号主义 没办法用符号主义去规则化它 就第一 它是有噪音的 第二它是复杂系统 它有混沌 对第三 它存在一个叫多尺度涌现 嗯就

多尺度涌现是具有某种计算不可约性 就是你没办法去还原论 还原出这个东西 我就可以得到这个解 嗯 因为它在这个过程中 会产生一些新的更 更高阶的一个模式 对对 这个 Pattern 必须要通过一步一步的那个 然后更关键是 我觉得很可能现实的很多问题 并不存在一个绝对的底层的逻辑 也就是所谓的这种底层的

公理系统 他的背后可能就不存在这个东西 是因为你往深了揪 揪那个粒子 揪多了就发现有量子力学 他的这个公理系统 他就不是一个 那个我们只能 他只是在一个 一个颗粒度上的为真 一个颗粒度上的某种总结 某一种统计学的总结 其实他实际 对就我总喜欢打个比方

就是给我的感觉就是 符号派人认为 人就是人的大脑 对 人就是人的理性嘛 皮层做推理 对然后那个连接派 认为人是大脑以外的部分 嗯就是 就到底这两个是 当然人是这两个东西的综合 对 但就是到目前为止 就是作为一个条件反射的 一个这么一东西 这么一个神经和肌肉在运作的 的一个东西

解决了那个真正困难的问题 到目前为止 对 而且甚至是我觉得大脑如果做的多 做的更多了以后 你发现它也不是完全死板的 功能模块的 Exactly 的这样运作 它也是一个神经网络 它就是神经网络 对 对 所以当时我 在这个过程中我就在思考 神经网络 如果我要打一个比方 如果让大家去理解的话 背后的感觉

它是一个非常有弹性 非常柔软的 一种高维的橡皮泥 你通过不断的输入输出 去捶打这个橡皮泥 把这个橡皮泥往这多拉一点 往这多压一点 最后这个橡皮泥形成的东西 对于这个数据的表征 一个重点是这个橡皮泥 本身具有的信息 要小于这个数据本身 它必须形成某种压缩表征 近似

某种近似 某种压缩表征 这个橡皮泥上的这些形状 这些造型 就是知识的一种 一种表征 我们说人的大脑 其实人的大脑 也不是一个完全的专家系统 虽然我们说前额叶可以学习 可以推理 可以逻辑 但事实上 人的大脑也是一种非常复杂 非常 Fuzzy 的一个过程 当他思考的时候 所以你看我们从 Thinking About The Game

Thinking About 下围棋 下象棋 做蛋白质折叠这样的东西本身 变成了 Thinking About Thinking 变成了一个 Meta 的层面 我觉得这是整个 我看了那个纪录片 我觉得最有意思的地方 就是 我们可能要放弃某一种形式化的努力 我们得放弃这个事 首先我不是批判形式化逻辑 或者形式化系统 因为人类科技的发展

其实背后巨大的动力 来自于这种形式化的尝试 我是觉得 接下来下一次的大范式转换 他们会融合 他们(符号派)会绝地反击 他们会 他们会 Come Back 会有一个更凶狠的 Come Back 我可以期待一下 然后同样的媒体 会再说一遍一样的话 重磅 然后 反动派就变成了连接派的人 那就很有意思 我只知道 那个时候 能不能不要给新闻所有

前面加什么万字长文 重磅 最后来一感叹号 那能不能事不过三 两次了 应该会有迭代 问题是这次和上次 我感觉没有任何迭代 我觉得我们太过于相信这种还原论 这种符号主义 希尔伯特说 我们必须知道 我们终将知道 我们好像可以把真理给 Figure Out 我们就解决了所有问题 但事实上发现我们太自大了 我们最多 最多

只能去构建一个足够 Plastic 的 橡皮泥 让它进出 进出 然后让这个橡皮泥去 拟合出这个东西 我就想到养娃 因为我有个儿子嘛 养娃 养娃的时候我就发现 你不可能规定 小孩去做每一件具体的事情 甚至是你定的原则 他也没办法完全遵守 你只能给他环境 给他数据

给他反馈 跟他互动 在这个互动中 你要有耐心 你要偷偷地关注他 但是你不能被他发现 然后让他自己不断地学习 不断地成长 当你目睹一个婴儿开始 他作为一个生命开始 过他的第二天 是他第一天的两倍 他一秒一秒的过这个生活 你会彻底的意识到 人是怎样成为他的经验 和他输入的所有信息的总和的

而且你要让渡出你对他的绝对控制 就像我们要让渡出 符号学派的绝对控制一样 是 然后这个就是关于 AlphaFold 以及一些联想 一些关于 Demis 的联想 Demis 这个人 实际上 他受到的关注其实有点不成比例 是的 而且他现在 还把他的 DeepMind 拆分出来 一个叫 Isomorphic 做深度学习在医药领域的 他现在没有任何管线

但是他想用 AlphaFold 和一系列的算法 去驱动这个事情 这是 Demis 在做的 他一直在做 AI For Science 这点挺了不起的 但是 他却给整个 AI 行业做了一个 金字招牌 来去游说政府 大伙都拿他去说事 对 其实一个个都在做 然后做 Large Model 以前做推荐算法 现在做这个 Large Language Model 做这个 Chat Bot

这挺有意思 咱们能不能最后再快速总结一下 用几句话 AlphaFold 的存在 让做药的过程为什么变得容易了 就是我们首先说一下 新药研发的大概流程 从最早期的 比如发现靶点 发现靶点以后 去做它的蛋白结构 蛋白结构这块 首先 AlphaFold 就可以用上了 去预测它蛋白结构

预测出蛋白结构以后 你可以找到这个蛋白结构上存在哪些 叫活性口袋 这个活性口袋 如果你在这往里面 插入一个匹配的化合物 它的整个蛋白会变形 变形了以后它就可能失活或者被激活 对吧 那么这个化合物 其实就是我们所谓的药物 感觉像是在做一块拼图一样嵌进去 是的 它和这个活性口袋会结合

所以 AlphaFold 也可以帮助到这一点 然后这个蛋白 上还有一些 我们称之为叫 Epitope 就是叫表位 一些结构 这个结构可以被我们说的大分子 另外一个大分子结合起来 那这个就是我们去设计 我们的抗体药物 我们知道它的表位 我们就可以设计对应的抗体 上面的那个 长什么样 就跟他抓手抓上了

但是 AlphaFold 是管杀不管埋的 它只管告诉你你应该做 做什么样的蛋白质是最可能的 可能性 关于怎么做 必须要进入到一个实验 和工程的验证 但至少它帮你提供了一个初始的筛选 OK 对 我能不能理解咱们今天说的这几个 这三四项技术 就是过去 20 年 人类在医药领域 治病这个领域 最重要的一些技术了

差不多 如果说分子生物说那个 那单细胞 单细胞空间也说了 或者说是 或者是在基因啊 蛋白质细胞这个层面就是最伟大 你要 你要读 你要写 你要预测它的蛋白功能 对吧 主要就是测序 单细胞测序 空间测序 写就是 CRISPR 这种感觉 一个技术 如果它足够突破和足够厉害

即使它是个纯科学技术 它对人的哲学观念也会有影响 这些东西 让我对很多事理解 感觉有一些动摇和变化 是吗 关于什么 品一品 比如说把血抽出来 改完之后再给你怼回去这个事 那 OK 那有些宗教是不接受献血的 对 你自己 的血抽出来 再把自己血塞回去行不行 自己的应该没事 但如果它是来自于一个健康人的 那估计是完全不行

但如果是你的呢 或者说我就只敲了你点基因 这还是 那个 怎么说呢 随着我们可操作 和可观察的那个层次 那个颗粒度越来越细 自然这个概念正在不断的后退 是的 你 原来你会觉得 你是不可想象你对细胞做什么事了 现在你可以对蛋白质做什么事 你可以对 DNA 做编辑 然后这个你

你在想什么东西是不自然的 就这个事 得不断地把这个位置给让出来 因为它是一个完全清晰的东西了 虽然我们现在 不能把 DNA 给拿出来 放手里玩 但是我们几乎都可以对 对它进行删除和增加了 所以它就必须得供我们操作了 那个所谓的这个事是不自然的 这个事可能是邪恶的

你就不再有 你怎么能操纵人的 神圣不可侵犯的 这种观念只能让开了 那基因编辑的这个受精卵 直接在受精卵上做编辑 其实现在有一些 如果它这个受精卵 被证明是遗传病的话 然后它是单位点的遗传病的话 好像现在正在 我不知道是已经批了 还是正在审批一些编辑 那我

我对这个事最大的疑问是 我们有理由乐观吗 因为 经过过去这 100 多年人类历史的教训 人类对一个新技术 出来的时候 其实第一反应不一定是乐观的 就是最好的情况 一半一半 比如 AI 有多少人赞同的 现在就有多少人反对 我觉得 甚至可能反对的人更多一点 那原子弹什么 就 Whatever 自从这个未来主义结束之后 人类对于新技术就不只是 很难是纯乐观态度了 但我听下来

咱们现在聊这个事 百利而无一害似的 那它肯定是有害的 这咱都知道 我打一个最具体的比方就是 比如 富豪可以去给他们的小孩编一些 我们知道一些 比如说让他的肌肉变得很厉害 或者是大脑变得很发达 他们可以对这个未来进行定制 他们拥有这个特权嘛 目前是

我们现在仅限于医学伦理 说这个小朋友 如果这个受精卵长大成小朋友 如果以后有一个遗传病 我们可以去把它修掉 但是是不是能做增强呢 这就是造成了更大的不平等 钱可以 得到更好的人 是的 成为更好自己 折换 他可以折换 但总体而言 这个技术 我们可以认为在诸多的新技术中 我们是相对来说

对这个技术应该更乐观一点 乐观 可以在这里面占一个比较大比重的事 至少我们现在在治病 至少我们现在治病 除了 Upside 没有 Downside 至少它没有叫嚣着 说你们以后都失业 然后还管失业的人叫历史的 AI 嘛 对 去年有个新闻 给我看生气了 说这个武汉这个萝卜快跑 萝卜快跑出来了一些司机 不是取代司机 开始当自动驾驶的了

然后有个人就写 他说这个司机很不乐意 这很正常 但是历史的车轮滚滚向前 一定有些人会被碾压过去 I was like 就是 你在说啥呢你 你再仔细想想 自己说这话 你在说的这个事 是违背了人类的一切伦理道德的话 是的 但做 AI 的人 有些时候他会沾沾自喜的往上 因为他是技术主义嘛 他甚至会很开心的跟你讲这个事 你看我们撵过了这么多人 这是他的成果 就是这个 我就有点不接受

虽然我是干这行的 但我非常不接受这个论调 我觉得这些事到今天 它是一个 顺着我刚才的想法说 它是一个去神圣化的过程 就是当你可以编辑基因之后 基因就是一个可以操作的事 对 然后咱们现在做的是一些非常 我们做了特定蛋白质 把它打到人的身体里面 去攻击人的癌细胞 那么接下来就是不断的

对人本身的基因的操纵 也会不断的被 Approve 变得更 基因治疗 其实就这样 但是现在还是以治病为主啊 如果他的某一个器官里面 缺少了某一种蛋白 我们可以把这个基因一段打进去 或者是他的某一段出现突变 我们可以在这一块局部的进行编辑 然后让他变得更健康一点 正常一点 但是就像你说的

治病是一码事 但是应用在其他场景是另外一回事 对 比如贺建奎 或者是其他 你这个基因对应的人的特性 也就再也没有任何的 圆融的 不可分割 也不可分离 也不可去操纵的 这个神圣性的保护了 你觉得它就是遗传 本来是遗传 本来它就是人嘛 它是人的一部分 现在不行 现在就是比如说

可操纵元件 假设我们找到了一个靶点 可以让一个人跳 1米5 高 让他变得非常非常厉害 像超人一样 那么它就是一个 It's Right There 你完全可以去 可以打奥运会 他可以在里面得金牌啊 那么那个 那个不可修改的和那个不可质疑的 我们公认的那个人是什么呢 就是它 这玩意是一个一退再退的过程啊

这是一个深渊 我就很难去想象 宗教在过去 200 年面对着多少挑战 现在要来个更大的 技术一直会挑战这个 行 我们 我们说完了这么多 我感觉今天聊了这么多 伟光正的东西 人类的 光明面占比 在这个节目里边 达到了蜉蝣天地的顶峰 后面不会再有 我们其他几期节目都是人类 多么难受 我觉得 AI 还挺 Doom 的

AI 第一个就是大量失业 大量失业是必然的 我们你现在能想象的 所有的 在电脑面前进行日常操作的人 基本上 包括你自己 包括我自己 现在我们自己还在写 可以取代我们自己的 Agent 自己是一种递归 这没有办法 咱们聊点黑暗面 调剂一下行吗 好可以 要不然我有点受不了 太美好了感觉

你这啥病 咱们说说 医药市场吧 虽然这不是你接触的 你每天要面对的事 但是药 我会很关注这个事 人会花钱买药 或者是让保险公司给自己报销 这个药 要么就是政府提供的社保 要么就是商业的医保 所以这个药的价格 其实是人的 福祉的非常重要的一部分 其实到今天

人治病 得到治疗 这个事本身就不是一个天经地义的事 就是人们买不起药 在药的面前 选择一个退而求其次的妥协 这是一个所有的患者 日常要面对的一个事情 我花了很久都接受不了这个事 因为你从小到大受的所有教育 所有文化中 都跟你说生命是无价的 甚至很多地方宗教不允许自杀 很多地方自杀也是违法的 但是 但是治病不一样 但治病却是

你花不起钱 你就会死 那这不是另外一种自杀吗 不是另外一种不合法的事吗 生命是一个纯有价格的东西 这没办法 这我花了很久去调剂 我现在没有完全调剂明白这个事 因为还有一个市场逻辑在里面 因为我们刚刚说药的话 做药的话 它还是要有一个 商业动机 就是因为你们刚才 咱们刚才讲的这些光辉灿烂的伟大 跟商业毫无关系 不是不是 我的意思是

CRISPR 到实际的应用 到什么 CAR-T 这些所有的 事情能够变成现实 和去实际的 Practice 它都需要钱 对 首先发明这个技术 应用这个技术 它也都需要钱 这个钱是需要不停的 由整个市场来供养的 对 如果是纯科研的钱 是由国家的国立卫生研究院

或者是 NCI NIH 这些去供养的 但是如果你说我要制作出一款药 那肯定是不一样的 所以它就是通过卖药来回收这个钱 是的 最终它都反映在药的价格里 是的 咱就说说这个美国 奥巴马的医保改革 一直到今天依然是 川普 前两天政府停摆 政府的一个特别核心的议题 他要 去 Revoke 所有的这些的东西

为什么药它就是死活便宜不下来 它怎么就 我们能理解 专利它需要 Recoup 它的成本 但是这就能解释 这个药的价格居高不下 专利东西多了去了 为什么药这么贵啊 尤其在美国 其实是这样子 美国第一 是所谓的创新药的龙头嘛 对吧

但是为什么这么多好的药在美国研发 但是卖给美国人却这么贵 然后美国人民水深火热对吧 然后他们不仅是这个贵 保险也贵 然后甚至前段时间出现了一个刺杀 一个最大保险公司的 CEO 的事件 就是它整个医药 并不是一个医药本身 创新本身的一个单一的问题

它是一个和保险 和那个患者 他们全部搅在一起的 一个非常复杂的东西 我觉得如果你要想理清这个事情的话 你可能要去稍微回溯一下 美国医药的定价的历史 你看怎么从一个简单的事情 一步一步一步 演化成今天这种特别复杂的 特别多层次的

盘根错节的利益纠纷的状态 就我们说在 最开始 20 世纪早期的时候 买药就很直接 你去药店直接买 然后给你一个价格 然后到二战的时候 政府冻结了工资 雇主为了吸引和留住员工 他就开始做 给员工买保险 买商业保险 这个时候 商业保险就开始慢慢起来了 等到二战之后 经济复苏

制药行业就开始蓬勃的 因为大家要追求生命质量了 我就要用到更好的药 让我的生命更好 这个时候 药品的种类和需求就变得很多了 然后这种批发商 各种 各种各样的中间商就出现了 与此同时 商业保险也在不断扩大 这种雇主为雇员提供的商业保险 基本上是中产的主流保险 再到后来进入六七十年代的时候

美国的医保体系 就开始有个叫 Medicare 和 Medicaid 一个是针对老年人 一个是针对低收入的人群 但是大量的中产工作人士 用的都是商业保险 对吧 既然有这样商业保险 到了七八十年代的时候 药品的成本种类增加 然后保险这边 覆盖面也开始扩大 这个时候保险要怎么去给药物定价 怎么去协商

怎么定价 他们有一个需求 这个需求就产生出了一个中间商 叫做药品福利管理机构 或者药品福利管理 Manager 我这打断一下 我没理解 为什么保险要管给药品定价的事 这不是药企定吗 你药企你要敢 比如说 现有这么一个药 你就拍脑袋定了一个特别高的价格 保险公司就没有动力去买这个药 因为任何一个病

都对应了很多很多种的选择 它绝对是一个 绝对是一个 Ongoing 的 一直的一个持续的博弈过程 一个药 因为保险只能买自己保单里含的药 而且保单要打 他要给病人自付款多少 要怎么跟他去 算这个报销比例 它都是一个特别复杂的 它跟这个药本身的创新度

跟本身这个药物能治疗这个疾病的 你知道能 Cover 多少 或者治愈率多少 它都有关 所以它必须要一个人 去协调这个中间的东西 那么就是产生了一个叫做 这个叫 PBM Pharmacy Benefit Manager 药品福利管理者 就是我们刚刚说的 药品福利管理机构 PBM PBM 最初的职责就是为 医药公司和保险之间去协商

这是个公立机构吗 不是公立机构 它就是产生出来的 有 一些团体 有一些类似于 公司就开始做这个事了 对 它开始对接这两边 对接了这两边 它一开始就是帮助算报销 算钱 计算药价 算这个保险到底覆盖要赔多少钱 然后 PBM 还有一个叫邮购网络 就是帮助把这个药 Deliver 到每个人的家里 它就是一个保险公司的一个外包

他们需要这样一个外包 帮他们处理这个特别复杂的东西 然后保险就直接付钱就可以了 合理 听起来像一个 Oracle 像一个很古老的 Oracle 对 有点这个意思 但是在后面 创新药 90 年代以后 美国的这个创新药 生物医药 就开始慢慢起来了 药品的支出不断上升 这个时候 PBM 的角色扩展了

它开始管理一个叫做处方集 或者是药品目录的东西 这个药品目录是干嘛的 就是你这个药可以进我这里面 第一档 第二档 第三档 每一档对应的报销比例不一样 每一档 可能我到时候给保险推荐的时候 我就推荐是哪一档 我不推荐你 比如说我只推荐第一档 不推荐第三档的药 所以

它拥有了一个对于药物的推荐权利 根据药物 它治疗的病人 然后根据保险它能覆盖的东西 它可以对药物进行分类 中国现在也有 所以所有的制药公司都巴不得 自己的每一个药都是最低的 自付的比例 这样的话 它的药

患者会更倾向于用这个药 大夫也愿意开这个药 对 但是同时也不完全 因为他也要考虑到 保险差的人到底买的是多少 OK 所以它不完全 他们能够管理这个处方集的话 他们就可以和医药公司谈 谈一个什么 谈回扣 出现了两种价格机制 有一个标价

这个药品在市场上挂出来的价格 叫 Listing Price 然后有一个中间的回扣 就是给了这个 PBM PBM 再怎么导给 保险或者什么的 然后有一个进价 减掉这个回扣的 以后的这个进价 PBM 就成为这个 药品定价的一个中间商和一个枢纽 其实有点对应我们国家的医保局 回扣这个词听着有点太肮脏了 它像返点

因为你是大客户 你一个保险公司相当于 比如说我是保险公司 你是辉瑞 我一年买你多少亿美元的 你家的药 对 你给我一定比例的 返点 这不是挺正常的 大概是这个意思 叫 Rebate 英文 所以我不知道它应该叫 佣金 叫返点 或者是 或者是回扣都可以 我再确定几个概念 那个目录不是什么官方目录 那个目录

是每一个保险公司的目录 哦 所以这个 PBM 是这个保险公司自己的 它需要找这个帮手 但现在是不是很多 PBM 就是保险公司自己的 这个非常好 这个观点你已经洞察了 后面一定会发展成这种 对啊 既然没人管我 我干嘛不从头到尾吃 因为议价的关键机制 如果我有的话 那这议价肯定是有利于我的 是的 对 Exactly 所以我们说这个 PBM 它起到这样一个过程

但是一个比较有意思的 就是美国它不能去官方干扰定价 至少在之前是不能去干预这个定价的 因为他们相信 就是政府不能管理 市场直接定 就是哈耶克主义 我们要让它自我发展 然后这个营利的中间层 经过几十年的垂直整合 这不是肿瘤吗 变成了三家 占了百分之八九十的市场份额 所以现在你说的是

美国患者需要有医保 然后他们需要拿医保去买药 但什么药能进这个医保 需要一个非公立的 纯私营的组织来管 而这个组织 恰恰是付钱给它买药的组织 是的 那这个就是 而且这个组织最后现在这三家 还是垄断的 一家是跟连锁药店 底下的一家是 另外两家都是跟保险有关的

他们都成为了这个保险公司的一个分 分的 他中间有一个环节 这个事本身并不一定是坏的 因为太复杂 因为你是两头都纺锤形结构 是的 是的 就是它 需要一个匹配的机制 但是它集中度太高 听起来就非常很不祥的预感了 因为它一共就 如果一共就三家的话 它这个市场 它就是失效了 很容易失灵 是的 是的

一旦形成垄断 你说的没有错 你要理解一下 PBM 一开始形成的初衷 是因为美国的药 新的各种各样的创新药变得太多了 它必然需要有人把它去排序 然后去计算和保险之间的这个关系 因为随着创新药越多 同样一个病有十几种药 你怎么办 你怎么去用 必须有人去做这样一件事 但是现在垄断了以后 比如说

有一个就属于联合保险的 保险巨头底下的一个 PBM 然后有一个就属于 CVS (连锁药店)底下的 然后还有另外一个 三家就占了 80% 多 联合保险 就是被路易吉刺杀的那个 联合保险 是的 是的 没错 没错 本来 PBM 是一个中间 它甚至要跟两边博弈一下的 它现在直接被打通 打通到这边了 应该有正常的政策 应该防止它被打通 对 但是它就是打通了

因为美国政府还有一个 不干预 它就是让这样的机制形成了 让所有药穿过 PBM 但这个事已经变成这样了 已经变成 最开始不是这样 它是一个结果 最开始它是一个很好的 因为 PBM 内有非常多的专家 它有临床专家 有药学专家 有保险专家 他们要攒在一起 其实是提供了某种知识的 地狱之路是由善意铺满的 那没办法 对

然后甚至是 我不是说有一个 PBM 就是一个连锁药店 所以甚至导致一些独立药店 它拿到的价格和连锁药店完全不一样 不一样 对 因为他没有 PBM 他没有议价权 所以独立药店会抱怨 就他拿的这个药价就高 然后患者自付也高 嗯 这样我给你举个例子 这是一个比较 General 的例子 就是说制药公司定的标价 500 刀 然后 中间预期有回扣 200 刀

就是 300 刀 它仍然能保持盈利的 然后 因为这个 200 刀 它就可以进入这个药品优先级 就是被更多的保 就形成了净价 就是 300 刀 300 刀保险公司支付 完了以后 患者买了保险 比如说 Copay 20% 是根据标价算的 就 500 刀算的 这个时候他就要付 100 刀 它不是根据进价算的 然后你保险越差 你自付就越高 你没有保险

你就可能就是 500 当然可能药品公司会给你稍微打点折 但是 它肯定是跟着你的虚高的标价走的 所以最后的这个结果就是 公众就对高药价就不满了 因为药价就这样被推高了 制药公司 我想要维持我的利润在标价之上 我在这个净价之上 这回扣我还要保证我的利润 然后保险公司我能拿到这个回扣

我就可以给它一个相对比较优先的 所以最后就转嫁到了患者的头上 患者平时日常买的保险就越来越贵 拒保率越来越高 自付越来越高 但是很有意思 公众其实他的视野或者是这个不满 更多是集中在药企 因为他看到的标价是药企给的 对 他觉得是药企的问题 不是说药企维持利润 它肯定是要维持利润的 你的意思就是怨气集中在药企

因为感觉在明面上 他是一个显式的东西 是药企的贪得无厌 对 他这个叙事 但你说药企有没有获得利润的动机 贪得无厌 我觉得当然有 当然了 对 Of course 它不贪得无厌 它怎么会做药 对 但是 PBM 就是 好像说你去问美国人的话 你问 10 个美国人 可能只有一两个人知道这个 PBM 的 这个事 甚至了解 中间的定价机制就更少了

我为了知道这个事 我还去查了很多东西 有人贪得无厌 有人欺负我 对 这个故事 如果一句话以内讲不完的话 人们就不会传播这个故事了 对 就是这个叙事 就复杂了 就太复杂了 你看我刚刚说了这么多 我觉得都有点绕 对 然后它本来从一个渠道 变成了一个 垄断的这样一个 PBM 以后 其实近年美国也在推出一些法案

就是想要 PBM 的回扣透明化 就我希望你搞 但是现在还在推动中 另外一个就是 我们说到美国药品体系 美国政府是尽量去避免 直接干预药价 对 那么就必然会诞生出 PBM 这样一个庞然的巨兽 隐形的巨兽 是这样一个隐形的巨兽 最后就转嫁到了这个老百姓 付钱上面 对 但是 今天川普其实也是在压缩这个 PBM 了

对 对 明白 即使是川普政府都在压缩 PBM 在压缩 PBM 对 这里面就是创新药导致复杂性 然后在美国的商业环境下 就产生 PBM 然后就放大了这个复杂性 最后就变成了一个非常冗余的 最后变成了一个有点像剥削 或者有点像压迫的感觉 就不平等 社会里长了一个大肿瘤

对 在吸食所有的能量 就是这样 所以你回到药企 你做创新药本身你有高风险 长期投入 高投入 你还要做 比如说罕见病 做疑难杂症叫孤儿药 你的成功的这个创新背后 你需要回报去激励它 不然我没法做这个事 对 它是需要这个激励机制的 但是当然 我们说这个创新

是不是完全在这些企业 这个事可以另说 因为包括美国的这个科研机构 它其实为这个创新 提供了很多的这个引擎 或者是初始的东西 这个事是可以另说的 但我们再从保险端看 它是一个社会化众筹本来 就大家都捐点钱 到时候一个人得了重病 就是有保险去 Cover 他 他就不用花什么钱 但是市场主体中间出现 PBM

政府不能干预 中间出现 PBM PBM 就越来越大 越来越大 越来越大 然后就同时还和这边整合 所以整个药价就慢慢的不行了 其实现在药企和 PBM 的矛盾 是越来越显化了 就你看 PBM 没有往药企整合 它是往保险这一端整合的 所以现在药 药企是在提出一些新的方案 比如叫直销 就是 Direct to Customer 不经过这个

DTC 对 DTC 原来有保险 我们说标价 500 回扣 200 进价 300 最后自付 20% 患者付 100 但是 你 DTC 模式是不是就真的能降下来 你统一零售价 比如说你还是要维持一个 比如说 150 或者高于 100 的样子 而且不能保险支付了 所以你得要自付 150 所以病人还可能不乐意 对 因为如果我买了保险 我肯定就不愿意这样自付的

那我会比较抵抗这种自付的形式 因为让整个市场 变得更透明更有效 并不能直接的 Benefit 任何人 对 就是这个市场的每一个参与方 都想要花更少的成本 是的 是的 和得到更多的那个 对 但是它 Long Term 的话 理论上是整个高药价会被降下来 对 如果采用这种方式的话 对 就是现在 川普不是在搞了一个叫川普 RX 其实人家就是叫川普大药房

它就是跟药企 就是直销 你可以直接从药企买药 然后中间没有什么中间层 对 它就直接 Link 到那 他也在做这样一件事 他在推这个事 然后 PBM 那边也在反击 我查了很多 PBM 的官网 看到他们就是说 肯定要论证 对 它是市场有效性的基石 Exactly 就是他说 他们有很多论文研究说过去五年

药品生产商提高标价 7% 给 PBM 带来的这个东西 但是你每花一块钱在 PBM 上 你能获得的是 10 块钱的回报 但是我不知道他怎么算出来的 他就用这个去做一些大的 Title 就是没有我更完 对 没有我你要花更多 我在让消费者花销相对 就是比没有我的情况下 花更少的钱 对 但是让你刚刚看 如果 DTC 的话 可能患者是要直接自付 150 因为没有保险

那表面上看确实这样 对 所以他说东西也没有错 但这样他就在 Argue 甚至是我看到一个比较大的 PBM 他就在指责 就是说这个药企是在搞垄断价格 就这个标价是药企垄断造成的 就他自己也是个垄断 垄断 互相指责对方是垄断 就是挺滑稽的 是 对 除了 PBM 我们说美国药价的话 我觉得还得要说一个东西 就是如果你把视野放大一点

从全球视野看的话 我觉得 PBM 是一方面在美国国内 但从全球视野看的话 大型的这种跨国药企 MNC 它把 MNC PBM 保险 药店这些利润全部摆在一边 美国的高昂药价还有一个隐藏的因素 川普也总是说可能大家不买账 就是说 美国是在某种意义上补贴全球的低价 因为别的国家 比方日本 欧洲 加拿大

他可以和药企谈判 他是国家 行政权力 来直接做这个大博弈 是的 所以那个 Counter 的 对手方的 议价能力很强 是的 是的 所以你只能被迫要低头 如果你想挣这个印度的钱 你想挣中国的钱 然后你到了美国 那在美国你越放任越自由市场 自由市场 最后 价格就上去了 你只能接受那个价格均衡 而这 完了 这个市场像我刚才说

还失灵了 但这个市场其实是利润最高的 所以大家都想进入美国市场 所以所有的药的研发都想进来 所以利润越高 他越想进来 越想进来就越高 就导致越高 越高以后 患者就越不爽 越不开心 这就是全球差异补贴嘛 补贴效应 在美国有高定价 所以他可以保持住这种研发的激励 但是还有一点 各个国家和药企谈判的价格

是不透明的 是保密的 因为 不同的国家他有不同的谈判策略 不同的 给你分类等级 所以他要保证这个保密性 他才不会触发 如果你知道一个连锁价的最低价的话 就导致一个连锁反应 所有人都按这个最低来了 所以他是互相保密的 但是最近中国搞谈判的时候 请专家 到全世界各地去收集这个药价 他把这个秘密信息全部收集来了

之后跟跨国药企谈的时候 直接把这个东西摆桌上 直接议价能力就上来了 把共同知识变成公共知识 对 直接作为谈判的锚点 导致跨国药企 其实在中国很难 但我没理解 为什么各国之间互相瞒着呢 你 我知道你便宜我就跟你走 不对我这也有利啊 但是药企就没有利了呀 所以是药企想保密 药企想保密 我可以给你打折 但要保密

而且每个国家和他谈判的不一样 手段都不一样 你能进我的 什么甲乙丙丁类 或者一二三类 他都不一样 没有人在乎保不保密 大家只想要便宜 对 想要便宜 最终目的是要 如果我保密 可以多让我便宜两块钱 我肯定保密 是的 然后中国就把这些 所有信息收集来了 以后跟他谈 这个还是挺厉害的 确实挺厉害的

这个事是一个掰扯不清的事 我无数次有这种感觉 有些人一生中的花费 有一些类目 是永远不可能降下来的 就是永远不可能 比如说医疗 比如说教育 特别典型的 一方面 你可以从供给端的角度去考虑 他是一个 如果它是一个劳动或者是人才密集型的 的一个供给的话

那么对方的收入水平 跟你的收入水平是一起来增长的 所以没有办法通过你的富裕 而降低这个东西 在你的消费中的占比 因为他那边也在往上 这是第一 第二就是 医疗是一个尤其没弹性的东西 它没弹性体现在我不是机器 你说我缺一个螺丝 我把这螺丝给拧上就完事了 没有疾病是一个缺螺丝的问题

我们想要 我想要好到这么多 是因为我好不起这么多 你让我的福祉 你让我的健康和我的 生命预期的长度 能长一分 我愿意花无限多的钱 是 所以那些大佬都在做 所以医疗占人的花费的比例 永远是严格等于 人能花得起的最大值 只不过这里面有一些分配的问题

但是这个事 天然地 他不可能降下来的 对 而且还要有新药的研发 因为还有茫茫多的疾病没有被 对啊 一直要有新药的研发 有各种各样的疑难杂症 但是另外一方面呢 你看到像中国这样的医药市场里面 又是完全不一样 甚至可以说是极端相反的逻辑 它变成一个不是市场 自由竞争导致的一个结果 他是一个完全行政化的结果

行政最大化 就是集体采购 带量 然后让大的药企 接最大的单 然后就提供 三分钱一片的阿司匹林 然后导致很多人 在质疑药本身的有效性 和产品质量等等的问题 另外 如果你为了让药便宜 一点利润都不留给药企的话

药企怎么可能做好创新呢 但是很讽刺的是 中国的创新药另一方面还不错 非常好 创新药非常好 但如果你是去看 药企的平均利润率来看的话 他又很不好 以至于很多药企做创新药 很好 他会做到一半或者做个七八成 然后把这个药 License out 去卖给别人 所以这个 License out 表面上看 像是大国崛起的

一个出口 但另外一方面 它是一个 我在国内市场 是因为它不让我收高价 他不让我挣这个钱 我只能从别的地方去找出路 有两个原因 第一个是高价问题 第二个是那些小的药企 他做不起那个实验 他也做不起临床实验 他可能做到一期前 他只要看到一个苗头 他就把它卖掉 他可以折现成资产 再去提高他的 但是你说的没有错

中国是完全另外一套体系 这另外一套体系 产生了完全不一样的生态 他这个生态和美国的生态 完全可能是反着的 或者是某种镜像 或者这种 这种感觉 所以说到国内 我就想问你 就是这些概念 他们连在一起 是个什么样的递进关系 因为咱们现在所有人都在 今年创新药的

企业股票都涨得非常好 大家也都知道 中国的创新药 现在是一流强国 没任何问题 但是 但是这个事在几年以前 我们还都没有这种感觉 甚至还不相信这个事 中国只能做山寨 只能做仿制药 但是今天从仿制药 然后到所谓的那个 Me-worse 然后 Me-too Me-better Me-better

然后再到 First-in-class 再到 Best-in-class 这是个啥概念 能给我们解释一下吗 不就是做药吗 为什么会有这么多的阶梯呢 我大概解释一下 Me-too Me-better 这一系列的概念 但是我说的可能不是那么严格 OK 就是首先 一开始仿制药都不称为 Me-too 药 它就是把人家的化学分子式 或者把人家结构拿过来做一点点改进 然后我直接用 因为大体上它的 理化性质是一样的

它产生的效果也是一样的 对啊 它可能甚至差一点 因为你的整个工艺流程不是很好 Me-too 的话 我就是对它 进行一定程度上的改进 然后我可以比较类似 然后能通过一些 比如说一致性 各方面 当然 现在仿制药也要求通过一致性检验了 但是 Me-better 是 我可能还是针对同样的靶点

或者是跟你这个结构有点类似 但是我做出来的效果要比你好 它已经不再是仿制药了 Me-better 就已经是创新药了 Me-too 还在仿制药范畴里吗 Me-too 算是一个中间点 OK Me-better 的话 算是创新药了 因为你做出一个 比现有的还要好的东西 微创新调好一点点 你可以说它是微创新 但是现在大量的在这个微创新上 是很多的

然后这个 我觉得这个积累的效应 还是非常非常可怕的 产生的这个 这个推的这个效应 然后到这个 First-in-class 的话 在这个领域 在这个疾病这个领域里面 它就是最好的 最好的一个药 如果你能够 Me-better 做到一定程度的话 你可能就会成为一个 First-in-class 的东西 Best-in-class 说错了 Best-in-class First-in-class 是这个领域 用这样的一种

比如说这个疾病之前没有药 或者这个疾病之前用的药 我现在做了一个 新药是完全不一样的靶点 完全不一样的新的治疗的机制 完全不一样的治疗机制 这个时候这个药 一般是叫 First-in-class 然后往往对应很多孤儿药 就是针对一些疑难杂症 特别特别难治的病 然后如果你做出一个东西 一般是 First-in-class 的 OK 然后我们公司其实比较强调

自己要做 First-in-class 的药 那这个天梯 我们已经爬到哪了 中国的创新药已经爬到什么 这个 Me-better Me-better 现在是比较 不稀奇了 是这意思吗 对于现在已有的药 它都可以做一些头对头的这个对比 然后至少是不比它差 就 Me-better Slightly Better 对吧

然后可能有一些 未来会做到 First-in-class 或者 Best-in-class 可能会有一些 这个还要点时间去研究 我可以说在创新药这块 中国目前还不能 说是世界最强的国家 但在增速上面 中国绝对是最好的 最快的 它的增速绝对是最快的 它的管线绝对是最多的 它现在进入临床实验也是绝对最多的 咱们前面说了 在这个节目的前一半

咱们说了一点点 关于这个 咱们有更多的患者 对 然后我们有 这个人口基数大 本身所带来的规模优势 对 那除了那个部分以外 还有什么很明显的的优势吗 特别是我在想象 就是我们没完没了的做仿制药 照着人家做 做出一个跟别人的机理和化学式 什么什么都一样 但是效果还差一点的 这个

这个听起来好像没有什么价值的 工作的过程中肯定是积累了一些东西 对 这个是什么呢 我觉得第一个 首先有大量的技术人才回来 他会带来很多知识和很多新的东西 新的技术 这是毫无疑问的 然后第二个是 我们其实之前存在 大量的这种叫做 CRO

或者 CXO 去帮助别的药企 做某一部分的科研 外包出来的工作 然后这些公司的话 比如说药明康德是最早最大的 CRO 最后他把它做成世界最大 世界最强 他就把每一个部分的 这个小的模块化的东西搭成了 那其实他如果想要去 自己自研一款的话 他的每个模块都在那 他可以做起来 然后第三个 我觉得

其实政策上也是有一些引导的 包括我们说集采 你说集采他是压低药价 他是惠民 或者是当然也有些质量问题什么的 但是你要是往深了看 集采背后我觉得是有另外一个 意思就是说倒逼创新 因为利润是一种激励 我们就想引导这个 这个激励 不要激这个 在重复劳动上 对

这个集采首先主要针对的是仿制药 他要把仿制药的利润打到最低 第一个是 我要把成百上千家的仿制药 那些茫茫多的公司 整合成 10 家 5 家 这种规模的公司整合了以后 我还把你这个仿制的利润压低 那你想要再获得更大的利润 你只能往创新这块走 从另外一个层面的话 他除了集采 还在做一个叫国谈 国谈的话他就会把

首先 创新药不进集采 他们要求 第二个是创新药会进入一个未来 叫商保目录 商业保险目录 中国人在做自己的商保 因为中国商保这块 还稍微落后了一点 主要靠医保社保 但是现在商保也开始在做 就是你发现 创新药跟商保 就一定是联系在一起的 因为医保是覆盖最基本的最大众的 但是你得有创新药

你得有价格歧视 是的 精装书让有钱人买 创新药是一个特别难的病 或者是比较少的人 或者是一些特别特别难攻克的 所以他必须要完成这个创新 必须要在支付端有一个解决方案 就是商保 然后呢 有人就在说中国要建立起自己的 PBM 但这个 PBM 是由这个 由这个政策引导的 PBM 他进入商保也会有目录

1 2 3 甲乙丙 OK 然后你进到不同的目录里面 然后你拿多少钱 然后他这个钱怎么分配 怎么报销 这一系列 你整合到一起的话 我觉得就是 我梳理一下这个时间线 大概 2008 年到 10 年的时候 是第一波生物创新药的企业 在国内开始成立了 然后 12 年到 15 年就是药监改革 加速审批流程 这显然 是在帮助加速创新药的研发

到 15 年到 18 年的时候呢 创新药 开始陆续进入临床后期了 你看也快到十年了 七八头十年了 很多就进入中后期了 进入中后期以后 集采开始启动 我开始压缩仿制药 仿制药的利润被大规模的压缩 同时还搞各种各样的国谈 还有一些外来的这些药物 然后它的利润空间变低 他们就离开 这个时候

国产的仿制药也在密集的往上走 往上上市了 然后到 2004 年 我们就说进口的原研药 大量的退出中国市场 2024 年 2024 年 说错了 原研药退出中国市场 他这个空间 更多的 为中国的创新药预留出来了 就是他让他们 你知道 在竞争上也会更 相对更少一点 我觉得 主要是生物医疗的这个行业 尤其是创新药的行业 它的周期太长了

十年为基础 它每一步都是一点一点 所以它有一个 我觉得是有一个 一开始你看不到任何动作 你看不到任何动向 你会觉得完全不行 但是其实大量的人在做 然后一旦到一个节点 一个时间段的时候就会出来了 就一下子爆发式的出来了 然后在这个时候 政策再用集采 再用谈判去完成这个接力

完成对于创新药的激励机制 但是你说这背后的隐患 我们大家知道 集采的话 就是有些治疗空白 有些领域的话 他原来有的一些药物可能就没有了 他现在我觉得 咱们国家在很多事都是这样的 就是说 他会把主要矛盾解决的巨好 超水平的好 你想用一些基础的药活命

这个价格能给你 打到全世界最低 但是你想用医保的话 你就得服从我们这个规矩 这就是社会公平和高质量的 这种 Trade-off 更多人用得起普通的 更廉价的药 还是说某些患者用上更好的药 更加有效的药 我觉得这两者之间 永远都是一个有点矛盾的关系 他没有办法去兼顾的

不可能的这个关系 就是你说它是不是一种阶段性的牺牲 我觉得肯定是的 因为集采的话 他还在等待着中国的创新 要去填补那些没有被满足的 高质量的医疗 所以患者就得挺着 那还有一个医保池子的问题 还有包括老龄化的问题 其实都在这里面会被凸显出来了 我觉得大家对于降价 对于质量的讨论很多

但我觉得从创新的角度去考虑 这个集采和国谈 其实是个比较值得关注的点 对 明白 实际上 这个机制还是严重鼓励创新的 他其实是鼓励创新 对 你看上去好像是压低创新 甚至是他把你赶出海 我觉得你可以把他想成大家长 你去跟外国人聊两句 18 岁踢出家里 差不多就是他要

他要强迫你去那个去 然后同时一部分政策上又给你 而且他会有几百家 几千家 然后你一家做出来了 他会给你极高的政策倾斜 就像电动车一样 对 通过这些方式 这些相似的规律 发生在每一个行业 你先去做那个最没有附加值的 是 去模仿 然后去做重复的劳动

对 然后把别人不屑于做的 没有利润的 但是低摩擦就可以灵活的外包 高流动的这样的 别人不愿意干的事就先接过来 但你的模块就建立起来了 你的产业的模块就建立起来了 就哪怕是在今天看 我们觉得很高附加值的 研发的领域里 他也有这个模块 是非常模块化的 其实是非常非常模块化的 他不是一个整体 单一不可分割的魔法 对

就像我们公司做创新药的 我们其实很多科研 很多需求 很多科研都是需要去找外包公司的 然后曾经我们也是药明康德 是我们最重要的一个科研的 外包的重要的服务商 但是 因为现在一些 Geopolitical 地缘政治的原因 他现在就不能找了 但我觉得 这个就是资本最底层的规律 对 他就是创造低摩擦力高流动性

把能够甩掉的东西 全部甩掉 全部包出去 就是 我们这个猫没事 有点罕见病 得要给他一个创新药了 顽固病 对 顽固罕见病 就是你 你要做的事是这么多 然后你能够甩掉这么多 是因为你不能甩掉更多 你要能甩掉更多 你巴不得全甩 更多 如果 Nike 这公司 他能一个人来运转 就光 CEO 他自己 他连一个人他都不想雇

这个时候 AI 是不是 Agent 可以做到这种 宝洁和 Nike 只剩牌子了基本上 对啊 就是这样的 就你不知道 这个公司和这个东西 背后到底是什么了 它到底意味着什么 因为这个就是一个回报率最高的 最理性的理性决策 咱现在不知道公司是啥 马上就不知道人是啥 所以就现在就变成了这根 他们在优化自己的 资本回报率的过程中 就是在往深渊里甩下的绳子

咱们就顺着一点一点 我们都接住了 我们全接住了 然后我们接住的过程中 政府还在引导你去接 然后让你去接更多 这个事的吊诡之处在于 你拿着放大镜看他微观的 你要一时一世的去看的话 你会觉得特别的没有创新 或者是很没劲 对

而且就感觉到非常的内卷内耗 和这个没有意义 就是让人觉得很幻灭 但是从总体来看 居然他还是有一个效率在 因为你想一下 就算是你说养蛊吗 我100 个 1000 个总归能养出一两个 对 9999 个他都被内卷死了 是 但是他有一两家成了

对 那么最后他可以 获得最大的这个回报 当然他也成为一个非常好的标杆 示范效应了 对 所以这种仿制药开始的重复研究 毫无疑问是一个创新的阶梯 看上去好像一点创新没有 对 是底层的必经之路 如果不经历这个的话 你无法建立起整个这个创新药的 就是这种研究体系 研发体系 嗯

研发体系建立起来以后 对吧 然后再去往上 明白 先通过 Me-too Me-better 然后一步一步往上 对 然后我觉得这个里面就是 还有一个 就是两种制度 背后的文化 有形的大手和无形的大手 对吧 哈耶克的无形大手 有形大手就是强设计强执行 对 然后能够集中资源 集中方向

但是自发的那种破坏式的创新 还是比较少一点 对 更多是 Me-too Me-better 的这个 真正能够形成 让他孕育出一个 一开始看不出任何价值的东西 我觉得还是需要一个更加松一点 松弛一点的环境 然后执行力太高的话 也会带来副作用吗 比如有些药物就直接就没了 这个治疗领域一下子就空掉了 是

然后没有负反馈机制 明白 但你反过来看这个无形的大手 看美国那边 我觉得特别有意思 就是我们总说啊 什么伟大不能被计划 这不是 OpenAI 的那个人写的书吗 我们就说让他 自发地生长出这种伟大 他确实生长出了很多伟大的公司 伟大的制度或者是文明 对 当然他也会生产出很多僵化

对 但是他在演化的过程中 他也有的时候 就不可避免的掉入那个僵化的 那种越来越冗余 越来越肥胖的那种陷阱里面 对 然后完了以后 在这个里面就产生出这种 我觉得就是有种腐败的这种感觉 就是腐败 酸臭的那种东西 然后他又去蚕食 最开始的那个伟大的那个动机 和那个生命力

是 然后最后自发的伟大 就走向了一个自发的平庸 是 但是咱们 咱们就是要个体 去承受这个微观的平庸 和微观的这种内卷 和这种精疲力尽的感觉 对 我在想 一转眼你去美国也十年 还是 11 年了 有多少年了 十一二年了 对 就曾经你也是这个平庸过程中

一点一点爬出来的这么一个人 就我的想象 就是你所在的 这个领域叫生物信息学 对 就是你也从一个 完全稚嫩的新兵蛋子 开始 就是很笨拙的方式去摸爬滚打 对 然后最终走到今天 这个就是超一流的这么一个 在湾区的 这么一个企业的 Scientist 的岗位 就这个是一个什么样的过程

就现在回望 你的过去的这十多年的经历 因为你之前跟我们讲过 就是说你当时上一个论坛 然后有一堆这个生物信息的小白 互相帮助的 这过程就听起来 简直就草台的不能再草台 一开始都是草台 而且无法想象 你做的这个 这个所谓的研究 是一个多 是一个具有任何的 实际的创新价值的事情

你只是在学着 模仿 学这些 Practice 是的是的 重轻刚刚提的这个问题我觉得特别好 我当年怎么从科研小白 从一点一点 就是通过这些论坛啊 这些共享社区 一点一点 慢慢做科研 慢慢进入这个 我觉得这个里面我也有些观察 就挺有意思的 正好就是分享一下吧

就是说当年可能十几年前 在硕士的时候 我就在做一些生物信息的东西 就刚刚接触生物信息那会儿 首先肯定是前单细胞时代 就还没有那些单细胞 那些新的 那些 Fancy 的技术 听着像那个 5 亿 500 亿年 前草履虫时代 太搞笑了 这个还是要说一下 他确实是一个不一样的 前单细胞时代 因为单细胞前和单细胞后 他的整个科研的范式也发生了

一个改变 动物从单细胞到多细胞 也进行了很大变化 前单细胞时代 对 你们这学科的时间跨度真大 你接着说吧 也就那么个 5-10 年 OK 然后十几年前 然后那会就怎么学 怎么做计算嘛 怎么做生物信息 怎么做这些东西 机器学习 行业处于一个比较早期的 然后信息也不是特别多 然后一个生物信息的工具就不普及 很多都是从

就是国外的那些英文的东西 对吧 然后虽然他有教程 但是他对你那个语言有要求啊 学校不教吗 学校不教他那些新的 你必须要用一些新的算法 他不可能教 他肯定教一些非常非常基础的东西 但你想要用一个比较 刚刚发表出来的一个东西 不可能学校教你的 对吧 这时候就有一些人 在一些论坛上去搬运 就是搬运那个最新的论文 他对应的那个 GitHub 的那个

比如说那个 Tutorial 那些东西 把它翻译成中文 翻译的同时 他还把那个软件 down 下来 把数据 down 下来 然后去做调试 Debug 然后把中间的一些坑啊什么的 都告诉你 软件是别人的 论文是别人的 就是别人做了 别人用一种方法做了一个选题 对 然后就是可类比的 有无数多的 你们谁愿意做谁做 就这意思

对 但是他的 数据也是公开的 数据也是公开的 全是别人的 是的 OK 但这个没有问题 就是说大家 这当然没有问题 我就是想听你描述这个过程 是的 Exactly 就是他本身这种搬运 就是说学术共同体 就是说 都是在基于别人的之上去做这个事 只是说 那时候我们国内的信息很少 所以他们需要去做 这个大量的搬运翻译

以及帮你去把 这个就是试错 摸索一下这个东西 然后摸索完了以后 它就变成一个教程 变成一个教程以后 你就可以去 Follow 你自己去试 自己试了以后 然后你还可以自己 你比方说你看到一个东西 你也去做一个教程 然后你去贡献到这个论坛上 就大家形成一个这种互助论坛 就有点像 Stack Overflow 嘛 嗯 是那个编程的时候对吧 大家都在 Stack Overflow 上说 你用这个东西碰到什么问题对吧

怎么 Debug 这些东西 唉 我 但我这里面很好奇的事 就是我上学的时候 我接触神经网络 那时候也是非常早 就是神经网络本身很早 但是没有人用 对 就是我说用神经网络 对 我 我爸上学时候就有 到我这 就是因为我当时特别清楚 我看那个吴恩达的手写数字视频 我觉得这个太牛了 这东西肯定是未来 然后我开始研究 开始学 但你大部分同学是不会 他没有这个动机去学这个东西的

那时候 Machine Learning 还是相对比较少一点 我 Machine Learning 基本上是在那个研究生后期 对 我想说的其实不是这个事 我想说的是 你们这个专业的学生 是比其他专业的学生 更有自学的能力和动力吗 必须要啊 因为所有的这些计算的工具 都是最新发表的 你必须要去自学他 必须要自己搭建他 搭建这个分析 但是他这个事怎么能如此割裂 这太有意思了

就是你刚才理所当然的说 这当然是不可能教的 But Like That's All There Is 就是你这个学科 或最主要的 你要做的事情是一个学校不教的东西 然后你需要自己去理解 你可以这么类比的理解一下 啥意思 就是你学 比如说你做 AI 嗯 你先去学一些 AI 的课程 他只会教你那些最基础的 对 但是最新的 AI 的算法 每天都在出新的文章

这个其实就是因为 当年的那个变化太快了 已经超过了教育体系能接受的 教育体系只负责最基础 对 我印象特别深 我当时大学肄业的一个原因是 我发现我要想正经学这个玩意 我上研究生才能学 而我上研究生那个都已经快 哪年 快 20 年了都 我说那黄花菜都凉了 有点像是学习这个里面的那个 那个通识 或者是基础理论 和那个技校教给你的那些东西的

之间的关系好像是 对 而且如果有一个东西 他变得越来越多人用了以后 他也可能会加入到这个通识的部分 对 但是那个过程就滞后了 就因为以前这个过程 可能是十几年慢慢来 现在这个技术太快了 导致它每个月都在变 对 对吧 我就记得当时学 那个新的什么 TensorFlow 然后 PyTorch 什么的 就感觉我咋学不完呢 啊对 就是每天都新的嘛 主要是离实践贼老远

对啊 是这个问题 但我的好奇点其实你还没回答我 就是你们这个专业的学生 有如此强的自驱力 都去上网学这些东西吗 我觉得只要你去做生物信息 或者做计算生物学 这应该是一个最基本的要求 所以就是以 就是因为现实跟制度 就这个教育的体系脱节太远 以至于所有人来这 他默认都得自学 他要没有这个心 他也不会来这 对 其实最重要的教育

发生在你们的互帮互助里面 对 其实你更多是从论坛 从这个跟大家的交流中学习 就是学校可能提供的是最基础的那套 就是你知道那些最基础的 最常用的流程 但是实际上 那套流程可能在你未来的科研工作中 已经完全不需要了 嗯 但实际上 有用的是来自于论坛上的那些东西 对 然后就是大家也没啥

特别多的功利目的就是互相学习嘛 互相分享知识 分享这个怎么应用啊 怎么去做这个事 那会儿就是 我也经常就是熬夜啊 Debug 啊 然后做这些分析什么的 我不知道汉洋 你学这个 你肯定知道什么 PCA Clustering 这些 嗯 常见的这些 这些 Unsupervised Machine Learning Machine Learning 对吧 然后 总有一些特别奇怪的 Bug 来阻拦你用 对 那你就是要负责

把这些 Bug 搞清楚 然后发到网上 告诉大家 你在这看到这个报错 要怎么去重新设置你的 Environment 怎么解决这个 Bug 对 这样子的话我也去 但是慢慢的 就是 你自己计算的技能会越来越娴熟 你越来越娴熟了以后 你就不太需要依靠这些论坛了 你就可以自己 你看一篇文章 你就知道他怎么做的 甚至你可以自己去写他的算法 在那会儿就这个东西 是慢慢慢慢 你在这个科研过程中

就形成了一个直觉性的东西 然后又开始出国啊 深造啊 继续科研 然后就开始 远离这些贴吧和论坛和这种 你还记得吗 你还记得你第一次用这种自学的方式 手搓出一个被人 就是被期刊接受的论文 或者是一个 Meaningful 的一个 Result 吗

啊 我觉得在博士生期间的 这个东西就开始了 对 开始有人要了 对 对 对 前面就是纯粹的练习 大量的练习 对 你整个硕士阶段都在大量练习 硕士的后期是开始接触这个东西 然后到博士的早期也是在大量的练习 大量的学习 对 然后到一个阶段以后 你就开始 更 Focus 到你要做的那个事情上 练习

就是用别人早都已经用完了的数据集 跑一些结果出来 看他长得像不像一个 还有一个就是 你想一下 你这个方法 能不能用在我的这个 Data 上 哦 对 你要做一个迁移 这个迁移过程也不是那么顺利 举一反三 对 对 对 你要迁移啊 OK 就是这么个过程 慢慢的呢 就是你会直接从最新的论文里面 从他的 GitHub 配置 他的那些 Tutorial

你自己去试错 自己去 Debug 然后你也对 Bug 这些 了解越来越深了 你这些每个算法都了解越来越多 甚至是你看到这个文章 你可以自己写一个算法 你不需要去用这些 你们这些算法用 GPU 吗 还是纯 CPU 以前肯定没有 现在是 全是 就你学的时候 我学的时候没有 GPU 哦 所以你还不用涉及 处理 cuda 那堆配置 In Parallel 就是 Parallel Computing 就是你要做那个

就是并行 做并行化处理 对 这个是有需要的 但是同时这个论坛或者这个交流 这些东西也在越做越大 就他们的人数也在越来越多 本来是一个特别特别小的圈子 嗯 他们就越来越多 越来越多 然后我觉得很多人 后来到什么顶级的科研院所的那些 他们可能早期都看过 这些论坛的某些东西

跟着他学过一些东西的 就是你不可否认的是 你确实从这里面获得了非常多的帮助 和最开始成长的那个 Initial 的 那个动力 这个东西我觉得是完全不可否认的 但是随着这种慢慢的这种分野的话 就是说你做科研的 做这种的 和你搞论坛的 他就慢慢开始分开了对吧 搞论坛的 有一群人

他们是搞论坛的 不能说搞论坛 就是在论坛上分享这个知识 后来做公众号 做这些东西的 太有意思 慢慢出现了一种分叉 就不止一个论坛 好多论坛 然后有一帮人 对 是一个最 Low 的最草根的学术共同体 非常草根 非常草根 靠这个东西 这些学术共同体是 积累在 Discuz! 和 Php 上的

积累在 Discuz! 和 Php 上的 都是什么小硕士 或者是有一些本科生 他就对这个感兴趣 才做这个事 就大家在一起摸爬滚打 对 然后我的英文还不太好 主要是 我在学术共同体的第一个身份 是版主 然后没有人 对 然后没有人 几乎没有任何一个成员在 在这做的事是为了发现科学的新知 大家只是为了

变成一个熟练工 对 变成一个熟练工 帮助方便自己 然后重复这个分析的流程 然后去做规范的科研的动作的 的这个 Practice 不能算规范 至少是要了解每一个新的东西 规范化可能还没有达到 还都达不到 对 然后是 然后 Hopefully 这个事 能够帮助自己的申请 或者是投论文这些 对 或者是能帮助你自己做项目 你自己做项目 有这个需求 对

然后我这里想问一下你们两位 你们知道中国的医生 尤其是在国内的大城市的 大三甲的这些医生 他们是怎么 尤其是年轻医生 他们是怎么晋升的 就他们的晋升渠道是什么 对 这我肯定知道 实际上临床的工作 只是很小一部分吧 他们科研就是要发论文 是个特别特别关键的事 是硬坎 对

他晋升往往就是看论文 这个就很离谱 因为他很显而易见嘛 这个矛盾 因为年轻的临床医生是干的活最多的 对 他每天要上班 要看诊 一天能够看到 50 到 100 个 在中国 在国外的话 可能一天就那么十来个 在中国是 50 到 100 个 有的时候还要去帮助一些大医生 做手术 晚上还要值夜班 还要写病历

对 他没有时间 没有任何时间 与此同时 像我们真正在做科研的人 我们在实验室里面 我们在高校里面做科研的人 我们是一周 7 天都泡在实验室的 我们早上九十点钟到实验室 然后就开始看论文 看文献 开会 做实验 一 整套大概要做到晚上十一二点钟 就这个时间上 医生是完全没有的 他就是超人的

他的这个要求本身 如果他们能达到的话 非人的 Exactly 就 他就是从什么 时空裂隙中抓取的时间 去获得的这个东西 不 他要有这能力 他 就为了写论文 那也太无私了 没办法 咱们就是一个人均圣贤的国家 你接着说吧 所以 这个问题就来了 临床的医生怎么发论文 对不对 对 他就有这个需求了 他要晋升

他必须要发论文 他怎么发论文 那么相信 我觉得两位肯定听过 就是 Paper Mill 论文工厂 早先 论文工厂是一个中国 一个比较巨大的灰色产业链 因为造假 然后各种各样子的 这种学术不端就很多 那时候 我可以说它是论文工厂的一个

早期的一个非常粗糙的生态模式 有比较熟练的人 他直接给你各种造假 然后把文章写出来 发表了以后发到什么样的期刊上 然后最后 这个医生就可以拿着这个东西 然后去评职称了 但是呢 与此同时 快速发展的是生物信息 还有我们说的这种各种组学 各种单细胞

公共的数据库越来越多 生物信息的这些论坛 这些人越来越活跃 所以他从原来在生物学实验上 造假的这种模式 慢慢就转移到了 我用公共的数据去驱动 做数据挖掘 然后去发现一个故事 然后把这个故事变 成一个文章 的一个模式 这个时候你就很难说他学术不端了 因为他所有东西都是真的了 对吧 但医生还是没时间

所以 由那些早期非常多的科研论坛 里面最活跃的人 还有一些公众号 他们开始接越来越多的项目 去跟医生 跟各个大的医学院去合作 帮他们去挖数据 做分析 写流程 产生报告 甚至是有的可以写文章 对 就这一整套的流水线

慢慢的就建立起来了 那数据也不是那个医生自己临床的 而是公共的 对 可以用公共数据 但是后面再发展的 这个数据就可以是临床医生的了 更精细化了 对对对 他就越来越升级了 定制了 对 就升级了 然后还有就是他们可以去搞培训 搞培训很赚钱的 比如说临床医生 他愿意来学一点点这个东西 他们可以去搞大规模的培训 整套流水线就形成了 形成了以后 论坛版主的职业发展路径就是

你别猜 对 对 这个大数据驱动的 科研服务 我也当过版主 我咋 我咋沦落到这了呢 我们刚刚说的 两种科研路径的分野嘛 我们一边出国 或者是在各种研究所里面做科研 对 我们要好奇心驱动 说的好听一点 好奇心驱动 我们要研究一个生命的奥秘 我们要设计一个 我们要产生一个科研的 Idea

然后我们要设计整个这个 项目 我们自己做 然后调整方向 写论文发表 但同时呢 他们就有点像是个科研服务员 他们不需要去考虑 这个事儿背后到底是在做一个什么 具体的或者是他的一个 你知道 科研的这个好奇心的 这个东西在哪 他并不太需要观察 他是面向考核的 你这论文我做到啥样

能够擦着那个反作弊和查重的边 我能过 对 我这个论文就是 你总得有个规矩吧 对 你既然有规矩 我就面向这个规矩 是的 我不是 而且找到最适合的杂志去投 都是可以匹配上的 对 我不是 面向星辰大海 我也不是 面向我什么好奇心 或者有什么个人的追求 对 我就面向你这个评估 面向需求 对 面向需求

他们从租服务器 学习最新的科研的算法 别人发的科研的算法 把它搭建成一个重复化的流程 然后再接项目 跑流程 出报告 真的是加上有的是可以代写论文的 但这个 东西还是需要去讨论一下嘛 对吧 被产业和被这个商业 被你说的这种东西驱动的

产生的一条流水化的服务线 这个 产业化的这个服务的流水线就出来了 甚至我认识一些 PhD Student 在海外的那些 他们会觉得 他们不是在做 真的科研 包括我在内 我也慢慢远离他们了嘛 对啊 在这个过程中 但后来有一次 几周前 我在小红书上听一个直播 我就看到我当年很熟的一个人 一个哥们 他就现在主要做这个事

他在开直播 他就是在做单细胞 单细胞怎么分析的 开这个直播 完了 他直播里面我就听了大概两三个小时 我觉得挺有意思 他大半夜的还在做 浑身起鸡皮疙瘩 你小红书直播 科学殿堂里的一个东西 现在是一个人的一个生计嘛 他的一个 对 他有路子 你最狂野的投资人也想象不出来 他投的一个平台

当年是做 PDF 的 现在有人在里面直播单细胞 对 就是这样 小红书上的这个科研的东西 可是非常高质量的 我们觉得他经常有些洞见性 你在论文都看不到的 对 我 你知道 我现在用小红书最常获取的知识是 我们不做 3D 建模吗 我发现 小红书的 3D 建模的这个领域的进展 速度比推特快 是的是的 Exactly 包括我们单细胞和这个都是小红书上

大家都是在分享这个东西 对 我当时就特别感慨 我听他的直播 特别感慨他的这种专业性 他的这种知识的广度 还有每一个环节要怎么做 他的这个 整个对于这个流程的熟悉度 是不亚于甚至远超于我认识的那些 PhD Student 甚至是那些学者的 相当于是 我不知道我理解对不对

他展现出了一种 一种学者应该有的 应该具备的 在理想情况下应该具备的 一种广泛的通才 或者 对 他就有点像通才 至少是在这个领域的 这个生物信息领域的一种通才性 像你当年那个音像店老板 知道所有歌手 哎对 有点这个感觉 他做过什么 他做过什么 斑马鱼 做过人 做过小鼠

做过各种各样的动物 还做过那个植物的各种测序的数据 单细胞的数据 所以他对每一种植物的每一种 每一种生物的这种每一种的基因 还有他的一些东西他都了解 他都可以 跟他们这帮人唠嗑 太有意思了 张嘴就是在前单细胞时代 然后有一个人做过人 还做过鱼 这听上去是不是有点不可思议 但是我们可能是习惯性的就这么说 对 你做多少个 从来没有人 把斑马鱼和人并列到一起

他就做过这个单细胞的测序的 无非是一个让我做的东西 你接着说 对对对 让我做的一个数据分析 Exactly 他对生物学的知识的掌握度 也非常非常的渊博 然后他这后面聊一聊 还聊一聊对于这个领域的发展未来 就是说我们要把这个单细胞的数据 越来越多 AI 然后要做这个 Virtual Cell 就 Exactly 就是我们现在在硅谷

在那些大学 Stanford 还包括一些药厂 他们都在做的事 Exactly 他都非常非常的了解 了然于胸 就很有洞见性嘛 还有 还有一些独创的这种洞见性的东西 然后他还提了他另外一个朋友 我觉得这事特别有意思 我就特别想在这说一下 他另外 一个朋友也是做这个科研服务的 然后呢他十多年前 互联网 信息是没有那么普及的时候 就没有什么 AI 他那会儿

他那个朋友就是把人类的 2 万个 编码蛋白的这个基因名 全部背下来了 非常抽象的一段英文字母 以及它对应的功能 他把这玩意全背下来了 就跟我们当时背什么四六级 托福雅思一样 他背这玩意 但这绝对比那个难 难多了 对 非常难 而且这玩意就是没有任何那个 而且不 他不只是背顺口溜 他不是背名字

而是背他后面的功能 对 他相当于把新华字典给背下来了 Exactly 他背这个名 名字和对应的功能 比我们都是牛逼太多了我觉得 就是奇人 真的太牛逼了 对 我觉得奇人就是 但你想一下他为什么要干这个事儿 其实那会儿不就 10 多年前嘛 因为那些信息的那些工具 还没有那么多 那些网上的那些信息还没有那么多 的时候他把这个背下来

他一眼拿到一个测序的结果 他看到那些基因 他脑海里面就已经做出了一个人脑的 对于这个基因的功能的分析了 他一个人脑功能富集分析 他看到这个癌细胞这 50 种基因 或者是 20 种基因 他就知道 这个癌细胞在什么糖酵解增强 增殖增强什么什么抑制 这东西他大脑就知道了 像是一个过于复杂

所以人不会觉得有意思的 RPG 他那个加点加的上万了 但他加的点很有意思 他就是 前 GPT 时代就是人形的 自走的生物学的 GPT 对吧 就是这种感觉 我说到这我就想表达的一个感受 就是说我特别纠结 我觉得这些人 他的专业素养 他的能力 他的各方面都非常非常的强 但是为什么不去做

所谓的好奇心驱动 或者是做这个研究生物的奥秘 为什么不去推动科学前进本身呢 对 或者就是直接自己去做科研吗 或者说为什么这个世界的分工 没有让他们去 自得其所的 对 就是 适其所适的 你既然你 你都成为了 这么有学养的一个学术工作者了 对 然后你帮别人评职称 你帮别人在这个服务的这里面

去帮别人发文章 是是 他是一种精疲力尽的贬低 对这个学科和对自己的贬低 但是他在这个贬低的过程中 他又如此的勤奋和自强 达到了一个 令实际的学者都感到颇为惊叹的 程度 这个事的这个荒谬程度 简直就是 对啊 但是我现在就是 我不想要说贬低 至少我当时是很纠结

我去理解这样一个东西 我很纠结 但是你反过来想 你做科研 读硕读博 拿的工资非常的微薄 是 其实就是茫茫多的这些硕士博士 他们家庭条件各方面都不是很好 其实他们需要去赚钱 对 而你做这样一个事情 进入这个领域 比如你最后能发表一篇 SCI 的论文 他可能就是 5 万到 10 万块钱

他对于 一个非常精通的 从上下游几个人的话 他就可能几周的时间就可以做出来 做出来这样一篇论文 这个论文还像模像样对吧 就你从这个角度也 Make Sense 嘛 他有这个需求 他也有这个需求 然后那边也有这个需求 他就对接上了 对 他们就会去做这个事儿 就更早的加入了产业化的链条 而且如果你仔细去品味的话 他就是这个

在整体上构成了这个人才梯队的 这个培养或者叫自我培养 是互助式的培养 是的是的 是的 让新兵蛋子变成一个熟手 然后最终能够走 走上那个 Proper 的 我们脑海中想象的那个 科研工作的岗位 对 所以在这个过程中 他的在集体上 在这个 中观或宏观层面 是完全 Make Sense

对 在微观的角度来看 有点半招摇撞骗 然后半有点卑鄙的这个感觉 没有那么卑鄙 但是我懂你的意思 没有 没有那么光鲜亮丽 就太世俗了 对 太世俗了 没有那么光鲜亮丽 没有大家想象的那种科研的样子 该有的样子 帮助别人去 Ghostwriting 一个论文 或者怎么样 对 听起来就挺那个的

但这是一个非常庞大的产业 对 这是一个非常 因为这个产业在我的价值观中 它很有正当性 那是对 因为学术那个 那个体系 我觉得问题实在太多 这是 只是一个对学术体系的反叛而已 不算反叛 他是加入了 他是利用一种商业化的 方式去加入到这个体系中 然后在这个体系中 我意思是 这个学术体系 实际上是希望把这些人排除出去的 如果他是个病菌的话 如果他是免疫细胞的话

他是希望这个体系没有这样的人 全部都是自己努力 自己具有好奇心 自己生产出来 他是个名不正言不顺的东西 但他毫无疑问 就是一个有机的组成部分 对 事实上一开始就是因为大量的 中国医院投的那些文章 里面出现各种造假和各种数据的问题 就出现杂志直接就看到了就拒 出现过这种大批量的问题 也是早期比较粗糙的阶段

但你说后来他确实在做数据分析 他确实是分析出了一些东西 他确实是做了一个 最后一个机制性的总结 但这就是你有没有规矩吧 你总得 你是不是总得有一个评估的方法 对 你只要有这个评估的方法 我们就面向你评估的方法 是的 你这个托福和雅思是不是一个考试 你告诉我 他如果是考试 他就有题 有题我新东方就能给他整

就整稀碎了 是的 我可以 Adapt 过去 这里面最关键 那这些生产这样的模式 生产出来的文章 他确实对人类的知识是个增量吗 是有用的吗 我觉得这个问题说 首先你去看一下人类知识的增量 你怎么去定义这个事儿 论文 科研论文太多了 你说哪一个有 但在 AI 这个时代来临的时候 AI 需要大量的

资料 那这些资料是它的 给它再添砖加瓦吗 比如说他在挖掘 挖掘这个已有的数据 但是他挖掘出了一个他认为新的东西 我觉得他当然是一个有增量的东西 但你说这种 同时他 他和增量很相悖 他是一个产业化的东西 他让你感觉好像 他不是在提供一个学术上的这种

他更像是一个健身房或者一个练习 让人从生到熟的这么一过程 然后那个真正的明摆着的 创新的价值 会在更晚的时候发生 但是在这个过程中 人们只是想熬过去 人们只是想要 在自己值 24 小时的日夜班之后 还要按照一个不可能的高标准 发一篇论文来 来评一个职称 来付自己的房租 就而已 就只是一个 弥补了这个需求

这个初心毫不高贵 Exactly 初心毫不高贵 就是一个弥补的这样一个空缺 但是这些平庸的过程 让平庸的人有机会 一步一步的 接近 最终像你这样的人 能够登上这个科学的大船 走到那个前沿的领域 甚至是现在 科研外包服务 我觉得已经是一个名正言顺的 名正言顺的东西 他是一个非常名正言顺的

如果我想一个课题 我需要做这一块东西 我就外包出去 对 甚至是生信的数据分析 而且是一个微观资本主义 就是咋的 没有问题 你辉瑞能外包 我不能外包吗 就是咋的 只是说最后论文署名的那个人 对于整个文章和项目的参与度 从一开始完全没有

到后来他也可以跟人家开会啊 你说开会他有没有 Input 当然有 Input 到最后 比如说医生 他可以去拉到临床样本 他把这个样本送到一个单细胞的 服务的一个 中心去测序 完了一个生物信息的分析 再加上一个什么其他的 下游的一个验证的分析 对 他是一套完整的东西 你说他没有 这个就是他科研不端

我觉得已经很难去界定了 对 我有一种冲动 把人的主体性拿开 把它看成是 用一堆世俗的目的 和一堆完全功利的行为 让资源 时间和什么配置起来和流动起来 对 Exactly 让数据找到这个算法 对 然后让 GPU 开动起来 然后谁能够得到一点蝇头小利

或者是能够帮自己涨点工资 或者怎么样 你来付这个钱 然后署这个名 然后我们就 但是从总体来看 这个资源正在找到彼此 然后 变成一个最有效的机器在往前跑 对 甚至是他会跑得越来越高 他发的论文会越来越好 对 然后我当时就在想 如果你把这个视野拉开 就像我们一开始讨论的

其实这就不是一个单纯的 我们说生物信息的 科研服务的一个领域 如果你去看制药公司 最早我说药明康德 帮你说的这个大药企 做一部分模块化 对 或者是最后形成一个全流程 对 然后还有华大基因 华大基因最开始就 测了一小部分的 这个人类基因组学计划嘛 对吧 后来是广泛的 他是和高校开展合作比较多 对 但是他也是做这种科研的

合作和外包 科研合作 科研外包 这个词已经变得不能区分了 对不对 是 他现在做的规模和体量 我觉得可以直接吊打这个 美国的好几个头部的 单细胞测序 和基因测序的公司了 对 然后你再把视野拉开来看 除了这个制药 生命科学 你去看电动车 你去看这个 电池 新能源

它一开始不都是起始于一个非常的 不高大上的需求吗 对 这个不够高大上的需求 从非常非常的低端 去做一些这个小小的东西 然后越做越多 越做越多 越做越大 越做越大 整个体系就被搭建 跟生物进化一模一样 被搭建起来了 我们如何从 他有这个流动 对 单细胞草履虫变到今天 其实就是学术共同体 是怎么有机的结合起来的 就是这样的

但是怎么流动和配置 就是一个群体智能 群体智能以一种很笨拙的 在微观看经不起检验 看着有点脏 或者有点庸俗的感觉 对 但是他 Nonetheless 他在往前走 就是这样 是的 他也构成了中国的创新药的能力 和中国的 对 中国的科研水平的提升 不能把他们剥离出来 他们是非常非常重要的一环 对 对 包括你也没法想象

如果没有那些论坛 那些 GitHub 和别人写的攻略 对 你在抄作业的时候 和那个我查什么这个游戏 这个宝箱在哪 就没有什么 没有啥本质区别 对对对 你只想知道出 Bug 的时候 你该怎么 Exactly 是的 而且现在我觉得特别 我也是听他那个直播的时候 特别意识到一点 我们说到单细胞 空间组学这些比较前沿的技术啊 我突然意识到能做的

能广泛的大规模做的只有美国和中国 当你把这个视野比如说放到日本 当他有一些顶级的实验室 有这个一整套的东西 但是随便找一个实验室 他没法做这个事 因为没有这一套科研的服务体系 去供他做这个事 所以你去看最相关的论文 全是中国和美国 当然也包括一些 比如说欧洲的一些特别的实验室 在做 但是在别的国家

他没有外包体系的话 他没有办法很容易的去做这件事 我都没有意识到 对 这个东西的那个根 他的根基 并不存在在任何一个有形的 实际的 Institute 就是一个体制或者一个机构里面 对 它是一个 它只存在于你们这帮人 就是草根的你 和你这样的人的 人与人之间 你的这个自发的协作之间

存在少数评论区里 也有很多公司 对 已经形成这些科研服务公司了 然后我刚刚想到 就是说同时在中国 你想一个二三线城市 或者是一个更 稍微落后一点的城市 比如说一个医院里面想做一个 单细胞研究它是很容易的 但是这个事在日本 或者在别的地方是做不了的 是 对 他这个 他有这一套支持啊

是 咱们这个深度 对 由普通的平庸的个体 然后编织成的网 网络 就是 吃下了这个 他把所有的需求都渗透了 变成了一个可外包的东西 嗯 然后极大的提高了所有需求的可及性 这就是中国过去 10 到 20 年的一个 缩影 对 我记得那个 石黑一雄

他拿诺贝尔文学奖的时候 当时最让人感到怪异的 那个新闻标题是说 他参加过那个写作培训班 就他报过课 就学怎么写小说 OK 就这个是当时对很多人来说 是一个非常怪异的一个事 就说 哦 所以那个诺贝尔文学奖 现在就是可以报班去学嘛 就当然大家知道 就是你报班你也学不了 但是就是一个作家 他的那种纯粹性

是否有点某种程度上被玷污了 就好像说 合着你是一个很想变好的作家 而不是一个完全在展现你灵魂的 这么一个赤裸 坦诚的这么一过程 然后就好像 你让我想到这个事 就说这个科研工作者 今天很难再讲出那样的故事了 如果有一天你做出了很了不起的

就是在你的空间组学或者怎么样的 就是你的领域里 做出了很了不起的成就 你拿了什么奖之后 别人去采访你的时候 你也讲不出那样的故事 说你有一天做梦 梦到一个蛇在咬自己的尾巴 第二天早上起来发现什么 想到苯环了 你讲不出任何这样的故事 你的故事就跟我刚才说的 就是一个作家 我找了很多外包公司 帮我完成了每一个的模块 对 对 对

这种 这种勇攀高峰的这种浪漫的叙事 已经没有办法提炼出来了 感觉好像 其实在 AI 时代不是更是如此吗 对吧 所有的内容创作 所有的这个知识 但都这样了 人类还是在攀登高峰啊 对啊 是啊 这更有意思的事 就是你把它工具化 但是不影响你自己 对 就人还是想攀登高峰 是啊 不影响你自己 在想一个重要的问题

然后我们说这个重不重要 也是另外一说了 对啊 所以最后我还是想问你这个事 你肯定也有过这样的感受 虽然有可能 可能几个月都没有一次 或者甚至几年都不一定能有一次 但你不可能一次都没有过 就是你会 你会为自己感觉非常好 你会觉得你在做非常棒的一个事情 你有一个很好的发现 虽然不可能干净利落的 像我刚才说

那些伟大的科学家 在故事书里一样 但总是多少会有一些 你感受到你的那个使命感 就是你 Fulfill 了一些了不起的东西 你有一些成就感 你还能回想起来吗 我 我觉得这个就是 如果说最近的话 我把它从使命感变成一 种压力吧 因为使命感和压力也是同样的 这个并存的 就是说我最近在参与一个

就是临床试验的一个 1 期到 2 期的一个过程 然后他们产生了大量的样本 然后做了我们这一套的数据 然后我要用我的数据给他们提供一个 他们从临床一期到二期 要做还是不要做的一个决策点 嗯 对 需要用我们去支撑他做决策 我觉得这个给我蛮大的压力 那我觉得也很重要 就是我自己 因为这是一笔很大的钱

会不会浪费 很大的钱 而且是非常重要 它就是一个药 嗯 对吧 它就是一个药 对 这个药到底能不能成 或者是应不应该往下做啊 我觉得这是一个 然后另外一个 我觉得就是从 可能更多像你说的这种纯粹的感觉 可能更多集中在 相对于比如说在做那个博士 或者是在做那个科研

科研院所做科研的期间 他的这种感受会更强一点 你盯着这个东西一直在做 然后你去看最新的论文 这个领域内最新的论文 然后你说 哇 我想的这个想法可别被人家想到了呀 对 就这种 这种时间紧迫 紧迫感非常非常 你在跟看不见的那个对手 对 你每天在看 拼命的赛跑 我的这个想法里面 一部分已经被他做了 我的一个想法里面 已经另外一部分 被另外一个人做了

那个东西就在你眼前 对 Right There 但你就是 Almost There 的 这种感觉 对 是 当年是有的 然后如果现在 在企业 或者是在这个公司里面 更多我觉得是把团队做好 然后慢慢的把这个项目做好 把团队做好 然后 其实有些项目是非常非常重要的 是 你们肯定知道

但是其实我们在公司的话 更多又偏向于一个 把自己的具体的事情 做好的一个过程了 对 对 因为你负责的是一个环节 你不再是一个在 PhD 的时候 你要想一整个课题 是 然后把一整个东西给做完的 一个感受 对 你也不指望自己拥有 类似于像那个杜德纳教授这样的 那个时刻 说我直接在细菌上看到一个东西 哦 这个太有意思了

然后说到杜德纳 我觉得特别有意思 她在 09 年还是 08 年的时候 加入过我们公司 然后做一个 Director 然后干了三个月走了 为什么 因为她觉得学术自由度被受到了影响 她还是最后回了学术界 事实上 我们公司算是在所有的公司里面 学术自由度会保持最高的一个公司 对 但即便如此 他毕竟是一个商业的一个东西啊 所以你要做什么事 花什么钱 还是要符合一个

你还是要去 对 需要去跟那些 VP 跟他们的这个商业的这个 去进行一定程度上的这个 Alignment 协调 明白 然后她在我们那干了三个月的样子 对 然后走掉了 即使这个自由度也还是不够 对她来说 对 她来说自由度不够的 明白啊 对我来说够了 我还可以做播客啊 就是 对不对 但是就是闲暇和兴趣爱好是一回事 就是你

自己倾注了这么大的心血 你的职业生涯再往前走 这个毕竟是你的 你最宝贵的一个 你倾注了你自己的时间和那个什么的 对 还有你自己的这个 Track Record 你一直在积累你自己的 这个就是攒 CV (资历) 嘛 或者这么说 对吧 对 然后我觉得 我刚刚说是 整个这种产业链的这种升级的过程 就是从一个特别不起眼的东西 但是这个过程里面

肯定是也有大量的灰色地带 也有大量的浪费 同质化竞争 内卷还有自我压迫 这东西都是不可避免的 对 在这个过程中 但是每一个个体 就是 只是在竭尽全力的改善自己的处境 就是多挣点钱 多评个职称 多发一篇文章 在这过程中 就是他也无可避免的为这个共同体 为科学本身 在往前走

对 尤其是中国的科研也在往前推 现在非常的快 然后我不知道可不可以说一个 跟这个我当时想到的一个关联 但是 跟这个事情完全不一样的一个事情 就是我当年打游戏的一个事情 你说 就是那个 重轻你说那个 就是原神的那个直播那个节目 我是听那个的时候 想到我当年打游戏的一个场景 就是代打和代练的那个事 有点 对

有点这个类似 就我当年打那个魔兽世界 然后当时有一个 70 80 的时候 有一个叫副本 叫太阳井 我不知道你知不知道 就是一个非常非常难的 血精灵嘛 对 非常非常难的一个副本 当时这个副本特别难 我们服务器上 是没有人打过的 你看你还是不够忙 你这魔兽世界也没耽误你打反正 当年当年 那会应该是你 这他说的不是怀旧服 哈哈 不是 大学本科 大学本科

嗯 对 你还是学渣呢 你还没有成为更好的人呢 学渣 学渣 更好的自己 行行行 然后里面的怪很难打 就是小怪 他也可能会掉橙装对吧 这个事呢 就产生了一个生态 是 这个生态就是每天晚上副本刷新 就有人在这个公众平台上去喊 是 10 到 20 人 组一个叫太阳井金团的一个事 这个金团是怎么回事呢

就是一群人连语音进到这个副本 严格的站位 严格的这个纪律性的 这个就每个人负责输出 那个什么就是非常严格 然后你只能站这边 就打门口的 4 个小怪 然后看哪个几率能掉一个橙装 掉个橙装现场拍卖 对 拍卖的钱分到我们 就是这十几二十个人 打的人的手里 他非常的重复劳作 一打就是几个小时 毫无乐趣可言

在魔兽世界里面开论坛呢 对 毫无乐趣可言 但是确实能赚到不少金币 这就是关键 那会我就跑去跟我一个在澳大利亚 那个留学的同学 就跟他介绍这个模式 他听了以后就特别吸引 他说这还能这么玩呢 对 他就说我来试试 他跑到澳大利亚的服务器里面 在那做广播 说我们去组一个 这个事 对 他想把复制到外服上

所有的人都在群嘲他 Nuts Crazy Crazy Guy 没有任 何理由 一个副本 必然是给一个公会 去不断不断地打这个副本的 最后把这个副本给开荒了 因为那个奖励是 玩游戏是为了快乐嘛 对 游戏的快乐是来 是来自于你征服它的过程 而不是买 买到一个东西 放在你的包里面 对 那个东西

它是乐趣的一个化身 对 但不是乐趣本身 但是没办法 咱们勤劳勇敢的老中 会把一切东西 都卷碎到这个颗粒度上 而且尤其是他只打 4 个小怪 他一个 Boss 都不碰 反复刷那 4 个小怪 这是干嘛 整个这过程已经跟玩没有任何关系 没有任何关系 就是劳作 在田里劳作 是是是 我觉得这真的是有点我们的特色 我觉得把这个东西

我可以联想到你说的原神的直播 我会联想到整个的 科研服务 对 服务行业 还有整个这个生态的业态 一开始都是来自于这样一个需求 产生的这样一个整个的生态 因为游戏是一个 你尤其在咱们讨论科研工作者的时候 你去类比 会格外感觉到很难受的一个点

因为游戏是一个比科研要更纯粹的东西 咱们刚才是在吐槽 在抱怨这个事不够纯粹 或者不够 初心不够高贵 但游戏是一个纯关于快乐的事 对 一个完全关于快乐的 关于过程的事情 也会被演化 或者被异化为 人们觉得 人们误以为快乐就是那个橙 那个橙色的武器

那个橙色的装备本身 而产生了一种完全毫无乐趣 咱们同归于尽 谁也别快乐 对 咱就把这个金色的这个弓 给拿到手就完事 甚至是这个武器也不是关键 是这个武器分给这 20 个人的金币 对 叫金团 对于买家来说 他只是想不经过我游玩的乐趣 直接获得 他就是获得科研论文的人 那个人 对对对

所以我们是负责获得金币的人 获得这个钱的人 对 所以我 我就是 就是 感觉这个感慨已经发过无数次了 在今天的这种高度协作 和这个高度分工的社会里面 这种纯粹的一体的 一颗种子在土地里生根发芽 长成大树的过程 已经是一个人不能再指望的奢侈了 人需要 也不叫忘掉

这个事嘛 你要自己 Cope With It 你要自己去跟 跟自己 协调出一套能够说服你自己的意义 对 然后为了你世俗的目标 一步一步的往前走 而那个最终能够让你 Satisfy 的意义 可能是很多年以后 你再回望这个过程 他作为一个整体是能给到你的 嗯 但是在眼下 你可能要一直努力的做着很普通的 或者很苟且的事情

对 只是为了让他很 感觉会很虚无 如果你在里面的话 在微观层面会觉得很虚无 然后你只是为了那一点报酬 或者那一点什么 什么那个是 我就想到 那个名人名言 阿基米德就 说给我一个支点 我就能撬动整个地球 看了这句话的英文的 原版的意思是说 给我一个支点和一根足够长的杠杆

对 杠杆 一个撬棒 嗯 我就能撬动整个世界 对 如果你把这些突破性的创新 想象成这个支点的话 那么这成千上万的 几亿人的这种劳动力 就是那根撬棒 对 对吧 他就是可以把这个世界给撬动 我们的故事 书里面讲的是 我们每一个人都是阿基米德 就是那个 就是那个 给我 对 给我一支点 谁去撬 但是我们谁也不是

但是我们所有人 加在一起构成了这根 这根棍 Eureka (我发现了) 这个词是群体发出来的 你自己在里面只是喊 是 哎 感觉今天聊太多了 我 谢谢两位提供这个机会 我觉得非常开心 可以在这里 我们也开心 嗯 对 好吧 非常感谢 Rum 我觉得今天这个节目

希望能够让听众里面的很多 在走 走在跟你相似的旅途上的人 找到一些共鸣 以及让这个所谓上了岸的 登上了这个船的 这个人感受到一种邀请 因为我和汉洋 希望能够 Reach 到更多的 可以 朋友来 来分享自己

回望自己的整个奋斗的过程中的 路上的风景 我觉得这是特别有意思的事情 嗯 最后一个问题 你问 我问 你问 对 那我们就老的最后一个问题 我们在全世界给建筑物做建模 如果让你选 一个建筑 它可能会消失 但你把它永远的保存在互联网上 有一个它的 3D 形象 你会选择什么建筑 我可以选 3 个吗 我已经想好了这个问题 因为我听过很多

你有一种 你正在散发一种做题家的味道 可以 来来来 我们上一期刚经历了 那就是我们的嘉宾半天没选出来 但这次来个仨的 我有备而来嘛 有备而来 哎 第一个不用说 说烂了的 那个万神殿吧 罗马的万神殿 我觉得这个太牛逼了 这太牛逼了 他的这个几何的精确性 他本身就是一个符号

他这个符号就是足够的牛逼 可以代表所有的东西 因此 在全世界各个地方 都可以看到他的变种 我还在想 如果你们建模的话 是可以建内部吗 对对 可以建内部模型 能不能做一个倒模 我不知道 因为它内部的结构 其实比外部的结构更加有意思 因为它有一个球和一个正球形的 它的前面的 你想把那个空的

这个空气 给保存出来看 对 我比较好奇 空间 能做这个事 对 空间 理论上是能的 我觉得这是一个 万神殿 另外一个 我插一句话啊 万神殿上周摔死一个人 你知道吗 哦 我不知道啊 万神殿特别高 很多人没意识到 万神殿的背面是个 类似悬崖一样高的台子 很多人坐到上面休息 但上周有个日本老先生 掉下来摔死了 Oh My God

所以下次如果你去要注意哦 但万神殿旁边可以乱停车的 如果你不下车 你在里面待 因为我 8 月份 在万神殿门口待了一个多小时 我在车里坐着 只要我在车里坐着 就没有警察来管我 我当时想 卧槽 这绝对是我这辈子 乱停车最牛的地方 我停在万神殿的正门口 他不驱你 因为我坐在车里面啊 他就知道我是临时停的啊 因为警察不管你 所以神拿你没招 万神都拿你没招

比如万神殿 还有一个就是说 可能跟我自己的经历 比较相关的一个 属于我相对私人 但你说它私人 他其实也是一个很有名的设计师 设计的一个建筑 在夏威夷的时候我住过一个宿舍 这个宿舍叫 Hale Manoa 它其实是贝聿铭的早期的建筑 贝聿铭非常非常早期 模仿马赛公寓 在那造了一个 他早期也在学习嘛 也在模仿 也在学习别人

也在当版主 差不多是在学别人的东西 在那造了一个 类似于那个东西的仿品 我觉得比较有意思的是 我当时住在里面住了一段时间 那个里面 它隶属于一个叫 East West Center 它会有各种国家的人 它类似于一个小联合国一样 住在这个楼里面的人 经常到晚上 就会搞那种什么 大家一起 Party 一样的 然后你知道每个国家这个 Party

的感觉都不一样 最后大家就是用非常原始的形式 坐在一起 唱歌跳舞 围着圈转 我就想到非洲 你知道吗 这么多人坐到了一起 在这为了交流 选择了非洲共同的这个最基本的 这种围着圈转的模式 然后 Happy 和 Party 对 你跟夏威夷的关系是啥 我在那边做了 PhD 我在夏威夷的癌症中心做了 PhD

我住在那个楼里面 你在夏威夷待了多久 5 年 你在夏威夷 哦 这个 这次时间太久了 下次别的节目找你聊聊夏威夷 夏威夷住 5 年什么感觉 可太多了 对 夏威夷可太有意思了 你能不能快速说一个点 夏威夷 和一般人想象中有什么不一样的 景色上 它不是你想象的沙滩和椰子树 它是有巨多的那种崇山峻岭

山上冬天有雪 它那个山非常非常的高 如果你从海底算的话 他那个山好像是最高的 但是只按海拔的话 他也有好几千米的那种哦 非常多的高山 原始森林 大峡谷 哦 它是一个浓缩了各种 National Park 的 一个地方 一个小地方 对 一个小地方 是特别有意思 在哪个岛上 我们当时是在欧胡岛 人最多的那个

火奴鲁鲁 在的 但是你可以去各个岛 每个岛都不一样 方便去吗 非常方便 飞机非常非常方便 对 早上可以坐个飞机晚上回来 OK 你继续 然后那个楼 因为那个楼又有点像马赛公寓 又有一些我自己的记忆在里面 我觉得挺有意思的 还有最后一个就是我 我想说 荣格有一个叫波林根塔楼 他当年自己跑去瑞士的一个湖边

去隐居他自己搭了一个塔楼 我不确定还有没有人帮助哈 他自己搭了一个塔楼 这个塔楼比较有意思的是 荣格在把塔楼的每一部分 对应到他自己内心的一个心理结构上 他说这个东西 这个房子 对应的是他内心的某一个结构 后来 比如后面有什么亲人去世 他就又造了一些新的东西 他去做这个对应关系 但这个塔楼好像不对外开放

不能参观 但我自己挺好奇的 我对这个特别特别感兴趣 这仨挺有意思 对 OK 行 那咱们这期到这 行 好 谢谢谢谢 这辛苦你了 谢谢 我们这是 辛苦两位了 不知道观众能不能看出来 我们是从早录到晚 我们录的时候太阳在正上面呢 现在已经到落山很久了

Loading...

Loading video analysis...