科学思维要点-汪诘

转自公众号，《读库》2001期

科学素养是由科学知识和科学思维共同组成的。我是一位职业科普人，近几年来，一直在为各个年龄段的科学教育贡献自己的力量。从2018年开始，我承担了一项重要工作，就是为中小学《科学》教材制作配套的视频微课。为把这个工作做好，我认真研读了教育部颁布的课程标准，以及几乎所有不同版本的小学《科学》教材。在这些教材中，科学知识的系统化.模块化程度非常高，知识点的大类、小类以及难度划分都非常细致准确，有明确的教学目标、考核标准，但让我感到遗憾的是，科学思维的教学，相对而言就显得不成体系，没有章法，甚至很难整理出一个个的知识点，更不要说结构化和模块化了。

科学教育的最终目标是提升人的科学素养，而科学素养是由科学知识和科学思维共同组成的，两者同样重要。我便开始尝试着把科学思维也整理成一个个明确的知识点，并且把它们分出层次结构，确定考核方法。经过两年多的积累，不断地总结、修订，现在有了一个阶段性的成果，就是将科学思维总结成十五个知识点，有这十五个知识点做基础，就可以把它们也像科学知识那样再继续解剖，细分结构，构建难易梯度。现在，我正在与读库合作，启动一项庞大的工程:编写一套针对小学生年龄段的“我爱科学”丛书，目标是在这套丛书中，把科学知识和科学思维放在同等重要的地位，系统地讲解科学知识和科学思维。首刊于此的十五条科学思维要点，是一个总纲，是我认为一个现代人学习科学时应当掌握的思维方式，它与科学知识同等重要。在未来的创作中，我会把这十五条科学思维的讲解继续延拓，用各种生动有趣的形式来阐释人类的这些伟大智力成就。

01 能区分事实和观点

事实陈述:描述在客观世界中可被证实或证伪的东西。观点陈述:描述观察事实时个人所处的位置或采取的态度。或许你会觉得事实陈述和观点陈述很容易区分。“这只苹果是红色的”，答案显而易见，这是事实陈述:“我喜欢红色的苹果”，答案也显而易见，这是观点陈述。那么，“人人都喜欢红色的苹果” ，是事实陈述还是观点陈述呢?答案是事实陈述，因为它可以被客观证实或者证伪。也就是说，我们只要找到有一个不喜欢红色苹果的人，那么上述的话就被证伪了。

能够区分事实和观点，对于我们在日常生活中讨论问题非常有用，可以避免陷入各说各话，不在同一个频道的尴尬境地。例如，甲说:没有科学家有兴趣证明上帝是否存在。(事实陈述)假如乙反驳说:我觉得你说的不对，科学家应该努力去寻找上帝。这种反驳就是没有正确区分观点陈述和事实陈述的差异。乙的反驳不是一一个有效的反驳，因为这实质上并不是一种反驳，而是在做观点陈述，而乙的观点陈述与甲的事实陈述并没有真正的矛盾。

针对性的反驳意见可以有两种: 第一种:我觉得你说的不对，因为我知道某某科学家就在证明宇宙中是否存在上帝。这叫举出反例来证伪一个事实。第二种:即便你说的是一个事实，但我认为这是不对的，我希望这个事实发生改变。你认为呢? 这叫先确认事实，再探讨观点。

学会区分观点陈述和事实陈述，双方就能在同一个频道中谈话，讨论也可以愉快地进行下去。否则，谈话很可能陷人无意义的争执中。

02 了解科学和技术的区别

科学的目的:发现自然规律。技术的目的:创造出有实用价值的工具。科学的成果是纯理论性的，用论文就可以表达出来。比如牛顿运动三定律、万有引力定律，相对论、进化论、元索周期表等等，这些都称为科学发现。它们反映了人类对宇宙、自然、生命的本质规律的认识。技术的成果则需要有实际的体现，它能改变人们的生活，能创造出更好的工具。比如中国古代的四大发明，爱迪生发明制造白炽灯，特斯拉改进交流输电系统，这些都是技术。它们体现了人类改变世界的能力。

搞科学的人叫科学家，搞技术的人叫工程师。当然，有人既是科学家也是工程师。举一个具体的例子。城市建设经常会实施大楼的爆破拆除。在这个过程中，炸药放在什么地方，放多少，是最为关键的。如果放的位置和量不合适，那么大楼就有可能在倒塌的过程中破坏周围的建筑物。并且这无法试验，必须一次性成功。科学家需要研究出炸药爆炸和大楼倒塌的规律，有了科学理论的指导，才能精确计算出把炸药放在哪里、放多少。把炸药准确地安放到预定位置，精确控制投放的量，在坚硬的水泥墙和地面上打出洞，将炸药严丝合缝地放置进去，这就是工程师需要完成的技术活。因此，拆掉一幢大楼，需要科学家与工程师联手合作，科学家设计方案的过程就是科学，而工程师落实行动、进行爆破作业的过程就是技术。

一般来说，一项科学发现的意义要远大于一个具体的技术发明，比发明了什么更酷的事情是发现了什么。不过，这也不是绝对的，有些技术发明也可以极大地推动科学发现。

03 知道什么是信源

信源:信息的最初来源。在日常口语中，信源一般指的是“消息的来源”。比如，这个消息是我听朋友讲的，这个消息是从报纸，书籍、电视，朋友圈中看到的，等等。但在科普人眼中，只有找到了信息的最初源头，才能说是找到了信源。信息的最初源头，是指这个信息第一次被创造出来的地方。举个例子来说明。辟谣内容:“尼比鲁星球将于2017年9月23日撞击地球”系谣言。在各大媒体上都能看到这条消息，请问:这条消息的信源是什么?大多数人可能会回答说:央视啊，央视都辟谣了，那还能有错。

如果不较真的话，答案不算错，因为对于回答者自己来说，这条消息确实来自央视。但是，如果较真的话，你就必须要明白，只有找到了这条消息第一次发表的地方，那才叫找到了信源。抽丝剥茧，我们发现，2017年9月20日央视新闻中引用的美国专家的辟谣视频，最初的发表时间是2011年10月21日，消息第次发表在YouTube上。这才是准确的信源。

信息第一次发表的地方可称为一手信源，也就是我们口语中说的第一手资料。其他所有转述这个消息的地方，可称为二手信源，也就是第二手资料。只有一手信源才是最真实准确的，所有的二手信源都有可能提供不真实或者不准确的信息，例如转述错误，信息丢失、过度解读甚至断章取义等。当然，有可能错误不代表一定错误，事实上，二手信源的可靠性差异也很大。大多数时候，我们如果只想粗略判断某篇文章的可信度，可以不用查证具体内容，只看它的信源是以一手信源为主还是以二手信源为主，大致就能知道文章作者的用心程度了。知道信源的概念是我们辩别信息真伪的第一步，万分重要。

04 能大致判定信源可靠度

信源等级:可以帮助我们快速判断信息可靠程度的一种依据。当你获得互相矛盾的信息时，有一个大致判断哪个信息更可靠的方法。一般来说，信息的可靠度与其信源的可靠度是正比关系。通常情况下，越是可靠的信源，它发布的信息越值得我们信任。信源的可靠度可以用“信源金字塔”来快速判断，信源等级越高，表示它的可靠程度相对也越高。

一级信源:国际组织的书面材料。比如在健康医疗领域，一级信源是世界卫生组织(WHO) ;关于全球气候问题，一级信源是政府间气候变化专门委员会(IPCC);此外还有名称中含“联合国”或“世界”的各种机构(非山寨)。
二级信源:科学界公认的那些高质量的科学期刊，尤其是Cell、 Nature、 Science,这三本期刊被并称为CNS。英国的自然出版集团还从全世界范围内选择了一批高质量的期刊，大约七八十本，称为自然指数期刊，可以在Nature的官网查询到。
三级信源:国家级机构(非山寨)发表的书面材料和各类教科书。例如中国科学院、国家天文台、美国药监局(FDA)、美国航空航天局(NASA)、美国儿科协会等。
四级信源: SCI收录的期刊，这个也常常被称为核心期刊。它有两个版本，一个是SCI,收录了大约三千五百多种期刊，一个是SCIE (E表示扩展的意思) .收录了大约八千多种期刊。
五级信源:具有良好口碑的专业机构垂直类媒体。
六级信源:综合性的大媒体(非平台性质的)。
七级信源:某专家学者的个人著作、访谈等。

还可以继续往下分八、九、十等级别，信源等级量差的就是道听途说，找不到任何出处的信息。以及“常言道”“古人云”“俗话说”之类的信息。特别指出:所有中医古代典籍在健康医疗领域都属于等级最低的信源，与道听途说处在一个等级。

重要补充:这只是一个帮助我们快速鉴别信息可靠度的大致方法，不能拘泥，也不能钻牛角尖。在做决策的时候。你需要交叉比对、互相印证。世界上的所有分类，分级其实都是人为划定的界线，而真实世界往往是复杂的，是不需要迁就这些界线的，总是会存在跨界的情况。

05 统计眼光:看待社会现象时要考虑这个现象背后的频次、概率等各种数据

用统计的眼光看现象，有两层含义:

一、不要被自己的感觉所欺骗。人们很容易被自己的感觉所欺骗，这是因为人人都有选择性遗忘的机制。尤其是当你先入为主地产生了某一个倾向性意见时，那么凡是你遇到符合自己预期的事情，就容易记住，不符合的就容易忘记。比如，有人先入为主地认为程序员容易生女孩，于是，他就会举出很多证据，其实真正的原因是那些反例全部被他忘记了而已。这也是为什么有人会觉得自已是乌鸦嘴，或者开车总是吃红灯、排队总是排在慢的队伍中。真正的原因是选择性遗忘，或者说选择性记忆。当你听到别人跟你绘声绘色地描述一些令他感到惊奇的现象时，不妨问一下:这是你真实统计出来的结果呢，还是凭着自己的感觉做出的判断?如果是后者，那么很可能只是选择性记忆的结果而已。

二、不要把特殊现象当普遍规律，要学会抓大放小，看到事物的普遍规律。不用统计的眼光看现象，会导致有些人特别喜欢说“那可不一定”。例如，你说吸烟有害健康，他说，那可不一定，我二男今年九十多，吸了至少七十年烟了，你说爱吃油炸食品会让人发胖，他说那可不一定，我侄女最爱吃炸鸡，但是你看她，怎么吃都不胖:你说为了将来有个好工作，现在要努力考人一所好大学，他说，那可不一定，没念过大学的成功人士太多了。虽然每句都没错。但这不能成为我们做决策的依据。

生活中大多数现象都符合统计学上的正态分布，中间最多，两头依次减少。例如，绝大多数人的身高都在人类平均身高的左右很小的范围内浮动，与平均身高相差越大，人数就会越少。正态分布表明，反常现象总是存在的，如果刻意要找，通常能找到。但这种反常情况，不能成为我们决策的主要依据。我们能因为有反常情况的存在，就大胆地吸烟、放心地让孩子吃油炸食品、对孩子的学业成绩无所谓吗?如果用统计的眼光看现象，这些问题的答案都显而易见:哪来的那么多不一定? 落到你自己身上，那就是大概率事件。不要心存侥幸。我们的一生中，绝大多数的遭遇都是概率分布中的那些大概率事件，这本身就是一种确定的规律。

06 能区分先后关系和因果关系

因果关系:通俗地讲，前一个事件的发生必然导致后一个事件的发生，则前为因后为果。先后关系:两个事件在发生的时间上是一先一后。具有因果关系的两个事件必须符合先后关系，这听上去有点像是废话，但时常被人们忘记。举个例子来说，我们发现富人往往身材健硕，热爱运动。于是，有些人可能得出一个结论:要想富，先瘦身。

这就是忘了因果关系必须符合先后关系。大多数情况下，很多人其实是因为富起来了，才开始有时间和金钱去健身，才会有更强的健康意识。而不是反过来。但是，最常被人们忘记的是:先后关系不一定是因果关系。例如，一个显而易见的例子是:每天鸡叫之后，天就会亮。但天显然不是鸡叫亮的，两个事件之间并没有因果关系。但同样的道理，换了一个场景，人们就容易糊涂。例如，某人到庙里烧了一炷香，一个月后怀孕了，就认定烧香和怀孕是因果关系。这样的例子在医疗健康领域可谓比比皆是。

再比如，曾经有一个朋友的朋友得了癌症，但是后来癌细胞又都消失了，于是，关于他癌细胞消失的原因传到我耳朵里时，就有了无数版本。其中有某家大医院的主任医师给治好的，一位老中医给治好的，某个寺庙的住持给治好的，练习瑜伽术给治好的，换了个山清水秀的地方住几个月就好了的，最夸张的是说晚上做了一个什么奇怪的梦就好了。后来我发现，所有这些版本中发生的事件都是真实的，也都是在癌细胞消失前发生的事情，但仅仅因为它们符合先后关系，就都被当作因果关系传诵了。其中不同传诵分支会不断地强化某个原因，以至于到最后就只剩下这一个原因了。

其实，上述任何一个事件都不能当作痛细胞消失的真正原因，很可能真正的原因是自愈，虽然听上去很神奇，但癌症确实也有可能自愈。不经过科学方法的研究，就无法确定因果关系。自愈也只是可能性之一。懂得了先后关系不一定是因果关系，在生活中，你就不容易轻信某些似乎很有道理的宣传。一个广告公司宣称自己的客户在签约后，利润同比增长了百分之百，这只能证明先后关系，无法证明因果关系。

07 能区分因果性和相关性

因果性:即因果关系，通俗地讲，前一个事件的发生必然导致后一个事件的发生，则前为因后为果。相关性:两个事件总是相生相伴，表面上有某种关联，但并不一定相互影响。在生活中，我们特别容易把因果性和相关性给搞混。

例如，我们经常听到“啤酒肚”这个说法，这个说法的意思是喝啤酒会导致人发胖，肚子变大。通过统计，我们也确实发现，身边喜欢喝啤酒的人肚子也往往比较大，肚子比较大的人也往往喜欢喝啤酒。似乎两者真有因果关系。其实，这两者之间只是有相关性，并没有因果性。真正的原因是，啤酒总是伴随着夜宵、烧烤、酒吧夜生活等，因此，啤酒喝得多的，往往是热量摄入高而运动量又少的人群，这个人群的肥胖比例自然也就会偏高。因此，喝啤酒和肚子大实际上是相生相伴的两个共同事件，并不是喝啤酒导致肚子大。实际上，只要控制热量摄入，多运动，哪怕天天喝啤酒，也不会导致肥胖。

有因果关系的事件之间一定会呈现出相关性，但反过来，有相关性的事件之间并不定具有因果关系。例如，统计发现雪糕的销售数量与溺亡人数呈现出明显的同高同低的情况，这是否说明商家销售雪糕的行为导致了溺亡人数增加呢?不能，它们只是相关性。真正的原因都是天气热。夏天一到，雪糕的销量升高，下水游泳的人数也会升高，所以溺亡的人数也就升高了。

请记住，你平常阅读到的绝大多数软广告，都是在用相关性来取代因果性，误导你。想要认定有相关性的两个事件之间具有确定的因果关系是一件非常困难的事情，往往需要通过非常严格的科学实验，才能最终确定。

例如，在医学上，要确定某种微生物与某种疾病之间有因果关系，需要通过下面这四个步骤的科学实验:

一、能从病人身上分离出这种微生物:
二、分离出的微生物能在体外单独培养繁殖;
三、把繁殖出的微生物植入到动物身上，动物能产生和人类似的症状:
四、从发病的动物身上又能分离出这种微生物。

在生活中，我们想要找出某个事件的原因时，不要想当然地认为是那个相关性最明显的事件，你需要先找出所有与之相关的事件，然后再根据具体情况，设计实验逐一排除或者验证。为收益最大化和损失最小化，在没有明确的证据时，我们不要轻易建立相关事件之间的因果关系。

08 懂得基本的逻辑规则

形式谬误:某个观点陈述中，因为结构上的缺陷而导致论证过程不符合逻辑的情况。

第一种形式谬误:真命题的逆命题不一定为真。科学史上有很多伟大的理论往往一开始不被主流科学界所接受。这是一个真命题，我们举出很多这样的例子。但如果反过来说:因为我的理论现在也不被主流接受，所以我的理论也是伟大的。这就错了。

第二种形式谬误:把整体具有的属性当成是每个部分也具有的属性，或者反过来，把部分当成是整体。香蕉和黄鱼单独吃都挺好吃的，但不代表香蕉炒黄鱼也一定好吃。某某药酒中的六十七味中药，其中的每一味药材在药典中都记载着能治疗某几种病症，但不意味着混在一起就能包治百病。

第三种形式谬误：循环论证，把待证明的结论也包含在证明的过程中。有人对我说，因为你不相信上火，所以你看你昨天吃了那么多瓜子，今天就上火了吧，现在你总该信吃瓜子会上火了。这个论证过程中已经把所有吃瓜子产生的后果都归因于上火，因此这种循环论证可以说怎么都不错，也可以说没有逻辑。

驳斥这类谬误不需要你是某个领域的专家，只需要分析观点的论证过程即可。因此，当有人指责别人不懂不要乱说，或者说你没学过什么就不要批评时，这个人本身就已经不讲逻辑了。因为对于形式谬误，是不需要关心具体内容的。我们应当听清楚别人批评的到底是什么，再判断他批评的内容是属于形式逻辑上的批评还是对于专业内容的批评，这时候才能继续说他有没有资格批评，否则就很容易变成人身攻击。

非形式谬误:除了形式谬误以外的逻辑谬误。

诉诸结果——用一个观点成立或者不成立的结果好坏来证明这个观点是否成立。举例:如果全球变暖是人类活动造成的，那么人类就不要活动了，因此，全球变暖不是人类活动造成的。

稻草人谬误——故意用一种错误甚至是滑稽的方式说出别人的观点，然后再证明这个观点是错误的。举例:有人说，现代医学是头疼医头脚疼医脚。实际上，我们都知道你如果头疼去医院做检查，很有可能是神经系统出了问题，现代医学要治疗的是你的神经系统。而一个人脚疼，可能是痛风，这时候的治疗方案跟脚完全没有关系，而是要减少嘌呤的摄入。说现代医学是治标不治本的，基本上也是同样的逻辑谬误。现代医学只有在实在找不到“本”或者是知道“本”但无法治疗的情况下，才会转求能够缓解症状。病理学、毒理学等寻找病因、病原的研究是现代医学最重要的研究方向。

简单归纳——在统计学上，样本太小，或者样本不具备广泛代表性，是不能得出结论的。举例:有人说我每次鱼刺卡喉咙，喝一口醋马上就好了，所以就得出喝醋能软化鱼刺的结论。个人的感受不能得出普遍的规律，实际上，喝醋是错误的治疗方法。

万能定义法——随时用结果来重新定义原因。举例:在西方国家，有一个对应的俗称是“不是真正的苏格兰人”。有一个故事是这样，一位叫哈密什的苏格兰人在报纸上看到一个英格兰人犯罪了，于是说，没有苏格兰人会做这种事。结果第二天，报纸上登了一个苏格兰人也犯了同样的罪，哈密什没有承认自己的观点是错的，而是说“我的意思是，没有真正的苏格兰人会做这种事”。这样一来，他就永远不会错了，因为犯错的人都不是真正的苏格兰人。

举证责任倒置——让对方来证明 “不可能”，逃避举证责任。举例:很多人会以没有证据证明某个命题是假的，来论证某个命题就是真的。这是把证据的缺失当成是证据不存在的证据。比如说，因为不能证明某种UFO现象是已知的任何自然现象，就当作是外星人飞船的证据。实际上，举证责任应该是提出非凡主张的一方，不能证明不存在可不代表必定存在。另外，绝大多数情况下，想要证明不存在，在逻辑上没有可能性。

把无知当证据一自已没看见或者不知道，就认为肯定是假的。举例:有人说，我真的难以想象，凭二十世纪六七十年代的技术，人类就能登陆月球，我实在难以相信，古人怎么可能建造出金字塔这样的庞然大物。这时候，比较耿直的一种回应可能是，这就是你没有成为科学家的原因吧。

把偶然当必然——尽管系列偶然的事件有可能导致一个不好的结果，但论证者会无视这种偶然性的微率，无限放大可能性，以最后导致的可怕后果为证据，来反对某个观点。举例:某个小学生上课的时候尿急，老师说，如果人人都你像你这样，那我的课还怎么上?类似这样的论证还常见于某些管理部门逃避自己的责任，无限放大偶然事件，如果人人都怎样来踢皮球。

对人不对事一一反驳某人的观点时，不关注观点的内容本身是否有理，而是转而指责这个人的人品。举例:有人说应该保护知识产权，反驳的人就以“谁没用过盗版，你也一样”来反驳。

诉诸无关权——一个科学家，哪怕再著名，只要脱离了本专业的领域，就和常人一样有可能犯常识错误。举例:生物学家或者化学家发表与理论物理有关的观点时，就不见得比普通人更可信。

虚假两难——论证者会设计出一个其实并不存在的二元选择，人为制造非此即彼的两难境地。举例:你不讨厌我，说明你爱我，你不仇视日本人，就是精日分子；你不转就不是中国人。

09 知道什么是类比，什么是逻辑推演

类比论证:把观点的论证过程建立在比喻上。逻辑推演:用形式逻辑的方式来论证某个观点。最常见的类比论证:人类不能和外星人沟通。因为这就好像人类和蚂蚁无法沟通一样，在外星人眼里，人类就是蚂蚁。这种证明自已观点的方法其实仅仅是一个类比，没有任何逻辑，因为没有讲出为什么可以把人类比作蚂蚁，把外星人比作人。这才是真正需要论证的观点，却没有经过论证，就直接当作结果来用了。

又比如:虫子都不吃转基因食品，人吃了能没事吗?这也是一种典型的类比论证，并不是有效的论证，因为把人类比为虫子，这个前提就不成立。再比如，把一个国家类比成一个公司，把原子类比成小球，把阴阳五行类比成数学模型等等。用类比得出的结论，往往错误的居多，大多数情况下，都是不恰当的类比。哪怕是最恰当的类比，也只是为了帮助理解，并不是有效的论证。

而用逻辑推演的方法来证明人类可以和外星人沟通的方法是:先建立不证自明的两条公理:一、数学是这个宇宙中普适的规律，二、智慧文明都能掌握基本的数学知识。如果你同意以上这两条的话，那么我就可以说，外星人能够和人类沟通。怎么沟通呢?通过数学作为信息传递的中介。假如你不同意，我们就要回到这个论证的起点，讨论数学是不是宇宙普适的规律，智慧文明是不是都能掌握基本的数学知识。我们先把外星人是否能和人类沟通的问题转换到这两个更基本的问题上，就这两个问题达成共识，再讨论外星人的问题。

这就是用逻辑推演的方法来证明。逻辑推演有可能不够严密，存在漏洞，但并不会妨碍这种证明方法本身的可靠性。它和类比有着很大的区别。逻辑推演是值得推崇的论证方式，而类比是不可靠的论证方式。

10 了解谁主张谁举证的基本概念

举证责任:一个观点的提出，有时需要证据，有时不需要证据，需要证据时就称为举证责任或举证义务。这原本是一个法律术语，但是在日常讨论问题时，这个概念也十分重要，否则就容易出现拾杠的情况。例如，警察在指控一个人偷东西时，举证责任就在警方。任何人都无须负有自证清白的责任(义务) 。

在日常生活中讨论问题时，一般来说，提出“存在性”主张的一方负有举证责任，而反对方不负。例如，有人提出主张“这座桥是我设计的”，那么就必须由他拿出相应的证据来证明自己的主张，而不是要求别人去证明“这座桥不是我设计的又是谁设计的?”。同样的道理，如果有一方主张” 金字塔是外星人建的”，这一方就需要拿出证据，而不是要求反对方举证“金字塔不是外星人建的又是谁建的?”。

不只是事和物的存在与否，主张“因果关系”存在的一方也负有举证责任，而反对方不负有。例如，主张“吹冷风能引起感冒”的人有责任举证“吹冷风”和“感冒”的因果关系。而反对方，也就是主张不存在这种因果关系的人，可以不举证。另外，正反双方首先应该对什么样的证据有效达成一致的判断标准，否则还是会陷入抬杠的情况。例如，在讨论吹冷风与感冒的因果关系前，应先对什么样的证据可以被视为有效证据进行讨论。假如反对方“不论主张方举出任何证据，都表示不采信”，那同样也是一种抬杠。

11 了解科学共同体是怎么回事

科学共同体:广义的概念是对所有认同科学方法、科学思维的科学工作者以及科学传播者的统称，狭义的概念是按照不同学科专业分成的一个个从事科研的组织、机构，单位等。科学共同体虽然没有总部、没有主席，但它又是一个确确实实存在的共同体，它最早的雏形可以追溯到十八世纪，形成于十九世纪末。科学共同体的游戏规则是所有科学工作者边玩边定的，但游戏规则也不是一成不变，只是进人二十世纪后，科学共同体的规则就已经非常稳定了。

这套游戏规则就是科学研究的基本范式和科学论文发表的基本原则。所有遵守这套规则的人都自动成为科学共同体的一部分，不遵守这套规则就自动退出。科学共同体可以按学科分、按国家分、按地域分等等，但是不管怎么分，大家遵守的游戏规则是一样的。最重要的是，所有成员都很容易沟通。在科学共同体中，成员通用的语言是数学。科学共同体的核心是科学家群体，它的外延现在也扩展到了各类科学传播者。科学共同体也有很多的行业组织，例如中国科学院、美国科学院、马克斯普朗克学会、世界卫生组织，还有像欧洲核子研究中心、美国航空航天局这样的科研单位，也包括全世界大大小小的实验室、大学等等。科学共同体的观点表达，主要是通过在科学期刊上发表论文，以及各个权威机构出版的白皮书之类的正式书面资料。科学共同体的作用主要包括科学研究、科学交流、塑造科学范式、承认和奖励，以及科学传播。

科学共同体是人类文明火种的守护团，是科学技术大厦的缔造者。它们不但要确保文明之火不会熄灭，同时也要确保科学这座大厦的每一块砖都是可靠的，后人可以放心地直接拿前人的成果来用。科学共同体最重要的条规则叫同行评审。无论科学家的名气有多大，凡是没有经过同行评审的观点都不能成为科学大厦的一块砖。

12 能区分哲学思辩和科学思考

哲学思辨:用纯粹的理性思考来研判一个命题。科学思考:把哲学思辨的结论仅当作一种假说对待，然后设计实验去验证这种假说。

例如有一个命题：黑丝袜为什么能增加女人的性感程度?对待这个命题，哲学家可以用纯理性分析来给出个答案。例如，根据亚里士多德的“种加属差”的分类法，黑丝袜属于丝袜这个大类，而丝袜与裤子、裙子、普通袜子比较，具有更好的塑形能力；黑色的丝袜相较于其他颜色的丝袜，它的优势是显瘦，还能把肤色衬得更白。因此，黑丝袜的优势就是，在种差的意义上，塑形能力最好；在属差的意义上，既显瘦又显白。以上这种思考方式可以称为哲学思辩，而下面则是科学思考。

科学思考的第一步:调研前人的研究，方法是到论文库中检索相关论文。很遗憾，没有找到有价值的前人研究。第二步:设计实验来证实或者证伪该命题。在设计实验之前，首先对命题中的每一个概念下定义。例如，性感的定义:对一个人所引起的代表性冲动的生理性反应的程度。实验举例:给模特拍摄两组照片，一组是穿黑丝袜的，一组是不穿丝袜的。寻找一百名成人作为被试者，样本的随机性分布越大越好。将被试者分成两组，一组称为实验组，让他们看那组穿黑丝袜的照片:另一组称为对照组，让他们看那组不穿丝袜的照片。测量每一个人在看照片时的血压，心率、呼吸，体表湿度(出汗)以及海棉体血量等等生理指标。让每个人再填写一份问卷，例如，你愿意花一百元请她看场电影，花三百元共进烛光晚餐，还是花一万元一起海南游?假如实验结果是该命题为真，则继续设计实验进一步探究原因。第三步:通过哲学思辨，假定黑丝袜增加女人性感程度的原因是一、让模特的腿显得更长，二、让模特的皮肤显得更白，三、长腿和皮肤白会增加女人性感。第四步:分别设计实验对以上三个假说进行验证。如果假说不成立，则循环“提出假说再验证”的过程，直到验证所有合理假说为止。

科学思考初看上去效率很低，甚至有些迁腐。但是，人类正是因为这种看上去低效率的思考活动，在短短几百年时间内所取得的智力成就，就远远超越了过去数千年的成就之和。科学思考是人类文明的一次重大升级。历史上，没有任何智力成就能与之媲美。

13 能明白经验不等于规律

规律:满足指定的条件时，某个事件必然会出现，这被称为客观规律。经验:个人通过主观感受获得的认知。规律是客观存在的，不以人的意志为转移。而针对同一规律，不同的人可能总结出不同的经验。个人经验与客观规律之间往往有偏差。

例如，同样看待日食、水灾等自然规律，古人根据经验，有说是帝王不仁所致，只需勤政即可免祸；也有说是天狗或神明显灵所致，只要敲锣打鼓即可驱赶。但这些经验都不等于客观规律。再比如，现代医学发现，感冒是自限性疾病，通常一周左右会痊愈，这是一个客观规律。但人们通过主观感受，会得出“洗热水澡好得快”“用被子捂汗好得快”“喝烫的姜茶好得快” 等等经验。这些经验虽然很符合不同人的主观感受，但是它们不等于规律，现代医学通过严格的临床试验发现，这些经验并不具有普适性，所以它们不等于规律。

科学思维要求人不要轻信自己的感觉和经验，哪怕你自已认为感觉和经验有多么的真切，也不能完全相信，而要相信严格的逻辑推演和受控实验的数据，用统计的思维考虑问题。简单概括来说，就是要相信逻辑和实证。

经验能够在一定程度上帮助人们认知世界，例如东方的阴阳五行学说和西方的四元素学说，都属于典型的经验性理论，它们代表了古人的智慧结晶，也曾经帮助古人解决了很多问题，但毕竟没有揭示真正的自然规律。只有摆脱对经验和个例的迷思，我们才能发现真正的客观规律。作为现代人，我们需要知道，经验有时候能够帮助我们找到规律，但经验不等于规律。按规律办事要比按经验办事成功率更高。

14 知道大样本随机双盲对照实验的含义

大样本:研究对象的数量要足够大，足够的意思是符合该项研究领域通常需要的数量。随机:研究对象的选择以及分组要符合随机原则，尽可能覆盖各种情况。双盲:测试者和被测者都不知道被测者在实验过程中的组别，以及其他一些有可能会对研究结论产生影响的信息。对照:被测者至少要分成“实验组”和“ 对照组”，有时根据情况还要增加“控制组”等。

大样本随机双盲对照实验是一种很重要的科学研究方法，也是国际公认的检验药物有效性的金标准。大部分人都有这样的经历，得了感冒，但没有去医院，甚至没有吃药，结果没几天感冒就好了，这是因为感冒是自限性疾病，它们会自愈，类似的常见病还有很多。为证明这病到底是“自己好的”还是“治疗产生的效果”，必须有人和你进行对照，分别观察吃药和不吃药的结果有什么不同。

为了排除“人和人不一样，有的人病好得快，有的人病好得慢”的影响，就需要用数量尽可能多的一批人来测试，也就是所谓的大样本。样本数量要大到什么程度才算是大。不同的研究对象有不同的标准。一般来说，三十到五十个是最低要求，有些研究甚至要求几千个样本才算大。

样本不单要大，还要有随机性。不能A组人都是青少年，B组人都是中老年，那样A组人吃药自然就会好得快些。可以用抽签的方式将人们随机分为A，B两组。

但以上三条原则依然无法排除安慰剂效应，也就是日常生活中我们常说的心理作用。这种效应甚至可以让一群注射蒸馏水的人认为自己打的是止痛药，并觉得疼痛感降低。所以要让A、B两组人组吃真药，一组吃安慰剂 (外形和真药一致，比如装着淀粉的胶囊)。但是人们后来又发现，如果给药的人知道哪种是真药，哪种是假药，也可能在观察病人时产生偏见，甚至无意间向被测对象暗示了药的“真假”，所以，需要对所有直接参与实验的人隐藏组别以及真假药信息，即发药和评价的人只知道A药和B药，却不知道它们中哪个是真药，哪个是安慰剂。

大样本随机双盲对照实验不只是科学的方法，更是逻辑的方法，除了被广泛应用于现代医学检验药物有效性，也能研究类似“哪种红茶更好喝”“哪种葡萄酒口感更好”这类问题。

15 能判断一个观点是否具备可证伪性

可证伪性:一个命题在逻辑上是否有可能被证明是误的。这是科学哲学家卡尔波普尔在二十世纪中叶提出的一个概念，在科学哲学的发展史上有重要的意义，理解这个概念，可以让我们更加理性地看待各种不同的说法。一个命题可以分成“逻辑上有可能被证明是错的”和“逻辑上没可能被证明是错的”两种情况。例如，以下这些命题有可能被证明是错的，只要找到一个反例就可以证伪了:

人是不会死的。
在任何参考系中，光速不变。
现代人是从类人猿演化而来的。

这些命题，有的已经存在反例，例如“人是不会死的”；有的尚未找到任何反例，例如“光速不变”，但并不意味着一定不存在反例。这些命题的共通性是:有可能找到一个反例来证明命题错误。因此，这些命题被称为“具备可证伪性”。

以下这些命题不可能被证明是错误的，找到再多的反例也没用。

人人都会死。
鬼魂是存在的。
人类终有灭亡的那一天。

这些命题的共通性是:你哪怕找到再多的反例，也无法证明该命题是错误的，因为命题的陈述形式已经决定了它不可能被穷举证伪。

波普尔在此基础上还提出了“可证伪度”的概念。可证伪度就是指一个理论被证伪的可能性的程度。一个理论如果完全没有可证伪度，就不是科学理论，而是非科学。假如一个可证伪度为零的理论声称自己是科学，那么它就是伪科学。反过来，一个理论可证伪度越高，它且被证实，可信度也就越高。

例如，爱因斯坦提出广义相对论时，做了一个很容易被证伪的预言:在日食时，可以观察到星光的偏折现象。爱因斯坦的理论所冒的被证伪的风险极大，理论的可证伪度极高，在这种情况下，他的理论一旦被证实，那理论的可信度就极大。这个例子中的星光偏折实验，就是波普尔所称的“判决实验”，这也是波普尔提出的重要概念之一。

因此，一个理论如果胆敢称自己是科学理论，那么就必须要能提出一个判决实验，而这个实验的结果有可能直接判理论的死刑。下次你遇到有人说自己的理论可以解释一切，你就直接问他:你能不能提出一一个具备可操作性的判决实验来呢?

END

万物静默如谜