为什么一些遗传疾病尽管会降低生存率,但仍会在人群中持续存在几代人?为什么罕见的隐性病症更常见于偏僻的社区?群体遗传学——研究等位基因频率如何随时间变化的学科——用优雅的数学回答了这些问题。本指南涵盖了从首要原则开始的核心思想。
等位基因、基因型和表型
二倍体生物中的每个基因都存在两个拷贝(等位基因),每个拷贝都遗传自亲本。如果我们将基因 A(显性)和 a(隐性)的两个版本标记为:
- AA — 纯合显性
- Aa — 杂合子(携带者)
- aa — 纯合隐性
基因型(存在哪些等位基因)决定表型(实际表达的内容)。如果A完全占主导地位,则AA和Aa具有相同的外观;只有 aa 个体表达隐性特征。
等位基因频率是基因库中每个等位基因的比例:
- p = A 等位基因的频率
- q = 等位基因的频率
- p + q = 1(所有等位基因之和必须达到 100%)
如果 100 个人的群体在 200 个等位基因总数中有 120 个 A 等位基因,则 p = 0.6,q = 0.4。
哈代-温伯格平衡
1908 年,数学家 G.H.哈代和医生威廉·温伯格独立表明,在不存在进化力量的情况下,等位基因频率和基因型频率在世代之间保持恒定。
Hardy-Weinberg 方程 根据等位基因频率预测基因型频率:
p² + 2pq + q² = 1
在哪里:
- p² = AA 频率
- 2pq = Aa 的频率(杂合子)
- q² = aa 的频率
示例: 如果 p = 0.6 (A) 且 q = 0.4 (a):
- AA 频率:0.6² = 0.36 (36%)
- Aa频率:2×0.6×0.4=0.48(48%)
- aa 频率:0.4² = 0.16 (16%)
当个体随机交配时,这些比例自然会出现——每个等位基因都是从基因库中独立抽取的,因此频率会像独立概率一样倍增。
平衡的五个条件
Hardy-Weinberg 平衡仅在满足五个条件时才成立:
- 随机交配——个体配对时不考虑基因型
- 无突变 - 等位基因不会从一种形式变为另一种形式
- 无迁移 — 没有人进入或离开种群
- 无限的人口规模——无随机波动
- 没有自然选择 - 所有基因型都具有相同的适应性
在实践中,这些都没有完全满足。 Hardy-Weinberg 的价值不是作为对现实的描述,而是作为一个空模型。与预期频率的偏差告诉您哪些力量在起作用。
在实践中使用 Hardy-Weinberg
Hardy-Weinberg 可让您根据可观察的表型计数估计等位基因频率:
问题: 每 10,000 人中就有 1 人患有隐性遗传病。携带者占百分之几?
- 疾病频率 = q² = 1/10,000 = 0.0001
- 因此 q = √0.0001 = 0.01
- 并且 p = 1 − 0.01 = 0.99
- 载波频率 = 2pq = 2 × 0.99 × 0.01 = 1.98% ≈ 1 in 50
这是一个惊人的结果:每一个患有这种疾病的人,都有大约 200 个携带者——几乎看不见,但携带一个等位基因副本。
遗传漂变:随机等位基因频率变化
即使没有选择、突变或迁移,等位基因频率在有限群体中也会偶然发生变化。运气好的话,一小群人可能在一代人中复制出稍微多一点的 A 等位基因。这就是遗传漂变。
每代等位基因频率变化的方差为:
Var(Δp) = p(1-p) / 2N
其中 N 是人口规模。在 50 人的人口中,标准差为 √(p×q/100) — 如果 p = q = 0.5,则每代的误差仅为 ±5%。
遗传漂变的后果:
- 小种群迅速失去遗传多样性
- 等位基因可能会偶然达到固定 (p = 1) 或丢失 (p = 0),无论适应性如何
- 即使没有选择,孤立的种群也会在遗传上出现分歧
创始人效应和瓶颈
当一小群人殖民一个新地区时,创始人效应就会发生。创始人只携带原始群体等位基因的子集,因此新群体一开始的多样性就会减少,频率也会出现偏差。
宾夕法尼亚州的旧秩序阿米什人就是一个引人注目的例子:几种罕见的遗传性疾病——包括埃利斯-范克里维尔德综合症(额外的手指加上心脏缺陷)——出现的频率比全球平均水平高 10 到 100 倍,可以追溯到少数 18 世纪的创始人。
人口瓶颈是人口规模急剧、暂时的减少(由于疾病、灾难或狩猎)。幸存的基因库可能不代表原始的等位基因频率,并且遗传多样性永久减少。
自然选择
自然选择系统地改变等位基因频率——而不是像漂移那样随机。 选择系数 (s) 衡量基因型的适应度劣势:
如果最适合的基因型的相对适合度为 1,则不利的基因型的适合度为 (1 − s)。当 s = 1 时,等位基因是致命的。
在针对 aa 的选择下,每代隐性等位基因的频率变化:
Δq ≈ -sq²p / (1 - sq²)
针对隐性等位基因的选择在稀有时很慢 - 大多数拷贝隐藏在载体(Aa)中,在选择中它们是不可见的。这就是为什么即使针对 aa 表型进行强烈选择,遗传性疾病也不会消失。
平衡多态性:镰状细胞性贫血
杂合子优势的经典例子:镰状细胞性贫血是由隐性等位基因(HbS)引起的。纯合子(HbS HbS)个体患有严重贫血;该等位基因明显降低了健康度。那么,为什么它在撒哈拉以南非洲地区持续存在高频率(高达 25%)呢?
因为 Aa 携带者 (HbA HbS) 比正常个体 (HbA HbA) 对疟疾有更强的抵抗力。在疟疾流行地区,携带者比任何一个纯合子都有更高的适应度——这通过平衡选择维持了人群中的两个等位基因。
稳定平衡频率为:
q_eq = s₁ / (s₁ + s₂)
其中 s₁ 是 AA(正常)的缺点,s2 是 aa(全镰状细胞)的缺点。在没有疟疾的地区,s₁ ≈ 0,等位基因向下漂移——这正是我们在疟疾区以外的非洲人后裔中观察到的情况。
突变率
新的等位基因通过突变进入群体。人类种系突变率约为每代每个碱基对 1.1 × 10⁻⁸,即每人约 33 个新突变。
对于基因位点:
μ = new mutations / (2N × generations)
突变率足够低,几乎不会改变任何一代中的等位基因频率(与选择或漂移不同)。但经过数千代,突变选择平衡决定了种群中有害等位基因的稳态频率。
生物多样性:测量那里的生物多样性
群体遗传学还为我们提供了衡量生物多样性的工具。 香农-维纳多样性指数 H' 量化了物种多样性:
H' = -Σ(pᵢ × ln pᵢ)
其中 pᵢ 是每个物种的比例。拥有 10 个物种且数量均等的群落,其 H' 值高于 90% 的个体属于单一物种的群落。
均匀度 (J) = H' / H'max 衡量个体在物种之间分布的均匀程度,与丰富度无关。 J = 1 表示完全均匀; J接近0意味着一个物种占主导地位。
这些指标用于保护生物学,以评估生态系统健康状况、规划保护区并跟踪栖息地丧失随时间的影响。
从群体遗传学到进化
群体遗传学提供了将达尔文进化论(适者生存)与孟德尔遗传学(等位基因遗传)联系起来的数学框架。这四种力量——选择、漂移、突变、迁移——作用于等位基因频率,经过足够的时间,它们的累积效应会产生物种形成。
使用我们的Hardy-Weinberg计算器、等位基因频率计算器、种群增长计算器、遗传漂移计算器和生物多样性指数计算器 用您自己的值探索这些模型。