Генетика
На уровень вверх

Критерий хи-квадрат

Критерий хи-квадрат

Проведем мысленный эксперимент.

Мы скрестили два растения гороха. Получили следующее потомство:

Для просмотра таблицы прокрутите страницу вправо

Растения с признаками

Количество таких растений

Желтые гладкие семена

315

Зеленые гладкие семена

108

Желтые морщинистые семена

101

Зеленые морщинистые семена

32

Что же делать с полученными результатами???

Так как мы с Вами исследователи, будем предлагать различные гипотезы. Я предлагаю такую:

Растения с признаками

Соотношение

Желтые гладкие семена (ЖГ)

10

Зеленые гладкие семена (ЗГ)

4

Желтые морщинистые семена (ЖМ)

3

Зеленые морщинистые семена (ЗМ)

1

То есть я говорю, что мы получили в эксперименте расщепление 10 : 4 : 3 : 1.

Любой человек, который изучал генетику, скажет, что я говорю глупости, а в эксперименте наблюдается классическое расщепление 9 : 3 : 3 : 1.

Кто же прав?

Последователи Дарвина укрепляли позиции эволюционной теории в жарких спорах не без применения кулаков.

Мы с Вами живем, к сожалению не в 19 веке, сейчас в ученом сообществе для этих целей используют математику.

Инструментом для проверки гипотез расщепления служит хи-квадрат .

Как им пользоваться?

Хи-квадрат вычисляется по следующей формуле:

Т.е. сначала мы смотрим сколько у нас есть различных групп (растений/животных), чье соотношение мы проверяем. В нашем случае всего четыре группы: ЖГ, ЗГ, ЖМ и ЗМ. Затем мы выбираем гипотезу, которую хотим проверить. Выберем для начала мою: соотношение признаков 10 : 4 : 3 : 1.

В идеальном случае из 556 растений (315 + 108 + 101 + 32), которые получились в опыте, 10/18 (10/10+4+3+1) часть

имела бы желтые гладкие семена, 4/18 были бы с зелеными гладкими и т.д. В числах это 308,8 (556 * 10/18), 123,6 и т.д.

Такие гипотетические численные значения в формуле обозначены Ожидаемое . Соответственно Наблюдаемое - это то, что мы увидели в опыте: 315, 108 ... Вычислим значение хи-квадрат для гипотезы 10 : 4 : 3 : 1. хи-квадрат = (315 - 308,8) 2 /308,8 + (108 - 123,6) 2 /123,6 + (101 - 92,7) 2 /92,7 + (32 - 30,9) 2 /30,9 = 2,88

Теперь самое главное.

Что делать с вычисленным значением хи-квадрат?

Итак, что мы можем сказать о значении хи-квадрат, думая своей головой?

• Чем оно больше, тем меньше наше доверие к гипотезе.

• Потому что это означает, что наблюдаемые значения очень сильно отличаются

от ожидаемых.

• Оценивать это значение можно только с учетом количества групп в опыте (в нашем случае их четыре).

Оценивают хи-квадрат обычно с помощью таблиц.

В таких таблицах пишут: по вертикали количество степеней свободы (для наших целей это число на единицу меньшее количества групп). Количество степеней свободы часто обозначают df (degree of freedom), а формула для его вычисления: df = кол-во групп - 1 по горизонтали: вероятность наблюдаемого значения быть случайным отклонением .

Сделаем умственное упражнение: если эта вероятность мала, то мы доверяем гипотезе или нет? Правильно! Нет.

Как определить количество групп?

Для этого не нужно быть изобретателем хи-квадрата. Достаточно уметь считать.

В нашем случае у нас раз, два, три, четыре! группы: (Желтые гладкие, Зеленые гладкие,

Желтые морщинистые, Зеленые морщинистые). Теперь вопрос на засыпку: если мы будем смотреть только наследование цвета, то сколько будет групп? Правильный ответ: 2 (желтые и зеленые).А чему будет равно кол-во степеней свободы?

Правильный ответ: 1 (количество групп минус 1).

Но вернемся к нашим баранам горохам.

Табл. 1. Значения хи-квадрат

Количество степений свободы

Вероятность наблюдаемого значения быть случайным отклонением

0,995

0,99

0,975

0,95

0,9

...

0,1

0,05

0,025

0,01

0,005

1

---

---

0,001

0,004

0,016

...

2,706

3,841

5,024

6,635

7,879

2

0,01

0,02

0,051

0,103

0,211

...

4,605

5,991

7,378

9,21

10,597

3

0,072

0,115

0,216

0,352

0,584

...

6,251

7,815

9,348

11,345

12,838

4

0,207

0,297

0,484

0,711

1,064

...

7,779

9,488

11,143

13,277

14,86

5

0,412

0,554

0,831

1,145

1,61

...

9,236

11,07

12,833

15,086

16,75

6

0,676

0,872

1,237

1,635

2,204

...

10,645

12,592

14,449

16,812

18,548

7

0,989

1,239

1,69

2,167

2,833

...

12,017

14,067

16,013

18,475

20,278

Попробуем оценить по этой таблице вероятность того, что отклонения от гипотезы 10 :

4 : 3 : 1 в опыте случайны.

Количество степеней свободы: 3 . Значение хи-квадрат: 2,88 . Из табл. видно, что данная вероятность находится где-то между 0,9 и 0,1. Принято доверять гипотезе, если вероятность >= 0,1 (это называется уровень значимости 0,1), или если она >= 0,05 (уровень значимости 0,05).

Значит моя гипотеза вполне подходит, несмотря на то, что она мало согласуется с генетикой!

Попробуйте вычислить значение хи-квадрат для гипотезы 9 : 3 : 3 : 1 самостоятельно.