Справочник
зоотехника-селекционера и контроль-
ассистента по молочному скотоводству

Под ред. проф. В.Н.Карелина. Минск, «Ураджай», 1972.

 

Методы изучения связи между признаками

Во многих случаях селекционеру, ведущему отбор по нескольким признакам, например, по удою, жирномолочности и белковомолочности или же по весу и другим признакам, необходимо выяснить вопрос о степени связи между этими признаками в стаде, так как от этого зависят и эффективность отбора, и особенности работы по их улучшению. Не менее важно иногда выяснить, какова связь между матерями и дочерями по тому или иному признаку для определения коэффициента наследуемости, и другие вопросы.

Скотный двор


На сайте Скотный двор

Для изучения связи между признаками существуют методы, позволяющие определять направление и степень связи между ними, а также изменение величин одного признака в зависимости от другого. В тех случаях, когда один признак не имеет колебаний (например, определенный возраст животного), ограничиваются определением средних величин изучаемого признака в зависимости от величины другого. Так, при изучении влияния номера лактации коров на их молочную продуктивность или на содержание жира в молоке определяют средний удой или среднее содержание жира в молоке у коров с разными лактациями. Часто установленную зависимость изображают в виде графика, в котором на оси X расположены величины определенного признака, например, числа лактации, по оси Y — шкала величин изучаемого признака, например, удоя или процента жира. Восстанавливая из соответствующих точек оси X перпендикуляры, высота которых равна величине исследуемого признака на шкале оси Y и соединяя их вершины прямыми линиями, получают кривые зависимости признака Y (например, удоя) от признака X (числа лактации).

В зависимости от характера связи между признаками графики могут быть различными. Если с увеличением признака X признак У увеличивается пропорционально, получается линия, близкая к прямой. Такая связь называется прямолинейной. Если же с увеличением одного признака второй признак (Y) сначала увеличивается, затем уменьшается или остается на одном уровне, получается кривая линия. Такая связь называется криволинейной.

Кривые отражают лишь общее направление в связи признаков, не учитывая изменчивости животных, входящих в каждую из средних. Поэтому необходим более точный учет связи между признаками и характеристики ее одной цифрой. Для этого используется коэффициент корреляции (r).

Коэффициент корреляции колеблется от — 1 до +1. Знак при нем указывает направление связи между признаками: при отрицательном знаке с увеличением одного признака другой уменьшается (связь отрицательная, или обратная), при положительном знаке с увеличением одного признака возрастает и второй (связь положительная, или прямая). Сама же абсолютная величина коэффициента корреляции указывает на степень связи между этими признаками. При отсутствии связи коэффициент корреляции равен нулю. Если связь между признаками слабая, он имеет абсолютные величины от 0 до 0,5, если средняя — от 0,5 до 0,7, если высокая — 0,7, при r = 1 связь между признаками полная, т. е. с увеличением одного признака у всех особей пропорционально изменяется и второй признак.

При изучении связи между признаками каждое животное должно иметь два показателя: один — по признаку, обозначаемому как признак X, второй — по другому признаку, обозначаемому как Y. Какой из двух признаков принимать за X, какой за Y, если оба признака изменчивы, не имеет значения. Затем для каждого признака строят классы (как для вариационного ряда), но с таким расчетом, чтобы число классов обоих признаков было бы почти одинаковым (разница не должна быть более 1—2 классов). Классы признака X располагают на горизонтали, как заголовки столбцов, классы признака Y— по вертикали, как заголовки строк. Получается корреляционная решетка (см. табл. 2), в которую и разносят варианты с учетом одновременно обоих признаков, выбирая, к какому столбцу животное относится по признаку X, к какой строке —· по признаку Y. В квадратике на их пересечении Делают отметку по той же десятичной системе, как и при построении вариационного ряда. В результате разноски часть клеток корреляционной решетки получается заполненной цифрами, показывающими число животных, имеющих одновременно определенные величины признаков X и Y. Часть клеток может остаться незаполненной.

Таблица 2

Корреляционная решетка распределения коров
по содержанию белка (X) и жира (Y) в молоке

Y3,1-3,193,2-3,293,3-3,393,4-3,493,5-3,593,6-3,693,7-3,793,8-3,893,9-3,994,0-4,094,1-4,19fYaYfYaYfYa2Y
X
3,4-3,4911       24832
3,5-3,591212     631854
3,6-3,6924122    1122244
3,7-3,7915768322   3413434
3,8-3,8927913158531  630  
3,9-3,9914361312632  5015050
4,0-4,09113299422134268136
4,1-4,19113422211118354162
4,2-4,29  112111  7428112
4,3-4,39  1111116530150
4,4-4,49      1124624144
4,5-4,59       1225735245
fX623303354402213667N=220 ∑fYaY=
=207
∑fYa2Y=
=1163
aX43210123456    
fXaX24696033 404439243042∑fXaX=
=33
   
fXa2X9620712033 408811796150294∑fXa2X=
=1241
   

При наличии положительной связи между признаками заполненные цифрами клетки решетки располагаются вдоль диагонали, идущей слева направо сверху вниз, которую называют диагональю положительной корреляции, при отрицательной связи такие клетки группируются вдоль диагонали, идущей слева направо снизу вверх, называемой диагональю отрицательной корреляции. При отсутствии связи между признаками они располагаются по всей решетке, группируясь ближе к средним классам признаков X и Y. Заполненные цифрами клетки образуют корреляционное поле, по форме которого можно судить о направлении и степени связи между признаками: чем оно уже, тем более связаны между собой признаки. Точное же представление о степени их связи дает лишь коэффициент корреляции, который определяют по приведенной ниже формуле:

Коэффициент корреляции

где N — число особей; аX и аY— выраженные в классах отклонения от условной средней в рядах X и Y, установленные по суммарным рядам признаков X и Y без распределения их по решетке;

Поправка 1и Поправка 2— поправки к условным средним, определяемые также для суммарных рядов X

σ'X и σ'Y — среднее квадратическое для этих же рядов, но без умножения на классный промежуток, так как последний в формуле коэффициента корреляции сокращен и расчеты проводятся лишь в номерах классов. Специфичной для коэффициента корреляции является лишь величина ∑faXaY представляющая собой сумму произведений числа особей в каждой клетке f, умноженную на отклонение этой клетки в ряду X и в ряду Y, т. е. на aX и aY.

Как пример, вычислим коэффициент корреляции между содержанием белка и жира в молоке у коров (табл. 2). Из распределения вариант в этой решетке видно, что связь между изучаемыми признаками в стаде положительная, так как варианты группируются вдоль диагонали положительной корреляции, но корреляционное поле довольно широкое, что указывает на слабую связь между этими признаками.

Для вычисления r в суммарных рядах X и Y выбирают классы, в которых находится условная средняя, как это делается и при определении средней арифметической. Соответствующие ему столбец и строка обводятся толстыми линиями, разбивающими решетку на 4 квадрата: I квадрат — у животных оба признака ниже, чем условные средние, и поэтому значения aX и aY отрицательные, а произведение их положительное; II квадрат — у животных признак X выше условного среднего (aX положительное), признак Y— ниже (aY отрицательное) и произведение их отрицательное; III квадрат — животные с обратным соотношением признаков и также с отрицательным произведением aXaY; IV квадрат — животные, у которых оба признака выше средних и положительное произведение aXaY. Поскольку селекционера интересуют животные, положительно отклоняющиеся от среднего по обоим признакам, процент животных в IV квадрате будет указывать на возможности селекции: чем больше таких животных, тем больше возможность пополнить стадо потомством таких лучших по обоим признакам коров.

Вычисление величины ∑faXaY производят по каждому квадрату в отдельности, затем суммируют с учетом знаков и получают общую ∑faXaY.

В приведенном примере ∑faXaY по квадратам будет следующая:

∑faXaY= 121 + 596 — 23 — 104 = 590.

I квадрат faXaY II квадрат faXaY III квадрат faXaY IV квадрат faXaY
1 . —4 . —3 = 122 . —3 . 1 = —61 . 1 . —4 = —412 . 1 . 1 = 12
1 . —4 . —1 = 42 . —2 . 1 = —44 . 1 . —3 = —126 . 1 . 2 = 12
1 . —3 . —4 = 123 . —1 . 1 = —33 . 1 . —2 = —69 . 1 . 3 = 9
2 . —3 . —3 = 182 . —1 . 2 = —46 . 1 . —2 = —62 . 1 . 4 = 8
2 . —2 . —3 = 122 . —1 . 3 = —61 . 2 . —4 = —89 . 2 . 2 = 36
4 . —2 . —2 = 16∑faXaY=  —231 . 2 . —3 = —64 . 2 . 2 = 16
1 . —2 . —1 = 2 3 . 2 . —2 = —122 . 2 . 3 = 12
1 . —1 . —4 = 4 2 . 2 . —1 = —42 . 2 . 5 = 20
5 . —1 . —3 = 15 1 . 3 . —3 = —91 . 2 . 6 = 12
7 . —1 . —2 = 14 1 . 3 . —2 = —62 . 3 . 1 = 6
6 . —1 . —1 = 6 3 . 3 . —1 = —92 . 3 . 2 = 12
∑faXaY= 121 1 . 4 . —2 = —81 . 3 . 4 = 12
  1 . 4 . —1 = —41 . 3 . 5 = 15
  1 . 5 . —2 = —101 . 3 . 6 = 18
  ∑faXaY= —1041 . 4 . 1 = 4
   1 . 4 . 2 = 8
   1 . 4 . 4 = 16
   1 . 5 . 2 = 10
   1 . 5 . 3 = 15
   1 . 5 . 5 = 25
   1 . 5 . 6 = 30
   1 . 6 . 1 = 6
   2 . 3 . 3 = 18
   1 . 6 . 4 = 24
   2 . 6 . 6 = 72
   1 . 7 . 2 = 14
   2 . 7 . 5 = 70
   2 . 7 . 6 = 84
   ∑faXaY= 596

На основании полученных с помощью корреляционной решетки (табл. 2) величин определяем входящие в формулу коэффициента корреляции показатели:

Показатели коєффициента корреляции

Подставляя все эти величины в формулу, получим следующую величину коэффициента корреляции:

Величина коєффициента корреляции

Такая величина г указывает на то, что между содержанием белка и жира в молоке коров изучаемого стада имеется положительная корреляция. Однако величина коэффициента корреляции, как и другие биометрические величины, зависит от случайности в выборке материалов, что может привести к неправильным выводам о наличии или отсутствии связи. Чтобы избежать таких ошибок, необходимо определять ошибку коэффициента корреляции по формуле:

Ошибка коєффициента корреляции

В зависимости от величины ошибки коэффициента корреляции решают вопрос, есть ли связь между изучаемыми признаками или она отсутствует, т. е. достоверно ли отличается полученный коэффициент корреляции от нуля — показателя отсутствия связи между признаками. Поэтому разница между коэффициентом корреляции и величиной, характеризующей отсутствие связи, т. е. нулем, всегда равна коэффициенту корреляции, и показатель достоверности определяется как отношение коэффициента корреляции к его ошибке:

Показатель достоверности

Если r превышает ошибку в три раза и более, связь между признаками доказана (достоверна). В приведенном выше примере при коэффициенте корреляции 0,504 и числе вариант 240 ошибка

Вічисление ошибки коєффициента корреляции

Следовательно, связь, между изученными признаками достоверна.

Величина ошибки коэффициента корреляции зависит не только от числа животных в выборке, но и от самой величины этого показателя: чем выше корреляция между признаками, тем меньше числитель дроби, а следовательно, и ошибка. Поэтому в случаях слабой связи между признаками для доказательства ее достоверности необходимо исследовать большее количество животных.

Коэффициент корреляции показывает направление и степень связи между признаками, однако по его величине нельзя судить, на сколько единиц изменится один признак при изменении второго на определенное число единиц. Ответ на этот вопрос дает специальная величина — коэффициент регрессии, определяемый по формулам

Коэффициент регресии

которые показывают, на сколько единиц изменится признак X при изменении на единицу признака Y

Изменение признака Х

и на сколько единиц изменится признак Y при изменении на единицу признака X

Изменение признака Y

В этих формулах сигмы берут умноженные на классный промежуток, т. е. выраженные в единицах изучаемого признака. Поэтому коэффициенты регрессии являются именованными числами. В нашем примере

Вычислкние коэффициентов регресии

Иными словами, при изменении на 1% содержания белка в молоке жирность молока (повысится на 0,453%, а при изменении содержания жира на 1% содержание белка увеличится на 0,559%. Следовательно, в этом стаде можно успешно вести селекцию по обоим признакам, однако степень связи между ними не столь высока, чтобы вести селекцию только по одному из них, рассчитывая, что это одновременно приведет к значительному росту второго признака. Используя полученные коэффициенты регрессии, можно рассчитать, какую величину в среднем должен иметь один признак при определенной величине второго по формуле:

Определение величины признака

где X — искомая величина;

      У — заданная величина признака У;

      МX и МY — соответствующие средние величины этих признаков.

В нашем примере МX = 3,55% + 0,137—0,1% = 3,56%;

                             МY= 3,85% + 0,86—0,1% = 3,936%.

Интересно выяснить, какое будет содержание белка в молоке, если содержание жира увеличится до 4,1%.

Подставив известные показатели в формулу, получим 3,657%

(Х = 3,567% + 0,559% . (4,10% — 3,936%) = 3,567% + 0,559% . 0,164 = 3,567% + 0,092% = 3,657%).

 

Вы смотрели страницу - Методы изучения связи между признаками

Следующая страница  - Практическое использование выводов биометрической обработки показателей

Предыдущая страница - Методы математической обработки

Вернуться к началу страницы - Методы изучения связи между признаками

1 2 3 4 5 6 7
8

Скотный двор

Скотный двор

Животноводство

Животноводство

Справочник зоотехника-селекционера и контроль-ассистента по молочному скотоводству

Справочник зоотехника-селекционера и контроль-ассистента по молочному скотоводству

Инкубаторы

Инкубаторы

Разведение кур мясо-яичных пород

Разведение кур мясо-яичных пород

Аз-Буки-Веді тваринника

Аз-Буки-Веді тваринника

Паразитологія та інвазійні хвороби сільськогосподарських тварин

Паразитологія та інвазійні хвороби сільськогосподарських тварин

Довідник по заготівлі і зберіганню кормів

Довідник по заготівлі і зберіганню кормів

Довідник зооінженера

Довідник зооінженера

9

Скотный двор

Скотный двор

На сайте Скотный двор

Индекс цитирования.