Большинство фамилий исчезнет! Так думали аристократы в Англии почти 200 лет назад, а после подключились и математики. В результате появилось целое направление в теории случайных процессов с приложениями, далеко выходящими за рамки фамилий. Исчезнет ли все-таки ваша фамилия? И при чем тут процесс Гальтона-Ватсона и ветвящиеся процессы?
Расшифровка видео
Введение
0:00
Всем привет это Виталий Ваша фамилия
0:02
скоро исчезнет Именно этого боялись
0:05
аристократы викторианской Британии смиты
0:07
и джонсы стали вытеснять морганов и
0:09
пиколзов в Англии и уэльсе с 1901 года
0:12
исчезла 200 тысяч фамилий или Посмотрите
0:15
на Китай где фамилии появились как
0:18
всегда раньше чем в Европе на целых
0:19
3.000 лет сейчас почти полутора
0:22
миллиардном Китай у 22
0:24
% населения всего одна из трех фамилий
0:27
ли Ван Джан То есть у каждого пятого в
0:30
Китае одна из всего трех фамилий А 200
0:34
фамилий вообще покрывают 96 процентов
0:36
всего населения Китая Неужели все
0:38
фамилии скоро исчезнут и везде останутся
0:40
только Ивановы и кузнецовы математики
0:43
конечно не обошли этот вопрос стороной
0:45
появились процесс гальтона Ватсона и
0:47
ветвящиеся процессы которые оказались
0:49
полезны не только для фамилий но и для
0:52
процессов ядерных реакций передачи генов
0:54
или распространения вирусов в Советском
0:56
Союзе ветвящихся процессы были даже
0:58
засекречены какое-то время что это за
1:00
процессы Правда ли что большинство
1:02
фамилий все-таки исчезнет Что полезного
1:04
сделали математики Какие Парадокс нашли
1:06
как обычно здесь мы говорим о красоте
1:09
математики в теории и жизни не забывайте
1:12
подписываться и писать ваши комментарии
1:14
и ваши примеры ветвящихся процессов
1:17
готовы поехали
Как исчезают фамилии?
1:22
Как живут фамилии обычно фамилия
1:25
передается от отца к сыну пока есть
1:28
сыновья фамилия безопасности Но что
1:30
будет через несколько поколений Давайте
1:33
представим некоторого человека с
1:35
дворянской фамилией бобрищев Пушкин
1:37
допустим у него двое сыновей у первой из
1:41
двух сыновей один сын А у второго три То
1:44
есть во втором поколении уже 4 человека
1:46
с фамилией бобричев Пушкин считаем что
1:49
все дочери выходят замуж и не сохраняют
1:51
фамилию из всех бобричевых пушкиных во
1:54
втором поколении у двоих родилось по два
1:57
сына у одного один а еще у одного все
2:00
дочери в третьем поколении целых пять
2:03
представителей фамилии бобричев Пушкин
2:05
Но из них только у двух родилось по сыну
2:08
А у остальных опять дочери из этих двоих
2:11
сыновей только у одного родился один сын
2:13
и вот в пятом поколении снова остался
2:16
один человек мужского пола когда-то
2:19
распространенной фамилией бобричев
2:21
Пушкин
2:22
Кто знает возможно в шестом поколении
2:24
этой фамилии уже не останется когда
2:26
смотришь на вот такое развитие событий и
2:29
передача фамилии возникают два вопроса
2:30
во-первых Какая вероятность увидеть
2:33
определенное количество потомков
2:34
мужского рода в каждом поколении а
2:37
во-вторых Какая вероятность что в
2:39
конечном счете фамилия исчезнет Хороший
2:42
вопрос и как всегда полезно проверить
2:44
свою интуицию поставить на паузу и
2:46
подумать действительно А когда фамилия
2:49
должна полностью исчезнуть
Исчезновение фамилий глазами математиков
2:54
[музыка]
2:55
но Давайте теперь посмотрим на весь этот
2:58
процесс глазами математиков И как часто
3:01
делают математики сделаем несколько
3:03
допущений во-первых Будем считать что у
3:05
взрослого мужчины может быть 0 1 2 3 4 5
3:08
и так далее сыновей с некоторыми
3:09
вероятностями p0 P1 p2p3 по 4 по 5 и так
3:12
далее например вероятность того что у
3:15
человека нет сыновей равна p0
3:16
вероятность того что у человека три сына
3:18
P3 причем эти вероятности одинаковы для
3:22
каждого мужчины в каждом поколении То
3:24
есть получается некоторые случайная
3:26
величина X которая принимает
3:28
неотрицательные значения с заданными
3:31
вероятностями во-вторых в каждом
3:33
поколении для каждого мужчины Икс
3:35
принимает определенные значения назовем
3:37
их xn например в нашем примере С обречем
3:42
Пушкина в нулевом поколении нулевое
3:44
первое равно единице в первом поколении
3:46
X 1 1
3:47
2 равно 3 так как у второго сына три
3:51
сына причем считаем что X это
3:54
независимые одинаково случайной величины
3:57
то есть количество сыновей у каждого
3:59
мужчины не зависит от количества сыновей
4:01
у других мужчин что в принципе логично А
4:04
вероятности рождения мальчиков у всех
4:06
одинаково наконец нужна еще одна
4:08
случайная величина назовем ее zn Это
4:11
суммарное количество сыновей в n-ом
4:13
поколении причем начинаем всегда с
4:15
одного человека поэтому Z нулевое равно
4:18
единице Давайте еще раз посмотрим на
4:20
бобричевых пушкинах Z нулевой равно
4:23
единице в первом поколении Z1 равно
4:25
количеству сыновей у мужчин в нулевом
4:27
поколении во втором поколении Z2 это
4:30
сумма количества сыновей у мужчин из
4:33
первого поколения в третьем поколении Z3
4:36
равно сумме количество сыновей мужчины
4:39
второго поколения и так далее
4:44
что можно заметить чтобы посчитать
4:46
количество людей мужского пола в
4:49
следующем поколении N + 1 то есть zn + 1
4:51
нужно посчитать количество сыновей у
4:54
мужчин из предыдущего поколения N А
4:57
количество таких мужчин предыдущем
4:59
поколении N как раз равно zn То есть
5:02
получается некоторые случайный процесс
5:04
который начинается с единицы и в котором
5:07
значение в каждом следующем поколении
5:10
это сумма нескольких случайных величин
5:13
причем количество слагаемых равно
5:15
значению процессов предыдущем поколении
5:18
этот процесс называется процессом
5:21
гальтона Ватсона Поэтому чтобы узнать
5:24
вероятность вырождения фамилии
5:26
достаточно всего-навсего хорошо
5:27
прочувствовать и понять как устроен
5:30
такой процесс процесс гальта на Ватсона
5:32
стал началом более общих процессов
5:34
придуманных колмогоровым на которых мы
5:36
скоро дойдем а для начала Давайте
5:39
посмотрим как вообще возник этот процесс
Процесс Гальтона-Ватсона. Начало
5:44
[музыка]
5:45
19 век прекрасная Эпоха Франции и
5:50
викторианская Англия Эпоха колонизации
5:52
аристократии в то время фамилиями
5:55
дорожили всерьез волновались что простые
5:57
фамилии захватят мир и всерьез
5:59
переживали за сохранение фамилии
6:01
потомков на самом деле процесс гальтона
6:03
Ватсона часто называют процессом
6:05
гальтона Ватсона первыми вопросы
6:07
исчезающих фамилии стали изучать
6:09
французы еще в 1845 году Ирине
6:13
жульбинами опубликовал небольшую работу
6:15
а законе умножения и продолжительности
6:17
жизни семей в котором впервые задался
6:19
вопросом исчезновения фамилии даже вывел
6:21
первые наблюдения в зависимости от
6:23
среднего количества сыновей но его
6:25
работа осталась незамеченной и через 30
6:28
лет задачей решения переоткрыли снова
6:30
Правда уже в Британии 1773 году
6:33
британский исследователь статистик
6:36
Географ психолог человек придумавший
6:38
термин евгеника разработавший метод
6:40
использования отпечатков пальцев
6:41
криминалистике двоюродный брат Чарльза
6:44
Дарвина лондонского королевского
6:45
общества кто угодно но не математик сэр
6:48
Фрэнсис гальтон опубликовал в
6:51
образовательном журнале задачу под
6:52
номером 4001 который спрашивал про Общее
6:56
решение задачи исчезновения фамилии а
6:58
читатели правда удовлетворительного
7:00
ответа он не получил поэтому попросил
7:03
найти решение своего друга математика
7:05
Генри Уильяма Ватсона и уже вместе
7:08
гальтоне Ватсон в 1875 году опубликовали
7:11
статью о вероятности исчезновения
7:13
фамилий в статье был математически
7:15
описан сам процесс и посчитано
7:17
вероятность исчезновения фамилии правда
7:20
посчитана с небольшой ошибкой тем не
7:24
менее начало новой области случайных
7:26
процессов было положено но когда же
7:28
все-таки исчезнут фамилии
Вероятность вырождения
7:32
[музыка]
7:34
вспомним что процесс гальт инновационна
7:37
это вот такая сумма случайных величин
7:39
поэтому для финального вымирания фамилии
7:41
нужно найти Вероятность того что zn
7:43
равняется нулю при бесконечном росте N
7:46
ключевую роль здесь играет среднее
7:49
количество сыновей у каждого мужчины
7:50
если помните мы говорили что X это
7:54
случайная величина которая равна
7:55
количеству сыновей у одного мужчины
7:57
причем эти количества получается с
8:00
некоторыми заданными вероятностями p01
8:02
P2 и так далее так вот среднее
8:05
количество сыновей обозначим его через М
8:07
это математическое ожидание этой самой
8:10
величины X или что то же самое сумма
8:12
произведений вероятностей на значение
8:14
теперь используя эту величину м есть два
8:18
варианта есть простой и еще более
8:20
простой ответ на вопрос когда же
8:23
все-таки происходит исчезновение фамилии
8:25
более простой ответ Следующий все
8:27
зависит от значения M если среднее
8:30
сосновей меньше единицы то вероятность
8:33
вырождения фамилии равна единице то есть
8:36
вырождения когда-то точно произойдет что
8:38
достаточно интуитивно согласитесь если
8:41
среднее количество сыновей больше
8:43
единицы м больше единицы то вероятность
8:45
вырождения уже не единица а некоторое
8:47
число от 0 до единиц То есть вырождение
8:49
может произойти но уже с некоторой
8:51
вероятностью другими словами появляется
8:53
шанс на Бесконечное сохранение фамилии
8:56
наконец если м равно единице то есть
8:59
среднее количество сыновей равно единице
9:01
как думаете что получается В таком
9:03
случае фамилия исчезнет или нет
9:07
ответ кому-то может показаться очень
9:09
интуитивно но давайте так пишите в
9:12
комментариях ваши версии А через 31 день
9:14
4 часа и 15 минут после публикации этого
9:16
видео сделаю пост с правильным ответом А
9:19
пока Давайте проверим вашу интуицию если
9:21
среднее количество сыновей у каждого
9:24
мужчины равно единице его фамилия
9:26
когда-либо исчезнет или нет Как думаете
9:31
Какая вероятность кто-то скажет но как
9:33
это посчитать опять одна вода все
9:36
поверхностно нет никакого
9:37
математического обоснования что ж
9:39
во-первых мы здесь про красоту
9:41
математики и на пальце и можно открыть
9:44
несколько ссылок под этим видео чтобы
9:46
сразу погрузиться в десятки теоремы
9:48
строго обоснования теории ветвящих
9:51
процессов а во-вторых одну идею
9:54
доказательства и работы с процессом
9:55
гальта на Ватсона мы все-таки обсудим
9:57
математике иногда очень хитрые люди или
10:00
изворотливые А может быть просто
10:02
креативные что часто сильно помогает
10:04
вместо того чтобы решать задачу напрямую
10:07
в лоб нужно придумать какой-то красивый
10:10
способ или инструмент чтобы сильно
10:13
упростить жизнь для процесса гальтона
10:15
Ватсона такой инструмент производящая
10:17
функция как всегда этот инструмент сам
10:20
по себе заслуживает отдельного видео Но
10:22
если вкратце Ключевая идея это переход
10:25
от некоторой последовательности чисел в
10:28
данном случае вероятностей к степенному
10:30
ряду зачем это нужно степенные ряды
10:34
изучают уже сотни лет есть хороший
10:36
аппарат алгебры и мат анализы это как
10:38
перевод на другой язык вместо того чтобы
10:40
решать задачи на языке вероятностей
10:42
Давайте переведем все на язык мат
10:44
анализа найдем решение на понятном языке
10:46
а после переведем его обратно на язык
10:49
вероятности много текста Давайте более
10:51
конкретно держитесь Это ненадолго пусть
10:55
же это производящая функция
10:57
вероятностного распределения p0 P1 P2 и
11:00
так далее
11:01
пусть же энергии это производящая
11:04
функция для nного поколения тогда
11:07
оказывается что производящая функция N +
11:09
1 поколения в точке Z это производящая
11:12
функция в точке GN от Z
11:16
вероятность исчезновения всех потомков в
11:19
n-ом поколении равна первому слагаемому
11:21
в производящей функции же n/z то есть
11:25
qn равняется же N в нуле
11:28
Кроме того вероятность исчезновения всех
11:31
потомков в N + 1 поколении равняется
11:34
производящей функции N + 1 поколения в
11:37
нуле
11:38
равняется используя нашу формулу выше
11:41
производящей функции в точке GN в нуле а
11:47
жмя в нуле равняется коэнному То есть
11:49
это значение равняется производящее
11:51
функции в точке
11:53
qn так как монотонно возрастает это
11:56
величина только увеличивается так как
11:58
добавляются все новые слагаемые и
12:00
понятное дело ограниченные единицы
12:01
поэтому существует некоторый предел
12:04
коэнного равной
12:06
если перейти к пределу выражении с
12:10
производящей функции получим что Q
12:13
равняется же в точке Q напомню Это и
12:18
есть вероятность исчезновения фамилии
12:20
Так что осталось всего лишь решить это
12:23
уравнение чтобы найти ответ один корень
12:26
равняется
12:28
собственно Ватсон как раз здесь я ошибся
12:31
думаю что это есть единственный корень
12:33
этого уравнения
12:35
Q равна единица означает что вероятность
12:36
вырождения равна единице и только через
12:39
50 лет Фишер холдейн и штеффинсон поняли
12:43
что есть и другой корень меньше единицы
12:45
при условии что среднее количество
12:47
сыновей больше единицы Но как это
12:51
применить ответ зависит от распределения
12:53
вероятностей количества сыновей p0 P1 P2
12:57
и так далее на их основе строится
12:59
производящая функция и находится корень
13:02
уравнения Q равняется производящая
13:04
функция в точке Q Например если считать
13:07
что у каждого мужчины может быть от 0 до
13:09
5 сыновей с одинаковой вероятностью
13:11
вероятность вырождения Получается
13:13
примерно 21 процент или если вероятности
13:17
задаются посоновским распределениям
13:19
напоминаю про видео кто еще не смотрел
13:21
или уже забыл для поласонского
13:24
распределения также строится
13:25
производящая функция а дальше уже как
13:27
говорится дело техники найти решение
13:29
уравнения в зависимости от параметра
13:31
лямбда вероятность будет разная например
13:33
при
13:35
лямбда равном 1,2 вероятность вырождения
13:38
получается около 69 процентов или еще
13:42
пример в 1931 году американским
13:44
математик Альфред лодка посчитал
13:46
вероятность исчезновения фамилий на
13:48
основе реальных данных Соединенных
13:49
Штатов он вывел что вероятности задаются
13:53
Вот такими значениями поэтому
13:55
вероятность исчезновения фамилий равна
13:57
примерно 82 процента то есть с
14:01
вероятностью 82 процента фамилия
14:04
исчезает только Задумайтесь это очень
14:06
большая вероятность но Неужели все так
14:09
плохо и фамилии действительно исчезнут в
14:13
чем вообще польза этого процесса гальд и
14:15
на Ватсона
Плюсы и минусы процесса Гальтона-Ватсона
14:18
на самом деле есть хороший и плохие
14:21
новости про процесс гальтона Ватсона
14:23
начнем с плохих процесс гальтона Ватсона
14:27
бесполезен для расчета вероятности
14:29
исчезновения фамилии в реальности Да мы
14:32
видели что можно смоделировать разные
14:34
результаты даже на реальных данных в
14:37
Штатах мы получили какие-то разумные
14:39
результаты Но на самом деле как и с
14:42
Любой моделью процесс гальд инноваций на
14:44
это всего лишь приближение есть еще
14:46
много факторов которые влияют на
14:48
передачу фамилии из поколения в
14:50
поколение люди могут менять свои фамилии
14:52
или брать новые фамилии например фамилии
14:56
известных людей фамилии дочерей могут
14:58
сохраняться при замужестве и еще много
14:59
причин мир намного сложнее но есть и
15:03
хорошая новость процесс Галька на
15:05
Ватсона стал первым среди целого класса
15:07
процессов которые называются ветвящимися
15:10
процессами их приложение далеко выходит
15:13
за рамки расчета исчезновения фамилии
Ветвящиеся процессы
15:18
понятие ветвящейся процесс было
15:21
предложено Андреем николаевичем
15:22
колмогором еще в 1947 году в том же году
15:25
стали появляться похожие исследования в
15:27
США и как это не удивительно работы по
15:30
ветвящимся процессам в Советском Союзе
15:32
засекретили как И за что можно
15:34
засекретить работы по математике причем
15:37
Это не криптография с секретными шифрами
15:39
это теория случайных процессов все
15:42
оказалось намного проще с помощью
15:43
ветвящихся процессов строилась модель
15:46
цепной реакции А как вы помните на
15:48
рубеже 40 и 50-х как раз активно
15:50
создавались атомные бомбы в итоге у
15:53
аспиранта Колмогорова Борис Севастьянова
15:55
засекретили почти половину диссертации А
15:58
все последующие пять лет они строили
15:59
более сложные модели процессов только в
16:03
тетради которые выдавали в миане утром а
16:05
в конце дня забирали и забирали в сейф в
16:08
конце концов всему этому наступил конец
16:10
и работа над ветвящимися процессами
16:12
снова стала доступной всему миру процесс
16:16
инноваций на был только началом
16:17
появились более сложные но все еще
16:20
ветвящиеся процессы например процесс
16:23
белмана Харриса где каждая частица
16:25
независимо от остальных живет случайное
16:27
время распределенное по некоторым закону
16:28
процесс Севастьянова для которого помимо
16:32
прочего еще и производящая функция
16:34
распределения количества потомков
16:35
зависит от времени жизни частицы процесс
16:38
крампа мода ягерца с помощью которого
16:41
можно предсказать возрастную структуру
16:43
населения по сути это модель описывает
16:45
Частицы которые живут случайное время и
16:47
могут неоднократно порождать случайное
16:49
количество потомков есть еще много
16:51
обобщений когда частицы разного типа
16:53
когда потомков бесконечно много когда
16:56
есть вечная частица разные типы
16:58
дискретных и непрерывных летящихся
17:00
процессов для всех этих процессов
17:02
изучается Когда и как наступает
17:05
вероятность вырождения Какова
17:07
вероятность экспоненциального роста как
17:09
работают предельные теоремы Как устроено
17:11
поведение исходимость процессов на
17:13
бесконечности но самый главный вопрос
17:15
Зачем Что все-таки полезного в этих
17:19
ветвящихся процессах
Зачем нужны ветвящиеся процессы?
17:24
про одно приложение я уже говорил модель
17:26
цепной реакции в основе атомного
17:29
реактора лежит ядерная реакция
17:30
размножения нейронов если Цепная реакция
17:33
развивается экспоненциально то будет не
17:35
очень хорошо а ветвящийся процесс
17:37
позволяет моделировать и контролировать
17:39
всю систему эпидемия и Как
17:41
распространяются вирус особенно на
17:43
начальных этапах тоже хорошо описывается
17:45
ветвящимися процессами для эпидемии есть
17:48
еще и другая модель SR Посмотрите кто
17:50
еще не видел станет Понятно зачем нужны
17:53
изоляции маски причем тут
17:55
дифференциальные уравнение еще один
17:57
пример мутация генов и как Гены и
18:01
хромосомы передаются из поколения в
18:03
поколение обобщенные ветвящиеся процессы
18:05
это еще одна из моделей численности
18:08
всего населения А как вы помните
18:11
вопросом численности стали заниматься
18:13
уже давно некоторые даже думали
18:16
уничтожить половину всего населения
18:18
чтобы всех спасти Не забывайте
18:20
посмотреть про это тоже если еще не
18:22
видели кроме этого ветвящиеся процес
18:24
активно используется как инструмент во
18:27
многих теориях таких как теория
18:30
массового обслуживания теория алгоритмов
18:32
теория случайных отображений или теория
18:34
просачивания да-да есть и такие теории
18:38
как обычно Впереди еще много видео и
18:41
много непокрытых тем про красоту
18:43
математики теорию и приложению В общем
18:45
как видите много приложений ветвящихся
18:49
процессов Вот такая непростая и
18:52
практичная теория началась простого
18:55
вопроса об исчезающих фамилиях
Три вывода
19:01
Какие три вывода можно сделать из всей
19:03
этой истории во-первых исчезнет ли Ваша
19:06
фамилия математическая модель процесс
19:08
гальтона Ватсона говорит что с
19:10
вероятностью 80 процентов исчезнет но
19:14
как обычно реальность намного сложнее
19:16
фамилия передаются более сложным путем
19:18
поэтому не все так печально Ваша фамилия
19:21
может и останется особенно если вы
19:24
Иванова или Кузнецов во-вторых сам
19:26
процесс гальд инновацийна это простой но
19:29
Достаточно мощный инструмент для
19:31
моделирования эволюции частиц в
19:33
зависимости от среднего количества
19:35
потомков в каждом поколении этот процесс
19:37
вырождается или развивается бесконечно А
19:40
что происходит когда среднее число
19:42
потомков равно единицы Пишите в
19:44
комментариях ответ будет через 31 день
19:47
после публикации Не пропустите наконец
19:49
в-третьих из процесса гальта на Ватсона
19:52
родилась целое направление ветвящиеся
19:55
процессы эти процессы описывают
19:57
различные схемы продолжительности жизни
19:59
частиц и распределения потом что Полезно
20:02
не только в различных жизненных
20:04
приложениях физики в биологии но и в
20:07
других областях математики например в
20:09
теории массового обслуживания Как часто
20:11
бывает в математике безобидные и на
20:13
первый взгляд понятны всем вопрос может
20:15
привести к новым сложным направлениям
20:18
математикам только дай волю они всего
20:20
сделают функциональные пространства и
20:22
обобщенные случайные процессы думайте и
20:25
наслаждайтесь красотой математики
20:27
увидимся пока