face

Наблюдения с серьёзным лицом, выпуск 2

Продолжение серии, рассказывающей о забавных философских, антропологических, социологических и других принципах, с первого взгляда кажущихся всего лишь упражнениями в острословии, но обладающих эмпирической справедливостью и в некоторой степени серьёзным значением.

Эмпирический закон Бенфорда гласит, что во многих, хотя и не во всех, больших массивах числовых данных об окружающей действительности первые цифры чисел будут встречаться не равновероятно: чаще всего, в около 30% случаев, первой цифрой будет единица, далее цифры встречаются с убывающей частотой вплоть до девятки, с которой начинаются менее, чем 5% чисел. Возьмите высоты городских зданий (в любых единицах измерения), численности населения стран, доходы налогоплательщиков — такие данные чаще всего довольно точно подчиняются закону Бенфорда. Закон нетрудно объяснить в случае, когда логарифм величины распределён равномерно, но он, как ни странно, выполняется и во многих других случаях. Как это часто бывает, закон, сформулированный в 1938 году Фрэнком Бенфордом (Frank Benford), впервые обнаружил ещё в 1881 астроном Саймон Ньюкомб (Simon Newcomb) — он заметил, что первые страницы сборников логарифмических таблиц, содержавшие данные для чисел, начинающихся с единицы, изнашивались сильнее других.

Закон Паркинсона: Работа заполняет время, отпущенное на неё. Сформулировав этот весьма правдивый закон в качестве шутки, Сирил Норткот Паркинсон (Cyril Northcote Parkinson), похоже, наткнулся на какую-то фундаментальную закономерность, всевозможные проявления которой с тех пор получили отдельные названия. Дуглас Хофштадтер (Douglas Hofstadter) сформулировал рекурсивный закон Хофштадтера: Любое дело всегда длится дольше, чем ожидается, даже если учесть закон Хофштадтера. Закон Рёмера, согласно которому при застрахованном населении, каждая построенная больничная койка будет занята (Мильтон Рёмер — Milton Roemer), на самом деле взят на вооружение в США при планировании системы здравоохранения. Закон Виртапрограммы становятся медленнее быстрее, чем компьютеры становятся быстрее (Никлаус Вирт — Niklaus Wirth) — похоже, всего лишь частное проявление парадокса Джевонса: повышение эффективности технологии, потребляющей некоторый ресурс, обычно приводит к росту, нежели к падению, потребления этого ресурса (Вильям Стенли Джевонс — William Stanley Jevons). Если за всеми этими явлениями стоит нечто общее, то этому общему правилу ещё предстоит быть открытым и названным чьим-то именем.

Эффект Джин Диксон, названный так в честь американской предсказательницы Джин Диксон (Jeane Dixon), заключается в том, что, если делать большое количество предсказаний будущего, то некоторые из них окажутся верными, после чего внимание публики можно привлечь именно к этим случаям, забывая о множестве несбывшихся пророчеств.

Парадокс навигации: увеличение точности средств навигации может вести к повышению риска столкновений. До широкого распространения технологии GPS, суда и самолёты следовали по случайным траекториям, лишь приблизительно соответствовавшим расчётным. Как ни странно, когда навигационная электроника позволила придерживаться «идеальных» траекторий, столкновения участились. Сегодня пилотам во избежание несчастных случаев рекомендуется держаться на милю-другую правее центровой линии воздушного коридора.

Теорема Томаса, сформулированная в 1928 году Вильямом Томасом (William Thomas): Когда люди воспринимают ситуацию как реальную, она имеет реальные последствия. Классический пример: ложные слухи о банкротстве банка могут побудить множество вкладчиков снимать средства со своих счетов, что в итоге и в самом деле приводит банк к банкротству. Согласно теории конкурса красоты Джона Кейнса (John Keynes), цены акций зависят не столько от их реальной оценки игроками на рынке, сколько от их оценки того, как, по их мнению, оценят те же акции другие игроки.

In English: Observations with a Straight Face, issue 2
Добавление. Закон Бенфорда - это следствие законов роста. Квадратичный и гиперболический рост (ресурс, население) дают именно такое распределение первых цифр десятичной записи. Хорошо исследовано Арнольдом.

P.S. Леша, не останавливайся, пиши еще, каждый раз с удовольствием читаю. :beer:
Мне даже что-то смутно помнится, что во втором томе Кнута про единицу тоже было. Дома надо будет посмотреть.
А вот ещё если взять номера версий всех программных продуктов, релизы которых произошли за год, то наверняка то же самое получится.

Спасибо! Рад стараться.
> номера версий всех программных продуктов

это, наверное, потому что до девятой версии мало кто доживает? )))
Провёл эксперимент: взял версии всех доступных в Debian пакетов и посчитал.
$ awk '$1=="Version:"{print substr($2,1,1)}' /var/lib/apt/lists/* | sort | uniq -c
  34936 0
  33844 1
  17037 2
   6014 3
   4939 4
   1801 5
   1019 6
    648 7
    451 8
    495 9
      6 G
Итак, в процентах:

0123456789
34.53%33.45%16.84%5.94%4.88%1.78%1.01%0.64%0.45%0.49%



Edited at 2011-05-23 06:18 pm (UTC)
Крутотенюшка! На досуге можно собрать побольше данных и посмотреть какая кривая аппроксимирует это счастье лучше. Вах, ты сделал мой вечер!
Легко измеримые вещи: размеры файлов на диске, число файлов в каждой директории, длины строк в программном коде, число ревизий в истории каждого файла в большом проекте, длины URL в истории браузера.
Я даж видел где-то краем глаза, как измеряли какие-то параметры небесных тел, доказывая что между ними есть связь и распределение неслучайное. ИМХО, красивое доказательство.
Ну, физики плюются, а математики говорят (и правильно), что отсутствие равномерного распределения может иметь кучу причин.

Те ребята, насколько я понимаю, хотели по-быстрому проверить а стоит ли вообще там копать, есть ли там что-то. В качестве блиц-ответа на такой вопрос для самого себя - что ж, фиг с ним. Но публиковать, конечно, не стоило.
Вспомни какое-нибудь дело за недавнее время, которое ты начала делать совсем близко к дедлайну и в результате успела впритык. Представь себе, что ты начала бы делать его раньше, так, чтобы времени до дедлайна оставалось в два раза больше. Самый правдоподобный вариант — дело всё равно продолжается вплоть до дедлайна и завершается впритык, хотя, возможно, и с меньшими нервами. Об этом и закон Паркинсона: какой бы запас времени ни был отведён, дело займёт его полностью.

Я думаю, что фундаментальная причина прокрастинации в том и заключается, что мы интуитивно знаем закон Паркинсона. Если сейчас развлечься, то потом ещё можно будет успеть сделать дело. Если же сейчас засесть за дело, оно займёт всё доступное время, и развлечься не получится. Конечно же, первый вариант привлекательнее!
Неужели и в студенческие годы никогда не откладывала всякие там курсовые работы на последнее?
Уникальный случай! А я смутно помил, что байку о существовании одного такого студента опровергли MythBusters…
ПАРАДОКС НАВИГАЦИИ.
Риск столкновений увеличивается из-за очень низкой подготовки штурманского
состава на иностранном флоте, расхлябанности и распиздяйства. Несколько
раз ловил штурманов на том, что они в процессе своей ходовой вахты покидали
капитанский мостик. Это на балкере водоизмещением 100 тысяч тонн. Никто
не подсчитывал сколько штуманов "газ в сиську" одновременно стоит на ходовой
вахте на мировом флоте. Сколько кретинов-самоубийц подвергают своими маневрами другие суда опасности столкновения. Если GPS NAVIGATION выйдет
из строя - иностранный флот остановится. Их штурмана не умеют определять
место судна старыми методами. Это будет полный "абзац". Классная тема.:)
Re: ПАРАДОКС НАВИГАЦИИ.
Допустим, это объясняет столкновения в море, ну а как же самолёты? Ведь пилоты не пьют.
Re: ПАРАДОКС НАВИГАЦИИ.
Виртуозность пилотов сдерживается и координируется диспетчерской службой
аэропортов, которые обеспечивают их корридорами и высотами в направлении
движения. Это глобальная диспетчерская сеть движения самолетов. Точность
определения места GPS NAVIGATION - круг диаметром 20 метров. Точность
определения места с помощью авиационного секстана - круг диаметром
10 nautical miles. Разница - поражает воображение. Для малых самолетов
есть запасной вариант опредение места - путем опроса местного населения.
Что бы не говорили о столкновениях в воздухе - это чрезвычайно малый
мизер по сравнению с мировым флотом - в этом виноват диспетческий аппарат
аэропортов и системы слежения за перемещением воздушных судов. Удачи :)
Re: ПАРАДОКС НАВИГАЦИИ.
Значит, если заблудился в воздухе на маленьком самолёте, нужно высунуть голову из кокпита и спросить народ, где я нахожусь. Буду иметь в виду.
Re: ПАРАДОКС НАВИГАЦИИ.
Это самый надежный способ определения места любого судна. Смешно, но факт:)
Из всех законов
Закон Паркинсона: Работа заполняет время, отпущенное на неё. Сформулировав этот весьма правдивый закон в качестве шутки, Сирил Норткот Паркинсон (Cyril Northcote Parkinson), похоже, наткнулся на какую-то фундаментальную закономерность, всевозможные проявления которой с тех пор получили отдельные названия.
вот этот мне больше всего понравился!
Re: Из всех законов
Я думаю, этот закон особенно близок тем, кто работает дома.
Большинство из этого я сам замечал, но всё равно: пиши еще :)

А вот еще довесок:
Чем короче путь, тем сильнее опаздываешь.
(наверняка уже сотни людей сформулировали и назвали своим именем :D )
И вариация:
Чем меньше работы, тем дольше просрочка (уж точно в процентном соотношении к запланированному времени)