Распределение Юла – Саймона - Yule–Simon distribution

Юл – Саймон
Вероятностная функция масс
Сюжет о ПМП Юла – Саймона
PMF Юла – Саймона в логарифмическом масштабе. (Обратите внимание, что функция определена только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.)
Кумулятивная функция распределения
Сюжет CMF Юла – Саймона.
Юла – Саймона CMF. (Обратите внимание, что функция определена только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.)
Параметры форма (настоящий )
Поддерживать
PMF
CDF
Иметь в виду за
Режим
Дисперсия за
Асимметрия за
Бывший. эксцесс за
MGF
CF

В вероятность и статистика, то Распределение Юла – Саймона это дискретное распределение вероятностей названный в честь Удный Йоль и Герберт А. Саймон. Саймон изначально называл это Распределение Йоля.[1]

В функция массы вероятности (pmf) Юла – Саймона (ρ) распределение

за целое число и настоящий , куда это бета-функция. Эквивалентно PMF можно записать в терминах возрастающий факториал в качестве

куда это гамма-функция. Таким образом, если целое число,

Параметр можно оценить с помощью алгоритма с фиксированной точкой.[2]

Функция массы вероятности ж обладает тем свойством, что при достаточно больших k у нас есть

График распределения Юла – Саймона (1) (красный) и его асимптотический закон Ципфа (синий)

Это означает, что хвост распределения Юла – Саймона является реализацией Закон Ципфа: можно использовать для моделирования, например, относительной частоты -е самое частое слово в большом наборе текста, который согласно закону Ципфа обратно пропорциональный до (обычно небольшой) степени .

Вхождение

Распределение Юла – Саймона возникло первоначально как предельное распределение определенного случайный процесс изучен Юлом как модель распределения биологических таксонов и субтаксонов.[3] Саймон назвал этот процесс «Святочным процессом», но сегодня он более известен как преференциальная привязанность процесс.[нужна цитата ] Процесс льготного прикрепления - это урна процесс в котором шары добавляются к растущему количеству урн, каждый шар распределяется по урне с вероятностью, линейной по количеству, которое уже содержится в урне.

Распределение также возникает как составное распределение, в котором параметр геометрическое распределение рассматривается как функция случайной величины, имеющая экспоненциальное распределение.[нужна цитата ] В частности, предположим, что следует экспоненциальному распределению с шкала или оценить :

с плотностью

Тогда распределенная переменная Юла – Саймона K имеет следующее геометрическое распределение при условии W:

ПДС геометрического распределения равна

за . Тогда PMF Юла – Саймона представляет собой следующее составное экспоненциально-геометрическое распределение:

В оценщик максимального правдоподобия для параметра учитывая наблюдения является решением уравнения с неподвижной точкой

куда - параметры скорости и формы гамма-распределение до .

Этот алгоритм разработан Гарсией. [2] путем прямой оптимизации вероятности. Робертс и Робертс [4]

обобщить алгоритм на Байесовский настройки с составной геометрической формулой, описанной выше. Кроме того, Робертс и Робертс [4] могут использовать Максимизация ожиданий (EM), чтобы показать сходимость алгоритма с фиксированной точкой. Более того, Робертс и Робертс [4] вывести сублинейность скорости сходимости для алгоритма с фиксированной точкой. Кроме того, они используют формулировку EM, чтобы дать 2 альтернативных вывода стандартной ошибки оценки из уравнения с фиксированной точкой. Дисперсия оценщик

в стандартная ошибка - квадратный корень из количества этой оценки, деленного на N.

Обобщения

Двухпараметрическое обобщение исходного распределения Юла заменяет бета-функцию на неполная бета-функция. Вероятностная функция масс обобщенного Юла – Саймона (ρ, α) распределение определяется как

с . За обыкновенный Юла – Саймона (ρ) распределение получается как частный случай. Использование неполной бета-функции приводит к экспоненциальному ограничению в верхнем хвосте.

Смотрите также

Библиография

  • Колин Роуз и Мюррей Д. Смит, Математическая статистика в системе Mathematica. Нью-Йорк: Спрингер, 2002 г., ISBN  0-387-95234-9. (См. Стр. 107, где это называется «Святочная раздача».)

Рекомендации

  1. ^ Саймон, Х.А. (1955). «Об одном классе функций косого распределения». Биометрика. 42 (3–4): 425–440. Дои:10.1093 / biomet / 42.3-4.425.
  2. ^ а б Гарсия Гарсия, Хуан Мануэль (2011). «Алгоритм с фиксированной точкой для оценки параметра распределения Юла-Саймона». Прикладная математика и вычисления. 217 (21): 8560–8566. Дои:10.1016 / j.amc.2011.03.092.
  3. ^ Юл, Г. У. (1924). "Математическая теория эволюции, основанная на выводах доктора Дж. К. Уиллиса, F.R.S". Философские труды Королевского общества B. 213 (402–410): 21–87. Дои:10.1098 / рстб.1925.0002.
  4. ^ а б c Робертс, Лукас; Робертс, Дениса (2017). «Рамки максимизации ожиданий для предпочтительных моделей привязанности». arXiv:1710.08511 [stat.CO ].