Si el PDF de distribución de $ x $ es $ PDF_X $ y existe una relación matemática entre $ y $ y $ x $:
$$ y = f (x) $$
¿Es posible encontrar $ PDF_Y $?
Si es así, ¿cómo calcularlo?
Si el PDF de distribución de $ x $ es $ PDF_X $ y existe una relación matemática entre $ y $ y $ x $:
$$ y = f (x) $$
¿Es posible encontrar $ PDF_Y $?
Si es así, ¿cómo calcularlo?
Para una función general $ h $, no existe una fórmula directa para obtener el pdf de la variable aleatoria $ Y = h (X) $ conociendo el pdf de $ X $. Hay una fórmula en caso de que $ h $ sea un mapeo uno a uno diferenciable del rango (el soporte , debería decir) de $ X $ al rango de $ Y $. Supongo que por tu pregunta no conoces esta fórmula, así que déjame darte la imagen y el proceso para derivarla.
Toma, por ejemplo, una variable aleatoria $ X \ sim {\ cal N} (\ mu, \ sigma ^ 2) $ y establezca $ Y = \ exp (X) $. La siguiente animación muestra algunas simulaciones de $ X $ y los valores correspondientes de $ Y $. La densidad de $ X $ se muestra en azul y la de $ Y $ se muestra en naranja en la dirección vertical.
Ahora la pregunta es: conociendo la densidad $ f _ {\ textrm {azul}} $ de $ X $, ¿cuál es la densidad $ f _ {\ textrm {naranja}} $ de $ Y $?
Tomando un punto $ y $ en el rango de $ Y $, la densidad $ f _ {\ textrm {orange}} $ proporciona la probabilidad de que $ Y $ pertenezca a un área pequeña $ \ mathrm {d } y $ alrededor de $ y $ por la fórmula $$ \ Pr (Y \ in \ mathrm {d} y) \ approx f _ {\ textrm {naranja}} (y) | \ mathrm {d} y | $$ donde $ | \ mathrm {d} y | $ denota la longitud del intervalo pequeño $ \ mathrm {d} y $. Esta probabilidad es el área rosada de la siguiente figura.
La probabilidad $ \ Pr (Y \ in \ mathrm {d} y) $ también es igual a la probabilidad $ \ Pr (X \ in \ mathrm {d} x) $, mostrado por el área gris debajo de la curva azul, donde $ x = \ log (y) $ debido a $ y = \ exp (x) $, y $ \ mathrm {d} x $ es el pequeño intervalo alrededor de $ x $. Esta probabilidad está dada por $$ \ Pr (X \ in \ mathrm {d} x) \ approx f _ {\ textrm {blue}} (x) | \ mathrm {d} x |. $$ Está claro que $ | \ mathrm {d} x | \ neq | \ mathrm {d} y | $. Recuerde que estas dos longitudes son muy pequeñas, por lo tanto, la función verde (llamémosla $ h $ en lugar de $ \ exp $) es como un segmento en el intervalo $ \ mathrm {d} x $, y la pendiente de este segmento es el valor $ h '(x) $ de la derivada de $ h $ en $ x $. Por lo tanto $ | \ mathrm {d} y | \ approx h '(x) | \ mathrm {d} x | $, y finalmente obtenemos $$ \ Pr (Y \ in \ mathrm {d} y) = \ Pr (X \ in \ mathrm {d} x) \ approx f _ {\ textrm {azul}} (x) \ frac {| \ mathrm {d} y |} {h '(x)}. $$ Expresando el lado derecho en términos de $ y = h (x) $ en lugar de $ x = h ^ {- 1} (y) $, esto da $$ \ Pr (Y \ in \ mathrm {d} y) \ approx f _ {\ textrm {azul}} \ bigl (h ^ {- 1} (y) \ bigr) \ frac {| \ mathrm {d} y |} {h '\ bigl (h ^ {- 1 } (y) \ bigr)}, $$ o, debido a $ \ frac {1} {h '\ bigl (h ^ {- 1} (y) \ bigr)} = {(h ^ {- 1}) } '(y) $, esto se puede escribir $$ \ Pr (Y \ in \ mathrm {d} y) \ approx {(h ^ {- 1})}' (y) \ times f _ {\ textrm {azul }} \ bigl (h ^ {- 1} (y) \ bigr) | \ mathrm {d} y |. $$ Al identificar esta fórmula por la que define la densidad de $ Y $: $$ \ Pr (Y \ en \ mathrm {d} y) \ approx f _ {\ textrm {naranja}} (y) | \ mathrm {d} y |, $$ finalmente obtenemos $$ \ boxed {f _ {\ textrm {naranja}} (y ) = {(h ^ {- 1})} '(y) \ times f _ {\ textrm {blue}} \ bigl (h ^ {- 1} (y) \ bigr)}. $$ Este es el llamada fórmula de cambio de variables .
Tenga cuidado con un punto: esta fórmula no es correcta en general. En mi ejemplo, el factor $ k $ relaciona $ | \ mathrm {d} x | $ y $ | \ mathrm {d} y | $ por la igualdad aproximada $ | \ mathrm {d} y | \ approx k | \ mathrm {d} x | $ is $ k = h '(x) $ porque $ h' (x) >0 $ en este ejemplo ($ h $ está aumentando), y uno tiene que tomar $ -h '(x) $ si $ h' (x) <0 $. La fórmula general incluye el valor absoluto: $$ \ boxed {f _ {\ textrm {naranja}} (y) = \ bigl | {(h ^ {- 1})} '(y) \ bigr | \ times f _ {\ textrm {azul}} \ bigl (h ^ {- 1} (y) \ bigr)}. $$
Suponga que $ X $ tiene una distribución normal estándar, entonces el pdf de $ X $ es $ f (x) = \ frac {1} {\ sqrt {2 \ pi}} e ^ {- \ frac {1} { 2} x ^ 2} $
Suponga que la relación matemática entre la variable aleatoria $ Y $ y $ X $ es $ Y = 2X $. Será fácil encontrar el pdf de $ Y $.
Básicamente hay dos métodos para encontrar el pdf de Y
1. use el CDF luego tome la derivada CDF.
2. Use la transformación de variable directamente (use jacobiano)
Aquí mostraré el segundo método.
$ y = 2x \ Rightarrow x = \ frac {1} {2} y $
$ J = \ frac {dx} {dy} = \ frac {1} {2} $
$ f (y) = \ frac {1} {\ sqrt {2 \ pi}} e ^ {- \ frac {1} {2} (\ frac {y} {2}) ^ 2} | J | = \ frac {1} {2 \ sqrt {2 \ pi}} e ^ {- \ frac {1} {8} y ^ 2} $
Puedes ver el pdf de $ Y $ es $ \ frac {1} {2 \ sqrt {2 \ pi}} e ^ {- \ frac {1} {8} y ^ 2} $
Según tengo entendido, usted pregunta sobre una situación en la que tenemos la variable aleatoria $ X $, su función de densidad $ f (x) $, y le interesa encontrar la función de densidad de probabilidad de la variable aleatoria $ Y $ definida como $ Y = f (X) $.
Esta relación es bastante sencilla para la función de distribución acumulativa, pero no tiene que existir para la función de densidad de probabilidad. Recuerde que la función
es una relación entre un conjunto de entradas y un conjunto de salidas permitidas con la propiedad de que cada entrada está relacionada con exactamente una salida . ( Wikipedia, cursiva agregada)
y observe las dos figuras a continuación que muestran el PDF de $ f (x) $ normal estándar. Cada valor del eje $ x $ está relacionado con exactamente un valor del eje $ y $ (figura izquierda), pero algunos valores del eje $ y $ están relacionados con más de un valor del eje $ x $ (figura derecha), por lo que La relación inversa no es una función. Esto no tiene por qué ser cierto para todas las funciones, sino solo para aquellas que no son asignaciones uno a uno.
Si está interesado en la probabilidad de observar los valores de $ f (x) $, puede obtenerla mediante simulación. Para calcular probabilidades, muestre los valores de la variable aleatoria $ X $ y páselos a través de la función de densidad $ f (\ cdot) $ de la misma manera que podría hacer cualquier otra transformación de $ X $. Esto le permite obtener $ y = f (x) $ y luego calcular las probabilidades empíricas para los valores de $ y $. A continuación se proporciona un ejemplo de código R para distribución normal.
hist (dnorm (rnorm (1e5)))
Sí, es posible. Veamos cómo.
Cuando $ Y = f (X) $, el condicional P (Y | X) se puede escribir como
$$ P (Y = y | x) = \ delta (y - f (x)) $$
donde $ \ delta $ es el delta de Dirac.
El PDF de Y puede ser obtenido al marginar sobre X:
$$ P (Y = y) = \ int P (y | x) P (x) dx = \ int \ delta (y - f (x)) P ( x) dx $$
Para calcular dicha integral, podemos usar que
$$ \ int h (x) \ delta (g (x) ) dx = \ sum_i \ frac {h (x_i)} {| g '(x_i) |} $$
donde $ x_i $ son las raíces de $ g $. Reemplazándolo en nuestro marginal con $ g (x) = y - f (x) $, y $ h (x) = P (x) $, obtenemos
$$ P (Y = y) = \ sum_ {i = 1} ^ N \ frac {P (x_i)} {| f '(x_i) |} $$
donde $ x_i $ son las soluciones de $ y = f (x ) $.
Esto es lo más lejos que podemos llegar. Sin embargo, esta fórmula evidencia que:
Encuentro agradable esta solución porque no tengo que recordarla; es una consecuencia de la definición de $ Y $ y $ P (Y | X) $.
Tomemos un ejemplo: X está uniformemente en $ x \ en [-1/2, 1/2 ] $, $ Y = f (X) = X ^ 2 \ in [0, 1/4] $. Calcule $ P (Y = y) $.
Hay dos soluciones de $ y = x ^ 2 $ en el intervalo $ x \ en [-1/2, 1/2] $: $ \ {- \ sqrt {y}, \ sqrt {y} \} $. Además, la derivada de $ f (X) $ es $ 2x $. Usando la ecuación anterior, obtenemos
$$ P (y) = \ sum_ {i = 1} ^ {2} \ frac {P \ left (x_ {i} \ right)} {| f '(x_ {i}) |} = \ izquierda (\ frac {1} {2 \ sqrt {y}} + \ frac {1} {2 \ sqrt {y}} \ right) = \ frac {1} { \ sqrt {y}} $$
que se puede confirmar, p. ej. en mathica:
Show [{Histogram [RandomVariate [UniformDistribution [{- 1/2, 1/2}], 100000] ^ 2, Automatic, "PDF"], Plot [1 / Sqrt [y], {y, 0.001, 1/4}, PlotStyle -> {Red, Thick},
PlotRange -> All]}]
Si X es uniforme en $ [0, 1] $ en su lugar, no es solo una solución y obtenemos
$$ P (y) = \ frac {1} {2 \ sqrt {y}} $$