Pregunta:
Distribución de Y de la distribución de X
ar2015
2015-12-25 12:10:32 UTC
view on stackexchange narkive permalink

Si el PDF de distribución de $ x $ es $ PDF_X $ y existe una relación matemática entre $ y $ y $ x $:

$$ y = f (x) $$

¿Es posible encontrar $ PDF_Y $?

Si es así, ¿cómo calcularlo?

@wolfies ¿a qué se refiere con solución de forma cerrada?
No, no es posible.
Cuatro respuestas:
Stéphane Laurent
2015-12-25 20:17:07 UTC
view on stackexchange narkive permalink

Para una función general $ h $, no existe una fórmula directa para obtener el pdf de la variable aleatoria $ Y = h (X) $ conociendo el pdf de $ X $. Hay una fórmula en caso de que $ h $ sea un mapeo uno a uno diferenciable del rango (el soporte , debería decir) de $ X $ al rango de $ Y $. Supongo que por tu pregunta no conoces esta fórmula, así que déjame darte la imagen y el proceso para derivarla.

Toma, por ejemplo, una variable aleatoria $ X \ sim {\ cal N} (\ mu, \ sigma ^ 2) $ y establezca $ Y = \ exp (X) $. La siguiente animación muestra algunas simulaciones de $ X $ y los valores correspondientes de $ Y $. La densidad de $ X $ se muestra en azul y la de $ Y $ se muestra en naranja en la dirección vertical.

enter image description here

Ahora la pregunta es: conociendo la densidad $ f _ {\ textrm {azul}} $ de $ X $, ¿cuál es la densidad $ f _ {\ textrm {naranja}} $ de $ Y $?

Tomando un punto $ y $ en el rango de $ Y $, la densidad $ f _ {\ textrm {orange}} $ proporciona la probabilidad de que $ Y $ pertenezca a un área pequeña $ \ mathrm {d } y $ alrededor de $ y $ por la fórmula $$ \ Pr (Y \ in \ mathrm {d} y) \ approx f _ {\ textrm {naranja}} (y) | \ mathrm {d} y | $$ donde $ | \ mathrm {d} y | $ denota la longitud del intervalo pequeño $ \ mathrm {d} y $. Esta probabilidad es el área rosada de la siguiente figura.

enter image description here

La probabilidad $ \ Pr (Y \ in \ mathrm {d} y) $ también es igual a la probabilidad $ \ Pr (X \ in \ mathrm {d} x) $, mostrado por el área gris debajo de la curva azul, donde $ x = \ log (y) $ debido a $ y = \ exp (x) $, y $ \ mathrm {d} x $ es el pequeño intervalo alrededor de $ x $. Esta probabilidad está dada por $$ \ Pr (X \ in \ mathrm {d} x) \ approx f _ {\ textrm {blue}} (x) | \ mathrm {d} x |. $$ Está claro que $ | \ mathrm {d} x | \ neq | \ mathrm {d} y | $. Recuerde que estas dos longitudes son muy pequeñas, por lo tanto, la función verde (llamémosla $ h $ en lugar de $ \ exp $) es como un segmento en el intervalo $ \ mathrm {d} x $, y la pendiente de este segmento es el valor $ h '(x) $ de la derivada de $ h $ en $ x $. Por lo tanto $ | \ mathrm {d} y | \ approx h '(x) | \ mathrm {d} x | $, y finalmente obtenemos $$ \ Pr (Y \ in \ mathrm {d} y) = \ Pr (X \ in \ mathrm {d} x) \ approx f _ {\ textrm {azul}} (x) \ frac {| \ mathrm {d} y |} {h '(x)}. $$ Expresando el lado derecho en términos de $ y = h (x) $ en lugar de $ x = h ^ {- 1} (y) $, esto da $$ \ Pr (Y \ in \ mathrm {d} y) \ approx f _ {\ textrm {azul}} \ bigl (h ^ {- 1} (y) \ bigr) \ frac {| \ mathrm {d} y |} {h '\ bigl (h ^ {- 1 } (y) \ bigr)}, $$ o, debido a $ \ frac {1} {h '\ bigl (h ^ {- 1} (y) \ bigr)} = {(h ^ {- 1}) } '(y) $, esto se puede escribir $$ \ Pr (Y \ in \ mathrm {d} y) \ approx {(h ^ {- 1})}' (y) \ times f _ {\ textrm {azul }} \ bigl (h ^ {- 1} (y) \ bigr) | \ mathrm {d} y |. $$ Al identificar esta fórmula por la que define la densidad de $ Y $: $$ \ Pr (Y \ en \ mathrm {d} y) \ approx f _ {\ textrm {naranja}} (y) | \ mathrm {d} y |, $$ finalmente obtenemos $$ \ boxed {f _ {\ textrm {naranja}} (y ) = {(h ^ {- 1})} '(y) \ times f _ {\ textrm {blue}} \ bigl (h ^ {- 1} (y) \ bigr)}. $$ Este es el llamada fórmula de cambio de variables .

Tenga cuidado con un punto: esta fórmula no es correcta en general. En mi ejemplo, el factor $ k $ relaciona $ | \ mathrm {d} x | $ y $ | \ mathrm {d} y | $ por la igualdad aproximada $ | \ mathrm {d} y | \ approx k | \ mathrm {d} x | $ is $ k = h '(x) $ porque $ h' (x) >0 $ en este ejemplo ($ h $ está aumentando), y uno tiene que tomar $ -h '(x) $ si $ h' (x) <0 $. La fórmula general incluye el valor absoluto: $$ \ boxed {f _ {\ textrm {naranja}} (y) = \ bigl | {(h ^ {- 1})} '(y) \ bigr | \ times f _ {\ textrm {azul}} \ bigl (h ^ {- 1} (y) \ bigr)}. $$

No estoy seguro de que $ f $ tenga que ser un mapeo uno a uno.Si tiene más de una inversa, puede sumar las inversas.P.ej.ver [mi respuesta] (http://stats.stackexchange.com/a/188225/12100)
@J.C.Leitão Solo quiero decir que doy la fórmula para el caso de un mapeo 1-1.De lo contrario, no puedo decir $ \ Pr (Y \ in dy) = \ Pr (X \ in dx) $.
Deep North
2015-12-25 13:56:01 UTC
view on stackexchange narkive permalink

Suponga que $ X $ tiene una distribución normal estándar, entonces el pdf de $ X $ es $ f (x) = \ frac {1} {\ sqrt {2 \ pi}} e ^ {- \ frac {1} { 2} x ^ 2} $

Suponga que la relación matemática entre la variable aleatoria $ Y $ y $ X $ es $ Y = 2X $. Será fácil encontrar el pdf de $ Y $.

Básicamente hay dos métodos para encontrar el pdf de Y

1. use el CDF luego tome la derivada CDF.

2. Use la transformación de variable directamente (use jacobiano)

Aquí mostraré el segundo método.

$ y = 2x \ Rightarrow x = \ frac {1} {2} y $

$ J = \ frac {dx} {dy} = \ frac {1} {2} $

$ f (y) = \ frac {1} {\ sqrt {2 \ pi}} e ^ {- \ frac {1} {2} (\ frac {y} {2}) ^ 2} | J | = \ frac {1} {2 \ sqrt {2 \ pi}} e ^ {- \ frac {1} {8} y ^ 2} $

Puedes ver el pdf de $ Y $ es $ \ frac {1} {2 \ sqrt {2 \ pi}} e ^ {- \ frac {1} {8} y ^ 2} $

Tim
2015-12-25 14:41:44 UTC
view on stackexchange narkive permalink

Según tengo entendido, usted pregunta sobre una situación en la que tenemos la variable aleatoria $ X $, su función de densidad $ f (x) $, y le interesa encontrar la función de densidad de probabilidad de la variable aleatoria $ Y $ definida como $ Y = f (X) $.

Esta relación es bastante sencilla para la función de distribución acumulativa, pero no tiene que existir para la función de densidad de probabilidad. Recuerde que la función

es una relación entre un conjunto de entradas y un conjunto de salidas permitidas con la propiedad de que cada entrada está relacionada con exactamente una salida . ( Wikipedia, cursiva agregada)

y observe las dos figuras a continuación que muestran el PDF de $ f (x) $ normal estándar. Cada valor del eje $ x $ está relacionado con exactamente un valor del eje $ y $ (figura izquierda), pero algunos valores del eje $ y $ están relacionados con más de un valor del eje $ x $ (figura derecha), por lo que La relación inversa no es una función. Esto no tiene por qué ser cierto para todas las funciones, sino solo para aquellas que no son asignaciones uno a uno.

enter image description here

Si está interesado en la probabilidad de observar los valores de $ f (x) $, puede obtenerla mediante simulación. Para calcular probabilidades, muestre los valores de la variable aleatoria $ X $ y páselos a través de la función de densidad $ f (\ cdot) $ de la misma manera que podría hacer cualquier otra transformación de $ X $. Esto le permite obtener $ y = f (x) $ y luego calcular las probabilidades empíricas para los valores de $ y $. A continuación se proporciona un ejemplo de código R para distribución normal.

  hist (dnorm (rnorm (1e5)))  

enter image description here

Creo que su elección de $ f $ es posiblemente confusa, porque es un * pdf *.
@StéphaneLaurent gracias, dejé más clara la redacción.
Tim, todavía no entiendo.Hay dos PDF en el OP y una transformación $ f $.Pero toma $ f $ un pdf, por eso dije que es confuso.Sería más claro, por ejemplo, si tomara $ f (x) = x ^ 2 $.
Puede que me equivoque, pero tengo la impresión de que ha leído mal la pregunta y está respondiendo a la pregunta de la ley de $ f (X) $ cuando $ f $ es la densidad de $ X $.
@StéphaneLaurent, como entendí, la pregunta $ f $ es una función de densidad para $ X $.Desafortunadamente OP no lo dejó claro en su pregunta y no proporcionó ningún comentario de seguimiento a mi respuesta.
@StéphaneLaurent ahora dejé claro en mi respuesta cómo entiendo que la pregunta sea clara al respecto.Gracias por la retroalimentación.
No lo creo, porque denota por $ PDF_X $ el pdf de $ X $.Pero como dices, ahora dejaste claro cómo lo entiendes.Es cierto que $ f $ es un poco misterioso en el OP.
Jorge Leitao
2015-12-26 00:41:55 UTC
view on stackexchange narkive permalink

Sí, es posible. Veamos cómo.

Cuando $ Y = f (X) $, el condicional P (Y | X) se puede escribir como

$$ P (Y = y | x) = \ delta (y - f (x)) $$

donde $ \ delta $ es el delta de Dirac.

El PDF de Y puede ser obtenido al marginar sobre X:

$$ P (Y = y) = \ int P (y | x) P (x) dx = \ int \ delta (y - f (x)) P ( x) dx $$

Para calcular dicha integral, podemos usar que

$$ \ int h (x) \ delta (g (x) ) dx = \ sum_i \ frac {h (x_i)} {| g '(x_i) |} $$

donde $ x_i $ son las raíces de $ g $. Reemplazándolo en nuestro marginal con $ g (x) = y - f (x) $, y $ h (x) = P (x) $, obtenemos

$$ P (Y = y) = \ sum_ {i = 1} ^ N \ frac {P (x_i)} {| f '(x_i) |} $$

donde $ x_i $ son las soluciones de $ y = f (x ) $.

Esto es lo más lejos que podemos llegar. Sin embargo, esta fórmula evidencia que:

  • el problema se puede tratar como cualquier otro problema de probabilidad: se definen las variables aleatorias, las probabilidades condicionales y se calcula la marginal;
  • la solución no necesariamente tiene una fórmula cerrada, pero no requiere $ f $ para ser biyectiva;
  • cuando la función es biyectiva (raíz única), esta solución se reduce a la solución @ Stéphane Laurent gave.

Encuentro agradable esta solución porque no tengo que recordarla; es una consecuencia de la definición de $ Y $ y $ P (Y | X) $.

Tomemos un ejemplo: X está uniformemente en $ x \ en [-1/2, 1/2 ] $, ​​$ Y = f (X) = X ^ 2 \ in [0, 1/4] $. Calcule $ P (Y = y) $.

Hay dos soluciones de $ y = x ^ 2 $ en el intervalo $ x \ en [-1/2, 1/2] $: $ \ {- \ sqrt {y}, \ sqrt {y} \} $. Además, la derivada de $ f (X) $ es $ 2x $. Usando la ecuación anterior, obtenemos

$$ P (y) = \ sum_ {i = 1} ^ {2} \ frac {P \ left (x_ {i} \ right)} {| f '(x_ {i}) |} = \ izquierda (\ frac {1} {2 \ sqrt {y}} + \ frac {1} {2 \ sqrt {y}} \ right) = \ frac {1} { \ sqrt {y}} $$

que se puede confirmar, p. ej. en mathica:

  Show [{Histogram [RandomVariate [UniformDistribution [{- 1/2, 1/2}], 100000] ^ 2, Automatic, "PDF"], Plot [1 / Sqrt [y], {y, 0.001, 1/4}, PlotStyle -> {Red, Thick},
PlotRange -> All]}]  

enter image description here

Si X es uniforme en $ [0, 1] $ en su lugar, no es solo una solución y obtenemos

$$ P (y) = \ frac {1} {2 \ sqrt {y}} $$

$\Pr(Y=y)=0$ if $Y$ has a pdf.


Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...