Ho un elenco (chiamiamolo $ \ {L_N \} $ ) di N numeri casuali $ R \ in (0,1) $ (scelto da una distribuzione uniforme). Successivamente, lancio un altro numero casuale dalla stessa distribuzione (chiamiamo questo numero "b"). Ora trovo l'elemento nell'elenco $ \ {L_N \} $ che è il più vicino al numero "b" e trovo questa distanza.
Se ripeto questo processo, posso tracciare la distribuzione delle distanze ottenute attraverso questo processo.
Quando $ N \ to \ infty $ , qual è l'approccio di questa distribuzione?
Quando simulo questo in Mathematica, sembra che si avvicini a una funzione esponenziale. E se l'elenco fosse lungo 1 elemento, credo che questo seguirebbe esattamente una distribuzione esponenziale.
Guardando wikipedia per le distribuzioni esponenziali, posso vedere che ci sono alcune discussioni sull'argomento:
Ma non riesco a interpretare ciò che dicono qui. Cosa significa "k" qui? Il mio caso è quello che descrivono qui nel limite in cui $ n \ to \ infty $ ?
EDIT: Dopo una risposta intuitiva molto utile di Bayequentist, ora capisco che il comportamento come $ N \ to \ infty $ dovrebbe avvicinarsi a una funzione delta di dirac. Ma mi piacerebbe ancora capire perché i miei dati (che è come il minimo di un mucchio di distribuzioni esponenziali), sembrano anche essere esponenziali. E c'è un modo per capire cos'è esattamente questa distribuzione (per N grande ma finito)?
Ecco un'immagine di come appare una tale distribuzione per N grande ma finito:
EDIT2: Ecco un po 'di codice Python per simulare queste distribuzioni:
% matplotlib inline
importa matematica
importa numpy come np
importa matplotlib come mpl
importa matplotlib.pyplot come plt
numpoints = 10000
NBINS = 1000
randarray1 = np.random.random_sample ((numpoints,))
randarray2 = np.random.random_sample ((numpoints,))
dtbin = []
per i nell'intervallo (len (t1)):
dt = 10000000
per j nell'intervallo (len (t2)):
delta = t1 [i] -t2 [j]
se abs (delta) < abs (dt):
dt = delta
dtbin.append (dt)
plt.figure ()
plt.hist (dtbin, bins = NBINS)
plt. mostra ()