matplotlib.pyplot.boxplot #

matplotlib.pyplot. boxplot ( x , notch = None , sym = None , vert = None , whis = None , positions = None , widths = None , patch_artist = None , bootstrap = None , usermedians = None , conf_intervals = None , meanline = None , showmeans= Nessuno , showcaps = Nessuno , showbox = Nessuno , showfliers = Nessuno , boxprops = Nessuno , labels = Nessuno , flierprops = Nessuno , medianprops = Nessuno , meanprops = Nessuno , capprops = Nessuno , whiskerprops = Nessuno , manage_ticks = True , autorange = False, zorder = Nessuno , capwidths = Nessuno , * , data = Nessuno ) [fonte] #

Disegna un grafico a scatola e baffi.

Il riquadro si estende dal primo quartile (Q1) al terzo quartile (Q3) dei dati, con una linea in corrispondenza della mediana. I baffi si estendono dalla scatola di 1,5 volte l'intervallo interquartile (IQR). I punti volanti sono quelli oltre la fine dei baffi. Vedere https://en.wikipedia.org/wiki/Box_plot per riferimento.

     Q1-1.5IQR   Q1   median  Q3   Q3+1.5IQR
                  |-----:-----|
  o      |--------|     :     |--------|    o  o
                  |-----:-----|
flier             <----------->            fliers
                       IQR
Parametri :
x Array o una sequenza di vettori.

I dati di input. Se si tratta di un array 2D, viene disegnato un boxplot per ogni colonna in x . Se una sequenza di matrici 1D, viene disegnato un boxplot per ogni matrice in x .

notch bool, default: False

Se disegnare un boxplot dentellato ( True) o un boxplot rettangolare ( False). Le tacche rappresentano l'intervallo di confidenza (CI) attorno alla mediana. La documentazione per bootstrap descrive come vengono calcolate le posizioni delle tacche per impostazione predefinita, ma le loro posizioni possono anche essere sovrascritte impostando il parametro conf_intervals .

Nota

Nei casi in cui i valori dell'IC sono inferiori al quartile inferiore o superiori al quartile superiore, le tacche si estenderanno oltre il riquadro, conferendogli un caratteristico aspetto "capovolto". Questo è un comportamento previsto e coerente con altri pacchetti di visualizzazione statistica.

sym str, facoltativo

Il simbolo predefinito per i punti volantino. Una stringa vuota ('') nasconde i volantini. Se None, i volantini impostati per impostazione predefinita sono "b+". Un maggiore controllo è fornito dal parametro flierprops .

vert bool, predefinito: vero

If True, disegna riquadri verticali. Se False, disegna riquadri orizzontali.

whis float o (float, float), default: 1.5

La posizione dei baffi.

Se è float, il baffo inferiore è al dato più basso sopra , e il baffo superiore al dato più alto sotto , dove Q1 e Q3 sono il primo e il terzo quartile. Il valore predefinito di corrisponde alla definizione originale di boxplot di Tukey.Q1 - whis*(Q3-Q1)Q3 + whis*(Q3-Q1)whis = 1.5

Se una coppia di float indica i percentili in corrispondenza dei quali disegnare i baffi (ad esempio, (5, 95)). In particolare, impostandolo su (0, 100) si ottengono baffi che coprono l'intero intervallo di dati.

Nel caso limite in cui , whis è impostato automaticamente su (0, 100) (copre l'intero intervallo dei dati) se autorange è True.Q1 == Q3

Al di là dei baffi, i dati sono considerati valori anomali e vengono tracciati come singoli punti.

bootstrap int, facoltativo

Specifica se eseguire il bootstrap degli intervalli di confidenza attorno alla mediana per i grafici a scatole con intaglio. Se bootstrap è None, non viene eseguito alcun bootstrap e le tacche vengono calcolate utilizzando un'approssimazione asintotica basata su Gaussian (vedere McGill, R., Tukey, JW e Larsen, WA, 1978 e Kendall e Stuart, 1967). In caso contrario, bootstrap specifica il numero di volte in cui eseguire il bootstrap della mediana per determinarne gli intervalli di confidenza al 95%. Si consigliano valori compresi tra 1000 e 10000.

usermedians 1D simile a un array, facoltativo

Un array 1D di lunghezza len(x). Ogni voce che non è Noneforza il valore della mediana per il set di dati corrispondente. Per le voci che sono None, le mediane vengono calcolate normalmente da Matplotlib.

conf_intervals simile a un array, facoltativo

Una forma simile a una matrice 2D . Ogni voce diversa da None forza la posizione della tacca corrispondente (che viene disegnata solo se tacca è ). Per le voci che sono , le tacche vengono calcolate con il metodo specificato dagli altri parametri (ad esempio, bootstrap ).(len(x), 2)TrueNone

posiziona come un array, facoltativo

Le posizioni delle scatole. I tick e i limiti vengono impostati automaticamente per corrispondere alle posizioni. L' impostazione predefinita è dove N è il numero di riquadri da disegnare.range(1, N+1)

widths float o simile ad un array

Le larghezze delle scatole. Il valore predefinito è 0,5 o , se è inferiore.0.15*(distance between extreme positions)

patch_artist bool, default: False

Se Falseproduce scatole con l'artista Line2D. Altrimenti, le caselle vengono disegnate con gli artisti Patch.

sequenza di etichette , opzionale

Etichette per ogni set di dati (una per set di dati).

manage_ticks bool, predefinito: vero

Se True, le posizioni e le etichette dei tick verranno regolate in modo che corrispondano alle posizioni del boxplot.

autorange bool, predefinito: False

Quando Truee i dati sono distribuiti in modo tale che il 25° e il 75° percentile siano uguali, whis è impostato su (0, 100) in modo tale che le estremità dei baffi siano al minimo e al massimo dei dati.

meanline bool, predefinito: falso

If True(e showmeans è True), proverà a rendere la media come una linea che copre l'intera larghezza della scatola secondo meanprops (vedi sotto). Sconsigliato se anche shownotches è vero. In caso contrario, le medie verranno visualizzate come punti.

zorder float, predefinito:Line2D.zorder = 2

L'ordine z del boxplot.

Resi :
dict

Un dizionario che mappa ogni componente del boxplot a un elenco delle Line2Distanze create. Quel dizionario ha le seguenti chiavi (assumendo boxplot verticali):

  • boxes: il corpo principale del boxplot che mostra i quartili e gli intervalli di confidenza della mediana se abilitati.

  • medians: linee orizzontali alla mediana di ogni casella.

  • whiskers: le linee verticali che si estendono fino ai punti dati più estremi e non anomali.

  • caps: le linee orizzontali all'estremità dei baffi.

  • fliers: punti che rappresentano dati che si estendono oltre i baffi (volantini).

  • means: punti o linee che rappresentano le medie.

Altri parametri :
showcaps bool, default: True

Mostra i cappucci alle estremità dei baffi.

showbox bool, predefinito: vero

Mostra la scatola centrale.

showfliers bool, predefinito: vero

Mostra i valori anomali oltre le maiuscole.

showmeans bool, default: False

Mostra le medie aritmetiche.

capprops dict, predefinito: Nessuno

Lo stile dei cappucci.

capwidths float o array, default: Nessuno

Le larghezze dei cappucci.

boxprops dict, predefinito: Nessuno

Lo stile della scatola.

whiskerprops dict, predefinito: Nessuno

Lo stile dei baffi.

flierprops dict, impostazione predefinita: Nessuno

Lo stile dei volantini.

medianprops dict, predefinito: Nessuno

Lo stile del mediano.

meanprops dict, predefinito: Nessuno

Lo stile della media.

oggetto indicizzabile dei dati , facoltativo

Se fornito, tutti i parametri accettano anche una stringa s, che viene interpretata come data[s](a meno che ciò non sollevi un'eccezione).

Guarda anche

violinplot

Disegna una stima della funzione di densità di probabilità.