Contenuto
- Semplificazione di un set di dati
- Utilizzare nel programma
- carattere
- considerazioni
- eccellere
- Prevenzione / soluzione
L'analisi dei componenti principali riduce un insieme di variabili correlate a un insieme più piccolo di variabili non correlate, semplificando un set di dati complesso per un'analisi successiva. Questa complessa procedura statistica può essere eseguita da molti programmi di analisi dei dati, o programmi aggiuntivi che ampliano le capacità della stessa, aggiungendo nuove funzionalità.
Programmi di fogli di calcolo come Excel possono eseguire analisi di componenti importanti con l'aiuto di un'estensione (Immagine di Flickr.com, per gentile concessione di Casey Serin)
Semplificazione di un set di dati
L'analisi dei componenti principali è una tecnica di esplorazione e riduzione dei dati. Un analista può utilizzare la tecnica per estrarre informazioni rilevanti da un insieme di dati ampio e confuso. La tecnica viene comunemente utilizzata quando il numero di variabili osservate è molto ampio e le correlazioni tra di esse rendono i dati difficili da analizzare direttamente. Ad esempio, in alcuni casi, la correlazione tra le variabili può creare una falsa impressione di ridondanza dei dati, rendendo difficile l'analisi tecnica o compromettendo la valutazione dei dati. L'analisi dei componenti principali semplifica le variabili che li esprimono in funzione di un numero minore di elementi, i componenti principali, che rappresentano la maggior parte delle variazioni nelle misure dei dati.
Utilizzare nel programma
La complessità dell'analisi dei componenti principali richiede l'uso di un programma specifico. Esiste un'ampia varietà di programmi statistici e molti di questi sono in grado di eseguire questa tecnica. I programmi più popolari sono SAS, Stata e SPSS. Università, centri di ricerca, organizzazioni di consulenza e altri professionisti della ricerca utilizzano questi programmi specifici. Tutti e tre possono eseguire l'analisi dei componenti principali di un set di dati inserito in un foglio di lavoro, in cui le righe rappresentano le singole osservazioni e le colonne rappresentano le variabili separate.
carattere
La maggior parte dei principali programmi software di analisi dei componenti, inclusi SAS, Stata e SPSS presenteranno i risultati sotto forma di tabelle che includono gli autovalori o le misure di varianza spiegate. Molti programmi forniscono anche la visualizzazione visiva dei risultati sotto forma di una trama di ghiaia.
considerazioni
L'analisi delle componenti principali viene spesso confusa con l'analisi fattoriale, un'altra tecnica di riduzione dei dati che spiega le osservazioni correlate in termini di fattori sottostanti. I due sono in realtà procedure separate, sebbene l'analisi delle componenti principali sia una fase dell'analisi fattoriale. Tuttavia, molti pacchetti combinano le due procedure.
Un'altra considerazione importante è che i programmi specializzati come SAS, SPSS e Stata sono costosi. Pertanto, questi programmi potrebbero non essere utili per le persone che non pianificano di condurre spesso analisi statistiche.
eccellere
Le persone che hanno bisogno di eseguire alcune analisi statistiche, ma preferiscono non acquistare un programma specializzato, potrebbero chiedersi se i programmi di foglio di calcolo ampiamente utilizzati, come Excel, siano in grado di eseguire un'analisi dei componenti principali. La risposta è sì e no. Sebbene Excel abbia alcuni strumenti di analisi dei dati che possono essere accessibili dall'installazione di un pacchetto di analisi statistica, il programma non intende essere un programma di analisi statistica. L'analisi delle componenti principali e l'analisi fattoriale non sono tra le funzioni dello strumento di analisi dei dati.
Prevenzione / soluzione
Esiste un programma che gli utenti possono scaricare e installare per migliorare le funzionalità di Excel come strumento di analisi dei dati. Addinsoft, una società di software specializzata in programmi di analisi, ha creato XLSTAT. Questo programma consente a Excel di eseguire analisi dei componenti principali e altre procedure statistiche. Ha anche procedure user-friendly, che consentono all'utente di selezionare i dati per l'analisi semplicemente facendo clic e trascinando una cella attraverso i campi richiesti. Gli utenti possono acquistare e scaricare XLSTAT dal sito Web di Addinsoft. Esiste anche una versione gratuita che gli utenti possono provare prima di decidere di acquistarla.