GNGTS 2016 - Atti del 35° Convegno Nazionale

388 GNGTS 2016 S essione 2.2 della PCA è quello di permettere il raggruppamento di siti caratterizzati da curve HVSR simili, identificando contestualmente gli andamenti HVSR caratteristici dei diversi gruppi. La fattibilità di questo approccio è stata verificata in tre contesti del Centro-Nord Italia, ognuno caratterizzato da diversi livelli di complessità geologica. PCA su dati HVSR. L’Analisi delle Componenti Principali è una tecnica usata nel contesto della statistica multivariata ed è adottata in diversi campi (p.es. , Davis, 2002; Wilks, 2006). Si ipotizza che per un dato un insieme di andamenti sperimentali (per esempio di curve HVSR) esista un certo numero di andamenti caratteristici (Componenti Principali o PC) tutti diversi fra loro (ovvero reciprocamente non correlati) e che ciascun andamento effettivamente osservato sia frutto di una specifica combinazione lineare di queste componenti principali. Scopo dell’analisi PCA è l’individuazione di questi andamenti caratteristici. In termini formali, il data set originale è costituito da un insieme di misure x ciascuna costituito da un vettore di K elementi. Ciascun vettore sarà caratterizzato da una media µ e da una varianza σ 2 . Nel caso delle curve HVSR, gli elementi x k del vettore x sono costituiti dai valori del rapporto spettrale in corrispondenza della frequenza f nel sito k-mo . Per motivi formali, è utile sostituire i vettori x con i vettori ‘centrati’ x’=x-µ . L’ipotesi è quindi che sia possibile scrivere (1) dove i K elementi u m sono gli stessi per ogni sito di misura. I vettori u m (f) che raccolgono i valori u m alle diverse frequenze rappresentano le Componenti Principali (PC). I valori e km sono coefficienti (“loadings”) che rappresentano il contributo che la m-ma Componente Principale fornisce alla misura relativa al valore HVSR del k-mo sito. La procedura PCA consente di identificare i vettori u m ( f ) che soddisfano la (1) con la condizione che questi siano reciprocamente non correlati (ovvero sono “diversi” fra loro). Ciascuna delle K Componenti Principali spiega una parte della variabilità osservata fra i dati originali ai diversi siti ed alle diverse frequenze. Mediante la procedura PCA è possibile calcolare quanta parte della varianza complessiva è “spiegata” dalla k-ma Componente Principale. Rappresentando u m ( f ) in funzione del corrispettivo valore di frequenza si ottengono andamenti rappresentativi della grandezza di interesse (la curva HVSR) ma con media nulla ed ampiezza proporzionale alla varianza spiegata dalla specifica componente considerata. Per queste caratteristiche le Componenti Principali in funzione della frequenza verranno indicate come curve HVSR “apparenti”. Si può quindi immaginare che se i vettori originali fossero simili fra loro, allora ci sarebbe una componente principale dominante (ovvero capace di spiegare molta parte della varianza complessiva) e altre componenti “minori”. In pratica, la frazione di varianza spiegata da ciascuna Componente Principale indica quanto il suo andamento è effettivamente presente nel campione. Dal punto di vista computazionale, la PCA è stata eseguita utilizzando la routine MATLAB “princomp”: l’intero algoritmo è caratterizzato da una notevole rapidità: considerando un dataset di 100-200 misure per un centinaio di frequenze campionate, il calcolo viene eseguito in pochi secondi. Criteri di raggruppamento del data set. Il passo successivo è stato quello di identificare le similarità tra gli andamenti delle curve “apparenti” e quelli delle singole curve HVSR sperimentali: questo passaggio ha permesso di effettuare i raggruppamenti tra le curve sperimentali simili. In particolare, sono stati seguiti in ordine i seguenti criteri: 1. identificazione della PC che dà il maggior contributo a ricostruire la curva HVSR sperimentale specifica del sito. Questa PC “dominante” viene identificata dal massimo dei valori assoluti dei prodotti tra i valori dei “loadings” e la massima escursione in ampiezza di ogni curva HVSR “apparente”. Se il valore del “loading” che contribuisce ad identificare la PC dominante ha segno negativo, la curva apparente associata alla

RkJQdWJsaXNoZXIy MjQ4NzI=