IT
Ricordo che alla prima lezione di statistica il professore ci aveva parlato di campionamento statistico e inferenza statistica, poiché è improponibile fare un'indagine su tutta la popolazione statistica.
In realtà, con il data mining non solo è più che proponibile, ma è la norma.
Comunque, con QlikView qualora si voglia caricare un campione di righe casuale da una tabella si può usare sample.
sample è un prefisso di load e select il cui unico argomento è la probabilità di caricare una riga.
Ad esempio:
sample '1%' load * from file.qvd (qvd);
Se file.qvd è una tabella di 100 milioni di righe, QlikView ne caricherà solo circa un milione scelto a caso.
EN
On my first statistics class, our teacher told us about sampling, and why it is really necessary for real world applications. Actually, data mining does indeed work on a full statistic population, usually.
By the way, you can load a random sample from a table by using the sample prefix, whose only argument is the probability of actually reading a row.
Here's an example:
sample '1%' load * from file.qvd (qvd);
Given a 100 million rows file, QlikView will load roughly 1 million of random rows.
Leave a comment