De factoren creëren

  1. Open de snCrocodile enquête.
  2. Klik op de  Advanced statistics button in de Snap Toolbar.
  3. Klik op de New button toets en selecteer New Factor Analysis... 

  4. Specifieer Q6a to Q6e in het Source veld.  Dit zijn de 5 vragen met beoordelingsschalen
  5. Stel Cutoff in op Number of Factors en (Auto) indien deze niet standaard zijn ingesteld.
  6. Klik in de lege tabel om de factoren te berekenen. Vijf factoren worden getoond, aangezien er 5 bronvariabelen waren. In een langere lijst van variabelen, zal het hoge aantal factoren moeten beperkt worden.

  7. Vink Transpose aan om de factoren als kolommen te tonen.
  8. Klik in het grijze veld bovenaan kolom 1, om te zien welke variabele de hoogste factor loading bevat.

    Quality of Food verschijnt nu als de meest belangrijke.

  9. Dubbelklik op de tekst FA1 Factor 1 bovenaan de kolom en vervang de tekst met het woord Food.

  10. Herhaal het proces voor kolom 2 (FA1 Factor 2). Snelheid van de dienst (0.69…) heeft de hoogste factor loading dus noem je deze Service.

    Indien de enquête een langere lijst van statements bevatte, kan het zijn dat andere vragen over de kwaliteit van de dienst ook hoge loadings hebben voor factor 2.

  11. Label Factor 3 Cleanliness en Factor 4 Parking via hetzelfde proces.
  12. Controleer Factor 5. Deze schijnt ook verband te houden met meningen over de voeding, hoewel de eigenvalue voor deze factor zeer laag is, en het onwaarschijnlijk is dat je deze opneemt in een eindanalyse. Dit verklaart namelijk slechts 5% van de algemene variabiliteit van de gegevens. Voor nu, kan je Factor 5 als Food (2) labelen.
  13. Eenmaal je alle factoren een label hebt gegeven, bewaar de analyse door te klikken op Save button .

    In een lange lijst met bronvariabelen is het waarschijnlijk dat verschillende factoren worden beïnvloed door dezelfde set van variabelen. Aangezien factoranalyse een date reductie techniek is, is het doel om het initieel aantal variabelen naar een meer werkbaar aantal te brengen, door "samengestelde" variabelen te creëren. Aangezien deze analyse aanvankelijk het zelfde aantal factoren creëert als er bronvariabelen zijn, is het onvermijdelijk dat er duplicatie optreedt. Deze klaarblijkelijke duplicatie treedt echter op in factoren met kleine eigenwaarden. Deze factoren worden meestal genegeerd, aangezien ze relatief insignificant zijn.

Wijzig de factoranalyse, voor gebruik in andere tabellen


Je kan de factoren in een bewaarde factoranalyse gebruiken op dezelfde manier als een andere variabele, in standaard tabellen.

Verminder het aantal factoren, om de visualisering in andere tabellen te vereenvoudigen

  1. Open de factoranalyse met Advanced statistics button om de lijst met Analysis Variables te tonen en dubbelklik op de factoranalyse om ze te openen
  2. In de vorige sectie argumenteerden we dat je slechts een subset van 5 factoren mag in acht nemen. Wijzig de Cutoff naar Cumulative Proportion en stel de proportion in op 80%.
  3. Klik op de tabel eronder om ze te updaten. Enkel de 3 eerste factoren worden nu getoond
  4. Klik Save button om te bewaren.

    De variabelen die worden gecreëerd op basis van een factoranalyse zijn Quantity Variabelen. Deze worden niet getoond in de variables lijst.

De factoranalyse toepassen

De factoren die we identificeren kunnen gebruikt worden in tabellen. Ook al zijn ze niet zo nuttig, kan je de start van de analyse zien.

  1. Klik op Table button in de Snap toolbar om een nieuwe toolbar te maken, en specifieer als volgt:

    Analysis: FA1(1) to FA1(3)

    Break: Q9 with Q10

    Calculate: Means & Significances

    Show Options: Means

  2. De tabel toont de gemiddelde score voor elke leeftijdsgroep en voor mannen en vrouwen voor elk van de eerste drie factoren (Food, Service en Cleanliness)

    Je kan vaststellen dat jongere mensen positiever zijn over de voeding, oudere mensen zijn positiever over de dienst, terwijl mannen meer kritisch zijn over de properheid dan hun vrouwelijke evenknieën.

  3. Klik op Properties Properties button. In het Show Options veld, selecteer Analysis Significance.
  4. Klik [OK] om terug te keren naar de tabel.

    De tabel toont nu de resultaten van t-Tests op de gemiddelde scores.
    Hoewel deze tabel gelijkt op een tabel die je maakt met Q6a to Q6e in het analysis veld, werd het voorbeeld hier beperkt tot een kleine data set, zodat de essentie van deze techniek duidelijk wordt. In een echte enquête kan het zijn dat tot 50 bronvariabelen werden gebruikt. Een lijst van 50 variabelen naar 5 tot 7 factoren reduceren zal heel tijdsbesparend werken in de interpretatie van de data.

Factoren gebruiken om clusters te vinden

  1. Maak een nieuwe cluster in de Crocodile enquête (Klik Advanced statistics button , klik New button en selecteer New Cluster Analysis...)

  2. In het detailscherm, stel Source in op FA1(1),FA1(2),FA1(3). Dit gebruikt de 3 factoren die je zonet creëerde. Indien je de naam wijzigde van de factoren, gebruik dan de nieuwe namen.
  3. Klik op het Results tabblad om de resultaten te berekenen en te tonen

  4. Snap heeft beslist om 6 clusters te produceren, op basis van de F-waarden. Dit is misschien niet de beste oplossing.

    Het aantal clusters dat gekozen wordt, hangt af van vele factoren, zoals subjectieve criteria zoals de kennis en het begrip van de klant. Cluster groepen met weinig respondenten zorgen voor minder betrouwbare analyses achteraf. De staalgrootte is slechts 204, dus het is aangewezen om een klein aantal clusters te creëren. Wijzig de value van Clusters naar 3.
  5. Nu kan je elke cluster een naam geven, die ze karakteriseert. Een naam kiezen die de groep karakteriseert, is een kunst op zichzelf. Het is aangewezen om namen te gebruiken die een correct beeld opwerpen, eerder dan eenvoudige factuele omschrijvingen. Je kan dit zélfs een stapje verder brengen, en de naam gebruiken als een fictief karakter (een "buyer persona")

    Cluster 1 was redelijk tevreden met de voeding, maar de scores op dienst en hygiëne waren hoger dan in de andere clusters. Je kan deze groep de "Stylisten" noemen.

    Cluster 2 vindt de dienstverlening maar niks. Je kan deze groep mensen de Criticasters noemen, aangezien ze de meest kritische groep zijn over de dienst en de properheid.

    Cluster 3 is niet echt onder de indruk van de dienst en de properheid, maar vindt het voedsel wel lekker. Deze groep kan je de "gastronomen" dopen

  6. Klik op de tekst (Cluster 1) bovenaan kolom 1 en overtyp het met Stylisten.
  7. Wijzig de tekst (Cluster 2) naar Criticasters.
  8. Wijzig de tekst (Cluster 3) naar Gastronomes.

De cluster profielen (buyer persona's) onderzoeken

  1. Met de Crocodile enquête open, klik Table button om een nieuwe tabel te maken.
  2. Stel het Results Definition dialoogvenster in:

    Analysis: Q9 with Q10 with Q2

    Break: CL1

    Calculate: Counts & Percents

    Options: Counts, Indexed Values

    De Indexed Values geven een indicatie of een enkele cel over - of ondervertegenwoordigd is. Een index > 100 betekent dat er meer mensen in die cel zitten dan verwacht. Een index < 100 betekent dat er minder in de cel zitten als verwacht.


Wanneer je doorheen de tabel loopt, kolom per kolom, zie je dat elke groep gekarakteriseerd wordt door de subgroepen die oververtegenwoordigd zijn, m.a.w. met een index > 100. Door dit principe toe te passen kan je het profiel van de 3 clusters als volgt omschrijven:

Stylisten: twintigers en ouder, niet-frequente bezoekers, hoofdzakelijk vrouwen

Criticasters: licht mannelijk overwicht, bezoekers zijn frequent tot niet-frequent, en ze zijn oftewel jong, ofwel oud

Gastronomen: jongere, frequente bezoekers, waarschijnlijk mannen

Dit hept om beter te begrijpen wie de leden zijn van elke groep. Dit licht ook een potentieel aandachtspunt uit voor de eigenaar van het Crocodile restaurant. De gastronomen zijn over het algemeen positiever over het eten dan de andere groepen, en zijn 49% van het staal. Bovendien zijn ze frequentere bezoekers dan de twee andere groepen, wat wil zeggen dat zij waarschijnlijk meer dan 49% vertegenwoordigen van alle bezoeken.

Door clustergroepen te gebruiken kan je de respondenten op basis van clustergroep lidmaatschap segmenteren, en zo potentiële problemen of oorzakelijke verbanden leggen bij gekende problemen

Nog meer ontdekken in de clusters

  1. Maak een gewicht genaamd Freq met 4 codes, namelijk 30, 8, 4, 1. Dit gewicht wordt gebruikt in de volgende tabel, waar we kijken naar de bezoekfrekwentie per clustergroep. De gewichten relateren met het aantal bezoeken per maand (dagelijks = 30, tweemaal per week = 8, etc...)

  2. Maak een tabel met de volgende eigenschappen:

    Analysis: Q2

    Break: CL1

    Ga naar het Summary Statistics tabblad en voeg Mean toe met in het Score veld "Freq".

  3. De gemiddelde scores voor de tabel geven een indicatie van het gemiddelde aantal bezoeken per maand voor elke cluster groep. Zoals eerder aangegeven, zijn de gastronomen de meest frekwente bezoekers, met meer dan 8 bezoeken per maand. Dit is bijna het dubbel van de 2de grootste groep, de Criticasters.

    De tabel bevestigt dat de gastronomen niet enkel tevreden zijn met het eten, maar ook dat zij frekwenter bezoeken