Jeg bruker Louvain-klynging (1,2) til å klynge celler i scRNAseq-data, som implementert av scanpy.
En av parameterne som kreves for denne typen klynging er antall naboer som ble brukt til å konstruere nabolagsgrafen over celler ( docs).
Større verdier gir et mer globalt syn på manifolden, noe som fører til lavere antall klynger, mens å redusere antall naboer går i motsatt retning. Det er imidlertid uklart hvordan du velger denne parameteren.
Oppløsningsparameteren ser ut til å fungere på motsatt måte.
Kjenner du til noen metodikk og / eller tommelfingerregel å definere disse parametrene? F.eks. avhengig av størrelsen på datasettet?
- Levine, Jacob H., et al. "Datadrevet fenotypisk disseksjon av AML avslører stamfarlignende celler som korrelerer med prognosen." Cell 162.1 (2015): 184-197.
- Blondel, Vincent D., et al. "Rask utfoldelse av lokalsamfunn i store nettverk." Journal of statistical mechanics: theory and experiment 2008.10 (2008): P10008.