Hvordan bestemme antall naboer og oppløsning for Louvain-klynging

gc5

2018-05-08 01:19:22 UTC

view on stackexchange narkive permalink

Jeg bruker Louvain-klynging (1,2) til å klynge celler i scRNAseq-data, som implementert av scanpy.

En av parameterne som kreves for denne typen klynging er antall naboer som ble brukt til å konstruere nabolagsgrafen over celler ( docs).

Større verdier gir et mer globalt syn på manifolden, noe som fører til lavere antall klynger, mens å redusere antall naboer går i motsatt retning. Det er imidlertid uklart hvordan du velger denne parameteren.

Oppløsningsparameteren ser ut til å fungere på motsatt måte.

Kjenner du til noen metodikk og / eller tommelfingerregel å definere disse parametrene? F.eks. avhengig av størrelsen på datasettet?

Levine, Jacob H., et al. "Datadrevet fenotypisk disseksjon av AML avslører stamfarlignende celler som korrelerer med prognosen." Cell 162.1 (2015): 184-197.
Blondel, Vincent D., et al. "Rask utfoldelse av lokalsamfunn i store nettverk." Journal of statistical mechanics: theory and experiment 2008.10 (2008): P10008.

Den Louviske algoritmen har et problem med frakoblede samfunn. Leiden-algoritmen anbefales for å løse dette. Se Traag et al. https://arxiv.org/abs/1810.08473

Hvis jeg ikke husker riktig, viser fenografpapiret at algoritmen deres er ganske robust for forskjellige (rimelige) verdier for k.

@gc5 fikk du svaret? Jeg vil også vite hva som er den beste oppløsningen? Da vi kan få flere lokalsamfunn når vi øker oppløsningen og omvendt. Takk

@KhalidUsman ikke noe tilfredsstillende svar så langt.