Las notas del presentador contienen información extra que puede serte de utilidad si vas a presentar estas diapositivas.
Presiona P
de nuevo para ir a las notas del presentador.
Presiona C
para crear una ventana nueva donde se visualizará la misma presentación.
Esta ventana está vinculada a la ventana principal. Si cambias las diapositivas en una, las otras cambiarán también.
Útil para dar una presentación.
Las notas del presentador contienen información extra que puede serte de utilidad si vas a presentar estas diapositivas.
Presiona P
de nuevo para ir a las notas del presentador.
Presiona C
para crear una ventana nueva donde se visualizará la misma presentación.
Esta ventana está vinculada a la ventana principal. Si cambias las diapositivas en una, las otras cambiarán también.
Útil para dar una presentación.
Comprender las dificultades en la secuenciación y amplificación de scRNA-seq, y cómo se superan.
Conocer los tipos de variación en un análisis y cómo controlarlos.
Comprender qué es la reducción de dimensión y cómo se puede realizar.
Familiarizarse con los principales tipos de técnicas de agrupación y cuándo utilizarlas.
Por ejemplo, ¿cómo se capturan y secuencian las células?
Por ejemplo, ¿cómo se capturan y secuencian las células?
En el análisis de secuencia de ARN a granel, el proceso implica tomar una muestra, eliminar moléculas no deseadas y secuenciar todo lo demás.
¿Cómo preparamos las muestras para la secuenciación?
Secuencia de ARN a granel
Secuencia de ARN unicelular
Por ejemplo, ¿cómo se capturan y secuencian las células?
En el análisis de secuencia de ARN a granel, el proceso implica tomar una muestra, eliminar moléculas no deseadas y secuenciar todo lo demás.
¿Cómo preparamos las muestras para la secuenciación?
Secuencia de ARN a granel
Secuencia de ARN unicelular
Réplicas biológicas
Tipo | Notas |
---|---|
Secuencia de ARN a granel | Cada corte de tejido es una muestra, se puede tomar otro corte |
RNA-secuencia unicelular | Cada celda es una muestra, no se puede replicar directamente porque es única |
Por ejemplo, ¿cómo se capturan y secuencian las células?
En el análisis de secuencia de ARN a granel, el proceso implica tomar una muestra, eliminar moléculas no deseadas y secuenciar todo lo demás.
El aislamiento celular se puede realizar de diferentes formas.
El aislamiento celular se puede realizar de diferentes formas.
Un método es el pipeteado manual, en el que los científicos de laboratorio húmedo succionan células individuales utilizando un tubo largo y delgado.
El aislamiento celular se puede realizar de diferentes formas.
Un método es el pipeteado manual, en el que los científicos de laboratorio húmedo succionan células individuales utilizando un tubo largo y delgado.
Pueden hacer esto cientos de veces para aislar cientos de células, pero es propenso a errores y, a menudo, se aíslan varias células juntas.
El aislamiento celular se puede realizar de diferentes formas.
Un método es el pipeteado manual, en el que los científicos de laboratorio húmedo succionan células individuales utilizando un tubo largo y delgado.
Pueden hacer esto cientos de veces para aislar cientos de células, pero es propenso a errores y, a menudo, se aíslan varias células juntas.
Otro método es la citometría de flujo, que reduce el componente de error humano de esta etapa.
Dispersión óptica *
Si el tamaño de la celda <longitud de onda del láser (~ 400 nm)
Medido en términos de:
! El mismo diagrama de dispersión, pero ahora los monocitos y graunlocitos se muestran como manchas.
La dispersión lateral es perpendicular al láser principal y mide la granularidad de la célula, ideal para distinguir células con estructuras internas menos definidas, como los granulocitos en el eje Y de la imagen de ejemplo.
.footnote [.reduce70 [Imagen de BD Biosciences]]
Coloque las células en la placa de secuenciación
De un conjunto de muchas muchas muestras de tejido / células diferentes:
Una vez que las moléculas de ARN han sido etiquetadas por códigos de barras de células, pueden amplificarse, ya sea por separado o agrupadas, donde los productos amplificados comparten los mismos códigos de barras de células que sus contrapartes originales.
¿Cuántas transcripciones rojas hay en la celda?
¿Después de la amplificación por PCR?
¿Qué hacen las pequeñas etiquetas de colores al comienzo de cada transcripción?
Identificadores moleculares únicos (UMI)
Agregado para ayudar a mitigar el sesgo de la amplificación.
Sin embargo, si agrupamos las lecturas por sus UMI, y luego contamos solo el número de UMI únicas por transcripción, eliminando la duplicación de las lecturas que comparten la misma transcripción y UMI, llegamos a 2 lecturas rojas y 2 lecturas azules que representan mejor el verdadero número de transcripciones.
UMI | # lecturas | |
---|---|---|
Rojo | {Rosa, Cian} | 2 |
Azul | {Rosa, Verde} | 2 |
¿Puede cada transcripción en una celda tener su propio UMI?
¿Número de transcripciones de ARNm en una célula?
Requiere códigos de barras como mínimo de longitud N , donde 4ᴺ = 10⁵
Esto se debe a que a menudo hay más transcripciones que UMI disponibles, que dependen de la cantidad de transcripciones en una celda y de la longitud del código de barras.
Códigos de barras de longitud N con distancia de edición de B :
AAAAA AAAAC AAAAG AAAAT AAACA ····CCCCC CCCCA CCCCG CCCCT CCCAC ···· · · ·
AAAAA AAACC AAAGG AAATT AACCA ····CCCCC CCCAA CCCGG CCCTT CCCAA ···· · · ·
Las distancias de edición protegen contra errores de secuenciación.
UMI | # lecturas | |
---|---|---|
Rojo | {Rosa, Cian} | 2 |
Azul | {Rosa, Verde} | 2 |
¿En qué contexto son únicos los UMI? *
'Suficientemente único' a nivel de transcripción
Deseamos contar solo las transcripciones
En el contexto de la amplificación, las UMI no necesitan ser únicas, solo necesitan ser lo suficientemente aleatorias para deduplicar las transcripciones a fin de dar una estimación más precisa del número de transcripciones dentro de una celda.
Para cada celda:
Así que recapitulemos lo que hemos aprendido: primero, cada celda tiene códigos de barras de celda agregados a cada molécula de ARN en cada celda.
Para cada celda:
T1 | T2 | T3 | |
---|---|---|---|
GeneA | 100 | 80 | 40 |
GeneB | 45 | 30 | 40 |
C1 | C2 | C3 | C4 | C5 | |
---|---|---|---|---|---|
GeneA | 0 | 0 | 2 | 0 | 1 |
GeneB | 2 | 0 | 15 | 0 | 0 |
¿Por qué es esto un problema?
$$R(s,g) = \frac{X\{sg}}{(\prod\{s} X\_{s})^{\frac{1}{n}}}$$
$$DESeq(s,g) = \frac{X\{sg}}{Med(R\{s})}$$
T1 | T2 | T3 | |
---|---|---|---|
GeneA | 100 | 80 | 40 |
GeneB | 45 | 30 | 40 |
C1 | C2 | C3 | C4 | C5 | |
---|---|---|---|---|---|
GeneA | 0 | 0 | 2 | 0 | 1 |
GeneB | 2 | 0 | 15 | 0 | 0 |
¿Por qué es esto un problema?
$$R(s,g) = \frac{X\{sg}}{(\prod\{s} X\_{s})^{\frac{1}{n}}}$$
$$DESeq(s,g) = \frac{X\{sg}}{Med(R\{s})}$$
¡No se puede dividir por cero!
Calcule el tamaño de la biblioteca de todas las celdas.
Calcule el tamaño de la biblioteca de una celda de pseudo referencia (promedio)
Separe los tamaños impares (rojo) y los tamaños pares (azul) en dos grupos
Ordene cada grupo por tamaño de biblioteca y colóquelo en lados opuestos de un "anillo"
Defina grupos superpuestos de celdas adyacentes de tamaño k
Para cada grupo
Para cada celda
Considerar:
Apuntar:
Nota:
Apuntar:
Restricción
También podemos derivar aún más las relaciones entre estos grupos calculando árboles de linaje en función de la cantidad de ruido en cada grupo, con la expectativa de que las células madre tengan perfiles de expresión ruidosos que produzcan grupos más amplios, y las células maduras tengan perfiles de expresión muy claros que produzcan grupos más ajustados.
![]() |
.image-100 [! Los clústeres ahora se mezclan entre sí, y la separación no es clara.] |
Duro | Suave |
Grandes espacios entre clusters | Los racimos se mezclan entre sí |
Los tipos de células están bien definidos y la agrupación refleja que | Los tipos de células parecen entremezclarse entre sí. |
Es de esperar un agrupamiento suave, ya que aunque el agrupamiento es un método estadístico para dividir datos de manera discreta, la biología celular subyacente de los datos es un proceso continuo, donde las células pasan de un estado bien definido a otro a través de etapas intermedias que se representan en entre dos centros de grupos.
Variedad de diferentes métodos de agrupación *
K-significa *
K-medianas *
Si, en cambio, la nueva configuración ha aumentado el número de enlaces externos, la configuración se rechaza y se selecciona y prueba otra celda. Al realizar esto varias veces, se construye una estructura comunitaria de células con el grado de especificidad que desee el usuario.
Los conjuntos de datos de una sola celda son vastos y están escasamente poblados
Se requiere filtrado y normalización de calidad
La selección de funciones y la reducción de dimensiones reducen la complejidad
La agrupación denota tipos de células y relaciones de células
scRNA-seq es un campo impulsado estadísticamente
Muchas formas de analizar los datos.
scRNA-seq requiere mucho procesamiento previo antes de que se pueda realizar el análisis.
Los grupos de células con perfiles similares se comparan con otros grupos.
Los problemas de detectabilidad requieren una consideración cuidadosa en todas las etapas.
La agrupación en clústeres es una parte integral de un análisis.
Continúa tu aprendizaje completando uno de nuestros entrenamientos recomendados:
Este material es resultado de trabajo colaborativo. ¡Agradecimientos a Galaxy Training Network y a todos los contribuidores!
Autores/as |
![]() |
Revisores/as |
|
GTN Framework tiene licencia del MIT Creative Commons Attribution 4.0 International License.
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |