Genoma da Cannabis sativa

“Genoma da Cannabis sativa“por Augusto Grower e Fernando Santiago
Desavanço fitotécnico da Cannabis sativa
A Cannabis sativa é uma cultura com grande importância antropológica, sendo umas das plantas mais antigas cultivada pelo homem, com intensa versatilidade no uso, como: adulto/recreativo (psicotrópico), medicinal (tratamento de doenças humanas e de pet´s), culinária, cordas navais, papel, concreto vegetal, entre outras.
Porém, com a proibição da planta na “Convenção Única sobre Intorpecentes” (1961), além da restrição de liberdade pessoal e social de uso, iniciou também um atraso no entendimento fitotécnico da C. sativa, em contraste com outras culturas, como tabaco (Nicotiana tabacum), soja (Glycine max), milho (Zea mays) e algodão (Gossypium hirsutum), as quais estavam avançando tecnicamente e em quantidade de área plantada.
Infelizmente, esse cenário ainda perdura na maioria dos países, onde os pesquisadores, cultivadores e entusiastas se organizam e realizam os cultivos e pesquisas de forma receosa. Porém, em poucos casos, dependendo do local, já está havendo a legalização e abertura do mercado agrícola da cultura, onde existe intenso potencial e recurso para compensar o “tempo perdido” e acelerar o entendimento de fatores mais técnicos e aprofundados da C. sativa, onde uma dessas subáreas é a Genômica (Figura 1).

Genômica
A genômica (sequência completa de DNA) é a área que realiza o estudo do genoma de qualquer organismo, desde microrganismos a plantas. O Genoma é o material genético dos seres vivos transmitido à sua descendência. Na genômica, o grande objetivo é conhecer minunciosamente a sequência de genes e como ela está disposta nos cromossomos.
Posteriormente, é possível compreender molecularmente com o auxílio da transcriptômica (transcrição em RNA – expressão dos genes) a manifestação dos caracteres/fenótipos da planta, principalmente os que estão relacionados ao rendimento produtivo da planta.
Atualmente, a genômica tem sido crucial para entender as características e especificidades de cada espécie a até mesmo diferenciar geneticamente as linhagens dentro de cada espécie ou sub-espécie. Conhecendo a sequência de genes de um organismo, é possível realizar um mapeamento genético, para conhecer onde cada gene está expressando determinado fenótipo (exemplos: altura e arquitetura de planta; expressão e concentração de cannabinóides THC, CBD, CBN, CBG; perfil de fitocromo; exigência fotoperiódica para floração; tempo de ciclo; resistência a patógenos e insetos; planta automática ou fotoperíodo, entre outros).
Porém, como a cultura C. sativa está começando a desapontar agora, a genômica e transcriptômica ainda está em momentos principiantes, onde há intensa demanda de trabalhos integrados de pesquisadores e instituições agronômicas e de melhoramento.
Montagem do genoma da Cannabis sativa
A montagem dos genomas de plantas sempre é um desafio (mesmo com sequenciadores de leitura longa), onde a Cannabis sativa não é uma exceção. O genoma da cannabis é intensamente heterozigoto (mais de um alelo para cada característica/fenótipo), onde a frequência é de 12,5 a 40,5% de caracteres marcados por heterozigose.
Outro determinante importante é que a planta contém grandes quantidades de sequências repetidas (faixa de 70%), gerando certa complexação no estudo. Para entendimento do genoma da cannabis, já foram realizados diversos levantamentos e estudos, como o sequenciamento de 12 strains diferentes (Tabelas 1 e 2; Figura 1).

*Predominância de sub-espécies e perfil fitoquímico principal (THC; CBD):
cs10/CBDRxa: desconhecido
Purple kush: 70% Indica/30% Sativa (THC: 22,9%; CBD: 0,5%);
Finola (hemp): predominância Ruderalis (THC: 0,2%; CBD: 2 – 6%);
Pineapple Banana Bubba: predominância Sativa (THC e CBD: desconhecidos)
L.A Confidential: predominância Indica (THC: 20%; CBD: 1%). *Obs.: Strain campeã da “High Times Cannabis Cup 2006” (modalidade geral) e “High Times Cannabis Cup 2008” (modalidade “Indicas”);
Chemdog 91: 50% Sativa/50% Indica (THC: 24%; CBD: 0,2%);
Cannatonic: híbrida desconhecida (THC: 4%; CBD: 9%). Obs.: strain bastante utilizada como base genética para criação de cultivares de Hemp;
Jamaican Lion: 50% Sativa/50% Indica (THC: 18%; CBD: 18%);
JL: desconhecido (linhagem selvagem).

É possível observar certos agrupamentos na similaridade de genes ortológos:
- CBDRx (cs10) é semelhante com Finola (hemp/cânhamo), podendo estar associado a baixa presença de THC e alta de CBD;
- CBDRx (cs10) é a strain com maior amplitude de genoma sequenciado;
- CBDRx (cs10) é semelhante com a strain JL;
- Jamaican Lion (geração F1) é semelhante com seu genitor Jamaican Lion Father, evidenciando a herança de caracteres;
- A strain Pineapple Banana Bubba Kush é a linhagem mais distante;
- De forma geral, as strains Cannatonic, Pineapple Banana Bubba Kush e Purple Kush possuem menor quantidade de genes ortólogos em relação as outras linhagens, evidenciando uma árvore genealógica bastante distinta e consequentemente com caracteres bem diferentes (exemplo: Purple Kush possui intenso teor do pigmento antocianina nas inflorescências/buds). *Obs.: existem inúmeras variações de “Purple Strains”, onde algumas possuem perfil elevado de antocianina nas flores, outras nas brácteas/fan-leaves (folhas adjacentes às inflorescências) e também podem ocorrer strains com as flores e brácteas arroxeadas concomitante.

*Crom.: número do cromossomo sequenciado
Sequência: nome da sequência inserida no banco de dados genômicos GenBank®
Evolução na montagem do genoma da Cannabis sativa
A evolução na montagem do genoma da C. sativa, como de outras plantas, passou por consideráveis mudanças, onde houveram avanços nas técnicas moleculares, de forma geral. No início dos mapeamentos de plantas, eram bastante utilizados os sequenciadores de leitura curta (fragmentos pequenos, necessitando de diversas rodadas para completar o sequenciamento do genoma inteiro).
Posteriormente, mais frequentemente foram sendo utilizados sequenciadores de terceira geração, como exemplos: Single-Molecule Real-Time (SMRT), PacBio e MinION (Oxford Nanopore Technologies), onde foi possível aprimorar consideravelmente a similaridade genética de 12 strains sequenciadas (Tabela 1).
O estudo com os sequenciadores resultou em uma análise dos cromossomos das strains Purple Kush, Finola (cânhamo), JL (acesso selvagem) e CBDRx (cs10). Dentre essas linhagens, o genoma da CBDRx (cs10) é a montagem mais completa em questão de genes alcançados, compreendendo 25.302 genes relacionados com expressão de proteínas.
O trabalho com a CBDRx (cs10) foi tão relevante, que o “International Cannabis Genomics Research Consortium” – ICRGC (“Consórcio Internacional de Pesquisa em Genômica de Cannabis”) realizou a proposta de coloca-lo como o modelo genômico da Cannabis sativa, onde o genoma completo está distribuído ao longo de 10 cromossomos.
Genes sexuais na C. sativa
O mapeamento dos cromossomos sexuais da Cannabis sativa foi outro avanço possível devido à genômica. Foram correlacionados 3500 genes com a determinação do sexo, onde a transcrição desses genes foram observados no genoma da Purple Kush e CBDRx (cs10 v 1.0 e cs10 v.2.0). Os genes estavam localizados nos cromossomos 1 e 10 (par de cromossomos sexuais).
Essas informações permitiram fazer uma varredura nesses loci dos cromossomos, onde pode gerar informações para melhorar principalmente as plantas femininas, com o aumento de caracteres intimamente relacionados ao sexo, como a concentração de cannabinóides.
Alguns cannabinoides altamente ligados ao sexo, como THCA (forma ácida do tetrahidrocannabinol) e CBDA (forma ácida do cannabidiol) são produzidos em concentrações intensamente maiores nas flores de plantas fêmeas (gineceu – pistilos) em comparação com as plantas machos (androceu – anteras). Com a genômica, pode surgir a capacidade de identificar previamente o sexo das plantas (unificação do sexo), onde para a produção comercial será de extrema importância (Cultivo Sensimilla).
*É importante ressaltar que os genes sexuais não estão restritos e localizados apenas nos cromossomos sexuais (cromossomos 1 e 10), muitos também estão localizados em outros cromossomos e relacionados também na produção de tricomas tectores e glandulares, hermafroditismo e independência de fotoperíodo (plantas automáticas – subespécie ruderalis).
Expressão de Cannabinóides
A compreensão do genoma da C. sativa elucidou várias vias de expressão da síntese de metabólitos secundários importantes para o mercado da planta, como o a produção de THC e CBD.
Nos estudos, ficou evidente que os genes THCAS (gene responsável pela expressão da forma ácida do tetrahidrocannabinol) e CBDAS (gene responsável pela expressão da forma ácida do cannabidiol) estão em locus diferentes, porém no mesmo cromossomo, tendo certa proximidade genômica, podendo estar relacionado com uma origem em comum, mesmo sendo metabólitos distintos.
Para analisar a expressão de cannabinóides, são feitos comparativos de primers/marcadores nas sequências (RNA-seq) de tricomas glandulares e tecido foliar proveniente de brácteas, onde ficaram evidentes, os seguintes resultados:
- A via de produção de THCA foi aumentada 15x em flores de Purple Kush em relação à linhagem Finola (hemp), gerando um contrase no perfil metabólico secundário.
- Para analisar a diferença de concentração de cannabinóides, foram realizadas várias amostragens, com várias plantas de cada linhagem e variações de tricomas glandulares (vários morfotipos);
- Na expressão de terpenos, ficou claro que o gene CsTPS está envolvido no acúmulo de mono e sesquiterpeno nas flores;
- O gene CBDAS está presente em maior número de cópias em comparativo com os genes THCAS e CBCAS (expressão do cannabicromeno – cannabinoide sem efeito psicotrópico e com efeito entourage);
- Possivelmente os genes THCAS e CBCAS são originados do CBDAS (através de evolução, possíveis indel´s – inserções e deleções genéticas ocorrendo através da duplicação de genes ao longo de cruzamentos) (Figura 2);
- As sequências de nucleotídeos do gene CBDAS é altamente similar entre as 12 linhagens (mais de 99% de identidade de nucleotídeos);
- Os consecutivos cruzamentos realizados pelos cultivadores para adquirir plantas com alto nível de THC geraram alta presença e replicação dos genes THCAS e CBCAS em vários loci dos cromossomos (Figura 3);
Vários genes THCAS, CBDAS e CBDAS posicionados em vários loci do cromossomo 6 não são expressos (genes inativos).



LOC115718836 (THC ativo/expresso);
LOC115720716 (THCA ativo/expresso);
LOC115717841 (CBDA ativo/expresso);
LOC115697880 (THCA inativo);
LOC115696609 (THCA inativo);
LOC115698060 (THCA inativo);
LOC115697886 (THCA inativo);
LOC115696884 (CBDA ativo/expresso);
LOC115697762 (CBDA ativo/expresso);
LOC115696987 (CBDA ativo/expresso);
LOC115696986 (THCA ativo/expresso);
LOC115697126 (CBDA ativo/expresso);
LOC115697019 (CBDA ativo/expresso);
Expressão de Terpenos
A planta da cannabis é uma grande produtora de terpenos (predominância de mono e sesquiterpenos) no seu perfil fitoquímico, onde a associação desses metabólitos secundários com os cannabinóides tem um poder de efeito “entourage/sinergia”.
A análise genômica rastreou 55 genes CsTPS envolvidos com a expressão de terpenos na C. sativa. Os genes foram divididos em subfamílias: CsTPS-a (síntese de sesquiterpeno) e CsTPS-b (síntese de monoterpeno), evidenciando uma grande divisão e variedade de terpenos já relatados, como: myrcene; pinene; linalool; limonene; humulene; eucalyptol; valencene; trans-nerolidol; terpinolene; phytol; geraniol; delta-3-carene; caryophylenne; camphene; borneol; bisabol, dentre outros. A divisão em sub-famílias de genes relacionados a expressão de terpenos revela que houveram duas grandes pressões/seleções direcionais para a diferenciação em monoterpeno (arranjo molecular com 2 isopropenos) e sesquiterpeno (arranjo molecular com 3 isopropenos).
Genômica na diversidade e criação de “Plantas Elite”
Os estudos em genômica e transcriptômica da C. sativa podem auxiliar os cultivadores e breeders/melhoristas a criarem perfis de cultivares “elite” de acordo com o perfil de mercado. Dessa forma, é possível identificar e manusear vários fatores desejáveis, como exemplos:
- Distinção e criação de cultivares com ótimo rendimento e destinação para uso adulto, medicinal e hemp;
- Síntese acentuada de cannabinóides;
- Montagem personalizada de perfil de terpenos;
- Rastreabilidade das linhagens ancestrais;
- Padronização e classificação real das Strains, onde atualmente com o lançamento de muitas cultivares parecidas, há muita perda de características marcantes e únicas de cada linhagem;
- Com a qualidade na criação das cultivares, o próprio breeder pode gerar uma tendência ou educação de mercado consumidor, sempre visando à evolução qualitativa das strains;
- Aumento do vigor das strains híbridas (cruzamentos com mais de uma sub-espécie: sativa, indica, ruderalis).
Pangenômica da Cannabis sativa
Uma das limitações do baseamento em um genoma isolado (exmplo: cs10 v 1.0) é a pobreza em detalhes genéticos e caracteres expressos, pois é apenas uma cultivar dentre inúmeras. Nesse sentido, o pangenoma é uma alternativa extremamente valiosa, onde pode ser considerado com um meta-genoma reunido, incluindo genomas completos de várias linhagens dentro de uma mesma espécie, onde o principal objetivo é reunir as informações genéticas de várias strains (aumento de diversidade), expandindo a quantidade de informações e podendo trabalhar com um conjunto de caracteres, podendo ter mais “poder” para montar uma “Strains de Elite”, com alta carga produtiva.
O cenário de pangenoma para a Cannabis sativa não está distante, pois com o aumento da acessibilidade de sequenciadores de leitura longa, a rapidez na construção de genomas completos de várias strains é um fator acelerador. Em outras culturas, o futuro já é uma realidade, como exemplo, o primeiro pangenoma de soja (Glycine max), foi construído em 2020, utilizando 29 linhagens silvestres, landraces e comerciais (Figuras 5 e 6).


Considerações Finais
A riqueza genética da Cannabis sativa ainda está longe de ser amplamente compreendida, onde estamos em passos iniciais. Porém com o avanço e rapidez das técnicas moleculares, em um futuro breve teremos um arsenal de informações para a escolha de caracteres desejáveis, principalmente de acordo com as demandas do mercado consumidor.
Nesse sentido, todo o conhecimento que for adquirido com a genômica será extremamente útil para aprofundar sucessivamente na criação de plantas “Elite”, onde o alcance em patamares de rendimento e fitoquímicos (ex: concentração de cannabinóides) ainda são inimagináveis.
Referências Bibliográficas
ADAMS, R.; HUNT, M.; CLARK, J. (1940) Structure of cannabidiol, a product isolated from the marihuana extract of Minnesota wild hemp. I. Journal of the American Chemical Society 62, P. 196 – 200.
AIZPURUA-OLAIZOLA, O.; SOYDANER, U.; ÖZTÜRK, E.; SCHIBANO, D.; SIMSIR, Y.; NAVARRO, P.; ETXEBARRIA, N.; USOBIAGA, A. (2016) Evolution of the cannabinoid and terpene content during the growth of Cannabis sativa plants from different chemotypes. Journal of Natural Products 79, P. 324 – 331
ALLEN, K., D.; MCKERNAN, K.; PAULI, C.; ROE, J.; TORRES, A.; GAUDINO, R. (2019) Genomic characterization of the complete terpene synthase gene family from Cannabis sativa. PLoS ONE 14: e0222363.
ANDRE, C., M.; HAUSMAN, J., F.; GUERRIERO,G. (2016) Cannabis sativa: the plant of the thousand and one molecules. Frontiers in Plant Science 4, P. 7 – 19.
BASAS-JAUMANDREU J.; DE LAS HERAS, F., X., C. (2020) GC-MS metabolite profile and identification of unusual homologous cannabinoids in high potency Cannabis sativa. Planta Medica 86, P. 338 – 347.
BAYER, P., E.; GOLICZ, A., A.; SCHEBEN, A.; BATLEY, J.; EDWARDS, D. (2020) Plant pan-genomes are the new reference. Nature Plants 6, P. 914 – 920.
BIELECKA M, KAMINSKI F, ADAMS I, POULSON H, SLOAN R, LI Y, LARSON TR, WINZER T, GRAHAM IA. (2014) Targeted mutation of Δ12 and Δ15 desaturase genes in hemp produce major alterations in seed fatty acid composition including a high oleic hemp oil. Plant Biotechnology Journal 12: 613– 623.
BOOTH, J., K.; YUEN, M., M.; JANCSIK, S.; MADILAO, L.; PAGE, J.; BOHLMANN,J. (2020) Terpene synthases and terpene variation in Cannabis sativa. Plant Physiology 184, P. 130 – 147.
BRAICH, S.; BAILLIE, R., C.; JEWELL, L., S.; SPANGENBERG, G., C.; COGAN, N., O., I. (2019) Generation of a comprehensive transcriptome atlas and transcriptome dynamics in medicinal cannabis. Scientific Reports 9, P. 1 – 12.
CAMPBELL, B., J.; BERRADA, A., F.; HUDALLA, C.; AMADUCCI, S.; MCKAY, J., K. (2019) Genotype × environment interactions of industrial hemp cultivars highlight diverse responses to environmental factors. Agrosystems, Geosciences & Environment 2, P. 1 – 11.
CAMPBELL, L., G.; NARAINE, S., G.; DUSFRESNE, J. (2019) Phenotypic plasticity influences the success of clonal propagation in industrial pharmaceutical Cannabis sativa. PLoS ONE 14: e0213434.
CITTI, C.; LINCIANO, P.; PANSERI, S.; VEZZALINI, F.; FORNI, F.; VANDELLI, M., A.; CANNAZZA, G. (2019) Cannabinoid profiling of hemp seed oil by liquid chromatography coupled to high-resolution mass spectrometry. Frontiers in Plant Science 10, PP. 120.
DE MEIJER, E., P., M.; BAGATTA, M.; CARBONI, A.; CRUCITTI, P.; MOLITERNI, V., M., C.; RANALLI, P.; MANDOLINO, G. (2003) The inheritance of chemical phenotype in Cannabis sativa L. Genetics 163, PP. 335 – 346.LIU, Y.; DU, H.; LI, P.; SHEN, Y.; PENG, H.; LIU, S.; ZHOU, G., A.; ZHANG, H.; LIU, Z.; SHI, M. (2020) Pan-genome of wild and cultivated soybeans. Cell 182, PP. 162 – 176.