Mais de 7.200 segmentos no genoma humano podem codificar novas proteínas

Existem bilhões de nucleotídeos no genoma humano, e os pesquisadores pensavam que poderia haver até 100.000 genes codificadores de proteínas codificados no genoma humano. Um dos principais objetivos do Projeto Genoma Humano foi identificar genes codificadores de proteínas na sequência genômica. Quando a grande maioria da sequência foi concluída por volta de 2003, no entanto, parecia haver apenas cerca de 20.000 genes codificadores de proteínas, que ocupam apenas cerca de dois por cento do genoma humano. Desde então, aprendemos que existem outras sequências com funções importantes que não codificam proteínas, como sequências de RNA reguladoras. Agora, os pesquisadores sugeriram que existem 7.200 segmentos de genes no genoma humano que podem potencialmente ser usados ​​para gerar novas proteínas. Este trabalho foi relatado na Nature Biotechnology

Muitas sequências curtas de DNA chamadas estruturas de leitura abertas (ORFs) foram encontradas no genoma. Houve evidências de que algumas dessas ORFs são transcritas e muitas têm funções biológicas, mas poucas são incluídas em bancos de dados de referência e permaneceram relativamente obscuras.

Os pesquisadores estão procurando colocar essas ORFs nesses materiais de referência para que mais pesquisadores possam encontrá-las se as sequências forem relevantes para seu trabalho. Os cientistas costumam comparar sequências em suas pesquisas com bancos de dados de referência para aprender mais sobre essas sequências ou genes, como se aparecem em outras espécies ou se carregam mutações.

As ORFs que interagem com partes do ribossomo, uma organela que gera proteínas a partir do mRNA, foram primeiro reunidas em um catálogo padronizado, embora muitos dos dados tenham sido obtidos de diferentes laboratórios de várias maneiras.

Os autores do estudo também queriam responder a algumas questões fundamentais, como exatamente o que constitui um gene ou proteína, e se os ribossomos apenas geram proteínas ou se os ribossomos também podem produzir outros tipos de moléculas. Agora, eles sugeriram que os bancos de dados de referência para o genoma humano deveriam ser revisados. Ensembl-GENCODE está integrando o novo catálogo ORF, e outros como UniProt e HGNC estão apoiando o esforço.

 

“É tremendamente excitante capacitar a comunidade de pesquisa com nosso novo catálogo”, disse o Dr. Sebastiaan van Heesch, líder do grupo do Princess Máxima Center para oncologia pediátrica. “É muito cedo para dizer se todas as seções inexploradas do DNA realmente representam proteínas, mas podemos ver claramente que algo inexplorado está acontecendo em todo o genoma humano e que o mundo deveria estar prestando atenção”.

“Por muito tempo, a comunidade científica foi deixada no escuro sobre essas ORFs”, disse Jonathan Mudge, do Instituto Europeu de Bioinformática (EMBL-EBI). “Estamos muito orgulhosos de que nosso trabalho será capaz de permitir que pesquisadores de todo o mundo comecem a estudá-los. Este é o ponto em que eles entram no mainstream da ciência genômica e médica, um esforço que esperamos ter ampla repercussão efeitos.”

3 de setembro de 2022
CNPJ: 23.298.851/0001-68 NACIENTIFICO - Cursos de Aprimoramento LTDA