Implementação de árvores de decisão para propriedades tridimensionais em linguagem Python
Visualizar/ Abrir
Data
2015-07-13Autor
Silva, Raphael Giordano do Nascimento e
Metadata
Mostrar registro completoResumo
A bioinformática faz uso de técnicas computacionais para resultados biológicos. O desenho
racional de fármacos (RDD - Rational Drug Design) é uma importante subdivisão da
bioinformática que trata fundamentalmente da interação das macromoléculas, chamadas de receptores,
e moléculas menores chamadas de ligantes. O objetivo consiste em investigar o melhor
encaixe entre essas duas moléculas para realizar ou inibir funções específicas. Esse encaixe
pode ser medido pela energia livre de ligação (FEB - Free Energy Binding). A maioria dos algoritmos
de docagem molecular considera o receptor como uma estrutura rígida. Porém, um método
mais realista, e de melhor resultado, deve considerar não só o ligante como uma estrutura
flexível, mas também o receptor. Isso é possível por meio de uma técnica chamada de dinâmica
molecular (DM). Após os experimentos in silico de RDD, os melhores ligantes de um determinado
receptor são testados in vitro e um novo fármaco pode surgir. O algoritmo implementado
neste trabalho induz uma árvore de decisão para regressão, uma técnica de classificação onde o
atributo classe contínuo, que considera as propriedades tridimensionais para se ter um melhor
resultado em relação à técnicas de indução convencionais. O algoritmo utiliza as coordenadas
para dividir um nodo em duas partes, onde o átomo é avaliado em termos de sua posição em um
bloco que melhor represente sua posição no espaço. Um especialista de domínio pode então selecionar
conformações promissoras do receptor a partir do modelo induzido. Este trabalho trata
da implementação do algoritmo 3D-Tri na linguagem Python. Essa linguagem foi escolhida
devido ao seu amplo uso no contexto de mineração de dados, seu grande número de bibliotecas
disponíveis e a facilidade de escrita e leitura nessa linguagem. Testes foram realizados com
dados do ligante NUNL2, conhecido inibidor da bomba de efluxo AcrB (Acriflavine resistance
protein B). Esses testes resultaram em um modelo facilmente interpretado por um especialista
de domínio, uma característica do algoritmo 3D-Tri. Esta implementação visa acrescentar melhorias
ao algoritmo e ampliar o uso do mesmo, para consequentemente contribuir no processo
de RDD.
Coleções
Os arquivos de licença a seguir estão associados a este item: