Modelo para la clasificación de secuencias, en problemas de la bioinformática, usando técnicas de inteligencia artificial

dc.contributor.advisorGarcía Lorenzo, María Matilde
dc.contributor.advisorGrau Ábalo, Ricardo del Corazón
dc.contributor.authorBonet Cruz, Isis
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2020-03-11T15:12:30Z
dc.date.available2020-03-11T15:12:30Z
dc.date.issued2008
dc.description.abstractLa motivación del trabajo es predecir la resistencia del VIH ante siete inhibidores de la proteasa, a partir de bases de casos de genotipo y fenotipo, mediante el desarrollo y aplicación de nuevas técnicas de inteligencia artificial. Se obtiene un modelo integrador que facilita la solución de problemas de clasificación de secuencias dentro de la bioinformática, mediante la combinación de métodos y la selección de rasgos basada en información biológica, para potenciar la eficacia de los pronósticos. Se proponen dos métodos de clasificación que parten del uso de las energías de contacto asociadas a cada aminoácido y consideran como clase la resistencia o susceptibilidad ante fármacos. El primero está basado en redes neuronales recurrentes bidireccionales con un módulo que combina las salidas de los diferentes tiempos en la red. El segundo combina varios modelos de clasificación a partir de un metaclasificador. La red recurrente tiene la ventaja de poder trabajar con secuencias de longitud variable, con inserciones o eliminaciones. El modelo multiclasificador es útil cuando se está en presencia de secuencias alineadas. Además se proponen dos medidas de distancias basadas en información biológica: la primera para comprobar relación entre posiciones en las secuencias, la segunda para analizar visualmente los datos.en_US
dc.description.abstractThe motivation of this thesis is to predict the HIV drugs resistance from the available information of the virus genotype and phenotype by developing new Artificial Intelligence techniques. An integrated model with methods combination and features selection based on biological information was obtained improving the efficacy in Bioinformatics sequences classification. Two classification methods are proposed: the bidirectional recurrent neural networks with an aggregation module to combine the outputs per times into a single classification, and the combination of diverse classification models with a meta-classifier. Both methods take the contact energies of the amino acids as features and the drugs resistance or susceptibility as objective feature. The recurrent neural network is many helpful in sequences with dynamic size caused by deletion or insertion mutations. The multiclassifier model is useful in aligned sequences. Two distance measures with biological meaning are introduced as well: the first one to support position relations, and the second one to visually analyze the data.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/12468
dc.language.isoesen_US
dc.publisherUniversidad Central "Marta Abreu" de Las Villas. Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectModelo Multiclasificadoren_US
dc.subjectClasificación de Secuenciasen_US
dc.subjectProblemas de la Bioinformáticaen_US
dc.subjectTécnicas de Inteligencia Artificialen_US
dc.titleModelo para la clasificación de secuencias, en problemas de la bioinformática, usando técnicas de inteligencia artificialen_US
dc.typeThesisen_US
dc.type.thesisphden_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Tesis.pdf
Tamaño:
713.25 KB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: