IDEAS home Printed from https://ideas.repec.org/a/erv/rccsrc/y2015i2015_0507.html
   My bibliography  Save this article

Aprendizaje Automatizado Para Clasificaciã“N De Secuencias Genã“Micas

Author

Listed:
  • Heidy Díaz Barrios
  • Yania Alemán Rivas
  • María del Carmen Chávez Cárdenas

Abstract

Las técnicas de clasificación se utilizan frecuentemente en la solución de diferentes problemas de la Bioinformatica. Las secuencias de ADN de la mayoría de los genes se transcriben en ARN mensajero que se traducen en proteínas. El ADN contiene en los genes segmentos codificantes (exones) y no codificantes (intrones). Durante el proceso de transcripción los intrones son “cortados†, mecanismo conocido como splicing que coloca a los exones de un gen consecutivamente, listos para traducirse en la secuencia de aminoácidos que conforman la proteína. En los splice sites, el principio del intrón es conocido como donor (par AG), y el final es conocido como acceptor (par GT). Un pequeño por ciento de estas combinaciones son splice sites reales. El presente trabajo aborda la predicción de sitios de splicing. Se utilizan técnicas de aprendizaje automatizado necesarias en la descripción de dominios biológicos y dos bases de datos de secuencias de nucleótidos, para clasificar verdaderos y falsos splice sites con 7000 casos cada una, 6000 falsos y 1000 verdaderos. Se prueba y compara una serie de algoritmos utilizando WEKA (Waikato Enviroment for Knowledge Analysis) para encontrar los mejores clasificadores. Para hacer la selección del mejor clasificador se aplican las medidas más conocidas basadas en la matriz de confusión: exactitud, razón de Verdaderos Positivos, área bajo la Curva de Operación del Receptor (ROC), etc… Como resultados del estudio se concluye que los métodos bayesianos maximizaron el número de verdaderos positivos y el área bajo la curva, por lo que es la propuesta a utilizar para realizar la clasificación de sitios de splicing.

Suggested Citation

  • Heidy Díaz Barrios & Yania Alemán Rivas & María del Carmen Chávez Cárdenas, 2015. "Aprendizaje Automatizado Para Clasificaciã“N De Secuencias Genã“Micas," Revista Caribeña de Ciencias Sociales, Servicios Académicos Intercontinentales SL, issue 2015_05, May.
  • Handle: RePEc:erv:rccsrc:y:2015:i:2015_05:07
    as

    Download full text from publisher

    File URL: http://www.eumed.net/rev/caribe/2015/05/donnor.html
    Download Restriction: no
    ---><---

    Corrections

    All material on this site has been provided by the respective publishers and authors. You can help correct errors and omissions. When requesting a correction, please mention this item's handle: RePEc:erv:rccsrc:y:2015:i:2015_05:07. See general information about how to correct material in RePEc.

    If you have authored this item and are not yet registered with RePEc, we encourage you to do it here. This allows to link your profile to this item. It also allows you to accept potential citations to this item that we are uncertain about.

    We have no bibliographic references for this item. You can help adding them by using this form .

    If you know of missing items citing this one, you can help us creating those links by adding the relevant references in the same way as above, for each refering item. If you are a registered author of this item, you may also want to check the "citations" tab in your RePEc Author Service profile, as there may be some citations waiting for confirmation.

    For technical questions regarding this item, or to correct its authors, title, abstract, bibliographic or download information, contact: Lisette Villamizar (email available below). General contact details of provider: https://www.eumed.net/rev/caribe/index.html .

    Please note that corrections may take a couple of weeks to filter through the various RePEc services.

    IDEAS is a RePEc service. RePEc uses bibliographic data supplied by the respective publishers.