Resum de la meva Tesi - Mineria de Dades aplicada a l'anàlisi de la deserció a la Cursa de Analista en Sistemes de Computació

En la present investigació es va realitzar una Mineria de Dades sobre el Cub 04 desgranant, exportat del Sistema de Gestió Acadèmica SIU-Guaraní, proveïts pel Ministeri d'Educació, Ciència i Tecnologia de la Nació.

L'objectiu principal va ser maximitzar la qualitat que els models tenen per classificar i agrupar els estudiants, d'acord a les seves característiques acadèmiques, factors socials i demogràfics, que han desertat de la Carrera Analista en Sistemes de Computació de la Facultat de Ciències Exactes, Químiques i Naturals de la Universitat Nacional de Missions.

Després, aquests models van ser utilitzats per realitzar pronòstics sobre la resta dels alumnes.

El projecte es va desenvolupar sota la metodologia de lliure difusió Crisp-DM i amb l'eina comercial IBM DB2 Warehouse (versió 9.5).

La qualitat dels models obtinguts a través de la classificació amb arbres de decisió va superar a la tècnica d'agrupament a través de la generació de clústers i totes dues han superat àmpliament el plantejat.

 

Descàrrega el document Mineria de Datos aplicada al análisis de la deserción en la Carrera de Analista en Sistemas de Computación.

 

 

Contingut relacionat

  • Resum

     

  • En el post del nostre fòrum CRISP-DM Traducció a l'espanyol Daniel Alejandro adjunta un document amb una traducció en castellà de la metodologia de CRISP-DM per al desenvolupament de models de mineria de dades. El contingut del mateix ens sembla tan interesant per a la comunitat que ho publiquem en forma de manual online per fer-ho més accessible a tots els membres. Es pot consultar seguint el link Metodologia CRISP-DM 1.0  Adjuntem també el document original en anglès a partir del qual Daniel ha realtzat la traducció.

  • En la Universitat Oberta de Catalunya es pot cursar el Màster de 'Programari Lliure' sobre sofware de Lliure Distribució. Per estar d'acord amb la filosofia lligada al desenvolupament d'aquest tipus de sofware la UOC ha decidit anar publicant els materials docents de les assignatures que es van cursant en aquest Màster.
    Una d'aquestes publicacions són els apunts de l'assignatura Bases de Dades, on s'expliquen els conceptes més importants sobre bases de dades, evolució històrica, el model Relacional de Bases de Dades, el llenguatge de consulta SQL i disseny de models de bases de dades. Després es pot aplicar aquesta teoria sobre MySQL i PostgreSQL, dues dels sistemes gestors de base de dades de lliure distribució més coneguts, dels quals s'aporten característiques, detallis funcionament i nocions d'administració.
    Aquest és el temari que abasten aquestes anotacions, extret de l'índex del mateix document. Seguint l'enllaç del títol de cada mòdul es pot descarregar en format pdf:

  • La mineria de dades, o data mining, és el procés no trivial de descobrir patrons vàlids, nous, potencialment útils i comprensibles dintre d'un conjunt de dades, segons la definició de Piatetsky-Shapiro publicada en la revista "AI Magazine".

    Per a simplificar-lo, podríem dir que la mineria de dades tracta d'extreure coneixement a partir de les dades.
    Mitjançant una sèrie de processos aplicats en diferents fases sobre les dades brutes, i definits per un expert que conegui el significat d'aquestes dades, i tingui clars els objectius que persegueix, es poden extreure relacions entre aquestes dades, descobrir patrons ocults i construir models que descriguin aquest coneixement. Les fases per les quals hauria de passar aquest procés de descobriment de coneixement són les següents:

  • Josep Lluis Cano és l'autor del llibre Business Intelligence: competir amb Informació. Aquesta excel lent obra explica en què consisteix el Business Intelligence i pot ser una gran guia per abordar projectes de BI. Està orientat sobretot per a directius de pimes que vulguin entrar en el món BI, i fer la seva empresa més competitiva, per la qual cosa el llenguatge és clar i el contingut molt pràctic.

    Els primers capítols tenen tot el necessari per saber què és el BI, què pot aportar a l'empresa, quines són les seves bases tècniques, i com es pot organitzar un projecte de Business Intelligence:

    Capítol 1. Introducció a la Business Intelligence
    Capítol 2. Modelització del Negoci
    Capítol 3. Model de dades
    Capítol 4. Components de Business Intelligence
    Capítol 5. Projectes de Business Intelligence

    Els dos últims capítols són especialment pràctics, i contenen referències a diferents eines i proveïdors L'empresa i casos d'èxit d'implementacions de projectes d'aquest tipus: