jueves, junio 02, 2005

Fases : Proyecto de Mineria de Datos.

Las tecnicas son variadas, pero si hacemos un resumen podemos indicar estas fases:

Filtrado de Datos
El formato de los datos, jamas sera el ideal y a veces realizar algoritmos de busquedas seran complejos, por lo tanto debemos utilizar un preoceso de filtrado de Datos la forma de poder eliminar los valores incorrectos.

Seleccion de Variables.
Despues de la seleccion de Datos, debemos ver la seleccion de caracteristicas el cual reducira el tamaños de datos eligiendo las variables mas significativas
Las carateristicas mas significativas seran los mejores atributos del problema

Extraccion de Conocimiento.
Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos

Destacan, por ejemplo, como modelos predictivos las regresiones o modelos de red neuronal supervisada. Técnicas de agrupamiento habituales son el análisis cluster y los modelos neuronales de mapas autoorganizados. Para realizar segmentaciones, son frecuentes los análisis discriminantes y la regresión logística. Para detectar la afinidad, es decir, que una persona alquila una película de vídeo e inmediatamente se lleva una caja de patatas fritas se usan análisis de Fourier, generadores de asociaciones de reglas y otras técnicas. O, el caso real de una cadena de de supermercados americana: encontraron que los días jueves y sábado, los varones que compraban pañales también compraban cerveza.

Herramientas

SPSS DataMinig Microsoft SQL Servers 2000

Interpretacion y Evaluacion.
Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.