Show simple item record

dc.contributor.authorRodriguez-Mazahua, Nidia
dc.contributor.authorAlor-Hernández, Giner
dc.contributor.authorLópez-Chau, Asdrúbal
dc.date.accessioned2023-08-13T01:56:20Z
dc.date.available2023-08-13T01:56:20Z
dc.date.issued2023-03-10
dc.identifier.urihttp://repositorios.orizaba.tecnm.mx:8080/xmlui/handle/123456789/760
dc.descriptionEl almacenamiento de datos provee arquitecturas y herramientas para que los ejecutivos comerciales organicen, entiendan y usen sistemáticamente los datos con el fin de tomar decisiones estratégicas. Los sistemas de almacenamiento de datos son herramientas útiles en un mundo competitivo y cambiante. Recientemente, varias compañías han invertido millones de dólares en el desarrollo de almacenes de datos para toda la empresa, por ello, el almacenamiento de datos representa una nueva estrategia de mercadotecnia indispensable y una manera de mantener a los consumidores, al aprender más sobre sus necesidades. Uno de los principales problemas que enfrentan los diseñadores de los Data Warehouse (DW) es la fragmentación. Existen varias técnicas de fragmentación horizontal que se basan en minería de datos, centrados en disminuir el tiempo de respuesta de las consultas y el costo de ejecución para hacer que el DW sea más eficiente. Sin embargo, se encontró que no existía alguna técnica de fragmentación horizontal que emplee un árbol de decisión para llevar a cabo la fragmentación en el DW. Dada la importancia de los árboles de decisión en la clasificación, ya que permiten obtener particiones puras (subconjuntos de tuplas) en un conjunto de datos utilizando medidas como el índice de Gini, la ganancia de información, la proporción de ganancia y, este trabajo de tesis tuvo como objetivo utilizar árboles de decisión en la fragmentación de un DW. Para hacer esto posible, se determinaron los requisitos necesarios para realizar la fragmentación horizontal mediante árboles de decisión y se diseñó el método de fragmentación llamado FTree, mismo que consiste en determinar las consultas OLAP (On-line Analytical Processing) más frecuentes, analizando los predicados utilizados por las consultas, y con base en esto construir el árbol de decisión para seleccionar el esquema de fragmentación horizontal. El método se implementó y validó en primera instancia utilizando SSB (Star Schema Benchmark), posteriormente se llevó a cabo la construcción de un Data Warehouse Turistíco donde FTree demostró su eficacia. Más tarde, se realizaron algunos experimentos para comparar los esquemas de fragmentación horizontal obtenidos por FTree con J48 versus el esquema seleccionado porotros clasificadores utilizando un modelo de costo. Finalmente, se comparó FTree contra un método del estado del arte.es
dc.description.abstractEl almacenamiento de datos provee arquitecturas y herramientas para que los ejecutivos comerciales organicen, entiendan y usen sistemáticamente los datos con el fin de tomar decisiones estratégicas. Los sistemas de almacenamiento de datos son herramientas útiles en un mundo competitivo y cambiante. Recientemente, varias compañías han invertido millones de dólares en el desarrollo de almacenes de datos para toda la empresa, por ello, el almacenamiento de datos representa una nueva estrategia de mercadotecnia indispensable y una manera de mantener a los consumidores, al aprender más sobre sus necesidades. Uno de los principales problemas que enfrentan los diseñadores de los Data Warehouse (DW) es la fragmentación. Existen varias técnicas de fragmentación horizontal que se basan en minería de datos, centrados en disminuir el tiempo de respuesta de las consultas y el costo de ejecución para hacer que el DW sea más eficiente. Sin embargo, se encontró que no existía alguna técnica de fragmentación horizontal que emplee un árbol de decisión para llevar a cabo la fragmentación en el DW. Dada la importancia de los árboles de decisión en la clasificación, ya que permiten obtener particiones puras (subconjuntos de tuplas) en un conjunto de datos utilizando medidas como el índice de Gini, la ganancia de información, la proporción de ganancia y, este trabajo de tesis tuvo como objetivo utilizar árboles de decisión en la fragmentación de un DW. Para hacer esto posible, se determinaron los requisitos necesarios para realizar la fragmentación horizontal mediante árboles de decisión y se diseñó el método de fragmentación llamado FTree, mismo que consiste en determinar las consultas OLAP (On-line Analytical Processing) más frecuentes, analizando los predicados utilizados por las consultas, y con base en esto construir el árbol de decisión para seleccionar el esquema de fragmentación horizontal. El método se implementó y validó en primera instancia utilizando SSB (Star Schema Benchmark), posteriormente se llevó a cabo la construcción de un Data Warehouse Turistíco donde FTree demostró su eficacia. Más tarde, se realizaron algunos experimentos para comparar los esquemas de fragmentación horizontal obtenidos por FTree con J48 versus el esquema seleccionado porotros clasificadores utilizando un modelo de costo. Finalmente, se comparó FTree contra un método del estado del arte.es
dc.description.sponsorshipCONACYT; TECNMes
dc.language.isoeses
dc.publisherInstituto Tecnológico de Orizabaes
dc.subjectFragmentación Híbridaes
dc.subjectArboles de Decisiónes
dc.titleFRAGMENTACIÓN HORIZONTAL DE ALMACENES DE DATOS USANDO ÁRBOLES DE DECISIÓNes
dc.typeThesises


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record