dc.contributor.author | Rodriguez-Mazahua, Nidia | |
dc.contributor.author | Alor-Hernández, Giner | |
dc.contributor.author | López-Chau, Asdrúbal | |
dc.date.accessioned | 2023-08-13T01:56:20Z | |
dc.date.available | 2023-08-13T01:56:20Z | |
dc.date.issued | 2023-03-10 | |
dc.identifier.uri | http://repositorios.orizaba.tecnm.mx:8080/xmlui/handle/123456789/760 | |
dc.description | El almacenamiento de datos provee arquitecturas y herramientas para que los ejecutivos comerciales organicen, entiendan y usen sistemáticamente los datos con el fin de tomar decisiones estratégicas. Los sistemas de almacenamiento de datos son herramientas útiles en un mundo competitivo y cambiante. Recientemente, varias compañías han invertido millones de dólares en el desarrollo de almacenes de datos para toda la empresa, por ello, el almacenamiento de datos representa una nueva estrategia de mercadotecnia indispensable y una manera de mantener a los consumidores, al aprender más sobre sus necesidades. Uno de los principales problemas que enfrentan los diseñadores de los Data Warehouse (DW) es la fragmentación. Existen varias técnicas de fragmentación horizontal que se basan en minería de datos, centrados en disminuir el tiempo de respuesta de las consultas y el costo de ejecución para hacer que el DW sea más eficiente. Sin embargo, se encontró que no
existía alguna técnica de fragmentación horizontal que emplee un árbol de decisión para llevar a cabo la fragmentación en el DW. Dada la importancia de los árboles de decisión en la clasificación, ya que permiten obtener particiones puras (subconjuntos de tuplas) en un conjunto de datos utilizando medidas como el índice de Gini, la ganancia de información, la proporción de ganancia y, este trabajo de tesis tuvo como objetivo utilizar árboles de decisión en la fragmentación de un DW. Para hacer esto posible, se determinaron los requisitos necesarios para realizar la fragmentación horizontal mediante árboles de decisión
y se diseñó el método de fragmentación llamado FTree, mismo que consiste en determinar las consultas OLAP (On-line Analytical Processing) más frecuentes, analizando los predicados utilizados por las consultas, y con base en esto construir el árbol de decisión para seleccionar el esquema de fragmentación horizontal. El método se implementó y validó en primera instancia utilizando SSB (Star Schema Benchmark), posteriormente se llevó a cabo la construcción de un Data Warehouse Turistíco donde FTree demostró su eficacia. Más tarde, se realizaron algunos experimentos para comparar los esquemas de
fragmentación horizontal obtenidos por FTree con J48 versus el esquema seleccionado porotros clasificadores utilizando un modelo de costo. Finalmente, se comparó FTree contra un método del estado del arte. | es |
dc.description.abstract | El almacenamiento de datos provee arquitecturas y herramientas para que los ejecutivos comerciales organicen, entiendan y usen sistemáticamente los datos con el fin de tomar decisiones estratégicas. Los sistemas de almacenamiento de datos son herramientas útiles en un mundo competitivo y cambiante. Recientemente, varias compañías han invertido millones de dólares en el desarrollo de almacenes de datos para toda la empresa, por ello, el almacenamiento de datos representa una nueva estrategia de mercadotecnia indispensable y una manera de mantener a los consumidores, al aprender más sobre sus necesidades. Uno de los principales problemas que enfrentan los diseñadores de los Data Warehouse (DW) es la fragmentación. Existen varias técnicas de fragmentación horizontal que se basan en minería de datos, centrados en disminuir el tiempo de respuesta de las consultas y el costo de ejecución para hacer que el DW sea más eficiente. Sin embargo, se encontró que no
existía alguna técnica de fragmentación horizontal que emplee un árbol de decisión para llevar a cabo la fragmentación en el DW. Dada la importancia de los árboles de decisión en la clasificación, ya que permiten obtener particiones puras (subconjuntos de tuplas) en un conjunto de datos utilizando medidas como el índice de Gini, la ganancia de información, la proporción de ganancia y, este trabajo de tesis tuvo como objetivo utilizar árboles de decisión en la fragmentación de un DW. Para hacer esto posible, se determinaron los requisitos necesarios para realizar la fragmentación horizontal mediante árboles de decisión
y se diseñó el método de fragmentación llamado FTree, mismo que consiste en determinar las consultas OLAP (On-line Analytical Processing) más frecuentes, analizando los predicados utilizados por las consultas, y con base en esto construir el árbol de decisión para seleccionar el esquema de fragmentación horizontal. El método se implementó y validó en primera instancia utilizando SSB (Star Schema Benchmark), posteriormente se llevó a cabo la construcción de un Data Warehouse Turistíco donde FTree demostró su eficacia. Más tarde, se realizaron algunos experimentos para comparar los esquemas de
fragmentación horizontal obtenidos por FTree con J48 versus el esquema seleccionado porotros clasificadores utilizando un modelo de costo. Finalmente, se comparó FTree contra un método del estado del arte. | es |
dc.description.sponsorship | CONACYT;
TECNM | es |
dc.language.iso | es | es |
dc.publisher | Instituto Tecnológico de Orizaba | es |
dc.subject | Fragmentación Híbrida | es |
dc.subject | Arboles de Decisión | es |
dc.title | FRAGMENTACIÓN HORIZONTAL DE ALMACENES DE DATOS USANDO ÁRBOLES DE DECISIÓN | es |
dc.type | Thesis | es |