A) Obtener información relevante y útil a partir de los datos B) Recopilar la mayor cantidad de datos posible C) Mantener los datos en privado sin analizarlos D) Eliminar cualquier dato que no sea relevante
A) Algoritmos de clasificación B) Regresión lineal C) Métodos de cifrado de datos D) Funciones matemáticas complejas
A) La correlación muestra una relación entre variables, mientras que la causalidad implica una relación de causa y efecto B) La causalidad es más precisa que la correlación C) La correlación siempre indica una causa directa D) Correlación y causalidad son términos intercambiables
A) Un modelo que busca retroceder en el tiempo para analizar datos pasados B) Un modelo que ignora por completo los datos C) Un modelo que utiliza datos existentes para predecir resultados futuros D) Un modelo que se enfoca en analizar datos no relacionados
A) Análisis de datos recopilados en intervalos de tiempo secuenciales B) Análisis de datos sin considerar el tiempo C) Análisis de datos utilizando solo una variable D) Análisis de datos de forma aleatoria
A) Facilita la interpretación y comunicación de los resultados de manera efectiva B) Hace que los datos sean incomprensibles para cualquier persona C) Aumenta la complejidad de los datos sin beneficios claros D) Es un paso innecesario en el proceso de análisis
A) Descripción de patrones y características de los datos mediante estadísticas y visualización B) Eliminar cualquier descripción de los datos C) Generar datos nuevos no basados en la muestra D) Crear narrativas ficticias sobre los datos
A) Calcular los valores desconocidos de una población basándose en una muestra B) Eliminar cualquier parámetro innecesario en los datos C) Aplicar cambios drásticos a los datos originales D) Recolectar toda la información disponible sin procesarla
A) Medidas utilizadas para evaluar el rendimiento de un modelo predictivo B) Reglas arbitrarias para determinar el resultado de un análisis C) Información innecesaria que distrae de los resultados conseguidos D) Datos adicionales para complicar el análisis sin aportar información relevante
A) Un análisis exclusivo de palabras negativas en el texto B) Un proceso para generar texto aleatorio sin significado C) Eliminar cualquier sentimiento del análisis de texto D) Proceso de determinar la actitud o emoción asociada con un texto
A) Añadir ruido a los datos para dificultar el análisis B) Combinar múltiples conjuntos de datos en uno solo C) Convertir variables continuas en categorías discretas D) Eliminar variables sin importancia en los datos
A) El proceso de ajustar un modelo a nuevos datos de manera precisa B) Un ajuste óptimo del modelo a todos los datos disponibles C) La falta de ajuste de un modelo a los datos D) Cuando un modelo se ajusta demasiado a los datos de entrenamiento y pierde generalización
A) Proceso de duplicar los datos originales sin cambios B) Proceso de selección y transformación de atributos relevantes para análisis C) Proceso de ocultar información clave en los datos D) Proceso de añadir datos irrelevantes al análisis
A) Los nodos representan entidades (como personas) y los bordes las conexiones entre ellas B) Los nodos son datos irrelevantes y los bordes son límites entre regiones C) Los nodos son conectores y los bordes representan el flujo de datos D) Los nodos representan países y los bordes son eventos en la historia
A) Manipular los datos para obtener resultados específicos B) Ocultar intencionalmente información en los datos C) Proceso de descubrir patrones y conocimientos útiles en grandes conjuntos de datos D) Generar datos de forma aleatoria sin propósito definido
A) Los resultados nunca deben interpretarse en análisis de datos B) La interpretación de resultados no aporta valor al análisis C) Permite tomar decisiones fundamentadas basadas en los análisis realizados D) La interpretación de resultados puede distorsionar la realidad
A) Un proceso que implica aceptar un modelo sin ninguna validación B) Un método para duplicar los datos antes de analizarlos C) Método para evaluar el rendimiento de un modelo al dividir los datos en conjuntos de entrenamiento y prueba D) Un proceso innecesario que no aporta valor al modelo
A) Los datos limpios son difíciles de obtener y procesar B) Los datos limpios generan análisis incorrectos C) Los datos limpios no son necesarios en el análisis D) Los datos limpios garantizan la precisión y fiabilidad de los resultados
A) Reducir la dimensionalidad de un conjunto de datos conservando la mayor cantidad de información B) Añadir componentes innecesarios a los datos C) Aumentar la complejidad de los datos sin beneficio claro D) Eliminar por completo cualquier información en los datos
A) Un gráfico que muestra la distribución de un conjunto de datos y resalta los valores atípicos B) Un gráfico que oculta información sobre los datos C) Una representación visual de la correlación entre dos variables D) Un gráfico que simplifica los datos en exceso |