Análisis - Examen

1. ¿Cuál es el objetivo del análisis de datos?

A) Mantener los datos en privado sin analizarlos
B) Recopilar la mayor cantidad de datos posible
C) Obtener información relevante y útil a partir de los datos
D) Eliminar cualquier dato que no sea relevante

2. ¿Cuál de las siguientes técnicas se usa comúnmente en el análisis de datos?

A) Funciones matemáticas complejas
B) Algoritmos de clasificación
C) Regresión lineal
D) Métodos de cifrado de datos

3. ¿Cuál es la diferencia entre correlación y causalidad en análisis de datos?

A) Correlación y causalidad son términos intercambiables
B) La causalidad es más precisa que la correlación
C) La correlación muestra una relación entre variables, mientras que la causalidad implica una relación de causa y efecto
D) La correlación siempre indica una causa directa

4. ¿Qué es un modelo predictivo en análisis de datos?

A) Un modelo que ignora por completo los datos
B) Un modelo que utiliza datos existentes para predecir resultados futuros
C) Un modelo que se enfoca en analizar datos no relacionados
D) Un modelo que busca retroceder en el tiempo para analizar datos pasados

5. ¿Qué es el análisis de series temporales?

A) Análisis de datos recopilados en intervalos de tiempo secuenciales
B) Análisis de datos de forma aleatoria
C) Análisis de datos sin considerar el tiempo
D) Análisis de datos utilizando solo una variable

6. ¿Por qué es importante la visualización de datos en análisis?

A) Es un paso innecesario en el proceso de análisis
B) Facilita la interpretación y comunicación de los resultados de manera efectiva
C) Aumenta la complejidad de los datos sin beneficios claros
D) Hace que los datos sean incomprensibles para cualquier persona

7. ¿Qué es el análisis descriptivo en el contexto de análisis de datos?

A) Descripción de patrones y características de los datos mediante estadísticas y visualización
B) Crear narrativas ficticias sobre los datos
C) Eliminar cualquier descripción de los datos
D) Generar datos nuevos no basados en la muestra

8. ¿Qué implica la estimación de parámetros en el análisis estadístico?

A) Aplicar cambios drásticos a los datos originales
B) Calcular los valores desconocidos de una población basándose en una muestra
C) Eliminar cualquier parámetro innecesario en los datos
D) Recolectar toda la información disponible sin procesarla

9. ¿Qué son las métricas de evaluación en análisis predictivo?

A) Información innecesaria que distrae de los resultados conseguidos
B) Reglas arbitrarias para determinar el resultado de un análisis
C) Medidas utilizadas para evaluar el rendimiento de un modelo predictivo
D) Datos adicionales para complicar el análisis sin aportar información relevante

10. ¿Qué es el análisis de sentimiento en la minería de texto?

A) Un proceso para generar texto aleatorio sin significado
B) Proceso de determinar la actitud o emoción asociada con un texto
C) Eliminar cualquier sentimiento del análisis de texto
D) Un análisis exclusivo de palabras negativas en el texto

11. En análisis de datos, ¿qué es la discretización?

A) Convertir variables continuas en categorías discretas
B) Combinar múltiples conjuntos de datos en uno solo
C) Eliminar variables sin importancia en los datos
D) Añadir ruido a los datos para dificultar el análisis

12. En el ámbito del análisis predictivo, ¿qué es el overfitting?

A) La falta de ajuste de un modelo a los datos
B) El proceso de ajustar un modelo a nuevos datos de manera precisa
C) Un ajuste óptimo del modelo a todos los datos disponibles
D) Cuando un modelo se ajusta demasiado a los datos de entrenamiento y pierde generalización

13. ¿Qué es la extracción de características en el análisis de datos?

A) Proceso de añadir datos irrelevantes al análisis
B) Proceso de ocultar información clave en los datos
C) Proceso de duplicar los datos originales sin cambios
D) Proceso de selección y transformación de atributos relevantes para análisis

14. En el contexto del análisis de redes sociales, ¿qué son los nodos y los bordes?

A) Los nodos son conectores y los bordes representan el flujo de datos
B) Los nodos representan países y los bordes son eventos en la historia
C) Los nodos son datos irrelevantes y los bordes son límites entre regiones
D) Los nodos representan entidades (como personas) y los bordes las conexiones entre ellas

15. ¿Qué es la minería de datos?

A) Manipular los datos para obtener resultados específicos
B) Generar datos de forma aleatoria sin propósito definido
C) Proceso de descubrir patrones y conocimientos útiles en grandes conjuntos de datos
D) Ocultar intencionalmente información en los datos

16. ¿Por qué es importante la interpretación de los resultados en análisis de datos?

A) Los resultados nunca deben interpretarse en análisis de datos
B) La interpretación de resultados no aporta valor al análisis
C) Permite tomar decisiones fundamentadas basadas en los análisis realizados
D) La interpretación de resultados puede distorsionar la realidad

17. ¿Qué es la validación cruzada en análisis de modelos?

A) Un método para duplicar los datos antes de analizarlos
B) Un proceso innecesario que no aporta valor al modelo
C) Método para evaluar el rendimiento de un modelo al dividir los datos en conjuntos de entrenamiento y prueba
D) Un proceso que implica aceptar un modelo sin ninguna validación

18. ¿Por qué se consideran importantes los datos limpios en el análisis?

A) Los datos limpios no son necesarios en el análisis
B) Los datos limpios son difíciles de obtener y procesar
C) Los datos limpios generan análisis incorrectos
D) Los datos limpios garantizan la precisión y fiabilidad de los resultados

19. ¿Cuál es el objetivo del análisis de componentes principales (PCA)?

A) Eliminar por completo cualquier información en los datos
B) Añadir componentes innecesarios a los datos
C) Aumentar la complejidad de los datos sin beneficio claro
D) Reducir la dimensionalidad de un conjunto de datos conservando la mayor cantidad de información

20. ¿Qué es un diagrama de caja (boxplot) en análisis de datos?

A) Un gráfico que oculta información sobre los datos
B) Un gráfico que simplifica los datos en exceso
C) Una representación visual de la correlación entre dos variables
D) Un gráfico que muestra la distribución de un conjunto de datos y resalta los valores atípicos

Examen creado con That Quiz — donde se practican las matemáticas.