Entender los tipos de datos — Pandas 03
En términos muy generales, los datos pueden clasificarse como continuos o categóricos.
Las categóricas son muy útiles para conocer información de tipo cualitativo, es decir, alguna cualidad de los datos. Las continuas nos aportan datos cuantitativos, es decir, cantidades y valores representados por números.
Pandas no clasifica ampliamente los datos como continuos o categóricos. En cambio, tiene definiciones técnicas precisas para muchos tipos de datos distintos.
La siguiente tabla contiene todos los tipos de datos de pandas, con sus cadenas equivalentes y algunas notas sobre cada tipo:
Mostremos el tipo de datos de cada columna en un DataFrame.
Utilicemos el atributo dtypes para mostrar cada columna junto con su tipo de datos:
Utilice el método dtypes.value_counts() para devolver el recuento de cada tipo de datos.
Cada columna debe ser de un tipo, por ejemplo cada valor en la columna aspect_ratio es un flotante de 64 bits y cada valor de la columna movie_facebook_likes es un número entero de 64 bits.
Datos homogéneos es otro término para referirse a columnas que tienen todas el mismo tipo.
Cuando una columna, es del tipo de datos de objeto, indica que toda la columna son cadenas.
Pandas creó su propio tipo de datos categóricos para manejar columnas de cadenas (o números) con un número fijo de valores posibles.