Entender los tipos de datos — Pandas 03

En términos muy generales, los datos pueden clasificarse como continuos o categóricos.

Las categóricas son muy útiles para conocer información de tipo cualitativo, es decir, alguna cualidad de los datos. Las continuas nos aportan datos cuantitativos, es decir, cantidades y valores representados por números.

Pandas no clasifica ampliamente los datos como continuos o categóricos. En cambio, tiene definiciones técnicas precisas para muchos tipos de datos distintos.

Photo by Deon Black on Unsplash

La siguiente tabla contiene todos los tipos de datos de pandas, con sus cadenas equivalentes y algunas notas sobre cada tipo:

Mostremos el tipo de datos de cada columna en un DataFrame.

Utilicemos el atributo dtypes para mostrar cada columna junto con su tipo de datos:

Utilice el método dtypes.value_counts() para devolver el recuento de cada tipo de datos.

Cada columna debe ser de un tipo, por ejemplo cada valor en la columna aspect_ratio es un flotante de 64 bits y cada valor de la columna movie_facebook_likes es un número entero de 64 bits.

Datos homogéneos es otro término para referirse a columnas que tienen todas el mismo tipo.

Cuando una columna, es del tipo de datos de objeto, indica que toda la columna son cadenas.

Pandas creó su propio tipo de datos categóricos para manejar columnas de cadenas (o números) con un número fijo de valores posibles.

Thanks for reading!
¡Gracias por leer!

Gracias por llegar hasta aquí. Recibo con mucho agrado tus comentarios. Si gustas puedes seguirme en mis redes sociales en Instagram @arnulfo o LinkedIn.

--

--

Data Analyst | Speaker | CodeOrDie

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store