Accede a los componentes de un DataFrame — Pandas 02
En ocasiones te gustará realizar operaciones en los componentes individuales y no en todo el DataFrame.
Se puede acceder a cada uno de los tres (3) componentes de un DataFrame (índice, columnas y datos) directamente desde un DataFrame. Cada uno de esos componentes es en sí mismo un objeto de Python con sus atributos y métodos únicos.
Vamos a extraer el índice, las columnas y los datos del DataFrame en variables separadas y luego mostraremos las columnas y el índice y como se heredan del mismo objeto.
¿Cómo lo haremos?
Utilizaremos el DataFrame
movie = pd.read_csv('data/movie.csv')
index = movie.index
columns = movie.columns
data = movie.values
Mostrar los valores de cada componente:
- index
- columns
- data
Mostrar el tipo (type) de cada componente del DataFrame (DF)
Los tipos para el índice como para las columnas están relacionados. El método integrado issubclass comprueba si RangeIndex es realmente una subclase de Index
issubclass(pd.RangeIndex, pd.Index)
True
Una forma común de referirse a los objetos es incluir el nombre del paquete seguido del nombre del tipo de objeto.
Observe cómo el atributo values DataFrame devolvió una matriz NumPy n-dimensional o ndarray. La mayoría de los pandas dependen en gran medida del ndarray.
Podrían considerarse el objeto base para los pandas sobre el que se construyen muchos otros objetos. Para ver esto, podemos mirar los valores del índice y
columnas: