PANDAS Manuseio de DataFrames

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
PANDAS Manuseio de DataFrames par Mind Map: PANDAS  Manuseio de DataFrames

1. x

1.1. COL/LIN

1.1.1. Segmentar, Fatiar Colunas

1.1.1.1. Por 'type' da COL

1.1.1.1.1. df.select_dtypes(include='object') df.select_dtypes(include='number') df.select_dtypes(include='['object','category','datetime']

1.1.1.2. Sel COL(name)

1.1.1.2.1. df [ [ ' COL1' , 'COL2' ] ]

1.1.1.3. Sel COL com condição de linha de COLALVO

1.1.1.3.1. com isin ('LISTA DE VALORES']

1.1.1.3.2. com loc

1.1.1.4. Segmentar o df em 2 dfs randômicos

1.1.1.4.1. df1=df.sample(frac=0,75) df2=df.drop(df1.index)

1.1.2. Clear

1.1.2.1. Remover LIN com NaN

1.1.2.1.1. df.dropna()

1.1.2.2. Troca NaN por ....

1.1.2.2.1. df.fillna(n)

1.1.2.2.2. df.fillna(method='bfill')

1.1.2.2.3. df.fillna(method='ffill')

1.1.2.3. Remove LIN duplicada

1.1.2.3.1. df.drop_duplicates()

1.1.2.4. Apaga COL

1.1.2.4.1. só 1 COL

1.1.2.4.2. lista de colunas

1.1.2.5. Apaga index

1.1.2.5.1. df.reset_index(drop=True)

1.1.3. Converter

1.1.3.1. COL string -> float

1.1.3.1.1. df.astype({ 'dic de colunas: float'}.dtypes

1.1.3.1.2. pd.to_numeric(df.COL, erros='coerce')

1.1.3.1.3. df.apply(pd.to_numeric,erros='coerce').fillna

1.1.4. Mudar Ordens

1.1.4.1. Reverte ordens COL

1.1.4.1.1. df.loc[:,::-1]

1.1.4.2. Reverter ordens LIN

1.1.4.2.1. df.loc[::-1] ou df.loc[::-1].reset_index(drop=True)

1.1.5. Renomear

1.1.5.1. Renomear COL

1.1.5.1.1. df.rename(columns={'OLD NAME1':'NEW NAME1','old name2':'new name2'})

1.1.5.1.2. df = df.rename({'OLD NAME1':'NEW NAME1','old name2':'new name2'}, axis = 1)

1.1.6. Criar coluna nova

1.1.6.1. Criar COL Calculada No final

1.1.6.1.1. df['New COL']=df['COL num A'] * df['COL num B']*100/2

1.1.6.2. Criar COL calculada na POS

1.1.6.2.1. df.insert(POS,'New COL'], df['COL num A'] * df['COL num B']*4)

1.1.6.3. Criar COL vazia ou NaN

1.1.6.3.1. df.insert(POS, "Empty_1", "")

1.1.6.3.2. df.insert(POS, "Empty_2", np.nan)

1.2. Reduzir kB do DataFrame

1.2.1. Importa só colunas tais...

1.2.1.1. so_col=['classificacao','uf','horario'] pd.read_csv('ocorrencia.csv', usecols=so_col)

1.2.2. Importa tais colunas já como Category

1.2.2.1. dic={ 'colname1': 'category', 'colname3': 'category','col4': 'category'} df=pd.read_csv('arquivo com conames.csv',dtype=dic)

1.3. Teste se df1==df2

1.3.1. df1.equals(df2)

1.4. Escrever numa célula

1.4.1. df.at[rowindex,'COL']=

1.4.2. df ['col'][rowindex]=