1. x
1.1. COL/LIN
1.1.1. Segmentar, Fatiar Colunas
1.1.1.1. Por 'type' da COL
1.1.1.1.1. df.select_dtypes(include='object') df.select_dtypes(include='number') df.select_dtypes(include='['object','category','datetime']
1.1.1.2. Sel COL(name)
1.1.1.2.1. df [ [ ' COL1' , 'COL2' ] ]
1.1.1.3. Sel COL com condição de linha de COLALVO
1.1.1.3.1. com isin ('LISTA DE VALORES']
1.1.1.3.2. com loc
1.1.1.4. Segmentar o df em 2 dfs randômicos
1.1.1.4.1. df1=df.sample(frac=0,75) df2=df.drop(df1.index)
1.1.2. Clear
1.1.2.1. Remover LIN com NaN
1.1.2.1.1. df.dropna()
1.1.2.2. Troca NaN por ....
1.1.2.2.1. df.fillna(n)
1.1.2.2.2. df.fillna(method='bfill')
1.1.2.2.3. df.fillna(method='ffill')
1.1.2.3. Remove LIN duplicada
1.1.2.3.1. df.drop_duplicates()
1.1.2.4. Apaga COL
1.1.2.4.1. só 1 COL
1.1.2.4.2. lista de colunas
1.1.2.5. Apaga index
1.1.2.5.1. df.reset_index(drop=True)
1.1.3. Converter
1.1.3.1. COL string -> float
1.1.3.1.1. df.astype({ 'dic de colunas: float'}.dtypes
1.1.3.1.2. pd.to_numeric(df.COL, erros='coerce')
1.1.3.1.3. df.apply(pd.to_numeric,erros='coerce').fillna
1.1.4. Mudar Ordens
1.1.4.1. Reverte ordens COL
1.1.4.1.1. df.loc[:,::-1]
1.1.4.2. Reverter ordens LIN
1.1.4.2.1. df.loc[::-1] ou df.loc[::-1].reset_index(drop=True)
1.1.5. Renomear
1.1.5.1. Renomear COL
1.1.5.1.1. df.rename(columns={'OLD NAME1':'NEW NAME1','old name2':'new name2'})
1.1.5.1.2. df = df.rename({'OLD NAME1':'NEW NAME1','old name2':'new name2'}, axis = 1)
1.1.6. Criar coluna nova
1.1.6.1. Criar COL Calculada No final
1.1.6.1.1. df['New COL']=df['COL num A'] * df['COL num B']*100/2
1.1.6.2. Criar COL calculada na POS
1.1.6.2.1. df.insert(POS,'New COL'], df['COL num A'] * df['COL num B']*4)
1.1.6.3. Criar COL vazia ou NaN
1.1.6.3.1. df.insert(POS, "Empty_1", "")
1.1.6.3.2. df.insert(POS, "Empty_2", np.nan)
1.2. Reduzir kB do DataFrame
1.2.1. Importa só colunas tais...
1.2.1.1. so_col=['classificacao','uf','horario'] pd.read_csv('ocorrencia.csv', usecols=so_col)
1.2.2. Importa tais colunas já como Category
1.2.2.1. dic={ 'colname1': 'category', 'colname3': 'category','col4': 'category'} df=pd.read_csv('arquivo com conames.csv',dtype=dic)
1.3. Teste se df1==df2
1.3.1. df1.equals(df2)
1.4. Escrever numa célula
1.4.1. df.at[rowindex,'COL']=
1.4.2. df ['col'][rowindex]=