βοΈ Hands on - DataFrames columns missing 2
It's time to put everything you've learned into practice. Try to correctly complete this code!
Daje, dopo questo step Γ¨ tutta in discesa!
POV: sei un partecipante del workshop Data Hunters e vuoi curare i metadati del progetto ERP131433. Nel primo esercizio, verifica la correttezza del valore contenuto in una delle colonne sempre presenti. Nel secondo esercizio, verifica la presenza di una delle 6 colonne non sempre presenti, ed eventualmente la correttezza dellβinformazione contenuta!
ESERCIZIO 1
import pandas ___ ___
df = ___.___("ERP131433_df.tsv", sep="\t")
#verifica la correttezza dell'informazione contenuta nella colonna "instrument_model"
modello = ___["instrument_model"].___()
print(modello)
#non Γ¨ corretto
["VALORE SBAGLIATO"]
#crea una nuova colonna "SKIOME_instrument_model" con l'informazione corretta
df___ = "Illumina MiSeq"
ESERCIZIO 2
import pandas as pd
import ___
df = pd.read_csv("ERP131433_df.tsv", sep="\t")
colonne = df.___.___()
colonne_trovate = ___
#cerca il valore "Italy" per capire se esiste una colonna "individuals_nationality"
pattern = ___.compile(r"Italy", flags=re.___)
for colonna in ___:
if df[colonna].astype(str).str.contains(pattern).any():
___.append(___)
else:
pass
if ___(___)>0:
for colonna in colonne_trovate:
print(colonna, ___.unique())
else:
print("nessuna colonna trovata!")
#supponiamo che non Γ¨ stata trovata nessuna colonna contente "Italy":
#crea la colonna "SKIOME_individuals_nationality"
df___ = "Italy"
Trovi le soluzioni nel prossimo capitolo!