πͺ Solution - DataFrames columns missing 2
Did you successfully complete the code?
Daje, dopo questo step Γ¨ tutta in discesa!
POV: sei un partecipante del workshop Data Hunters e vuoi curare i metadati del progetto ERP131433. Nel primo esercizio, verifica la correttezza del valore contenuto nella colonna onnipresente. Nel secondo esercizio,verifica la presenza di una delle 7 colonne non sempre presenti, ed eventualmente la correttezza dellβinformazione contenuta!
ESERCIZIO 1
import pandas as pd
df = pd.read_csv("ERP131433_df.tsv", sep="\t")
#verifica la correttezza dell'informazione contenuta nella colonna "instrument_model"
modello = df["instrument_model"].unique()
print(modello)
#non Γ¨ corretto
["VALORE SBAGLIATO"]
#crea una nuova colonna con l'informazione corretta
df["SKIOME_instrument_model"] = "Illumina MiSeq"
ESERCIZIO 2
import pandas as pd
import re
df = pd.read_csv("ERP131433_df.tsv", sep="\t")
colonne = df.columns.to_list()
colonne_trovate = []
#cerca il valore "Italy" per capire se esiste una colonna "individuals_nationality"
pattern = re.compile(r"Italy", flags=re.IGNORECASE)
for colonna in colonne:
if df[colonna].astype(str).str.contains(pattern).any():
colonne_trovate.append(colonna)
else:
pass
if len(colonne_trovate)>0:
for colonna in colonne_trovate:
print(colonna, df[colonna].unique())
else:
print("nessuna colonna trovata!")
#supponiamo che non Γ¨ stata trovata nessuna colonna contente "Italy":
#crea la colonna "SKIOME_individuals_nationality"
df["SKIOME_individuals_nationality"] = "Italy"
Se hai dubbi scrivimi! sara.fumagalli@unimib.it