Rimuovi automaticamente le righe duplicate in Excel

Excel è un'applicazione versatile che è cresciuta molto oltre le sue prime versioni semplicemente come una soluzione di foglio di calcolo. Impiegato come custode di record, rubrica, strumento di previsione e molto altro ancora, molte persone usano persino Excel in modi che non sono mai stati concepiti.

Se utilizzi Excel molto a casa o in ufficio, sai che a volte i file di Excel possono diventare rapidamente ingombranti a causa del numero di record con cui stai lavorando.

Fortunatamente, Excel ha funzioni integrate per aiutarti a trovare e rimuovere i record duplicati. Sfortunatamente, ci sono alcune limitazioni all'utilizzo di queste funzioni, quindi fai attenzione o potresti cancellare inconsapevolmente i record che non intendevi rimuovere. Inoltre, entrambi i metodi seguenti rimuovono immediatamente i duplicati senza farti vedere cosa è stato rimosso.

Citerò anche un modo per evidenziare le righe che sono duplicate per prime, in modo che tu possa vedere quali saranno rimosse dalle funzioni prima di eseguirle. Devi utilizzare una regola di formattazione condizionale personalizzata per evidenziare una riga completamente duplicata.

Rimuovi funzione duplicati

Supponiamo che tu usi Excel per tenere traccia degli indirizzi e sospetti di avere record duplicati. Guarda il foglio di lavoro Excel di esempio qui sotto:

Si noti che il record "Jones" appare due volte. Per rimuovere tali record duplicati, fare clic su Dati scheda sulla barra multifunzione e individuare il Rimuovi duplicati funzione sotto il Strumenti di dati sezione. Clicca su Rimuovi duplicati e si apre una nuova finestra.

Qui devi prendere una decisione in base al fatto che tu usi le etichette delle intestazioni in cima alle colonne. Se lo fai, seleziona l'opzione etichettata I miei dati hanno intestazioni. Se non si utilizzano le etichette di intestazione, verranno utilizzate le designazioni standard delle colonne di Excel, ad esempio Colonna A, Colonna B, ecc.

Per questo esempio, sceglieremo solo la colonna A e fare clic su ok pulsante. La finestra delle opzioni si chiude e Excel rimuove il secondo record "Jones".

Di certo, questo era solo un semplice esempio. È probabile che qualsiasi record di indirizzo che continui a utilizzare Excel sia molto più complicato. Supponiamo, per esempio, di avere un file di indirizzo simile a questo.

Si noti che, sebbene siano presenti tre record "Jones", solo due sono identici. Se abbiamo usato le procedure sopra per rimuovere i record duplicati, resterebbe solo una voce "Jones". In questo caso, dobbiamo estendere i nostri criteri decisionali per includere rispettivamente il nome e il cognome trovati nelle colonne A e B rispettivamente.

Per fare questo, ancora una volta fare clic sul Dati scheda sulla barra multifunzione e quindi fare clic su Rimuovi duplicati. Questa volta, quando viene visualizzata la finestra delle opzioni, scegliere le colonne A e B. Fare clic su ok pulsante e notare che questa volta Excel ha rimosso solo uno dei record di "Mary Jones".

Questo perché abbiamo detto a Excel di rimuovere i duplicati facendo corrispondere i record in base alle colonne A e B anziché solo alla colonna A. Più colonne scegli, più criteri devono essere soddisfatti prima che Excel consideri un record come duplicato. Scegli tutte le colonne se vuoi rimuovere le righe che sono completamente duplicate.

Excel ti fornirà un messaggio che ti dice quanti duplicati sono stati rimossi. Tuttavia, non ti mostrerà quali righe sono state cancellate! Scorri fino all'ultima sezione per vedere come evidenziare le righe duplicate prima di eseguire questa funzione.

Metodo di filtro avanzato

Il secondo modo per rimuovere i duplicati consiste nell'utilizzare l'opzione di filtro avanzato. Innanzitutto, seleziona tutti i dati nel foglio. Successivamente, nella scheda Dati nella barra multifunzione, fare clic su Avanzate nel Ordina e filtra sezione.

Nella finestra di dialogo che si apre, assicurati di controllare il Solo record unici casella di controllo.

Puoi filtrare l'elenco sul posto oppure copiare gli elementi non duplicati in un'altra parte dello stesso foglio di calcolo. Per qualche strano motivo, non è possibile copiare i dati su un altro foglio. Se lo si desidera su un altro foglio, selezionare prima una posizione sul foglio corrente e quindi tagliare e incollare i dati in un nuovo foglio.

Con questo metodo, non si ottiene nemmeno un messaggio che indica quante righe sono state rimosse. Le righe vengono rimosse e il gioco è fatto.

Evidenzia Righe duplicate in Excel

Se vuoi vedere quali record sono duplicati prima di rimuoverli, devi fare un po 'di lavoro manuale. Sfortunatamente, Excel non ha un modo per evidenziare le righe che sono completamente duplicate. Ha una funzione con la formattazione condizionale che evidenzia le celle duplicate, ma questo articolo riguarda le righe duplicate.

La prima cosa che devi fare è aggiungere una formula in una colonna a destra del set di dati. La formula è semplice: basta concatenare tutte le colonne per quella riga insieme.

= A1 e B1 e C1 e D1 e E1

Nel mio esempio qui di seguito, ho dati nelle colonne da A a F. Tuttavia, la prima colonna è un numero ID, quindi escludo quello dalla mia formula di seguito. Assicurati di includere tutte le colonne in cui sono presenti i dati per i quali vuoi verificare la presenza di duplicati.

Ho inserito la formula nella colonna H e poi l'ho trascinata per tutte le mie righe. Questa formula combina semplicemente tutti i dati di ogni colonna come un'unica grande porzione di testo. Ora, salta un paio di altre colonne e inserisci la seguente formula:

= COUNTIF ($ H $ 1: $ H $ 34, $ H1)> 1

Qui stiamo usando la funzione COUNTIF e il primo parametro è l'insieme di dati che vogliamo esaminare. Per me, questa era la colonna H (che ha la formula dei dati di combinazione) dalla riga 1 alla 34. È anche una buona idea sbarazzarsi della riga di intestazione prima di fare ciò.

Dovrai anche assicurarti di usare il simbolo del dollaro ($) davanti alla lettera e al numero. Se si dispone di 1000 righe di dati e la formula della riga combinata si trova nella colonna F, ad esempio, la formula sarà simile a questa:

= COUNTIF ($ F $ 1: $ F $ 1000, $ F1)> 1

Il secondo parametro ha solo il simbolo del dollaro davanti alla lettera della colonna, quindi è bloccato, ma non vogliamo bloccare il numero della riga. Di nuovo, lo trascinerete verso il basso per tutte le vostre righe di dati. Dovrebbe apparire come questo e le righe duplicate dovrebbero avere VERO in loro.

Ora, evidenziamo le righe che contengono VERO in quanto quelle sono le righe duplicate. Innanzitutto, seleziona l'intero foglio di lavoro facendo clic sul piccolo triangolo nell'intersezione in alto a sinistra di righe e colonne. Ora vai alla scheda Home, quindi fai clic su Formattazione condizionale e fare clic su Nuova regola.

Nella finestra di dialogo, fare clic su Utilizzare una formula per determinare quali celle formattare.

Nella casella sotto Formatta i valori in cui questa formula è vera:, inserire la seguente formula, in sostituzione P con la colonna che ha i valori VERO o FALSO. Assicurati di includere il simbolo del dollaro davanti alla lettera della colonna.

= $ P1 = TRUE

Dopo averlo fatto, fai clic su Formato e fai clic sulla scheda Riempimento. Scegli un colore e questo verrà usato per evidenziare l'intera riga duplicata. Fare clic su OK e ora dovresti vedere le righe duplicate evidenziate.

Se questo non ha funzionato per te, ricomincia e fallo di nuovo lentamente. Deve essere fatto esattamente giusto per far funzionare tutto questo. Se ti manca un singolo simbolo $ lungo il percorso, non funzionerà correttamente.

Avvertenze con la rimozione di record duplicati

Ci sono, naturalmente, alcuni problemi con lasciare che Excel rimuova automaticamente i record duplicati per te. Innanzitutto, devi stare attento a scegliere troppe poche o troppe colonne affinché Excel possa essere utilizzato come criterio per l'identificazione dei record duplicati.

Troppo pochi e potresti inavvertitamente cancellare i record che ti servono. Troppi o includendo una colonna identificatore per errore e non si troveranno duplicati.

In secondo luogo, Excel presuppone sempre che il primo record univoco che incontra sia il record principale. Si presume che tutti i record successivi siano duplicati. Questo è un problema se, ad esempio, non è stato possibile modificare un indirizzo di una delle persone nel file, ma invece creato un nuovo record.

Se il nuovo record di indirizzo (corretto) viene visualizzato dopo il vecchio record (non aggiornato), Excel presuppone che il primo record (non aggiornato) sia il master e che elimini tutti i record successivi rilevati. Questo è il motivo per cui bisogna stare attenti a quanto liberalmente o prudentemente si consente a Excel di decidere quale sia o meno un record duplicato.

In questi casi, dovresti utilizzare il metodo di evidenziazione in duplicato di cui ho scritto e cancellare manualmente il record duplicato appropriato.

Infine, Excel non ti chiede di verificare se vuoi veramente cancellare un record. Utilizzando i parametri scelti (colonne), il processo è completamente automatizzato. Questa può essere una cosa pericolosa quando hai un numero enorme di record e ti fidi che le decisioni che hai preso siano corrette e permetti a Excel di rimuovere automaticamente i record duplicati per te.

Inoltre, assicurati di controllare il nostro precedente articolo sull'eliminazione di righe vuote in Excel. Godere!