¿Una tabla tiene datos duplicados? ¿Cómo podemos saberlo?

La forma “a lo bruto” es escribir un SELECT ordenado por la columna que nos interesa y luego mirar si encontramos algún duplicado. Claro, eso es factible si la tabla tiene pocas filas, quizás hasta unas pocas decenas, pero si tiene miles o millones de filas es imposible porque nadie tiene el tiempo ni las ganas de revisar millones de filas para ver si dos o más de ellas son idénticas.

¿Cómo lo averiguamos entonces?

Con este simple SELECT:

SELECT
   MiColumnaBuscada,
   Count(*)
FROM
   MiTabla
GROUP BY
   MiColumnaBuscada
HAVING
   Count(*) > 1

Y así muy fácilmente podremos saber si tenemos datos duplicados (o triplicados, o cuadruplicados, o ….)

 

 

Anuncios