메뉴 건너뛰기

조회 수 1949 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

MySQL DB작업을 하다보면 table에 포함된 중복된 데이터를 골라내서 삭제하고 싶을때가 있다.

revenue라는 테이블안에 collect_date, currency, amount라는 세개의 필드가 있다고 가정할때, collect_date currency가 동일하다면 중복된 데이터라고 가정한다.

샘플 데이터

2017-01-01, KRW, 10
2017-01-01, KRW, 10
2017-01-01, USD, 2
2017-01-02, KRW, 34
2017-01-01, USD, 2

위 데이터에서 2017-01-01, KRW, 10 가 중복된 것을 볼 수있다. 중복 데이터를 제거하려면 어떻게 해야할까?

1차 시도: 실패

DELETE
FROM revenue 
WHERE id IN 
(
    (SELECT id FROM revenue GROUP BY collect_date, currency HAVING count(*) > 1)
) 
  • GROUP BY 쿼리를 이용하여 데이터를 aggregate 한 후에 중복된 데이터가 하나 이상 존재하는 경우를 찾는다.
  • 찾아진 데이터의 id 값을 SELECT해서 DELETE한다.

이렇게 단순히 접근하면 아래와 같은 에러를 만나게 된다.

You can't specify target table 'revenue' for update in FROM clause

MySQL에는 SELECT 서브쿼리를 실행한 테이블과 동일한 테이블에서 DELETE하지 못하는 제약이 걸려있기 때문에 발생하는 에러이다. 이 에러메시지를 피해가기 위해서 별도로 테이블을 생성해서 중간 데이터를 한번 저장한 후에 DELETE 쿼리만 다시 실행하면 된다. 하지만 단지 DELETE 쿼리 하나를 위해 명시적으로 임시 테이블을 추가로 생성한다는것은 너무 번거로웠다. 그래서 뭔가 더 간단한 방법이 있지 않을까해서 찾아보니 다음과 같이 해결이 가능했다.

2차 시도: 성공

DELETE
FROM revenue 
WHERE id IN 
(
    SELECT id FROM (SELECT id FROM revenue GROUP BY collect_date, currency HAVING count(*) > 1) temp_table
) 
  • GROUP BY 쿼리를 이용하여 데이터를 aggregate 한 후에 중복된 데이터가 하나 이상 존재하는 경우를 찾는다.
  • 찾아진 데이터의 id 값을 temp_table 이라는 임시테이블로 명명한다.
  • temp_table로부터 id 값을 다시 SELECT해서 DELETE한다.

이 방법에서는 SELECT한 데이터를 temp_table이라는 임시테이블로 지정한 후에 temp_table로 부터 SELECT id값으로 reveue 테이블에 있는 데이터를 DELETE했다. 즉, 같은 테이블에 대한 DELETE 작업이 아니기 때문에 제약을 피할 수 있게 된다.


List of Articles
번호 제목 날짜 조회 수
126 BEGIN, COMMIT, ROLLBACK 2021.03.26 315
125 binlog 조회 / 삭제 / 보관 기간 설정 file 2023.01.10 132
124 CASE 문법 사용 하기 file 2023.01.10 111
123 column의 정보 중에서 column 설명(column_comment) 2021.03.26 129
122 Create Procedure 2016.12.23 6012
121 DB의 모든 테이블을 삭제하는 쿼리 2016.08.29 6767
120 DISTINCT와 ALL 2016.12.23 5498
119 Dump & Restore 2016.12.23 5788
118 dump 를 db에 올릴때 인코딩 문제 2016.12.23 5871
117 flush privileges 명령어 file 2017.04.12 5303
116 FORMAT 문법 사용 하기(숫자 자리수 나타내기) file 2023.01.10 102
115 fulltext 관련 글 2021.03.26 125
114 group by, distinct, count 를 이용한 겹치지 않는것의 개수 2021.03.26 262
113 group by로 뽑아온 값중에 가장큰 값(max)의 상태값을 가져오기 2021.03.26 594
112 IMPORT 2016.12.23 5440
111 IN 연산자 2016.12.23 5809
110 InnoDB 스토리지 엔진에서 테이블의 최대 저장 row 개수 2018.07.18 1675
109 InnoDB, MyISAM 2016.12.23 5536
108 LIMIT 속도 저하 2021.03.26 247
107 MariaDB can't create test file lower-test 2023.02.16 139
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7

하단 정보를 입력할 수 있습니다

© k2s0o1d4e0s2i1g5n. All Rights Reserved