[Hive] Duplicate column name column_name in the table definition. 에러 발생 원인과 해결 방법
·
Data Engineering/Hive
FAILED: SemanticException [Error 10034]: Duplicate column name column_name in the table definition.Hive 테이블의 format을 orc로 변경 후에 데이터를 적재할 때 발생했던 오류이다. DB 에 있는 데이터가 아닌 파일 데이터라, 스키마 structure 를 저장해 두고 그에 맞게 저장하고 있는데, 컬럼 값들이 대문자여서 에러가 났다. 데이터를 전부 삭제하고 적재해도 데이터가 전부 NULL로 들어가는 이슈 발생 txt 포맷일 때는 한 번도 본 적 없던 에러가 왜 orc로 변경 후에 나타날까 원인1. txt 포맷은 스키마 매칭이 유연하다.2. orc 포맷은 스키마 매칭에 엄격하다.Hive는 내부적으로 스키마 정보를 소문자로 ..