decimal -> int 변환했을 때 음수 나오는 이유
·
Data Engineering/Spark
문제 상황ORACLE에 있는 테이블을 spark dataframe로 변환했다. ORACLE의 NUMBER 형 데이터 타입이 SPARK 에서는 DECIMAL 데이터 타입으로 바뀌었는데, 소수점이 생겨서 보기 불편하였다. 데이터를 식별하는 PK 값에 소수점이 잔뜩 붙어 버리니 데이터가 예쁘지 않았다. ex) ORACLE: 202401010000SPARK DATAFRAME: 202401010000.0000000000 소수점이 필요한 데이터가 아니어서 해결 방법을 찾아 보았다. 문제 발생 원인decimal 데이터 타입으로 변한 이유는, 스파크 데이터프레임으로 변환할 때 따로 스키마 설정을 안 해 주었기 때문이다. 스키마 지정을 하지 않으면 스파크는 숫자형 데이터를 임의로 decimal 데이터 타입으로 바꾸어 소..