공공 사이트 및 데이터 공유 사이트를 통해서
xml / json / csv 등 다양한 형태로
데이터를 얻어 올 수 있는
시대가 되었다.
이렇게 데이터를 받아왔을 때 가장 먼저 확인해봐야하는 부분은
데이터를 사용하기에 용이한지 점검을 해봐야한다.
간단한 사례하나를 보면서 확인해볼 수 있다.

이와같이 항상 데이터를 불러와서 나 PC 환경에 맞춰서
확인해보면 텍스트들이 깨지는 현상들을 볼 수 있다.
이렇게 텍스트가 깨지면 데이터를 식별하기 힘들고
그에따라 데이터를 활용하기는 사실상 무의미하다고 볼 수 있을 것이다.
또한
PC에서 열었을 때 이와같이 깨져있는 텍스트를 발견할 때면
굉장히 당혹감을 감출 수가 없고
작업 시작하는 단계부터 상당히 불쾌했다.
그럼 이렇게 깨지는 현상을 어떻게하면
처리할 수 있을까?
그 원인은 csv 파일을 메모장에서
열어보면 또 깨지지 않은 것을 확인할 수 있다.

이러한 현상이 일어나는 것은
윈도우 운영체제에서 EUC-KR이 아닌 UTF-8로 인코딩이 된 결과이다.
이런경우 텍스트 편집기나 메모장을 활용하여 엑셀에서 인식할 수 있는
ANSI 인코딩형태로 변환해주어야 한다.
비교적 어려운 작업은 아니다.
이와같이 다른이름으로 저장하기를 통하여
인코딩 부분을 ANSI로 변경해주고 저장해주면
엑셀에서도 텍스트가 깨지지 않는 것을 확인할 수 있다.

이처럼 텍스트에서 확인 할 때는 사실상 직감적으로
데이터를 확인하기는 조금 어렵지만
엑셀을 통하여 확인하니 직감적으로 알 수 있는 것을 볼 수 있다.
'꿀팁' 카테고리의 다른 글
NAVER SMS API 연동 (0) | 2023.03.27 |
---|---|
Apache JMeter 부하 테스트 (0) | 2023.03.26 |
개인도서목록 (0) | 2023.01.27 |
티스토리 Code블럭 테마변경 (0) | 2023.01.21 |