맥(Mac)에서 보낸 파일의 파일명이 분리되는 문제 방지를 위한 파이썬 코드

Posted In: 미분류

맥에서 이메일 등으로 한글제목의 파일을 보내다보면 윈도우 환경에서 파일을 다운로드 받았을때 파일명이 분리되는 문제가 종종 발생한다.

맥을 쓰는 사람 입장에서는 나한테 잘 보이니 상관은 없을 수 있지만, 상대방에게는 파일명이 분리되어 엄청나게 길어지니 민폐가 아닐 수 없다.

맥을 쓰는 예나 지금이나 이 문제는 해결이 되지 않았고, 결국 사용자가 유니코드 정규화 방식의 차이를 인지하고 그것을 구분해서 쓰는 수밖에 없다는 결론에 이르게 된다.

유니코드 정규화 방식

NFD (Normalization Form Canonical Decomposition) : Mac에서 사용하는 방식
NFC (Normalization Form Canonical Composition) : Windows에서 사용하는 방식

위와 같이, 유니코드 정규화 방식이 다르기 때문에 맥에서 파일을 보낼 때 윈도우즈에서 사용하는 방식으로 변환하여 보내면 된다. 아래 Python으로 구현한 스크립트를 이용해 간단하게 변환할 수 있다.

사용방법

python nfd2nfc.py 파일명 or 경로

참고링크

http://stackoverflow.com/questions/16467479/normalizing-unicode
https://en.wikipedia.org/wiki/Unicode_equivalence