각 파일 포맷별 PDF 변환 원리 (각론) 1. HWP 변환 원리 (구형 포맷)확장자: .hwp원리: HWP는 사실상 하나의 덩어리로 된 알 수 없는 암호 코드(이진 바이너리)입니다. 따라서 이 암호를 해독할 수 있는 전문 도구인 pyhwp(hwp5html) 라이브러리를 통해 글자와 서식을 아주 단순한 웹 페이지 문서(.xhtml) 형태로 먼저 해부하고 펼쳐냅니다. 그 펼쳐진 웹 문서를 마치 크롬 브라우저에서 'PDF로 인쇄'하듯이 안정적인 LibreOffice 엔진이 찍어내는 방식입니다. 2. HWPX 변환 원리 (신형 포맷)확장자: .hwpx원리: HWPX는 사실 수십 개의 XML 문서 쪼가리들이 모여있는 ZIP 파일입니다. 제가 직접 개발한 **fast_parser.py**가 HWPX 속의 내부 ..