왜 JPEG가 여전히 웹을 지배하는가
30년 동안 웹을 지배해온 JPEG 포맷의 역사와 여전히 사라지지 않는 이유를 탐구합니다.
약 30년 동안 JPEG는 월드 와이드 웹의 주요 이미지 포맷이었습니다.
하지만 웹이 처음 시작할 때 사용된 포맷은 아니었습니다. 최초의 대중적인 그래픽 브라우저인 NCSA Mosaic은 처음에는 인라인 JPEG 파일을 지원하지 않았고, 인라인 GIF와 몇 가지 다른 포맷만 지원했습니다.
JPEG는 GIF에 비해 많은 장점이 있었습니다. 256색 제한이 있는 GIF와 달리 1,670만 색을 지원했고, 손실 압축을 통해 사진 품질을 유지하면서도 파일 크기를 줄일 수 있었습니다. JPEG 파일은 GIF보다 더 우아하게 품질이 저하되어, 이미지의 원래 형태를 더 잘 유지할 수 있었습니다.
GIF는 사실상의 표준, JPEG는 진짜 표준
2013년, GIF의 창시자인 스티브 윌하이트가 자신의 업적을 기리는 상을 받기 직전 뉴욕타임스와의 인터뷰에서, GIF 발음 논쟁에 대해 언급했습니다. “부드러운 G, 즉 ‘지프(jif)’로 발음한다. 끝.”
이 일화는 윌하이트가 자신의 포맷을 위원회가 아닌 혼자 개발했다는 점을 보여줍니다. 1987년 CompuServe 직원으로서 이 프로젝트를 맡아 직접 만들었고, 문서도 매우 간단했습니다.
JPEG는 약 5년 후에 공식적으로 등장했는데, 상황이 완전히 달랐습니다. 수십 명의 이해관계자들이 참여해 만든 JPEG(Joint Photographic Experts Group)는 모두의 요구를 충족하는 포맷을 만들고자 했습니다. 포맷이 세상에 공개되었을 때는 600페이지가 넘는 책으로 소개될 정도였습니다.
사실상의 표준과 진짜 표준의 차이였고, 이것이 JPEG가 널리 퍼지는 데 결정적이었죠.
JPEG 포맷의 탄생
이 이미지의 품질을 점점 낮춰볼 것입니다. 원래 전체 크기는 13.7메가바이트입니다.
IBM 직원이자 JPEG 조직의 일원이었던 윌리엄 B. 페네베이커와 조안 L. 미첼이 쓴 『JPEG: 정지 영상 데이터 압축 표준』은 포토리얼리즘 이미지와 즉시성의 균형을 맞출 방법이 없던 멀티미디어 이미지의 세계를 설명합니다.
“문제는 이미지 압축 알고리즘의 부족이 아니라, 다양한 응용 프로그램 간에 이미지를 교환할 수 있는 표준 알고리즘의 부재였다”
IBM, AT&T, Canon 등 각 회사는 각자의 필요에 따라 참여했습니다. 캐논은 프린터와 사진에, AT&T는 데이터 전송에 더 관심이 있었습니다. 이들이 남긴 표준은 지금까지도 유효합니다.
재미있게도, JPEG 압축을 사용할 수 있는 프로그램이 처음 등장한 곳은 MacOS나 Windows가 아니라 IBM이 만든 실패한 운영체제 OS/2였어요.
JPEG를 강하게 압축하면 어떻게 될까
초기 품질의 50퍼센트로 낮추면, 이미지 용량이 약 2.6MB로 줄어듭니다.
JPEG가 PNG나 GIF와 다른 점은 데이터를 압축할 때 어떻게 품질이 저하되는지입니다. JPEG의 목표는 압축이 필요하더라도 사진처럼 보이게 하는 것입니다.
페네베이커와 미첼의 통찰: “가장 효과적인 압축은 원본 이미지를 정확히 재현하는 것이 아니라 근사치로 만드는 것이다.”
핵심은 이산 코사인 변환(Discrete Cosine Transform, DCT)이라는 압축 과정입니다. 이 알고리즘은 1970년대에 개발되었으며, 데이터를 마치 수도꼭지처럼 조절할 수 있게 해줍니다.
JPEG 표준은 네 가지 모드를 제공합니다:
- 순차 DCT: 압축된 이미지를 위에서 아래로 순서대로 표시
- 점진적 DCT: 전체 이미지를 낮은 해상도로 먼저 보여주고 점차 디테일 추가
- 순차 무손실: 블라인드 방식이지만 압축하지 않음
- 계층적 모드: 앞의 세 가지를 조합
JPEG가 만들어질 당시에는 모뎀이 흔했기 때문에, 이미지를 천천히 로딩하는 점진적 DCT가 인터넷에 가장 적합했습니다. 시간이 지나면서 컴퓨터 성능이 좋아져 순차 DCT가 더 많이 쓰이게 되었습니다.
같은 숲 사진을 품질 5퍼센트로 저장하면, 약 419킬로바이트로 줄어듭니다.
DCT로 압축하면 특정 패턴의 아티팩트가 나타납니다. 복잡한 디테일(머리카락, 나뭇잎)에서는 변화가 덜 눈에 띄지만, 단색 영역에서는 블록 노이즈가 나타날 수 있고, 날카로운 경계(텍스트)에서는 링잉 아티팩트가 생깁니다. 그래서 소셜 미디어 게시물을 스크린샷하면 노이즈가 생기는 것입니다.
특허 전쟁
JPEG가 90년대에 인기를 끈 이유는 포맷의 품질뿐만 아니라 특허 때문이기도 했습니다.
1994년, 유니시스(Unisys)는 자신들이 소유한 LZW 압축 특허를 사용한 GIF 파일 사용자들에게 요금을 청구하려 했습니다. 이로 인해 무료로 사용할 수 있는 JPEG가 더 인기를 끌었고, 특허가 없는 PNG 포맷도 탄생했습니다.
JPEG도 특허 문제에서 자유롭지 못했습니다. 1997년, 포전트 네트웍스가 컴프레션 랩스를 인수한 후, JPEG 압축과 유사한 특허를 발견하고 소송을 제기하기 시작했습니다.
포전트 CEO 제이 피터슨은 2005년 CNET 인터뷰에서 “이 특허는 어떤 면에서 복권과 같다. 5년 전에 ‘네가 JPEG 특허를 갖고 있다’고 했다면 믿지 않았을 것”이라고 말했습니다.
포전트는 디지털 카메라 제조사로부터 1억 달러 이상, PC 업계로부터 800만 달러를 합의로 받아냈습니다. 공격적인 특허 소송이 이어지자 법원과 여론 모두에서 점점 불리해졌고, 결국 2007년 특허가 만료되었습니다.
JPEG가 사라지지 않는 이유
JPEG 파일 포맷은 오랫동안 우리 곁에 있었고, 쉽게 대체되지 않았습니다.
JPEG 2000 같은 포맷이 더 나은 성능과 무손실 옵션을 제공하며 대체를 시도했지만, 일반 사용자에게는 인기가 없었습니다. 구글이 지원하는 WebP는 웹사이트 개발자들 사이에서 인기가 있지만, 도구 지원 제한과 호환성 문제로 사용자들 사이에서는 논란이 있습니다. AVIF와 HEIC 같은 포맷은 JPEG를 능가하는 성능을 보이기도 합니다.
그럼에도 불구하고 JPEG는 여전히 살아남고 있습니다. MP3나 ZIP 파일처럼 너무 널리 퍼져서 사라지기 힘든 포맷입니다. 모든 디바이스에서 지원되고, 모든 소프트웨어와 호환되며, 사용자들이 익숙하죠. 30년의 역사를 가진 포맷을 대체하는 것은 쉽지 않습니다.
JPEG의 성공은 기술적 우수성만이 아니라, 표준화, 개방성, 적시성이 결합된 결과였습니다. 이는 기술 표준이 어떻게 생태계를 형성하고 지배할 수 있는지 보여주는 사례입니다.