% 표기 뒤의 의미
"%ED%95%9C" 같은 % 표기 뒤에는 표준·바이트·UTF-8 같은 의미가 숨어 있다. 한 번 짚어 두면 자료 해석이 더 자연스럽다.
RFC 3986 표준
URL 인코딩의 국제 표준. % + 16진수 두 자리 형태로 한 바이트 표현. 모든 브라우저·도구가 이 표준 따른다.
UTF-8 바이트 매핑
- 한글 한 글자 → 3바이트
- 영문 한 글자 → 1바이트
- 이모지 → 4바이트
- 각 바이트 → %XX
예약 문자(Reserved Characters)
URL에서 특별한 의미가 있는 문자. 그대로 사용하면 URL 구조 일부로 해석.
- : / ? # [ ] @
- ! $ & ' ( ) * + , ; =
예약 문자를 데이터로 쓰려면 인코딩 필수.
안전 문자(Unreserved Characters)
인코딩 없이 그대로 사용 가능.
- A-Z, a-z
- 0-9
- - _ . ~
16진수 두 자리의 의미
한 바이트(8비트)는 16진수 두 자리(00~FF)로 표현. %20은 16진수 20 = 10진수 32 = ASCII 공백. URL 인코더로 변환 결과를 보면 패턴이 보인다.
대문자 vs 소문자 16진수
%2A와 %2a는 같다. 표준은 대문자 권장(RFC 3986). 다만 도구·시스템마다 차이 가능.
예약 문자 인코딩 매핑
- ! → %21
- # → %23
- $ → %24
- % → %25
- & → %26
- = → %3D
- ? → %3F
왜 % 기호인가?
URL에서 거의 사용되지 않는 기호. 역사적으로 인코딩 표시에 적합한 자리. URL 디코더로 % 기호의 의미를 한 화면에서 확인.
마무리
% 표기 뒤에는 표준·바이트·매핑 의미가 숨어 있다. 한 번 짚어 두면 자료 해석이 더 자연스러워진다.