컴퓨터공학
유니코드 (Unicode)의 구조
무에서
2018. 7. 9. 20:53
반응형
유니코드 (Unicode)는 16진수 0~10FFFF 범위의 코드로 1,114,112개의 문자로 구성되어 있다.
유니코드를 실제 바이트로 구현하는 것을 인코딩 (Encoding)이라고 한다. 유니코드를 실제로 구현하는 방법 중 가장 많이 사용하는 방법은 UTF-8, UFT-16 이다.
UTF-8은 1~4 바이트의 가변 크기를 가지고 1바이트로 나타낼 때는 ASCII 코드와 호환된다. UTF-16은 16비트 크기 워드 1개 또는 2개로 가변 크기를 가진다. UTF-32는 32비트 (4바이트) 고정 크기로 유니코드를 표현한다.
반응형