본문 바로가기
컴퓨터공학

유니코드 (Unicode)의 구조

by 무에서 2018. 7. 9.
반응형

유니코드 (Unicode)는 16진수 0~10FFFF 범위의 코드로 1,114,112개의 문자로 구성되어 있다.


유니코드를 실제 바이트로 구현하는 것을 인코딩 (Encoding)이라고 한다. 유니코드를 실제로 구현하는 방법 중 가장 많이 사용하는 방법은 UTF-8, UFT-16 이다. 


UTF-8은 1~4 바이트의 가변 크기를 가지고 1바이트로 나타낼 때는 ASCII 코드와 호환된다. UTF-16은 16비트 크기 워드 1개 또는 2개로 가변 크기를 가진다. UTF-32는 32비트 (4바이트) 고정 크기로 유니코드를 표현한다.


반응형

'컴퓨터공학' 카테고리의 다른 글

SIMD의 의미  (0) 2018.07.13
MIT 라이센스와 GPL의 차이  (0) 2018.07.09
레거시 (Legacy)의 의미  (0) 2018.07.08
블루투스 SPP  (0) 2018.06.13
MSX 컴퓨터 스펙  (0) 2018.05.06

댓글