Skip to main content

One post tagged with "unicode"

View All Tags

· 3 min read

Chuyển Unicode thành ký tự UTF-8.

Trước tiên hãy xem bảng sau, bên trái là khoảng các kí tự unicode, bên phải là dạng nhị phân sau khi convert:

U-00000000 – U-0000007F:  0xxxxxxxU-00000080 – U-000007FF:  110xxxxx 10xxxxxxU-00000800 – U-0000FFFF:  1110xxxx 10xxxxxx 10xxxxxxU-00010000 – U-001FFFFF:  11110xxx 10xxxxxx 10xxxxxx 10xxxxxxU-00200000 – U-03FFFFFF:  111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxxU-04000000 – U-7FFFFFFF:  1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

Và dĩ nhiên là tất cả tính toán đều phải đưa về dạng nhị phân. Các chữ cái x đều phải được điền bằng giá trị tương ứng.