GBK編碼,一個漢字佔兩個字節。
UTF-16編碼,通常漢字佔兩個字節,CJKV擴展B區、擴展C區、擴展D區中的漢字佔四個字節(一般字符的Unicode範圍是U+0000至U+FFFF,而這些擴展部分的範圍大於U+20000,因而要用兩個UTF-16)。
UTF-8編碼是變長編碼,通常漢字佔三個字節,擴展B區以後的漢字佔四個字節。