MW211 EXIT

devlog
文字コード/シフトJISをUTF-8に見立てた場合
2013年10月03日
UTF-8では、バイト毎に、先頭4ビットに、以下のような意味を持たせている

「0???」→1バイト文字
「10??」→2バイト文字以上の2バイト目以降
「110?」→2バイト文字の1バイト目
「1110」→3バイト文字の1バイト目
「1111」→4バイト文字の1バイト目

よって、シフトJISの2バイト文字で、「11??」が2バイト目の前半にはまると、
それはUTF-8的にはエラーとなる(後続にバイトが続かないから)。
#但し、「10??」が1バイト目の前半にはまっても大目に見てくれるようだ

つまり、シフトJIS「0x??C?」~「0x??F?」はUTF-8的にはエラーとなる。
分類:文字コード