MW211 EXIT

devlog
メモ帳の文字コード
2012年05月03日
メモ帳ではあまり文字コードを意識することがない。
たいていのエディタでは編集中に現在使用中の文字コードを表示しているものだが
メモ帳の場合、これがないからかもしれない。

ということで、あらためて、メモ帳における文字コードのおさらい。

まず、メモ帳において使用できる文字コードは以下の3つ。
  ・ANSI(=Windows版Shift_JIS=CP932)
  ・UTF-8
  ・Unicode(=UTF-16)
つまり「EUC-JP」は使用できない。

文字コードを自発的に指定したい場合は、以下の2つの方法がある。
  ・ファイルを開く時に、指定する
  ・ファイルを保存する時に、指定する
つまり、編集中に変更はできない(一発で変換して再表示ってことはできない)。

文書ファイルのダブルクリックや
メモ帳に対するドラッグ&ドロップでファイルを開いたりする場合
文字コードをある程度自動認識してくれる。
この使い方をすることが多いと思うので、文字コードを意識しづらい。

自動認識の基準は(先頭の)「BOM」のようだ。
UTF-8、UTF-16で保存した場合は、自動で「BOM」を付加する。


ついでに別件だが、改行コードは「CR+LF」のみを認識し、
「CR」や「LF」だけだと改行として認識しない。

メモ帳の特徴といったらこんなところか。
分類:文字コード