ドキュメントのエンコーディングを管理する
「gedit」では、ドキュメントの読み込み時と保存時に、ドキュメントのエンコーディング(文字コード)を指定することができます。デフォルトのエンコーディングは「UTF-8」です。
Ubuntuでは、デフォルトのエンコーディングに「UTF-8」を採用しているため、ドキュメントを保存するときは「UTF-8」で保存するとよいでしょう。
「gedit」では、ユーザーがよく利用するエンコーディングを管理することができます。
エンコーディングの管理は、「文字エンコーディング」画面から行います。
1.エンコーディングメニューの表示
エンコーディングをクリックし、エンコーディングメニューを表示します。以下はドキュメントを開く時の画面です。
2.文字エンコーディング画面の表示
メニューから「追加と削除」をクリックします。文字エンコーディング画面が表示されます。
文字エンコーディング画面
文字エンコーディング画面です。1.利用可能なエンコーディング
「gedit」でサポートしているエンコーディングの一覧が表示されます。2.説明
エンコーディングの言語もしくはUnicodeによる分類が表示されます。ボタンをクリックすると、昇順で並び替え・降順で並び替え・並び替え無しを切り替えることができます。
並び替えは「説明」で表示される名称を元に行われます。
3.エンコーディング
エンコーディン名が表示されます。ボタンをクリックすると、昇順で並び替え・降順で並び替え・並び替え無しを切り替えることができます。
並び替えは「エンコーディング」で表示される名称を元に行われます。
4.メニューに表示するエンコーディング
メニューに表示するエンコーディングの一覧が表示されます。メニューとは上記でも出てきたエンコーディングを選択するメニューのことです。
「現在のロケール」は常に表示されます。
5.説明
エンコーディングの言語もしくはUnicodeによる分類が表示されます。ボタンをクリックすると、昇順で並び替え・降順で並び替え・並び替え無しを切り替えることができます。
並び替えは「説明」で表示される名称を元に行われます。
6.エンコーディング
エンコーディン名が表示されます。ボタンをクリックすると、昇順で並び替え・降順で並び替え・並び替え無しを切り替えることができます。
並び替えは「エンコーディング」で表示される名称を元に行われます。
よく利用されるエンコーディングの紹介
「Unicode」と「日本語」でよく利用されるエンコーディングの紹介です。Unicode
Unicodeにはエンコーディングの種類が複数存在します。UTF-8
「UTF-8」はUbuntuのデフォルトのエンコーディングです。常にメニューに表示されるため、「利用可能なエンコーディング」には表示されません。
UTF-16
1文字を2バイトもしくは4バイト(サロゲートペア)で表現するエンコーディングです。Ubuntuではリトルエンディアンを示すBOMが付きます。
UTF-16BE
1文字を2バイトもしくは4バイト(サロゲートペア)で表現するエンコーディングです。「BE」はビッグエンディアン(Big Endian)の略です。
BOMは付きません。
UTF-16LE
1文字を2バイトもしくは4バイト(サロゲートペア)で表現するエンコーディングです。「LE」はリトルエンディアン(Little Endian)の略です。
BOMは付きません。
UTF-32
1文字を4バイトで表現するエンコーディングです。日本語
日本語では日本で使われているエンコーディングの種類が複数存在します。ドキュメントを保存する時は、特に理由がなければ「UTF-8」で保存するとよいでしょう。
EUC-JP
UNIX系のソフトウェアで使われているエンコーディングです。EUC-JP-MS
「EUC-JP」にWindowsの文字セットを組み合わせたエンコーディングです。CP932
WindowsのシフトJISです。Windowsで作成されたテキストファイルが文字化けする場合は、まず「CP932」を選択してみると良いでしょう。