今回は、 文字コードに関連するセキュリティの話題では古参ともいえるUTF-8の冗長なエンコードというテーマについて紹介します。 UTF-8とは UTF-8は、 各文字を1~4バイトの可変長で表現するUnicodeの符号化方式のひとつです。 U+0000からU+007Fの範囲の文字を ...
CSVファイルを作って、いざExcelで開いたら 文字化け…。 「ちゃんとデータを作ったのに、どうして?」と困ったことはありませんか? その原因のひとつが エンコーディングの違い です。 特に、utf-8・Shift_JIS・utf-8-sig の違いを理解しておくと、文字化け ...
パソコン等でファイルを保存するときに、「文字コード」を指定します。 まずはその文字コードとは何なのかを簡単に説明すると 文字コードとはコンピュータが文字を理解するためのルール(エンコード)のことで、UTF-8はその中の一つです。 UTF-8は世界中 ...
Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 このUTF-8を ...
SIMPLIAのよくあるご質問を検索できます。 UTF-8データを扱う場合の利用者定義変換テーブルの定義方法を教えてください。 UTF-8データを扱う場合でも、利用者定義変換テーブル上は、UCS2(ビッグエンディアン)で定義する必要があります。 また、UCS2(リトル ...
{ "image" : "/images/building-a-utf8-encoder-in-perl/bart-simpson-utf8.png", "description" : "Learn UTF-8 by encoding it yourself", "date" : "2016-08-02T08:47:57 ...
SIMPLIAのよくあるご質問を検索できます。 UTF-8変換時、利用者定義変換テーブルで定義した通りの変換が行われません。原因を教えてください。 UTF-8変換を行う場合でも、利用者定義変換テーブルの定義は、UCS2(ビッグエンディアン)の形式で行う必要があり ...