せっかくダウンロードしたCSVファイルをExcelで開いたら、中身が「あいうえお」ではなく謎の記号の羅列(文字化け)になっていた……。そんな経験はありませんか?
実はこれ、故障でも魔法でもなく、単純な「文字コードの不一致」が原因です。この記事では、CSVが文字化けする理由と、今すぐできる解決策を分かりやすく解説します。
なぜ文字化けは起きるのか?
原因を一言で言えば、「ファイルの保存形式(UTF-8など)」と「Excelが読み込もうとする形式(Shift-JIS)」がズレているからです。
現在、世界のWebサービスの多くは「UTF-8」という文字コードを使ってデータを保存しています。しかし、日本語版のExcelは歴史的な経緯から、古い日本独自の規格である「Shift-JIS」をデフォルトとして期待しています。この「通訳のミス」が文字化けの正体です。
解決策1:Excelの「データ取得」機能を使う
ファイルをダブルクリックで開くのではなく、以下の手順を踏むことで確実に正しく表示できます。
- Excelを新規で開く
- 「データ」タブ > 「テキストまたはCSVから」を選択
- 対象のCSVファイルを選択して「インポート」
- プレビュー画面の「元のファイル」で「65001: Unicode (UTF-8)」を選択
- 文字化けが消えたことを確認して「読み込み」をクリック
解決策2:変換ツールでコードを変えてしまう
複数のファイルを処理する場合や、手順が面倒な場合は、あらかじめ「Excelが読み込める形式」に変換してしまうのが最も手っ取り早いです。
TOOL FARMの変換ツールを使えば、JSONやCSVのフォーマットを変換するついでに、構造を整理してExcelで扱いやすい形に整えることができます。
データを扱いやすく変換する
まとめ
CSVの文字化けは、知識さえあれば怖くありません。相手(ソフト)がどの言語を話そうとしているのかを理解し、適切に変換してあげることで、データ分析の効率は劇的に向上します。