文字コード
コンピュータが文字を扱うための規格・符号化方式。Web では UTF-8 が事実上の標準。HTML の <meta charset="UTF-8"> で指定する。Shift_JIS・EUC-JP などの古い日本語文字コードもまだ一部のレガシーシステムで使われる。
Web 担当者にとっては、サイトの文字化け対応・文字エンコード設定で関わる基礎概念。最新サイトはほぼすべて UTF-8 で統一されているが、古いシステムとのデータ連携・メール配信で文字コード問題が発生することがある。
本書のスタンスは「文字コードは UTF-8 統一が基本」。複数の文字コードが混在すると、データ変換で文字化け・データ破損が起こる。新規プロジェクトでは UTF-8 で統一、レガシー連携時のみ変換処理を入れる。
担当者が陥りやすいのは、古い CSV・Excel ファイルが Shift_JIS で、UTF-8 サイトに取り込むと文字化けすること。データ取り込み時の文字コード変換ルールを業者と最初に握る。
言葉をよく利用する人
- コーダー / フロントエンドエンジニア
- バックエンドエンジニア
- Web 担当者(発注側)
- 情シス
会話上での使用例
文字化けトラブル対応
-
プロデューサー
CSV インポートで文字化けが
-
Web 担当者
文字コード 問題ですね。元 CSV を UTF-8 に変換してから取り込みましょう
新規サイトの仕様確認
-
コーダー
文字コード設定は?
-
Web 担当者
文字コード は UTF-8 統一で。HTML / CSS / JS / DB すべて