Question 1

NFC と NFKC は何が違いますか？

Accepted Answer

どちらも分解後に合成しますが、NFCは正準等価な変換のみを行い、見た目の文字を保ちます。NFKCはさらに互換変種を畳み込み、全角ＡをASCII Aに、㈱を(株)に変換します。検索や識別子の比較にはNFKCが向きます。

Question 2

入力したテキストはサーバーに送信されますか？

Accepted Answer

いいえ。正規化はブラウザ標準の String.prototype.normalize() を使ってローカルで実行され、入力したテキストがサーバーに送信されたり保存されたりすることはありません。

Question 3

扱える文字数に制限はありますか？

Accepted Answer

明示的な上限はなく、ブラウザのメモリが許す範囲で長いテキストも処理できます。4形式の結果に加えてコードポイント列とUTF-8バイト数も併記されます。

Question 4

macOS と他のOSでファイル名が一致しないのはなぜですか？

Accepted Answer

macOSのHFS+/APFSはファイル名をNFD（分解形式）で保存するため、NFCを使う他のシステムと見た目が同じでも内部表現が異なります。比較する際は両側をNFCに正規化してから突き合わせてください。

Question 5

アクセント記号を取り除くにはどの形式を使えばよいですか？

Accepted Answer

NFKD（または NFD）で基底文字と結合マークに分解したうえで、正規表現 \p{M} などで結合マークを削除すると、アクセントを除去できます。

Unicode 正規化ツール (NFC / NFD / NFKC / NFKD)

よくある質問