テキスト正規化Lint
コピペ事故の原因になりやすい NFKC正規化差分・不可視文字・改行コード混在をまとめて診断し、その場で修正できる無料ツールです。差分例を確認しながら、正規化・不可視処理・改行統一をブラウザ内で安全に実行できます。
同じ目的のツール切替
改行・不可視文字・正規化の近い作業を、用途別モードで切り替えできます。
何ができるか
NFKC差分・不可視文字・改行コード混在を同時に診断し、修正後テキストをすぐ生成できます。
適用前に差分例を確認できるため、不可逆変換の事故を減らしやすい設計です。
診断レポート
- NFKCで変わる文字: 0件
- 不可視文字合計: 0件
- 改行コード: LF 0 / CRLF 0 / CR 0(混在なし)
NFKC差分プレビュー(先頭10件)
差分はありません。
不可視文字の種類別カウント
- ZWSP (U+200B): 0
- ZWNJ (U+200C): 0
- ZWJ (U+200D): 0
- BOM (U+FEFF): 0
- NBSP (U+00A0): 0
- TAB (U+0009): 0
入力例(ワンクリック)
入力データは原則ブラウザ内で処理します。機密情報は入力しないでください。
使い方
- 入力欄にテキストを貼り付け、診断レポートを確認します。
- NFKC差分プレビューと不可視文字件数を見て、適用する修正オプションを選びます。
- 「修正テキストを生成」で結果を確認し、必要ならコピーします。
判断基準
まず「比較用テキストか表示用テキストか」を決めてください。比較用途ならNFKCと改行統一を優先し、表示用途では不可視文字除去だけに絞る判断が有効です。
よくある失敗
- 全オプションを一度に適用し、どの変換で差異が出たか追えなくなる。
- NFKC後の記号変換を見落とし、検索キーワード一致条件が変わる。
- CRLF必須の提出先にLF統一版を渡して再提出になる。
境界条件
- 文字種や文脈に応じた意味保持の自動判定は行わず、機械的な正規化を実施します。
- 一般的には法令文・契約文で表記揺れ許容範囲が異なるため、組織ルール確認を推奨します。
- 差分プレビューは先頭件数のみで、全文差分レビュー機能は含みません。
具体例
- `00123` をNFKC適用で `00123` に正規化
- LF/CRLF/CR混在テキストをLFへ統一
適用前の注意(折りたたみ)
- NFKC正規化や置換は不可逆の場合があります。差分プレビューを確認してから適用してください。
- 全文ハイライトは負荷が高いため、現仕様では先頭件数の差分例表示に絞っています。
注意・免責
- 正規化・置換により元の表記へ戻せない場合があります。原文のバックアップを推奨します。
- 処理はブラウザ内で完結し、入力テキストはサーバー送信しません。
- 入力内容がURLクエリに含まれるため、共有時は公開してよいテキストのみ扱ってください。
関連用語
用語の意味は用語集で確認できます(NFKC / 不可視文字 / CRLF / LF / ゼロ幅スペース / NBSP)。
失敗しやすい修正例
NFKCを無条件で適用する
記号や互換文字が変わり、仕様上必要な表記が失われることがあります。
例: 判断ポイント: NFKC差分プレビューを見て適用可否を決める
不可視文字処理と改行統一を同時適用して原因を混同する
どの処理で不具合が解消したか追跡しづらくなります。
例: 運用例: 1オプションずつ適用して差分を確認
境界値・例外ケース
改行コードが複数種混在
OS間移動テキストで LF/CRLF/CR が混在して検出件数が増えます。
例: 出力例: newlineReport で mixed=true が表示
不可視文字が密集した長文
プレビュー上は先頭件数のみ表示されるため全件把握に注意が必要です。
例: 判断ポイント: 種類別件数と位置例を合わせて確認
よくあるミス
修正後テキストを再診断しない
取り切れていない不可視文字や混在改行を見落とす可能性があります。
例: 判断ポイント: 生成テキストを再入力してゼロ件確認
診断件数だけで品質合格にする
業務ルール上の表記許容範囲は別途確認が必要です。
例: 運用例: Lint結果と運用チェックリストを併用する
FAQ
NFKC正規化って何ですか?
文字の互換差を吸収して比較しやすくする正規化です。全角半角や一部互換文字が統一されますが、表記が変わる点には注意が必要です。
どんな不可視文字が問題になりますか?
ZWSP、ZWNJ、ZWJ、BOM、NBSP、タブなどがコピペ時に混入しやすく、検索不一致やパース失敗の原因になることがあります。
改行コード混在は何が困りますか?
見た目は同じでも、差分比較や処理系で挙動が変わる場合があります。混在を解消してLFまたはCRLFに統一すると安定しやすくなります。
文字が勝手に変わるのが不安です。
適用前にNFKC差分の例(元→後)を先頭件数で表示します。内容を確認してから修正生成してください。
オプションは同時適用より段階適用が良いですか?
監査目的では段階適用を推奨します。NFKC→不可視文字→改行統一の順で影響範囲を切り分けやすくなります。
基本FAQ
入力データは外部へ送信されますか?
原則として送信されません。入力内容はブラウザ内で処理します。例外がある場合は各ツールページ内に明記しています。
入力内容は自動保存されますか?
原則として自動保存しません。コピーやダウンロードで保存する場合は、ご利用端末内に保存されます。
同じ目的の整形ツール
改行・不可視文字・正規化の確認と整形をまとめて行うファミリーです。
関連ツール
現在の入力内容とあわせて確認しやすいツールです。