ゼロ幅文字・NBSPの抽出と除去
ZWSP/ZWNJ/ZWJ/NBSP/WJ を位置(行/列/オフセット)付きで検出し、種類別件数を確認できます。除去・可視トークン化・NBSPスペース化を選び、処理結果を別欄で安全に生成できます。
同じ目的のツール切替
改行・不可視文字・正規化の近い作業を、用途別モードで切り替えできます。
何ができるか
ゼロ幅系文字やNBSPを検出し、どこにあるかを位置一覧で確認できます。
除去・可視置換・NBSPスペース化を入力非破壊で試し、結果をコピーできます。
例入力(ワンクリック)
検出件数: 0
- 検出なし
検出一覧
検出結果はまだありません。
入力データは原則ブラウザ内で処理します。機密情報は入力しないでください。
使い方
- 入力欄にテキストを貼り付けます。
- 検出対象と処理モードを選びます。
- 検出を実行し、位置一覧と種類別件数を確認します。
- 処理後テキストまたは一覧をコピーして利用します。
判断基準
先に「検出だけ」か「置換まで行うか」を決めると誤操作を減らせます。共有前チェックなら可視化置換、最終整形なら除去モードが実務向きです。
よくある失敗
- 一覧確認せず一括除去し、ZWJ依存の絵文字連結が崩れる。
- NBSPを通常空白へ置換後、行頭インデント意図まで失う。
- 検出対象を狭くしすぎて、BOM混入を見落とす。
境界条件
- 周辺抜粋は前後10文字の参考表示で、全文差分ビューではありません。
- 一般的には文字符号化由来の不具合調査で、別途バイト列確認が必要なケースがあります。
- このツールで問題が出なくても、システム固有の入力制約は個別確認が必要です。
具体例
- 入力: `AB`(AとBの間にZWSP)。出力: ZWSPを行列・offset付きで検出表示。
- 入力: `東京 都`(NBSP含む)、処理モード=通常空白へ置換。出力: `東京 都` へ変換。
補足(折りたたみ)
周辺抜粋は前後10文字を表示します。ZWJ/ZWNJは意図的に使われる場合があるため、除去前に一覧で確認してください。
注意・免責
- ZWJ/ZWNJは絵文字や言語表記に必要な場合があります。除去前に用途を確認してください。
- 本ツールは代表的不可視文字を対象とし、すべての不可視文字網羅を保証しません。
- 入力内容がURLクエリに含まれるため、共有時は公開してよいテキストのみ扱ってください。
失敗しやすい処理例
検出一覧を見ずに全削除する
意図的に使っていた文字境界制御まで消えることがあります。
例: 判断ポイント: 先に位置一覧で種別と周辺文脈を確認する
可視トークン置換の結果を本番データへ上書きする
検査用トークンがそのまま残ると表示崩れの原因になります。
例: 入力例: `A[ZWSP]B` 形式のまま公開データへ反映してしまう
境界値・例外ケース
ZWJを含む絵文字シーケンス
除去すると1絵文字が分解されて別表示になる場合があります。
例: 入力例: 家族絵文字 / 出力: ZWJ除去で複数絵文字に分離
NBSPが桁区切りやレイアウトに使われている
通常スペース化で折返し位置が変わることがあります。
例: 判断ポイント: `nbsp-to-space` 実行後に表示確認を行う
よくあるミス
検出対象チェックを固定で使い回す
案件ごとに不要な検出まで増えて確認負荷が上がります。
例: 運用例: 文書用途ごとに対象ON/OFFを切り替える
処理前後テキストの差分保存をしない
後からどの不可視文字を除去したか追跡できなくなります。
例: 判断ポイント: TSV一覧と処理後テキストをセットで保存
FAQ
NBSPって何が困るのですか?
見た目は通常スペースでも別コードのため、検索不一致やCSV処理ミスの原因になります。
ゼロ幅文字はどこで混入しますか?
Webページのコピー、チャット、エディタの自動整形、絵文字入力などで混入することがあります。
除去すると壊れる場合はありますか?
あります。特にZWJ/ZWNJは絵文字や文字結合に使われるため、除去前に一覧確認を推奨します。
offsetと行列のどちらを優先して直すべきですか?
エディタでピンポイント修正する場合は行列、機械処理ログと突合する場合はoffset優先が扱いやすいです。
基本FAQ
入力データは外部へ送信されますか?
原則として送信されません。入力内容はブラウザ内で処理します。例外がある場合は各ツールページ内に明記しています。
入力内容は自動保存されますか?
原則として自動保存しません。コピーやダウンロードで保存する場合は、ご利用端末内に保存されます。
同じ目的の整形ツール
改行・不可視文字・正規化の確認と整形をまとめて行うファミリーです。
関連ツール
現在の入力内容とあわせて確認しやすいツールです。