文字化け復元候補
URLエンコード/HTMLエンティティ/誤デコード由来の文字化けに対して、複数の復元候補を生成し、スコア順に比較できる無料ツールです。処理はブラウザ内で完結し、失敗理由も確認できます。
何ができるか
URL/HTMLデコードと誤デコード逆変換(Latin-1/Shift_JIS等)で復元候補をまとめて作成し、当たりっぽい順に並べます。
生成不可の理由も表示するため、次の切り分けがしやすくなります。
入力例(ワンクリック)
復元候補(スコア順)
解析結果はまだありません。
入力データは原則ブラウザ内で処理します。機密情報は入力しないでください。
使い方
- 文字化けした文字列を入力します。
- URLデコード回数、HTMLデコード、2段復元の有無を選びます。
- 「復元候補を解析」を実行し、候補をスコア順で比較します。
- 最も自然な候補をコピー、または再解析して絞り込みます。
判断基準
まずURL/HTML前処理だけで改善するかを確認し、次に1段復元、必要時のみ2段復元を試す順に進めると、 過変換による別文字化けを避けやすくなります。
よくある失敗
- 既に正しい文字列へ追加デコードをかけ、別の文字化けを作る。
- 最高スコアのみで確定し、業務文脈に合わない候補を採用する。
- 元データの文字コード情報を確認せず、復元試行を無制限に繰り返す。
境界条件
- 不可逆に壊れたデータ(欠損・上書き済み)は復元できない場合があります。
- 一般的にはShift_JIS等の復元候補はブラウザのDecoder実装に依存します。
- 正式復旧時は元システムの出力設定や原本データを併せて確認してください。
具体例
- `%E3%81%82%E3%81%84%E3%81%86` → URLデコード候補で `あいう`
- `ããã«ã¡ã¯` → Latin-1 bytes→UTF-8 候補で `こんにちは`
- 二重化け文字列は 2段復元ON で候補が増える
注意
- すべての文字化けを復元できるわけではありません。
- 表示結果は候補であり、正しさを保証するものではありません。
- 処理はブラウザ内で完結し、入力は送信されません。
- 入力内容がURLクエリに含まれるため、共有時は公開してよいテキストのみ扱ってください。
失敗しやすい復元例
最上位候補だけで確定する
文脈次第では2位以下が正解になるケースがあります。
例: 判断ポイント: 上位候補を原文文脈で比較して採用する
入力前処理をせず混在データを一括解析する
URLエンコードやHTML実体参照が混在すると候補が散らばります。
例: 入力例: %E3... と &#x... 混在 / 出力: 候補数増加で判別困難
境界値・例外ケース
2段復元が必要な文字化け
単段では復元不可でも double pass で候補が出る場合があります。
例: 判断ポイント: 単段失敗時に2段復元オプションをONにする
対応外エンコーディング由来の化け
候補が生成されない、または低スコア候補のみになることがあります。
例: 出力例: failures に失敗理由が表示される
よくあるミス
復元結果を元データに即上書きする
誤候補採用時に元情報へ戻れなくなります。
例: 運用例: 原文・候補・採用理由をセットで保存
候補スコアの根拠を確認しない
見た目だけで採用すると別文字列を選ぶリスクがあります。
例: 判断ポイント: スコアと失敗理由を合わせて比較する
FAQ
復元できないときはどうすれば良いですか?
入力の出所(Excel/CSV/Slack/ブラウザ)を確認し、元データに近い形式で再取得した文字列でも試してください。
URLデコードは2回試すべきですか?
通常は1回で十分です。二重エンコードが疑われる場合のみ2回を試してください。
候補のスコアは何を見ていますか?
日本語らしさ、置換文字や制御文字の有無、典型文字化け断片の残存などを軽量ヒューリスティックで評価しています。
再解析ボタンは何に使いますか?
上位候補を次入力として再評価し、二重化けや前処理影響を段階的に切り分けるために使います。
基本FAQ
入力データは外部へ送信されますか?
原則として送信されません。入力内容はブラウザ内で処理します。例外がある場合は各ツールページ内に明記しています。
入力内容は自動保存されますか?
原則として自動保存しません。コピーやダウンロードで保存する場合は、ご利用端末内に保存されます。
関連ツール
現在の入力内容とあわせて確認しやすいツールです。