見えないUnicode文字を検出
上のテキストエリアに任意の文字列を貼り付けると、不可視文字、ゼロ幅文字、変則的な空白、方向制御文字、制御文字、スマート引用符などを抽出して一覧表示します。検出された各項目には、出現位置、コードポイント、Unicode名、カテゴリが表示されます。
検出できる文字
ゼロ幅文字
ゼロ幅文字は表示上の幅を持たない文字です。U+200B、U+200C、U+200D、U+2060、U+FEFF などを検出します。SNSの空白名や、AI出力に紛れ込みがちです。
改行不可スペース・全角空白などの空白系
U+00A0(改行不可スペース)、U+2000〜U+200A、U+202F、U+205F、U+3000(全角空白)など、通常空白との置き換わりが起きやすい文字を検出します。Wordや表計算ソフトのコピペ、PDFコピーで紛れ込みがちです。
方向制御文字
U+200E、U+200F、U+202A〜U+202E、U+2066〜U+2069 などの双方向テキスト制御文字を検出します。コードレビューで隠しコミットを作ったり、表示順を逆転させたりする悪用の温床になりがちです。
制御文字
U+0000〜U+001F のうち、通常テキストには現れないはずの制御文字を検出します。ログ、CSV、シェル出力のコピペで混入しやすい文字です。
スマート引用符・ダッシュ・3点リーダ
“ ” ‘ ’ – — … などのスマート引用符類は不可視ではありませんが、URL、コード、CSVで一致検索を壊します。検出結果に明示するので、必要に応じて通常記号へ正規化できます。
なぜ隠れた文字は問題を起こすか
コード・設定ファイル
ゼロ幅スペースが JSON のキーや YAML のインデント、SQL クエリに紛れ込むと、エディタでは見えないのにパーサーが壊れます。方向制御文字は、コードレビュー時に変数名を視覚的に逆転させるリスクもあります。
CSV・スプレッドシート
Word や Web からのコピペで、改行不可スペースやスマート引用符がセルに混ざりがちです。完全一致が外れたり、見た目は正しいのにフィルターで弾かれたりします。
URL・検索
URL内にゼロ幅スペースが混じるとリダイレクトや検索インデックスが崩れます。AI生成テキストやPDFコピーから流入することが多いです。
AI出力・コピーされた文書
LLMの出力やPDFコピーは、変則的な空白・スマート引用符・制御文字を含むことがあります。公開前に通すと、不要な文字を一括で除去できます。
安全に削除する手順
削除したいカテゴリにチェックを入れると、その種別の文字だけが除去されます。デフォルトはゼロ幅文字、方向制御文字、制御文字を削除する設定です。改行不可スペースとスマート引用符は文章上の意味を持つことがあるため、初期状態では残しています。「クリーンなテキスト」をコピーすれば、必要なテキストだけを取り出せます。
プライバシー:処理はすべてブラウザ内
GlyphCopy は貼り付けた内容をサーバーに送信しません。判定も削除もブラウザ内のJavaScriptで行うため、機密文書やコードでも安心して使えます。読み込み後はネットワーク切断状態でも動作します。