テキストをバイナリに、バイナリをテキストに変換。UTF-8 と ASCII、ビット区切りを選択可能。
文字数: 5
UTF-8 バイト数: 15
出力長: 134
| 文字 | 10進数 | バイナリ(8ビット) |
|---|---|---|
| A | 65 | 01000001 |
| Z | 90 | 01011010 |
| a | 97 | 01100001 |
| z | 122 | 01111010 |
| 0 | 48 | 00110000 |
| 9 | 57 | 00111001 |
| (スペース) | 32 | 00100000 |
| ! | 33 | 00100001 |
| ? | 63 | 00111111 |
| (改行) | 10 | 00001010 |
よくある質問
テキストからバイナリへの変換はどう動くのか?
テキスト中の各文字には数値コード(コードポイント)が割り当てられています。ASCII 文字のコードは 7 ビットに収まり、先頭に 0 を付けて 8 ビットに揃えます。たとえば
A はコード 65 で、バイナリでは 01000001 です。変換ツールは各文字を順に読み取り、コードを参照して 1 バイトずつバイナリ表現を書き出します。日本語の場合は UTF-8 で 1 文字あたり 3 バイト(漢字・ひらがな・カタカナ)または 4 バイト(一部の絵文字や追加漢字)になります。ASCII と UTF-8 の違いは?
ASCII は 128 文字(英字・数字・記号)を 1 文字 7 ビットで表します。UTF-8 は可変長エンコーディングで、ラテン文字・キリル文字・漢字・アラビア文字・絵文字まで世界中の文字を 1〜4 バイトで扱えます。ASCII 範囲の文字は UTF-8 でも同じ 1 バイトになります。ひらがな・カタカナ・漢字を扱うには UTF-8 が必須です。たとえば「あ」は UTF-8 で
11100011 10000001 10000010(3 バイト)。ASCII モードを選ぶと 0〜127 範囲外の文字はエラーになります。バイナリのデコードに失敗する理由は?
主な原因は次のとおりです:(1) ビット群が 8 ビット(または 7 ビット)になっていない — 余分な空白が混じっていないか確認してください。(2) 0 と 1 以外の文字が含まれている。(3) 不完全な UTF-8 シーケンスになっている(マルチバイト文字の途中でビットが欠けると 文字化け の原因になります)。デコーダは最初のエラー位置を表示します。区切り文字がない場合は「ビットの区切り」を 8 に、「区切り文字」を「なし」に設定してください。
1文字あたり何ビット使うべき?
標準は 1 バイト = 8 ビットです。純粋な ASCII は 7 ビットに収まりますが、保存データやネットワークプロトコルでは常に 8 ビットに揃えます。7 ビットは古いテレタイプ機器や学習目的でのみ使ってください。日本語(ひらがな・カタカナ・漢字)や絵文字、アクセント記号などの非 ASCII 文字は UTF-8 で 2〜4 バイトを必要とするため、7 ビット区切りは適用できません。情報処理試験や学習目的の場合も、現実のデータは基本 8 ビット単位と覚えておくと混乱しません。
日本語や絵文字は変換できる?
はい、エンコーディングを UTF-8 に設定すれば対応できます。例として「あ」は UTF-8 で
11100011 10000001 10000010(3 バイト)、「漢」は 11100110 10111100 10100010 のように 3 バイトで表されます。カタカナや常用漢字も基本 3 バイト、一部の絵文字や追加漢字(𠮷 など)は 4 バイトです。Shift-JIS と UTF-8 は異なるエンコーディングなので、Shift-JIS で保存されたデータをそのまま UTF-8 として読むと文字化けします。ASCII モードでは 0〜127 範囲外のすべての文字がエラーになります。バイナリは機械語と同じ?
いいえ、別物です。バイナリは単なる2 進数表記で、0 と 1 の 2 種類の数字を使う数の表現方法に過ぎません。一方、機械語(マシンコード)は CPU 命令を 2 進数で表したもので、プロセッサごとに固有のエンコーディングを持ちます。このページで扱うバイナリは「テキストをバイトに符号化したもの」であり、実行可能な命令ではありません。両者がどちらも 0 と 1 を使うため、「バイナリ=コンピュータ向け」という慣用的な意味合いで混同されがちです。
バイナリをテキストに戻すには?
「バイナリ → テキスト」タブに切り替えて、バイナリを貼り付けてください。デコーダは入力を区切り文字(既定はスペース)でバイト列に分割し、各グループを 2 進数から 10 進数のコードポイントに変換し、文字を組み立てます。UTF-8 の場合はマルチバイト列を正しく繋ぎ合わせて 1 文字に復元します。区切り文字がない場合は「ビットの区切り」で 8 を選択してから貼り付けてください。
変換はすべてブラウザ内で行われます。送信は一切ありません。
テキストをバイナリ表現に変換し、バイナリをテキストにデコードします。エンコーディングは UTF-8(既定、日本語・絵文字を含むあらゆる言語に対応)と ASCII(7ビット、英語のみ)から選択。ビット区切り(8、7、なし)と区切り文字(スペース、なし、ハイフン、パイプ)を入力フォーマットに合わせて調整できます。「入れ替え」ボタンで出力を入力に戻し、ラウンドトリップで値を検証できます。ライブ統計は入力文字数、UTF-8 バイト数、出力長を表示。例:文字 A は 01000001、単語 Hi は 01001000 01101001、ひらがな「あ」は UTF-8 で 11100011 10000001 10000010(3バイト)、絵文字は通常 4バイト。日本語の文字や絵文字は UTF-8 モードでのみ正しく扱えます。ASCII モードでは範囲外の文字でエラーが表示されます。デコーダーはエラーが発生したビット群の位置を示すので、不正な入力を素早く修正できます。