Binary Text Converter: Текст в двоичный код
Binary Text Converter конвертирует текст в двоичный или шестнадцатеричный формат и декодирует обратно в текст. Поддержка Unicode, настраиваемые разделители.
Что такое Binary Text Converter?
Binary Text Converter — бесплатный онлайн-инструмент, который конвертирует простой текст в двоичные (base-2) или шестнадцатеричные (base-16) представления и декодирует двоичные или hex-строки обратно в читаемый текст. Использует кодировку UTF-8, корректно обрабатывая весь набор символов Unicode — английские буквы, символы с диакритикой, арабский, китайский, эмодзи и любой текст, кодируемый в UTF-8.
Инструмент используется разработчиками для проверки данных на уровне байтов, студентами для изучения кодировки символов и всеми, кто хочет убедиться, что двоичное или шестнадцатеричное представление строки соответствует ожидаемому. Все вычисления выполняются локально в браузере; на сервер ничего не отправляется. Инструмент бесплатен и не требует аккаунта.
Основные возможности
- Конвертация текста в двоичный — Кодирует каждый байт UTF-8 входных данных как 8-битную двоичную строку (
01001000для ASCII-символаH). - Конвертация двоичного в текст — Декодирует двоичную строку (группы по 8 бит, разделённые пробелами или пробельными символами) обратно в текст.
- Поддержка шестнадцатеричного формата — Кодирует текст в hex-пары в верхнем регистре (
48дляH) или декодирует hex-пары обратно в текст. - Настраиваемые разделители — В режиме кодирования: пробел, без разделителя или перенос строки. Это контролирует читаемость и формат вывода.
- Валидация ввода — В режиме декодирования инструмент немедленно проверяет ввод. Двоичный ввод должен содержать только символы
0и1группами по 8. Hex-ввод должен содержать только допустимые hex-символы парами. Визуальный индикатор показывает статус валидности. - Поддержка Unicode/UTF-8 — Использует встроенные API браузера
TextEncoderиTextDecoder. Многобайтовые символы (символы с диакритикой, CJK, эмодзи) корректно кодируются и декодируются без потерь. - Конвертация в реальном времени — Вывод обновляется при каждом нажатии клавиши.
- Кнопка обмена — Перемещает текущий вывод в поле ввода и переключает режим одним кликом.
- Копирование в буфер обмена — Копирование вывода одним кликом.
- Пакетный режим — Обработка нескольких строк одновременно (функция для подписчиков).
Как использовать
Шаг 1: Выбрать режим
Вверху отображаются две кнопки режима: Text to Binary (кодирование) и Binary to Text (декодирование).
- Выберите Text to Binary, если у вас есть читаемый текст и вы хотите получить его двоичное или шестнадцатеричное представление.
- Выберите Binary to Text, если у вас есть двоичная или hex-строка и вы хотите восстановить исходный текст.
Шаг 2: Выбрать формат
Две кнопки формата: Binary и Hexadecimal.
- Binary производит или ожидает 8-битные двоичные строки (
01001000 01100101 01101100 01101100 01101111дляHello). - Hexadecimal производит или ожидает hex-пары в верхнем регистре (
48 65 6C 6C 6FдляHello).
Шаг 3: Выбрать разделитель (только режим кодирования)
В режиме кодирования доступны три варианта разделителя:
| Опция | Эффект | Пример вывода для hi |
|---|---|---|
| Space | Байты, разделённые пробелами | 01101000 01101001 |
| None | Без разделителя, байты слиты | 0110100001101001 |
| Line Break | Каждый байт на отдельной строке | 01101000\n01101001 |
Опция разделителя скрыта в режиме декодирования, так как декодер удаляет все пробельные символы перед обработкой.
Шаг 4: Ввести данные
Вставьте или введите содержимое в поле ввода. Вывод появляется немедленно в панели вывода.
Пример кодирования:
Ввод (текст): Hello Формат: Binary, разделитель: Space
Вывод: 01001000 01100101 01101100 01101100 01101111
Пример декодирования:
Ввод (двоичный): 01001000 01100101 01101100 01101100 01101111 Режим: Binary to Text
Вывод: Hello
Пример кодирования Unicode:
Ввод (текст): café Формат: Hexadecimal, разделитель: Space
Вывод: 63 61 66 C3 A9
Символ é кодируется как два байта (C3 A9), поскольку это многобайтовый символ UTF-8.
Шаг 5: Проверить ввод в режиме декодирования
Когда активен режим декодирования и вы ввели данные, появляется индикатор валидации:
✓ Valid input(зелёный) — ввод проходит проверку и может быть декодирован.✗ Invalid input(красный) — ввод содержит символы, которые не могут быть декодированы.
Для двоичного: только символы 0 и 1 (пробельные символы игнорируются), общее количество бит делится на 8. Для hex: только hex-символы (пробельные символы игнорируются), общее количество символов делится на 2.
Шаг 6: Использовать обмен для проверки
После кодирования нажмите кнопку Swap / Switch Mode, чтобы переместить закодированный вывод в ввод, переключиться в режим декодирования и убедиться, что исходный текст возвращается.
Практические примеры
Отладка сетевого протокола
Протокол отправляет двоичные полезные нагрузки. Вы перехватили 01001000 01100101 01101100 01101100 01101111 00100001 и хотите узнать, что в нём написано. Выберите Binary to Text, вставьте двоичные данные и прочитайте Hello! в выводе.
Проверка кодировки интернационализированного текста
Вы тестируете корректность обработки французской строки в вашем приложении. Введите façade в режиме кодирования с шестнадцатеричным форматом. Вывод 66 61 C3 A7 61 64 65 подтверждает, что ç кодируется как два байта (C3 A7), как и ожидается для UTF-8. Сравните это с реальным байтовым выводом вашего приложения.
Обучение студентов двоичному кодированию
Покажите, как буквы отображаются в биты. Введите один символ (A) и продемонстрируйте студентам двоичный вывод: 01000001. Измените символ на a (строчная буква) и наблюдайте 01100001. Разница в позиции бита 5 (0 против 1) иллюстрирует связь ASCII/Unicode между прописными и строчными буквами.
Советы и рекомендации
Пробельные символы в декодируемом вводе игнорируются. Декодер удаляет все пробельные символы (пробелы, табуляции, переносы строк) перед обработкой. Двоичный ввод, разделённый пробелами, переносами строк или без разделителя, обрабатывается одинаково.
Шестнадцатеричный вывод использует заглавные буквы. Инструмент всегда выводит hex в верхнем регистре (A до F). При декодировании принимаются как заглавные, так и строчные буквы (6F и 6f оба декодируются в o).
Многобайтовые символы создают несколько групп вывода. 4-байтовый эмодзи 😀 создаёт 4 двоичные группы (11110000 10011111 10011000 10000000) или 4 hex-пары (F0 9F 98 80). Это корректная кодировка UTF-8.
Используйте разделитель None для компактного вывода. Если вам нужен двоичный вывод без пробелов, выберите None. Декодер также принимает этот формат.
Кнопка обмена экономит шаг копирования. После кодирования вместо ручного копирования, смены режима и вставки просто нажмите Swap один раз.
Частые проблемы и устранение неисправностей
«Invalid binary input. Must contain only 0s and 1s in groups of 8.» Декодер выдаёт эту ошибку, когда в двоичной строке количество бит не делится на 8 или присутствуют не двоичные символы. Проверьте лишние буквы, цифры кроме 0 и 1, или знаки препинания во вводе.
«Invalid hex input. Must contain valid hex characters in pairs.» Возникает, когда в hex-вводе нечётное количество символов (после удаления пробельных символов) или символы за пределами 0-9A-Fa-f.
Вывод показывает нечитаемые символы. Это обычно означает, что исходные данные не были закодированы в UTF-8. Инструмент использует TextDecoder с кодировкой UTF-8 по умолчанию. Если исходные байты поступили из источника с кодировкой Latin-1 или Windows-1252, декодированный текст будет отличаться от оригинала.
Валидация показывает недопустимый ввод, хотя он выглядит корректным. Проверьте, делится ли общее количество бит на 8. Двоичная строка из 17 символов (после удаления пробельных символов) недопустима, так как 17 не кратно 8.
Кнопка «Копировать» неактивна. Кнопка «Копировать» неактивна, когда вывод пустой. Это происходит, когда ввод пустой или декодирование завершилось ошибкой. Сначала устраните ошибку валидации, затем скопируйте.
Конфиденциальность и безопасность
Binary Text Converter работает полностью в браузере. Кодирование использует встроенный API браузера TextEncoder; декодирование — TextDecoder. Ни один из этих API не выполняет сетевые запросы. Никакой текст или двоичные данные не передаются на сервер. Инструмент не имеет серверного компонента для конвертации и работает офлайн после загрузки страницы.
Часто задаваемые вопросы
Binary Text Converter бесплатный? Да, бесплатно без регистрации. Основная функциональность кодирования/декодирования полностью доступна без затрат. Функции для подписчиков (пресеты, история, пакетный режим) требуют подписки Glyph Widgets.
Работает офлайн? Да. Конвертация использует нативные API браузера (TextEncoder, TextDecoder). После загрузки страницы интернет-соединение не нужно.
Мой текст в безопасности? Ваш текст никогда не отправляется на сервер. Вся обработка выполняется локально в JavaScript. Внешние сервисы не задействованы.
Какая кодировка символов используется? UTF-8, через API TextEncoder и TextDecoder браузера. Это обеспечивает поддержку всех символов Unicode, включая эмодзи и символы за пределами Basic Multilingual Plane.
Почему é создаёт два hex-пары вместо одного? Потому что é (U+00E9) кодируется в UTF-8 как два байта: 0xC3 0xA9. UTF-8 кодирует кодовые точки выше U+007F с использованием нескольких байтов.
Можно ли декодировать двоичные данные с разделителем, отличным от пробела? Да. Декодер удаляет все пробельные символы перед обработкой, поэтому двоичные данные, разделённые пробелами, табуляциями, переносами строк или без разделителя, обрабатываются одинаково.
В чём разница между двоичным и шестнадцатеричным выводом? Оба представляют одни и те же базовые байты. Двоичный показывает каждый байт как 8 бит (например, 01001000). Шестнадцатеричный показывает каждый байт как 2 hex-цифры (например, 48). Hex компактнее — 5-символьное слово Hello даёт 40 двоичных символов против 14 hex-символов. Двоичный более нагляден для образовательных целей; hex более распространён в контекстах разработки.
Поддерживает ли инструмент эмодзи? Да. Эмодзи — многобайтовые символы UTF-8. Каждый кодируется в 3 или 4 байта и декодируется обратно в исходный эмодзи без потерь.
Можно ли конвертировать несколько строк одновременно? Да, с помощью пакетного режима (функция для подписчиков). Введите по одной строке в каждой строке пакетного ввода. Инструмент применяет текущие настройки режима и формата к каждой строке.
Почему в шестнадцатеричном выводе используются заглавные буквы? Вызов byte.toString(16) комбинируется с .toUpperCase() в исходном коде. Это распространённая конвенция — стандарты RFC и многие инструменты отладки отображают hex в верхнем регистре.
Связанные инструменты
- Base64 Encoder/Decoder — Другой распространённый формат кодирования для двоичных данных в текстовых контекстах.
- Character Counter — Подсчёт символов, байтов и кодовых точек в тексте перед кодированием.
- Case Converter — Изменение регистра текста до или после конвертации.
Попробуйте Binary Text Converter: Binary Text Converter