Удалитель ненормативной лексики
Удаляйте ненормативные слова из текста.
Ввод
Вывод
Документация
Что такое фильтрация ненормативной лексики?
Фильтрация ненормативной лексики — это процесс обнаружения и удаления или маскирования оскорбительных, вульгарных или неприемлемых слов из текста. Она широко используется на онлайн-платформах, в приложениях чата, форумах и системах управления контентом для поддержания семейной атмосферы и соответствия правилам сообщества.
Современные фильтры ненормативной лексики выходят за рамки простого сопоставления слов. Они используют распознавание образов для выявления вариаций нецензурных слов, включая намеренные опечатки, замену символов (например, "sh1t" или "a$$") и повторение букв. Это делает их эффективными против пользователей, пытающихся обойти фильтры творческим написанием.
Описание инструмента
Этот инструмент удаления ненормативной лексики обнаруживает и цензурирует оскорбительный язык в вашем тексте. Он использует продвинутый алгоритм сопоставления, который выявляет распространённые вариации нецензурных слов и попытки их маскировки. Вы можете выбрать замену плохих слов символом на ваш выбор или удалить их полностью. Инструмент также поддерживает добавление пользовательских слов в список фильтра.
Возможности
- Обнаруживает распространённую английскую ненормативную лексику и её вариации
- Выявляет попытки маскировки, такие как замена символов и повторение букв
- Два режима цензурирования: замена символом или полное удаление
- Настраиваемый символ замены (*, #, и т. д.)
- Добавляйте собственные слова в список фильтра
Варианты использования
- Модерация контента: Очищайте пользовательский контент перед публикацией на веб-сайтах, форумах или платформах социальных сетей.
- Фильтрация чата: Обрабатывайте логи чата или сообщения для удаления неприемлемого языка перед архивированием или обменом.
- Санитизация документов: Подготавливайте текстовые документы для профессиональной или семейной среды путём удаления оскорбительного языка.
Объяснение параметров
| Параметр | Описание |
|---|---|
| Текст | Входной текст, который вы хотите отфильтровать на предмет ненормативной лексики |
| Режим | Выберите между "Заменить символом" (маскирует плохие слова) или "Удалить полностью" (удаляет плохие слова) |
| Символ замены | Символ, используемый для маскирования ненормативной лексики в режиме замены (по умолчанию: *) |
| Пользовательские плохие слова | Добавляйте свои слова для фильтрации, разделённые запятыми. Они добавляются к встроенному списку ненормативной лексики |
Как это работает
Инструмент использует сопоставитель на основе регулярных выражений с библиотекой Obscenity. Он применяет рекомендуемые преобразователи, которые нормализуют текст перед сопоставлением, позволяя ему обнаруживать:
- Стандартную ненормативную лексику и оскорбления
- Вариации в стиле Leetspeak (например, "4ss" вместо "ass")
- Повторение символов (например, "shiiit")
- Вариации с разными регистрами
- Распространённые замены и маскировки
Когда обнаруживается ненормативная лексика, инструмент либо заменяет каждый символ выбранным вами символом, либо удаляет слово полностью, очищая лишние пробелы в режиме удаления.
Ограничения
- Встроенный словарь сосредоточен на английской ненормативной лексике
- Может иногда помечать законные слова, содержащие нецензурные подстроки (ложные срабатывания)
- Не может обнаруживать ненормативную лексику в изображениях или нетекстовом контенте
- Фильтрация с учётом контекста не поддерживается (слова, которые оскорбительны в одних контекстах, но не в других)
Советы
- Используйте функцию пользовательских плохих слов для добавления терминов, специфичных для отрасли, или слов на других языках
- Протестируйте выбор символа замены — некоторые платформы могут иметь дополнительные фильтры, которые помечают определённые символы
- Для полного удаления просмотрите результат, чтобы убедиться, что предложения по-прежнему имеют грамматический смысл