O que é filtragem de profanidade?

A filtragem de profanidade é o processo de detectar e remover ou mascarar palavras ofensivas, vulgares ou inadequadas do texto. É comumente usada em plataformas online, aplicativos de chat, fóruns e sistemas de gerenciamento de conteúdo para manter um ambiente apropriado para famílias e estar em conformidade com as diretrizes da comunidade.

Os filtros de profanidade modernos vão além da simples correspondência de palavras. Eles usam reconhecimento de padrões para detectar variações de palavras ofensivas, incluindo erros ortográficos intencionais, substituições de caracteres (como "sh1t" ou "a$$") e repetições de letras. Isso os torna eficazes contra usuários que tentam contornar filtros com ortografia criativa.

Descrição da ferramenta

Esta ferramenta de remoção de profanidade detecta e censura linguagem ofensiva em seu texto. Ela usa um algoritmo de correspondência avançado que detecta variações comuns de profanidade e tentativas de ofuscação. Você pode escolher substituir palavras ofensivas por um caractere de sua escolha ou removê-las completamente. A ferramenta também suporta a adição de palavras personalizadas à lista de filtros.

Recursos

  • Detecta profanidade em inglês comum e suas variações
  • Detecta tentativas de ofuscação como substituições de caracteres e repetições
  • Dois modos de censura: substituir por caractere ou remover completamente
  • Caractere de substituição personalizável (*, #, etc.)
  • Adicione suas próprias palavras personalizadas à lista de filtros

Casos de uso

  • Moderação de conteúdo: Limpe o conteúdo gerado pelo usuário antes de publicar em sites, fóruns ou plataformas de mídia social.
  • Filtragem de chat: Processe logs de chat ou mensagens para remover linguagem inadequada antes de arquivar ou compartilhar.
  • Sanitização de documentos: Prepare documentos de texto para ambientes profissionais ou apropriados para famílias removendo linguagem ofensiva.

Opções explicadas

Opção Descrição
Texto O texto de entrada que você deseja filtrar para profanidade
Modo Escolha entre "Substituir por caractere" (mascara palavras ofensivas) ou "Remover completamente" (exclui palavras ofensivas)
Caractere de substituição O caractere usado para mascarar profanidade quando em modo de substituição (padrão: *)
Palavras ofensivas personalizadas Adicione suas próprias palavras para filtrar, separadas por vírgulas. Estas são adicionadas à lista de profanidade integrada

Como funciona

A ferramenta usa um matcher baseado em expressão regular com a biblioteca Obscenity. Ela aplica transformadores recomendados que normalizam o texto antes da correspondência, permitindo detectar:

  • Profanidade e insultos padrão
  • Variações em leetspeak (por exemplo, "4ss" para "ass")
  • Repetições de caracteres (por exemplo, "shiiit")
  • Variações de maiúsculas e minúsculas
  • Substituições e ofuscações comuns

Quando a profanidade é detectada, a ferramenta substitui cada caractere pelo símbolo escolhido ou remove a palavra completamente, limpando espaços extras no modo de remoção.

Limitações

  • O dicionário integrado se concentra em profanidade em inglês
  • Pode ocasionalmente sinalizar palavras legítimas que contêm substrings profanas (falsos positivos)
  • Não pode detectar profanidade em imagens ou conteúdo não textual
  • A filtragem com reconhecimento de contexto não é suportada (palavras que são ofensivas em alguns contextos, mas não em outros)

Dicas

  • Use o recurso de palavras ofensivas personalizadas para adicionar termos específicos do setor ou palavras em outros idiomas
  • Teste sua escolha de caractere de substituição—algumas plataformas podem ter filtros adicionais que sinalizam certos símbolos
  • Para remoção completa, revise a saída para garantir que as frases ainda façam sentido gramatical