Usuwacz wulgaryzmów
Usuwa wulgaryzmy z tekstu.
Wejście
Wyjście
Instrukcja
Co to jest filtrowanie wulgaryzmów?
Filtrowanie wulgaryzmów to proces wykrywania i usuwania lub maskowania obraźliwych, wulgarnych lub nieodpowiednich słów z tekstu. Jest powszechnie używane na platformach internetowych, w aplikacjach czatu, forach i systemach zarządzania treścią, aby utrzymać środowisko przyjazne dla rodzin i zgodne z wytycznymi społeczności.
Nowoczesne filtry wulgaryzmów wykraczają poza proste dopasowywanie słów. Wykorzystują rozpoznawanie wzorców, aby wychwycić odmiany złych słów, w tym celowe błędy ortograficzne, podstawienia znaków (takie jak "sh1t" lub "a$$") i powtórzenia liter. To czyni je skutecznymi wobec użytkowników próbujących obejść filtry kreatywną ortografią.
Opis narzędzia
To narzędzie do usuwania wulgaryzmów wykrywa i cenzuruje obraźliwy język w Twoim tekście. Wykorzystuje zaawansowany algorytm dopasowywania, który wychwytuje typowe odmiany wulgaryzmów i próby zakamuflowania. Możesz wybrać zastąpienie złych słów wybranym znakiem lub całkowite ich usunięcie. Narzędzie obsługuje również dodawanie niestandardowych słów do listy filtrów.
Funkcje
- Wykrywa typowe angielskie wulgaryzmы i ich odmiany
- Wychwytuje próby zakamuflowania, takie jak podstawienia znaków i powtórzenia
- Dwa tryby cenzury: zastąpienie znakiem lub całkowite usunięcie
- Konfigurowalny znak zastępczy (*, #, itp.)
- Dodawaj własne niestandardowe słowa do listy filtrów
Przypadki użycia
- Moderacja treści: Oczyść treść generowaną przez użytkowników przed opublikowaniem na stronach internetowych, forach lub platformach mediów społecznych.
- Filtrowanie czatu: Przetwarzaj logi czatu lub wiadomości, aby usunąć nieodpowiedni język przed archiwizacją lub udostępnieniem.
- Sanityzacja dokumentów: Przygotuj dokumenty tekstowe do środowisk zawodowych lub przyjaznych dla rodzin, usuwając obraźliwy język.
Wyjaśnienie opcji
| Opcja | Opis |
|---|---|
| Tekst | Tekst wejściowy, który chcesz filtrować pod kątem wulgaryzmów |
| Tryb | Wybierz między "Zastąp znakiem" (maskuje złe słowa) lub "Usuń całkowicie" (usuwa złe słowa) |
| Znak zastępczy | Znak używany do maskowania wulgaryzmów w trybie zastępowania (domyślnie: *) |
| Niestandardowe złe słowa | Dodaj własne słowa do filtrowania, oddzielone przecinkami. Są one dodawane do wbudowanej listy wulgaryzmów |
Jak to działa
Narzędzie używa matchera opartego na wyrażeniach regularnych z biblioteką Obscenity. Stosuje zalecane transformatory, które normalizują tekst przed dopasowaniem, umożliwiając mu wykrycie:
- Standardowych wulgaryzmów i obelg
- Odmian leetspeak (np. "4ss" zamiast "ass")
- Powtórzeń znaków (np. "shiiit")
- Odmian mieszanego przypadku
- Typowych podstawień i zakamuflowań
Gdy wulgaryzm zostanie wykryty, narzędzie zastępuje każdy znak wybranym symbolem lub usuwa słowo całkowicie, czyszcząc dodatkowe spacje w trybie usuwania.
Ograniczenia
- Wbudowany słownik skupia się na angielskich wulgaryzmach
- Może czasami flagować uzasadnione słowa zawierające wulgarne podciągi (fałszywe alarmy)
- Nie może wykrywać wulgaryzmów na obrazach lub zawartości innej niż tekst
- Filtrowanie świadome kontekstu nie jest obsługiwane (słowa, które są obraźliwe w niektórych kontekstach, ale nie w innych)
Wskazówki
- Użyj funkcji niestandardowych złych słów, aby dodać terminy specyficzne dla branży lub słowa w innych językach
- Przetestuj wybór znaku zastępczego—niektóre platformy mogą mieć dodatkowe filtry, które flagują określone symbole
- W przypadku całkowitego usunięcia przejrzyj wynik, aby upewnić się, że zdania mają nadal sens gramatyczny