Analisador de Quebras de Linha
Analise terminações de linha em texto ou arquivos. Detecte tipos de quebra de linha CRLF, LF e CR, conte ocorrências e visualize estatísticas de linha incluindo total de linhas, mais longa, mais curta e comprimento médio da linha.
Entrada
Saída
Leia-me
O que são terminações de linha?
Uma terminação de linha (também chamada de newline ou sequência de fim de linha) é um caractere especial ou par de caracteres que marca onde uma linha de texto termina e a próxima começa. Três convenções distintas existem entre sistemas operacionais: LF (\n, um único caractere linefeed), CRLF (\r\n, um retorno de carro seguido por um linefeed), e CR (\r, um retorno de carro isolado).
A diferença origina-se do hardware de computação primitivo. Máquinas de escrever exigiam dois passos físicos para iniciar uma nova linha — mover o carro de volta ao início (CR) e avançar o papel uma linha (LF). Sistemas Unix adotaram apenas LF nos anos 1970, enquanto MS-DOS e posterior Windows mantiveram a sequência completa CR+LF. O clássico Mac OS (antes do OS X) usava CR sozinho, embora o macOS moderno siga a convenção Unix LF.
Terminações de linha mistas são comuns em arquivos que foram editados em múltiplas plataformas, transferidos entre sistemas, ou concatenados de diferentes fontes. Elas podem causar bugs sutis em scripts, ferramentas de build e sistemas de controle de versão.
Descrição da ferramenta
Esta ferramenta analisa texto ou um arquivo e detecta quais tipos de terminação de linha estão presentes. Ela conta cada tipo individualmente — CRLF, LF e CR — e relata o estilo geral de terminação de linha (incluindo se o arquivo tem terminações mistas). Ela também fornece estatísticas básicas de linha: contagem total de linhas, linha mais longa, linha mais curta e comprimento médio de linha.
Recursos
- Detecta todos os três tipos de terminação de linha: CRLF (Windows), LF (Unix/macOS) e CR (Mac clássico)
- Identifica terminações de linha mistas e rotula o estilo dominante
- Aceita tanto texto colado via editor de código quanto arquivos enviados de qualquer formato de texto
Como funciona
Sequências CRLF (\r\n) são detectadas e contadas primeiro usando uma correspondência regex. Os pares correspondidos são então removidos da string antes de contar separadamente caracteres LF (\n) e CR (\r) isolados. Isso evita que um único \r\n seja contado tanto como CR quanto como LF. As estatísticas de linha são derivadas dividindo o texto original em todos os três padrões de terminação de linha.