Wat zijn regeleindes?

Een regeleinde (ook wel newline of end-of-line sequence genoemd) is een speciaal teken of tekenpaar dat aangeeft waar één regel tekst eindigt en de volgende begint. Er bestaan drie verschillende conventies in besturingssystemen: LF (\n, een enkel linefeed-teken), CRLF (\r\n, een carriage return gevolgd door een linefeed), en CR (\r, een zelfstandige carriage return).

Het verschil ontstaat uit vroege computerhardware. Schrijfmachines vereisten twee fysieke stappen om een nieuwe regel te starten — de wagen terugtrekken naar het begin (CR) en het papier één regel vooruit brengen (LF). Unix-systemen namen in de jaren 70 alleen LF aan, terwijl MS-DOS en later Windows de volledige CR+LF-reeks behielden. Classic Mac OS (vóór OS X) gebruikte alleen CR, hoewel modern macOS de Unix LF-conventie volgt.

Gemengde regeleindes komen veel voor in bestanden die op meerdere platforms zijn bewerkt, tussen systemen zijn overgedragen, of uit verschillende bronnen zijn samengevoegd. Ze kunnen subtiele bugs veroorzaken in scripts, buildtools en versiebeheersystemen.

Gereedschapbeschrijving

Dit gereedschap analyseert tekst of een bestand en detecteert welke regeleindetypes aanwezig zijn. Het telt elk type afzonderlijk — CRLF, LF en CR — en rapporteert de algemene regelendestijl (inclusief of het bestand gemengde eindes heeft). Het biedt ook basisregelstatistieken: totaal aantal regels, langste regel, kortste regel en gemiddelde regellengte.

Functies

  • Detecteert alle drie regeleindetypes: CRLF (Windows), LF (Unix/macOS) en CR (classic Mac)
  • Identificeert gemengde regeleindes en geeft de dominante stijl aan
  • Accepteert zowel geplakte tekst via een code-editor als geüploade bestanden van elk tekstformaat
  • Telt elk regelendetype onafhankelijk zonder dubbeltelling
  • Rapporteert totaal aantal regels, langste regel, kortste regel en gemiddelde regellengte

Gebruiksscenario's

  • Foutopsporing van platformoverschrijdende buildfouten — scripts of configuratiebestanden met onverwachte CRLF-eindes breken vaak op Unix-servers; gebruik dit gereedschap om regeleindes vóór implementatie te bevestigen
  • Voorbereiding van codebeoordelingen — controleer of een bestand van een Windows-machine de verwachte LF-conventie van het project gebruikt voordat u het doorvoert
  • Audit van tekstbestanden — inspecteer snel logbestanden, CSV's of gegevensexports om hun structuur te begrijpen voordat u ze programmatisch parseert

Hoe het werkt

CRLF-reeksen (\r\n) worden eerst gedetecteerd en geteld met behulp van een regex-match. De overeenkomende paren worden vervolgens uit de string verwijderd voordat zelfstandige LF (\n) en CR (\r) tekens afzonderlijk worden geteld. Dit voorkomt dat een enkele \r\n als zowel een CR als een LF wordt geteld. Regelstatistieken worden afgeleid door de originele tekst op alle drie regeleindepatronen te splitsen.