Reavahetuse analüsaator
Analüüsige reavahetusi tekstis või failides. Tuvastage CRLF, LF ja CR reavahetuse tüübid, loendage esinemisi ja vaadake rea statistikat, sealhulgas ridade koguarv, pikim, lühim ja keskmine rea pikkus.
Sisend
Väljund
Loe mind
Mis on reavad?
Reavahe (tuntud ka kui uus rida või rea lõpu jada) on spetsiaalne märk või märkide paar, mis näitab, kus üks teksti rida lõpeb ja järgmine algab. Operatsioonisüsteemides eksisteerivad kolm erinevat konventsiooni: LF (\n, üksik reavahe märk), CRLF (\r\n, kärje tagasikäik millele järgneb reavahe), ja CR (\r, eraldiseisev kärje tagasikäik).
Erinevus pärineb varaste arvutite riistvarast. Kirjutusmasinad nõudsid kahte füüsilist sammu uue rea alustamiseks — kärje tagasikäik algusesse (CR) ja paberi edasi liigutamine ühe rea võrra (LF). Unix-süsteemid võtsid 1970. aastatel kasutusele ainult LF-i, samas kui MS-DOS ja hilisem Windows säilitasid täieliku CR+LF jada. Klassikaline Mac OS (enne OS X-i) kasutas ainult CR-i, kuigi kaasaegne macOS järgib Unix LF konventsiooni.
Segatud reavahed on levinud failides, mida on redigeeritud mitmel platvormil, edastatud süsteemide vahel või kombineeritud erinevatest allikatest. Need võivad põhjustada subtiiilseid vigu skriptides, ehitusvahendeites ja versioonihaldussüsteemides.
Tööriista kirjeldus
See tööriist analüüsib teksti või faili ja tuvastab, millised reavahe tüübid on olemas. See loendab iga tüüpi eraldi — CRLF, LF ja CR — ning teatab üldise reavahe stiili (sealhulgas kas failil on segatud reavahed). See annab ka põhilisi rea statistikat: ridade koguarv, pikim rida, lühim rida ja keskmine rea pikkus.
Funktsioonid
- Tuvastab kõik kolm reavahe tüüpi: CRLF (Windows), LF (Unix/macOS) ja CR (klassikaline Mac)
- Tuvastab segatud reavahed ja märgistab domineeriva stiili
- Aktsepteerib nii kleebitud teksti koodireeturi kaudu kui ka üleslaaditud faile mis tahes teksti vormingus
- Loendab iga reavahe tüüpi iseseisvalt ilma topeltloendamiseta
- Teatab ridade koguarvust, pikim rida, lühim rida ja keskmine rea pikkus
Kasutusjuhud
- Platvormideüleste ehitusprobleemide silumine — skriptid või konfiguratsioonifailid ootamatu CRLF lõpuga murravad sageli Unix-serverites; kasuta seda tööriista reavahe kinnitamiseks enne juurutamist
- Koodiülevaatuse ettevalmistamine — kontrolli, et Windowsi masinast pärit fail kasutab projekti eeldatavat LF konventsiooni enne kinnitamist
- Tekstifaili audit — kontrolli kiiresti logifaile, CSV-sid või andmete eksporte, et mõista nende struktuuri enne nende programmilist analüüsimist
Kuidas see töötab
CRLF jadad (\r\n) tuvastatakse ja loendatakse esmalt regulaaravaldise abil. Leitud paarid eemaldatakse seejärel stringist enne eraldiseisva LF (\n) ja CR (\r) märkide loendamist. See takistab üksikut \r\n loendamist nii CR-ina kui ka LF-ina. Rea statistika saadakse algse teksti jagamisel kõigil kolmel reavahe mustril.