Анализатор на разрывите на редове
Анализирайте разрывите на редове в текст или файлове. Открийте CRLF, LF и CR типове разрывите на редове, пребройте появленията и преглеждайте статистика на редовете, включително общ брой редове, най-дълъг, най-кратък и средна дължина на редовете.
Вход
Изход
Прочети ме
Какво са краищата на редовете?
Крайът на редица (наричан също нов ред или последователност край на редица) е специален знак или двойка знаци, които отбелязват където един ред текст завършва и следващият започва. Три различни конвенции съществуват в операционните системи: LF (\n, един знак за преместване на линия), CRLF (\r\n, връщане на каретката, последвано от преместване на линия), и CR (\r, самостоятелно връщане на каретката).
Разликата произхожда от ранния компютърен хардуер. Пишещите машини изискваха две физически стъпки за начало на нов ред — преместване на каретката обратно в началото (CR) и преместване на хартията един ред (LF). Unix системите приеха само LF през 1970-те години, докато MS-DOS и по-късно Windows запазиха пълната последователност CR+LF. Класическата Mac OS (преди OS X) използваше само CR, въпреки че съвременната macOS следва Unix конвенцията за LF.
Смесени краища на редовете са често срещани във файлове, които са редактирани на множество платформи, прехвърлени между системи или свързани от различни източници. Те могат да причинят фини грешки в скриптове, инструменти за изграждане и системи за контрол на версиите.
Описание на инструмента
Този инструмент анализира текст или файл и открива кои типове краища на редовете са налични. Той брои всеки тип поотделно — CRLF, LF и CR — и докладва общия стил на краищата на редовете (включително дали файлът има смесени краища). Той също така предоставя основна статистика на редовете: общ брой редове, най-дълъг ред, най-кратък ред и средна дължина на редица.
Функции
- Открива всички три типа краища на редовете: CRLF (Windows), LF (Unix/macOS) и CR (класическа Mac)
- Идентифицира смесени краища на редовете и обозначава доминиращия стил
- Приема както вставен текст чрез редактор на код, така и качени файлове от всеки текстов формат
- Брои всеки тип крайът на редица независимо без двойно броене
- Докладва общ брой редове, най-дълъг ред, най-кратък ред и средна дължина на редица
Случаи на употреба
- Отстраняване на грешки при кръстосани платформи — скриптове или конфигурационни файлове с неочаквани CRLF краища често се счупват на Unix сървъри; използвайте този инструмент, за да потвърдите краищата на редовете преди разгръщане
- Подготовка на преглед на код — проверете, че файл, допринесен от Windows машина, използва очаквания LF конвенция на проекта преди ангажиране
- Одит на текстови файлове — бързо инспектирайте лог файлове, CSV или експорт на данни, за да разберете тяхната структура преди програмно анализиране
Как работи
CRLF последователностите (\r\n) се открива и броят първо, използвайки съвпадение на regex. Съвпадащите двойки се премахват от низа преди отделното броене на самостоятелни LF (\n) и CR (\r) знаци. Това предотвратява един \r\n да бъде брой както CR, така и LF. Статистиката на редовете се получава чрез разделяне на оригиналния текст на всички три модели на краищата на редовете.