mardi 24 janvier 2012

Rozdělit do textového souboru na polovinu (nebo procento) na Ubuntu Linux

Pokud máte nemotorný textový soubor, který se snaží zpracovat, rozdělit ji do sekce mohou někdy pomoci čas na zpracování, zejména v případě, že budeme importovat soubor do tabulky. Nebo můžete jen získat určitou sadu řádků ze souboru.

Zadejte Split, WC, ocas, kočka, a grep. (Nezapomeňte, sed a awk). Linux obsahuje bohatou sadu nástrojů pro práci s textovými soubory na příkazovém řádku. Pro náš úkol dnes budeme používat split a WC.

Nejprve se podíváme na naše log soubor ....

> Ls-l
-Rw-rr-1 thegeek ggroup 42046520 2006-09-19 11:42 access.log

Vidíme, že velikost souboru je 42 MB To je docela velká ... Ale kolik řádků se zabýváme? Pokud bychom chtěli importovat do aplikace Excel, potřebovali bychom, aby to méně než 65 tisíc linek.

Podívejme se na počet řádků v souboru pomocí utility WC, což je zkratka pro "Počet slov".

> Wc-l access.log
146330 access.log

Jsme tak přes naše hranice. Budeme muset rozdělit tento na 3 části. Použijeme rozdělení nástroj, jak toho dosáhnout.

> Split-l 60000 access.log
> Ls-l

Celkem 79124
-Rw-rw-r-1 thegeek ggroup 40465200 2006-09-19 12:00 access.log
-Rw-rw-r-1 thegeek ggroup 16598163 2006-09-19 12:05 XAA
-Rw-rw-r-1 thegeek ggroup 16596545 2006-09-19 12:05 xab
-Rw-rw-r-1 thegeek ggroup 7270492 2006-09-19 12:05 XAC

Nyní jsme naše textové soubory rozdělit na 3 samostatné soubory, z nichž každý obsahuje méně než 60000 řádků, což vypadalo jako dobré číslo si vybrat. Poslední soubor obsahuje zbylé částky. Pokud jste se chystá snížit tento konkrétní soubor na dvě poloviny, měli byste si udělat toto:

> Split-l 73165 access.log

A to je vše, co se to.

Aucun commentaire:

Enregistrer un commentaire