/blog/perl


substr() in Perl
[154287 mal gelesen]
foreach in Perl
[129187 mal gelesen]
Arrays in Perl - Besonderheiten
[125445 mal gelesen]
split() in Perl - Zeichenketten teilen
[113659 mal gelesen]
open() - Dateien öffnen in Perl
[109015 mal gelesen]
grep - Listen durchsuchen in Perl
[94772 mal gelesen]
chomp() in Perl
[93659 mal gelesen]
push in Perl
[90875 mal gelesen]
sleep in Perl - Das aktuelle Script warten lassen
[76007 mal gelesen]
index() in Perl - Zeichenkette in Zeichenkette suchen
[59612 mal gelesen]


Arrays
Dateien
HTPC
Hashes
Leistungsoptimiert
PHP
Perl
RegEx
Schleifen
Script
Skalare
Sonstiges
System
Webserver
Zur Startseite


Montag, 9.4.2007, 00:00:49 Uhr

grep - Listen durchsuchen in Perl


Syntax
grep {BLOCK} ARRAY;
oder
grep (EXPR, ARRAY); bzw. grep EXPR,ARRAY;

Der Befehl grep ist ein sehr mächtiger und universeller Befehl, mit dem sich bestimmte Einträge in Arrays finden lassen.
Die Ergebnisse werden als neues Array zurückgegeben, bzw. im skalaren Kontext die Anzahl der gefundenen zutreffenden Elemente von des Arrays.

Der grep-Befehl führt die Anweisung(en) in BLOCK oder EXPR für jedes Element des Arrays ARRAY. Dabei kann BLOCK ein oder mehrere Perl-Befehle beinhalten, getrennt durch ein Semikolon, EXPR kann Variablen, Subroutinen-Aufrufe und Befehle enthalten.
Wichtig ist jedoch, daß der grep-Befehl intern für jedes Element von ARRAY das $_ verwendet wird, und jede Änderung an $_ wird automatisch in ARRAY übernommen. Man sollte also Vorsicht walten lassen, da möglicherweise die Originaldaten verändert werden.

grep gibt als Ergebnis eine Liste zurück, die das beinhaltet, was in EXPR oder BLOCK als true, also zutreffend, gefunden wurde.
Sind mehrere Anweisungen in einem BLOCK, so ist die Letzte entscheident, ob ein Element true oder false ist.

Vielleicht ein kleines Beispiel:

@a=(1,2,3,4,5,6,7,8,9,10,11,12,13);

print grep {$_<10 && $_>5;} @a;


Es wird ein Array mit den Elementen 1 - 13 angelegt und per grep werden alle Elemente größer 5 und kleiner 10 ausgegeben.
Ausgabe daher:
6789

Moment mal, könnte man sich jetzt denken, das was der da mit grep macht, das krieg ich auch ganz leicht mit einer foreach-Schleife hin:

@a=(1,2,3,4,5,6,7,8,9,10,11,12,13);
foreach (@a){
print $_ if ($_<10 && $_>5);
}


Und was soll ich sagen: o, genau richtig, denn grep macht ja eigentlich auch nichts anderes als jedes Element einzeln zu untersuchen.
Aber grep kann vieles wesentlich schneller und vor allem flexibler.

Nächstes Beispiel, mal wieder Dateien finden:

opendir(DIR,"testdir");
my @dateien = readdir(DIR);
closedir(DIR);

my @htm= grep (/\.htm$/,@dateien);

print join(" ",@htm);


Was passiert hier?
Es wird das Verzeichnis testdir geöffnet und eingelesen in ein Array @dateien.
Danach wird per grep ein neues Array erzeugt, in dem alle Dateien enthalten sind, die mit .htm enden. Dieses Array wird schließlich ausgegeben.

Vielleicht nicht so die Killeranwendung im Alltag, jedoch als Beispiel ganz gut, denke ich. Vor allem sieht man, wie einfach und schnell sich die Suche nach der Dateiendung gestaltet und wie übersichtlich der Code ist.

Interessant ist in dem Zusammenhang vielleicht auch die Unterschiedlichkeit der Bedingungen im ersten und im zweiten Beispiel. Während es im ersten Beispiel eine if-Abfrage war, war es hier im zweiten Beispiel eine RegEx. grep ist also sehr vielfältig beim Durchsuchen von Arrays.

Ein Beispiel noch, um den skalaren Kontext etwas besser zu erläutern:

@a=(1,2,3,4,5,6,7,8,9,10,11,12,13,7,3,4,5,1,2,8,5,4,11,1234,5,0,9,0,9,8,7,5);

$anzahl= grep {$_==5;} @a;
print "Die 5 ist $anzahl mal enthalten";


Es wird ein Array nach dem Vorkommen der Zahl 5 durchsucht und die Anzahl des Auftretens ausgegeben. grep dient also dazu, die Anzahl zu bestimmen.

Nächstes Beispiel

@a=(1,2,3,4,5,6,7,8,9,10,11,12,13,1,2);

print grep {$temp{$_}==2} grep{$temp{$_}++} @a;


Es wird das Array @a nach Elementen untersucht, die exakt 2 mal auftreten.

Wie geht das?
Das Array @a wird zuerst durch das zweite grep geschleust. Dabei wird der jeweilige Hash-Wert um eins erhöht. Wenn alle Elemente durch sind, übergibt das grep seine Ergebnisse (nämlich alle, bzw. in dem Fall sind es dann die keys des Hashes %temp) dem linken grep, das dann untersucht, welcher Hash-Wert == 2 ist. Diese keys werden dann ausgegeben.


Nächstes Beispiel, eine Datei untersuchen nach dem Vorkommen eines Wortes:

use strict;
open (my $IN,"<datei.txt") || die "can not open datei: $!";
print grep /Sommer|Sonne/i, <$IN>;
close $IN;


Das Beispiel durchsucht eine Datei nach Zeilen, die die Wörter Sonne oder Sommer enthalten.
Interessant ist in dem Zusammenhang die Tatsache, daß grep das <$IN> ja als Array betrachtet. Dazu wird besagtes <$IN> komplett in den Arbeitsspeicher eingelesen. Na, klingelts? Große Dateien können da schon mal den Rechner lahmlegen! Deswegen sollte dieses Beispiel nur zur Demonstration dienen, im "echten Leben" sollte man lieber die Zeilen einzeln einlesen und durchsuchen! Zum Beispiel so:

open (my $IN,'<datei.txt') || die "Error: $!";
while (<$IN>){
print $_ if ($_=~ /Sommer|Sonne/i);
}
close $IN;


Gerade dieses Beispiel zeigt, daß alles, was grep kann, auch mit Schleifen gelöst werden kann.
Aber mit grep ist eben vieles einfacher und meist auch schneller.

Eine etwas ältere, sehr gute Beschreibung von grep, map und sort (leider in Englisch) finden Sie hier.


Thema: Perl Arrays

Der Beitrag "grep - Listen durchsuchen in Perl" wurde 94773 mal gelesen.

Es wurde 38 x über diesen Beitrag abgestimmt.
Die durchschnittliche Beurteilung liegt bei
2.1 (1 = sehr gut - 6 = grottenschlecht).

Kommentar schreiben  Druckansicht  Seitenanfang 
Beurteilen 






 Zufällige Beiträge im /blog/perl

IP-Adresse anhand des Domainnamens herausfinden

mkdir() - Ein Verzeichnis erstellen in Perl

values() - Alle Werte eines Hashes ermitteln

Webserver mit Apache, MySQL, Perl und PHP auf Windows-PC simulieren

Mac-Adresse herausfinden unter Windows Vista, Windows 7 und XP

Eine nette kleine RegEx

Wie viele Zeilen hat die Datei?

read() - Bestimmte Anzahl Zeichen aus Datei einlesen

Unicode mit Perl - Einfache (?) Anwendung



0.0357589721679688 sec. to build



...Blogsoftware in pure Perl - Powered by a lot of Coffee...


SSD-Festplatte - Wassn das???
Die Transliteration - Nur ein Zeichen in einem Skalar ersetzen
Select - Case in Perl
Windows 7 XP Mode – Wo finde ich den XP-Modus unter Windows 7?
Mac-Adresse beim Apple Macintosh herausfinden
SGN-Funktion für Perl

Eigene IP herausfinden mit Perl
Epoche live in Datum umwandeln
Firefox 3 - Exe-Files downloaden


Gesamtverzeichnis
Februar 2010
Dezember 2009
Oktober 2009
Januar 2009
Dezember 2008
November 2008
September 2008
August 2008
Juli 2008
Juni 2008
Mai 2008
April 2008
Januar 2008
Dezember 2007
November 2007
Oktober 2007
September 2007
August 2007
Juni 2007
Mai 2007
April 2007
März 2007
Februar 2007
Januar 2007
Dezember 2006


Mister Wong

RSS-Feed

Heute ist der
12.12.2024

Es ist
13:52:11 Uhr

Ihre IP:
18.97.9.172

Blog-Einträge: 186

Die letzten 24 Stunden im Überblick


Gelesene Beiträge insgesamt:
4426865


Webseiten vergleichen
Kalender mit Feiertagen - 2028
Links finden und testen
Menschliche Datumsangaben
IP zu Domain herausfinden
Time live in Datum umwandeln
Perl für Windows



Impressum