/blog/perl


substr() in Perl
[153789 mal gelesen]
foreach in Perl
[129083 mal gelesen]
Arrays in Perl - Besonderheiten
[125222 mal gelesen]
split() in Perl - Zeichenketten teilen
[113349 mal gelesen]
open() - Dateien öffnen in Perl
[108892 mal gelesen]
grep - Listen durchsuchen in Perl
[94580 mal gelesen]
chomp() in Perl
[93558 mal gelesen]
push in Perl
[90753 mal gelesen]
sleep in Perl - Das aktuelle Script warten lassen
[75884 mal gelesen]
index() in Perl - Zeichenkette in Zeichenkette suchen
[59377 mal gelesen]


Arrays
Dateien
HTPC
Hashes
Leistungsoptimiert
PHP
Perl
RegEx
Schleifen
Script
Skalare
Sonstiges
System
Webserver
Zur Startseite


Samstag, 13.10.2007, 10:34:16 Uhr

Automatische Stichwortverlinkung


Nicht daß man denkt, ich würde jetzt den ganzen Tag an meinem HTPC hängen, nein, ich hab gerade heute ein neues Feature in mein Blog-Script eingebaut:

Ich kam auf die Idee, daß es doch schön wäre, wenn bestimmte Wörter automatisch mit bestimmten Seiten verlinkt werden, so zum Beispiel das Wort print mit der entsprechenden Seite, die den print-Befehl beschreibt.

Eigentlich recht einfach, denkt man (jedenfalls ich), hatte aber natürlich wieder so seine Tücken.

Aber erstmal von Anfang an:
Die Texte im Blog sind in .txt-Form gespeichert, so richtig mit äöü und so. Darin enthalten sind Formatierungen. Das erstmal vorweg.

Ich dachte also, na gut, beim Umwandeln ins HTML-Format guckst Du gleich, ob eben jene bestimmte Worte enthalten sind und verlinkst sie einfach.

Also aus der Zeile:

das ist ein Testtext zu print


macht das Programm

das ist ein Testtext zu <a href="entsprechende-seit.htm">print</a>.



Das war auch schnell geschafft. Bis ich dahinter kam, daß das Script auch Wörter in Links umgewandelt hat, wenn eben diese Wörter darin vorkamen. Folge war, daß die Links dann natürlich nicht mehr funktionierten.

Ich hab die Regex dann also so modifiziert, daß sie nun folgendermaßen aussieht

$ersetzwort='print';
$ersetzwoerter{print}='http://www.sonstwas.de';
$_=~ s/([^<]*.*?\W)($ersetzwort)(\W)(.*?)([^>])/\1<a href=\"$ersetzwoerter{$ersetzwort}\">\2<\/a>\3\4\5/;

$zeile=~ s/^($ersetzwort)([^\w])/<a href=\"$ersetzwoerter{$ersetzwort}\" class=\"linkunterstrichen\"> \1<\/a>\2/gis;


Wie man sieht, sind im Hash %ersetzwoerter die Links enthalten, aber das nur am Rande.

Und wie geht das nun?
Also:
In $zeile steht eine Zeile der Blog-Eintraege.
Diese Zeile wird untersucht nach
([^<]*.*?\W) -> kein <, danach beliebige Zeichen und ein Sonderzeichen
($ersetzwort) -> das zu ersetzende Wort
([\W]) -> kein Buchstaben und Ziffer nach dem gesuchten Wort, auch kein abschließendes >

Wenn also ein HTML-Tag ein Suchwort enthält, wird der HTML-Tag NICHT verändert.

Ist ein Suchwort ein Teil eines größeren Wortes, soll ebenfalls nichts verändert werden.

Die zweite Prüfung ist übrigens dafür, daß auch Wörter am Zeilenanfang gefunden werden.

So weit läuft es schon gut, ich werde das mal im Auge behalten und testen. Und natürlich jetzt alle möglichen Stichworte einführen.


Nachtrag
Das mit der RegEx war wohl nix, wie es besser geht steht hier.

Thema: Perl RegEx

Der Beitrag "" wurde 6028 mal gelesen.

Es wurde 1 x über diesen Beitrag abgestimmt.
Die durchschnittliche Beurteilung liegt bei
2 (1 = sehr gut - 6 = grottenschlecht).

Kommentar schreiben  Druckansicht  Seitenanfang 
Beurteilen 






 Zufällige Beiträge im /blog/perl

Nochmal Links testen - mein Modul für Perl

push in Perl

chdir - Aktuelles Arbeitsverzeichnis definieren

Hash Slices - Was ist das?

rindex in Perl - Zeichenketten "von rechts" durchsuchen

Windows Vista - Verwaltungswerkzeuge

Sozialfotografie-Blog

Skalar durchsuchen und gefundene Ergebnisse in Array schreiben



0.0205459594726562 sec. to build



...Blogsoftware in pure Perl - Powered by a lot of Coffee...


SSD-Festplatte - Wassn das???
Die Transliteration - Nur ein Zeichen in einem Skalar ersetzen
Select - Case in Perl
Windows 7 XP Mode – Wo finde ich den XP-Modus unter Windows 7?
Mac-Adresse beim Apple Macintosh herausfinden
SGN-Funktion für Perl

Eigene IP herausfinden mit Perl
Epoche live in Datum umwandeln
Firefox 3 - Exe-Files downloaden


Gesamtverzeichnis
Februar 2010
Dezember 2009
Oktober 2009
Januar 2009
Dezember 2008
November 2008
September 2008
August 2008
Juli 2008
Juni 2008
Mai 2008
April 2008
Januar 2008
Dezember 2007
November 2007
Oktober 2007
September 2007
August 2007
Juni 2007
Mai 2007
April 2007
März 2007
Februar 2007
Januar 2007
Dezember 2006


Mister Wong

RSS-Feed

Heute ist der
21.9.2024

Es ist
2:20:00 Uhr

Ihre IP:
44.192.26.226

Blog-Einträge: 186

Die letzten 24 Stunden im Überblick


Gelesene Beiträge insgesamt:
4414912


Webseiten vergleichen
Kalender mit Feiertagen - 2028
Links finden und testen
Menschliche Datumsangaben
IP zu Domain herausfinden
Time live in Datum umwandeln
Perl für Windows



Impressum