/blog/perl


substr() in Perl
[149738 mal gelesen]
foreach in Perl
[127783 mal gelesen]
Arrays in Perl - Besonderheiten
[123045 mal gelesen]
split() in Perl - Zeichenketten teilen
[110943 mal gelesen]
open() - Dateien öffnen in Perl
[107678 mal gelesen]
grep - Listen durchsuchen in Perl
[92853 mal gelesen]
chomp() in Perl
[92529 mal gelesen]
push in Perl
[89509 mal gelesen]
sleep in Perl - Das aktuelle Script warten lassen
[74372 mal gelesen]
index() in Perl - Zeichenkette in Zeichenkette suchen
[57275 mal gelesen]


Arrays
Dateien
HTPC
Hashes
Leistungsoptimiert
PHP
Perl
RegEx
Schleifen
Script
Skalare
Sonstiges
System
Webserver
Zur Startseite


Samstag, 13.10.2007, 10:34:16 Uhr

Automatische Stichwortverlinkung


Nicht daß man denkt, ich würde jetzt den ganzen Tag an meinem HTPC hängen, nein, ich hab gerade heute ein neues Feature in mein Blog-Script eingebaut:

Ich kam auf die Idee, daß es doch schön wäre, wenn bestimmte Wörter automatisch mit bestimmten Seiten verlinkt werden, so zum Beispiel das Wort print mit der entsprechenden Seite, die den print-Befehl beschreibt.

Eigentlich recht einfach, denkt man (jedenfalls ich), hatte aber natürlich wieder so seine Tücken.

Aber erstmal von Anfang an:
Die Texte im Blog sind in .txt-Form gespeichert, so richtig mit äöü und so. Darin enthalten sind Formatierungen. Das erstmal vorweg.

Ich dachte also, na gut, beim Umwandeln ins HTML-Format guckst Du gleich, ob eben jene bestimmte Worte enthalten sind und verlinkst sie einfach.

Also aus der Zeile:

das ist ein Testtext zu print


macht das Programm

das ist ein Testtext zu <a href="entsprechende-seit.htm">print</a>.



Das war auch schnell geschafft. Bis ich dahinter kam, daß das Script auch Wörter in Links umgewandelt hat, wenn eben diese Wörter darin vorkamen. Folge war, daß die Links dann natürlich nicht mehr funktionierten.

Ich hab die Regex dann also so modifiziert, daß sie nun folgendermaßen aussieht

$ersetzwort='print';
$ersetzwoerter{print}='http://www.sonstwas.de';
$_=~ s/([^<]*.*?\W)($ersetzwort)(\W)(.*?)([^>])/\1<a href=\"$ersetzwoerter{$ersetzwort}\">\2<\/a>\3\4\5/;

$zeile=~ s/^($ersetzwort)([^\w])/<a href=\"$ersetzwoerter{$ersetzwort}\" class=\"linkunterstrichen\"> \1<\/a>\2/gis;


Wie man sieht, sind im Hash %ersetzwoerter die Links enthalten, aber das nur am Rande.

Und wie geht das nun?
Also:
In $zeile steht eine Zeile der Blog-Eintraege.
Diese Zeile wird untersucht nach
([^<]*.*?\W) -> kein <, danach beliebige Zeichen und ein Sonderzeichen
($ersetzwort) -> das zu ersetzende Wort
([\W]) -> kein Buchstaben und Ziffer nach dem gesuchten Wort, auch kein abschließendes >

Wenn also ein HTML-Tag ein Suchwort enthält, wird der HTML-Tag NICHT verändert.

Ist ein Suchwort ein Teil eines größeren Wortes, soll ebenfalls nichts verändert werden.

Die zweite Prüfung ist übrigens dafür, daß auch Wörter am Zeilenanfang gefunden werden.

So weit läuft es schon gut, ich werde das mal im Auge behalten und testen. Und natürlich jetzt alle möglichen Stichworte einführen.


Nachtrag
Das mit der RegEx war wohl nix, wie es besser geht steht hier.

Thema: Perl RegEx

Der Beitrag "" wurde 5609 mal gelesen.

Es wurde 1 x über diesen Beitrag abgestimmt.
Die durchschnittliche Beurteilung liegt bei
2 (1 = sehr gut - 6 = grottenschlecht).

Kommentar schreiben  Druckansicht  Seitenanfang 
Beurteilen 






 Zufällige Beiträge im /blog/perl

Wohnzimmer-PC, die hoffentlich letzte Maßnahme

chr() in Perl - Zeichen anhand seines ASCII-Codes ermitteln und ausgeben

Befehle, die standartmäßig $_ verwenden, und solche, die das nicht tun

Uhrzeit und Datum bestimmen in Perl

chomp() in Perl

Mac-Adresse beim Apple Macintosh herausfinden

Zugriff auf bestimmte Webseiten sperren unter Windows XP

Automatische Stichwortverlinkung



0.0206658840179443 sec. to build



...Blogsoftware in pure Perl - Powered by a lot of Coffee...


SSD-Festplatte - Wassn das???
Die Transliteration - Nur ein Zeichen in einem Skalar ersetzen
Select - Case in Perl
Windows 7 XP Mode – Wo finde ich den XP-Modus unter Windows 7?
Mac-Adresse beim Apple Macintosh herausfinden
SGN-Funktion für Perl

Eigene IP herausfinden mit Perl
Epoche live in Datum umwandeln
Firefox 3 - Exe-Files downloaden


Gesamtverzeichnis
Februar 2010
Dezember 2009
Oktober 2009
Januar 2009
Dezember 2008
November 2008
September 2008
August 2008
Juli 2008
Juni 2008
Mai 2008
April 2008
Januar 2008
Dezember 2007
November 2007
Oktober 2007
September 2007
August 2007
Juni 2007
Mai 2007
April 2007
März 2007
Februar 2007
Januar 2007
Dezember 2006


Mister Wong

RSS-Feed

Heute ist der
30.11.2022

Es ist
15:21:44 Uhr

Ihre IP:
3.238.118.80

Blog-Einträge: 186

Die letzten 24 Stunden im Überblick


Gelesene Beiträge insgesamt:
4303021


Webseiten vergleichen
Kalender mit Feiertagen - 2028
Links finden und testen
Menschliche Datumsangaben
IP zu Domain herausfinden
Time live in Datum umwandeln
Perl für Windows



Impressum