Unsere Schlagwortdatenbank umfasst derzeit rund 210.000 Wörter denen 140.000 Schlagwörter zugeordnet sind.

Durch das Profilieren der Webauftritte der rund 3 Millionen Unternehmen in der Unternehmensdatenbank können wir für jede Domain ermitteln, welche Schlagwörter in welcher Häufigkeit dort auftreten.

Die Schlagwort-Datenbank wird sowohl induktiv-automatisiert durch Machine-Learning Verfahren als auch deduktiv-händisch durch Expertenbeurteilungen aufgebaut.

Für die auf einer Menge von Trainingswebsites auftretenden Worte wird automatisiert eine optimale Zuordnung von Worten zu Schlagworten erzeugt. Ebenfalls automatisiert werden auch diejenigen Worte identifiziert, die nichts zu einer Klassifikation der Websites beitragen und so als irrelevant betrachtet werden können.

Die zweite Quelle der Keyword-Erzeugung bildet eine eher deduktive, von tatsächlich bestehenden Webinhalten zunächst unabhängige Herangehensweise. Hierbei werden für möglichst viele sachliche Bereiche durch Experten Listen von für diesen Bereich als wichtig erachteter Begriffe gebildet. In einem mehrstufigen Verfahren werden diese Wortlisten dann u.a. durch Stammwortermittlung und Synonymableitung zu Schlagwortlisten verdichtet. Die jeweiligen Wortlisten werden auf jeder Verdichtungsstufe notiert und bilden kumuliert mit der zugehörigen finalen Schlagwortliste eine zweite, unabhängige Zuordnung von Worten zu Schlagworten.

Beide Zuordnungslisten werden abschließend zusammengeführt. Der sich überschneidende Teil wird auf sich widersprechende Zuordnungen reduziert und wiederum durch Expertenbeurteilungen aufgelöst.

Beide Quellen von Wort-Schlagwort Zuordnungen werden laufend aktualisiert und die Resultate der Zusammenführung in die Schlagwort-Datenbank eingebracht.


Antworten auf die häufigsten Fragen

  FAQs