Warum das semantische Web kommen muss
Warum Semantisches Web unausweichlich kommen muss und es auch wird
Web der Dinge haben wir meiner Meinung jetzt: tonnenweise Daten, ohne jegliche Struktur, Bedeutung und Beziehung zueinander. Bald haben wir soviele Infos, dass es egal sein wird, wie performant die “old-scholl : string-vergleichs-system” Suchmaschinen sein werden, es wird uns nichts nutzen, weil:
Sagen wir mal, ich bekomme heute Nachmittag Zahnschmerzen und muss schnellstens zum nächsten Zahnarzt…
Also möchte ich, dass mir die SM auf meine Anfrage: “Wien Meidling Zanharzt” definitiv keine 1.600 Ergebnisse anbietet, wo ich u.a. folgende Ergebnisse bekomme:
- eine Immo-Firma mit einem nicht möblierten Ordinationsangebot…
- Link zu Zahnarzt- und Ärztekammer Österreichs…
- Rundgang zur Ästhetischen Zahnheilkunde…
- Bilder zu einer „Amalgan-Freien Ordination“…
- Einladung zu einer Kieferorthopedenkonferenz…
- Waldviertler-Diagnosezentrum mit Radiologie und Zahnarzt-Notdienst…
- ein weiteres Immo-Angebot „mit Zahnarzt im Haus“…
- Ortsinfo einer Schule „mit zahnärztlicher Behandlung inklusive“…
- eine Reise nach Ungarn zu zahnärztlicher Behandlung kombiniert mit einer Einkaufstour…
- ein Wiener Kleingartenverein mit einer modernen „Mitglied-Ordination“…
- Eine Seminarreihe über moderne Zahnheilkunst…
- die Meinung eines Zahnarztes über die Fälschungssicherheit der eCard…
- ein Antiquariat für zahnärztliche Literatur…
- ein Auszug aus der Diplomarbeit eines Zahnarztes über die Mundheilkunde…
- und einige mehrere Dutzend Seiten zählende Linkverzeichnisse mit unsortierten und nichts sagenden veralteten Namen und Adressen…
Eine halbe Stunde später
nach durchforsten von 9 SERPs à 50 Ergebnisse und besuchen von mehreren Hundert Seiten rufe ich meine in Wien aufgewachsene Schwiegermutter an und frage sie nach einem Zahnarzttipp. Sie lebt zwar schon seit Jahren in Innsbruck aber trotzdem wird sie mir keinen Zahnarzt in Tirol empfehlen sondern einen in Wien, der in meiner Nähe ordiniert, mit Öffis erreichbar ist und der ihr schon mehrmals von einigen Bekannten empfohlen wurde…
Und das ist nur ein einfaches alltägliches Beispiel ohne jegliche komplexe Zusammenhänge und Konstrukte…
Geht das Ganze nicht einfacher, schneller, besser und effektiver?
In diesem Augenblick steht in meinem Kopf groß geschrieben: Das kann ja bitte nicht sein – wieso schafft es meine Schwiegermutter und Google nicht?!
Dabei kennt Google derzeit gut 50 Milliarden Webseiten mit Abermillionen an Datensätzen, endlose Datenbanken voller Daten, kann in Sekundenbruchteilen das gesamte Web durchforsten, kennt mittlerweile mehrere Dutzend meiner Online Profile, kennt Wien ebenfalls und kann Abermillionen Ergebnisse liefern – und trotzdem scheitert er an dieser einfachen Aufgabe und kann er mir keinen brauchbaren Tipp geben…
Der Unterschied liegt darin,
dass Google meine Frage nicht versteht, er tut zwar so als ihm alles sonnenklar wäre, dem ist aber nicht so. Meine Schwiegermutter weiss weniger über mich, aber sie kann diese Infobruchteile verstehen und in Zusammenhänge bringen – und daraus kann sie am Ende für mich den richtigen Rat aussuchen…
Und da es derzeit für eine Maschine vollkommen unmöglich ist festzustellen, ob in einem <p> in einem <div> oder einem <tr> ein Essay, ein Review, eine Produktbeschreibung, eine Anekdote oder nur eine sinn- und kontextlose Werbung zu finden ist und da <table> nachwievor zum ‚stylen’ benutzt werden, brauchen wir einen anderen Weg um den Maschinen zu ermöglichen, die Inhalte der gelesenen Daten nicht nur speichern und darzustellen, sondern sie auch „verstehen“ und in Zusammenhänge bringen zu können…
Und eben an dieser Stelle kommt semantisches Web ins Spiel.
Semantische Standards lösen genau diese Probleme. Sie ermöglichen auch Maschinen Daten die sie lesen, aufbewahren und weitergeben zu verstehen und in Zusammenhänge zu bringen.
Ein Suchscript im Semantischen Web wird sich zuerst mein online Profil ansehen und dort auslesen, dass ich Wien 12 wohne, danach wirft er ein Blick in meinen Kalender um herauszufinden wann ich Zeit hätte um hinzugehen, schaut sich dann die Profile der Zahnärzte in Wien, filtert die aus Wien Meidling aus, schaut in deren Kalender, wann sie Zeit hätten und sortiert die verfügbaren aus, springt dann noch schnell in 2, 3 Zahnkundenforen um zu schauen ob da bereits Bewertungen zu dem einen oder anderen in Frage kommenden Zahnarzt vorliegen und filtert ein Paar weitere aus, die keine guten Bewertungen bekommen haben. Danach ruft er sich noch schnell den Stadtplan ab und schlägt mir eine günstige Öffisverbingun vor, evtl. zwei, drei Taxinummern als Ausweichvariante für den Transport dahin…
So kann mir am Ende dieser Suche der Suchscript in einer zumutbaren Zeit einen wirklich brauchbaren Tipp geben…
Mit diesem Konzept kann das Semantische Web die Suche nach zusammenhängenden Daten aus vertrauenswürdigen Quellen ermöglichen und die Suche würde revolutioniert werden, die Daten kategorisiert und strukturiert und die Maschine könnte sie sinnvoll interpretieren.
Genau aus diesem Grund ist Semantisches Web in meinen Augen unausweichlich der nächste notwendige Schritt in die richtige Richtung…
Es lebe das Web der Zusammenhänge!
![]()
Possibly Related Posts:
- Orbis Twittus | Woche in Tweets | TwitterWoche 21 / 2009
- Orbis Twittus | Woche in Tweets | TwitterWoche 20
- Orbis Twittus | Woche in Tweets | Twitterwoche 19/2009
- Qimaya unter Red Herring Top 100 Europa Finalisten
- Qimaya - Quantensprung ist das richtige Wort dafür


Ich kann mich da nur anschließen. Es gibt ja schon mehrere Ansätze, aber ich komme schon beim ersten Schritt, der Festlegung auf eine Sprache in Schwierigkeiten. Lässt man dies außer Acht und verwendet Deutsch, dann merkt man sofort die Unzulänglichkeiten dieser Sprache. Die extrem hohe Redundanz mag für die zwischenmenschliche Kommunikation nützlich oder sogar erforderlich sein, um die unzähligen Fehler einer Durchschnittskommunikation auszugleichen und trotzdem zu verstehen, was der Andere meint, aber für das Semantische Web wird sie zum Klumpfuß. Vielleicht wäre es einfacher zu versuchen die Kommunikation der Menschen auf Prolog oder LISP umzustellen, als die menschliche Sprache verstehen zu wollen. Die Bedeutung einzelner Wörter zu bewältigen (die elektronische Verarbeitung), geschweige denn, die Bedeutung von Sätzen.
Wenn man ganz einfache Sätze betrachtet, wie:
“Es regnet.” oder “Da steht ein Haus.” und dann versucht zu erklären was das alles bedeuten kann, wird die Problematik deutlich.
Ich möchte gar nicht erwähnen, dass es geschriebene Wort unvergleichbar sind zu einem gesprochenen Satz.
Gesprochen kann ich mit dem Sätzchen “Es regnet.” meinem Gesprächspartner sogar mitteilen, dass heute ein beschissener Tag ist, oder aber auch, dass ich es sehr romantisch finde und regnerische Tage liebe. Ein schöner Regentag, heute. Das kann ich nur mit verschiedener Intonation unterstützt durch Mimik und Gestik. Aber bleiben wir bei dem geschriebenen Satz. Wo, wie stark, wann regnet es. Wer hat es für wem aus welchen Grund geschrieben?
Nein, der Satz ist viel zu schwierig. Kennst du einen einfacheren, mit dem man beginnen könnte über die Bedeutung zu analysieren?
Servus, Helmut
Klar Helmut, ohne Zweifel.
Nur jedesmal wenn ich mir das Szenario vorstelle, wo das Web so überladen und mehr oder weniger zugespammt ist, sodaß nicht mal die besten Algorythmen zu irgendwelchen brauchbaren Ergebnissen führen werden, würde es mir schon reichen, wenn die Machinen für’s Erste nix wirklich “verstehen” aber immerhin anhand bestimmter anerkannten und standardiesierden Regeln die einfachsten Daten insofern “auslesen” können, daß sie diese dadurch wenigstens in logische Zusammenhänge bringen können…
Der Anfang liegt IMHO schon alleine beim semantisch korrektem und validierenden Qeellcode kombiniert mit “meta”-MarkUp mit Microformats oder etwas ähnlichem.
Es würde zwar weder das Problem des überladenen Webs und ineffektiver Algorythen lösen noch den Maschinen die menschliche Sprache beibringen, aber immerhin könnten wir schon so aufbereitete Daten wesentlich besser einordnen und für weitere Verarbeitung aufbereiten und uns auf’s effektives “mashen” dieser Datensätze konzentrieren, was zum Teil die “impotenten” Suchmaschinen überbrücken helfen könnte…
Es ist klar Eniges sehr weit hergeholt und zum Teil Wunschdenken, aber es könnte uns auch mal wieder passieren, daß durch die nicht enden wollende Informationsflut sich wieder mal geschlossene Portale und Netzwerke mit gefilterten großteils proprietären Inhalten bilden werden, die für so Manchen einfach die “einfachere” und schmerzlosere Variante der Datenbesorgung, so wie ein elektronisches Zeitungsabo oder “DAS Intranet” in China…
Exzellentes post, und jawohl: Die suchmaschinen sind schlicht dumm - sie können noch nicht ’selber denken’, und werden das warhscheinlich auf absehbare zukunft auch nicht tun können.
Semantisches web wird ein schritt in der zukunft sein für bessere suchresultate. Hoffetlich in der nahen Zukunft!
das semantic web könnte am problem des spams zerbrechen
sind informationen wahr oder nicht, bleibt wahrscheinlich noch länger ein größeres geheimnis
Da muss ich Dir vollkommen Recht geben, es ist bestimmt schon jetzt ein Anliegen, nicht nur die vorhandenen und neuen Daten zu strukturieren und um neue Formate anzureichen, sondern auch das Problem des Wahrheitsgehalts eines Datensatzes zu bestimmen oder einschätzen zu können…
Ich wüsste bislang aber von keinen Ansätzen, die sich mit diesem Thema produktiv auseinandersetzen …
Oder gibt’s doch welche?
Grüße aus Meidling
Ich finde bei einer Suchanfrage bei Google meist erst auf der 3. oder 4. Seite oder mit mehreren Anläufen das Gesuchte. Entweder frage ich zu doof oder die Suma….
Bei uns hier (im Thüringer Wald)habe ich innerhalb von drei Minuten einen Zahnarzt gefunden - normale Offnungszeiten vorausgesetzt.
Die semantische Suche wird kommen, ich bezweifle jedoch, ob ich das von dir dargestellte “Suchverhalten” wünsche. Ich suche lieber selbst etwas länger, als dass mir die Maschine was vorschlägt
Warum das semantische Web kommen muss…
Warum Semantisches Web unausweichlich kommen muss und auch wird: Web der Dinge haben wir meiner Meinung jetzt: tonnenweise Daten, ohne jegliche Struktur, Bedeutung und Beziehung zueinander. Bald haben wir soviele Infos, dass es egal sein wird, wie perf…
Warum das semantische Web kommen muss…
Warum Semantisches Web unausweichlich kommen muss und auch wird: Web der Dinge haben wir meiner Meinung jetzt: tonnenweise Daten, ohne jegliche Struktur, Bedeutung und Beziehung zueinander. Bald haben wir soviele Infos, dass es egal sein wird, wie perf…
[...] informativen Leckerbissen, jetzt allerdings ohne direkten Bezug zu Queap möchte ich euch noch Martin´s Blog empfehlen. [...]
[...] Warum das semantische Web kommen muss [...]
[...] Warum das semantische Web kommen muss [...]
Definitv wird die semantische Suche ein erster Schritt sein. Das Spam ein Problem ist glaube ich nicht. Denn wenn die semantische Suche funktioniert erkennt sie das. Erkennt Sie es nicht, funktioniert sie auch nicht und wir können bei Google & Co bleiben…

[...] informativen Leckerbissen, jetzt allerdings ohne direkten Bezug zu Qebed möchte ich euch noch Martin´s Blog empfehlen. [...]
Warum das semantische Web kommen muss…
Warum Semantisches Web unausweichlich kommen muss und auch wird: Web der Dinge haben wir meiner Meinung jetzt: tonnenweise Daten, ohne jegliche Struktur, Bedeutung und Beziehung zueinander. Bald haben wir soviele Infos, dass es egal sein wird, wie perf…
Semantisches Web ist derzeit nicht möglich, da fehlt einfach noch der Syntax dafür. Klar, gibt kann man mit validen XHTML/CSS den ersten Schritt in die richtige Richtung machen, aber gerade hier ist auch der Haken.
Der erste Schritt, aber was kommt danach? XHTML 2.0 hat einige (sehr gute) Verbesserungen, richtig interessant wird es aber erst mit XHTML 3.0 werden (wobei es Ewigkeiten dauernd wird, bis genug Browser XHTML 2oder 3 unterstützen werden.
Ich glaube, daß schon alleine die Wahrnehmung der angesprochenen Probleme ein großer Gewinn ist, da liegt der Anfang zum Wandel… Ich denke mir, solange wir keine eindeutige bewährte Lösung haben, ist jeder Ansatz valid, wenn für nichts anderes, zumindest um die möglichen Lösungswege einzugrenzen… Aus diesem Grund freut es mich doppelt, daß sich so viele Webworker Gedanken dazu machen… Wir sind am guten Weg!
[...] wie man es in den Beta-Tests bereits sehr gut spüren kann, wird es der Meileinstein auf dem Weg zum Semantischen Web [...]
[...] User Need, Monetarisierung und die Entwicklung des Webs. Zur Anwendung von Semantik sagt Martin folgendes. Eine Anwendung von Semantik ist also weniger Suche als vielmehr die Obsoletierung von Suche. Unser [...]
[...] in ihrer Anwendung stellt sich wie folgt dar, ich bin so frei und zitiere Martin. Sagen wir mal, ich bekomme heute Nachmittag Zahnschmerzen und muss schnellstens zum nächsten [...]
Ich frage mich wie ich die entsprechenden Informationen bereitstellen kann, so dass Google 2.0 die semantischen Verweise finden kann. Retro Coding und Microformats war doch da mal ein Thema.
Gruß Tom
Thomas Maierhofers last blog post..UPS Update killed our web server
Hi Thomas!
Das ist ja eben die Revolution - es soll vollkommen egal sein, in welcher Form ein Datenstück vorliegt - das ist der Unterschied zu ontologisch (vor)angereicherten Techniken, die alle vorhandenen Daten zuerst “vorkochen” müssten, bevor man sie “essen” kann.
Ontologie-basierte meta-angereicherte Datensets eignen sich nur für streng definierte Informationssubsets, wie z.B. Jurisdiktion, Medizin, Pharmazie - wo Begriffe sozusagen “ein für alle male” statisch festgehalten werden und so auch “für immer” bleiben.
Aber die Natur des Webs ist ja alles andere als statisch und um dies zu reflektieren, suchen wir nach Techniken, die kontextbezogene relevante Begriff-Relationen “selbstständig” erkennen, festhalten, bei Bedarf aktualisieren und in Zusammenhang mit anderen Begriffen, Datensets oder ganzen Werken bringen können…
Und an dieser Stelle kommt eben Qimaya dazu - mittels eines Künstlichen Neuronalen Content Netzwerks kann Qim nicht nur die Erschließung sondern und vor allem die Gewichtung der Bedeutung eines Textbausteins in Bezug auf alle anderen übernehmen und so jedes einzelne Begriff mit allen anderen kontextbasiert verknüpfen…
Ok, jetzt habe ich es kapiert, bin mal gespannt ob das tatsächlich funktioniert und vorallem auch in der Breite eingesetzt wird.
Gruß Thomas
Thomas Maierhofers last blog post..UPS Update killed our web server
[...] obwohl nach wie vor aus vielen sehr unterschiedlichen Quellen bestehend - die nicht auf dem bloßen Vorkommen oder Nicht-Vorkommen von bestimmten Strings basiert [...]
Semantische Strukturen in einen Prozess einzubauen ist in der Tat sehr schwierig. Nicht nur das es ungeheure Rechenkapatizitäten benötig, auch der Maschiene die Syntax und Logik von Sprache nahezulegen ist eine ausserordentliche Herausforderung. Hinzu kommt noch, dass die Grammatik je nach Sprache unterschiedlich Komplex ist. Englisch ist da noch am einfachsten. Ein gutes Beispiel für die Herausforderungen die Sprache an Maschienen stellt findet sich in dem deutschen chat-Bot “JEliza”. Auch dieser benutzt ein Semantisches Netz um gelernte Begriffe anderen zuzuordnen und dadurch lernt zu “verstehen”. Theoretisch einleuchtent. Dies entpuppte sich jedoch als viel schwieriger als angenommen. Wer JEliza testet wird merken warum. Das ganze Internet semantisch zu verknüpfen ist meiner Meinung nach Heute (+/ bis 10 Jahre) unmöglich. Mann braucht einen Algorhytmus der selbständig diese Strukturen ausbildet. Eine derartige K.I. ist zurzeit nicht sonderlich weit entwickelt. Und selbst wenn, wäre das Ergebnis wahrscheinlich ähnlich der derzeitigen Suchanfragen bei google. Denn woher soll das System wissen was mit was in Bezug steht. Man müsste es erst einen gewissen Grundsatz lehren. Ein solches Netz würde ausserdem Ausserirdische Mengen an Daten mit sich ziehen, die ähnlich groß der gesamten Datenmenge des Internets wären, und müsste auf einem Rechencluster bzw in einem Rechenzentrum ablaufen.
Der Wahrheitsgehalt von Aussagen lässt allerding relativ gut mittels sogenannter Fuzzy Logik in die Maschienenwelt intregieren. War es früher nur Schwarz oder Weiß (I/0), kann damit auch eine Grauzone erkannt und wiedergegeben werden.
Auf jedenfall wird das der nächste Schritt sein, aber das wird noch eine Weile auf sich warten lassen.
“Ein solches Netz würde ausserdem Ausserirdische Mengen an Daten mit sich ziehen,”
Nunja, theoretisch sind doch diese Daten schon da. Sie müssten doch nur von Grund auf neu strukturiert und organisiert werden.
Combat Armss last blog post..Neue Map in Combat Arms aufgetaucht.
Interessanter Ansatz mit der Oma, um das Semantische Web in seinen Grundzügen zu erklären. Ich bin wirklich gespannt, wie es in den nächsten Jahren weitergeht. Mittlerweile ist es echt schlimm, Sinn von Unsinn in den Suchmaschinen zu trennen.
Sieht man ja auch daran, dass immer mehr ominöse Seiten in den Ergebnissen rumgurken, die rein gar nichts mit dem Thema zu tun haben. Ich Suche A, Ergebnis zeigt mir A aber die aufgerufene Seite zeigt mir nur B.
Da wird man wahnsinnig.
Hallo Martin,
ich denke gerade aus Bibliothekssicht über das Semantic Web nach. Ich denke, dass auch Firmen über die Präsentation ihrer Angebote nachdenken müssten. Alles werden die Maschinen nicht schaffen. So hatte ich kürzlich die Anfrage ob es ein Ladegerät für eine elektrische Zahnbürste im Wohnmobil gäbe. Ich habe leider keinen genauen Hinweis gefunden. Statt dessen nur alle möglichen Preissuchmaschinen, die mir alle möglichen Elektrischen Zahnbürsten anzeigten. Wenn Firmen am Verkauf interessiert sind, sollten Sie auch sämtliches Zubehör maschinenlesbar aufbereiten.
Semantic Web wünsche ich mir auch noch als Synonym-Übersetzer. Also ich suche mit “Gaststätte” und gesucht wird auch nach “Restaurant” oder wie sagt man in Wien?
Harald
Hi Harald,
vielen Dank für Dein Kommentar.
Ich gebe dir vollkommen Recht. Interessant finde ich nur, dass es bereits große Preissuchmaschinen (z.B. den britischen PriceRunner) gegeben hat, die es versucht haben, genau was du beschreibst mit Hilfe von Microformats zu bewerkstelligen. Es wäre genau das richtige, wenn es funktionieren würde.
Richtig aufbereitete und maschinenlesbare Inhalte - ausgezeichnet mit Microformats, sodaß der Spider die einzelnen Textbrocken ‘entziffern’ und sie in Verbindung und logischen Zusammenhang einordnen kann. Eine brauchbare Lösung, möchte man denken, leider falsch.
Es fehlen derzeit vor allem die intelligenten automatisierten Tools, die diese Daten auch dementsprechend weiter verarbeiten könnten und ebenfalls tun sich einfach die meisten Publisher nur schwer mit ’semantischer’ Auszeichnung - da es kaum automatisch geht, von Ontologien noch gar nicht gesprochen…
Ebenfalls BBC hat ein, zwei Jahre lang Microformats eingesetzt und danach wieder verworfen, weil sie einfach keine - dem Aufwand entsprechende - Vorteile daraus ziehen konnten.
Also hoffe ich ebenfalls mit dir, dass wir bald Technologien erfinden, die uns endlich mal die wirkliche Tiefe und Möglichkeiten des WeltWeitenWebs so richtig aufzeigen.
Leave a comment!
Blogosphere »
Tweet me tender, tweet my tweet, never let me go…
Was macht Twitter eigentlich zum Twitter? Was unterscheidet Twitter so sehr von den restlichen sozialen Portalen, Medien und Netzwerken? Was ist das Geheimnis, das Twitter in kürzester Zeit 12 Millionen User beschert hat? Ist das erst der Anfang oder auch schon das Ende von Twitter?
Mobile Web »
Twitter: Das neue coole TweetDeck Client für iPhone
Heute wurde der neue TweetDeck-Client für iPhone der Öffentlichkeit vorgestellt und ich habe ihn auch schon dem ersten Praxis-Test unterzogen, vor allem aus dem Grund, daß TweetDeck mein präferiertes Twitter-Client am Desktop ist, da es dank Adobe-AIR OS-unabhängig arbeitet. Hier meine ersten Eindrücke, Screenshots und ein Fazit.
Semantic Web »
Qimaya - Quantensprung ist das richtige Wort dafür
Quantensprung ist in der Tat das richtige Wort dafür. Revolutionärste Innovation pur. Wir haben wirklich ein Glück dabei zu sein.
Alles, was Sie schon immer über Qimaya wissen wollten…Dank sei dem Dresdner Zukunftsforum und T-Systems …
WordPress »
Review: IntenseDebate im Blog-Einsatz
Vor zwei Wochen habe ich bei mir IntenseDebate installiert um meinen Lesern bessere Usability, Interaktivität und Mehrwert bieten zu können. Leider happert es derzeit noch an allen Ecken und Enden und während ich so gut wie keine positiven Effekte verzeichnet habe, musste ich mich die ganze Zeit mit verschiedensten Problemen herumschlagen. Fazit: All zu viele Probleme für zwei Wochen Einsatz. Rollback!
Subscribe for updates
TwitterCounter
This Blog on your Mobile, iPhone or PDA
Archives
Top Commentators
Sites I Enjoy
Recommended WordPress Ressources
Random Posts
Latest Video Post
Recent Posts
Most Commented
Pages