RSS|
Live-Blogging vom Barcamp Munich, Teil 2: Es geht um die Suche, um neuronale Netze und damit um Neurosemantik. Session-Leiter ist Roy Uhlmann von Queap, einer Suchmaschine, die auf Neuroinformatik basiert, also auf künstlicher Intelligenz. Er wird unterstützt von seinem Kollegen Klaus Holthausen. Dieser hat einen Algorithmus entwickelt, mit dem man große Datenmengen durchsuchen kann.
Klaus Holthausen beginnt mit einer Einleitung zum Thema Neuronale Netze. Diese sind schon uralt, nämlich 65 Jahre. Grundlagen bereits 1943 gelegt von US-Wissenschaftlern: Mit einem künstlichen neuronalen Netz lassen sich logische Operationen aller Art durchführen.
Danach passte 20 Jahre nix, bis in den 70ern die KI-Diskussion begann.
Neuronale Netze benötigen wahnsinnig viel Rechenleistung, an diesem Problem wurde seit den 80er Jahren gearbeitet. Wichtiges Paradigma: In N.N. ist alles mit allem vernetzt. Beispiel Jörg Haider: Auch die Vergangenheit muss in N.N. upgedatet werden, weil sich die Sichtweisen nachträglich verändern.
Stanford-Patent: patentiert 1998. Grundidee: Wichtig ist, was andere als wichtig bewerten. (Kern des Google-Algorithmus). Google ermöglicht es, mit möglichst wenig Rechenkapazität diese Verlinkungsnetzwerke auszurechnen. Neuronale Netzwerke sind aber noch weitaus komplexer und erfordern wesentlich mehr Rechenkapazität.
Es gibt aber jetzt einen Entwicklungs-Prototypen, der in dieser Session von Roy vorgestellt wird. Er beginnt mit einem Assoziations-Spiel, bei dem die Session-Besucher mit einem Faden “vernetzt” werden: Was fällt Dir zu “???” ein… Fadenknoten entsprechen Synapsen und man sieht, das bestimmte Inhalte fester verknüpft sind als andere. Bsp.: “Politesse” und “Strafzettel” kommen häufiger in Kontakt als “Politesse” und “Zahlen”.
Der Status Quo: Google. Kontextuelle (Bool´sche) Suche. Beispiel “Golf” – geht es hier um den Sport oder das Auto oder um den Golfkrieg? Man findet nur das Wort, aber nicht den Inhalt.
Wird KI verwendet, erfasst diese den gesamten Inhalt der Webseite. Der Inhalt wird analysiert und identifiziert. Aus einzelnen Begriffen werden Zusammenhänge generiert und der Inhalt wird identifiziert. Dieser Inhalt kann mit dem anderer Webseiten abgeglichen werden. Dazu werden die Suchergebnisse kategorisiert. Dies geschieht mit KI.
Bsp.: Durch Kontextanalyse wurden ägyptische Hieroglyphen als Fälschungen entlarvt.
Jetzt: Die Anwendung. Roy Uhlmann zeigt die Queap-Suche. Zu jedem Suchergebnis wird eine Kategorie angezeigt. Bsp.: Bankenkrise. Suchbegriff gehört in Kategorie “Politik” oder “Wirtschaft”. Betrachtet wird aus unterschiedlichen Blickwinkeln, diese werden auf Basis der gecrawlten Seiten erstellt:
Die Wissensstruktur des Netzes wird abgebildet. Aktuell werden im Prototypen etwa 2 Mio. Seiten aus dem deutschen Internet abgebildet.
Verwandte Themen zu Bankenkrise sind so etwa auch “Nokia” oder “Liquidität”.
Ein weiteres Beispiel ergibt sich aus der Suche nach “Echnathon”: Neben Suchbegriffen werden auch “verwandte Themen” angezeigt, die nach Relevanz sortiert sind. Die Trefferliste würde sich nicht sehr vom Tagging eines Ägyptologen unterscheiden, sagt Klaus Holthausen.
Die Session ist übrigens so voll, dass Leute auf dem Boden sitzen müssen.
Der Nutzer kann sich entscheiden, ob er eine inhaltliche Information will oder etwa einen Shopping-Link.
Bislang werden nur Texte indiziert, in Russland gibt es allerdings Forscher, die an einer kontextuellen Bildersuche arbeiten.
Die Relevanz der Treffer wird in Prozent angegeben. Es werden auch Suchtreffer angezeigt, die den Suchbegriff nicht enthalten, aber die relevanten Treffer aus den verwandten Begriffen. Die Suchergebnisse teilen sich in Volltexttreffer und assoziierte Treffer. Die semantische Suche lässt sich beschreiben als Projektion des gesamten Web auf Teilnetze, das Web wird untersucht auf ein bestimmtes Thema hin, etwa “Sport”. Es gibt einen Kern-Layer für das gesamte Netz und kleinere Layer, welche die Kategorien abbilden.
Google hat 43 Patente zum Thema Semantik veröffentlicht. Das Problem ist aber der Kernalgorithmus, der sich nicht auf semantisch umstellen lässt. Die Session-Leiter orientieren sich an dem mathematischen Modell, das die Vorgänge in der Großhirnrinde wiedergibt.
Queap wird in Kürze Test-User einladen, die semantisch suchen dürfen.
Neuronale Netze werden nicht dazu führen, dass es kein SEO mehr geben wird. Internet-Nutzer werden sich aber eigene neuronale Netze aus ihren Interessen bauen, die mit dem Gesamt-Web abgeglichen werden. Und diese eigenen Netze werden sich von außen nicht SEO-optimieren lassen. Im Idealfall hat am Ende jeder Nutzer sein eigenes, personalisiertes neuronales Netz.
Entscheidender Punkt zum Schluss: Es geht darum, beliebig große Datenmengen zu durchsuchen. Wer das schafft, kann auch eine neue Suche bauen. An diesem Kernproblem arbeiten derzeit schon relativ viele Forscher parallel, zum Beispiel auch das Fraunhofer Institut. (uba)
Related posts: