Das Bayesche Netz hat als Wurzel eine unbeobachtbare Variable names Spam, welche binär ist und sie hat so viele Nachfolger, wie es Worte in der Nachricht gibt, wobei jedes Wort eine identische bedingte Verteilung der Worthäufigkeit besitzt, gegeben die Klassifikation Spam oder nicht Spam.
The Bayes network has at its root an unobservable variable called spam, which is binary, and it has as many children as there are words in a message, where each word has an identical conditional distribution of the word occurrence given the class spam or not spam.
Das Web als rein topologische Struktur (als Netz von Dokumenten und Links), rein syntaktische Struktur (Dokumente, die Markup-Sprache enthalten), oder rein statistische Struktur (Worthäufigkeit) unterscheidet sich radikal von der menschlichen Gewohnheit, Informationen nach Gegenständen, Aktivitätsbereichen, Kontext usw. zu ordnen.
Framing the Web purely in terms of topological (a network of documents and links), syntactical (documents as containers of markup language), and statistical (word occurrences) structure radically departs from our human habit of ordering information into subject matters, areas of activity, context, and so on.
