Ein nicht indexiertes Dokument ist kein verlorenes Dokument.
Es ist bewahrt, physisch, real. Es nimmt Raum ein auf einem Regal oder einem Server. Es kann konsultiert werden, wenn man weiß, dass es existiert und wo es sich befindet. Aber für ein System, das es nicht kennt, existiert es nicht als mobilisierbares Objekt. Es ist anwesend ohne zugänglich zu sein. Es existiert ohne auffindbar zu sein.
Die Unterscheidung zwischen physischer Existenz und operativer Existenz ist Gegenstand dieses Dossiers.
Eine große Bibliothek bewahrt Millionen von Dokumenten. Kein Forscher kann sie alle konsultieren. Was wirklich zugänglich wird, ist der Index. Der Index entscheidet, was auffindbar ist. Was auffindbar ist, entscheidet, was zitiert, mobilisiert, verglichen, widerlegt werden kann. Ein nicht indexiertes Dokument ist bewahrt aber unwirksam. Es tritt nicht in Beweis ketten, Bibliographien, Argumente ein. Es produziert keine operativen Konsequenzen. Für die Forschung existiert es nicht.
Das ist keine außergewöhnliche Fehlleistung. Es ist die normale Struktur jedes Dokumentationssystems.
Die Kataloge mittelalterlicher Bibliotheken indexierten nach Titel, Autor, manchmal nach Thema. Aber die Themen waren die Kategorien des Katalogisierers, nicht die des Dokuments. Eine Abhandlung über Strömungsmechanik unter "Naturphilosophie" eingeordnet konnte für einen Leser unauffindbar werden, der Strömung, Druck oder Widerstand von Flüssigkeiten suchte. Der Katalog spiegelte nicht nur den Inhalt wider. Er spiegelte die verfügbaren Kategorien zum Zeitpunkt der Indexierung wider. Diese Kategorien filterten, was gefunden werden konnte, und von wem.
Der Index librorum prohibitorum, geführt von der Indexkongregation der katholischen Kirche von 1559 bis 1966, operierte nach derselben Logik in umgekehrter Richtung: indexieren um zu verbieten, sichtbar machen um unzugänglich zu machen. Ein in den Index eingetragenes Buch existierte als Objekt des Verbots. Es existierte nicht als legitime Quelle. Die negative Indexierung ist ebenfalls eine Operation der Behandelbarkeit: sie konvertiert eine physische Anwesenheit in einen operativen Status, hier den des Verbotenen.
Eine Suchmaschine gibt keinen Zugang zum Web. Sie gibt Zugang zu ihrem Index des Webs.
Was sie nicht erkundet hat, was eine robots.txt-Datei ausgeschlossen hat, was eine dynamische Struktur nicht crawlbar gemacht hat, was ein Formular einschließt, was eine URL isoliert, gehört nicht unmittelbar zum gemeinsamen Raum des Auffindbaren. Dieser Inhalt kann öffentlich, legal, gehostet, technisch vorhanden sein. Für die quasi-Totalität der Nutzer existiert er nicht. Sie können ihn nicht finden ohne präzise zu wissen, wo sie suchen sollen. Seine physische Anwesenheit auf Servern verleiht ihm keine operative Existenz im Suchraum.
Der Index einer Suchmaschine ist keine erschöpfende Liste dessen, was existiert. Er ist das Ergebnis eines partiellen Erkundungsprozesses, begrenzt durch endliche computationale Ressourcen, Crawl-Prioritäten, technische und juristische Ausschlussregeln, und Relevanzkriterien, die sich mit den Algorithmen ändern. Bei jedem Zyklus entscheidet das System, was in den Raum des Auffindbaren eintritt und was außerhalb bleibt.
PageRank, Googles ursprünglicher Algorithmus, bewertete die Wichtigkeit einer Seite nach der Anzahl und Qualität eingehender Links. Eine Seite ohne eingehende Links kann nicht durch gewöhnliche Erkundung gefunden werden. Sie kann existieren, wenn ihre URL bekannt oder direkt eingereicht wird, aber sie profitiert nicht von demselben Entdeckungsregime. Das Indexierungskriterium und das Relevanzkriterium verstärken sich gegenseitig: was bereits bekannt ist, wird leichter gefunden; was leichter gefunden wird, wird öfter zitiert; was öfter zitiert wird, wird leichter auffindbar.
Der Index verstärkt, was bereits im Index ist.
Diese Zirkularität ist nicht willkürlich. Sie kommt von einer operativen Entscheidung darüber, was die Wichtigkeit eines Dokuments bedeutet: die Wichtigkeit ist von Links abgeleitet, Links sind menschliche Zitationsentscheidungen, und Zitationsentscheidungen hängen davon ab, was zuvor auffindbar war. Das Kriterium wird endogen zum System, das es misst.
PubMed indexiert mehrere Dutzend Millionen bibliographische Referenzen in biomedizinischen Wissenschaften. Eine klinische Studie, veröffentlicht in einer nicht indexierten Zeitschrift, kann rigoros, relevant, replizierbar sein. Sie existiert in der Literatur im materiellen Sinn. Aber sie tritt nicht in dieselben Ketten systematischer Übersichten, automatisierter Meta-Analysen, klinischer Empfehlungen oder evidenzbasierter Medizin ein. Sie ist nicht verschwunden. Sie ist nicht am selben Ort operativ.
Die Indexierungspolitik ist also eine epistemische Politik. Sie entscheidet, was als Beweis in der Kette gelten kann, die von der klinischen Studie zur therapeutischen Empfehlung führt. Eine nicht indexierte Zeitschrift produziert Studien, die existieren, aber schwer in die Dispositive eintreten, wo Praktiken aggregiert, verglichen und entschieden werden.
Der Index ist keine Liste dessen, was existiert.
Er ist die Bedingung dessen, was zählen kann.
Doktrin
Der Index ist eine Schwellenoperation, angewandt auf eine Sammlung.
Er konvertiert eine physische Anwesenheit in operative Zugänglichkeit. Was die Schwelle der Indexierung passiert, wird zu einem mobilisierbaren Objekt in den Ketten von Beweisen, Zitationen, Argumenten, Entscheidungen. Was sie nicht passiert, bleibt im Außenfeld der dokumentarischen Behandelbarkeit.
Die Indexierungspolitik ist eine epistemische Politik. Sie entscheidet, was als Quelle, Beweis, Referenz, Autorität gelten kann. Sie ist nicht neutral, weil sie nicht erschöpfend ist. Jede Indexierung operiert durch Selektion, und jede Selektion produziert ein Außenfeld.
Dieses Außenfeld ist nicht leer. Es ist bevölkert von realen Dokumenten, rigorosen Studien, existierenden Texten. Es ist einfach unzugänglich für die Systeme, die vom Index aus operieren. Für diese Systeme existiert es nicht.
Offener Vektor
Empfehlungsalgorithmen sind dynamische und personalisierte Indizes. Sie indexieren nicht, was in einem gemeinsamen Raum existiert. Sie indexieren, was einem gefolgerten Profil, einer Historie, Klicks, einer Lokalisation, einer Zugriffszeit, einer Engagement-Wahrscheinlichkeit entspricht. Zwei Personen, die denselben Begriff suchen, können zwei verschiedene Auffindbarkeitsräume erhalten. Der Index wird persönlich.
Was jeder finden kann, hängt davon ab, was das System entschieden hat, dass er sucht. Der Raum des Auffindbaren ist nicht mehr gemeinsam. Er ist individualisiert, undurchsichtig für den Nutzer, revidierbar bei jeder Anfrage. Die zugängliche Realität wird zu einem instabilen operativen Objekt, verschieden je nachdem wer sucht und wann.
Das Außenfeld dieses personalisierten Index ist kein geteiltes Außenfeld. Es ist jedem Nutzer eigen. Was der eine nicht finden kann, kann der andere finden. Was für den einen nicht existiert, existiert für den anderen. Der Index fragmentiert den Raum des Auffindbaren in so viele Räume wie es Profile gibt.
Wenn zwei Personen nicht mehr dieselben Dinge finden können, können sie noch dieselben Beweise teilen?
