Ziel des CLUBS-Projekts ist die empirische Untersuchung vier verschiedener Ansätze im Bereich des "Cross-lingual information retrieval" anhand der psychologischen Suchmaschine PubPsych.
Liegen schriftliche Informationen nur in einer dem Leser unverständlichen Sprache vor, können sie von ihm häufig nicht aufgefunden und genutzt werden. Diese Problematik betrifft besonders Fach- und wissenschaftliche Veröffentlichungen, denn dort erscheinen jährlich tausende potentiell relevante Veröffentlichungen in diversen Sprachen. Aufgrund der Sprachunterschiede können Wissenschaftler und sonstige Experten nur jeweils einen Bruchteil der insgesamt in ihrer Disziplin vorhandenen Publikationen auffinden und bei eigenen Vorhaben berücksichtigen. Dies kann zu mehrfachem Forschungsaufwand für dieselben Fragestellungen oder der Vernachlässigung eigentlich vorhandener Informationen führen und damit höhere Kosten und weitere unerwünschte Effekte nach sich ziehen.
Für die Psychologie haben daher das ZPID und verschiedene Partner im Jahr 2013 PubPsych entwickelt, eine vertikale Suchmaschine für psychologische Literatur, Tests, Behandlungsschemata und Forschungsdaten. Alle Informationen in PubPsych liegen in mindestens einer der vier Sprachen Englisch, Spanisch, Französisch oder Deutsch vor. Keiner der Datensätze liegt aber vollständig in allen diesen Sprachen vor.
Mit Hilfe des CLUBS-Projekts sollen nun, unseres Wissens erstmalig, vier verschiedene Ansätze empirisch untersucht werden, um die cross-linguale Suche in bibliographischen Metadaten zu verbessern. Dies wird exemplarisch anhand der PubPsych-Plattform geschehen, um dort unabhängig von der Sprache der Suchanfrage eine Anreicherung der Rechercheergebnisse mit fremdsprachigen Treffern umzusetzen.