Web Application for Harvesting Publication Meta Data and Visualising as a Citation Graph using a Community Based Approach

- Masterarbeit -


Beschreibung:

Wissenschaftler werden häufig an sogenannten Impact Faktoren wie dem Hirsch Index [3] oder einer Variante [1] gemessen. Diese beruhen darauf wie häufig die Publikationen des Wissenschaftlers zitiert wurden. Aber auch für die Außendarstellung ist es wichtig zu zeigen, wie häufig und welche Publikationen die Publikationen des Wissenschaftlers zitiert haben.

In einer vorherigen Arbeit hier am Institut ist bereits ein Tool zum zielgerichteten Suchen von Zitationen entstanden. Dabei hat sich gezeigt, dass es zwar eine Vielzahl an frei verfügbaren Datensätze über Publikationen gibt und fehlende Informationen auch aus Volltext-PDFs größtenteils automatisch ermittelt werden können, dass diese öfter jedoch auch widersprüchlich sein können. Diese Arbeit soll daher untersucht werden, wie die Datenqualität von Daten über Publikationen erhöht werden kann. 

In dieser Arbeit soll daher ein Framework entstehen, dass

  • in der Lage ist, Informationen über Publikationen (insbesondere zu Referenzen und Zitationen) zu verwalten
  • periodische Aktualisierungen durch Import der Datenquellen vornehmen kann
  • transparent alle Informationen mit ihren Quellen abspeichert anstatt nur eines konsolidierten Datensatzes
  • in einer Webanwendung den Besuchern ermöglicht,
    • Aktualisierungen des Datenbestandes vorzunehmen
    • Up-/Downvotes bei widersprüchlichen Informationen zu ermöglichen
    • in einer Detailansicht genau zu verfolgen, woher einzelne Informationen stammen

Je nach Art der Arbeit (Bachelor- oder Masterarbeit) und Interesse des Studierenden kann auf einzelne Teilgebiete fokussiert werden.

[1] S. Alonso, F. Cabrerizo, E. Herrera-Viedma, and F. Herrera, "h-index: A review focused in its variants, computation and standardization for different scientific fields", Journal of Informetrics, vol. 3, no. 4, pp. 273 – 289, 2009.

[2] CiteSeerX, "CiteSeerExtractor - A RESTful API for extracting information from scholarly documents", citeseerextractor.ist.psu.edu/static/index.html, accessed: 2015-04-08.

[3] J. E. Hirsch, "An index to quantify an individual’s scientific research output", Proceedings of the National Academy of Sciences of the United States of America, vol. 102, no. 46, pp. 16 569–16 572, 2005. [Online]. Available: www.pnas.org/content/102/46/16569.abstract

[4] A. Kusserow, and S. Groppe, "Getting Indexed by Bibliographic Databases in the Area of Computer Science", Open Journal of Web Technologies (OJWT), vol. 1, no. 2, pp. 10 - 27, 2014. [Online]. Available: www.ronpub.com/publications/ojwt/OJWT_2014v1i2n02_Kusserow.html

Anforderungen/Kenntnisse:
Programmierung von Web-Servern und Browsern, insbesondere PHP, JavaScript, HTML und CSS

Bearbeitung:
Phu Anh Tuan Nguyen

Betreuung:

Privatdozent Dr. rer.nat. habil. Sven Groppe
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 500 5706