Stellenausschreibungen DH - Schwerpunkt Machine Learning an ÖNB - Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare

[1]
Für die Hauptabteilung Digitale Bibliothek/Abteilung Forschung und Datenservices, eingebunden in das Center für Software-Entwicklung der Österreichischen Nationalbibliothek, suchen wir zum Eintritt ab 1.4.2023, befristet bis 31.10.2025, eine/n engagierte/n

Software-Entwickler*in
für Machine-Learning-Infrastruktur in den Geisteswissenschaften
(20 Stunden/Woche)

Die Österreichische Nationalbibliothek beteiligt sich mit mehreren Universitäten im Rahmen eines vom bmbfw geförderten Projekts am Aufbau einer institutionenübergreifenden Forschungsinfrastruktur (u.a. GPU-Cluster und Storage) für die digitalen Geisteswissenschaften in Österreich. Ziel ist u.a., rechenintensive Machine-Learning-Anwendungen auf großen Datenmengen zu ermöglichen um digitale Sammlungen bestmöglich für die Forschung nutzbar zu machen. Die Österreichische Nationalbibliothek verfügt über sehr große Bestände an digitalen Text- und Bilddaten, die in diese Infrastruktur eingebunden werden sollen.

Ihre Aufgaben

Mitarbeit an der Implementierung einer Infrastruktur, die es ForscherInnen aus den (digitalen) Geisteswissenschaften ermöglicht, Machine-Learning Anwendungen auf großen (Kultur-)Datenbeständen auszuführen
Definition von Anforderungen für die Infrastruktur gemeinsam mit den Projektpartnern
Technische Umsetzung der Integration der digitalen Bestände der Österreichischen Nationalbibliothek in die Infrastruktur über eine API
Design von Use Cases für die Nutzung der digitalen Bestände der Österreichischen Nationalbibliothek in der Infrastruktur: z. B. ML/GPU-Anwendungen, computergestützte Erschließung von Beständen, Visualisierung von Datensets
Design und Umsetzung von Testszenarien
Abstimmung und Zusammenarbeit mit den Partnerinstitutionen

Unsere Anforderungen

Abgeschlossene IT-Ausbildung (z.B. HTL, FH, Universität) und/oder einschlägige Berufserfahrung
Gute Kenntnisse im Bereich Software-Entwicklung vorzugsweise mit Python und Java
Erfahrung mit Linux Shell und Server-Administration sowie im Umgang mit folgenden Technologien bzw. Konzepten: Git, CI/CD, Docker, Kubernetes, Ceph
Kenntnisse von relationalen Datenbanken (SQL, noSQL, etc)
Idealerweise Kenntnisse von API-Design bzw. -Entwicklung von Authentifizierungsworkflows (OAuth, Tokens etc.) sowie von IIIF und bibliographischen Metadatenstandards
Analytische, strukturierte und teamorientierte Arbeitsweise, sowie sehr hohe Kommunikationskompetenz und Fähigkeit, zwischen Kolleg*innen mit technischer und nicht-technischer Expertise zu vermitteln
Sehr gute Deutsch- und Englischkenntnisse

Bewerbungen
Ausschließlich online über unser Jobportal (jobs.onb.ac.at) mit Angabe Ihrer Gehaltsvorstellung.

Das Jahresbruttogehalt für diese Position auf Basis 20h/Woche liegt bei mindestens EUR 21.820,- mit der Bereitschaft zur Überzahlung, abhängig von Qualifikation und Berufserfahrung.

[2]
Für die Hauptabteilung Digitale Bibliothek/Abteilung Forschung und Datenservices, eingebunden in das Center für Software-Entwicklung der Österreichischen Nationalbibliothek, suchen wir zum Eintritt ab 1.4.2023, befristet bis 31.03.2024 mit der Option auf eine FWF-Stelle ab 1.4.2024 im Rahmen eines weiteren Forschungsprojekts bis 30.9.2025, eine/n engagierte/n

Software-Entwickler*in mit Schwerpunkt Machine Learning
(20 Stunden/Woche)

Die Österreichische Nationalbibliothek verwaltet umfangreiche Archive zur Plansprache Esperanto. Digitalisierte historische Zeitungsausschnitte zur Geschichte von Esperanto sollen im Rahmen eines von der Österreichischen Akademie der Wissenschaften geförderten Projekts mit Machine Learning-Methoden analysiert, erschlossen und der internationalen Esperanto-Community inkl. Volltext zugänglich gemacht werden.

Ihre Aufgaben

Mitwirkung an der strategischen Umsetzung von Machine Learning-Anwendungen für die großen Datenbestände der Österreichischen Nationalbibliothek
Implementierung von Layout- und Texterkennung (OCR) mittels Machine Learning für digitalisierte historische Zeitungsausschnitte in Zusammenarbeit mit anderen Software-Entwickler*innen des Teams
Mitarbeit am Aufbau einer skalierbaren OCR-Pipeline an der Österreichischen Nationalbibliothek
Mitarbeit bei der Erstellung der Trainingsdaten für Machine Learning und OCR
Zusammenarbeit mit den Fachwissenschafter*innen der Sammlung für Plansprachen bei der Definition von Use Cases für das Projekt

Unsere Anforderungen

Abgeschlossene IT-Ausbildung (z.B. HTL, FH, Universität) und/oder einschlägige Berufserfahrung
Gute Python-Programmierkenntnisse und Erfahrung im Umgang mit Git, CI/CD, Docker
Erfahrung mit Machine Learning- und OCR-Technologien von Vorteil
Idealerweise Kenntnisse mit gängigen OCR-Frameworks (z.B. Tesseract, Calamari, OCR-D) und OCR-Datenformaten (z.B. hOCR, ALTO, PAGE)
Analytische, strukturierte und teamorientierte Arbeitsweise, sowie sehr hohe Kommunikationskompetenz und Fähigkeit, zwischen Kolleg*innen mit technischer und nicht-technischer Expertise zu vermitteln
Sehr gute Deutsch- und Englischkenntnisse

Bewerbungen
Ausschließlich online über unser Jobportal (jobs.onb.ac.at) mit Angabe Ihrer Gehaltsvorstellung.

Das Jahresbruttogehalt für diese Position auf Basis 20h/Woche liegt bei mindestens EUR 21.820,- mit der Bereitschaft zur Überzahlung, abhängig von Qualifikation und Berufserfahrung.

Stellenausschreibungen DH – Schwerpunkt Machine Learning an ÖNB

Schreibe einen Kommentar Antworten abbrechen