[1]
Für die Hauptabteilung Digitale Bibliothek/Abteilung Forschung und Datenservices, eingebunden in das Center für Software-Entwicklung der Österreichischen Nationalbibliothek, suchen wir zum Eintritt ab 1.4.2023, befristet bis 31.10.2025, eine/n engagierte/n
Software-Entwickler*in
für Machine-Learning-Infrastruktur in den Geisteswissenschaften
(20 Stunden/Woche)
Die Österreichische Nationalbibliothek beteiligt sich mit mehreren Universitäten im Rahmen eines vom bmbfw geförderten Projekts am Aufbau einer institutionenübergreifenden Forschungsinfrastruktur (u.a. GPU-Cluster und Storage) für die digitalen Geisteswissenschaften in Österreich. Ziel ist u.a., rechenintensive Machine-Learning-Anwendungen auf großen Datenmengen zu ermöglichen um digitale Sammlungen bestmöglich für die Forschung nutzbar zu machen. Die Österreichische Nationalbibliothek verfügt über sehr große Bestände an digitalen Text- und Bilddaten, die in diese Infrastruktur eingebunden werden sollen.
Ihre Aufgaben
- Mitarbeit an der Implementierung einer Infrastruktur, die es ForscherInnen aus den (digitalen) Geisteswissenschaften ermöglicht, Machine-Learning Anwendungen auf großen (Kultur-)Datenbeständen auszuführen
- Definition von Anforderungen für die Infrastruktur gemeinsam mit den Projektpartnern
- Technische Umsetzung der Integration der digitalen Bestände der Österreichischen Nationalbibliothek in die Infrastruktur über eine API
- Design von Use Cases für die Nutzung der digitalen Bestände der Österreichischen Nationalbibliothek in der Infrastruktur: z. B. ML/GPU-Anwendungen, computergestützte Erschließung von Beständen, Visualisierung von Datensets
- Design und Umsetzung von Testszenarien
- Abstimmung und Zusammenarbeit mit den Partnerinstitutionen
Unsere Anforderungen
- Abgeschlossene IT-Ausbildung (z.B. HTL, FH, Universität) und/oder einschlägige Berufserfahrung
- Gute Kenntnisse im Bereich Software-Entwicklung vorzugsweise mit Python und Java
- Erfahrung mit Linux Shell und Server-Administration sowie im Umgang mit folgenden Technologien bzw. Konzepten: Git, CI/CD, Docker, Kubernetes, Ceph
- Kenntnisse von relationalen Datenbanken (SQL, noSQL, etc)
- Idealerweise Kenntnisse von API-Design bzw. -Entwicklung von Authentifizierungsworkflows (OAuth, Tokens etc.) sowie von IIIF und bibliographischen Metadatenstandards
- Analytische, strukturierte und teamorientierte Arbeitsweise, sowie sehr hohe Kommunikationskompetenz und Fähigkeit, zwischen Kolleg*innen mit technischer und nicht-technischer Expertise zu vermitteln
- Sehr gute Deutsch- und Englischkenntnisse
Bewerbungen
Ausschließlich online über unser Jobportal (jobs.onb.ac.at) mit Angabe Ihrer Gehaltsvorstellung.
Das Jahresbruttogehalt für diese Position auf Basis 20h/Woche liegt bei mindestens EUR 21.820,- mit der Bereitschaft zur Überzahlung, abhängig von Qualifikation und Berufserfahrung.
[2]
Für die Hauptabteilung Digitale Bibliothek/Abteilung Forschung und Datenservices, eingebunden in das Center für Software-Entwicklung der Österreichischen Nationalbibliothek, suchen wir zum Eintritt ab 1.4.2023, befristet bis 31.03.2024 mit der Option auf eine FWF-Stelle ab 1.4.2024 im Rahmen eines weiteren Forschungsprojekts bis 30.9.2025, eine/n engagierte/n
Software-Entwickler*in mit Schwerpunkt Machine Learning
(20 Stunden/Woche)
Die Österreichische Nationalbibliothek verwaltet umfangreiche Archive zur Plansprache Esperanto. Digitalisierte historische Zeitungsausschnitte zur Geschichte von Esperanto sollen im Rahmen eines von der Österreichischen Akademie der Wissenschaften geförderten Projekts mit Machine Learning-Methoden analysiert, erschlossen und der internationalen Esperanto-Community inkl. Volltext zugänglich gemacht werden.
Ihre Aufgaben
- Mitwirkung an der strategischen Umsetzung von Machine Learning-Anwendungen für die großen Datenbestände der Österreichischen Nationalbibliothek
- Implementierung von Layout- und Texterkennung (OCR) mittels Machine Learning für digitalisierte historische Zeitungsausschnitte in Zusammenarbeit mit anderen Software-Entwickler*innen des Teams
- Mitarbeit am Aufbau einer skalierbaren OCR-Pipeline an der Österreichischen Nationalbibliothek
- Mitarbeit bei der Erstellung der Trainingsdaten für Machine Learning und OCR
- Zusammenarbeit mit den Fachwissenschafter*innen der Sammlung für Plansprachen bei der Definition von Use Cases für das Projekt
Unsere Anforderungen
- Abgeschlossene IT-Ausbildung (z.B. HTL, FH, Universität) und/oder einschlägige Berufserfahrung
- Gute Python-Programmierkenntnisse und Erfahrung im Umgang mit Git, CI/CD, Docker
- Erfahrung mit Machine Learning- und OCR-Technologien von Vorteil
- Idealerweise Kenntnisse mit gängigen OCR-Frameworks (z.B. Tesseract, Calamari, OCR-D) und OCR-Datenformaten (z.B. hOCR, ALTO, PAGE)
- Analytische, strukturierte und teamorientierte Arbeitsweise, sowie sehr hohe Kommunikationskompetenz und Fähigkeit, zwischen Kolleg*innen mit technischer und nicht-technischer Expertise zu vermitteln
- Sehr gute Deutsch- und Englischkenntnisse
Bewerbungen
Ausschließlich online über unser Jobportal (jobs.onb.ac.at) mit Angabe Ihrer Gehaltsvorstellung.
Das Jahresbruttogehalt für diese Position auf Basis 20h/Woche liegt bei mindestens EUR 21.820,- mit der Bereitschaft zur Überzahlung, abhängig von Qualifikation und Berufserfahrung.