@misc{12816,
  abstract     = {{Medical images need annotations with high-level semantic descriptors, so that domain experts can search for the desired dataset among an enormous volume of visual media within a Medical Data Integration Center. This article introduces a processing pipeline for storing and annotating DICOM and PNG imaging data by applying Elasticsearch, S3 and Deep Learning technologies. The proposed method processes both DICOM and PNG images to generate annotations. These image annotations are indexed in Elasticsearch with the corresponding raw data paths, where they can be retrieved and analyzed.}},
  author       = {{Cheng, Ka Yung and Pazmino, Santiago and Bergh, Bjoern and Lange-Hegermann, Markus and Schreiweis, Bjorn}},
  booktitle    = {{19th World Congress on Medical and Health Informatics (MEDINFO)}},
  isbn         = {{978-1-64368-456-7}},
  issn         = {{1879-8365}},
  keywords     = {{Medical image retrieval, data lake, DICOM, deep learning, elasticsearch}},
  location     = {{Sydney, AUSTRALIA}},
  pages        = {{1388--1389}},
  publisher    = {{IOS Press, Incorporated}},
  title        = {{{An Image Retrieval Pipeline in a Medical Data Integration Center.}}},
  doi          = {{10.3233/SHTI231208}},
  volume       = {{310}},
  year         = {{2024}},
}

@misc{12904,
  abstract     = {{It is crucial to identify defective machine components in production to ensure quality. Some components generate heat when defective, so automating the inspection process with a thermal imaging camera can provide qualitative measurements. This work aims to use computer vision methods to locate these components in thermal images. Since there is currently  no comparison of object detection and semantic segmentation algorithms for this use case, this study compares different architectures with the goal of localising these components for  further defect inspection. Moreover, as there are currently no datasets for this use case, this study contributes a novel annotated dataset of thermal images of combine harvester  components. The different algorithms are evaluated based on the quality of their predictions and their suitability for further defect inspection. As semantic segmentation and object  detection cannot be directly compared with each other, custom weighted metrics are used. The architectures evaluated include RetinaNet, YOLOV8 Detector, DeepLabV3+, and  SegFormer. Based on the experimental results, semantic segmentation outperforms object detection regarding the use case, and the SegFormer architecture achieves the best results  with a weighted MeanIOU of 0.853.  }},
  author       = {{Senke, Hanna and Sprute, Dennis and Büker, Ulrich and Flatt, Holger}},
  booktitle    = {{Forum Bildverarbeitung 2024 = Image Pocessing Forum 2024}},
  editor       = {{Längle, Thomas and Heizmann, Michael}},
  isbn         = {{978-3-7315-1386-5}},
  keywords     = {{industrial quality assurance, deep learning architectures, object localisation, Thermal images}},
  location     = {{Karlsruhe}},
  pages        = {{71--82}},
  publisher    = {{KIT Scientific Publishing}},
  title        = {{{Deep learning-based localisation of combine harvester components in thermal images}}},
  doi          = {{10.58895/ksp/1000174496-7}},
  year         = {{2024}},
}

@misc{7734,
  abstract     = {{    Der Konferenzbeitrag zeigt den Forschungs- und Technikstand bezüglich des Griff-in-die-Kiste auf. Basierend auf einer Literaturrecherche werden Beispiele für regelbasierte und lernende Verfahren vorgestellt. Anschließend erfolgt eine systematische Gegenüberstellung der Verfahren. Hierfür werden die Anforderungen, die ein Griff-in-die-Kiste-System zu erfüllen hat, dargelegt. Die Kriterien resultieren aus einer Expertenbefragung des produktionstechnischen Umfelds der Weidmüller Gruppe. Neben den Anforderungen werden die Gewichtungen zur Bildung einer Rangfolge ermittelt. Die erarbeiteten Anforderungen dienen anschließend zur Bewertung der regelbasierten und lernenden Verfahren. Die Analyse mündet in einer methodischen Lücke zwischen beiden Paradigmen und stellt die Ausgangsbasis für die weitere Arbeit zur Entwicklung des industriellen Griff-in-die-Kiste dar. Abschließend werden erste Arbeitsergebnisse zur Objekterkennung von Reihenklemmen veröffentlicht. In einer Untersuchung werden die Zuverlässigkeit, die Robustheit sowie die Einrichtdauer einer Objekterkennung mithilfe von Deep Learning ermittelt. Das angestrebte Forschungsergebnis stellt einen Entwicklungsschritt von automatisierten Systemen, die in einem definierten Wirkbereich eigenständig arbeiten, zu autonomen Systemen, die selbstständig auf zeitvariante Größen reagieren, dar.}},
  author       = {{Stuke, Tobias and Bartsch, Thomas and Rauschenbach, Thomas}},
  booktitle    = {{Tagungsband AALE 2022: Wissenstransfer im Spannungsfeld von Autonomisierung und Fachkräftemangel}},
  editor       = {{Härle, Christian and Jäkel, Jens and Sand, Guido}},
  keywords     = {{Griff-in-die-Kiste, Bildverarbeitung, Robotik, Deep Learning, lernende Verfahren, regelbasierte Verfahren}},
  location     = {{Pforzheim}},
  pages        = {{145 – 154}},
  publisher    = {{Open Access}},
  title        = {{{Adaptiver Griff-in-die-Kiste – Die methodische Lücke zwischen Forschung und Industrie}}},
  doi          = {{https://doi.org/10.33968/2022.14}},
  year         = {{2022}},
}

@misc{8888,
  abstract     = {{Diese Arbeit handelt von der Frage, wie Tonaufnahmen-basierte Lernprozesse im Learning Management System der Hochschule für Musik Detmold, Moodle, erweitert werden können. Dazu werden LMS zunächst definiert und anschließend in die Bildungslandschaft eingeordnet. Daraufhin wird der Status Quo betrachtet mit der Feststellung, dass ein Bedarf an Werkzeugen besteht. Dieser Bedarf wurde durch die Programmierung zweier Anwendungen adressiert, die eine Integration im LMS ermöglichen und damit zu einer erhöhten Nutzbarkeit von Tonaufnahmen und musikalischen Inhalten führen sollen. Zum einen ist das eine Implementation des DTW Algorithmus, mittels welchem sich Synchronisationsdaten zwischen zwei verschiedenen Musikdarstellungen desselben Stückes berechnen lassen. Damit ließe sich bspw. ein Interface erstellen, auf dem die Anzeige der Musikwiedergabe mit der Anzeige einer Notenpartitur synchronisiert wird. Die zweite Anwendung fällt in den Bereich des maschinellen Lernens – es wurde ein automatischer Instrumentenklassifizierer geschrieben. Dieser eignet sich zur Erstellung von automatischen Taggings, zwecks Organisation von Daten und Gehörübungen. Die Nutzung einer CNN-Architektur hat sich dabei als effektiv erwiesen: Nach insgesamt 39 Lernepochen und knapp 7 Millionen gelernten Parametern konnte eine Genauigkeit von 95% erzielt werden. Als Datensatz diente die frei verfügbare Aufnahmensammlung des britischen Philharmonia Orchesters (vgl. Thorben Dittes). 
Im zweiten Kapitel soll ein Abstecken der Zwecke der einzelnen Programme die Designentscheidungen informieren, welche daraufhin erläutert werden. Im dritten Teil wird anschließend mit ScoreTube eine DTW Implementation von Berndt et al. zum Vergleich herangezogen, um die vorliegende Arbeit in den aktuellen Diskurs einzuordnen. Der Beitrag endet mit einer Evaluation der Ergebnisse und einem Ausblick auf potenzielle zukünftige Arbeiten.}},
  author       = {{Treiber, Dennis}},
  keywords     = {{learning management system, dynamic time warping, deep learning, convolutional neural network}},
  pages        = {{53}},
  publisher    = {{Technische Hochschule Ostwestfalen-Lippe}},
  title        = {{{Die Verwendung von Tonaufnahmen im LMS : Entwicklung spezifischer digitaler Werkzeuge an Hochschulen.}}},
  year         = {{2022}},
}

@inproceedings{4097,
  abstract     = {{The capabilities of object detection are well known, but many projects don’t use them, despite potential benefit. Even though the use of object detection algorithms is facilitated through frameworks and publications, a big issue is the creation of the necessary training data. To tackle this issue, this work shows the design and evaluation of a prototype, which allows users to create synthetic datasets for object detection in images. The prototype is evaluated using YOLOv3 as the underlying detector and shows that the generated datasets are equally good in quality as manually created data. This encourages a wide adoption of object detection algorithms in different areas, since image creation and labeling is often the most time consuming step.}},
  author       = {{Besginow, Andreas and Büttner, Sebastian and Röcker, Carsten}},
  booktitle    = {{22nd International Conference on Human-Computer Interaction}},
  isbn         = {{978-3-030-50343-7}},
  keywords     = {{Object detection, Synthetic datasets, Machine learning, Deep learning}},
  location     = {{Copenhagen, Denmark}},
  pages        = {{178--192}},
  publisher    = {{Springer}},
  title        = {{{Making Object Detection Available to Everyone - A Hardware Prototype for Semi-automatic Synthetic Data Generation}}},
  doi          = {{https://doi.org/10.1007/978-3-030-50344-4_14}},
  volume       = {{12203}},
  year         = {{2020}},
}

@misc{12807,
  abstract     = {{Writing chorales in the style of Bach has been a music theory exercise for generations of music students. As such it is not surprising that automatic Bach chorale harmonization has been a topic in music technology for decades. We suggest several improvements to current neural network solutions based on musicological insights into human choral composition practices. Evaluations with expert listeners show that the generated chorales closely resemble Bach's harmonization style.}},
  author       = {{Leemhuis, Alexander and Waloschek, Simon and Hadjakos, Aristotelis}},
  booktitle    = {{Machine Learning and Knowledge Discovery in Databases : International Workshops of ECML PKDD 2019}},
  editor       = {{Cellier, Peggy and Driessens, Kurt}},
  isbn         = {{978-3-030-43886-9}},
  issn         = {{1865-0937}},
  keywords     = {{Bach chorale harmonization, Deep learning, Beam search}},
  location     = {{Würzburg}},
  pages        = {{462–469}},
  publisher    = {{Springer International Publishing}},
  title        = {{{Bacher than Bach? On Musicologically Informed AI-Based Bach Chorale Harmonization}}},
  doi          = {{10.1007/978-3-030-43887-6_39}},
  volume       = {{1168}},
  year         = {{2020}},
}

@inproceedings{4102,
  abstract     = {{Complexity is a fundamental part of product design and manufacturing today, owing to increased demands for customization and advances in digital design techniques. Assembling and repairing such an enormous variety of components means that workers are cognitively challenged, take longer to search for the relevant information and are prone to making mistakes. Although in recent years deep learning approaches to object recognition have seen rapid advances, the combined potential of deep learning and augmented reality in the industrial domain remains relatively under explored. In this paper we introduce AR-ProMO, a combined hardware/software solution that provides a generalizable assistance system for identifying mistakes during product assembly and repair.}},
  author       = {{Dhiman, Hitesh and Büttner, Sebastian and Röcker, Carsten and Reisch, Raphael}},
  booktitle    = {{Proceedings of the 31st Australian Conference on Human-Computer-Interaction (OzCHI'19) : 2nd Dec.-5th Dec. 2019, Perth/Fremantle, WA, Australia}},
  isbn         = {{978-1-4503-7696-9}},
  keywords     = {{Augmented Reality, Deep Learning}},
  location     = {{Perth/Fremantle, WA, Australia}},
  pages        = {{ 518–522}},
  publisher    = {{ACM}},
  title        = {{{Handling Work Complexity with AR/Deep Learning}}},
  doi          = {{10.1145/3369457.3370919}},
  year         = {{2019}},
}