
Spezialwissen wurde perfekt gebündelt
Die Idee wurde von Mettler-Toledo im "Data Innovation Alliance" Netzwerk öffentlich ausgeschrieben. Verschiedene Institute und Universitäten meldeten ihr Interesse an. Die Wahl fiel auf ein Konsortium zweier Forschungspartner – der ZHAW für statistische Methoden und zur Sicherstellung der Robustheit durch statistische Signifikanzanalysen, sowie dem CSEM, welches seine mehr als 12-Jährige Praxiserfahrung im Bereich Deep Learning in industriellen Anwendungen in das Projekt einbringen konnte.
Mettler-Toledo hat die gesamte Domainexpertise in das Projekt eingebracht – sowie auch die Integration der entwickelten KI-Lösung in die kommerzielle STARe Software. Zusätzlich hat Mettler-Toledo eine grosse Anzahl von Expertendaten für das Projekt aufgearbeitet, basierend auf vielen Messungen, die in der Vergangenheit für Publikationen und Referenzbibliotheken gemessen wurden.
Die ZHAW entwickelte statistische Methoden zur Bereinigung der Daten, zur Analyse der Expertendaten, Erkennung von fehlerhaften Labels und zum robusten automatischen Setzen der Messtangenten. Die Aufgabe des CSEM lag in der Entwicklung des Neuronalen Netzwerks, der robusten Trainingsalgorithmen inklusive Data Augmentation und Generation, sowie der Validierung und Plausibilitätsprüfung der Ergebnisse.
Das Projektergebnis ist eine neue Software Option, AIWizard genannt, welche in die bereits etablierte STARe Software integriert wurde. Sie ermöglicht neu vollautomatische Auswertungen thermoanalytischer Messkurven unbekannter Proben.
Künstliche Intelligenz: Der Weg zum Erfolg
Besonders herausfordernd ist die Festlegung der Effektgrenzen – also wo ein solcher Effekt beginnt – und wo er aufhört. Diese Übergänge sind in vielen Fällen fliessend, aber eine genaue Positionierung essentiell, um Informationen über den Effekttyp (z. B. Schmelzen, Kristallisation, Glasübergang) zu erhalten. Hier kommt die KI ins Spiel. Das Ziel war stets, den komplexen und oft auch fehleranfälligen Teil der Effektbestimmung zu automatisieren und dabei das Wissen und die Erfahrung vieler Experten aus unterschiedlichen Domänen zusammenzubringen.
Erfahrene Mitarbeiter waren anfänglich sehr skeptisch. Aussagen wie "die automatisierte Auswertung ist überhaupt nicht möglich" wurden geäussert. Am Schluss überzeugte die Lösung: "die Ergebnisse haben meine Erwartungen weit übertroffen".
Neuronale Netzwerke sind datenhungrig, weshalb viele Expertendaten nötig waren. Um den Datensatz aus hunderten Messungen weiter zu vergrössern, wurden tausende künstliche Daten erzeugt – diesen Prozess nennen wir Data Augmentation und Data Generation. Es ist wichtig, die physikalisch ablaufenden Prozesse zu berücksichtigen. Unter Data Generation versteht man, durch Modellierung der Prozesse oder Rekombination von echten Daten, neue Datensätze zu erzeugen.
«Wir haben viel gelernt, wie neue Technologien heute Kundennutzen schaffen. Ohne das Spezialwissen der Projekt-Partner hätten wir die Idee nicht umsetzen können.» Urs Jörimann, Mettler-Toledo Projektleiter.
Das Projekt wurde durch die Schweizerische Agentur für Innovationsförderung, Innosuisse (Projekt Nummer: 35056.1 IP-ENG).