Klassifizierung von Metallschrott mittels Deep Learning Methoden
verfasst von:
Gerald Koinig, Melanie Neubauer, Walter Martinelli, Yves Radmann, Nikolai Kuhn, Thomas Fink, Elmar Rückert, Bojan Lorber, Alexia Tischberger-Aldrian
Die Metallrecyclingindustrie steht vor der Herausforderung, Kupfer aus eisenhaltigem Schrott zu trennen, um die Qualität des recycelten Stahls zu gewährleisten. Kupfer, das in der Stahlproduktion unerwünscht ist, beeinträchtigt die mechanischen Eigenschaften des Endprodukts und erschwert das Recycling. Die steigende Nachfrage nach Kupfer, insbesondere durch die Produktion von Elektrofahrzeugen und erneuerbaren Energien, macht eine effiziente Trennung umso wichtiger. Aktuelle Methoden wie manuelle Sortierung und Röntgen-Fluoreszenzanalyse sind entweder ineffizient oder kostenintensiv. Der Beitrag untersucht die Anwendung von Deep Learning Methoden, insbesondere Convolutional Neural Networks (CNN), zur Klassifizierung von Metallschrott. Durch den Einsatz von 20 gängigen CNN-Architekturen wird ein Modell identifiziert, das sich für den industriellen Einsatz eignet. Die Ergebnisse zeigen, dass bestimmte Architekturen wie DenseNet-201 eine hohe Genauigkeit bieten, jedoch mit höheren Hardwareanforderungen und Inferenzlatenz einhergehen. Alternativen wie GoogleNet und MobileNetV2 bieten eine gute Balance zwischen Genauigkeit und Geschwindigkeit, was sie besonders für ressourcenbeschränkte Umgebungen interessant macht. Die Implementierung eines verschlankten Netzwerks in einem industrienahen Prototyp zeigt vielversprechende Ergebnisse, obwohl weitere Optimierungen notwendig sind. Die kontinuierliche Weiterentwicklung der sensorbasierten Sortierung und der zugrundeliegenden Algorithmen ist entscheidend, um die Effizienz und Wirtschaftlichkeit der Metallrecyclingindustrie zu steigern.
KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
Zusammenfassung
Der derzeitige Umstieg von Hochöfen auf Elektrolichtbogenöfen (EAF) in der Stahlindustrie setzt voraus, dass Störstoffe, wie etwa Kupfer, bereits in der Aufbereitungsphase aus dem Inputstrom entfernt werden. Dies ist im Fall von Kupfer darin begründet, dass sich Kupfer während der Stahlerzeugung in EAF weder in der Schlackephase noch in der Gasphase anreichert, sondern in der Schmelze verbleibt. Der erhöhte CU-Gehalt führt nach Erstarren zu Spannungen an den Korngrenzen und in weiterer Folge zu Versagen durch Bruch oder Riss während etwaiger Umformprozesse. In diesem Beitrag wird gezeigt, wie kupferhältige Partikel in einer Shredderfraktion mittels Convolutional Neural Networks erkannt werden können. Hierzu wurden 20 CNN-Architekturen auf Basis der erreichbaren Vorhersagegenauigkeit und Inferenzlatenz miteinander verglichen. Auf Basis dieser Metriken wurde die performanteste Architektur ausgewählt und die Inferenzlatenz durch Verschlankung reduziert. Im letzten Schritt wurde die adaptierte Architektur in Inline-Versuchen angewandt, um Kupferpartikel zu erkennen und eine Ausschleusungsmechanik zu steuern.
Hinweise
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
1 Einleitung
Der bevorstehende Übergang von der Nutzung von Hochöfen zur Anwendung von Elektrolichtbogenöfen (EAF) als primäre Methode zur Herstellung von hochwertigem Stählen verändert die Anforderungen an verfügbare Schrottmaterialien als Einsatzstoffe. Daher wird es immer wichtiger, unerwünschte Metalle von eisenbasierten Schrottmetallen vor ihrer Verwendung als Rohstoff in den EAF zu trennen. Kupfer ist bei der Herstellung von hochwertigem Stahl unerwünscht, da seine Anwesenheit die mechanischen Eigenschaften des Endprodukts verringert, wodurch es nur für weniger anspruchsvolle Anwendungen geeignet ist [1]. Die Entfernung von Kupfer vor dem Einsatz des Metallschrottes im Elektrolichtbogenofen ist entscheidend, da es während des Schmelzprozesses in der flüssigen Phase verbleibt und die mechanischen Eigenschaften des Stahls, wie etwa eine verringerte Bruchdehnung und Duktilität, beeinträchtigen kann [1‐3].
Demnach behindert Kupfer das Recycling von Stahl, der am häufigsten und weit verbreitet verwendeten Schrottfraktion [4]. Gleichzeitig ist Kupfer selbst zunehmend begehrt. Eine 2022 von Eurometaux veröffentlichte Studie schätzt, dass die europaweite Nachfrage nach Kupfer, teilweise getrieben durch die Produktion von Elektrofahrzeugen und den Infrastrukturaufbau für erneuerbare Energien, im Vergleich zu den heutigen Verbrauchsniveaus um 30–35 % steigen wird [5]. Weiters hat die Europäische Union Kupfer in die Liste kritischer Rohstoffe von 2023 aufgenommen [6].
Anzeige
Die Metallrecyclingindustrie benötigt eine kostengünstige Methode zur Trennung von Kupfer aus eisenhaltigem Schrott. Aktuell werden dafür zwei Verfahren angewendet. Die erste Methode beinhaltet die manuelle Demontage und Sortierung unmittelbar nach der Sammlung, was jedoch aufgrund des Produkt-Designs oft eine Herausforderung darstellt und einen Zerkleinerungsschritt erfordert [7]. Die zweite Möglichkeit ist Sortierung mittels Röntgen-Fluoreszenzanalyse (XRF), bzw. Röntgen-Transmissionstomographie (XRT). In der Anwendung sind hier aber teure Sensorik und umfangreiche Arbeitssicherheitsmaßnahmen notwendig [1].
Die Farberkennung ist eine Alternative, bei der Partikel anhand ihrer kupferroten oder eisengrauen Farbe unterschieden werden. Diese Methode stößt jedoch an ihre Grenzen, wenn der Kupfergehalt nicht offensichtlich ist, wie z. B. bei Elektromotoren. Menschliche Erfahrung lässt den Kupfergehalt vermuten, was Bildklassifizierungsmethoden nachahmen können, um eine Sortierung zu ermöglichen [8].
Objekterkennung und Klassifikation umfasst Techniken der künstlichen Intelligenz und des maschinellen Lernens, die darauf abzielen, Objekte in Bildern oder Videos zu identifizieren und zu kategorisieren [9]. Diese Methoden ermöglichen die Erstellung von Sortiermodellen, die weitere Merkmale, wie die Form der Partikel, verwenden, anstatt sich ausschließlich auf Farben zu verlassen, um kupferhaltige Objekte zu erkennen [10].
Die Begriffe Objekterkennung und Klassifikation selbst umfassen eine umfangreiche Toolbox, wobei jedes dieser Tools für eine andere Aufgabe besonders geeignet ist. Die hier verwendete Methode sind Convolutional Neural Networks (CNN), die es in einer Vielzahl von Architekturen gibt. Die verschiedenen Strukturen führen zu unterschiedlicher Leistung, Geschwindigkeit und Anwendbarkeit auf bestimmte Probleme. In dieser Arbeit werden 20 gängige CNN-Architekturen zur Differenzierung von Kupfer- und Stahlpartikeln aus einer Post-Shredder-Fraktion trainiert und bewertet. Das Ziel ist die Ermittlung eines CNN-Modells, das zukünftig in Kombination mit kostengünstiger Hardware im industriellen Umfeld eingesetzt werden kann.
Anzeige
2 Materialien und Modellerstellung
Für die Versuche erfolgte die Entnahme von etwa 700 kg Metallpartikeln aus der Post-Shredder-Fraktion eines österreichischen Metallrecyclers. Diese wurden händisch in die Klassen Kupfer und Eisen eingeteilt. Die Kupferfraktion umfasste Kupferdrähte, Rotoren, Kupferwolle, Transformatoren und Statoren von Elektromotoren sowie komplette Elektromotoren.
Die Versuche wurden auf einem sensorbasierten Sortieraggregat durchgeführt, welches mit einer Farb-Zeilenkamera (Teledyne AViiVA® SC2 CL) ausgestattet ist. Damit erfolgten die Aufnahmen von insgesamt 2800 Bilder der Proben. Von diesen wurden 2200 für ein offline Training und die verbliebenen 600 zur offline Validierung eingesetzt. Alle Netzwerke wurden auf Basis ihrer Genauigkeit und Vorhersagegeschwindigkeit bewertet. Abschließend wurde das performanteste Modell in Inline-Testversuche mit insgesamt 50 Partikeln evaluiert. Die Inline-Testfraktion wurde breit gewählt, um einen Querschnitt der Kupferfraktion zu erhalten und enthielt u. a. Elektromotoren, Kupfer Metallbälle und Drähte. Die Fraktion enthielt 50 % Eisenpartikel und 50 % Kupferpartikel.
2.1 Ablauf Bildaufnahme und Klassifikationsversuche
Abb. 1 zeigt den Ablauf von Bildaufnahme bis zum klassifizierten Bild. Abb. 1a zeigt das aus den einzelnen Zeilen der Zeilenkamera zusammengefügte Bild. Dieses Bild wird nachbearbeitet, um den Hintergrund möglichst gut von den Objekten selbst abzugrenzen Abb. 1b. Dieses Bild wird anschließend mit einem Helligkeitsthreshold in ein Schwarz-Weiß-Bild (Maske) umgewandelt Abb. 1c. Auf diese Maske wird eine Blob-Analyse angewandt, um den Mittelpunkt und die Bounding Box der einzelnen Objekte zu ermitteln. Diese Bounding Boxen werden genutzt, um die Objekte aus dem ursprünglichen Bild separat zu klassifizieren. Das Ergebnis dieser Klassifikation ist in Abb. 1d zu sehen. Hier ist das Klassifikationsergebnis über jedem Objekt zu sehen. Unter jedem Objekt ist die Wahrscheinlichkeit der Klassenzugehörigkeit zu sehen. Oben jeweils Eisen, darunter jeweils Kupfer.
Abb. 1
Darstellung des Klassifikationsablaufs. a Rohaufnahme der Partikel. b Vorverarbeitete Aufnahme um Hintergrund besser von Partikeln abzuheben. cSchwarz Weiß Maske Hintergrund/Objekte für Blobanalyse. d Klassifikationsergebnis der Objekte
2.2 Anpassung einer der geeignetsten Architekturen an Inline-Versuche
Im nächsten Schritt wurde anhand der Metriken Genauigkeit und Inferenzlatenz ein Netzwerk für weitere Inline-Versuche mit einer über Mikrocontroller gesteuerte Klappenaustragseinrichtung ausgewählt. Hierbei wurde das Netzwerk verschlankt, um geringere Inferenzzeiten zu erreichen. Die Verschlankung erfolgte durch Reduktion der Netzwerklayer. Anhand des verschlankten Netzwerkes wurde untersucht, ob die Rechenzeit durch eine Reduktion der eingegebenen Kanäle weiter reduziert werden kann. Hierfür erfolgte im ersten Schritt die Umwandlung der Trainingsdaten in Graustufenbilder. Außerdem wurde der Versuch angestellt die Geschwindigkeit mit einem einzelnen Kanal (rot) zu erhöhen.
2.3 Durchführung von Austragsversuchen mit verschlanktem Netzwerk
Die Bilder der sich bewegenden Objekte wurden mit einer Teledyne Zeilenkamera aufgenommen. Mittels eines Framegrabbers wurden die einzelnen Zeilen zusammengefügt und an einen Rechner zur Bildverarbeitung und Vorhersage weitergeleitet. Dieser Rechner steuerte anschließend auf Basis der Vorhersage einen Mikrokontroller an, der die Steuerung der Aktuatoren übernahm. Die Aktuatoren treten in Form von zwei Hubmagneten, die bei Erkennung eines Kupferobjektes eine Klappe ausfahren, auf.
3 Resultate
3.1 Einstufung der geeignetsten Architekturen
Die präziseste Vorhersage lieferte DenseNet-201 mit einer Genauigkeit im Inline-Test von 98 %. Die Genauigkeit dieser Architektur geht jedoch mit hohen Hardwareanforderungen und Inferenzlatenz einher. In den durchgeführten Tests benötigte DenseNet-201 0,0575 s pro Bild. Alternative Architekturen mit geringerer Genauigkeit und sehr niedrigen Inferenzlatenz sind AlexNet (92 %/0,0275 s), GoogleNet (90 %/0,0225 s) oder MobileNetV2 (90 %/0,0265 s). Diese Architekturen eignen sich insbesondere für Anwendungsszenarien mit geringen Hardwareressourcen. Abb. 2 listet einer Auswahl der getesteten CNN-Architekturen mitsamt der entsprechenden Inline-Vorhersagegenauigkeit und Inferenzlatenz auf.
Abb. 2
Auflistung einer Auswahl der getesteten CNN-Architekturen mitsamt der entsprechenden Inline-Vorhersagegenauigkeit und Inferenzlatenz
3.2 Geschwindigkeitsgewinn durch Architekturverschlankung
Basierend auf den Ergebnissen in Abb. 2 wurde GoogleNet für Verschlankungsversuche herangezogen. Eine Reduktion von 144 auf 30 Layer erwies sich als geeigneter Kompromiss, um die Inferenzlatenz bei minimaler Reduktion der Vorhersagegenauigkeit zu verbessern. Die Genauigkeit im Testset sank auf 86 %, während die Vorhersagegeschwindigkeit auf 0,016 s reduziert werden konnte. Eine Reduktion der Kanäle durch Graustufenbildung führte zu einer Genauigkeit von 70 %, was zeigt, dass dabei zu viele Informationen für präzise Vorhersagen verloren gehen. Die Verwendung des roten Kanals anstelle der Graustufenbildung erreichte eine Genauigkeit von 85 % bei einer Vorhersagegeschwindigkeit von 0,014 s. Dies zeigt, dass durch Kanalreduktion kein wesentlicher Geschwindigkeitsgewinn nach der Verschlankung erzielt werden konnte.
3.3 Inlineimplementierung der Sortierung
Die Inlineimplementierung des schlankeren GoogleNet zeigte eine um 5 Prozentpunkte niedrigere Genauigkeit im Vergleich zum Original. Während der Implementierung traten weitere Limitationen auf: Das maximale Partikelgewicht ist durch die Hubmagnete auf 60 N begrenzt, und der Abstand zwischen Trennscheitel und Expansionshaube beschränkt die maximale Partikelhöhe auf 5 cm. Die Rechenzeit für das gesamte System von Bildakquise über Bildverarbeitung bis zur Klassifikation und Ansteuerung des Microcontrollers ist teilweise zu lang, um Partikel rechtzeitig vor ihrer Passage mittels Klappe auszutragen. Für höhere Genauigkeit sind mehr Trainingsdaten erforderlich, insbesondere für Kupfermotoren. Abb. 3 zeigt eine Übersicht der Austragseinrichtung mit Klappensystem, eines Inputgemisches aus Eisen- und Kupferpartikeln, der Expansionshaube und der resultierenden Fraktionen von Kupfer und Eisen. Die Hardwarebeschränkungen führten zu vergleichsweisen langen Trainingszeiten, trugen jedoch dazu bei, CNN-Architekturen zu entdecken, die auf ressourcenbeschränkte Hardware zugeschnitten sind. Im weiteren Fortschritt dieser Arbeit sollen diese Ergebnisse auf einen industrienahen Prototyp angewandt werden.
Abb. 3
Prinziptest der Austragseinrichtung. a Input: Gemisch aus Eisen- und Kupferpartikeln. b Prinziptest Austragung: Expansionshaube und Austragsklappe. c Eject: Ausgetragenes Kupfermaterial. d Reject: Eisenfraktion
Bei der Sortierung von Kunststoffen und ähnlichen Materialien wird in der Regel komprimierte Luft eingesetzt. Eine mögliche Verbesserung des angewandten Systems besteht darin, anstelle mechanischer Klappen auf ein Druckluftsystem umzusteigen. Mit diesem soll eine schnellere Reaktions- und Ausführungszeit erreicht werden. Derzeit wird an der Integration eines mobilen Ausschussaggregats und einer dazugehörigen Ausschusskammer an einem Fließbandsystem gearbeitet.
4 Schlussfolgerungen
Die Auswahl einer geeigneten Architektur ist der erste Schritt bei der Erstellung eines Klassifikationsalgorithmus. Angesichts der Vielzahl verfügbarer Architekturen kann dies zeitaufwendig sein. Die aufgeführte Liste getesteter CNN-Architekturen bietet eine Basis für die schnelle Vorauswahl geeigneter Modelle zur Sortierung von kupferhaltigem Schrott. Dies verkürzt die Vorbereitungszeit für die Entwicklung der Sortiermethode und ermöglicht eine effizientere Nutzung von Ressourcen für Training und Implementierung.
Convolutional Neural Networks ermöglichen eine äußerst zuverlässige Klassifizierung, erfordern jedoch eine längere Verarbeitungszeit und zeigen Schwächen bei hoher Bandbelegung. In der traditionellen Objekterkennung mit Convolutional Neural Networks handelt es sich um sogenannte Bildklassifikationsmethoden. Diese klassifizieren ein gesamtes Bild. Das bedeutet – um einzelne Objekte auf einer Aufnahme zu klassifizieren, ist es notwendig vorher einen eigenen Segmentationsschritt durchzuführen. Dies kann etwa, wie hier angewandt, durch einen Helligkeitsthreshold geschehen, um Objekte vom Hintergrund zu separieren. Diese Methode stößt jedoch bei höheren Bandbelegungen bald an ihre Grenzen. Eine Alternative sind sogenannte Two-Stage Detektoren (R-CNN, Faster-R-CNN). Diese arbeiten in zwei separaten Schritten: Zunächst wird ein Region Proposal durchgeführt, um potenzielle Objektbereiche zu identifizieren. Im zweiten Schritt erfolgen die Klassifikation und die Feinjustierung der Begrenzungsrahmen für die erkannten Objekte. Dieser zweistufige Ansatz verursacht jedoch eine höhere Inferenzlatenz und einen größeren Rechenaufwand, besonders bei dichter Bandbelegung, was wiederum einen wesentlichen Einfluss auf die Anwendbarkeit dieser Methoden hat.
Um sowohl die Inferenzlatenz als auch den Rechenaufwand zu verringern, kann der Einsatz von One-Stage-Detektoren in Betracht gezogen werden. Diese Methode hat in den letzten Jahren einen Sprung an Reifegrad und Anwendbarkeit durchlaufen, was ihren Einsatz in der Abfallwirtschaft erleichtert. Die Anwendung dieser Technologie sollte in Zukunft ebenfalls, besonders auf ihre Anwendbarkeit im industriellen Umfeld der Abfallwirtschaft mit ihren inhärenten Eigenschaften wie etwa hoher Inhomogenität, evaluiert werden.
Neben der Wahl der Architektur spielen auch die Qualität und Diversität der Trainingsdaten eine entscheidende Rolle für die Klassifikationsleistung. Insbesondere bei komplexen Materialgemischen ist eine robuste Datengrundlage essenziell, um verlässliche Ergebnisse in industriellen Anwendungen zu gewährleisten.
Die effiziente und vor allem wirtschaftliche Trennung von Schlechtmetallen aus stahlbasierten Metallschrotten wird in Zukunft an Bedeutung gewinnen. Um die hohe Qualität und Verfügbarkeit des österreichischen Stahls auch in Zukunft zu garantieren, sind frühzeitige Maßnahmen erforderlich. Die kontinuierliche Weiterentwicklung der sensorbasierten Sortierung und der ihr zugrundeliegenden Algorithmen und eine enge Verzahnung mit industriellen Anforderungen sind essenziell, um die Effizienz und Wirtschaftlichkeit dieser Technologie weiter zu steigern.
Danksagung
Diese Arbeit wurde im Rahmen des Forschungsprojektes „KIRAMET“, gefördert durch das Bundesministerium für Klimaschutz, Umwelt, Energie, Mobilität, Innovation und Technologie (FFG No.: FO 999899661) erstellt.
Weiters gebührt der Scholz Austria GmbH Dank für die Unterstützung bei der Erstellung dieser Arbeit und für den zur Verfügung gestellten Kupfer- und Eisenschrott.
Interessenkonflikt
G. Koinig, M. Neubauer, W. Martinelli, Y. Radmann, N. Kuhn, T. Fink, E. Rückert, B. Lorber und A. Tischberger-Aldrian geben an, dass kein Interessenkonflikt besteht.
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
Die im Laufe eines Jahres in der „adhäsion“ veröffentlichten Marktübersichten helfen Anwendern verschiedenster Branchen, sich einen gezielten Überblick über Lieferantenangebote zu verschaffen.