Skip to main content
Erschienen in: e & i Elektrotechnik und Informationstechnik 3/2018

Open Access 24.04.2018 | Originalarbeit

Nichtlineare Regelung mit einem Raspberry PI

Automatisierung des Versuchsaufbaus ,,Ball auf Rad“ mit einem Raspberry PI und offener Hard- und Software

verfasst von: Sven-Olaf Lindert, Christian Höfler, Kurt Schlacher

Erschienen in: e+i Elektrotechnik und Informationstechnik | Ausgabe 3/2018

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Die kommerziell erhältlichen Automatisierungssysteme sind sehr kostspielig. Hinzu kommen meist Lizenzgebühren für Software zur Simulation und Automatisierung. In diesem Artikel wird die Lösung einer anspruchsvollen Automatisierungsaufgabe, die Balancierung eines Balles auf einem rotierenden Rad, durch offene Software und preiswerte Hardware beschrieben. Zum Einsatz kommen der Einplatinencomputer Raspberry PI, das offene Hardware-Automationssystem BIOE und offene Software.

1 Einleitung

Der folgende Artikel möchte demonstrieren, wie mit preiswerten und frei verfügbaren Mitteln moderne Automatisierungsaufgaben gelöst werden können.
Zunächst wird in Abschn. 2 der Versuchsaufbau ,,Ball auf Rad” kurz vorgestellt. Seine physikalischen Eigenschaften werden soweit dargestellt, wie es für den anschließenden Reglerentwurf erforderlich ist. Der Reglerentwurf selber wird für den vorliegenden Aufbau gezeigt, ohne auf theoretische Hintergründe näher einzugehen.
In Abschn. 3 wird gezeigt, wie ein Raspberry PI, ein ursprünglich als Lernhilfe für Schüler konzipierter Einplatinencomputer, als echtzeitfähiger digitaler Prozessrechner verwendet werden kann. Dabei wird im Sinne von Industrie 4.0 nur der echtzeitkritische geschlossene Regelkreis am Versuch selber realisiert, während das Bedienen und Beobachten über das Internet geschieht. Hierfür kann man sich mit einem beliebigen Browser einloggen. Es kommt ausschließlich open-source Software zum Einsatz.
Im vierten und letzten Abschnitt wird die ebenfalls offene Simulationsumgebung erläutert und Testergebnisse von dem Versuchsstand gezeigt. Ein Video, das den funktionierende Versuch zeigt, wurde ebenfalls aufgenommen und ist unter https://​youtu.​be/​CJSD–gsHqU zu sehen.

2 Modellbildung und Reglerentwurf

Der Versuchsaufbau ist ein international verbreitetes Labormodell und auf Englisch als ,,Ball on Wheel“ bekannt. Zunächst sollen der physikalische und mathematische Hintergrund kurz skizziert werden, beginnend mit der Modellbildung.

2.1 Modellbildung

Ein Ball mit einer Masse \(m_{B}\) und einem Radius \(r_{B}\) liegt auf einem Rad. Dieses Rad mit Radius \(r_{W}\) und dem Trägheitsmoment \(J_{W}\) wird von einem Gleichstrommotor angetrieben. Ziel des Aufbaus ist es, den Ball durch die Drehung des Rades auf dem Rad zu balancieren. Der Winkel des Rades wird mit \(\varphi_{W}\) und der des Balles mit \(\varphi_{B}\) (siehe Skizze Abb. 1) bezeichnet. Zunächst sollen beide Winkel einbezogen werden. Allerdings wird vom Rad lediglich die Winkelgeschwindigkeit \(\dot{\varphi}_{W}\) gemessen, so dass der Winkel \(\varphi_{W}\) später weggelassen wird. Mit dem Trägheitsmoment \(J_{W}\) des Rades sowie dem Trägheitsmoment \(J_{B}\) und der Masse \(m_{B}\) des Balles erhält man die kinetische Energie des Gesamtsystems
$$ E_{\mathrm{kin}} = \frac{1}{2} \left( J_{W} \dot{\varphi}_{w}^{2} + J_{B}\frac{r_{W}^{2}}{r_{B}^{2}} \left( \dot{\varphi}_{B} - \dot{\varphi}_{W} \right)^{2} + m_{B} \left( r_{W} + r_{B} \right)^{2} \dot{\varphi}_{B}^{2} \right) \:. $$
Weiters erhält man mit der Schwerkraft \(g\) die potentielle Energie
$$ E_{\mathrm{pot}} = g \: m_{B} \left( r_{W} + r_{B} \right) \cos\varphi_{B} \:. $$
Aus dem Lagrange Formalismus erhält man die Bewegungsgleichungen
$$\begin{aligned} &\begin{bmatrix} J_{W} \!+\! J_{B}\frac{r_{W}^{2}}{r_{B}^{2}} & -J_{B}\frac{r_{W}^{2}}{r_{B}^{2}} \\ -J_{B}\frac{r_{W}^{2}}{r_{B}^{2}} & J_{B}\frac{r_{W}^{2}}{r_{B}^{2}} \!+\! m_{B} \left(r_{w} \!+\! r_{B} \right)^{2} \end{bmatrix} \begin{bmatrix} \ddot{\varphi}_{W} \\ \ddot{\varphi}_{B} \end{bmatrix} \\ &\quad - \begin{bmatrix} 0 \\ g m_{B} \left( r_{W} \!+\! r_{B} \right) \sin\varphi_{B} \end{bmatrix} = \begin{bmatrix} Q_{1} \\ Q_{2} \end{bmatrix} \end{aligned}$$
(1)
mit den verallgemeinerten Kräften \(\boldsymbol {Q} = \begin{bmatrix} Q_{1} & Q_{2} \end{bmatrix}^{T}\). Die Kräfte setzen sich zusammen aus einem Teil vom Motor und einem Teil aus der Reibung im System. Der wirkt über ein Getriebe mit der Übersetzung \(i_{G}\) auf das Rad. Da es sich um einen Gleichstrommotor handelt, ist sein Moment \(M_{M}\) gegeben durch:
$$ M_{M} = \frac{i_{G} \: k_{M}}{R_{A}} \left( u_{A} - i_{G} \: k_{M} \: \dot{\varphi}_{W} \right) $$
(2)
mit der Motorkonstanten \(k_{M}\), dem Ankerwiderstand \(R_{A}\) und der Ankerspannung \(u_{A}\) als Stellgröße. Die Induktivität des Motors ist gegenüber dem mechanischen Aufbau vernachlässigbar klein. Die wesentlichen Reibbeiträge entstehen durch das Drehen des Rades im Lager
$$ R_{W} = k_{W}^{c} \operatorname{sign}\dot{\varphi}_{W} + k_{W}^{v} \dot{\varphi}_{W} $$
und durch das Rollen des Balles auf dem Rad
$$ R_{B} = k_{B}^{c} \operatorname{sign}\left(\dot{\varphi}_{B} - \dot{\varphi}_{W} \right) + k_{B}^{v} \left(\dot{\varphi}_{B} - \dot{\varphi}_{W} \right) \:, $$
jeweils mit einem Coulombschen und einem viskosen Anteil. Zusammengenommen sind die Kräfte dann
$$\begin{aligned} Q_{1} &= M_{M} - R_{W} + R_{B} \end{aligned}$$
(3a)
$$\begin{aligned} Q_{2} &= -R_{B} \:. \end{aligned}$$
(3b)
Die Zahlenwerte der Parameter sind in Tab. 1 zu finden.
Tab. 1.
Zahlenwerte der Parameter und des Systems (4)
\(m_{B}\)
0.2046
kg
\(k_{M}\)
0.041
\(\frac{\text{N}\,\text{m}}{\text{A}}\)
\(r_{B}\)
0.068
m
\(R_{A}\)
2.96
Ω
\(r_{W}\)
0.2663
m
\(k_{W}^{c}\)
0.04994
N m
\(J_{W}\)
0.1288
kg m2
\(k_{W}^{v}\)
0.005540
N m s
\(J_{B}\)
0.001058
kg m2
\(k_{B}^{c}\)
0.002979
N m
\(i_{G}\)
14
 
\(k_{B}^{v}\)
0.0003945
N m s
\(a_{21}\)
2.014
    
\(a_{22}\)
−0.8446
    
\(a_{23}\)
0.001669
    
\(a_{31}\)
18.00
    
\(a_{32}\)
−0.3413
    
\(a_{33}\)
−0.009400
    
\(b_{2}\)
1.402
    
\(b_{3}\)
0.5820
    
Sowohl für den Reglerentwurf als auch für die Trajektorienplanung wird eine kompakte Darstellung als eingangsaffines System, im Englischen Affine Input System, verwendet. In den Modellgleichungen taucht der Winkel \(\varphi_{W}\) nicht auf. Da er auch nicht gemessen wird, kann man ihn weglassen und führt \(\omega_{W} = \dot{\varphi}_{W}\) ein. Setzt man in die Gl. (1), (2) und (3a), (3b) die Parameterwerte aus Tab. 1 ein, so erhält man mit dem Zustand
$$\boldsymbol {x} = \begin{bmatrix} \varphi_{B} & \omega_{W} & \dot{\varphi}_{B} \end{bmatrix}^{T} $$
das eingangsaffine System
$$ \begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{W} \\ \ddot{\varphi}_{B} \end{bmatrix} = \underbrace{\begin{bmatrix} \dot{\varphi}_{B} \\[1ex] a_{21} \sin\varphi_{B} + a_{22} \omega_{W} + a_{23} \dot{\varphi}_{B} + C_{W}\\[1ex] a_{31} \sin\varphi_{B} + a_{32} \omega_{W} + a_{33}\dot{\varphi}_{B} + C_{B} \end{bmatrix}} _{\boldsymbol {f}(\boldsymbol {x})} + \underbrace{\begin{bmatrix} 0 \\[1ex] b_{2} \\[1ex] b_{3} \end{bmatrix}} _{\boldsymbol {g}} u_{A} \:. $$
(4)
Die Werte sind rechts in Tab. 1 zu finden. Die Konstanten \(C_{W}\) und \(C_{B}\) entstehen durch die Coulombsche Reibung und hängen nur von den Vorzeichen \(\operatorname{sign}\omega_{W}\) und \(\operatorname{sign}(\dot{\varphi}_{B} - \omega_{W})\) ab, die sich während des Betriebes zumeist nicht ändern. Das rechtfertigt die Berücksichtigung als Konstante. Im Einzelnen sind es
$$\begin{aligned} C_{W} &= -0.3611 \operatorname{sign}(\omega_{W}) + 0.01260 \operatorname{sign}(\dot{\varphi}_{B} - \omega_{W}) \\ C_{B} &= -0.1499 \operatorname{sign}(\omega_{W}) -0.07098 \operatorname{sign}(\dot{\varphi}_{B} - \omega_{W})\:. \end{aligned}$$

2.2 Reduzierter Beobachter

Da verschiedene Zustandsregler zum Einsatz kommen sollen, muss der gesamte Zustand messbar sein. Die Größen \(\omega_{W}\) und \(\varphi_{B}\) werden messtechnisch erfasst. Die dritte \(\dot{\varphi}_{B}\) muss beobachtet werden. Sieht man von den Konstanten ab, so fällt bei der Betrachtung von Gl. (4) auf, dass die nichtlinearen Terme einzig aus gemessenen Größen bestehen und die zu beobachtende Größe linear auftritt. Das System hat die Struktur
$$\begin{aligned} &\begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{w} \end{bmatrix} = \boldsymbol {A}_{y} \dot{\varphi}_{B} + \boldsymbol {f}_{\!y}(\varphi_{B},\omega_{W},u_{A}) \\ &\ddot{\varphi}_{B} = \boldsymbol {A}_{\varphi}\dot{\varphi}_{B} + \boldsymbol {f}_{\!\varphi}(\varphi_{B},\omega_{W},u_{A}) \:. \end{aligned}$$
Der Zustand \(\hat{z}\) des reduzierten Beobachters und die Beobachterverstärkung werden analog zum linearen Fall eingeführt
$$\begin{aligned} &z = \dot{\varphi}_{B} + \boldsymbol {L} \begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{w} \end{bmatrix},\qquad \hat{z} = \dot{\hat{\varphi}}_{B} + \boldsymbol {L} \begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{w} \end{bmatrix} \\ &z - \hat{z} = \dot{\varphi}_{B} - \dot{\hat{\varphi}}_{B} = e \:. \end{aligned}$$
Die Beobachtergleichungen lauten dann
$$\begin{aligned} \dot{\hat{z}} = \boldsymbol {A}_{\varphi}\dot{\hat{\varphi}}_{B} + \boldsymbol {f}_{\!\varphi}(\varphi_{B},\omega_{W},u_{A}) + \boldsymbol {L} \Big( \boldsymbol {A}_{y} \dot{\hat{\varphi}}_{B} + \boldsymbol {f}_{\!y}(\varphi_{B},\omega_{W},u_{A})\Big) \end{aligned}$$
und für den ,,wahren” Wert
$$\begin{aligned} \dot{z} = \boldsymbol {A}_{\varphi}\dot{\varphi}_{B} + \boldsymbol {f}_{\!\varphi}(\varphi_{B},\omega_{W},u_{A}) + \boldsymbol {L} \Big( \boldsymbol {A}_{y} \dot{\varphi}_{B} + \boldsymbol {f}_{\!y}(\varphi_{B},\omega_{W},u_{A})\Big) \:. \end{aligned}$$
Zieht man beide voneinander ab, erhält man die lineare Fehlerdynamik
$$ \dot{z} - \dot{\hat{z}} = \dot{e} = \Big(\boldsymbol {A}_{\varphi}+ \boldsymbol {L} \boldsymbol {A}_{y} \Big) e \:. $$

2.3 Reglerentwurf

Zwei unterschiedliche Zustandsregler sollen realisiert werden, zum ersten ein einfacher linearer Zustandsregler, zum zweiten eine Steuerung und Regelung, die die Eigenschaft der Flachheit nutzt.

2.3.1 Linearer Regler mit I-Anteil

Bei der näheren Betrachtung von Gl. (4) fällt auf, dass die einzigen nichtlinearen Terme die Konstanten der trockenen Reibung und \(\sin\varphi_{B}\) sind. Wenn der Ball also in der Nähe der oberen Ruhelage \(\varphi_{B} \approx 0\) bleibt, so wird ein linearer Regler gute Ergebnisse bringen. Zur Kompensation der trockenen Reibung wird ein I-Anteil angefügt. Das linearisierte System lautet
$$ \begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{W} \\ \ddot{\varphi}_{B} \end{bmatrix} = \begin{bmatrix} 0 & 0 & 1 \\ a_{21} & \;a_{22} & a_{23} \\ a_{31} & \;a_{32} & \;a_{33} \end{bmatrix} \begin{bmatrix} \varphi_{B} \\ \omega_{W} \\ \dot{\varphi}_{B} \end{bmatrix} + \begin{bmatrix} 0 \\ b_{2} \\ b_{3} \end{bmatrix} u_{A} \:. $$
(5)
Der Zustandsregler wird um den I-Anteil erweitert
$$ \dot{x}_{I} = \omega_{W} - \omega_{W}^{\mathrm{soll}}\:, $$
so dass das Gesamtsystem
$$ \begin{bmatrix} \dot{\varphi}_{B} \\ \dot{\omega}_{W} \\ \ddot{\varphi}_{B} \\ \dot{x}_{I} \end{bmatrix} = \begin{bmatrix} 0 & 0 & 1 & 0 \\ a_{21} & \;a_{22} & a_{23} & 0\\ a_{31} & \;a_{32} & \;a_{33} & 0 \\ 0 & 1 & 0 & 0 \end{bmatrix} \begin{bmatrix} \varphi_{B} \\ \omega_{W} \\ \dot{\varphi}_{B} \\ x_{I} \end{bmatrix} + \begin{bmatrix} 0 \\ b_{2} \\ b_{3} \\ 0 \end{bmatrix} u_{A} + \begin{bmatrix} 0 \\ 0 \\ 0 \\ -1 \end{bmatrix} \omega_{W}^{\mathrm{soll}} $$
ergibt. Zur Berechnung der Rückführung \(u_{A} = - \boldsymbol {k}^{T} \boldsymbol {x}\) wird die LQR-Methode (siehe z.B. [7]) verwendet mit den Wichtungen
$$\boldsymbol {Q} = \begin{bmatrix} 10 & 0 & 0 & 0 \\ 0 & 0.1 & 0 & 0 \\ 0 & 0 & 5 & 0 \\ 0 & 0 & 0 & 2 \end{bmatrix}\quad \operatorname{und}\quad R = 1 $$
und man erhält
$$ \boldsymbol {k}^{T} = \begin{bmatrix} 99.74 & -2.809 & 23.79 & -1.414 \end{bmatrix} \:. $$

2.3.2 Flachheitsbasierte Trajektorienplanung

Man kann leicht zeigen, dass das AI-System (4) flach ist. Die Eigenschaft der Flachheit bedeutet, dass eine fiktive Größe \(y\) existiert, aus deren Verlauf \(y(t)\) der Verlauf sämtlicher anderen Größen \(\boldsymbol {x}\) und \(u_{A}\) berechnet werden kann, ohne eine Differentialgleichung lösen zu müssen. Dies erleichtert die Planung von Trajektorien erheblich. Eine Einführung in diese Theorie findet sich in [2] oder [4]. Zur Ermittlung des flachen Ausgangs \(y\) wird die nichtlineare Regelungsnormalform genutzt, siehe [5, 6] oder [2]. Glücklicherweise ist die Distribution
$$ D = \Big[ \boldsymbol {g} \,,\; \left[ \boldsymbol {f}, \, \boldsymbol {g} \right] \Big] = \begin{bmatrix} 0 & \; b_{3} \\ b_{2} & \; -1.186\\ b_{3} &\; -0.4840 \end{bmatrix} $$
konstant. Dadurch ist lediglich zu prüfen, ob sie Maximalrang besitzt. Der Rang der folgenden Distribution
$$\begin{aligned} &\Big[ \boldsymbol {g} \,,\; \left[ \boldsymbol {f}, \, \boldsymbol {g} \right] \,,\; \left[ \boldsymbol {f}, \, \left[ \boldsymbol {f}, \, \boldsymbol {g} \right] \right] \Big] \\ &\quad = \begin{bmatrix} 0 & \; b_{3} &\; -0.4840 \\ b_{2} & \; -1.186 &\; 1.003 \!+\! 1.172 \cos\varphi_{B} \\ b_{3} &\; -0.4840 &\; 0.4094 \!+\! 10.48\cos\varphi_{B} \end{bmatrix} \end{aligned}$$
ist voll für relevante Winkel1 \(\varphi_{B}\), wie man durch Berechnen der Determinante leicht zeigen kann. Der flache Ausgang ergibt sich dann aus dem Links-Annihilator zu \(D\) als
$$ y = \begin{bmatrix} 0.01423 &\; 0.4150 &\; -1 \end{bmatrix} \boldsymbol {x} \:. $$
Damit kann man einen neuen Zustand einführen
$$\boldsymbol {z} = \begin{bmatrix} y &\; \dot{y} &\; \ddot{y} \end{bmatrix}^{T} $$
mit der Transformation \(\boldsymbol {z} = \varPhi(\boldsymbol {x})\), die ausgeschrieben
$$\begin{aligned} z_{1} = y &= 0.01423 \: \varphi_{B} + 0.4150 \: \omega_{W} - \dot{\varphi}_{B} \end{aligned}$$
(6a)
$$\begin{aligned} z_{2} = \dot{y} &= -17.17\:\sin\varphi_{B} -0.01009\:\omega_{W} + 0.02432\:\dot{\varphi}_{B} \\ &\quad + 0.4150 \: C_{W} - C_{B} \end{aligned}$$
(6b)
$$\begin{aligned} z_{3} = \ddot{y}& = -17.17\:\dot{\varphi}_{B} \cos\varphi_{B} + 0.4174\:\sin\varphi_{B} + 0.0002454\:\omega_{W} \\ &\quad -0.0002454 \:\dot{\varphi}_{B} -0.01009\:C_{W} + 0.02432\:C_{B} \end{aligned}$$
(6c)
lautet. Auf das Ausschreiben der inversen Transformation \(\boldsymbol {x} = \varPhi^{-1}\!(\boldsymbol {z})\) wird aus Platzgründen verzichtet. Man geht so vor, dass zunächst die Größen \(\dot{\varphi}_{B}\) und \(\omega_{W}\), die lediglich linear auftreten, eliminiert werden. Die verbleibende trigonometrische Gleichung in \(\varphi_{B}\) ist numerisch robust lösbar, womit dann wiederum \(\dot{\varphi}_{B}\) und \(\omega_{W}\) berechnet werden können. Die Werte der Konstanten \(C_{W}\) und \(C_{B}\) sind praktisch immer bekannt. Wendet man diese Transformation auf Differentialgleichung (4) an, so erscheint sie in der gewünschten Form
$$ \begin{bmatrix} \dot{z}_{1} \\ \dot{z}_{2} \\ \dot{z}_{3} \end{bmatrix} = \begin{bmatrix} z_{2} \\ z_{3} \\ \alpha(\boldsymbol {z}) \end{bmatrix} + \begin{bmatrix} 0 \\ 0 \\ \beta(\boldsymbol {z}) \end{bmatrix} u_{A} \:. $$
(7)
Hiermit kann man offensichtlich aus der Kenntnis von \(y(t) = z_{1}(t)\) durch Differenzieren und Anwenden von \(\varPhi^{-1}\) sämtliche Größen berechnen.

2.3.3 Reglerentwurf mittels exakter Linearisierung

Die Darstellung (7) kann auch genutzt werden, um einen Trajektorienfolgeregler mit linearer Fehlerdynamik zu entwerfen. Der gewünschte Verlauf \(y^{d}(t) = z_{1}^{d}(t)\) ist mit ausreichend vielen Ableitungen bekannt. Aus der Kenntnis des Zustandes \(\boldsymbol {x}\) kann man mit der Transformation \(\varPhi(\boldsymbol {x})\) den Istzustand \(\boldsymbol {z}\) bestimmen. Nun fordert man, dass der Fehler \((y-y^{d})\) einer stabilen Differentialgleichung gehorcht
$$ 0 = \dddot{y} - \dddot{y}^{d} + c_{2} \big( \ddot{y} - \ddot{y}^{d} \big) + c_{1} \big( \dot{y} - \dot{y}^{d} \big) + c_{0} \big( y - y^{d} \big) $$
und mit Gl. (7)
$$ 0 = \alpha(\boldsymbol {z}) + \beta(\boldsymbol {z}) \: u_{A} - \dddot{y}^{d} + c_{2} \big( z_{3} - \ddot{y}^{d} \big) + c_{1} \big( z_{2} - \dot{y}^{d} \big) + c_{0} \big( z_{1} - y^{d} \big) \:. $$
Löst man obige Gleichung nach der Stellgröße \(u_{A}\) auf, erhält man die stabilisierende linearisierende Rückführung
$$\begin{aligned} \boldsymbol {z} &= \varPhi(\boldsymbol {x}) \end{aligned}$$
(8a)
$$\begin{aligned} u_{A} &= \frac{1}{\beta(\boldsymbol {z})} \big( \dddot{y}^{d} - \alpha(\boldsymbol {z}) - c_{2} \big( z_{3} - \ddot{y}^{d} \big) - c_{1} \big( z_{2} - \dot{y}^{d} \big) - c_{0} \big( z_{1} - y^{d} \big) \big) \;. \end{aligned}$$
(8b)
Darin enthalten ist selbstverständlich auch die Möglichkeit, einen konstanten Wert \(\omega_{W}^{\mathrm{soll}}\) einzustellen. Dann ist nur \(y^{d}(t) = \bar{y}^{d}\) zu berechnen, denn sämtliche Ableitungen sind Null. Die Gl. (6a), (6b) (6c) wird zu
$$\begin{aligned} \bar{y}^{d} &= 0.01423 \: \varphi_{B}^{\mathrm{soll}} + 0.4150 \: \omega_{W}^{\mathrm{soll}} \\ 0 &= -17.17\:\sin\varphi_{B}^{\mathrm{soll}} -0.01009\:\omega_{W}^{\mathrm{soll}} + 0.4150 \: C_{W} - C_{B} \end{aligned}$$
und die Rückführung bekommt die in der Literatur verbreitetere Form
$$u_{A} = - \frac{1}{\beta(\boldsymbol {z})} \big( \alpha(\boldsymbol {z}) + c_{2} z_{3} + c_{1} z_{2} + c_{0} \big( z_{1} - y^{d} \big) \big) \:. $$

3 Implementierung mit offener Hard- und Software

Ein Anliegen dieses Artikels ist es zu zeigen, dass anspruchsvolle Regelungskonzepte nicht notwendigerweise teure Hard- oder Softwarepakete benötigen. Als echtzeitfähiger Prozessrechner wurde ein Raspberry PI Modell B verwendet, der über seine GPIO (General Purpose Input Output) Pins mit der Messhardware kommunizierte. Zum Bedienen und Beobachten kam das RTXML, das in [11] vorgestellt wurde, zum Einsatz. Als digitales Ein- und Ausgabesystem wurde BIOE [10] in einer für den Raspberry PI adaptieren Fassung und als Betriebssystem wurde Xenomai [1], eine auf Linux basierende Echtzeitumgebung, verwendet. Dadurch hat man die gesamte Linux Umgebung für Diagnose- und Verwaltungszwecke zur Verfügung.
Zum Antrieb des Rades wurde ein Motor-Getriebe-Paket, bestehend aus einem Motor der Serie 3557 K024 CR und einem Getriebe der Serie 38/2, der Firma Faulhaber verwendet. Die Winkelgeschwindigkeit \(\omega_{W}\) wurde durch einen Digital-Inkrementalgeber mit anschließender Torzeitmessung erfasst. Der Winkel \(\varphi_{B}\) des Balles wurde indirekt über einen Lasersensor vom Typ OADM 20I4470/S14C der Firma Baumer Electric gemessen.

3.1 LPT-Adaptierung des Raspberry PI für BIOE-Anschluss

BIOE wurde ursprünglich für eine Verwendung mit einem echtzeitfähigen Standard-PC entwickelt. Daher verwendet es dessen parallele Schnittstelle (LPT) zur Übertragung. So musste der Raspberry PI mit einer LPT-Schnittstelle versehen werden. Dies wurde mit einem speziellen LPT-Treiber, der auf dem Beispiel [8] basiert, erreicht. Mit diesem Treiber ist neben der geforderten minimalen IO-Zeit und der Zuverlässigkeit beim Setzen einzelner GPIOs auch das zeitlich parallele Setzen und Lesen mehrerer GPIOs möglich. Mit dem damit entwickelten Treiber ergibt sich sogar eine etwas bessere IO-Zeit als am PC in der Regel mit einer echten LPT-Schnittstelle zu erwarten wäre. Die IO-Zeit am Raspberry PI beträgt etwa 30 μs. Noch kürzere Zeiten sind vom Raspberry PI her möglich. Jedoch sind die Mikroprozessoren der BIOE-Module dafür nicht geeignet.
Zur Adaption der Hardware wurde der LPT-Adapter geplant und gefertigt, welcher dazu dient, den Logik-Pegel für High von 5 V des BIOE auf die 3.3 V des Raspberry PI wandeln zu können. Eine Trägerplatine nimmt drei kleine Logik-Konverter-Platinen auf, welche ihrerseits je vier bidirektionale IO-Leitungen umsetzen können. Diese werden unter anderem für Entwicklerarbeiten am Raspberry PI angeboten.

3.2 BIOE-Erweiterung

Das bisher veröffentlichte BIOE [10] bietet die Möglichkeit pro Modul bis zu vier Spannungen zwischen 0 und 5 V, einzulesen. Zur Ausgabe analoger Signale existiert lediglich eine Puls-Weiten-Modulation (PWM). Wegen des offenen Charakters ist das BIOE jedoch gut erweiterbar. Es wurde eine Platine gefertigt, die mit verschiedenen Pin-kompatiblen 12-bit ADC-Chips bestückt werden kann. Hier kamen ein HI-674A der Firma Intersil und ein ADS774 von Texas Instruments zum Einsatz. Weiters wurde eine Platine gefertigt, die einen 12-bit DAC, den DAC811 von Texas Instruments, an das BIOE anschließt. Dadurch können mehrere bipolare Spannungen mit wählbaren Bereichen eingelesen und ausgegeben werden. Die jeweils nötigen Versorgungsspannungen werden mit einem integrierten DC/DC-Wandler aus der \(+5\) V Versorgung gewonnen.
Die BIOE-Firmware wurde modifiziert, um eine neue DTN (Device-Type-Number) für den Betrieb mit der ADC-Platine und der DAC-Platine bereit zu stellen.

3.3 Software-Anpassungen

Zusammen mit BIOE [10] wird das Internet-basierte Bedien- und Beobachtungspaket RTXML angeboten. Dieses ist als Erweiterung für Scilab [9] und Scicoslab verfügbar. Über die in Scilab und Scicoslab enthaltene graphische Programmierumgebung Scicos, kann damit C-Code und dessen direkt ausführbares Programm generiert werden. Sobald es gestartet wird, bietet es ein über HTTP bereitgestelltes Web-Interface an, welches dem Benutzer erlaubt, Parameter des im Programm enthaltenen Echtzeittasks zu ändern und Messdaten von jenem im Web-Browser graphisch darzustellen.
Im Zuge der in diesem Artikel vorgestellten Adaptierung und Erweiterung von BIOE wurde auch eine Modifikation von RTXML realisiert, welche die Verwendung von RTXML in der Programmierung mit C oder C++ möglich macht. Die spezielle Schnittstelle, die bei der Code-Generierung in Scilab verwendet wird, wurde dabei durch eine für den Programmierer lesbare ersetzt.
Als Betriebssystem wird Xenomai [1] für den Raspberry PI verwendet. Eine Verwendung von RT PREEMPT und Standard-Linux funktioniert mit wenigen Anpassungen ebenso.
Um die Echtzeitfähigkeit zu testen, wurde ein Ablauf ähnlich zu dem im Abschn. 4.3 vier Stunden lang durchgeführt. Dabei wurden während der Ausführung über Xenomai-POSIX Zeitpunkte der CLOCK_MONOTONIC2 gemessen. Das Ergebnis findet man in Tab. 2. Die Verteilung des Jitters, also die Zeit um die sich der Start des Programmes gegenüber dem geplanten Start verzögert, ist in Abb. 2 als Histogramm dargestellt. Hervorzuheben ist, dass der Jitter im Mittelwert lediglich 19.84 μs mit geringen Schwankungen beträgt, so dass auch wesentlich kürzere Abtastzeiten, als die hier verwendeten 10 ms möglich sind. Die echtzeitkritische Rechenzeit ist jene Zeit, die von der Bereitstellung der Messwerte bis zur Bereitstellung der Stellgröße für den jeweiligen Abtastschritt verstreicht. Die echtzeitkritische Gesamtzeit ist die Zeit, die vom Start des Programmes bis zur Ausgabe der neuen Stellgröße verstreicht, also die Summe aus Eingabe-, Ausgabe- und Rechenzeit. Der recht hohe Maximalwert zeigt an, dass es durch betriebssysteminterne Abläufe sehr vereinzelt auch zu deutlich längeren Rechenzeiten kommen kann, die jedoch die Stabilität der Regelung nicht merklich beeinflussen. In Abb. 3 sieht man das Histogramm der echtzeitkritischen Gesamtzeit.
Tab. 2.
Ergebnis der Echtzeitmessung über vier Stunden
Zeit
Mittelwert
Max
Min
Stichprobenvarianz
Jitter
19.84 μs
55.85 μs
10.47 μs
1.969 μs
Einlesezeit
112.8 μs
172.3 μs
102.9 μs
3.034 μs
Echtzeitkritische Rechenzeit
41.17 μs
1818 μs
1.96 μs
5.098 μs
Ausgabezeit
33.22 μs
90.78 μs
29.34 μs
1.815 μs
Echzeitkritische Gesamtzeit
187.2 μs
1968 μs
137.8 μs
6.807 μs
Sonstige Rechenzeit
18.77 μs
147.9 μs
14.26 μs
4.738 μs

3.4 Objektorientierte Programmierung

Um eine gute Modularisierung und Wiederverwendbarkeit zu erreichen, wird der Regler objektorientiert in C++ realisiert. Dadurch können in der gegebenen Struktur (Abb. 4) unterschiedliche Regler leicht ausgetauscht werden. Dabei müssen selbstverständlich nicht immer sämtliche Klassen vorhanden sein und bei den Klassen müssen nicht sämtliche Eigenschaften ausgeprägt werden. Beispielsweise hat der Trajektorienfolgeregler (8a), (8b) keine internen Zustände und der lineare Regler mit I-Anteil benötigt keinen \(x^{d}(t)\)-Generator. Man beachte, dass der \(y^{d}(t)\)-Generator keinerlei Information über die spezifische Regelstrecke hat, bzw. benötigt. Er lässt sich daher für andere Aufgaben wiederverwenden. In der vorliegenden Arbeit wird die Solltrajektorie durch abschnittsweise definierte Polynome dargestellt, bei denen an den Übergangsstellen die erforderliche Glattheit garantiert wird. Weil die Darstellung der Trajektorien eine private Eigenschaft ist, können ohne Schwierigkeit auch andere Darstellungen implementiert werden. Ein Algorithmus zur Planung von Übergängen zwischen Ruhelagen \(y^{d}_{\mathrm{start}}\) und \(y^{d}_{\mathrm{end}}\) gehört zur Grundausstattung.

4 Testergebnisse

Der Aufbau wurde mit den beiden vorgestellten Regelungskonzepten getestet. Zuvor jedoch mussten die Algorithmen an einem Simulationsmodell validiert werden.

4.1 Simulationsumgebung

Auch die Simulationsumgebung wurde ausschließlich mit offener Software eingerichtet, nämlich mit GNU-Octave [3] und dessen C++ Schnittstelle. Zunächst wurden die Bewegungsgleichungen (1) um einige bewusst nicht modellierte Eigenschaften erweitert, um realitätsnahe Störungen in der Simulation zu erhalten. Speziell wurden die Exzentrizität des Balles, denn der Ball ist nicht ausgewuchtet, und ein feineres Reibmodell hinzugenommen. Dieses Modell wurde für den Befehl lsode von GNU-Octave als zeitkontinuierliches Modell implementiert. In einer Schleife über die Abtastzeitpunkte wurden die simulierten Messwerte über das External Code Interface (Oct-Files) an die in Abschn. 3.4 skizzierten Regler übergeben und die berechnete Stellgröße für den neuen Abtastschritt entgegengenommen. Zu bedenken ist dabei nur, dass die Objekte nach jedem Aufruf zerstört werden. Daher müssen deren Eigenschaften während der Simulation static deklariert werden, was zur Folge hat, dass jeweils nur eine Reglerkonfiguration gleichzeitig getestet werden kann. Von Abtastzeitpunkt zu Abtastzeitpunkt wird dann wieder zeitkontinuierlich simuliert, weshalb man von einer hybriden Simulation sprechen kann.
Die validierten Regler werden in der Folge an der realen Strecke mit einer Abtastzeit von 10 ms getestet.

4.2 Test: Linearer Regler mit I-Anteil

Zwei Anschläge an dem Aufbau verhindern, dass der Ball im Falle des Versagens der Regelung herunter fällt. Zu Beginn des Tests liegt der Ball an einem dieser Anschläge. Das Testergebnis findet man in Abb. 5. Mit Einschalten des Reglers wird der Ball in die Mitte geholt und bei einer festen Winkelgeschwindigkeit \(\omega_{M}^{\mathrm{soll}}\) balanciert. Ein Sollwertsprung demonstriert die Robustheit. Dabei versucht der Regler das System in der Ruhelage zu halten, was natürlich bei Beschleunigung speziell für den Winkel \(\varphi_{B}\) nicht gelten kann. Die genaue Gestalt der Abweichungen bleibt bei diesem Regler dem Zufall überlassen. Man beachte, dass auch der Vorzeichenwechsel in \(\omega_{W}\), bei dem auch die trockene Reibung das Vorzeichen wechselt, kein Problem ist. Der I-Anteil kompensiert die geänderte Reibung wieder.
Falls keine höheren Ansprüche an das Verhalten bei Sollwertänderungen gestellt werden, ist dieser Regler gut genug, denn die Ruhelage wird robust stabilisiert.

4.3 Test: Flachheitsbasierter Trajektorienfolgeregler

Die Trajektorienplanung soll in etwa die gleiche Aufgabe lösen, wie zuvor der lineare Regler. Der Ball soll von einem Anschlag in die Mitte geholt und dort bei einer festen Geschwindigkeit \(\omega_{W}^{\mathrm{soll}}\) balanciert werden. Danach soll er auf eine andere feste Sollgeschwindigkeit wechseln. Die Wechsel sollen möglichst schnell geschehen. Dabei sind der Schnelligkeit jedoch Grenzen gesetzt, denn der Ball soll sich nicht zu weit aus der Mitte bewegen. Schaut man sich Gl. (6b) näher an, so fällt auf, dass \(\dot{y}\) überwiegend von \(\sin\varphi_{B}\) abhängt. Wenn man also \(z_{2} = \dot{y}\) beschränkt, wird sich der Ball nicht zu weit heraus bewegen. Die Solltrajektorie \(y^{d}\) wird daher eine Rampe mit der Steilheit \(-17.17\:\sin(10^{\circ})\), die an den beiden Enden durch Übergangspolynome so in eine Konstante \(\bar{y}^{d}\) überführt wird, dass die Trajektorie zweimal differenzierbar bleibt und die Spannung \(u_{A}\) nicht über \(\pm 24\) V geht. Durch die genauere Vorausplanung kann der Regler schwächer mit
$$c_{0} = 16.42 \:,\qquad c_{1} = 2.650 \:,\qquad c_{2} = 9.972 $$
eingestellt werden. Das Ergebnis sieht man in Abb. 6. Den geplanten Trajektorien wird gut gefolgt. Durch die Planung ist man in der Lage, die Grenzen des Systems auszunutzen und gleichzeitig einzuhalten.

5 Zusammenfassung

Die vorgestellte Reglerimplementierung ist einer gängigen, kommerziell erhältlichen Implementierung sowohl in der Hardware als auch in den Algorithmen im Ergebnis gleichwertig. Die Flexibilität, die man zum Experimentieren benötigt, ist voll gegeben. Man muss allerdings einräumen, dass Aufbau und Programmierung vertiefte Kenntnisse der jeweiligen Techniken verlangen. Dem gegenüber steht jedoch eine erhebliche Reduktion der Kosten, was diese Vorgehensweise vor allem für Ausbildungseinrichtungen interessant machen dürfte.

Danksagung

Open access funding provided by Johannes Kepler University Linz. Diese Arbeit wurde im Rahmen eines K2 Projektes in der Linz Center of Mechatronics GmbH durchgeführt. Die K2 Projekte werden aus Mitteln des österreichischen COMET-K2 Programms finanziert. Die COMET K2 Projekte im LCM werden unterstützt von der Österreichischen Bundesregierung, dem Land Oberösterreich, der Johannes Kepler Universität und allen wissenschaftlichen Partnern, die Teil des K2-COMET Konsortiums innerhalb der Linz Center of Mechatronics GmbH sind.
Open Access This article is distributed under the terms of the Creative Commons Attribution 4.0 International License (http://creativecommons.org/ licenses/by/4.0/), which permits unrestricted use, distribution, and reproduction in any medium, provided you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons license, and indicate if changes were made.
Fußnoten
1
Rangverlust tritt erst bei Winkeln \(|\varphi_{B}| > \frac{\pi}{2}\) auf, bei denen der Ball vom Rad fällt.
 
2
Eine Uhr, die nicht gestellt werden kann und die die monoton verstrichene Zeit seit einem nicht definierten Anfangszeitpunkt misst.
 
Literatur
6.
Zurück zum Zitat Jakubczyk, B., Respondek, W. (1980): On linearization of control systems. Bull. Acad. Pol. Sci., Sér. Sci. Math. Astron. Phys., 28, 517–522. MathSciNetMATH Jakubczyk, B., Respondek, W. (1980): On linearization of control systems. Bull. Acad. Pol. Sci., Sér. Sci. Math. Astron. Phys., 28, 517–522. MathSciNetMATH
7.
Metadaten
Titel
Nichtlineare Regelung mit einem Raspberry PI
Automatisierung des Versuchsaufbaus ,,Ball auf Rad“ mit einem Raspberry PI und offener Hard- und Software
verfasst von
Sven-Olaf Lindert
Christian Höfler
Kurt Schlacher
Publikationsdatum
24.04.2018
Verlag
Springer Vienna
Erschienen in
e+i Elektrotechnik und Informationstechnik / Ausgabe 3/2018
Print ISSN: 0932-383X
Elektronische ISSN: 1613-7620
DOI
https://doi.org/10.1007/s00502-018-0613-8

Weitere Artikel der Ausgabe 3/2018

e & i Elektrotechnik und Informationstechnik 3/2018 Zur Ausgabe

Neuer Inhalt