Skip to main content

2020 | OriginalPaper | Buchkapitel

6. Methodenteil

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Um „soziale Roboter“, die variable Interaktionsfähigkeit in nonverbalen und in verbalen Bereichen erfordern, für Interaktionsstudien zu nutzen, konnten bisherige Robotertypen aufgrund fehlender Sprachgenerierung und -verstehen sowie begrenzter Umsetzung von Sozialität durch künstliche Intelligenz nicht eingesetzt werden. Robotiker, mit Interesse an der Erforschung der Besonderheiten der Mensch-Maschine Interaktion, haben sich demnach einen Kniff überlegt, um die Limitationen der Technik sowohl auf den Gebieten der Adaptionen an die Um- und Mitwelt des Roboters als auch zur sprachlichen Kommunikationsfertigkeit und sozialen Kognition zu umgehen. Da die Hiroshi-Ishiguro-Laboratories (HIL) Interaktionsforschung und Wirkungen von Robotern auf menschliche Interaktionspartner nicht auf unabsehbare Zeit vertagen wollten, wurde ein Robotermodell angefertigt, welches Interaktionsgebaren entsprechend dem aktuellen Stand der Technik ermöglicht.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Die HIL stellen eine Forschungseinheit im Rahmen der „Intelligent Robotics and Communication Laboratories“ am ATR (Advanced Telecommunications Research Institute International) in Kyoto/Japan dar.
Für nähere Infos zu den Projekten der Labore bezüglich Mensch-Roboter-Interaktion bzw. zu avancierten Kommunikationstechnologien siehe http://​www.​geminoid.​jp/​en/​index.​html, http://​www.​irc.​atr.​jp/​en/​ sowie http://​www.​atr.​jp/​index_​e.​html (Letzter Zugriff am 17.07.2018).
 
2
Inwieweit Leiblichkeit, Verkörperung bzw. „embodiment“ eine Rolle in den Kognitionswissenschaften spielen erörtert u. a. Becker (1998).
 
3
Die Gestalt des androiden Robotertyps Geminoid gleicht der eines real existierenden Menschen (vgl. Nishio et al. 2007) und die Entwickler beziehen sich bei der Namensvergebung „Geminoid“ ethymologisch auf die lateinische Bedeutung von ‚geminus‘ als ‚Zwilling‘ oder ‚Doppelt‘, wobei der Wortstamm um ‚-oid‘ erweitert wurde und sich auf die Ähnlichkeit zu etwas bezieht (ebd.) “As the name suggests, a geminoid (sic!) is a robot that will work as a duplicate of an existing person. It appears and behaves as a person and is connected to the person by a computer network. Geminoids extend the applicable field of android science. Androids are designed for studying human nature in general. With geminoids (sic!), we can study such personal aspects as presence or personality traits, tracing their origins and implementation into robots.” (Nishio et al. 2007: 346).
 
4
Die Endung HI stellen das Akronym/die Initialien des Robotikers Hiroshi Ishiguro dar.
 
5
Die derzeitig existierenden Modelle der Robotertypen Geminoid sind ‚Geminoid HI-1‘ bis ‚Geminoid HI-4‘; ‚Geminoid-F‘ und andere, nicht von Ishiguro vermarktete Modelle (siehe etwa Geminoid DK https://​spectrum.​ieee.​org/​automaton/​robotics/​humanoids/​latest-geminoid-is-disturbingly-realistic. Letzter Zugriff am 17.07.2018). Die Gestaltung und Herstellung der Geminoid Robotermodelle wurden von der Firma Kokoro, die sich auf das äußere Design von Robotern spezialisiert hat, ausgeführt (https://​www.​kokoro-dreams.​co.​jp/​english/​rt_​tokutyu/​. Letzter Zugriff am 17.07.2018).
 
6
Die Nachbildung des real existierenden Menschen (HI) basiert auf MRI-Aufnahmen und Photographien der zu replizierenden Person und erfolgt anhand einer Refiguration derer Körper- und Gesichtsmerkmale, welche durch einen Abdruck mit Hilfe einer Silikonmasse mit anschließender Pigmentierung vorgenommen wird.
 
7
Zu einer genaueren Beschreibung der technischen Machart und der Funktion von androiden Robotern siehe Nishio et al. (2007).
 
8
Allerdings sind die Beweglichkeit und Steuerbarkeit des Roboters stark limitiert, was auf zwei technische Komponenten zurückführbar ist: Einerseits erfordert die Übertragung von Daten zu den Körperpartien eine hohe Rechenkapazität und hierzu entsprechend leistungsfähige Prozessoren. Der Umstand, dass die Entwickler die Übertragung von Körperpositionen auf die Gesichts- und Torsopartie limitieren, kann demnach auf technische Einschränkungen zurückgeführt werden. Andererseits ist es auch möglich, dass die Entwickler die Angleichung des Roboters an die Kopf- und Torsopartie des Steuernden für das Gelingen von Interaktion für ausreichend halten. Wahrscheinlich ist es eine Mischung aus beiden Komponenten, d. h. der technischen Grenzen und der Vorannahmen der Entwickler bezüglich der Mindestbedingungen, welche den Ingenieuren zum Gelingen von Interaktion im Allgemeinen zu genügen scheinen.
 
9
Von den 50 Aktuatoren wurden allein 13 in der Gesichtspartie platziert, 15 im Torsobereich und 22 in Bereichen der simulierten Arme und Beine.
 
10
Ishiguro beschreibt das GUI Interfaces wie folgt: “Two monitors show the controlled robot and its surroundings, and microphones and a headphone are used to capture and transmit conversation. The captured sounds are encoded and transmitted to the geminoid server [sic!] by IP links from the interface to the robot and vice versa. The operator’s lip corner positions are measured by an infrared motion capturing system in real time, converted to motion commands, and sent to the geminoid server [sic!] by the network. This enables the operator to implicitly generate suitable lip movement on the robot while speaking. However, compared to the large number of human facial muscles used for speech, the current robot has only a limited number of actuators in its face. Also, the response speed is much slower, partially due to the nature of the pneumatic actuators. Thus, simple transmission and playback of the operator’s lip movements would not result in sufficient, natural robot motion. To overcome this issue, measured lip movements are currently transformed into control commands using heuristics obtained through observation of the original person’s actual lip movements. The operator can also explicitly send commands to control robot behavior using a simple GUI interface. Several selected movements, such as nodding, contradicting, or staring in a certain direction can be specified by a single mouse click. This relatively simple interface was prepared because the robot has 50 degrees of freedom, which makes it one of the world’s most complex robots, and it is basically impossible to manipulate the system manually in real time. A simple, intuitive interface is necessary so that the operator can concentrate on interaction and not on robot manipulation. Despite its simplicity, by cooperating with the geminoid server [sic!], this interface enables the operator to generate natural humanlike motions in the robot.” (Ishiguro & Nishio 2007: 139).
 
11
Die technischen Spezifiken zu den Bewegungsabläufen beschreibt Ishiguro folgendermaßen: “The geminoid server [sic!] receives robot control commands and sound data from the remote controlling interface, adjusts and merges inputs, and sends and receives primitive controlling commands to and from the robot hardware. Figure 6.1 shows the data flow in the geminoid system [sic!]. The geminoid server [sic!] also maintains the state of human-robot interaction and generates autonomous or unconscious movements for the robot. As described above, as a robot’s features become more humanlike, its behavior should also become suitably sophisticated to retain a “natural” look. One thing that can be seen in every human being, and that most robots lack, are the slight body movements caused by the autonomous system, such as breathing or blinking. To increase the robot’s naturalness, the geminoid server [sic!] emulates the human autonomous system and automatically generates these micro-movements, depending on the state of interaction each time. When the robot is “speaking,” it makes different micromovements than when “listening” to others. Such automatic robot motions, generated without the operator’s explicit orders, are merged and adjusted with conscious operation commands from the teleoperation interface. In addition, the geminoid server [sic!] gives the transmitted sounds specific delays, taking into account the transmission delay/jitter and the start-up delay of the pneumatic actuators. This adjustment serves to synchronize lip movements and speech, thus enhancing the naturalness of geminoid [sic!] movement.” (Ishiguro & Nishio 2007: 139 f.).
 
12
Short, Williams, and Christie (1976) bestimmen in ihrer “Social Presence Theory” (SPT) “soziale Präsenz” als “(…) the degree of salience of the other person in the interaction and the consequent salience of the interpersonal relationships.” (Short et al. 1976: 65). Mit Hinblick auf die Verwendung technischer Kommunikationsmittel bestimmt Gunawardena (1995) soziale Präsenz weiter als “(…) the degree to which a person is perceived as a ‘real person’ in mediated communication.” (Gunawardena 1995: 151). Riva & Anolli (2006) bieten ebenfalls einen pointierten Überblick über technisch-vermittelte soziale Präsenz.
 
13
Vgl. hierzu Ishiguros Worte: „As the name suggests, a Geminoid is a robot that will work as a duplicate of an existing person. It appears and behaves as a person and is connected to the person (sic!) by a computer network. (…) With geminoids [sic!], we can study such personal aspects as presence or personality traits, tracing their origins and implementation into robots.” (Ishiguro & Nishio. 2007: 138).
 
14
Funktion c) wurde anhand von Interaktionsanalysen belegt, die durch sprachliche Aussagen nachweisen, dass dem Roboter eine eigens emergente ‚Inkorporierte Identität‘ zugesprochen wurde (und der Charakter des Steuerenden durch die Merkmalszuschreibungen an den Roboter ersetzt wurden). Die Bedingungen und Merkmale von sozialer Präsenz der steuernden Person einerseits und des Roboters andererseits können zudem mit dem Vorbild der Robotergestalt und dessen Wirkung auf den Interaktionspartner verglichen werden. Zudem können die Studien ausgeweitet werden auf Effekte und Wirkungen von Seiten des Steuernden und des Rezipienten bei Steuerung des Roboters durch eine andere Person als die dem Roboter Gestaltgebende. Somit wird die Auswirkung einer anderen äußeren Gestalt als der eigenen auf der Seite des Steuerenden und die Handhabung und der Umgang mit dem Steuerenden resp. dem Roboter von Seiten des Interaktionspartners analysierbar. Die Analyse der „Inkorporierten Identität“ GHI-1 ist Inhalt einer anderen Studie, die in Folge publiziert werden soll. Eine genauere Ausführung einer interaktionsanalytisch gewichteten ‚sozialen Präsenz‘ des Roboters wird indes bereits in dieser Arbeit näher besprochen.
 
15
Zur Identititätsgenerierung von Geminoid HI-1 durch Zuschreibungen sowohl von Seiten der Interaktionspartner als auch von Seiten der steuernden Personen siehe Straub et al. (2010). Zu den Grenzbereichen zwischen Androiden und Menschen siehe Kahn et al. (2007).
 
16
Damit bietet diese Studie eine Untersuchung der Eindrücke von Besuchern gegenüber GHI-1, die nicht aus Laborexperimenten stammen. Siehe auch Cicourels Kritik an der Artifizialität von Laborexperimenten (Cicourel 1974: 222).
 
17
Die Settings lassen sich wie folgt listen: Setting 1) GHI-1 sitzt allein an dem Cafétisch und simuliert das Arbeiten an einem Laptop; Setting 2) GHI-1 sitzt an dem Cafétisch ohne Laptop; Setting 3) GHI-1 sitzt mit/ohne Laptop an dem Cafétisch mit einer weiteren Person, die ebenfalls in einen Laptop schaut oder sich im Teleoperationsmodus mit GHI-1 unterhält. Da die unterschiedlichen Settingtypen sich für unsere Studie als nicht-relevant herausgestellt haben, wollen wir uns in dieser Studie auf die drei Aktivitätsmodi des Idling Modus, Facetrack Modus sowie Teleoperationsmodus konzentrieren.
 
18
Bei der Studie im Café gab es auch Besucher, die GHI-1 nicht beachteten und vorbeigingen. Bei der Analyse des Datenmaterials wurden Momente gesichtet, bei denen die Besucher GH-1 bemerken und Reaktionen auf die Gestalt aufweisen.
 
19
Das Verhältnis von Subjekten, Selbsten oder Personen gegenüber Objekten wird verschieden diskutiert, so finden sich Studien zur Personifikation oder zu Bedingungen zu Zuschreibungen von Bewusstsein gegenüber nicht-belebten Dingen oder Robotern (vgl. Brady et al. (1994), Dodier (1995), Frank (1996), Gallagher (2012), Kurthen & Linke (1993), Kwan & Fiske (2008a), Mori (1999), Spaemann (2006) oder Straub et al. (2012)), bzw. nicht-menschlichen Wesen vgl. Bermúdez (2003b).
 
20
Siehe hierzu Lindemanns Ausführungen vor dem Hintergrund Plessners ‚Positionalitätstheorie‘: „Die Analyse setzt beim Objekt an. Die Bedingungen des Erscheinens werden nicht auf der Seite des Subjekts untersucht, sondern auf der Seite des erscheinenden Objekts. (…) Er entwickelt anfänglich eine These, wonach sich belebte Dinge von unbelebten durch ihre spezifische Form der Abgrenzung von ihrer Umgebung und damit durch ihre spezifische Form der Selbständigkeit gegenüber Ihrer Umgebung unterscheiden. Dies ist die Positionalitätstheorie.“ (Lindemann 2009a: 68) und „Wenn es darum geht zu entscheiden, ob beobachtete Phänomene im Sinne von Personsein zu deuten sind, lautet die von der Theorie des Gegenstandes begründete Beobachtungsanweisung: Sieh auf das Verhältnis der Körper zueinander, denn nur in diesem kommt die Deutung vor, durch die zwischen personalen Körpern und anderem unterschieden wird. Nur in diesem Verhältnis ist Personsein realisiert.“ (Lindemann 2009a: 76).
 
21
Die Kürzel ergeben sich aus dem Geschlecht der Besucher (M=Mann, F= Frau, J=Junge, Md=Mädchen) sowie dem in Klammern gesetzten geschätzten Alter der Person (z. B. M(42)).
 
22
Vgl. auch DGS-Ethik-Kodex: http://​www.​soziologie.​de/​de/​die-dgs/​ethik/​ethik-kodex.​html (geprüft am 15.05.2018) bzw. die Arbeit: „Objektivität und Integrität der Forschenden, Risikoabwägung und Schadensvermeidung, Freiwilligkeit der Teilnahme, Informiertes Einverständnis, Vertraulichkeit und Anonymisierung“ (vgl. von Unger et al. 2014).
 
23
Neben der Videographie befasst sich inzwischen auch die „visuelle Soziologie“ mit den Besonderheiten von visuelle-beobachtbaren Daten, vgl. hierzu Weichbold & Bachleitner (2015) und Tuma & Schmidt (2012).
 
24
Eine Diskussion zu Hypothesen und Vorwissen in der qualitativen Forschung bietet Meinefeld (2007).
 
25
Die Konversationsanalyse ist aus der empirischen Feldforschung mit ethnomethologischem Schwerpunkt entstanden (Garfinkel 1967) und wurde in den 1960er Jahren von Harvey Sacks (1992 [1964]) zunächst initiiert und von Schegloff et al. (1973, 1968) weitergeführt.
 
26
Zur ethnomethodologischen Konversationsanalyse generell siehe Bergmann (1981).
 
27
Die entsprechenden Sequenzen zu nonverbalen Bezugsweisen werden in der empirischen Untersuchung beispielhaft als Partiturtranskripte mit dem Softwareprogramm ELAN dargestellt.
 
28
Vgl. auch die Grundannahme des interpretativen Paradigmas bei Mead (1998), Schütz (1971), etc. Auch der späte Strauss betont, zusammen mit Corbin, in dem Aufsatz „Methodological Assumptions“ den Einfluss von Präkonzepten auf die Datenauswertung. „Probably most researchers who become grounded theorists (and certainly those who only use its procedures) have not reflected upon the assumptions that underlie our version of the method. Perhaps they assume that methodology evolves strictly from practice. Though it does to some degree, it is also considerably influenced by world view, beliefs and attitudes about the world we live in.” (Strauss & Corbin 2016: 131 f.).
 
29
Dabei ist die Analyse von Daten zu den Sinnzusammenhängen von sozialen Aktionen vornehmlich durch zwei Ebenen des Vorwissens des Forschers mitbestimmt: Einerseits ist der Forscher selbst Teil einer Sozialwelt und verfügt über ein Wissen zu alltäglichen Abläufen, andererseits ist der Blick auf soziale Phänomene durch wissenschaftliche „Denkstrukturen/-stile“ (Fleck 2012 [1980]) mit beeinflusst. In jedem Fall geht der Forscher mit einem bestimmten Fokus ins Feld, um die Wissens- und Verhaltensstrukturen der Akteure in alltäglichen Situationen zu rekonstruieren. Dabei zielt der Forscher darauf ab, Deutungen auf der Ebene der ‚Konstruktion erster Ordnung‘ – bei der der Wissenschaftler versucht, die Wirklichkeit aus der Sicht der Akteure lebensweltlich zu erfassen – durchzuführen, um dann eine theoretische Einordnung vorzunehmen und sich auf die Ebene der ‚Konstruktion zweiter Ordnung‘ eines abstrahierenden Beobachters zu begeben (vgl. Schütz 1971: 268).
 
30
Strauss & Corbin (2016) nehmen als philosophischen Unterbau für ihre Methodologie Bezug auf den Symbolischen Interaktionismus (Blumer 1969) als auch auf die Lehren des amerikanischen Pragmatismus (Dewey 1938 und Mead 1972).
 
31
Breuer verweist unter anderem auf „De-Zentrierungs- und Selbstreflexionstechniken“, die dem Gewahrwerden subjektiver persönlicher Nuancen im Forschungsprozess dienen (Breuer 2010: 122 f.).
 
32
In der soziologischen Forschung hat sich die Unterteilung von Theoriebildung aus empirischen Untersuchungen bzw. rein theoretischen Überlegungen in Theorien ‚kurzer, mittlerer und größerer Reichweite‘ etabliert. Mit der Untersuchung, basierend auf der Grounded Theory Methode, ist eine formale Theorie mittlerer Reichweite erzielbar (Glaser & Strauss 2005). Dementsprechend soll die sich ergebende formale ‚Theorie mittlerer Reichweite‘ Einfluss in die bereits gegebene Sozialtheorie ‚größerer Reichweite‘ finden. Dabei stellen die am konkreten und spezifischen Gegenstandsbereich entwickelten gegenstandsbezogenen Theorien das Bindeglied zwischen der Entwicklung und Formulierung einer formalen, in der Empirie verankerten Theorie dar. Aus mehreren gegenstandsbezogenen Theorien lässt sich schließlich eine formale Theorie entwickeln, welche durch einen hohen Allgemeinheitsgrad mit Rückgriff auf eine Vielzahl an empirischen Belegen gekennzeichnet ist. Die Entwicklung formaler Theorien beansprucht dabei, über die bloße Deskription des zu erforschenden Gegenstandbereiches hinaus zu gehen und allgemein gültige Zusammenhänge/Theorien zu einem Forschungsfeld zu formulieren (Lamnek 2005).
 
33
Die Transkription dient dazu das Material zu sichten und anhand einer ersten Reduktion von audiovisuellem Material auf schriftliche Daten, das Material übersichtlich zu gestalten und eine erste Kategorisierung vorzunehmen. Im Anschluss an eine detailliertere Kategorisierung können weitere Transkriptionsschritte anschließen. Bei der Lokalisation entscheidender Sequenzen kann eine einfache Transkription in eine Detailtranskription oder mikroanalytisch in eine Partiturtranskription verfeinert werden.
 
34
Das Transkriptionsverfahren ist demnach als inhaltlich-semantische Transkription ausgelegt und verzichtet auf die detaillierte Kenntlichmachung von Prosodie oder Intonation (vgl. hierzu Kuckartz et al. 2008).
 
35
Zur computergestützten qualitativen Datenanalyse siehe auch Kuckartz (2010).
 
36
QDA-Software hat sich mit ihren Vorteilen soweit in der Forschungslandschaft etabliert, dass sie mit der Option zur Bearbeitung großer und vielfältiger Datenvolumina sowie der detailgetreuen Mikroanalyse von Daten, zur Neukonzeption verschiedener Forschungszweige, wie der Videographie (Tuma et al. 2013) bzw. der ‚Soziologie des Visuellen‘ (Lucht et al. 2013/Tuma & Schmidt 2013) beigetragen hat.
 
37
Dabei handelt es sich einerseits um den Zugriff auf und um die Verknüpfung von übergeordneten Kategorien/Familien zueinander und andererseits um die Verknüpfung von Video- und Textdateien (Transkripten), die durch das Auswerten stocken lassen und eine visuelle Darstellung im Sinne einer Detail-/Partiturtranskription verhindern.
 
38
Bei ELAN (EUDICO Linguistic Annotator) handelt es sich um ein Videotranskriptionsprogramm, welches Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt wurde und kostenfrei zur Verfügung gestellt wird. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen und unterschiedliche Modalitäten der Interaktion in den Fokus nehmen. In der vorliegenden Arbeit wurden Version 4.7.3–5.3.0 verwendet.
 
Metadaten
Titel
Methodenteil
verfasst von
Ilona Straub
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-658-31384-5_6