Familienpsychologische Gutachten — Der Leitfaden · Hauptthema 6
Zehn Folgen über die beobachtenden und testdiagnostischen Methoden: Verhaltens- und Interaktionsbeobachtung nach Jacob, die wichtigsten Interaktionsverfahren, Bindungsdiagnostik vom Fremde-Situations-Test bis ins Schulalter, Testdiagnostik bei Kind und Eltern, die Verfälschungsproblematik — und der multimethodale Ansatz.
Lesezeit ca. 10 Minuten
Wir starten ins sechste Hauptthema. In Hauptthema 5 haben wir die Datenquellen Akte, Exploration, Anamnese, Kindesgespräch, Hausbesuch und Drittinformationen behandelt. Jetzt kommen wir zur zweiten großen Methodenfamilie: Verhaltens- und Interaktionsbeobachtung, Bindungsdiagnostik und Testverfahren. Wir beginnen heute mit den methodischen Grundlagen der Verhaltensbeobachtung.
Was Verhaltensbeobachtung leisten kann. Zumbach et al. formulieren die Bedeutung: Das Verhalten der zu begutachtenden Personen auf Individualebene während der Durchführung von Explorationen und Tests liefert zusätzliche Informationen zu relevanten Sorgerechts- und Kindeswohl- bzw. umgangsrelevanten Kriterien — etwa psychische Befindlichkeit, Entwicklungsstand, Konvergenzen und Differenzen im Verhalten gegenüber verschiedenen Personen. Gerade bei sehr jungen Kindern kann die Verhaltensbeobachtung wichtige kindbezogene Befunde liefern, die ansonsten aufgrund der altersbedingt eingeschränkten Explorationsfähigkeit in nur sehr geringem Ausmaß erhoben werden können (Zumbach et al. 2020, Kap. 4.2.1).
Das ist eine wichtige Aussage. Bei einem zweijährigen Kind kann man nicht 90 Minuten ein Explorationsgespräch führen. Aber man kann es beobachten — wie es spielt, wie es reagiert, wie es Aufmerksamkeit ausrichtet. Diese Verhaltensbeobachtung liefert Daten, die anders nicht zu bekommen wären.
Trennung Wahrnehmen und Bewerten. Hammesfahr formuliert eine zentrale methodische Regel: Wichtig ist hierbei „verhaltensnahes" Registrieren, bei dem eine klare Trennung zwischen Wahrnehmen und Registrieren der Beobachtungen auf der einen Seite und Bewertung der Beobachtungen auf der anderen Seite eingehalten wird (Hammesfahr, a.a.O., Rn. 298, mit Verweis auf Rohmann PDR 2009, 44).
Das ist die Grundregel: Erst wird beschrieben, was passiert ist. Erst dann wird interpretiert. Im Gutachten heißt das: Im Ergebnisteil steht die wertfreie Verhaltensbeschreibung. Erst im Bewertungsteil kommt die Interpretation. Salzgeber ordnet die Beobachtung als zentrale Methode ein: Neben dem Interview stelle die Verhaltens- und Interaktionsbeobachtung die wesentliche psychologische Erfassungsmethode dar; jede Verhaltensbeobachtung müsse — soweit sie für die gerichtliche Fragestellung bedeutsam ist — dokumentiert werden, etwa schriftlich, per digitaler Aufzeichnung oder durch Diktat unmittelbar nach der Beobachtung (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1335). Die eingesetzte Methode müsse geeignet und erforderlich sein und über eine Zufallswahrscheinlichkeit hinaus brauchbare Informationen liefern (Salzgeber, a.a.O., Rn. 1316).
Die Indikatoren nach Jacob. Zumbach et al. schlagen — Jacob 2016 folgend — eine kriteriengeleitete Beschreibung kindlichen Verhaltens anhand folgender Indikatoren vor: Vitalität — Aktivierung und Wachheit; Spiel — Initiative, Aufrechterhaltung, Beendigung, Spielarten; Ausrichtung von Aufmerksamkeit; Augenkontakt — Vermeidung, Aufrechterhaltung, Beendigung; Lautsignale — verbal, paraverbal; Körpergestik — speziell soziale Gesten; Reaktivität — Folgeverhalten; Verhalten bei situationsabhängigen Übergängen; Affekt — Ausdruck, Spiegelung und Abstimmung von Affekten, Affektregulation (Zumbach et al. 2020, Kap. 4.2.1, mit Verweis auf Jacob 2016).
Indikatoren der Elternperspektive. Jacob ergänzt für die Elternseite eine eigene Indikatorenliste: Rahmung — Zeit- und Lagestrukturgebung; Affektausdruck — mimisch, gestisch, vokalisierend, dynamisch; Wärme — Zärtlichkeit in Körperkontakt, Berührung und Körperposition; Lautäußerungen — Satzbau, Lautstärke, Tonhöhe, Tempo und Kontingenz; verbale Instruktion — Verständlichkeit, Wiederholung; verbale Restriktion — Häufigkeit und Ausprägung negativer Äußerungen; verbale Ermunterung — Häufigkeit und Ausprägung positiver Äußerungen; Authentizität — Passung von Verhalten und Erleben; Variabilität — Abwechslungsreichtum elterlichen Handelns; Sensitivität auf kindliche Signale (Jacob 2022, Kap. 1.3.1 und 1.3.2).
Das Drei-Stufen-Vorgehen. Zumbach et al. erläutern das methodische Vorgehen: Das beobachtete Verhalten wird zunächst interpretationsfrei beschrieben. Auf Basis dieser Verhaltensbeschreibung erfolgt eine Zuordnung zu den jeweiligen Indikatoren nach Jacob 2016. Aufbauend auf der Verhaltensbeobachtung und -beschreibung wird die übergreifende Verhaltensbeurteilung vorgenommen. Im schriftlichen Gutachten sollte sich die Verhaltensbeschreibung direkt an den Indikatoren orientieren. Die Verschriftlichung der Verhaltensbeurteilung erfolgt an späterer Stelle im Gutachten im Rahmen der Bewertung der Ergebnisse (Zumbach et al. 2020, Kap. 4.2.1).
Fallbeispiel Maria. Zumbach et al. demonstrieren das Vorgehen am Fallbeispiel der dreijährigen Maria, die in einer Pflegefamilie lebt — die Frage betrifft die Gefährdung des Kindeswohls bei Rückführung in den Haushalt der leiblichen Mutter. Im Rahmen eines Hausbesuchs im Haushalt der Pflegeeltern wurde im Kinderzimmer eine Spielsituation initiiert. Die wertfreie Beschreibung schildert: Maria reagierte prompt auf die Frage, ob sie ihr Zimmer zeigen wolle; sie nahm die Hand des Pflegevaters; sie machte mehrere Spielvorschläge; sie suchte mehrfach Augenkontakt zur Sachverständigen; sie reagierte mit Umarmung auf die Rückkehr des Pflegevaters.
Aus dieser Beschreibung erfolgt die Zuordnung zu den Indikatoren — Vitalität durch aktive Beteiligung; Initiative durch eigene Spielvorschläge; Augenkontakt mehrfach hergestellt; Körpergestik durch Handnehmen und Umarmung. Erst danach erfolgt die Bewertung: Maria zeigte in allen Beurteilungskategorien altersentsprechende Verhaltensweisen; deutlich ausgeprägt zeigte sich eine Fähigkeit zur Initiierung und Aufrechterhaltung sozialer Interaktionen mit einer ihr bislang unbekannten Person (Zumbach et al. 2020, Kasten 5).
Gütekriterien. Jeder Beobachtungsbefund muss an den klassischen Gütekriterien gemessen werden — Objektivität (Unabhängigkeit vom Beobachter), Reliabilität (Stabilität der Messung), Validität (das Verfahren misst, was es messen soll). Hammesfahr und Jacob weisen auf die methodischen Schwierigkeiten hin: Bei freier Verhaltensbeobachtung ist die Rater-Reliabilität tendenziell niedriger als bei standardisierten Verfahren.
Jacob formuliert: Die Auswahl geeigneter inhaltlich-funktionaler Kategorien sowie entsprechender Indikatoren sollte bereits vor der Beobachtung selbst erfolgen (Jacob, Interaktionsbeobachtung). Wer ohne Kategoriensystem beobachtet, beobachtet selektiv und bewertet bereits beim Beobachten.
Videoaufzeichnung. Zumbach et al. weisen auf eine wichtige methodische Verbesserung hin: Videoaufnahmen — nach vorliegendem Einverständnis der Beteiligten — ermöglichen die Auswertung des Materials auf Mikro- und Makroebene (Zumbach et al. 2020, Kap. 4.2).
Jacob ergänzt: Die Beobachtungssituationen sollten mittels Videotechnik aufgezeichnet werden. Videoaufnahmen setzen stets das Einverständnis der Sorgeberechtigten voraus, zudem müssen diese über die institutionell gültigen Datenschutzbestimmungen informiert werden. Besonderes Augenmerk sollte auf den Aspekt der Aufbewahrungsfrist sowie auf die Frage, ob die Videoaufzeichnungen auch gegenüber professionellen Dritten kommuniziert werden können, gelegt werden. Für beide Anliegen ist es notwendig, sich eine separate Einwilligung entsprechend der DSGVO einzuholen (Jacob, Kap. 8).
Offenheit als methodisches Gebot. Zumbach et al.: Durch die Rahmenbedingungen der Begutachtung festgelegt ist die offene Beobachtung — Transparenzkriterium (Zumbach et al. 2020, Kap. 4.2).
Heimliche Beobachtung — etwa ohne Wissen der Beteiligten — ist methodisch unzulässig. Die Eltern wissen, dass sie beobachtet werden. Dass dies die Authentizität der Beobachtung beeinflusst, ist hinzunehmen — der methodische Grundsatz der Transparenz wiegt schwerer.
Was Beteiligte tun können. Erstens: Schauen Sie im Gutachten nach, ob die Verhaltensbeschreibung wertneutral ist. Auftauchende interpretierende Adjektive — „die Mutter wirkte überfordert", „das Kind zeigte sich liebevoll" — sind im Ergebnisteil methodisch falsch platziert.
Zweitens: Achten Sie auf das Kategoriensystem. Wenn keine klaren Beobachtungskategorien benannt werden, ist die Beobachtung methodisch wenig kontrolliert.
Drittens: Bei Videoaufzeichnungen muss eine schriftliche DSGVO-Einwilligung vorliegen — auch zu Aufbewahrungsfrist und Weitergabe an Dritte. Das sollte im Akt dokumentiert sein.
Ausblick. In der nächsten Folge geht es um die Interaktionsbeobachtung — also nicht das Verhalten einer einzelnen Person, sondern das Zusammenspiel zwischen Elternteil und Kind. Welche Settings gibt es? Welche Verfahren?
Quellen
Lesezeit ca. 10 Minuten
Heute kommen wir zur Interaktionsbeobachtung. Sie ist nicht dasselbe wie die Verhaltensbeobachtung. Die Verhaltensbeobachtung beobachtet eine Person — wie verhält sich das Kind, wie verhält sich die Mutter. Die Interaktionsbeobachtung beobachtet das Zusammenspiel — was geschieht zwischen Elternteil und Kind.
Bedeutung der Interaktionsbeobachtung. Bei Fragen nach Erziehungsfähigkeit, Bindungsqualität und kindlichem Wohlbefinden ist die Interaktion zwischen Eltern und Kind das zentrale Untersuchungsobjekt. Hier zeigt sich, wie die Beziehung tatsächlich gelebt wird — jenseits dessen, was Eltern oder Kinder in der Exploration berichten.
Setting-Varianten nach Jacob. Jacob unterscheidet vier grundlegende Settings für die Interaktionsbeobachtung. Erstens: Labor — inszeniert. Hierzu zählt der Still-Face-Test nach Tronick et al. 1978, Führungs- und emotionale Aufgaben in der Heidelberger-Marschak-Interaktionsmethode (H-MIM) nach Franke und Schulte-Hötzel 2019 sowie ein strukturierter Ablauf analog der Fremden Situation. Zweitens: Labor — frei. Hierzu zählt das Eltern-Kind-Interaktions-Profil (EKIP) nach Alpermann und Koch 2006 sowie der CARE-Index nach Crittenden 2005. Drittens: natürlich — inszeniert. Hierzu zählen die H-MIM-Aufgaben in vertrauter Umgebung sowie die Münchner Klinische Kommunikationsskala (MKK). Viertens: natürlich — frei. Hierzu zählen Feinfühligkeitsbeobachtungen nach Grossmann und Grossmann 2008 oder die Video-Interventionstherapie (VIT) nach Downing 2003 (Jacob, Tab. 5.1).
Systematische vs. teilsystematische Beobachtung. Hammesfahr unterscheidet zwei Hauptklassen: In familiengerichtlichen Begutachtungen kommen systematische, standardisierte Interaktionsbeobachtungen und teilsystematische Interaktionsbeobachtungen zur Anwendung (Hammesfahr, a.a.O., Rn. 300, mit Verweis auf Klein/Sauer-Kramer PDR 2017, 131).
Systematische Interaktionsbeobachtungen wie der Fremde-Situations-Test nach Ainsworth für Kinder im zweiten Lebensjahr, die Still-Face-Methode oder die Heidelberger Marschak-Interaktionsmethode (H-MIM) finden unter standardisierten Bedingungen in kontrollierten Settings statt. Dabei werden den Beteiligten detaillierte, standardisierte Anweisungen bzw. „Aufgaben" erteilt, relativ kurze Interaktionssequenzen gefilmt und hochdetailliert ausgewertet (Hammesfahr, a.a.O., Rn. 300).
Stärken und Grenzen systematischer Verfahren. Hammesfahr formuliert eine wichtige methodische Spannung: Die Aussagekraft solcher unter streng kontrollierten Umgebungsbedingungen — „Laborbedingungen" — gewonnenen Daten im Hinblick auf die alltägliche Lebenssituation einer Familie ist begrenzt. Bei standardisierten Interaktionsbeobachtungen besteht das Risiko, dass die — durch Testinstruktionen und kontrollierte Bedingungen — stark limitierten Verhaltensmöglichkeiten der Eltern und der Kinder Daten erbringen, die kaum Rückschlüsse auf die alltäglichen Eltern-Kind-Interaktionen in vertrauter Umgebung zulassen (Hammesfahr, a.a.O., Rn. 300).
Das ist eine wichtige Einschränkung. Wer FST oder H-MIM einsetzt, gewinnt verlässliche Standarddaten — kann diese aber nicht ohne Weiteres auf den Alltag der Familie übertragen.
Teilsystematische Beobachtung. Hammesfahr beschreibt die Alternative: Teilsystematische Interaktionsbeobachtungen im alltäglichen Lebensumfeld der Familie bzw. in der Umgebung, in der die Eltern-Kind-Interaktion sonst auch stattfindet — etwa vertraute Räumlichkeiten beim begleiteten Umgang —, bieten Eltern und Kindern die Möglichkeit, ihr „typisches" Interaktions-, Beziehungs- und Erziehungsverhalten ohne einschränkende, verfremdende Vorgaben zu zeigen (Hammesfahr, a.a.O., Rn. 301).
Die Verhaltensbeobachtung ist hier flexibler, näher am Alltag — aber methodisch weniger kontrolliert. Das ist ein Trade-off zwischen Ökologische Validität und methodischer Strenge. Salzgeber benennt dieselbe Bandbreite: Das Verhalten könne frei, gezielt (teilstrukturiert) oder systematisch erfasst werden — im Spielzimmer mit Videoanlage, beim Hausbesuch oder auf dem Spielplatz, im Gespräch, in der Exploration oder anlässlich von Übergaben (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1335). Methodisch wichtig: Zwei Beobachtungen pro Elternteil ergäben validere Daten als nur eine (Salzgeber, a.a.O., Rn. 1388).
Aufgabenstellungen in der Praxis. Hammesfahr beschreibt typische Aufgabenstellungen: alltagsnahe Beschäftigungen wie Mahlzeiten, Gesellschaftsspiele, Basteln und Malen, Hausaufgabenbegleitung (Hammesfahr, a.a.O., Rn. 297).
Solche Aufgaben sind ökologisch valide. Sie zeigen Eltern und Kind in einer Situation, in der sie sonst auch interagieren — Vorlesen, ein Spiel spielen, etwas gemeinsam machen. Die Beobachtung erfasst hier real gelebtes Interaktionsverhalten.
Dreischritt der Durchführung. Hammesfahr formuliert den methodischen Ablauf in drei Schritten. Erstens — Sodann erfolgt die Beobachtung und Registrierung der Interaktion durch den Sachverständigen (Hammesfahr, a.a.O., Rn. 298). Hier gilt: verhaltensnahes Registrieren, klare Trennung zwischen Wahrnehmen und Bewerten.
Zweitens: Die Protokollierung der Interaktionsbeobachtungen erfolgt je nach Verfahren durch Videoaufzeichnung, Audioaufzeichnung ergänzt durch ein schriftliches Beobachtungsprotokoll oder nur durch ein ausführliches schriftliches Beobachtungsprotokoll (Hammesfahr, a.a.O., Rn. 298).
Drittens: Im letzten Schritt erfolgt die Auswertung der registrierten Daten auf der Basis des vorab festgelegten Kriteriensystems (Hammesfahr, a.a.O., Rn. 299). Das ist wichtig: Das Kriteriensystem wird vorab festgelegt — nicht erst, wenn man die Beobachtung gesehen hat.
Wertfreie Verlaufsbeschreibung. Hammesfahr formuliert die Anforderung an die Verlaufsbeschreibung: Die Verlaufsbeschreibung der Interaktionsbeobachtung erfolgt sprachlich im Präteritum — es wird diese beobachtete Sequenz zu diesem Zeitpunkt beschrieben, wie durch das Objektiv einer Kamera betrachtet. Hierbei ist streng darauf zu achten, dass an dieser Stelle — entsprechend der Trennung zwischen Ergebnisdarstellung und fachlicher Bewertung — keinerlei Generalisierungen und Bewertungen des beobachteten Verhaltens der Eltern und der Kinder vorgenommen werden. Der methodische Grundsatz der wertungsfreien Wiedergabe von Sachverhalten ist sprachlich nicht immer einfach, insbesondere bei der Verwendung von Adjektiven, die oftmals wertende Konnotationen beinhalten (Hammesfahr, a.a.O., Rn. 340–341).
So sollte beispielsweise bei der Beschreibung eines Tonfalls, mit dem ein Elternteil das Kind zurechtweist, besonders darauf geachtet werden, ein möglichst beschreibendes, wenig wertendes Adjektiv zu verwenden, ohne den Sinngehalt der Verhaltensbeschreibung zu „verwässern".
Was Beteiligte beachten können. Erstens: Schauen Sie, in welchem Setting die Interaktion beobachtet wurde — Labor, Praxisraum, Hausbesuch? Bei standardisierten Verfahren — FST, H-MIM, Still-Face — ist die Validität für den Alltag begrenzt. Das sollte im Gutachten reflektiert sein.
Zweitens: Schauen Sie, ob die Auswertungskriterien vorab benannt sind. Eine Beobachtung ohne klar definiertes Kriteriensystem ist methodisch schwer.
Drittens: Achten Sie auf wertneutrale Sprache in der Verlaufsbeschreibung. „Die Mutter wies das Kind in scharfem Tonfall zurecht" ist eine Wertung; „Die Mutter sagte mit erhobener Stimme: ..." ist Beschreibung.
Ausblick. In der nächsten Folge schauen wir uns die wichtigsten standardisierten Interaktionsbeobachtungsverfahren genauer an: EKIP, H-MIM, MKK, CARE-Index.
Quellen
Lesezeit ca. 10 Minuten
Heute schauen wir uns die wichtigsten standardisierten Interaktionsbeobachtungsverfahren konkret an. Sie sind methodisch unterschiedlich strukturiert — und liefern unterschiedliche Befunde. Wer wissen will, was sein Gutachten methodisch wert ist, muss diese Verfahren kennen.
EKIP — Eltern-Kind-Interaktions-Profil. Das Eltern-Kind-Interaktions-Profil (EKIP) wurde im Rahmen des sozial-emotionalen Entwicklungsscreenings für Säuglinge und Kleinkinder im Alter von null bis drei Jahren im Kontext der Eltern-Kind-Beziehung an der Fachhochschule Potsdam vorgestellt. Es basiert auf Skalen, die im Projekt zur Erweiterung des Mutter-Kind-Passes des Österreichischen Instituts für Familienforschung entwickelt worden sind (Jacob, Kap. 7; Ludwig-Körner/Alpermann/Koch 2006; Alpermann/Koch 2007).
Durchführung: Die Beobachtung der Eltern-Kind-Interaktion erfolgt anhand einer 5-10 minütigen Interaktionssequenz — wahlweise gemeinsames Spiel, Wickeln, Füttern — zwischen einem Elternteil und dem Kind. Falls beide Elternteile anwesend sind, sollten zwei dyadische Interaktionssequenzen beobachtet werden (Mutter-Kind plus Vater-Kind). Die Interaktionssequenz sollte videografiert und anhand der Videoaufnahme beurteilt werden (Jacob, Tab. 4.4 Manual).
Das EKIP umfasst elf bipolare und 9-stufige Skalen: Gesamteindruck; Qualität der Grundmelodie bzw. Tonart; Grundrhythmus; Promptheit der Reaktion; Lautstärke; Elterliche Sensitivität; Elterliche Kontrolle; Elterliche Akzeptanz der kindlichen Autonomie; Elterliche Aggressivität; Elterliche Flexibilität; Emotionale Authentizität und Spontaneität (Jacob, Kap. 7).
Bewertung: Praktikabel, gut beschrieben, klar strukturiert und technisch relativ einfach. Aber: Gütekriterien sind noch nicht ausreichend geprüft. Zur differenzierten Einschätzung kindlichen Verhaltens bedarf es weiterer Beobachtungsinstrumente (Jacob, Tab. 4.4).
H-MIM — Heidelberger Marschak-Interaktionsmethode. Die H-MIM wurde von Marianne Marschak in den USA entwickelt und von Ritterfeld und Franke (1994/2009) für den deutschsprachigen Raum übersetzt und weiterentwickelt (Franke & Schulte-Hötzel 2019). Sie deckt eine breite Altersspanne ab — vom ersten Lebensjahr bis ins junge Erwachsenenalter (Jacob, Kap. 4).
Dettenborn beschreibt: Die Heidelberger Marschak Interaktionsmethode (H-MIM) von Ritterfeld und Franke (1994) bietet Spielaufgaben, die vom Elternteil und Kind gemeinsam bewältigt und nach den Kriterien Emotionalität, Führung und Umgang mit Stress ausgewertet werden (Dettenborn). Die H-MIM strukturiert das Setting durch standardisierte Aufgaben und ermöglicht so eine hohe Beurteilungsübereinstimmung. Salzgeber zählt solche standardisierten Verfahren — ausdrücklich auch die H-MIM — zu den systematischen Interaktionsbeobachtungen und verlangt, dass jede Beobachtung dokumentiert wird (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1335). Bei der Auswahl solle der Sachverständige die beste verfügbare Methode und die aktuellste Version des Verfahrens wählen (Salzgeber, a.a.O., Rn. 1316).
MKK — Münchner Klinische Kommunikationsskala. Die Münchner Klinische Kommunikationsskala (MKK) nach Papoušek 1996 ist ein Instrument zur Erfassung der Eltern-Säuglings-Kommunikation. Das Manual und die Validierung finden sich bei Raudzus-Groden 2008 und Domogolla 2006 (Jacob, Tab. 4.10).
Design: Das Baby wird in einer Wippe in halb angelehnter Haltung positioniert. Die Anweisung lautet, dass die Mutter bzw. der Vater sich so mit dem Kind beschäftigen soll, wie sie es auch zu Hause tut — etwa wenn das Kind auf dem Wickeltisch liegt. Es werden keine Spielzeuge benutzt. Die Videoaufzeichnung dauert 5 Minuten (Jacob, Tab. 4.10, mit Verweis auf Sidor 2012, S. 475).
Das Instrument umfasst zwei Skalen — eine für das kindliche, eine für das elterliche Verhalten. Die Altersgruppe ist auf den 1. bis 6. Lebensmonat begrenzt. Die Reliabilität und Validität sind nach Jacobs Bewertung mittel bis hoch (Jacob, Tab. 4.10).
CARE-Index. Der CARE-Index wurde von Crittenden entwickelt und ist sprachunabhängig. Dettenborn beschreibt: Mittels Videobeobachtung einer Spielsituation wird der Child-Adult-Relationship-Index (CARE-Index) nach Crittenden 2005 erhoben, mit dem die Qualität einer Erwachsenen-Kind-Interaktion auch in Bezug auf die Feinfühligkeit sprachunabhängig beurteilt werden kann (Dettenborn).
Es gibt verschiedene Versionen: CARE-Index Infants für den Altersbereich 0-15 Monate (Crittenden 2004) und CARE-Index Toddlers für 15-36 Monate (Crittenden 2006). Auch eine Vorschulversion existiert für 3-6 Jahre (Künster 2007). Die Ratertraining ist aufwendig und kostenintensiv. Die Gütekriterien sind nach Jacobs Bewertung gut überprüft (Jacob, Tab. 4.3, Bewertung 8 von 10).
Vergleichende Übersicht nach Altersgruppen. Jacob hat eine Tabelle 6.1 erstellt, die die wichtigsten Verfahren nach Altersgruppen sortiert und mit einer 10-Punkte-Skala bewertet. Das Lausanner Trilogspiel (LTP, Schwinn 2008) erhält 9 Punkte und ist damit eines der bestbewerteten Verfahren. CARE-Index, H-MIM und MKK erhalten 8 Punkte. EKIP erhält 7 Punkte. Feinfühligkeitsbeobachtung nach Grossmann/Grossmann erhält nur 3 Punkte — vor allem wegen unscharfer Beobachtungsdaten (Jacob, Tab. 6.1).
MAD-J — 4-Komponenten-Modell. Jacob und Wahlen 2006 haben mit dem Multiaxialen Diagnosesystem Jugendhilfe (MAD-J) ein 4-Komponentenmodell entwickelt, das eine Systematik bietet, um sich differenziert spezifische Beobachtungsindikatoren zu erschließen. Das Modell umfasst: Verhaltenssysteme — Pflege, Strukturierung, Sicherheit, Orientierung und Anregung; elterliche Interaktionsmechanismen nach Keller — ungeteilte/geteilte Aufmerksamkeit, Sensitivität für positive/negative Signale, Kontingenz auf positive/negative Signale; affektives Klima; und Erziehungsfähigkeit als Ganzes (Jacob, Kap. 8.2.2).
Was Beteiligte tun können. Erstens: Schauen Sie, welches Verfahren eingesetzt wurde. Wenn der Sachverständige H-MIM oder CARE-Index nennt, ist das methodisch gut belegt. Wenn er ein selbst entwickeltes, nicht standardisiertes Verfahren einsetzt, sollte das begründet sein.
Zweitens: Achten Sie auf die Altersgruppen-Eignung. CARE-Index Infants ist für 0-15 Monate — wenn der Sachverständige ihn bei einem fünfjährigen Kind einsetzt, ist das methodisch fragwürdig.
Drittens: Schauen Sie auf das Ratertraining. Wenn der Sachverständige ein Verfahren ohne entsprechendes Training anwendet — etwa CARE-Index ohne Crittenden-Training oder H-MIM ohne Schulung —, ist die Auswertungsobjektivität nicht gewährleistet.
Viertens: Wenn das Gutachten allein auf eine Interaktionsbeobachtung gestützt ist, ist das methodisch riskant. Jacob formuliert ausdrücklich: Urteilsbildung ausschließlich mittels einer Messung ist nicht ausreichend; es bedarf noch weiterer Messungen bzw. anderer Verfahren (Jacob, Tab. 4.3 zum CARE-Index).
Ausblick. In der nächsten Folge geht es um die Bindungsdiagnostik im engeren Sinne — Fremde-Situations-Test, Bindungsmuster A/B/C/D, Still-Face-Paradigma. Hier liegen die theoretischen Grundlagen der Bindungstheorie.
Quellen
Lesezeit ca. 10 Minuten
Heute kommen wir zum Kern der Bindungsdiagnostik im Säuglings- und Kleinkindalter: dem Fremde-Situations-Test von Ainsworth, der Klassifikation der Bindungsmuster und dem Still-Face-Paradigma. Diese Verfahren sind methodische Klassiker — und sie tauchen in vielen Gutachten auf.
Die Fremde Situation nach Ainsworth. Dettenborn beschreibt das klassische Verfahren: Das erste und bekannteste Verfahren zur Beobachtung von Bindungsverhalten in einer gestalteten Situation ist die „Fremde Situation" nach Ainsworth u. a. (1969) für Kinder ab dem zweiten Lebensjahr. Hier wird das Verhalten eines Kindes nach zwei kurzen Trennungen von einer Bindungssituation beobachtet und einem der Bindungsmuster zugeordnet (Dettenborn).
Staub erläutert das Setting genauer: Bei 1- bis 3-jährigen Kindern lässt sich die Bindungsqualität mit einem standardisierten Untersuchungsverfahren relativ zuverlässig erfassen. Das Feinfühligkeitsverhalten der Bezugspersonen ist aus dem Bindungsverhalten des Kindes ableitbar. Der Test ist einer Wartezimmersituation beim Arzt nachempfunden. In vier bis acht Episoden von je drei Minuten wird das Bindungsverhalten durch eine zweimalige kurze Trennung von der primären Bezugsperson in fremder Umgebung aktiviert und nach der Wiedervereinigung mit der Bezugsperson untersucht (Staub, Kap. 10.7.1; Grossmann/Grossmann 2003).
Die vier Bindungsmuster. Zumbach et al. nennen die vier klassischen Bindungsmuster: Die Kinder werden anhand der Fremden Situation Bindungsmustern zugeordnet — Sicher (B), Unsicher-vermeidend (A), Unsicher-ambivalent (C), Desorganisiert/Desorientiert (D) (Zumbach et al. 2020, Kap. 4.2.3).
Sicher gebunden — Typ B. Dettenborn beschreibt das sichere Bindungsmuster: Bei sicherer Bindung zeigen Kinder nach der Trennung kaum Kummer. Nach Wiederkehr der Bindungsperson suchen und behalten sie Nähe und Kontakt zur Bezugsperson. Sie wird gegenüber der fremden Person und den Spielsachen präferiert. Körperlicher Kontakt wird entspannt angenommen (Dettenborn).
Unsicher-vermeidend — Typ A. Kinder mit vermeidend-unsicherer Bindung neigen eher dazu, die Bezugsperson nach Wiederkehr zu ignorieren oder gar zu meiden — sie also nicht zur Regulation zu nutzen. Bei Zuwendung — etwa Aufnehmen des Kindes — oder Abwendung — etwa Absetzen — wirken sie eher passiv. Auf physiologischer Ebene sind aber Stress-Symptome nachweisbar (Dettenborn).
Unsicher-ambivalent — Typ C. Kinder mit ambivalent-unsicherer Bindung reagieren in den Phasen des Weggangs der Bezugsperson lautstark und mit negativen Affekten — Wut. Bei Wiederkehr suchen sie einerseits Kontakt und Nähe, andererseits widersetzen sie sich auch Kontaktversuchen der Bezugsperson. Sie verhalten sich ambivalent. Die Rückkehr zum explorativen Verhalten ist eingeschränkt (Dettenborn).
Desorganisiert — Typ D. Das vierte Muster — Desorganisation/Desorientiertheit — wurde von Main und Solomon ergänzt. Kinder zeigen hier widersprüchliche Verhaltensweisen: gleichzeitig Annäherung und Erstarren, oder fragmentierte Bewegungsabläufe. Bindungsdesorganisation wird oft mit traumatischen Beziehungserfahrungen in Verbindung gebracht (vgl. Zumbach et al. 2020, Kap. 4.2.3).
Still-Face-Paradigma. Zumbach et al. nennen als zweites zentrales Verfahren das Still-Face-Paradigma — ursprünglich für 2-20 Wochen entwickelt von Tronick, Als, Adamson, Wise und Brazelton 1978. Es ist ein Beobachtungsverfahren für sehr junge Säuglinge (Zumbach et al. 2020, Tabelle 9).
Das Setting: Die Bezugsperson interagiert zunächst normal mit dem Säugling, dann hält sie für etwa zwei Minuten ein ausdrucksloses, neutrales Gesicht — den „Still Face" —, dann wird die Interaktion wieder aufgenommen. Das Verhalten des Säuglings in dieser Sequenz zeigt, wie er auf den plötzlichen Abbruch der Reziprozität reagiert und wie er sich anschließend wieder regulieren lässt.
H-MIM und H-MIM-Erweiterung als bindungsdiagnostische Methoden. Hammesfahr nennt FST, Still-Face und H-MIM in einer Reihe: Systematische Interaktionsbeobachtungen wie der Fremde-Situations-Test nach Ainsworth für Kinder im zweiten Lebensjahr, die Still-Face-Methode oder die Heidelberger Marschak-Interaktionsmethode (H-MIM) finden unter standardisierten Bedingungen in kontrollierten Settings statt (Hammesfahr, a.a.O., Rn. 300, mit Fn. 552-554).
Crittenden CARE-Index als bindungsdiagnostische Erweiterung. Dettenborn nennt eine wichtige Erweiterung: Mittels Videobeobachtung einer Spielsituation wird der CARE-Index nach Crittenden 2005 erhoben, mit dem die Qualität einer Erwachsenen-Kind-Interaktion auch in Bezug auf die Feinfühligkeit sprachunabhängig beurteilt werden kann (Dettenborn). Es gibt auch Modifikationen der „Fremden Situation" wie die „Clown-Session" nach Main und Weston 1981, „Attachment Organisation in Preschool Children" von Cassidy und Marvin (Marvin 2001), oder „The Preschool Assessment of Attachment" von Crittenden 1994 (Dettenborn).
Aufwand und Grenzen. Dettenborn betont: Die Methode ist aufwendig und auf eine begrenzte Altersspanne bezogen. Die Einordnung der beobachteten Verhaltensweisen in dafür entwickelte Kategoriensysteme setzt Training voraus. Das Gleiche gilt für Variationen des „Fremde Situation"-Tests (Dettenborn).
Das ist wichtig: Wer FST anwendet, muss geschult sein. Das ist nicht ein Standardverfahren, das jeder Sachverständige aus dem Stand durchführen kann. Eine wissenschaftlich saubere FST-Auswertung erfordert spezifische Trainings. Salzgeber beschreibt das Design entsprechend: Die explizite Bindungsdiagnostik im Sinne der Bindungstheorie erfordere ein spezielles Setting — das etwa einjährige Kind wird für rund fünfzehn Minuten von der Bezugsperson getrennt, und bei deren Rückkehr wird die Reaktion des Kindes beobachtet, wobei darauf zu achten ist, das Kind nicht in eine zu starke Stresssituation zu bringen (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1392). Da eine einzelne Beobachtung störanfällig ist, gilt: Zwei Beobachtungen pro Elternteil ergeben validere Daten als nur eine (Salzgeber, a.a.O., Rn. 1388).
Methodische Einordnung. Zumbach et al. ordnen die Verfahren so ein: Bei Säuglingen und Kleinkindern erfolgt die Bindungsdiagnostik auf der Verhaltensebene mittels Interaktionsbeobachtungen von Elternteil und Kind, meist unter Zuhilfenahme von Videoaufnahmen. Die Auswertung erfolgt anhand bindungsspezifischer Beobachtungsskalen mit dem Ergebnis einer qualitativen Einschätzung. Ainsworth und Wittig (1969) entwickelten mit der „Fremden Situation" die klassische Laborbeobachtungsmethode zur Erfassung der Bindungsmuster im Alter von 11 bis 20 Monaten (Zumbach et al. 2020, Kap. 4.2.3).
Was Beteiligte beachten können. Erstens: FST ist altersbegrenzt. Bei Kindern jenseits des dritten Lebensjahres ist er nicht mehr das Mittel der Wahl — dann kommen andere Verfahren zum Einsatz, die wir in der nächsten Folge behandeln.
Zweitens: Die Bindungsmuster A/B/C/D sind eine Klassifikation der Bindungs-Qualität. Sie sind kein moralisches Urteil über die Eltern. Ein unsicher-vermeidendes Bindungsmuster ist ein Ergebnis von Wechselwirkungen — nicht eine Eigenschaft der Mutter oder des Kindes.
Drittens: Wenn ein Gutachten von „Bindungsstörung" spricht, sollte das klar von „unsicherem Bindungsmuster" unterschieden werden. Bindungsstörungen nach ICD-10 — reaktive Bindungsstörung F94.1 oder Bindungsstörung mit Enthemmung F94.2 — sind klinische Diagnosen mit spezifischen Kriterien. Sie sind nicht dasselbe wie unsichere Bindungsmuster.
Ausblick. In der nächsten Folge geht es um die Bindungsdiagnostik im Vorschul- und Schulalter. FST funktioniert dort nicht mehr — andere Verfahren wie GEV-B, SAT und BISK kommen zum Einsatz.
Quellen
Lesezeit ca. 10 Minuten
In der letzten Folge ging es um Bindungsdiagnostik bei Säuglingen und Kleinkindern. Heute schauen wir uns die Verfahren für ältere Kinder an. Ab etwa drei Jahren funktioniert der Fremde-Situations-Test nicht mehr — andere Methoden treten an seine Stelle.
Der entwicklungsbedingte Wechsel der Methoden. Dettenborn formuliert: Verinnerlichte Erwartungsmuster sind ab circa 3 Jahren handlungswirksam und können über das Spiel, über Zeichnungen und zunehmend auch über die Sprache vermittelt werden. Je nach Alter und Vorlieben des Kindes wendet man entsprechende Methoden an (Staub, Kap. 10.7.1).
FST für Vorschulkinder. Zumbach et al. nennen für den Altersbereich 2;5 bis 5;5 Jahre den Fremde-Situations-Test für Kindergarten- und Vorschulkinder (Zumbach et al. 2020, Tabelle 9). Dies ist eine Adaptation des klassischen Verfahrens für ältere Kinder — auch hier mit Trennung und Wiedervereinigung.
GEV-B — Geschichtenergänzungsverfahren zur Bindung. Zumbach et al. beschreiben für den Altersbereich 5-8 Jahre: Geschichtenergänzungsverfahren zur Bindung 5- bis 8-jähriger Kinder (GEV-B; Gloger-Tippelt & König, 2016) (Zumbach et al. 2020, Tabelle 9).
Staub erläutert das Setting: Mit Spielmaterial und Puppenfiguren spielt man dem Kind den Anfang von fünf Geschichten szenisch vor. Anschließend wird das Kind aufgefordert, die Geschichte zu Ende zu erzählen. Es handelt sich um bindungsaktivierende Geschichten mit ungelöstem Konflikt oder kleineren Schadenshandlungen des Kindes — etwa Verschütten von Saft, Abschied von den Eltern, Schmerz durch Sturz, Furcht vor Monstern im Kinderzimmer. Die von den Kindern inszenierten Reaktionen der Puppen-Eltern und die entsprechenden Gefühle des Puppen-Kindes lassen Rückschlüsse auf die Feinfühligkeit der realen Eltern und auf das Bindungsmuster der Kinder zu (Staub, Kap. 10.7.1, mit Verweis auf König/Gloger-Tippelt/Zweyer 2007).
SAT — Separation Anxiety Test. Zumbach et al. nennen für den gleichen Altersbereich ein weiteres Verfahren: Separation Anxiety Test (SAT; Main et al., 1985) (Zumbach et al. 2020, Tabelle 9).
Beim SAT handelt es sich um ein bildgestütztes projektives Verfahren: Die Kinder werden aufgefordert, zu Bildern, auf denen bindungsrelevante Situationen dargestellt sind — in der Regel Trennungssituationen —, Empfindungen und Ausgänge aus der Situation zu formulieren. Die Auswertung erfolgt auf Basis von Videoaufnahmen oder Transkriptionen (Zumbach et al. 2020, Kap. 4.2.3, mit Verweis auf Main, Kaplan & Cassidy 1985).
BISK — Bindungsinterview für die späte Kindheit. Hammesfahr erläutert: Das Bindungsinterview für die späte Kindheit (BISK) ist ein halb-strukturiertes Interview, das mentale Strukturen der Bindungsrepräsentationen und der Bindungsverhaltensstrategien von Kindern und Jugendlichen ab dem achten Lebensjahr erfasst. Die Klassifikation erfolgt beziehungsspezifisch, also für jede Bindungsperson separat. Die Fragen zielen auf die emotionale Verfügbarkeit und die Effektivität der emotionalen Regulationsfähigkeit der Bindungsperson sowie auf die Bindungsverhaltensstrategien des Kindes ab. Unterschieden werden sichere, unsicher-vermeidende und unsicher-ambivalente Bindungen zu jeder Bindungsperson sowie Bindungsdesorganisation (Hammesfahr, a.a.O., Rn. 287, mit Verweis auf Zimmermann/Scheuerer-Englisch 2003).
Auswertungskriterien sind die Bindungsstrategien bei emotionaler Belastung, die Schilderung der elterlichen Fürsorge sowie die Offenheit des Berichts über negative Emotionen — wie weit das Kind Gefühle von Angst, Kummer, Hilflosigkeit seinen Bezugspersonen gegenüber offen zeigen kann (Hammesfahr, a.a.O., Rn. 287).
CAI — Child Attachment Interview. Zumbach et al. nennen für die gleiche Altersgruppe ein zusätzliches Verfahren: Child Attachment Interview (CAI; Target et al., 2003) (Zumbach et al. 2020, Tabelle 9).
AAI für Jugendliche und Erwachsene. Ab 16 Jahren — modifiziert — und ab 18 Jahren in der Vollversion kommt das Adult Attachment Interview (AAI; George, Kaplan & Main, 2001) zum Einsatz. Es ist das klassische Verfahren zur Erfassung von Bindungsrepräsentationen bei Erwachsenen — und kann auch bei Eltern eingesetzt werden, um deren eigene Bindungsmuster zu erfassen, die ihre Erziehungsfähigkeit prägen. Zumbach et al. nennen es in Tabelle 9 (Zumbach et al. 2020).
Bei der Auswertung wird nicht die Erfahrung selbst kodiert, sondern deren Verarbeitung und aktuelle Bewertung sowie die Kohärenz der präsentierten Lebensgeschichte. Inkohärente Aussagen werden als Hinweis auf unverarbeitete, negative Bindungserfahrungen gesehen (Zumbach et al. 2020, Kap. 4.2.3).
Fehlerquellen der Bindungsdiagnostik. Staub widmet diesem Thema ein eigenes Kapitel (Kap. 10.7.2). Sie nennt zentrale Fehlerquellen — die wir in einer eigenen Folge der späteren Hauptthemen vertiefen, aber heute schon kurz benennen: Trennungsangst — Wenn ein Kind permanenten Konflikten zwischen den Eltern ausgesetzt ist, stellen sich Trennungsängste ein, weil dem Kind immer bewusster wird, dass sich die Eltern wahrscheinlich bald trennen werden (Staub, Kap. 10.7.2).
Dettenborn ergänzt zwei klassische Beobachtungsfehler: Das Verwechseln von Angst mit Bindung — Wenn ein Kind die Trennung der Eltern erleben musste, setzen oft Trennungsängste ein, weil es den Verlust der elterlichen Einheit erlebt und weitere Verluste befürchtet. Das Kind reagiert mit verstärktem Bindungsverhalten — etwa mit Suchen von Nähe bis hin zum „Klammern" bei jüngeren Kindern. Daraus auf sichere Bindung zu schließen, hieße, den wirklichen Zusammenhang zu übersehen. Und: Das Verwechseln von Trennungsreaktion und Bindungsmangel — Vernachlässigte und misshandelte Kinder wirken vordergründig oft emotional nicht gebunden und wenig belastet, sondern eher unbeteiligt (Dettenborn, Kap. 2.3.2.5).
Mehrfachindikation und Aggregation. Dettenborn formuliert eine zentrale methodische Regel der Bindungsdiagnostik: Geboten ist, immer mehrere Indikatoren zu integrieren — Prinzip der Aggregation — und kein Ergebnis isoliert zu bewerten. Weinen eines Kindes im Kontakt mit einer Bezugsperson kann ein Anzeichen für misslungene Regulation und damit unsichere Bindung sein, aber auch aktiviertes Bindungsverhalten im Rahmen einer sicheren Bindung anzeigen (Dettenborn).
Ergibt sich — wie nicht selten festzustellen — kein ausreichender Hinweis auf eines der Bindungsmuster, sollte das klar ausgedrückt werden. Die Sicherheit der Diagnose steigt mit der Menge der Beobachtungen und der Vielfalt der Beobachtungssituationen, in denen Bindungsverhalten aktiviert wird (Dettenborn).
Eingeschränkter Forschungscharakter. Staub weist auf eine wichtige Einschränkung hin: Diese Instrumente wurden aber für die Forschung entwickelt und sind zur Diagnostik in familienrechtspsychologischen Fragen nur sehr begrenzt anwendbar. Standardisierte Methoden, die sich zur Einzelfalldiagnostik eignen, sind die Ausnahme. Dem bindungstheoretisch erfahrenen Gutachter dienen die vorhandenen Instrumente als Grundlage für die Einzelfalldiagnostik, welche die Verhaltensbeobachtung sinnvoll ergänzen (Staub, Kap. 10.7). Salzgeber bewertet die hier verwendeten projektiven Zugänge zurückhaltend: Objektive und valide Daten ließen sich mit projektiven Verfahren nicht gewinnen; ihr Vorteil liege darin, dass Kinder ihre Erfahrungen und Bedürfnisse in diesen Medien ausdrücken und dies als Grundlage für ein vertieftes Gespräch dienen kann (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1386). Der Stellenwert (semi-)projektiver Tests in der Beziehungsdiagnostik — als Explorationshilfe und hypothesenlieferndes Verfahren — sei im Wesentlichen unbestritten (Salzgeber, a.a.O., Rn. 1332).
Was Beteiligte beachten können. Erstens: Bei Kindern jenseits des dritten Lebensjahres erwarten Sie nicht den klassischen FST. Wenn er dort dennoch angewandt wird, ist das methodisch fragwürdig.
Zweitens: GEV-B und SAT sind projektive Verfahren — mit allen Vorbehalten, die dafür gelten. Bei der Auswertung gibt es Interpretationsspielräume. Das sollte im Gutachten reflektiert sein.
Drittens: Wenn der Sachverständige Bindungsmuster diagnostiziert, sollte das auf mehreren Indikatoren beruhen — nicht auf einer einzigen Beobachtung. Das Aggregationsprinzip ist auch in der Bindungsdiagnostik zentral.
Ausblick. In der nächsten Folge wechseln wir das Methodenfeld. Wir kommen zur Testdiagnostik beim Kind — welche Verfahren gibt es, was leisten sie, was sind ihre Grenzen?
Quellen
Lesezeit ca. 10 Minuten
Heute kommen wir zur Testdiagnostik beim Kind. Welche Verfahren gibt es? Wann ist ihr Einsatz gerechtfertigt — und wann nicht? Hier gilt eine besonders strenge Regel: Testdiagnostik beim Kind muss immer aus der Beweisfrage abgeleitet sein.
Die Grundregel. Hammesfahr formuliert die Grundregel zur Auswahl von Testverfahren: Die angewandten Testverfahren müssen auf die für die Beantwortung der gerichtlichen Fragestellung relevanten Daten abgestellt sein. Die Anwendung von Testverfahren ohne jeden Bezug zur gerichtlichen Fragestellung — etwa die Anwendung klinisch-psychologischer Fragebögen, Persönlichkeitstests, Intelligenztests ohne jeden Hinweis auf psychische Auffälligkeiten der Eltern und/oder des Kindes — ist nicht zulässig (Hammesfahr, a.a.O., Rn. 256, mit Verweis auf Kannegießer PDR 2022, 159, 170).
Dettenborn formuliert das so: Der Einsatz psychologischer Methoden unterliegt dem aus dem Rechtsstaatsprinzip folgenden Verhältnismäßigkeitsgrundsatz. Sie müssen geeignet, erforderlich und angemessen sein. Diagnostische Verfahren, die keinen Bezug zur gerichtlichen Fragestellung erkennen lassen — etwa die routinierte Anwendung von Testbatterien —, sind unzulässig, da sie sowohl berufsethisch als auch rechtlich einen unzulässigen Eingriff in die Persönlichkeitsrechte des Betroffenen darstellen (Dettenborn).
Persönlichkeitsdiagnostik nur bei Hinweisen. Hammesfahr betont: Persönlichkeitsdiagnostik sollte ausschließlich bei Hinweisen auf persönlichkeitsbedingte Einschränkungen von Eltern zum Einsatz kommen, da sie in die Persönlichkeitsrechte eingreift (Hammesfahr, a.a.O., Rn. 256, mit Verweis auf Kannegießer PDR 2022, 159, 170). Salzgeber unterlegt die Verhältnismäßigkeit: Testpsychologische Verfahren seien nur passend zur gerichtlichen Fragestellung anzuwenden; das Verhältnismäßigkeitsgebot verbiete die Erforschung der gesamten Familienverhältnisse, und bei Fragen der Kindeswohlgefährdung seien Tests nur bei erheblichen Abweichungen vom Normalverhalten einzusetzen (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1318). Welche kindbezogenen Verfahren in Betracht kommen, richte sich nach der Fragestellung — bei § 1666 BGB häufig solche zum Entwicklungsstand (Salzgeber, a.a.O., Rn. 1331).
Das gilt analog für Tests am Kind. Sie sind nur dann zulässig, wenn aus der Beweisfrage oder aus vorliegenden Akten Hinweise auf Auffälligkeiten beim Kind bestehen, die durch Tests geklärt werden müssen. Ein Routinetest „Familie in Tieren" bei jedem Kind, das begutachtet wird, ist methodisch nicht gerechtfertigt.
Gütekriterien der Testverfahren. Hammesfahr formuliert die methodischen Anforderungen: Bei der Anwendung standardisierter Verfahren sind solche Verfahren auszuwählen, die nachweislich über eine hohe Qualität hinsichtlich der Hauptgütekriterien Objektivität, Reliabilität und Validität und der Nebengütekriterien — insbesondere Zumutbarkeit und Unverfälschbarkeit — verfügen. Wenn eine normorientierte Interpretation der Testwerte vorgesehen ist, ist bei der Auswahl des Testverfahrens darauf zu achten, dass die dem Verfahren zugrunde liegende Eichstichprobe zur Fragestellung passt und hinreichend aktuell ist (Hammesfahr, a.a.O., Rn. 267, mit Verweis auf Qualitätsstandards des Diagnostik- und Testkuratoriums der Föderation Deutscher Psychologenvereinigungen).
Der „Testorteffekt". Hammesfahr weist auf einen wichtigen methodischen Befund hin: Daten aus dem Projekt zur Generierung sinnvoller Referenzstichproben der Universität Hamburg weisen auf die Existenz eines „Testorteffekts" hin — eines erheblichen und systematischen Einflusses des Orts der Testung auf die Testergebnisse — dergestalt, dass der Elternteil, in dessen Haushalt die Testdurchführung erfolgte, in vielen Subskalen der Testverfahren SURT, SKEI und EBF-KJ potentiell positiver bewertet wurde. Die Explorationen und Testdurchführungen mit den Kindern sollten daher nicht im Haushalt nur eines Elternteils stattfinden (Hammesfahr, a.a.O., Rn. 257, mit Verweis auf Bodansky/Johannsen/Schubert/Preuss/Liedtke PDR 2022, 125).
Es kann zudem sehr aufschlussreich sein, die Kinder in beiden elterlichen Haushalten zu explorieren, um eventuelle Einflüsse dieser Umgebungsbedingungen auf die Angaben der Kinder erfassen zu können.
Verfahren zur Beziehungs- und Bindungsdiagnostik. Hammesfahr nennt mehrere Verfahren zur Diagnostik der Eltern-Kind-Beziehung: das Strukturierte Interview zur Erfassung der Kind-Eltern-Interaktion (SKEI; Skatsche/Buchegger/Schulter/Papousek); die Sorge- und Umgangsrechtliche Testbatterie (SURT; Hommers); den Familien-Identifikations-Test (FIT); das Erziehungsstilinventar (ESI); den Elternbildfragebogen für Kinder und Jugendliche (EBF-KJ); das Geschichtenergänzungsverfahren zur Bindung (GEV-B); das Bindungsinterview für die späte Kindheit (BISK) (Hammesfahr, a.a.O., Rn. 280–287).
SURT — Sorge- und Umgangsrechtliche Testbatterie. Hammesfahr beschreibt: Die SURT ist in drei Untertests aufgegliedert: Projektiver-Familien-Szenen-Test (PFST) — Erzählen von familiären Alltagssituationen und Zuordnung von Tierkarten für Mutter und Vater; Semi-Projektive Entscheidungsfragen (SPEF); und Elternwahrnehmungsunterschiede (EWU). Die SURT verbindet projektive Beziehungsdiagnostik mit einer psychometrischen Auswertungsgrundlage (Hammesfahr, a.a.O., Rn. 281).
Entwicklungsdiagnostik. Hammesfahr nennt: Der Entwicklungstest für Kinder von sechs Monaten bis sechs Jahren (ET 6-6) ist ein hochstandardisiertes Verfahren zur Erhebung des Entwicklungsstands. Das Verfahren erfasst die Abweichung der Entwicklung eines Kindes von einer Normstichprobe Gleichaltriger in den Bereichen Körpermotorik, Handmotorik, kognitive Entwicklung und Sprache sowie sozial-emotionale Entwicklung (Hammesfahr, a.a.O., Rn. 291).
Der ET 6-6-R ist in 13 Altersgruppen unterteilt. Für jede Altersgruppe wird aus insgesamt 166 Aufgaben eine altersspezifisch passende Zusammenstellung vorgenommen. Die sozial-emotionale Entwicklung wird durch Elternauskunft erhoben. Die standardisiert gemessenen Indikatoren der Abweichungen besitzen eine hohe prognostische Validität für Entwicklungsauffälligkeiten.
Ressourcen- und Belastungsdiagnostik. Der Fragebogen zu Ressourcen im Kindes- und Jugendalter (FRKJ 8-16) ist ein Selbstbeurteilungsinstrument und erfasst anhand von 60 Items individuelle und soziale Ressourcen — Empathie, Selbstwirksamkeit, Selbstwertschätzung, Kohärenzsinn, Optimismus, Selbstkontrolle, elterliche soziale und emotionale Unterstützung, autoritativer Erziehungsstil, Integration in die Peergruppe, schulische Integration. Diese Ressourcen werden als Schutzfaktoren aufgefasst (Hammesfahr, a.a.O., Rn. 292, mit Verweis auf Lohaus/Nussbeck).
Psychopathologie-Diagnostik beim Kind. Bei Hinweisen auf psychische Auffälligkeiten beim Kind stehen u.a. zur Verfügung: Depressionsinventar für Kinder und Jugendliche (DIKJ) im Alter von 8 bis 16 Jahren; Differentieller Aggressionsfragebogen (DAF) für 10- bis 17-Jährige; Child Behavior Checklist (CBCL 1,5-5 und CBCL 4-18); Interview zu Belastungsstörungen bei Kindern und Jugendlichen (IBS-KJ) für 7-16 Jahre (Hammesfahr, a.a.O., Rn. 293–294).
Was Beteiligte tun können. Erstens: Schauen Sie, ob die Testanwendung beim Kind aus der Beweisfrage abgeleitet wurde. Wenn es um Umgangsregelung geht — wofür braucht es einen Intelligenztest? Wenn nicht hinreichend begründet, ist das ein methodischer Mangel.
Zweitens: Achten Sie auf die Eichstichprobe der Verfahren. Aktualität und Passung sind wichtig — ein Verfahren mit einer 30 Jahre alten Eichstichprobe ist methodisch problematisch.
Drittens: Bei projektiven Verfahren erwarten Sie eine kritische Reflexion. Das vertiefen wir in der nächsten Folge.
Ausblick. In der nächsten Folge geht es um die Testdiagnostik bei Eltern — Erziehungsverhalten, IDEE, EFB, EBI, MAD-J. Welche Verfahren gibt es zur Erfassung elterlicher Erziehungsfähigkeit?
Quellen
Lesezeit ca. 10 Minuten
Heute kommen wir zur Testdiagnostik bei Eltern. Es gibt mehrere Verfahren zur Erfassung des elterlichen Erziehungsverhaltens — IDEE, EFB, EBI, MAD-J. Sie alle zielen darauf, eine empirische Datenbasis für die Bewertung der Erziehungsfähigkeit zu liefern.
IDEE — Interviewleitfaden zur Diagnostik von Elterlichem Erziehungsverhalten. Zumbach et al. erläutern: Mit dem Interviewleitfaden zur Diagnostik von Elterlichem Erziehungsverhalten (IDEE; Jacob & Schiel, 2010) liegt ein Interviewleitfaden zur Erfassung elterlichen Erziehungsverhaltens vor, der auf einer theoretischen Grundlage — Vier-Komponenten-Modell und Multiaxiales Diagnosesystem der Jugendhilfe nach Jacob & Wahlen, 2006 — entwickelt wurde und der sich explizit auch an familienpsychologisch tätige Sachverständige richtet. Der Interviewleitfaden wurde für Eltern konzipiert, die ein Kind im Alter zwischen 6 und 12 Jahren haben. In einer wissenschaftlichen Pilotuntersuchung hat sich gezeigt, dass auf der Grundlage der Informationen, die mithilfe des Interviewleitfadens gewonnen wurden, zwischen Eltern mit unproblematischem und solchen mit problematischem Erziehungsverhalten differenziert werden konnte (Zumbach et al. 2020, Kap. 4.1.1).
EFB — Erziehungsfragebogen. Dettenborn nennt einen weiteren Selbstbeurteilungstest: Der „Erziehungsfragebogen" (EFB) von Naumann u.a. (2010) baut auf der „Parenting Scale" (PS) von Arnold u.a. (1993) auf und fragt Erziehungsverhalten bei einem als unangemessen empfundenen Verhalten des Kindes ab (Dettenborn).
EBI — Eltern-Belastungs-Inventar. Dettenborn ergänzt: Ebenso beruht das „Eltern-Belastungs-Inventar" (EBI) von Tröster (2010) auf dem „Parenting Stress Index" (PSI) von Abidin (1983) (Dettenborn).
Auch Zumbach et al. nennen das EBI: Eltern-Belastungs-Inventar, EBI; Tröster, 2010. Der Einsatz solcher Fragebogenverfahren kann auch erfolgen, um zur Validierung der anhand der verschiedenen methodischen Ansätze gesammelten Erkenntnisse untereinander beizutragen — etwa Vergleiche von Selbst- und Fremdbeobachtungsansätzen (Zumbach et al. 2020, Kap. 4.3.2).
MAD-J — Multiaxiales Diagnosesystem Jugendhilfe. Jacob und Wahlen (2006) haben mit dem MAD-J ein umfassenderes diagnostisches Konzept entwickelt. Hammesfahr nennt das Verfahren als Ergänzung zu IDEE: Deutschsprachige Interviewleitfäden zu einzelnen Aspekten elterlicher Erziehungsfähigkeit und Erziehungsverhalten — wie der Interviewleitfaden zur Diagnostik von Elterlichem Erziehungsverhalten (IDEE) und das Interview zur Einschätzung der Entwicklung des Kindes und der Erziehungsbedingungen (MAD-J) — können in die Erarbeitung der individuellen Explorationsleitfäden einfließen (Hammesfahr, a.a.O., Rn. 259, Fn. 502).
Das Vier-Komponenten-Modell von Jacob/Wahlen. Jacob hat in der Interaktionsbeobachtung das Vier-Komponenten-Modell des MAD-J systematisch dargestellt. Die erste Komponente — Verhaltenssysteme — bezieht sich auf: Pflege, Strukturierung, Sicherheit, Orientierung und Anregung.
Die zweite Komponente — elterliche Interaktionsmechanismen nach Keller (2001) — umfasst: ungeteilte/geteilte Aufmerksamkeit; Sensitivität für positive/negative Signale; Kontingenz auf positive/negative Signale. Diese Mechanismen stehen im Zusammenhang mit dem Feinfühligkeitskonzept der Bindungstheorie und werden durch das kindliche Bedürfnis nach Kommunikation angeregt (Jacob, Kap. 8.2.2).
Die Grenzen der Selbstbeurteilungsverfahren. Dettenborn warnt: Selbstwahrnehmungen erlangen für die Einschätzung der Erziehungsfähigkeit jedoch erst Relevanz, wenn sie sich im tatsächlichen Erziehungsverhalten widerspiegeln oder hierfür eine hohe Wahrscheinlichkeit besteht. Bei Datenerhebungen im familienrechtlichen Kontext kann nie ausgeschlossen werden, dass Selbstdarstellungen positiv gefärbt sind oder auch Unwahrheiten enthalten. Zudem muss sich die Selbstwahrnehmung auch nicht mit der Fremdwahrnehmung anderer — etwa der des Kindes — decken (Dettenborn).
Das ist die zentrale methodische Grenze. Ein Elternteil, der Sorgerecht zur Disposition hat, hat einen starken Anreiz, sich in Selbstbeurteilungsverfahren günstig darzustellen. Das ist nicht moralisch verwerflich — es ist eine systemische Reaktion auf die Begutachtungssituation. Aber die Validität der Befunde ist dadurch eingeschränkt.
Validierung durch Fremdsicht. Dettenborn formuliert die methodische Konsequenz: Für die Frage einer am Kindeswohl orientierten Bewertung der Erziehungsfähigkeit ist deshalb die Fremdwahrnehmung des Erziehungsverhaltens durch das Kind von besonderem Interesse. Erhebungsmethoden sind auch hier die Exploration und der Einsatz standardisierter Tests (Dettenborn).
Das bedeutet: Was Eltern über sich selbst sagen — auch im Fragebogen —, muss durch Fremddaten validiert werden. Aussagen des Kindes, Verhaltensbeobachtungen, Drittinformationen. Wenn Selbstbeurteilung und Fremdbeurteilung weit auseinanderfallen, ist das ein diagnostischer Befund. Salzgeber benennt die Maßstäbe für die Verfahrensauswahl: Bei der Beurteilung von Testverfahren sei zu prüfen, ob das Verfahren für Fragestellung und Person geeignet ist und ob es in einer Fachzeitschrift mit Peer Review veröffentlicht wurde; das Testkuratorium der Deutschen Gesellschaft für Psychologie veröffentliche hierzu regelmäßig Beurteilungen (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1323). Kritik an Testverfahren sei zugleich ein häufiger und berechtigter Gegenstand von Stellungnahmen zum Gutachten (Salzgeber, a.a.O., Rn. 1322).
Erziehungsstil-Inventare. Es gibt mehrere Verfahren zur Erfassung des Erziehungsstils. Hammesfahr nennt das Erziehungsstilinventar (ESI; Krohne/Pulsack 1995). Staub erläutert: Das ESI besteht aus einer Mutter- und einer Vaterversion. Der erste Teil des Inventars umfasst 60 Items, die sich zu je 12 Items auf die Erziehungsstil-Skalen Unterstützung, Einschränkung, Lob, Tadel und Inkonsistenz verteilen. Der zweite Teil erfasst die elterliche Strafintensität (Staub, Kap. 8.2.4).
Theoretische Grundlage — autoritatives Erziehungsverhalten. Dettenborn referiert die Klassifikation von Maccoby und Martin (1983) — sie unterscheiden vier Grundtypen von Erziehungsverhalten: autoritäres Verhalten mit geringer Akzeptanz und Feinfühligkeit, aber starker Kontrolle; vernachlässigendes Verhalten mit wenig Akzeptanz und wenigen Grenzsetzungen; permissives Verhalten mit hoher Akzeptanz, aber wenig Kontrolle; autoritatives Verhalten, das durch hohe Akzeptanz und Feinfühligkeit bei gleichzeitig deutlicher Grenzsetzung und Forderungen gekennzeichnet ist (Dettenborn).
Untersuchungen zeigen, dass autoritatives Erziehungsverhalten — das letztlich bindungsförderndes Verhalten mit Konstanz, Konsequenz und Normen- und Wertevermittlung verbindet — am ehesten zu emotional angepasstem, selbständigem, leistungsfähigem und positivem sozialen Verhalten eines Kindes beiträgt (Dettenborn, mit Verweis auf Baumrind 1991). Diese theoretische Grundlage prägt viele Erziehungs-Tests.
Was Beteiligte tun können. Erstens: Wenn ein Selbstbeurteilungsverfahren wie EFB, EBI oder ESI eingesetzt wird, achten Sie auf die Validierung durch andere Datenquellen. Ein günstiges Selbstbild allein ist kein Befund.
Zweitens: IDEE und MAD-J sind methodisch deutlich aufwendiger als reine Fragebögen — sie sind strukturierte Interviews. Wenn der Sachverständige sie einsetzt, ist das eine methodisch starke Wahl.
Drittens: Achten Sie auf die Theoriegrundlage. Erziehungsstil-Konzepte mit autoritativem Erziehungsverhalten sind empirisch gut begründet. Idiosynkratische Bewertungssysteme („gefühlsmäßig schien mir die Mutter erziehungsfähig zu sein") sind es nicht.
Ausblick. In der nächsten Folge geht es um ein spezielles Verfahren, das in Kindeswohlgefährdungs-Fragen oft eingesetzt wird: das EBSK — Elternbelastungsscreening zur Kindeswohlgefährdung.
Quellen
Lesezeit ca. 10 Minuten
Heute kommen wir zu einem speziellen Testverfahren, das in Kindeswohlgefährdungs-Fragen häufig eingesetzt wird: das EBSK — Elternbelastungsscreening zur Kindeswohlgefährdung. Dieses Verfahren hat eine Sonderstellung, weil es direkt Risikofaktoren für Kindeswohlgefährdung erfasst — mit allen methodischen Konsequenzen, die das hat.
Herkunft und Konstruktion. Hammesfahr beschreibt das Verfahren: Im Rahmen von Begutachtungen zu elterlicher Erziehungsfähigkeit bzw. Kindeswohlgefährdung wird häufig das Elternbelastungsscreening (EBSK) angewandt. Das EBSK ist die deutsche — verkürzte und aktualisierte — Form des Child Abuse Potential Inventory (CAPI) von Milner, das seit 1986 zur Erfassung des Risikos zukünftiger Kindeswohlgefährdungen eingesetzt wird (Hammesfahr, a.a.O., Rn. 268, mit Verweis auf Deegener/Spangler/Körner/Becker, Elternbelastungsscreening).
Das deutsche Verfahren wurde von Deegener, Spangler, Körner und Becker (2009) entwickelt: Eltern-Belastungs-Screening zur Kindeswohlgefährdung (EBSK). Deutsche Form des Child Abuse Potential Inventory (CAPI) von Joel S. Milner (Deegener et al. 2009, Hogrefe).
Das Format. Hammesfahr erläutert die Struktur: Den Elternteilen werden 63 Items (Fragen) mit Aussagen zu persönlichen Merkmalen, Ansichten und Verhaltensweisen in Situationen des erzieherischen Alltags vorgelegt, die sie bejahen bzw. verneinen sollen. Die Items beziehen sich auf Risikofaktoren für Kindeswohlgefährdungen, die als gesichert angesehen werden können. Festgestellt wird, welcher Vergleichsgruppe — nicht belastete, wenig belastete, deutlich belastete, stark belastete Elternteile — der Proband mit hoher Wahrscheinlichkeit angehört. Items sind durch Ankreuzen des Feldes „stimmt" oder „stimmt nicht" zu beantworten (Hammesfahr, a.a.O., Rn. 268).
Beispiel-Items. Hammesfahr gibt Beispiele: Fragen aus dem EBSK lauten zum Beispiel — „Ich habe ein Kind, das oft in Schwierigkeiten gerät"; „Kinder sollten still sein und zuhören"; „Heutzutage weiß man nicht so recht, auf wen man sich verlassen kann" (Hammesfahr, a.a.O., Rn. 269).
Man sieht: Die Items zielen auf Belastungsfaktoren, Erziehungseinstellungen und allgemeines Misstrauen — alles Konstrukte, die mit Misshandlungsrisiko korrelieren.
Cut-off-Werte und Belastungsgrade. Hammesfahr beschreibt die Auswertung: Zur Einstufung des Belastungsgrads — niedrige, leicht erhöhte, erhöhte, erheblich erhöhte Belastung — werden jeweils „Cut-off-Werte" angegeben. Neben der primären klinischen Skala zur Erfassung des elterlichen Belastungsgrads beinhaltet das EBSK auch drei Validitätsskalen zur Erfassung spezifischer Tendenzen der Antwortverzerrung (Hammesfahr, a.a.O., Rn. 269).
Die Validitätsskalen — wichtig für die Auswertung. Hammesfahr nennt drei Validitätsskalen: soziale Erwünschtheit bzw. „Lügenskala"; unreflektiertes Antwortverhalten bzw. „Zufallsantwortenskala"; inkonsistentes Antwortverhalten bzw. „Inkonsistenzskala" (Hammesfahr, a.a.O., Rn. 269).
Diese Validitätsskalen sind methodisch wichtig. Sie zeigen an, ob ein Elternteil sozial erwünscht antwortet, also versucht, ein positives Bild von sich zu zeichnen. Bei familienrechtlicher Begutachtung ist diese Motivation hoch — und das EBSK kann sie zumindest teilweise aufdecken.
Was das EBSK liefert. Hammesfahr formuliert: Das EBSK liefert neben der Erfassung des zukünftigen Risikos von Kindeswohlgefährdung auch Hinweise auf den Belastungsgrad und Unterstützungsbedarf der untersuchten Eltern (Hammesfahr, a.a.O., Rn. 269).
Das ist eine wichtige Differenzierung. Das EBSK ist nicht nur ein Misshandlungsrisiko-Screening. Es ist ein Belastungs-Screening — es zeigt, wo Eltern unter Druck stehen, wo sie Unterstützung brauchen, wo ihre erzieherischen Ressourcen erschöpft sind.
Methodische Grenzen. Das EBSK ist ein Screening — nicht ein diagnostisches Verfahren im engeren Sinne. Es zeigt eine Wahrscheinlichkeit, gibt aber keine Diagnose. Ein erhöhter EBSK-Wert bedeutet nicht, dass tatsächlich Kindeswohlgefährdung vorliegt — er bedeutet, dass das statistische Risiko erhöht ist.
Die Übertragung von einer Risikogruppe auf den Einzelfall erfordert immer eine ergänzende Diagnostik. Hammesfahr formuliert das so: Forschungsergebnisse müssen in Bezug zu den konkreten diagnostischen Informationen betrachtet und abgewogen werden — beispielsweise im Hinblick auf konkret festzustellende Auswirkungen auf die Kinder im vorliegenden Fall (Hammesfahr, a.a.O., Rn. 345).
PSSI — Persönlichkeits-Stil- und Störungs-Inventar. Hammesfahr nennt eine ergänzende Diagnostik: Bei Hinweisen auf persönlichkeitsbedingte Einschränkungen eines Elternteils kann zur Erfassung eventueller Persönlichkeitsakzentuierungen oder -Störungen u.a. das Persönlichkeits-Stil- und Störungs-Inventar (PSSI) angewandt werden (Hammesfahr, a.a.O., Rn. 269, mit Verweis auf Kuhl/Kazen).
Das PSSI ist ein Selbstbeurteilungsinstrument, das die relative Ausprägung von Persönlichkeitsstilen quantifiziert. Das Inventar besteht aus 140 Items, die 14 Skalen zugeordnet sind: eigenwilliger Stil/paranoide Persönlichkeitsstörung, zurückhaltender Stil/schizoide PS, ahnungsvoller Stil/schizotypische PS, spontaner Stil/Borderline-PS, liebenswürdiger Stil/histrionische PS, ehrgeiziger Stil/narzisstische PS, selbstkritischer Stil/selbstunsichere PS, loyaler Stil/abhängige PS, sorgfältiger Stil/zwanghafte PS, kritischer Stil/passiv-aggressive PS, passiver/depressive PS, hilfsbereiter/selbstlose PS, optimistischer/rhapsodische PS, selbstbehauptender/antisoziale PS (Hammesfahr, a.a.O., Rn. 269).
Wichtige Differenzierung — psychische Erkrankung vs. Erziehungseignung. Hammesfahr formuliert eine zentrale methodische Grundregel: Nicht eine psychische Erkrankung an sich stellt eine Einschränkung der Erziehungseignung dar, sondern die konkreten Auswirkungen der psychischen Erkrankung auf das Erziehungsverhalten und die Entwicklungschancen des Kindes. Einschränkungen der Erziehungsfähigkeit sind zudem kein Spezifikum psychisch kranker Eltern. Das Risiko, Gefährdungen der Kinder aufgrund psychischer Erkrankung der Eltern nicht ausreichend zu begegnen, muss mit dem Risiko, die Folgen der Erkrankung auf die kindliche Entwicklung zu überschätzen und protektive Faktoren zu übersehen, abgewogen werden (Hammesfahr, a.a.O., Rn. 269–270).
Das ist eine zentrale Klarstellung. Eine Mutter mit einer Depression ist nicht automatisch nicht erziehungsfähig. Ein Vater mit einer Persönlichkeitsstörung ist nicht automatisch ungeeignet. Es geht um die konkreten Auswirkungen — und nicht um die Diagnose als solche. Salzgeber stützt den zurückhaltenden Einsatz: Bei Fragen der Kindeswohlgefährdung seien testpsychologische Verfahren nur bei erheblichen Abweichungen vom Normalverhalten anzuwenden, da das Verhältnismäßigkeitsgebot die Erforschung der gesamten Familienverhältnisse verbietet (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1318). Dass ein Screening wie das EBSK das Risiko nicht zielgenau abbildet, entspricht dem Objektivitäts-Validitäts-Dilemma: Ein Verfahren ist oft objektiv, erfasst aber nicht zielgerichtet das für die Fragestellung Entscheidende (Salzgeber, a.a.O., Rn. 1325).
Was Beteiligte tun können. Erstens: Wenn EBSK eingesetzt wurde, achten Sie auf die Validitätsskalen. Wenn sie nicht miterhoben oder nicht ausgewertet wurden, ist die Aussagekraft beschränkt.
Zweitens: Ein erhöhter EBSK-Wert ist kein Beleg für tatsächliche Kindeswohlgefährdung. Er ist ein Risiko-Hinweis, der durch weitere Diagnostik abgesichert werden muss.
Drittens: Wenn das Gutachten von einer psychischen Erkrankung auf nicht-Erziehungsfähigkeit schließt, ohne die konkreten Auswirkungen zu prüfen, ist das ein methodischer Mangel.
Ausblick. In der nächsten Folge geht es um klinische Testverfahren bei Eltern — MMPI-2, BPI, ADS, BAI — und vor allem um die Verfälschungsproblematik bei Selbstbeurteilungsverfahren in der familienrechtlichen Begutachtung.
Quellen
Lesezeit ca. 10 Minuten
Heute geht es um eine der heikelsten Methodenfragen der familienpsychologischen Begutachtung: die klinischen Testverfahren bei Eltern. MMPI-2, BPI, ADS, BAI — wann sind sie sinnvoll, wann nicht? Und warum ist die Verfälschungsproblematik so zentral?
Die methodische Grundproblematik. Hammesfahr formuliert die Spannungslage: Die Möglichkeiten, eine psychische Erkrankung durch entsprechende klinisch-psychologische Testverfahren festzustellen, sind im Rahmen einer familiengerichtlichen Begutachtung — im Vergleich zu einer Situation, in der der betreffende Elternteil um Behandlung nachsucht — in den meisten Fällen erheblich erschwert (Hammesfahr, a.a.O., Rn. 219).
Das ist der zentrale Unterschied. In der klinischen Praxis sucht ein Patient Hilfe — er hat ein Interesse daran, seine Beschwerden offen darzulegen, damit ihm geholfen werden kann. In der forensischen Begutachtung steht etwas zur Disposition — Sorgerecht, Umgangsregelung, Aufenthaltsbestimmung. Der Anreiz, sich günstig darzustellen, ist hoch.
Selbstbeurteilungsverfahren und Verfälschbarkeit. Hammesfahr beschreibt die methodische Konsequenz: Klinisch-psychologische Testverfahren und strukturierte klinische Interviews — wie zum Beispiel das Borderline-Persönlichkeitsinventar (BPI), die allgemeine Depressionsskala (ADS), das Beck-Angst-Inventar (BAI), die Beck-Suizidgedanken-Skala (BSS) — sind Selbstbeurteilungsinstrumente, die direkt auf die entsprechenden Symptome zielende Fragen bzw. Items enthalten (Hammesfahr, a.a.O., Rn. 219).
Wenn auf Seiten der klinisch-testpsychologisch untersuchten Personen Verfälschungsmotivation — weil etwas für sie zur Disposition steht —, Verfälschungsfähigkeit — kognitive Fähigkeit, das Messinstrument zu durchschauen — und Verfälschungsmöglichkeit bestehen — keine Kontrollskala —, ist es sehr plausibel, dass es zu Verfälschung kommt. Daher ist im Kontext der familiengerichtlichen Begutachtung mit einer dissimulierenden Antworttendenz und verfälschten, die Symptomausprägung unterschätzenden Testergebnissen zu rechnen (Hammesfahr, a.a.O., Rn. 219).
Das MMPI-2 als Ausnahme. Hammesfahr nennt eine wichtige Ausnahme: Das Minnesota Multiphasic Personality Inventory-2 (MMPI-2) erhebt ein relativ vollständiges Bild der Persönlichkeit und klinisch relevanter psychischer Beschwerden anhand von 567 Items. Das MMPI-2 enthält im Gegensatz zu den meisten klinisch-psychologischen Testverfahren mehrere Kontroll- bzw. Validitätsskalen, die Aufschluss über „sozial erwünschtes" Antwortverhalten und Dissimulation des Probanden geben (Hammesfahr, a.a.O., Rn. 270, mit Verweis auf Engel/Starke/Hathaway/McKinley, MMPI-2).
Aber: Verhältnismäßigkeit und Zumutbarkeit. Hammesfahr formuliert die Einschränkung: Die Bearbeitungsdauer ist mit 60 bis 90 Minuten relativ lang. Zudem ist hier der Grundsatz der Verhältnismäßigkeit und Zweckgebundenheit der Datenerhebung zu beachten. Das MMPI-2 wird daher bei familiengerichtlichen Begutachtungen wohl eher in gut begründeten Ausnahmefällen anzuwenden sein (Hammesfahr, a.a.O., Rn. 270, mit Verweis auf Balloff ZKJ 2021, 10, 11).
Das ist eine wichtige Klarstellung. Auch das MMPI-2 ist nicht ein Routine-Verfahren — es ist eine Sondermaßnahme, die spezifisch begründet werden muss. Wer es einsetzt, ohne dass aus der Beweisfrage konkrete Hinweise auf Persönlichkeitsauffälligkeiten kommen, verstößt gegen den Grundsatz der Verhältnismäßigkeit.
Die Empfehlung bei psychischen Erkrankungen. Hammesfahr formuliert eine pragmatische Empfehlung: Im Rahmen der familiengerichtlichen Begutachtung besteht oftmals eine hohe Motivation für Dissimulation. Die Verfälschbarkeit von Testresultaten ist bei klinisch-psychologischen Selbstbeurteilungsinstrumenten, die in der Regel keine Kontrollskalen enthalten, daher grundsätzlich gegeben (Rn. 219). Deshalb ist es im Rahmen der familiengerichtlichen Begutachtung in der Regel zielführender, Informationen zu psychischer Erkrankung und Symptomausprägung wenn möglich bei behandelnden Psychotherapeuten — eine Schweigepflichtentbindung seitens des Elternteils vorausgesetzt — einzuholen (Hammesfahr, a.a.O., Rn. 271).
Das ist ein methodisch wichtiger Hinweis. Selbstbeurteilungstests durch den Elternteil sind methodisch unsicher. Aussagen behandelnder Therapeuten sind oft aussagekräftiger — sie kennen den Patienten über längere Zeit und in einem nicht-forensischen Kontext. Salzgeber benennt den methodischen Kern: Es bestehe ein Objektivitäts-Validitäts-Dilemma — psychometrische Verfahren seien oft zwar objektiv, erfassten das gewünschte Konstrukt aber nicht zielgerichtet (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1325). Entsprechend sei Kritik an Testverfahren — gerade an verfälschungsanfälligen Selbstbeurteilungsinstrumenten — ein häufiger und berechtigter Gegenstand von Stellungnahmen (Salzgeber, a.a.O., Rn. 1322).
Wann ist eine klinische Diagnose nötig? Hammesfahr formuliert eine wichtige Klarstellung: Die Feststellung einer psychischen Störung mit Krankheitswert ist selbst bei gerichtlichen Fragen nach der Erziehungsfähigkeit eines psychisch kranken Elternteils bzw. einer hieraus eventuell resultierenden Kindeswohlgefährdung zumeist gar nicht mehr erforderlich (Hammesfahr, a.a.O., Rn. 218).
In vielen Fällen liegen klinische Diagnosen bereits vor und können vorliegenden Berichten in der Gerichtsakte entnommen oder durch Informationserhebung bei behandelnden Psychotherapeuten oder Fachärzten eruiert werden. Aber auch in Fällen, in denen noch keine Diagnosen nach ICD-10 oder DSM-5 vorliegen, ist die Feststellung bzw. Diagnose einer psychischen Erkrankung im Kontext der familienrechtspsychologischen Begutachtung zumeist gar nicht zielführend (Hammesfahr, a.a.O., Rn. 218).
Worauf es ankommt. Hammesfahr formuliert die methodische Pointe: Es geht in der Begutachtung nicht primär darum, ob eine psychische Erkrankung vorliegt — sondern darum, wie sich eine bestehende oder vermutete Erkrankung auf das Erziehungsverhalten und die Entwicklung des Kindes auswirkt.
Das ist die zentrale Konstruktverschiebung: Die Beweisfrage richtet sich nicht auf die Diagnose, sondern auf die Erziehungseignung. Die Diagnose ist allenfalls Anhaltspunkt — die Auswirkungen sind das Untersuchungsobjekt.
Was Beteiligte tun können. Erstens: Wenn ein klinisches Testverfahren ohne Validitätsskalen eingesetzt wird — etwa BPI, ADS, BAI ohne MMPI-Begleitung —, ist die Aussagekraft begrenzt. Das sollte im Gutachten reflektiert werden.
Zweitens: Wenn das MMPI-2 eingesetzt wird, muss die Notwendigkeit aus der Beweisfrage hergeleitet sein. Ohne Begründung verstößt das gegen Verhältnismäßigkeit und Zumutbarkeit.
Drittens: Bei eigener psychischer Vorgeschichte ist die Schweigepflichtentbindung zu Therapeuten oft die methodisch sauberere Option als ein klinischer Test in der Begutachtung. Das sollten Sie strategisch durchdenken.
Viertens: Wenn das Gutachten von einer Diagnose direkt auf nicht-Erziehungsfähigkeit schließt, ohne die konkreten Auswirkungen zu prüfen, ist das ein methodisch fundamentaler Fehler. Diagnose ist nicht gleich Auswirkung.
Ausblick. In der letzten Folge dieses Hauptthemas geht es um eine zentrale methodische Frage, die alle bisherigen Folgen zusammenführt: die Methodenkombination. Wann reicht eine Methode? Wann braucht man mehrere? Was bedeutet multimethodaler Ansatz konkret?
Quellen
Lesezeit ca. 10 Minuten
Wir schließen Hauptthema 6 mit einer methodischen Grundfrage ab, die alle bisherigen Folgen zusammenführt: Wie kombiniert man die verschiedenen Methoden? Wann ist welche Methode geeignet? Was bedeutet multimethodaler Ansatz konkret? Und was sind die Risiken, wenn er nicht eingehalten wird?
Multimethodal — was bedeutet das? In Hauptthema 4 (Folge 4.4) haben wir die multimethodale Datenerhebung bereits eingeführt. Sie ist eines der Kernkriterien der Mindeststandards an die Qualität von Sachverständigengutachten im Kindschaftsrecht (Mindeststandards 2019). Heute schauen wir uns an, wie sie in der Praxis konkret umgesetzt wird.
Multimethodal heißt: Mehrere Methoden werden kombiniert, sodass die Stärken der einen die Schwächen der anderen ausgleichen. Konkret bedeutet das: Aktenanalyse, Exploration, Verhaltensbeobachtung, Interaktionsbeobachtung, Bindungsdiagnostik, Testverfahren, Drittinformationen — diese Methoden sind nicht alternativ, sondern komplementär.
Die Stärken-Schwächen-Matrix. Jede Methode hat ihre Stärken und Schwächen. Exploration liefert subjektive Erlebnisinhalte — kann aber Selbstdarstellung enthalten. Verhaltensbeobachtung liefert objektivere Befunde — ist aber zeitlich punktuell. Testverfahren sind standardisiert — können aber verfälscht werden. Drittinformationen kommen aus anderer Perspektive — sind aber durch Eigeninteressen der Drittpersonen geprägt.
Keine Methode allein ist ausreichend. Erst die Kombination ergibt ein methodisch belastbares Bild.
Das Mehrfachbelege-Prinzip. In Hauptthema 5 (Folge 5.10) haben wir das Mehrfachbelege-Prinzip eingeführt. Hammesfahr formuliert: Ein Aspekt gilt als belegt, wenn Belege aus mindestens zwei unabhängigen Informationsquellen angeführt werden können. Nach diesem Prinzip der Mehrfachbelege und dem Aggregationsprinzip wird die Fehleranfälligkeit einzelner Quellen relativiert (Hammesfahr, a.a.O., Rn. 344, mit Verweis auf Salzgeber Arbeitsbuch S. 49; Mindestanforderungen S. 14; Arbeitsgruppe Familienrechtliche Gutachten PDR 2015, 7, 19; Kindler PDR 2008, 240, 248).
Im multimethodalen Ansatz ist das Mehrfachbelege-Prinzip die operative Anwendung. Wenn ein Befund nur aus einer Quelle stammt — etwa nur aus der Exploration der Mutter —, ist er methodisch schwach. Wenn er sich aus Exploration, Verhaltensbeobachtung, Drittinformation und Test triangulieren lässt, ist er methodisch belastbar. Salzgeber liefert die Grundregel: Anerkannt sei die Anwendung eines Multitrait-Multimethod-Ansatzes, mit dem mehrere Variablen eines Konstrukts und mehrere Daten für eine Variable erfasst werden; Übereinstimmungen und Unterschiede zwischen den Ergebnissen seien in der Empfehlung so weit wie möglich zu erklären und möglichst zu integrieren (Salzgeber, Familienpsychologische Gutachten, 8. Aufl., Rn. 1324). Operativ heißt das auch in der Beobachtung: Zwei Beobachtungen pro Elternteil ergeben validere Daten als nur eine (Salzgeber, a.a.O., Rn. 1388).
Empirische Validierung von Selbst- und Fremdbeobachtung. Zumbach et al. formulieren das in einer wichtigen Passage zur Validierung: Der Einsatz solcher Fragebogenverfahren kann auch erfolgen, um zur Validierung der anhand der verschiedenen methodischen Ansätze gesammelten Erkenntnisse untereinander beizutragen — etwa Vergleiche von Selbst- und Fremdbeobachtungsansätzen (Zumbach et al. 2020, Kap. 4.3.2).
Konkret: Was die Eltern in der EBI-Selbstbeurteilung über ihre Belastung sagen, wird mit dem verglichen, was im Hausbesuch und in der Drittinformation beobachtet wurde. Stimmen Selbst- und Fremdbild überein? Oder klaffen sie auseinander?
Die Bindungsdiagnostik als Beispiel. Dettenborn formuliert zur Bindungsdiagnostik ein zentrales Aggregationsprinzip: Die Sicherheit der Diagnose steigt mit der Menge der Beobachtungen und der Vielfalt der Beobachtungssituationen, in denen Bindungsverhalten aktiviert wird — etwa in Konfliktsituationen, in Übergabesituationen zwischen getrennt lebenden Eltern, bei Hausbesuchen und bei Betreuungstätigkeiten (Dettenborn, Kap. 2.3.2.5).
Eine Bindungsmuster-Diagnose, die nur auf einer einzigen Beobachtung beruht, ist methodisch nicht ausreichend. Sie muss durch mehrere Beobachtungssituationen abgesichert werden — und durch andere methodische Zugänge wie Exploration oder Bindungsinterview.
Verfahren als Validierungsschritte. Jacob formuliert eine wichtige methodische Konsequenz zum CARE-Index: Urteilsbildung ausschließlich mittels einer Messung ist nicht ausreichend; es bedarf noch weiterer Messungen bzw. anderer Verfahren (Jacob, Tab. 4.3).
Das ist nicht nur für den CARE-Index richtig. Es ist die generelle methodische Regel. Kein einzelnes Verfahren — kein EKIP, kein H-MIM, kein EBSK, kein FST — reicht allein aus, um eine Frage zur Erziehungsfähigkeit oder Kindeswohlgefährdung verlässlich zu beantworten.
Übergang von Beobachtung zu Bewertung. Hammesfahr beschreibt den methodischen Übergang: Sodann wird die Verlaufsbeschreibung der Interaktionsbeobachtung in einem Kurzbefund im Hinblick auf die zuvor unter Rn. 296 und 303 bis 308 definierten Kriterien ausgewertet. Hierbei sollten die einzelnen Kriterien kurz definiert werden. Die Bewertung der Interaktionssequenzen im Hinblick auf die Kriterien sollte durch kurze Beispiele aus der Verlaufsbeschreibung illustriert und belegt werden, um die Nachvollziehbarkeit auch für Nichtpsychologen sicherzustellen (Hammesfahr, a.a.O., Rn. 341).
Das ist methodisch wichtig: Die Bewertung muss konkret belegt sein. Allgemeine Bewertungssätze wie „die Mutter zeigte sich überfordert" sind ohne konkrete Belege aus der Beobachtung nicht überprüfbar — und damit methodisch ungenügend.
Validierung gegen Hypothesenbildung. Hammesfahr beschreibt das methodische Vorgehen so: Die psychologischen Fragen werden hypothesengeleitet diskutiert, bewertet, beantwortet und mit den Untersuchungsergebnissen begründet, denn Ziel der Begutachtung ist Beweisführung (Dettenborn, Abschnitt zu Befundung; vgl. auch Hammesfahr Rn. 345 Dreierschritt).
Hypothesengeleitet heißt: Der Sachverständige formuliert zu Beginn der Untersuchung Hypothesen — etwa „Die Mutter ist erziehungsfähig" vs. „Die Mutter ist eingeschränkt erziehungsfähig". Beide Hypothesen werden systematisch geprüft. Das verhindert, dass der Sachverständige selektiv nur jene Daten wahrnimmt, die seine erste Eindrucks-Hypothese bestätigen — das wäre Bestätigungsbias.
Forschungsergebnisse und Einzelfall. Hammesfahr formuliert eine zentrale methodische Klarstellung — die wir in Folge 4.9 zur idiografisch-nomothetischen Verknüpfung schon eingeführt haben: Forschungsergebnisse an sich sind nicht aussagekräftig für den konkreten Fall. Sie müssen daher immer in Bezug zu den konkreten diagnostischen Informationen betrachtet und abgewogen werden — beispielsweise im Hinblick auf konkret festzustellende Auswirkungen auf die Kinder im vorliegenden Fall. Es bleibt unvermeidbar immer ein Rest subjektiver Entscheidung, ob und wie weit Forschungsergebnisse auf den vorliegenden Einzelfall übertragbar sind (Hammesfahr, a.a.O., Rn. 345).
Konkret: Das EBSK zeigt statistische Risikofaktoren. Aber ob im vorliegenden Einzelfall tatsächlich eine Kindeswohlgefährdung vorliegt, kann das EBSK allein nicht beantworten. Es liefert einen Risikohinweis — die Einzelfalldiagnostik muss prüfen, ob sich das Risiko in konkreten Verhaltensweisen niederschlägt.
Was Beteiligte tun können. Erstens: Schauen Sie im Gutachten nach, wie viele verschiedene Methoden eingesetzt wurden. Wenn es nur eine — etwa nur Exploration — gab, ist das methodisch dünn. Wenn drei bis fünf Methoden trianguliert wurden, ist das methodisch solide.
Zweitens: Achten Sie auf das Mehrfachbelege-Prinzip. Werden Befunde durch mehrere unabhängige Quellen belegt? Oder beruhen kritische Befunde auf einer einzigen Quelle?
Drittens: Schauen Sie, wie die Bewertung mit der Datenbasis verknüpft wird. Werden konkrete Belege aus der Beobachtung zitiert? Oder bleiben die Bewertungen allgemein?
Viertens: Wenn statistische Risikobefunde — etwa erhöhte EBSK-Werte — unbesehen auf den Einzelfall übertragen werden, ohne die konkreten Auswirkungen zu prüfen, ist das ein methodischer Fehler. Statistik ist nicht Diagnose.
Abschluss des sechsten Hauptthemas. Wir haben in den Folgen 6.1 bis 6.10 die zentralen Methoden der zweiten Datenerhebungsphase behandelt: Verhaltensbeobachtung mit Indikatoren nach Jacob; Interaktionsbeobachtung in unterschiedlichen Settings; EKIP, H-MIM, MKK, CARE-Index als systematische Verfahren; Bindungsdiagnostik mit FST, Bindungsmustern und Still-Face bei kleinen Kindern; GEV-B, SAT, BISK bei älteren Kindern; Testdiagnostik beim Kind; Testdiagnostik bei Eltern mit IDEE, EFB, EBI und MAD-J; EBSK zur Kindeswohlgefährdung; klinische Testverfahren bei Eltern mit MMPI-2; und heute den multimethodalen Ansatz.
Im siebten Hauptthema gehen wir zu den Kernkonstrukten der familienpsychologischen Begutachtung über: Kindeswohl, Kindeswille, Kindeswohlgefährdung. Hier kommen wir vom „Wie wird gemessen?" zum „Was wird gemessen?" — und stoßen auf die zentralen rechtlichen und psychologischen Konzepte, an denen sich alles entscheidet.
Quellen
Die zentralen Werke dieses Hauptthemas
Die einzelnen Folgen sind durchgehend gegen die nachstehenden Standardwerke und gegen die einschlägige Methodenliteratur geprüft. Die jeweils verwendeten Verfahren und Fundstellen stehen am Ende jeder Folge.
Interaktionsverfahren (u.a. EKIP, H-MIM, MKK, CARE-Index) · Bindungsdiagnostik (Fremde-Situations-Test, Still-Face-Paradigma, GEV-B, SAT, BISK) · Elternbelastungs- und Risikoinventare (EBSK, CAPI) · Testkuratorium der Föderation Deutscher Psychologenvereinigungen / DIN 33430. Die konkreten Verfahrensnachweise sind den Quellenangaben der jeweiligen Folge zu entnehmen.
FamFG §§ 30, 163 · ZPO §§ 404a, 407a · BGB §§ 1666, 1684 · Art. 6 Abs. 2 GG · Grundsatz der Verhältnismäßigkeit testdiagnostischer Eingriffe.
Die vollständige Vorbereitung auf ein Familienpsychologisches Gutachten
Marcus Jähn
Wenn dich dieses Hauptthema erreicht hat und du selbst vor einem familienpsychologischen Gutachten stehst — oder mittendrin bist — findest du in meinem Buch eine kompakte, praxistaugliche Vorbereitung: was im Vorfeld zu klären ist, wie Gespräche und Testverfahren ablaufen, worauf du in der Eltern-Kind-Interaktion achten solltest, und wie du ein fertiges Gutachten methodenkritisch liest.
Rechtlicher Hinweis und Haftungsausschluss
Diese Inhalte dienen ausschließlich der allgemeinen Information und Weiterbildung. Sie stellen keine Rechtsberatung und keine psychologische oder psychotherapeutische Beratung im Einzelfall dar und können eine solche nicht ersetzen. Gesetze, Rechtsprechung und fachliche Standards entwickeln sich fort; trotz sorgfältiger Recherche wird keine Gewähr für Aktualität, Vollständigkeit und Richtigkeit übernommen. Eine Haftung für Schäden oder Nachteile, die aus der Nutzung oder Nichtnutzung dieser Informationen entstehen, ist – soweit gesetzlich zulässig – ausgeschlossen. Für die Beurteilung eines konkreten Falls wenden Sie sich bitte an eine Rechtsanwältin oder einen Rechtsanwalt beziehungsweise an eine qualifizierte Fachperson. Die genannten Gerichtsentscheidungen und Fundstellen wurden nach bestem Wissen wiedergegeben; maßgeblich ist stets der amtliche Wortlaut.
Marcus Jähn · werdewiederstark.de · psychologie-hilft.de