Diamantschildkröte, Malaclemys terrapin, im Aquaterrarium mit Entengrütze – © Hans-Jürgen Bidmon

Vermeiren - 2025 - 01

Vermeiren, Peter, Sandrine Charles & Cynthia C Muñoz (2025): Quantifying the relationship between observed variables with censored values using Bayesian error-in-variables regression. – Chemosphere 376: 144269.

Die Quantifizierung der Beziehung zwischen beobachteten Variablen mit zensierten Werten unter der Verwendung von Bayesian Fehler-Variablen Regression.

DOI: 10.1016/j.chemosphere.2025.144269 ➚

Diamantschildkröte, Malaclemys terrapin – © Hans-Jürgen Bidmon
Diamantschildkröte,
Malaclemys terrapin,
im Aquaterrarium
© Hans-Jürgen Bidmon

Wir wollten zwei häufige Herausforderungen für Wissenschaftler, die mit Beobachtungsdaten arbeiten, angehen: „Wie lässt sich die Beziehung zwischen zwei beobachteten (oder gemessenen) Variablen quantifizieren?“ und „Wie lassen sich zensierte Werte berücksichtigen?“ (d. h. Beobachtungen oder Messungen, deren Wert nur innerhalb eines Bereichs bekannt ist). Die Quantifizierung der Beziehung zwischen beobachteten Variablen und die Vorhersage einer Variablen aus der anderen (und umgekehrt) verstößt gegen die Annahme der Standardregression hinsichtlich der Existenz einer unabhängigen, erklärenden Variablen, die ohne (oder mit begrenzter) Unsicherheit beobachtet wird. Um diese Herausforderung zu bewältigen, haben wir ein Bayes'sches Regressionsmodell für Fehler in Variablen (EIV) entwickelt und getestet, das die Unsicherheit in Variablen orthogonal berücksichtigt. Darüber hinaus ermöglichte die Parameterschätzung mittels Bayesscher Inferenz die Übertragung der vollständigen Parameterunsicherheit in probabilistische Modellvorhersagen, die für die Entscheidungsfindung geeignet sind. Alternative Modellformulierungen wurden auf einen Datensatz angewendet, der gemessene Konzentrationen organischer Schadstoffe bei Müttern und ihren Eiern der Schildkröte Malaclemys terrapin enthielt, und anhand eines unabhängigen Datensatzes der Schildkröte Chelydra serpentina validiert. Das leistungsstärkste EIV-Modell wurde dann erneut auf den Datensatz angewendet, nachdem Messungen in einer oder beiden Variablen zensiert wurden. Hier wurden unabhängige Wahrscheinlichkeiten für zensierte und unzensierte Daten formuliert und dann nach der Bayes'schen Implementierung des Modells einfach kombiniert. Das EIV-Modell zeigte eine gute Leistung, wie aus den posterioren Vorhersageprüfungen um 85 % hervorgeht, und lieferte vergleichbare Parameterschätzungen sowohl in zensierten als auch in unzensierten Fällen. Das resultierende Modell ermöglicht es Wissenschaftlern und Entscheidungsträgern, Variablen quantitativ zu verknüpfen und Vorhersagen von einer Variablen zur nächsten zu treffen, wobei Unsicherheiten und zensierte Daten berücksichtigt werden.

Kommentar von H.-J. Bidmon

Vielleicht könnte dieses Regressionsmodell auch dazu beitragen solche Probleme wie sie von Bradke et al. (2025) dargelegt werden besser zu analysieren.

Literatur

Bradke, Danielle R., Mark G. Dodd & John C. Maerz (2025): Potential and Limitations of Unmarked Population Surveys to Inform State-Wide Management for Diamondback Terrapins. – Chelonian Conservation and Biology 24(1): 77-89 oder Abstract-Archiv.

Galerien