Direkt zum Inhalt

Ultrahochdimensionale semiparametrische Längsschnittdatenanalyse

Brittany Green, PhD Liane, H. Ju, Y. Zu, T.
Biometrie. August 3, 2020

Publikation anzeigen

Abstrakt

Da ultrahochdimensionale Längsschnittdaten in Bereichen wie der öffentlichen Gesundheit und der Bioinformatik immer deutlicher werden, ist die Entwicklung flexibler Methoden mit einem spärlichen Modell von großem Interesse. In dieser Einstellung kann die Dimension der Kovariaten möglicherweise exponentiell als exp (𝑛1/2) exp (n1 / 2) in Bezug auf die Anzahl der Cluster n. Wir betrachten einen flexiblen semiparametrischen Ansatz, nämlich teilweise lineare Einzelindexmodelle, für ultrahochdimensionale Längsschnittdaten. Am wichtigsten ist, dass wir nicht nur die teilweise linearen Kovariaten, sondern auch die Einzelindex-Kovariaten innerhalb der unbekannten flexiblen Funktion zulassen, die nichtparametrisch als ultrahochdimensional geschätzt werden. Unter Verwendung von bestraften verallgemeinerten Schätzungsgleichungen kann dieser Ansatz die Korrelation innerhalb von Subjekten erfassen, eine gleichzeitige Variablenauswahl und -schätzung mit einer reibungslos abgeschnittenen absoluten Abweichungsstrafe durchführen und Nichtlinearität und möglicherweise einige Interaktionen zwischen Prädiktoren erfassen. Wir etablieren eine asymptotische Theorie für die Schätzer, einschließlich der Orakeleigenschaft in ultrahoher Dimension sowohl für die teilweise linearen als auch für die nichtparametrischen Komponenten, und wir präsentieren einen effizienten Algorithmus zur Bewältigung der rechnerischen Herausforderungen. Wir zeigen die Wirksamkeit unserer Methode und unseres Algorithmus anhand einer Simulationsstudie und Genexpressionsdaten des Hefezellzyklus.