Перейти к основному содержанию

Полупараметрический продольный анализ данных сверхвысокой размерности

Биометрия, Август 3, 2020

Посмотреть публикацию

Абстрактные

Поскольку лонгитюдные данные сверхвысокой размерности становятся все более очевидными в таких областях, как общественное здравоохранение и биоинформатика, разработка гибких методов с использованием разреженных моделей представляет большой интерес. В этом случае размерность ковариат потенциально может расти экспоненциально как exp (𝑛1/2) exp (n1 / 2) относительно количества кластеров n. Мы рассматриваем гибкий полупараметрический подход, а именно частично линейные одноиндексные модели, для продольных данных сверхвысокой размерности. Наиболее важно то, что мы допускаем не только частично линейные ковариаты, но и одноиндексные ковариаты в неизвестной гибкой функции, непараметрически оцениваемой как сверхвысокоразмерные. Используя штрафные обобщенные уравнения оценки, этот подход может фиксировать корреляцию внутри субъектов, может выполнять одновременный выбор и оценку переменных с плавно отсеченным штрафом за абсолютное отклонение и может фиксировать нелинейность и, возможно, некоторые взаимодействия между предикторами. Мы устанавливаем асимптотическую теорию для оценок, включая свойство оракула в сверхвысокой размерности как для частично линейных, так и для непараметрических компонентов, и представляем эффективный алгоритм для решения вычислительных задач. Мы демонстрируем эффективность нашего метода и алгоритма с помощью моделирования и данных по экспрессии генов клеточного цикла дрожжей.