
La idea de que un reloj sea capaz de ayudar a detectar problemas de salud antes de que den la cara, e incluso a anticipar embarazos, ya no suena tan lejana. Un nuevo estudio ha mostrado cómo la combinación de inteligencia artificial y datos recogidos de forma pasiva por el Apple Watch puede acercar la medicina preventiva a la muñeca, sin necesidad de pruebas clínicas constantes.
Para lograrlo, un grupo de investigadores ha recurrido a una fórmula muy concreta: usar algoritmos avanzados de IA capaces de exprimir registros incompletos y llenos de huecos, justo el tipo de información que generan en la vida real los relojes inteligentes. En lugar de aspirar a un control perfecto, el modelo aprende a trabajar con lo que hay, tal y como se usa el dispositivo en el día a día.
Un macroestudio con 16.522 usuarios y tres millones de días de datos reales
El proyecto se apoya en una base de datos masiva, formada por 16.522 personas que usaron un Apple Watch durante largos periodos de tiempo. Si se suman todos esos registros, el conjunto equivale a aproximadamente tres millones de días de uso real, una cifra que permite observar patrones que serían imposibles de detectar a pequeña escala.
Cada usuario generó hasta 63 métricas diferentes relacionadas con su salud, organizadas en varios bloques: parámetros cardiovasculares (como la frecuencia cardiaca o su variabilidad), indicadores respiratorios, calidad del sueño, nivel de actividad física y otras estadísticas generales sobre rutinas diarias. No todos los participantes usaban el reloj con la misma constancia, pero eso no se consideró un problema insalvable.
De hecho, una parte clave del estudio es que la mayoría de los datos no venía acompañada de un diagnóstico médico claro. Tan solo en torno a un 15% de los participantes disponía de un historial clínico etiquetado, es decir, con enfermedades registradas de manera formal que pudieran servir de referencia directa para el algoritmo.
En lugar de descartar todo ese volumen de información sin etiquetas, el equipo optó por una estrategia de autoaprendizaje o autosupervisión. Primero, el modelo se entrenó con el conjunto completo de los registros, sin necesidad de saber qué persona padecía qué enfermedad. Más adelante, se afinó con el pequeño grupo de usuarios que sí contaban con diagnósticos confirmados.
Esta aproximación permite aprovechar datos que, en otros contextos, se considerarían demasiado ruidosos o irregulares. El modelo no solo mira valores concretos, sino que trata de comprender cómo se comporta cada individuo a lo largo del tiempo, con sus altibajos, días sin reloj y cambios de rutina incluidos.
Una IA que entiende los huecos en los datos del Apple Watch

El corazón técnico del sistema se inspira en la arquitectura JEPA (Joint Embedding Predictive Architecture), un tipo de modelo pensado para comprender contextos amplios más que para predecir un dato aislado. A diferencia de los modelos de lenguaje que tratan de adivinar la siguiente palabra, aquí la prioridad es construir una representación coherente del estado general de la persona.
Para ello, cada observación registrada por el reloj se transforma en una suerte de token que incluye el día, el tipo de métrica y el valor medido. Sobre esa secuencia se aplica un mecanismo de enmascarado: determinadas partes de la información se ocultan de forma deliberada para que la IA tenga que inferir qué podría haber en esos huecos.
La clave está en que el modelo no intenta rellenar los espacios vacíos con un número exacto, sino interpretar qué significa esa ausencia dentro del patrón de cada usuario. Por ejemplo, varios días sin registros de sueño no se consideran automáticamente un error, sino un elemento más del comportamiento que puede aportar contexto sobre hábitos o cambios puntuales.
Esto resulta especialmente útil cuando se trabaja con wearables, porque su uso dista mucho de ser perfecto: el reloj se queda cargando en la mesilla, la batería se agota a media tarde o algún sensor falla puntualmente. El modelo bautizado por los investigadores, conocido como JETS, está precisamente diseñado para sacar partido de este caos y seguir siendo útil con datos muy irregulares.
Los responsables del estudio señalan que algunas métricas solo estaban disponibles alrededor de un 0,4% del tiempo total para ciertos usuarios, mientras que otras se registraban casi a diario. Aun así, la IA consiguió extraer patrones relevantes que probablemente habrían pasado desapercibidos con enfoques más clásicos, centrados en series ordenadas y completas.
Capacidad para anticipar hipertensión, apnea y otros riesgos de salud
Una vez entrenado, el modelo se sometió a pruebas con varias condiciones médicas concretas, muy relacionadas con la salud cardiovascular y los trastornos del sueño. Entre ellas, la hipertensión arterial, el síndrome del seno enfermo, distintos tipos de fatiga crónica y problemas compatibles con episodios de apnea.
En el caso de la hipertensión, los datos del estudio apuntan a una capacidad de discriminación de alrededor del 86,8% entre personas con y sin esta condición. No significa que acierte el diagnóstico al milímetro en todos los casos, pero sí que es bastante eficaz a la hora de separar a quienes probablemente tienen un problema de quienes tienen menos papeletas.
El modelo también mostró buen rendimiento al detectar patrones vinculados a síndrome del seno enfermo y a cuadros de fatiga crónica. Frente a otros algoritmos y métodos comparativos, no fue siempre el número uno en cada métrica, pero sí presentó una ventaja consistente cuando se trataba de trabajar con registros incompletos y muy dispares.
Las métricas con las que se ha evaluado el sistema no cuentan “aciertos” de forma directa, sino que miden cuán bien prioriza los casos con mayor probabilidad de riesgo. Esta forma de evaluación encaja con la medicina preventiva, donde lo realmente importante es decidir a quién conviene revisar antes, más que clavar el diagnóstico definitivo en un primer vistazo.
En la práctica, el potencial de este tipo de IA está en actuar como un sistema de cribado pasivo, que funcione en segundo plano y señale qué usuarios deberían consultar con un profesional sanitario. El Apple Watch se convierte así en un filtro inicial que aprovecha mediciones aparentemente rutinarias para levantar la mano cuando detecta algo fuera de lo habitual.
Datos imperfectos que pueden ayudar a salvar vidas
Una de las ideas más interesantes que deja el trabajo es que los datos imperfectos no son sinónimo de datos inútiles. Si se analizan con el enfoque adecuado, pueden resultar tremendamente valiosos, sobre todo cuando se recogen durante meses o años en situaciones de vida cotidiana, lejos de los entornos controlados de un laboratorio.
Incluso registros muy esporádicos pueden contribuir a levantar un modelo robusto del estado general de cada persona. Al juntar información sobre actividad física, calidad del sueño y comportamiento de la frecuencia cardiaca, se obtiene un mapa bastante completo que puede delatar problemas subyacentes que aún no han mostrado síntomas claros.
Este enfoque refuerza la impresión de que relojes inteligentes como el Apple Watch pueden jugar un papel creciente en la monitorización continua de la salud. No es imprescindible llevar el dispositivo las 24 horas del día ni obsesionarse con pulsar todos los botones: lo fundamental es disponer de sistemas capaces de interpretar con criterio lo que sí se está midiendo.
El modelo desarrollado por los investigadores está concebido precisamente para eso: acompañar al usuario en su rutina normal sin exigir un uso perfecto. A partir de los fragmentos de datos que se van acumulando, la IA construye una especie de “retrato dinámico” de la persona, suficientemente estable como para detectar desviaciones llamativas.
Para los sistemas sanitarios europeos, habitualmente tensionados por la demanda asistencial, herramientas de este tipo podrían tener encaje como apoyo al trabajo clínico. Un algoritmo que ayude a priorizar casos o a señalar a quienes necesitan una revisión más urgente puede resultar muy útil, siempre que se integre con criterio y no se utilice como sustituto de la consulta médica.
Limitaciones, validación clínica y privacidad de los datos
Los propios autores del trabajo insisten en que todo esto sigue perteneciendo al terreno de la investigación. Que un modelo funcione bien en un estudio no quiere decir que esté listo para convertirse en una función comercial del reloj ni para emitir diagnósticos por su cuenta.
Por ahora, no se ha demostrado de forma sólida cómo se comportaría este sistema en entornos clínicos reales, donde influyen factores muy variados: diferencias entre países y poblaciones, formas distintas de usar el reloj, cambios de estilo de vida, tratamientos médicos que alteran las métricas o simplemente épocas en las que la persona deja de utilizar el dispositivo.
Aun con porcentajes de discriminación elevados, la IA está lejos de ser infalible. Pueden aparecer falsos positivos que generen alarmas innecesarias o falsos negativos que dejen pasar un riesgo relevante. Por eso, cualquier señal que emita este tipo de modelos debería entenderse como un aviso para buscar consejo profesional, no como un veredicto cerrado.
En este contexto, el papel del personal médico sigue siendo totalmente central. La exploración física, las pruebas diagnósticas específicas y la valoración global del paciente son elementos que no puede replicar un algoritmo alimentado solo con datos pasivos del reloj. La IA puede ayudar a enfocar mejor la atención, pero la última decisión debe recaer en los profesionales.
A todo ello hay que sumar la cuestión de la privacidad y protección de los datos de salud, especialmente sensible en Europa. El análisis continuo de información tan íntima como las pulsaciones, los patrones de sueño o el nivel de actividad obliga a garantizar altos niveles de seguridad y a cumplir estrictamente normativas como el Reglamento General de Protección de Datos (RGPD).
Impacto potencial en la medicina preventiva en España y Europa
Más allá de las cautelas, el trabajo apunta a un cambio de enfoque en la forma de entender la medicina preventiva en España y en el resto de Europa. Pasar de revisiones puntuales a una supervisión casi constante, aunque sea de forma pasiva, abre la puerta a tratar problemas de salud en fases mucho más tempranas.
El Apple Watch ya ofrece funciones como alertas de ritmo cardiaco anómalo, notificaciones de irregularidades en el pulso, registros de sueño o detección de caídas. Este nuevo tipo de modelos sugiere un paso más: que el dispositivo pueda colaborar en la detección de patologías como la hipertensión o ciertas formas de apnea del sueño con una mirada más global sobre el comportamiento del usuario.
En el contexto europeo, donde crecen las iniciativas de telemedicina y seguimiento remoto, estos avances encajarían en proyectos de monitorización a distancia de pacientes crónicos o de personas con factores de riesgo. Integrar datos procedentes del reloj en la historia clínica electrónica, siempre con el consentimiento adecuado, permitiría a los profesionales disponer de una radiografía mucho más fina entre visitas.
Para el sistema sanitario español, acostumbrado a gestionar listas de espera y una alta demanda en atención primaria, disponer de herramientas de cribado automatizado basadas en datos reales podría ayudar a derivar antes a quienes necesitan pruebas más específicas. Eso sí, sería necesario acompañarlo de protocolos claros, formación para los sanitarios y una evaluación rigurosa de beneficios y posibles efectos secundarios, como la sobrecarga de alertas.
El ecosistema de salud en el iPhone también se está moviendo en esa dirección. La aplicación Salud ha pasado de ser un simple repositorio a un panel que resalta tendencias, muestra cambios llamativos y facilita la exportación de informes. Si este tipo de modelos de IA acaba integrándose en ese entorno, el usuario europeo podría disponer de un asistente mucho más proactivo, pero también más exigente en cuanto a transparencia y control de sus datos.
Todo apunta a que estamos ante el principio de una nueva etapa en la que una inteligencia artificial entrenada con millones de días de uso de Apple Watch actúa como un radar silencioso de anomalías, mientras los médicos siguen teniendo la última palabra. Los resultados del estudio muestran que incluso registros irregulares pueden ofrecer pistas valiosas sobre hipertensión, apnea u otros problemas, siempre que se manejen con rigor científico y bajo las garantías de la normativa europea de protección de datos.