RWD y la representatividad de la información. ¿El tamaño importa?

imagen autor
Rocío Rodríguez, PhD. Consultant. Cegedim Healthcare Spain. University of Murcia Professor.

RWD y la representatividad de la información. ¿El tamaño importa?

11/12/2023
717
Una de las frases que más me ha impactado me la dijeron cuando estudiaba Ingeniería Informática. El profesor de lo que en aquel tiempo nosotros llamábamos “redes”, un día entró en clase y estábamos todos hablando, algo revueltos, como siempre y comentó: “pero, ¿no os dais cuenta que lo más preciado que tenéis es vuestro tiempo?, queráis o no vuestro tiempo va pasando…” Y automáticamente lo enlazó con el propósito de la asignatura “... y lo único que podéis hacer es gestionarlo de la mejor manera posible y al menos en una faceta de vuestra vida a eso os estoy ayudando…”. Y podría parecer que este era el comentario al que me refería al principio, sin embargo, lo que realmente me impactó vino después: “¿no os dais cuenta de que la información es poder?”.

Y aquí es donde empieza este artículo. Siguiendo el artículo de PMFarma del 13 de diciembre de 2021 “ Real World Data para principiantes”, se define Real World Data (RWD) como los datos observacionales derivados del mundo real. Estos datos observados se guardan en una base de datos del RWD. Y lo que es claro, es que los avances tecnológicos de las últimas décadas han supuesto un acceso a la información sin precedentes, por lo que se puede almacenar mucha información del mundo real. Y como hemos visto antes, la información puede ser muy valiosa, pero, ¿en qué condiciones? ¿Quiénes se preguntan por la pertinencia, la veracidad, la integridad o la homogeneización de la misma? ¿Cómo podemos obtener los mayores beneficios de la base de datos del RWD? En este artículo vamos a ofrecer algunos tips para responder a estas preguntas.

Lo primero que se debe hacer es definir el propósito o propósitos del estudio de la manera más concreta posible. Esta definición nos ayudará posteriormente a definir qué información es relevante en la obtención de datos. Además, es necesario considerar los siguientes puntos básicos:

1.- La información debe ser pertinente y necesaria: cuanta más información se solicite mayor es el coste, en general, de almacenamiento y el de gestión de la misma en particular y más inefectiva se vuelve para los propósitos realmente interesantes. Al final, salvando las distancias, sería un poco como querer guardar todos los videos que se hacen con el móvil conociendo la limitación de memoria del mismo y sabiendo que si son realmente importantes tienes que gestionar su exportación a otro dispositivo, lo que hace que el acceso no sea tan inmediato.

¿Qué le debemos pedir entonces a la información? ¿Qué debemos guardar y qué no?

Lo ideal sería solicitar y guardar exclusivamente los registros y variables dentro de cada registro que ofrezcan información acerca del propósito inicial establecido.

En este sentido, lo más importante no es obtener la base de datos del RWD que más información tenga, es mucho más valioso y práctico obtener una base de datos más reducida con la información necesaria y pertinente para cubrir el propósito establecido, esto supondrá menos coste en recursos y tiempo.

2.- La información debe ser veraz, íntegra y representativa. Aquí enlazamos con las fuentes de datos y la minería de datos. Las fuentes de datos observacionales pueden ser analógicas o digitales, y objetivas o subjetivas. En este sentido, si una fuente es digital y objetiva, el dato será más veraz e integro (ej, una fecha ofrece poco margen para el error, si es 16 de junio de 1975, no hay mucha interpretación posible). Sin embargo, si estamos trabajando con los síntomas del paciente tras tomar una medicación, será difícil valorar por ejemplo la severidad del mareo que indica tener.

En este sentido, lo ideal es trabajar, en la medida de lo posible con el mayor número de datos objetivos que provengan de fuentes previamente digitalizadas. Al final esto conduce a que la base de datos del RWD es menor, porque no ha se ha tratado de digitalizar información analógica y/o subjetiva para aumentar el volumen de los datos. Sin embargo, será una base de datos más asertiva y representativa de la realidad.

3.- Homogeneidad de los datos. En este punto nos referimos no solo a que la base de datos del RWD tenga los datos en el mismo formato (ej. Los siguientes formatos de fechas son correctos, sin embargo, son diferentes, Fecha: 16/06/75 o 16/06/1975 o 06/16/75), sino también a que todos los registros tengan cumplimentados los mismos campos, es decir, si la fecha es un campo clave para el propósito del estudio, no puede venir en unos casos sí y en otros no. Nuevamente, esto conlleva un menor número de registros con la totalidad de la información, que a su vez proviene de diferentes bases de datos, donde se almacenan diferentes campos.

Aunque las tres consideraciones ofrecidas parecen muy básicas, es muy importante tenerlas en cuenta, porque en el mercado actual parece haberse establecido una norma implícita de que cuanto más grande sea la base de datos del RWD mejor para el propósito del estudio, cuando en realidad, lo que determina la pertinencia y valor de los datos son otros factores como la representatividad, la veracidad, la homogeneidad, la fuente, etc.

Entonces, ¿la información es poder? Sí…Siempre y cuando sea la información adecuada para el propósito definido. En otro caso, es probable que sea más perjudicial que beneficiosa.


Más sobre CEGEDIM HEALTH DATA


Cegedim Health Data es la división de datos relativos a la salud del Grupo Cegedim, un innovador grupo de tecnología, servicios y datos del mundo real especia...

Saber más

Servicios:

Real world data
Market intelligence
Farmacoeconomía
Patient intelligence

Articulos relacionados:

Logo
Alicia López de Ocariz. Directora Médica Corporativa. Cinfa.
Espacio europeo de datos sanitarios: un reto y una oportunidad

La pandemia de COVID-19 dejó una serie de enseñanzas en la Unión Europea que han desencadenado tanto revisiones como nuevas estrategias relacionadas con la salud. La Comisión adoptó una nueva Estrategia en materia de salud, señalándola como un pilar esencial de la política exterior de la UE, un sector crítico desde el punto de vista geopolítico y un factor fundamental para la autonomía estratégica de la UE. La Estrategia presenta...

Abr. 2024
Logo
Rocío Rodríguez. Consultant. Cegedim Healthcare Spain.
¿Pueden la Inteligencia Artificial o el Machine Learning trabajar sin datos de calidad?

La Inteligencia Artificial y el Machine Learning están de moda. Las empresas y cualquier sector de la sociedad comentan las bondades de esta tecnología innovadora. Pero ¿qué es la Inteligencia Artificial (IA)? La IA es una tecnología que muestra la culminación de la inteligencia humana y el procesamiento informático. Fundamentalmente lo que se hace es recopilar información de varias fuentes y utilizar los algoritmos adecuados para...

Abr. 2024
Logo
Ana Díaz-Roncero. Business Development. Persei vivarium.
¿Cómo pueden los Datos de Vida Real mejorar los tratamientos?

Como hemos visto anteriormente, el Real-World Data (RWD) está adquiriendo cada vez más valor en el ámbito de la salud ya que aporta evidencias sobre patologías y tratamientos en un contexto real, lo cual está ayudando a avanzar en la investigación, prevención, diagnóstico y tratamiento de las enfermedades. Esto está generando que se conviertan, cada vez más, en un requisito demandado por todos los actores del sistema sanitario:...

Ene. 2024