Disk candidates from mid-infrared observed and predicted data in Sun-like open cluster members

Nuria Fonseca Bonilla

Departamento de Astrofísica

Año 2026

Los discos circunestelares son el lugar de nacimiento de los planetas. Compuestos de gas, polvo y planetesimales, orbitan alrededor de una estrella en una estructura con forma de disco resultado del colapso de una nube interestelar. A medida que el sistema estrella+disco evoluciona en el tiempo, los discos pasan (mediante procesos como la acreción y la fotoevaporación) de discos protoplanetarios ricos en gas a discos de escombros pobres en gas, compuestos principalmente de polvo y planetesimales. Bajo condiciones favorables, el material remanente del disco da lugar a la formación de planetas. Por ello, los discos son fundamentales para comprender los procesos que gobiernan la formación y evolución de los sistemas planetarios.

Desde su identificación en 1984 mediante la detección de un exceso en el infrarrojo, por encima del esperado para la fotosfera de la estrella, han sido exhaustivamente estudiados y caracterizados. La detección de sus excesos en el infrarrojo continúa siendo el método más común para identificarlos y, por eso, numerosos estudios y campañas de observación se han llevado a cabo en un amplio rango de longitudes de onda.

Los estudios evolutivos iniciales con IRAS e ISO estaban principalmente enfocados en estrellas de tipo A, más brillantes y observables a distancias más largas. La llegada de Spitzer con mayor sensibilidad y resolución en el infrarrojo medio y lejano, permitió ampliar las observaciones de discos de escombros a estrellas de tipo solar, proporcionando un marco comparativo para nuestro Sistema Solar. Posteriormente, varias campañas de observación aprovecharon las avanzadas capacidades de Herschel en el infrarrojo lejano para llevar a cabo estudios evolutivos con énfasis en estrellas FGK. WISE, cubriendo todo el cielo en el infrarrojo cercano y medio, también ha contribuido a los estudios evolutivos de discos aumentando el tamaño de las muestras estelares. Sin embargo, confusión y contaminación en sus medidas han provocado discrepancias con observaciones de Spitzer a longitudes de onda similares. Para estrellas de tipo solar, las tasas de falsos positivos con WISE pueden llegar al 70%, lo que limita la posibilidad de aprovechar al máximo su amplia cobertura.

Para aumentar la significancia estadística, es importante aumentar de manera adecuada el número de estrellas en las muestras. Mientras no haya nueva instrumentación disponible, lo mejor es aprovechar los catálogos actuales y accesibles para construir grandes muestras obtenidas mediante una metodología consistente, con la mejor calidad posible, incluyendo estrellas con un gran rango de edades y, si es posible, con una cobertura completa del cielo.

Esta tesis tiene como objetivo sacar el máximo partido de la gran cantidad de datos infrarrojos disponibles gracias a la gran cobertura por todo el cielo del satélite WISE y combinarlos con recientes catálogos mejorados de Gaia de miembros identificados de cúmulos abiertos, con la finalidad de aumentar nuestros conocimientos de evolución de discos circunestelares mediante el análisis de sus excesos infrarrojos. Se identifican dos específicos:

  1. El primero consiste en desarrollar una nueva metodología basada en el uso de aprendizaje automático (ML en inglés) para poder trabajar con las medidas de WISE y preservar tanto su gran cobertura y volumen de datos como, al mismo tiempo, aprovechar al máximo posible la gran sensibilidad y resolución espacial de Spitzer. El Capítulo 2 está dedicado a la descripción de los métodos empleados para conseguir este objetivo, los resultados y los análisis para demostrar su validez.
    Hemos aplicado técnicas de ML a una muestra completa de miembros de cúmulos abiertos con datos de WISE, usando una muestra de entrenamiento de datos de alta calidad del catálogo SEIP de Spitzer (MIPS y IRAC) y allWISE (bandas de W1, a 3.4 µm, hasta W4, a 22 µm). Hemos probado diversos modelos de regresión con el objetivo de predecir flujos en las bandas equivalentes a MIPS1 (24 µm) y IRAC4 (8 µm) a partir de variables de WISE (flujos y parámetros de calidad). Además, para mejorar la calidad de la predicción hemos implementado técnicas de selección para eliminar las variables irrelevantes de WISE. Como resultado, hemos aumentado notablemente la capacidad de detección de WISE, sobre todo para los objetos con menores magnitudes, que eran los que previamente mostraban las mayores discrepancias con Spitzer.
    En nuestro caso particular, el algoritmo con mejores resultados es uno de árboles extremadamente aleatorios (ET). Hemos probado nuestros resultados en miembros de IC 348, mostrado las discrepancias entre las medidas observadas de Spitzer y WISE y demostrado la buena concordancia entre nuestros valores predichos con los observados a esas longitudes de onda.
  2. El segundo objetivo es identificar nuevos candidatos a discos en una muestra de cúmulos abiertos de alta calidad, con parámetros estelares y edades, usando flujos a 8 µm y 24 µm, observados por Spitzer o predichos por nuestra metodología del primer objetivo. En el Capítulo 3, presentamos resultados de la búsqueda de excesos en el infrarrojo medio y su dependencia con la edad y distancia de los cúmulos abiertos, además de evaluar la validez y fiabilidad de nuestro enfoque para obtener flujos y su consistencia al comparar con flujos observados.
    Empleando las técnicas desarrolladas en el Capítulo 2, buscamos excesos en la emisión a 8 µm y 24 µm en las distribuciones espectrales de energía de estrellas FGK miembros confirmados de cúmulos abiertos. Ajustes a distintos modelos muestran que la frecuencia de los excesos a 24 µm decae con la edad en una escala de tiempo consistente tanto con modelos teóricos como con observaciones previas en estas longitudes de onda. También hemos identificado dos posibles candidatos a discos de escombros extremos a distintas edades.


Nuestros resultados demuestran que el ML es un enfoque eficiente y robusto para descubrir relaciones ocultas entre conjuntos de datos, como los identificados entre flujos de WISE y Spitzer, y coinciden con el conocimiento vigente de discos circunestelares. Esperamos que la aplicación de nuestra metodología a catálogos más amplios, como allWISE, mejore significativamente la identificación de candidatos a discos hasta niveles sin precedentes. Esto permitirá el desarrollo de estudios evolutivos de discos más extensos y significativos estadísticamente, contribuyendo a una mejor comprensión de los procesos involucrados.



Circumstellar disks are considered the birthplace of planets. They are composed of gas, dust, and planetesimals orbiting a star in a disk-shape structure resulting from the collapse of an interstellar cloud. As the star+disk system evolves, the disks transition over time (through processes like accretion and photoevaporation) from gas-rich protoplanetary disks, to gas-poor debris disks primarily composed of dust and planetesimals. Under favorable conditions, the remaining material in the disk results in the formation of planets. As a consequence, circumstellar disks are key for a better understanding of the processes governing the formation and evolution of planetary systems.

Circumstellar disks were first identified in the 80’s through the detection of an excess emission in the infrared over what was expected from the stellar photosphere. Since then, disks have been thoroughly studied and characterized. The detection of infrared excesses is still the most common method for identifying them and numerous disks surveys and targeted studies have been carried out across a wide range of wavelengths.

Early evolutionary studies with IRAS and ISO were mostly focused on A-type stars because they are brighter and can be detected at longer distances. The advent of Spitzer, with its increased sensitivity and spatial resolution in the mid and far-infrared, expanded debris disk observations to solar-type stars, helping place our Solar system into context. Later on, several surveys exploited Herschel’s improved capabilities in the far-infrared to perform evolutionary studies of both protoplanetary and debris disks, with particular emphasis in FGK stars. WISE’s all-sky coverage at near and mid-infrared wavelengths
has also contributed to the study of disk evolution by increasing the stellar samples. However, confusion and contamination have resulted in discrepancies with Spitzer data at similar wavelengths. For solar-type stars, false positive rates in WISE can be up to 70%, which has hindered the exploitation of WISE’s all-sky coverage for evolutionary disk studies.

Toincrease the statistical significance of the results from the disk evolutionary studies, it is important to increase the number of stars in the stellar samples, but this needs to be done in a reliable way. Until new instrumentation becomes available, the best approach is to take advantage of current and readily accessible catalogs to assemble large samples obtained using consistent methodology, with the highest quality data possible, including stars with a wide range of ages, and, if possible, using all-sky data.

This thesis aims to make the most of the extensive amount of infrared data provided by WISE’s all-sky coverage, and combine them with newly improved catalogs of Gaia identified members of open clusters, with the ultimate goal of increasing our knowledge of the evolution of circumstellar disks through the analysis of their infrared excesses. We identified two objectives:

  1. The first objective is to develop a novel methodology based on the use of machine learning (ML) to work with WISE measurements with the goal of preserving both its high coverage and vast data volume while, at the same time, taking full advantage of Spitzer’s superior sensitivity and spatial resolution. Chapter 2 (A ML approach to estimate mid-infrared fluxes from WISE data) is devoted to the description of the methods used to achieve this goal, and the results and analysis to check its validity.
    Specifically, we have applied ML techniques to a complete WISE data sample of open cluster members, using a training set of paired data from high-quality Spitzer Enhanced Imaging Products (SEIP), MIPS and IRAC, and allWISE catalogs, W1 (3.4 µm) to W4 (22 µm) bands. We have tested several MLregression models with the aim of predicting mid-infrared fluxes at MIPS1 (24 µm) and IRAC4 (8 µm) bands from WISE variables (fluxes and quality flags). In addition, to improve the prediction quality, we have implemented feature selection techniques to remove irrelevant WISE variables. We have notably enhanced WISE detection capabilities, mostly for the targets with the lowest magnitudes, which previously showed the largest discrepancies with Spitzer.
    In our particular case, extremely randomized trees was found to be the best algorithm. We have tested our results in members of IC 348. We show discrepancies in the measurements of Spitzer and WISE, and demonstrate the good concordance of our predicted mid-infared fluxes with the observed ones.
  2. The second objective is to identify new disk candidates in a sample of open clusters high-quality data, characterized by the most reliable stellar parameters and age determinations currently available, using data at 8 µm and 24 µm, either observed by Spitzer or predicted by the methodology established in the first objective. In Chapter 3 (Disks candidates in Sun-like stars from OC using mid-infrared observed and predicted data), we present the results of the search of mid-infrared excesses and their dependence on the age and distance of the open clusters, and we assess the validity and reliability of the approach to obtain predicted fluxes and their consistency when compared to the observed values.
    Using the ML techniques developed in Chapter 2, we have searched for 8 µm and 24 µm excess emission in the spectral energy distributions of FGK stars that are confirmed members of open clusters. Different parametric fits show that the frequency of the excesses at 24 µm decays with age with a timescale consistent with both theoretical models and previous observational studies at these wavelengths. We have also identified two possible candidates of Extreme Debris Disk at different ages.


Our results demonstrate that ML is an efficient and robust approach for uncovering hidden relationships between datasets, such as those identified between WISE and Spitzer fluxes, and are consistent with current understanding of circumstellar disks. We expect that applying our methodology to larger catalogs, such as allWISE, will significantly enhance the identification of disk candidates to unprecedented levels. This will enable the development of more extensive and statistically significant studies of disk evolution, contributing to the understanding of the processes involved

Datos de interés

Supervisores: Benjamín Montesinos Comino, María Amaya Moro Martín
Universidad: UNIVERSIDAD COMPLUTENSE DE MADRID
Fecha de lectura: 01/01/2026