Apple ofrece un conjunto de funciones impulsadas por inteligencia artificial en sus dispositivos iPhone, iPad y Mac, que permiten a los usuarios acceder a herramientas de escritura para corregir textos, recibir resúmenes optimizados de notificaciones, generar emojis a partir de descripciones de texto, entre otras opciones.
En este sentido, la compañía ha anunciado su plan para optimizar su inteligencia artificial, con el objetivo de que los usuarios obtengan mejores resultados cuando, por ejemplo, soliciten cambios en el tono de un texto que redactaron para un cliente importante o pidan un emoji de una rana con sombrero vaquero.
Para lograrlo, Apple debe acceder, de forma controlada, a los datos de los usuarios que hayan otorgado su permiso a través de la opción ‘Compartir análisis del iPhone’, ubicada en el apartado de ‘Privacidad y Seguridad’ dentro de la sección de Configuración.
Con este permiso concedido por algunos usuarios, Apple pone en práctica lo que denomina como “datos sintéticos”, para iniciar a entrenar sus modelos de inteligencia artificial de acuerdo con las necesidades de cada función.
“Los datos sintéticos se crean para imitar el formato y las propiedades importantes de los datos del usuario, pero no contienen contenido generado por el usuario. Al crear datos sintéticos, nuestro objetivo es generar oraciones o correos electrónicos sintéticos con un tema o estilo lo suficientemente similar al real para mejorar nuestros modelos de resumen, pero sin que Apple recopile correos electrónicos del dispositivo”, explican.
Cómo Apple crea datos sintéticos
Primero, Apple utiliza un modelo de lenguaje avanzado (LLM, por sus siglas en inglés) para crear correos electrónicos sintéticos sobre diversos temas comunes. Por ejemplo, puede generar un mensaje como: “¿Te gustaría jugar al tenis mañana a las 11:30?”. Este mensaje no pertenece a un usuario real, pero es un ejemplo de una conversación que podría ocurrir en la vida real, señala Infobae.
Luego, Apple toma esos mensajes sintéticos y los transforma en “incrustaciones”, que son representaciones matemáticas que capturan características clave del mensaje, como el idioma, el tema y la longitud.
Por ejemplo, en lugar de almacenar todo el correo electrónico, la incrustación solo retiene una forma simplificada del mensaje, permitiendo analizar patrones sin usar datos personales.
Estas incrustaciones se envían a unos pocos iPhone, Mac o iPad de usuarios que han habilitado el análisis de dispositivos para comparar los correos electrónicos recientes y reales con las incrustaciones sintéticas.
El dispositivo elige cuál de las incrustaciones sintéticas se parece más a los mensajes reales del usuario, pero sin saber de qué correo electrónico se trata exactamente. Esto se hace utilizando privacidad diferencial, una técnica que asegura que los datos personales no se revelen durante el proceso.
A partir de esta información, Apple puede aprender qué incrustaciones sintéticas se parecen más a los correos electrónicos reales de los usuarios y usar esos mensajes para mejorar sus modelos de inteligencia artificial.
Por ejemplo, si el mensaje sobre “jugar al tenis” es popular, Apple podría crear nuevos mensajes sintéticos cambiando “tenis” por “fútbol” o “baloncesto”, y luego añadir esos nuevos ejemplos a la base de datos para mejorar la próxima ronda de entrenamiento de la IA.
“Estos datos sintéticos se pueden utilizar para probar la calidad de nuestros modelos con datos más representativos e identificar áreas de mejora en funciones como el resumen”, indica Apple.
Cómo es el entrenamiento de la IA que genera emojis
La herramienta que genera emojis a partir de descripciones del usuario se entrena de manera diferente. Para los usuarios que optan por compartir el Análisis de Dispositivos con Apple, se utilizan métodos de privacidad diferencial para identificar patrones y las indicaciones más populares sin vincularlas a usuarios específicos ni revelar indicaciones poco comunes.
Este enfoque permite a Apple evaluar mejoras en los modelos según las indicaciones más representativas de la interacción real del usuario, como cuando un usuario solicita un Genmoji con varias entidades (por ejemplo, “dinosaurio con sombrero de vaquero”).
El proceso, según Apple, asegura que se detecten indicaciones populares, sin asociarlas a dispositivos individuales ni acceder a indicaciones únicas.